儘管在學術上評估信用風險所使用的模型千千萬萬,但在實務上Scorecaed恐怕還是$用最廣的,基本的原因我想是它提供更好的直覺(至少在應用上),而且對於資料的分析更為全面。


     提到評分卡,不可否認FairIsaac在全球是最微領先的,至於它背後的理論其實不好懂,牽涉到自然科學或資訊領域Entropy,這幾年我花較多心思研究的"最適風險"也與它有關,不過考慮的變數與呈現的樣貌不太相同,這裡整理些在評分卡中有關Weight of Evidence(WOE)和Information Value(IV)的直覺,有能人異士歡迎提供更多的看法。


    首先什麼是資訊,這個定義有千百種(不同領域包括經濟,財務都有其定義)而且可複雜了,這裡資訊的定義主要是為了解決不確定的問題。有個不錯的例子是,當有人˙告訴我發生某事情的機率是1/2,資訊很少,但若有人告訴我是90%或是10%,資訊就更有價值。(要注意這裡假設只有兩種可能性,百分之十和百分之九十在某種意義是相同的)。


   有趣的是,由另一個角度看,1/2卻是最大的資訊,例如要我們從一到一百找個數,每次可以選一個數,出題者會告訴我們大於它還是小於它,我們會怎麼選呢,當然要先選五十,因為剛好是1/2機率,以後類推下去最可能最快猜到數字。


    於是,有人定義某隨機變數的資訊是Log(1/p),這裡可以想像"1"是確定的機率,為何取對數,因為一次是不一定猜對的,長期猜下去,機率是一直乘下去。


   Entropy是算出來這些資訊的期望值。我看過最好直覺的解釋是把它想成是可能的"組合"數目(就是排列組合的組合),大部分的文章是把他解釋成亂度,其實是因為組合數太多了當然比較"亂"的關係。


   在評分卡我們最常用到的是woe或是 weight of evidence,它的定義是對於某種特徵的人(例如學歷大學的人)誠實的人佔所有誠實的人的比例/有這種特徵的人違約的人佔所有違約的比例,然後再取對數。鋼材我們大致知道資訊的意義,這裡可以看成是相對的資訊,基本上,WOE越高風險越低。


  至於資訊價值(Information Value)呢?有點類似Entropy,是把該屬性下(學歷)下所有特徵的WOE做某種加總,加總的權數是個屬性下好人占所有好人比例減去該屬性下壞人占所有壞人的比例。資訊價值得主要目的是看看這種特徵有沒有區別力。


   這幾年我發現Entropy真是是極有趣的東西,有興趣的人可以多想想,晚上失眠,想想就睡著了。(不過如果因而失眠更加嚴重我不負責任!)。


 


 


 


 


 

arrow
arrow
    全站熱搜

    dabaitw 發表在 痞客邦 留言(0) 人氣()