作者:相信未來
來源:泓策投研手札(ID:FinanceBao)
評級是藝術,但你廢掉另一只腿科學,直接和我開聊藝術和分析框架我就難以信服了,兩者不矛盾,你為什么不和我聊聊科學?前述文章中談及了數(shù)據(jù)治理問題(大數(shù)據(jù)信用風險管理操作手冊),以及內評模型驗證問題(內部評級模型驗證方法全解析),本文則詳細敘述銀行內評模型建模的全流程(債券評級模型有自身特征),歡迎來懟。
違約損失率,也就是當客戶發(fā)生違約后,債項損失的程度,等于1-回收率?!栋腿麪枀f(xié)議》強調“估計違約損失率的損失是指經(jīng)濟損失”,而不是會計上的賬面損失。經(jīng)濟損失要考慮回收成本和資金的時間價值,也就是利用合適的折現(xiàn)率計算禍首現(xiàn)金流的現(xiàn)值。所以《巴塞爾協(xié)議》下的違約損失率(LGD)為:
計算歷史LGD的三個關鍵:回收現(xiàn)金流(有效催收窗口)、回收成本、折現(xiàn)率。
數(shù)據(jù)收集和變量構造
LGD模型構建一直是銀行的難點,關鍵障礙在于LGD的數(shù)據(jù)缺失相當嚴重。LGD建模所需要數(shù)據(jù)可分為兩部分:因變量和自變量計算所需要的數(shù)據(jù)。違約概率(PD)模型的數(shù)據(jù)缺失主要為自變量計算所需要數(shù)據(jù)的缺失,因變量(即違約與否的判斷)數(shù)據(jù)質量相對較好,而LGD模型這兩方面的數(shù)據(jù)缺失都相當嚴重。
歷史LGD的計算數(shù)據(jù),重點在于回收現(xiàn)金流、回收成本、折現(xiàn)率。關于回收現(xiàn)金流,各行都有催收臺賬,但是很少有銀行在IT系統(tǒng)記錄了詳細準確的交易明細,成本分攤更是商業(yè)銀行的軟肋,準確地估計某個機構、某個時段、某個產(chǎn)品的回收成本幾乎是不可能的。大型商業(yè)銀行已經(jīng)上線了標準催收、ERP等系統(tǒng),這方面的情況有所改善。
自變量數(shù)據(jù),包括債項類型、債項的優(yōu)先級別、抵(質)押品、抵債資產(chǎn)的優(yōu)先求債權、破產(chǎn)相關法律因素、行業(yè)因素、違約概率、商業(yè)周期、信貸歷史、宏觀經(jīng)濟等方面,其中,商業(yè)銀行對于抵(質)押品的管理一直比較薄弱,數(shù)據(jù)積累也非常差,各大商業(yè)銀行已經(jīng)開始已經(jīng)建設抵(質)押品市值重估和管理系統(tǒng),數(shù)據(jù)情況得到改善。
穆迪的LossCalc?模型(Guptonand Stein, 2002)包括了債務類型和優(yōu)先級、資本結構、行業(yè)、宏觀經(jīng)濟四個方面的九個自變量。
穆迪LossCalc(TM)模型變量
變量類型 | 變量名稱 | 變量數(shù)目 |
債務類型和優(yōu)先級別 | 債務類型優(yōu)先級別對應的LGD歷史平均值 | X1 |
資本結構 | 債務的相對級別 資產(chǎn)負債率 | X2 X3 |
行業(yè)因素 | 行業(yè)回收率平均值 銀行業(yè)指標 | X4 X5 |
宏觀經(jīng)濟因素 | RiskCal模型計算的上市公司1年期違約概率中位數(shù) 穆迪破產(chǎn)企業(yè)債券指數(shù) 投機級債券12個月平均違約率 經(jīng)濟領先指數(shù) | X6 X7 X8 X9 |
模型分組和樣本選擇
違約損失率LGD模型的分組基本上與客戶違約概率評級模型的分組原則比較類似,一般可以從行業(yè)、規(guī)模、區(qū)域、產(chǎn)品等維度進行分組,具體應該選擇幾個維度,在每個維度如何分組,應該考察經(jīng)濟學直覺、業(yè)務管理情況、數(shù)據(jù)來源、統(tǒng)計分析等幾個方面的情況。
違約損失率LGD模型必須要進行非違約賬戶和違約賬戶的分組,因為已經(jīng)違約的客戶包括了逾期后回收的更新數(shù)據(jù),信息量遠大于非違約賬戶,可以構造更多的自變量,預測也更為準確。
在非違約賬戶和違約賬戶分組中,LGD模型建設都只使用違約樣本,但是觀察期和表現(xiàn)期的構造不一致。非違約賬戶分組中,所有樣本在觀察點之前還沒有發(fā)生違約,而在表現(xiàn)期內都發(fā)生違約,發(fā)生違約的賬戶回收率取決于有效催收窗口的分析,所以LGD模型的建設對于歷史數(shù)據(jù)的時間長度要求比較高。
違約賬戶分組中,所有樣本在當前觀察點之前都已經(jīng)發(fā)生違約,有效催收窗口在觀察點之前已經(jīng)開始,需要三年數(shù)據(jù)。
LGD分布特征
1、Beta 分布
2、穆迪通過實證認為回收率服從Beta分布。
首先,回收率分布區(qū)間為[0,1]
Beta分布的形狀隨著兩個參數(shù)的變化而呈現(xiàn)很大的差異,也能很好地擬合偏峰厚尾的情況。
Moody公司1970-2002年第二季度間所有
債券和貸款回收率
LGD呈現(xiàn)的雙峰分布(Bimodal Distribution),商業(yè)銀行的信貸業(yè)務,雙峰的情況比較嚴重。直覺上也比較容易理解,如果債務人主觀上愿意還錢,無論時間長短,最終回歸換大部分的借款,即違約損失率LGD比較低,呈現(xiàn)為低端的峰;如果債務人主觀上沒有意愿還錢,既然是違約,不如違約徹底,即違約損失率LGD比較高,呈現(xiàn)高端的峰。
特別對于中國商業(yè)銀行,因為受國內壞賬核銷等法規(guī)和信用環(huán)境的影響,雙峰分布更為極端,LGD取值0和1的情況占比非常大,也就是說,很多債務在催收后能全額還款,而有些債務則一分錢都沒能回收。
雙Beta函數(shù)的密度函數(shù)為
對于中國的商業(yè)銀行,因為受到國內壞賬核銷等法規(guī)的影響,雙峰分布更為極端,LGD取值為0和1的情況占比非常大:很多債務在催收后能全額還款,有些債務則分文收不回來。
模型方法論
理論上,沒有絕對最優(yōu)的模型方法論,其選擇依賴于研究對象的數(shù)據(jù)結構和數(shù)據(jù)特性。違約損失率LGD數(shù)據(jù)的特點是:
1. LGD取值局限于[0,1],實證研究表明其分布為貝塔分布或雙峰分布,總之不是正態(tài)分布,不適合使用線性回歸模型??蛻粼u級模型常用的Logistic回歸是半?yún)?shù)方法,對于分布要求并不要個,能否使用LGD模型呢?
2. LGD取值在[0,1]連續(xù),Logistic回歸應用于分類問題,需要因變量離散變量,無法直接應用。
根據(jù)違約損失率LGD數(shù)據(jù)的特點,介紹三種模型方法:穆迪LossCalc?模型、構造樣本Logistic回歸、決策樹。
(1) 穆迪的LossCalc?模型
穆迪的違約損失率LossCalc?模型基于回收率為因變量展開,由于回收率=1-LGD,所以無論是LGD還是回收率為因變量,沒有什么本質區(qū)別。
(1-1) logistic模型
穆迪的違約損失率LossCalc?模型中迷你模型類似穆迪違約概率模型RiskCal的處理,即通過單變量分析得到自變量到歷史平均LGD的轉化函數(shù)。
(1-2) 分布轉化
在回收率符合貝塔分布的情況下,可以通過分布轉化函數(shù)將貝塔空間下的回收率R轉化成正態(tài)空間下的回收率
在正態(tài)空間下,可以采用線性回歸:
其中,Betadist(R)代表Beta分布函數(shù)
為迷你模型的輸出結果作為回歸模型的輸入
(2) 構造樣本Logistic回歸
LossCalc?模型方法在LGD取值比較連續(xù)的時候比較有效,但是對于中國的商業(yè)銀行業(yè)LGD分布在1和0點過多的情況,適用性有限。
如果LGD取值0和1比重非常高,可以采用Logistic回歸方法,對于其中在區(qū)間(0,1)的值,可以采用如下構造樣本的處理方法:
(2-1) 四舍五入法。顧名思義,就是LGD取值大于等于0.5的時候取值1,小于0.5的時候取值0.
(2-2) 樣本權重法。四舍五入法的處理有點粗糙,只有雙峰現(xiàn)象明顯,LGD在區(qū)間(0,1)取值很少的時候才使用。樣本權重法則精細一些,例如對于LGD取值為0.6的樣本,構造LGD分別等于1和0的兩個樣本與其對應,然后在模型訓練中,LGD=1的樣本權重為0.6,LGD=0的權重為0.4。
(2-3) 虛擬樣本法。例如對于LGD取值為0.6的樣本,分別構造自變量形同的6個LGD等于1,4個LGD等于0的樣本;對于LGD取值為1和0的樣本,則需要負值10倍,以保證合理的樣本權重。虛擬樣本方法效果與樣本權重法一致。
(3) 決策樹
決策樹屬于非參數(shù)法,對于數(shù)據(jù)分布、數(shù)據(jù)類型都沒有嚴格要求,比較適合處理LGD模型這種特殊情況。而且決策樹方法也非常直觀,邏輯判斷過程在樹結構中一目了然,易于業(yè)務人員接受。
注:文章為作者獨立觀點,不代表資產(chǎn)界立場。
題圖來自 Pexels,基于 CC0 協(xié)議
本文由“泓策投研手札”投稿資產(chǎn)界,并經(jīng)資產(chǎn)界編輯發(fā)布。版權歸原作者所有,未經(jīng)授權,請勿轉載,謝謝!