AppList和SmsList是xjd的核心風控數(shù)據(jù),各家風控能力的差異基本就體現(xiàn)在對這兩部分信息的抽取上。
前幾個月一直在研究SMS的信息提取(參考《SMS特征提取的一些心得【1】》和《SMS特征提取的一些心得【2】》),最近又回來琢磨App了。
之前我們對App打的標簽的包括:
是否是LendingApp:根據(jù)app_id去爬取GooglePlay頁面,然后根據(jù)產(chǎn)品描述做判別模型,最后人工確認
App安裝時間:客戶端直接獲取
App更新時間:客戶端直接獲取
產(chǎn)品發(fā)布時間:爬蟲獲取
產(chǎn)品安裝量:爬蟲獲取
幾個標簽里除了是否是LendingApp有人工參與外,剩下都是借助程序自動化打的標簽,還是希望盡量淡化人工的干預程度,盡量Tech和Automatic一些。
這幾個標簽在過去幾年中很好用,比如量級大的?/?發(fā)布時間早的LendingApp周期更長費率更低產(chǎn)品更合規(guī),對應(yīng)的客戶質(zhì)量就更好。但是從去年開始AppList的區(qū)分性衰減的很明顯,量級大的App開始不再滿足“周期更長費率更低產(chǎn)品更合規(guī)”的特征。一個App可以在很短的時間通過瘋狂滿量沖到百萬級,然而一看review,7天+高費率+砍頭+爆催,可能還會給新戶批高的離譜的額度。
這個時候一個很自然而然的思路是不使用安裝量級,改用產(chǎn)品的真實周期和費率(這個思路是去年跟同行交流時候他們在用的)。這個時候又有一個很尷尬的問題:風險定價。新戶給的期限短,費率高;老戶給的期限長,費率低。首先能找到的信息更多是新戶給的,沒法代表整體的情況;其次是周期有長有短費率有高有低,很難總結(jié)一個值來當標簽。
最近還在摸索+找大牛討論,有結(jié)論了再在這里進行更新。
有思路心得愿意share的小伙伴也歡迎在風控群里交流or后臺留言。
PS 真想有一個大模型可以把產(chǎn)品review里的期限和費率信息給提取出來,一個一個看的我想死。
文章為作者獨立觀點,不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質(zhì)的學習資料。
現(xiàn)在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)