異常檢測(cè)、設(shè)備指紋和關(guān)聯(lián)圖譜是人工智能反欺詐實(shí)踐中重要的機(jī)器學(xué)習(xí)反欺詐技術(shù),這些技術(shù)在應(yīng)對(duì)自動(dòng)化和身份欺詐等場(chǎng)景中非常有效。在反欺詐的實(shí)戰(zhàn)中,欺詐者經(jīng)常呈現(xiàn)出團(tuán)伙作案的特征。對(duì)于團(tuán)伙欺詐,關(guān)聯(lián)圖譜是非常有效的手段,本文將重點(diǎn)介紹關(guān)聯(lián)圖譜的定義。
什么是關(guān)聯(lián)圖譜?
在一般的機(jī)器學(xué)習(xí)的場(chǎng)景中,我們往往考察的是單一信息點(diǎn)的屬性。在反欺詐的場(chǎng)景中,還有另一類非常有效的信息,關(guān)聯(lián)信息。比如某用戶A的住址為X, 某用戶B的住址也是X, 用戶A和用戶B則通過(guò)地址X相互關(guān)聯(lián)。和一般數(shù)值型的信息不同,這種關(guān)聯(lián)表達(dá)的是一種結(jié)構(gòu)型的信息。我們把這種關(guān)聯(lián)關(guān)系用圖表達(dá)出來(lái),就構(gòu)成了一張關(guān)聯(lián)圖譜,有時(shí)也稱為社交網(wǎng)絡(luò)。在反欺詐場(chǎng)景中,團(tuán)伙欺詐用常規(guī)的方法比較難發(fā)現(xiàn),關(guān)聯(lián)圖譜或者說(shuō)社交網(wǎng)絡(luò)分析是發(fā)現(xiàn)欺詐團(tuán)伙的重要方法。
社交網(wǎng)絡(luò)方法的理論基礎(chǔ)是圖論。圖論作為一門新興學(xué)科,本身有很多分支,如幾何圖論,組合圖論,算法圖論,隨機(jī)圖論,代數(shù)圖論等。計(jì)算機(jī)專業(yè)的圖論入門往往是從組合圖論開始的,而在人工智能的領(lǐng)域里代數(shù)圖論也有很重要的應(yīng)用。
一個(gè)社交網(wǎng)絡(luò)或者說(shuō)圖是由節(jié)點(diǎn)和邊組成。在數(shù)學(xué)上用矩陣來(lái)表示節(jié)點(diǎn)間的鄰接關(guān)系,我們稱之為鄰接矩陣。這樣就把一個(gè)組合數(shù)學(xué)問(wèn)題轉(zhuǎn)化成了一個(gè)矩陣或者說(shuō)線性代數(shù)的問(wèn)題。
圖一
根據(jù)圖的邊是否具有方向性,社交網(wǎng)絡(luò)可分為有向圖和無(wú)向圖。圖一是一個(gè)無(wú)向圖的例子,圖二是一個(gè)有向圖。
圖二
根據(jù)邊的性質(zhì)是否相同又可以分為同構(gòu)網(wǎng)絡(luò)和異構(gòu)網(wǎng)絡(luò)。相同類的邊和節(jié)點(diǎn)組成的網(wǎng)絡(luò)稱為同構(gòu)網(wǎng)絡(luò), 不同類的邊和節(jié)點(diǎn)組成的網(wǎng)絡(luò)稱為異構(gòu)網(wǎng)絡(luò)。
描述社交網(wǎng)絡(luò)的指標(biāo)有很多,這邊簡(jiǎn)單的介紹幾類:關(guān)聯(lián)度,中心度和網(wǎng)絡(luò)聚類。
第一類是關(guān)聯(lián)度指標(biāo)。一度的關(guān)聯(lián)度即是指一個(gè)節(jié)點(diǎn)和多少個(gè)其他節(jié)點(diǎn)相鄰。如果是有向網(wǎng)絡(luò),還可細(xì)分為入度和出度,分別對(duì)應(yīng)鏈入和鏈出的節(jié)點(diǎn)數(shù)。二度關(guān)聯(lián)度則是指介由一個(gè)中間節(jié)點(diǎn)相關(guān)聯(lián)的節(jié)點(diǎn)數(shù)。一度,二度關(guān)聯(lián)的關(guān)聯(lián)度在反欺詐的場(chǎng)景中的使用非常的廣泛。
另一類標(biāo)志節(jié)點(diǎn)重要性的指標(biāo)是中心度(Centrality,有時(shí)也譯作中心性): 比如介數(shù)中心度,特征向量中心度等等。介數(shù)中心度度量對(duì)于一個(gè)節(jié)點(diǎn)X,多少其他節(jié)點(diǎn)對(duì)之間的最短路徑必須介由X。特征向量中心度則可以認(rèn)為是一度關(guān)聯(lián)度的一種延伸,當(dāng)考慮一個(gè)節(jié)點(diǎn)的重要性時(shí),不止考慮他有多少個(gè)鄰接節(jié)點(diǎn),還要考慮這些鄰接節(jié)點(diǎn)的重要性。大名鼎鼎的PageRank實(shí)際上是特征向量中心度的一個(gè)變種。
第三類指標(biāo)是在網(wǎng)絡(luò)上的聚類。物以類聚,人以群分,考察和一個(gè)節(jié)點(diǎn)有緊密聯(lián)系的其他節(jié)點(diǎn)所構(gòu)成聚類的共性,往往對(duì)研究該節(jié)點(diǎn)的特性有很強(qiáng)的指導(dǎo)性。
由于文章篇幅有限,我們將在下一期文章中向大家介紹關(guān)聯(lián)圖譜分析的常用方法,敬請(qǐng)期待~
本文作者:周輝 Maxent猛犸反欺詐聯(lián)合創(chuàng)始人
----持續(xù)更新 ----
未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載
歡迎關(guān)注
1.《什么是關(guān)聯(lián)圖譜?——關(guān)聯(lián)圖譜(一)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《什么是關(guān)聯(lián)圖譜?——關(guān)聯(lián)圖譜(一)》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/tiyu/24523.html