1 什么是知識(shí)圖譜?
通俗地講,知識(shí)圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò)。
知識(shí)圖譜這個(gè)網(wǎng)絡(luò)具備以下3種特性:
1.1 由節(jié)點(diǎn)(Point)和邊(Edge)組成
1.2 每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界中存在的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”
1.3 知識(shí)圖譜是關(guān)系的最有效的表示方式
所以,知識(shí)圖譜本質(zhì)上就是語義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu);
2 知識(shí)圖譜能干什么?
先按知識(shí)圖譜應(yīng)用的深度主要可以分為兩大類:
一是通用知識(shí)圖譜,通俗講就是大眾版,沒有特別深的行業(yè)知識(shí)及專業(yè)內(nèi)容,一般是解決科普類、常識(shí)類等問題。
二是行業(yè)知識(shí)圖譜,通俗講就是專業(yè)版,根據(jù)對(duì)某個(gè)行業(yè)或細(xì)分領(lǐng)域的深入研究而定制的版本,主要是解決當(dāng)前行業(yè)或細(xì)分領(lǐng)域的專業(yè)問題。
下面我根據(jù)這兩大類,分別從知識(shí)圖譜應(yīng)用的廣度進(jìn)行介紹:
2.1 通用知識(shí)圖譜
我們?nèi)粘R姷降亩际峭ㄓ弥R(shí)圖譜,主要應(yīng)用于面向互聯(lián)網(wǎng)的搜索、推薦、問答等業(yè)務(wù)場(chǎng)景;
先列舉3個(gè)通用知識(shí)圖譜的案例:
2.1.1、百度知識(shí)圖譜(tupu.baidu.com/)
2.1.2、搜狗搜索(sogou.com/)
2.1.3、360搜索(so.com)
2.2 行業(yè)知識(shí)圖譜
行業(yè)知識(shí)圖譜指面向特定領(lǐng)域的知識(shí)圖譜,用戶目標(biāo)對(duì)象需要考慮行業(yè)中各級(jí)別的人員,不同人員對(duì)應(yīng)的操作和業(yè)務(wù)場(chǎng)景不同,因而需要一定的深度與完備性,行業(yè)知識(shí)圖譜對(duì)準(zhǔn)確度要求非常高,通常用于輔助各種復(fù)雜的分析應(yīng)用或決策支持,有嚴(yán)格與豐富的數(shù)據(jù)模式,行業(yè)知識(shí)圖譜中的實(shí)體通常屬性比較多且具有行業(yè)意義
2.2.1、人脈路徑查詢
基于兩個(gè)用戶之間的關(guān)聯(lián)實(shí)體(比如:所在單位、同事、同學(xué)、朋友、家人等)找到兩者之間的關(guān)聯(lián)路徑。
2.2.2、企業(yè)社交圖譜查詢
基于投資、任職、專利、招投標(biāo)、涉訴關(guān)系以目標(biāo)企業(yè)為核心心向外層層擴(kuò)散,形成一個(gè)網(wǎng)絡(luò)關(guān)系圖,直觀立體展現(xiàn)企業(yè)關(guān)聯(lián)。
2.2.3、企業(yè)最終控股人查詢
基于股權(quán)投資關(guān)系尋找持股比例最大的股東,最終追溯至自然人或國有資源管理部門。
2.2.4、輔助信貸審核
基于知識(shí)圖譜數(shù)據(jù)的統(tǒng)一查詢,全面掌握客戶信息;避免由于系統(tǒng)、數(shù)據(jù)孤立、信息不一致造成信用重復(fù)使用、信息不完整等問題。
2.2.5、反欺詐之組團(tuán)騙貸
同一個(gè)人利用多個(gè)身份去申請(qǐng)貸款,詳細(xì)見下圖:雖然貸款人A、貸款人B、貸款人C之間沒有直接的關(guān)系,但通過知識(shí)圖譜可以看出三者之間都共享某一部分信息,存在一定的組團(tuán)騙貸風(fēng)險(xiǎn)。
還有更多行業(yè)案例,畫圖真的很辛苦,有時(shí)間再補(bǔ)充,同時(shí)歡迎大家添磚加瓦。
案例補(bǔ)充:
1、企業(yè)發(fā)展歷程時(shí)序圖(融資)
基于企業(yè)知識(shí)圖譜中的投融資事件發(fā)生的時(shí)間順序,記錄企業(yè)的融資發(fā)展歷程。
2、競品分析
電商平臺(tái)常會(huì)用到,兩家企業(yè)知識(shí)路徑越相似,競爭關(guān)系越緊張。
3、征信系統(tǒng)
根據(jù)用戶已有信息(例如:教育信息、身份信息、聯(lián)系方式、擔(dān)保或被擔(dān)保人信息)關(guān)聯(lián)多家平臺(tái)信用記錄。
建設(shè)一個(gè)知識(shí)圖譜系統(tǒng),需要包括:知識(shí)建模、知識(shí)獲取、知識(shí)融合、知識(shí)存儲(chǔ)和知識(shí)應(yīng)用5大部分:
1、知識(shí)建模:構(gòu)建多層級(jí)知識(shí)體系,將抽象的知識(shí)、屬性、關(guān)聯(lián)聯(lián)關(guān)系等信息,進(jìn)行定義、組織、管理,轉(zhuǎn)化成現(xiàn)實(shí)的數(shù)據(jù)庫。
2、知識(shí)獲取:將不同來源、不同結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)化成圖譜數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)(解析)、知識(shí)標(biāo)引、知識(shí)推理等,保障數(shù)據(jù)的有效性和完整性。
3、知識(shí)融合:將多個(gè)來源、重復(fù)的知識(shí)信息進(jìn)行融合,包括融合計(jì)算、融合計(jì)算引擎、手動(dòng)操作融合等。
4、知識(shí)存儲(chǔ):根據(jù)業(yè)務(wù)場(chǎng)景提供合理的知識(shí)存儲(chǔ)方案,存儲(chǔ)方案具備靈活、多樣化、可拓展特性。
5、知識(shí)應(yīng)用:為已構(gòu)建知識(shí)圖譜提供圖譜檢索、知識(shí)計(jì)算、圖譜可視化等分析與應(yīng)用能力。并提供各類知識(shí)計(jì)算的SDK,包含圖譜基礎(chǔ)應(yīng)用類、圖結(jié)構(gòu)分析類、圖譜語義應(yīng)用類、自然語言處理類、圖數(shù)據(jù)獲取類、圖譜統(tǒng)計(jì)類、數(shù)據(jù)集數(shù)據(jù)獲取類、數(shù)據(jù)集統(tǒng)計(jì)類。
責(zé)任編輯:xj
原文標(biāo)題:知識(shí)圖譜的前世今生
文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5554瀏覽量
122484 -
知識(shí)圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
7930
原文標(biāo)題:知識(shí)圖譜的前世今生
文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
輕輕松松學(xué)電工(識(shí)圖篇)
典型電路原理、電路識(shí)圖從入門到精通等資料

電路識(shí)圖從入門到精通高清電子資料
直流電機(jī)基本知識(shí)彩色PDF來啦
一文讀懂:LED 驅(qū)動(dòng)電路二極管挑選要點(diǎn)
一文讀懂什么是「雷電4」

一文帶你讀懂EBSD

傳音旗下人工智能項(xiàng)目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項(xiàng)目獎(jiǎng)”一等獎(jiǎng)

評(píng)論