在皮尤研究中心2010年度報(bào)告中,該中心對(duì)895名語(yǔ)義技術(shù)專(zhuān)家和利益相關(guān)者 進(jìn)行了調(diào)查,結(jié)果顯示47%的受訪者認(rèn)為,到2020年,Berners-Lee的語(yǔ)義網(wǎng)設(shè)想不會(huì)實(shí)現(xiàn),或與終端用戶(hù)有著巨大分歧。另一方面, 41%的受訪者認(rèn)為這一設(shè)想能夠?qū)崿F(xiàn)。剩下的受訪者表示無(wú)法回答這一問(wèn)題。
W3C基礎(chǔ)性標(biāo)準(zhǔn)目前最終定稿并獲得了支持。目前平臺(tái)和軟件工具數(shù)量也在不斷增加。專(zhuān)家表示,盡管如此,語(yǔ)義網(wǎng)技術(shù)和標(biāo)準(zhǔn)遠(yuǎn)沒(méi)有獲得能夠充分展示其優(yōu)勢(shì)的足夠支持。
重要的是,在通用語(yǔ)義技術(shù)和符合W3C標(biāo)準(zhǔn)與專(zhuān)用于網(wǎng)絡(luò)信息資源的語(yǔ)義網(wǎng)技術(shù)之間有著明顯的界限。
專(zhuān)家表示,語(yǔ)義技術(shù)正在普及,特別是在企業(yè)知識(shí)管理和商業(yè)智能領(lǐng)域。市場(chǎng)研究公司IDC分析師Susan Feldman稱(chēng),“幫助用戶(hù)查找他們想找的非結(jié)構(gòu)性信息”的語(yǔ)義內(nèi)容分析工具市場(chǎng)正在以每年20%的速度增長(zhǎng)。她指出,目前大多數(shù)企業(yè)搜索平臺(tái)正在包含語(yǔ)義技術(shù)。
與傳統(tǒng)的商業(yè)智能工具相比,語(yǔ)義技術(shù)的一個(gè)最大優(yōu)勢(shì)是讓主題專(zhuān)家(SME)能夠創(chuàng)建他們自己的查詢(xún)架構(gòu),無(wú)需經(jīng)歷苛刻而耗時(shí)的創(chuàng)建和重建數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市任務(wù)。Project10X總經(jīng)理Mills Davis舉例稱(chēng):“一個(gè)精通標(biāo)準(zhǔn)的專(zhuān)家能夠在兩周內(nèi),而不是在9個(gè)月里創(chuàng)建一個(gè)語(yǔ)義架構(gòu),然后輕松而快速的進(jìn)行調(diào)整?!?/p>
與傳統(tǒng)商業(yè)智能工具相比,語(yǔ)義技術(shù)另一個(gè)優(yōu)勢(shì)是具有執(zhí)行更為復(fù)雜而模糊的查詢(xún),能夠?qū)Ψ墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,并且可先從小范圍的精確查詢(xún)開(kāi)始,然后逐漸擴(kuò)展。
在網(wǎng)絡(luò)上,語(yǔ)義技術(shù)已經(jīng)在日漸增長(zhǎng)的商業(yè)市場(chǎng)中站穩(wěn)了腳跟。在電子出版物市場(chǎng),在線新聞服務(wù)商DBpedia、Geonames、RealTravel 和 MetaWeb都已經(jīng)率先采用了該技術(shù)。在在線金融信息服務(wù)業(yè)務(wù)中,湯森路透和道瓊斯也已經(jīng)部署語(yǔ)義技術(shù)。其中湯森路透OpenCalais 的大客戶(hù)中包括美國(guó)哥倫比亞廣播傳媒集團(tuán)(CBS)旗下互動(dòng)媒體集團(tuán)和CNET 集團(tuán),老牌電子雜志Slate、赫芬頓郵報(bào)和網(wǎng)絡(luò)新聞聚合公司Moreover 技術(shù)。另外,大約9000家在線書(shū)城目前正在使用OpenPublish。OpenPublish將OpenCalais 與開(kāi)源內(nèi)容管理系統(tǒng)Drupal整合在了一起。
近期,網(wǎng)絡(luò)零售商開(kāi)始部署語(yǔ)義網(wǎng)平臺(tái),幫助優(yōu)化產(chǎn)品和品牌在搜索結(jié)果中的排名,為客戶(hù)提供更多、更豐富的購(gòu)物體驗(yàn)。
需克服的障礙
如今W3C 標(biāo)準(zhǔn)還缺乏更為廣泛的支持,并且缺乏便于跨網(wǎng)絡(luò)和商業(yè)領(lǐng)域進(jìn)行語(yǔ)義查詢(xún)的常用詞匯表。數(shù)語(yǔ)義網(wǎng)圖式主體還在開(kāi)發(fā)之中。專(zhuān)業(yè)人士指出,由于這類(lèi)框架通常包括特定的商業(yè)和功能術(shù)語(yǔ),行話和縮略語(yǔ),因此其他行業(yè)無(wú)法很好的理解它們。這也使得跨領(lǐng)域查詢(xún)、語(yǔ)義應(yīng)用和服務(wù)必須每個(gè)信息資源的本體知識(shí)庫(kù)聯(lián)系起來(lái)。
下面以為大家介紹一下全球知名的能源公司Eni的案例。據(jù)Eni的語(yǔ)義技術(shù)主管Daniele Montanari稱(chēng),該公司的技術(shù)和主題專(zhuān)家花了12年開(kāi)發(fā)和調(diào)整Expert System的Cogito語(yǔ)義商業(yè)智能平臺(tái)。該平臺(tái)可支持與石油、天然氣和電力有關(guān)的交易、生產(chǎn)和物流處理。
Montanari 稱(chēng),Cogito 允許Eni的終端用戶(hù)前往網(wǎng)絡(luò)上預(yù)選和預(yù)定的信息資源,查找關(guān)于特定主題的重要信息,然后生成一個(gè)可以下載、自動(dòng)更新和進(jìn)行語(yǔ)義查詢(xún)的“語(yǔ)料庫(kù)”。
Montanari 稱(chēng),語(yǔ)義圖式趨向于針對(duì)特定的商業(yè)領(lǐng)域。比如,公司的精煉部門(mén)開(kāi)發(fā)了可在大量文檔中快速定位信息的語(yǔ)義框架和分類(lèi)。在這些文檔中,許多由Eni的研發(fā)團(tuán)隊(duì)所編寫(xiě),另一些則來(lái)自團(tuán)隊(duì)定購(gòu)的網(wǎng)絡(luò)資源。
對(duì)于石油工業(yè)最新的技術(shù)研發(fā)來(lái)說(shuō),由于每個(gè)網(wǎng)站都有自己的專(zhuān)用本體知識(shí)庫(kù),因此通用的網(wǎng)絡(luò)搜索存在許多問(wèn)題。Montanari 稱(chēng):“在一個(gè)信息領(lǐng)域內(nèi)包含有多個(gè)來(lái)源,因此你必須要定義一個(gè)普用的語(yǔ)義模式?!?/p>
Montanari 稱(chēng),相同的問(wèn)題還存在于內(nèi)部語(yǔ)義查詢(xún)中。他的團(tuán)隊(duì)曾經(jīng)嘗試創(chuàng)建一個(gè)適用于整個(gè)公司的語(yǔ)義圖式,能夠?yàn)楣镜臄?shù)據(jù)庫(kù)和數(shù)據(jù)集中的每件事物準(zhǔn)確找到對(duì)應(yīng)物,但是公司最終無(wú)法解決石油、天然氣、研發(fā)、營(yíng)銷(xiāo)等業(yè)務(wù)領(lǐng)域中存在的差異。
他稱(chēng):“即使在邏輯上,這也是一個(gè)難題?!币虼耍谔厥獾臉I(yè)務(wù)部門(mén)和行業(yè)中還是傾向于保留內(nèi)部查詢(xún)。
發(fā)展前景展望
在行業(yè)管控和客戶(hù)壓力下,標(biāo)準(zhǔn)化的本體知識(shí)庫(kù)已經(jīng)出現(xiàn)。電子商務(wù)公司是否會(huì)真正團(tuán)結(jié)在一個(gè)通用圖式下還有待觀察。
其中一個(gè)嘗試是GoodRelations 電子商務(wù)詞匯表。目前,僅有BestBuy.com和Overstock.com等少數(shù)公司加入其中。不過(guò),谷歌在近期也宣布他們支持該詞匯表。
《新一波技術(shù)浪潮》作者Phil Simon稱(chēng):“與電話和互聯(lián)網(wǎng)一樣,隨著越來(lái)越多的人使用新技術(shù),它們才會(huì)變得更具價(jià)值?!彼赋?,對(duì)于許多公司來(lái)說(shuō),目前仍然缺乏一個(gè)明確的投資回報(bào),這是部署的主要成本。Simon稱(chēng),那些希望能夠訪問(wèn)內(nèi)部和互聯(lián)網(wǎng)中大量非結(jié)構(gòu)化信息的公司在得到回報(bào)前往往要花上數(shù)年時(shí)間設(shè)置語(yǔ)義網(wǎng)基礎(chǔ)設(shè)施。除了新技術(shù)需要投資外,清理和標(biāo)記數(shù)據(jù)等工作也需要大量的資金。
實(shí)際上,與之前許多突破性信息技術(shù)一樣,語(yǔ)義網(wǎng)可能會(huì)陷入《第22條軍規(guī)》所描述的困境中:在新技術(shù)體現(xiàn)出優(yōu)勢(shì)前需要有大量的用戶(hù)使用,但是公司,尤其是電子商務(wù)公司在用戶(hù)數(shù)量達(dá)到一定規(guī)模后,才會(huì)部署新技術(shù)。
BestBuy.com網(wǎng)絡(luò)研發(fā)總工程師Jay Myers在博客中稱(chēng):“產(chǎn)品目錄對(duì)于零售/制造商都是獨(dú)一無(wú)二的,由于有著數(shù)十億種產(chǎn)品,通用產(chǎn)品目錄是一個(gè)不可能實(shí)現(xiàn)的目標(biāo)。我看到了一些在產(chǎn)品目錄方面的嘗試,但是我沒(méi)有看到這些嘗試取得什么進(jìn)展。目前業(yè)內(nèi)已達(dá)成共識(shí),即產(chǎn)品目錄定義看起來(lái)沒(méi)有用處,應(yīng)用避免。”
不過(guò),Myers表示:“正是由于沒(méi)有任何通用標(biāo)準(zhǔn),這并不意味著我們無(wú)法通過(guò)W3C 標(biāo)準(zhǔn)和GoodRelations等本體知識(shí)庫(kù)為機(jī)器設(shè)置某種類(lèi)似的產(chǎn)品目錄。這是一種雙贏的舉措,因?yàn)楣緦?huì)讓客戶(hù)感到滿(mǎn)意,而客戶(hù)也將通過(guò)相關(guān)的產(chǎn)品數(shù)據(jù)權(quán)衡自己的購(gòu)買(mǎi)決定。”
實(shí)際上,許多語(yǔ)義網(wǎng)社團(tuán)仍然認(rèn)為語(yǔ)義技術(shù)將最終會(huì)為網(wǎng)絡(luò)帶來(lái)一場(chǎng)革命。
Davis稱(chēng):“隨著用戶(hù)數(shù)量和數(shù)據(jù)移動(dòng)性的增加,以及互聯(lián)網(wǎng)服務(wù)和數(shù)字化數(shù)據(jù)信息滲入到我們的日常生活中,迫使我們將研發(fā)方向轉(zhuǎn)向語(yǔ)義。由于錯(cuò)誤的網(wǎng)絡(luò)信息源快速擴(kuò)散,現(xiàn)在已經(jīng)不再是在干草堆中找一針那樣了,你的首要任務(wù)是找到是正確的那一垛干草堆。語(yǔ)義學(xué)為我們帶來(lái)了一個(gè)重要的分離方法?!?/p>
Simon 稱(chēng):“當(dāng)我在技術(shù)圈里提到語(yǔ)義網(wǎng)時(shí),90%的人不知道我在說(shuō)什么。有人問(wèn)我,我是否相信它的實(shí)力,是否相信它會(huì)成為游戲規(guī)則的改變者?我的答案是‘絕對(duì)是’?!?/p>
評(píng)論