人工智能是當(dāng)前很熱門的技術(shù),各國都在投入資金和人力進(jìn)行研究。誰錯過了人工智能,誰就丟掉了未來。
語言文字在人工智能中占有非常重要的地位,它是人和人工智能交互的工具,人工智能只有準(zhǔn)確理解語言文字才能做出準(zhǔn)確應(yīng)對,才能表現(xiàn)出高智商。今天就談?wù)勚形暮陀⑽氖遣皇莾?yōu)秀的人工智能語言,以及未來前景。
一、語音識別
雖然我不想承認(rèn),但英文語音識別確實(shí)比中文更準(zhǔn)確、高效。
英文由26個字母構(gòu)成,邏輯結(jié)構(gòu)更簡單,發(fā)音以字母為基礎(chǔ),音標(biāo)和音標(biāo)區(qū)之間區(qū)分比較明顯,只要說的不是很快,AI能比較容易、準(zhǔn)確識別每一個字母,加上同音單詞比較少,所以英文的語音識別效率領(lǐng)先中文許多。
中文發(fā)音則要復(fù)雜的多。漢語拼音有23個聲母,6個單韻母,18個復(fù)韻母,還有16個整體認(rèn)讀音節(jié),整套方案共63個發(fā)音元素。除此之外,漢語還有四種音調(diào),加上種類繁多的方言,發(fā)音不準(zhǔn)的話,非常影響AI識別。
AI在進(jìn)行中文識別的時候,需要先進(jìn)行發(fā)音識別,再根據(jù)單詞進(jìn)行漢字判斷,識別效率低于英文,識別錯誤率也高于英文。
語音識別,英文勝。
二、文字識別
到文字識別環(huán)節(jié),我們終于可以揚(yáng)眉吐氣了,中文文字識別的效率和準(zhǔn)確度比英文更勝一籌。
中文有幾個特點(diǎn),讓AI識別更高效:
1、漢字信息密度高,更少的字?jǐn)?shù)可以承載更多的信息,中文文章永遠(yuǎn)比英文短,綜合來看,中文信息密度比英文高37.5%。
2、中文以漢字為單位,可以靈活排列,橫豎都可以,而英文是線性文字,只能橫排,豎排、錯亂排列的識別效率會驟降!
3、漢字獨(dú)立表意能力強(qiáng)。比如“他去吃早飯”,你看一個字就能多明白一個字的意思。而英文“He went to have breakfast”,你即使看到“have”這個詞,你依然不明大概的意思,只有到“breakfast”你才知道原來have是吃,went to是去,整句是去吃早飯。英文表意比較依賴“短語”,甚至整句,不看完整句話,你往往不能知道句意。這就給AI識別造成了難度,因為AI跳躍識別能力較差。
文字識別,中文勝。
三、同音字詞
中文發(fā)展人工智能比較大的障礙就是同音字詞現(xiàn)象!比如,他姓zhang,到底是“張”還是“章”呢?如果是口語的話,還要補(bǔ)一句弓長張,或立早章。中文里有多少同音字、同音詞,很難準(zhǔn)確的統(tǒng)計。同音字詞也是英語使用者攻擊中文表意不清比較大的借口。
英語雖然也有同音字,如right正確的、write寫字;meet遇見、meat 肉;hole 洞穴、whole 全部的;pear梨子、pair雙;flower花、flour面粉等,但英語同音字詞數(shù)量遠(yuǎn)比中文同音詞數(shù)量少。英語是通過造更多單詞的方法,來減少同音詞現(xiàn)象的。
AI現(xiàn)在不能準(zhǔn)確處理多音字,出錯在所難免。難道為了AI準(zhǔn)確,人類只能通過語言文字改革消滅多音字詞?這工程也太大了,人類也很難適應(yīng)這么大的改革!
同音字詞,英文勝。
四、多義字詞
一詞多義,是每種成熟語言都難免的,世間萬事萬物這么多,情感這復(fù)雜,如果每個詞匯只表達(dá)一個準(zhǔn)確的意思,那幾百萬字詞都收不住。無論是中文還是英文,一個字詞不會只表達(dá)一個意思,通常有很多意思,有時候區(qū)別還很大!
比如“close”,其意思非常多:關(guān)閉、合攏、合上、不開放、(使)關(guān)門、關(guān)閉(一段時間)、結(jié)束、終結(jié)、接近、幾乎(處于某種狀態(tài))、可能(快要做某事)、親密的、密切的、接近、靠近、不遠(yuǎn)地、死胡同、斷頭路、大教堂所屬的周圍場地及建筑物等。
現(xiàn)在人工智通過上下文識別詞義的能力還比較弱,遇到多義詞的時候經(jīng)常出錯,這也是人工智能發(fā)展的難關(guān)。
多義字詞,中文和英文彼此彼此。
五、整段識別
讓人工智能翻譯一個短句,一句話,其實(shí)沒多大意義,實(shí)用價值也不高,只有具備整段文字識別,才有實(shí)用價值。讓我們以中英文互譯來考察AI對中文和英文的識別能力了!
原文如下:
“Things that trend in these two countries are insanely different. For example: knowledge-basedcontent is extremely popular in China, and less so in the U.S. Also, this was wild to me: thosecreators that did the most dance videos in China are users born in the 60s (!!), whereas in theUS, it seems that it‘s mostly teenagers who are creating the dances,” she wrote.
她寫道:“這兩個國家的趨勢截然不同,比如:知識性內(nèi)容在中國很流行,但在美國稍差一些。而且,這一點(diǎn)對我來說很瘋狂:中國最喜歡拍舞蹈視頻的是60后(!!),但在美國,好像是年輕人最喜歡拍舞蹈視頻。”
AI將“英文原文”翻譯成中文如下:
“這兩個國家的趨勢截然不同。例如:以知識為基礎(chǔ)的內(nèi)容在中國非常受歡迎,而在美國卻很少。此外,這對我來說很瘋狂:在中國制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(!!)的用戶,而在美國,似乎是大多數(shù)年輕人在創(chuàng)作舞蹈。”她寫道。
有一句失真比較嚴(yán)重:“在中國制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(!!)的用戶。”
這句話的英文原文是: “those creators that did the most dance videos in China are users born in the 60s ”。這是一句英語長句,詞序比較復(fù)雜,又夾雜了亂七八糟的介詞,導(dǎo)致人工智能的大腦錯亂,沒能準(zhǔn)確識別!
這個英文識別錯誤很有典型性,暴露了英文在語法上、詞序上太過復(fù)雜的弊端。如果是翻譯更復(fù)雜的英語長句,AI將束手無策!這也是每個表音文字的弱點(diǎn)!
AI將“中文原文”翻譯成英文如下:
“The trends in these two countries are quite different. For example, intellectual content is very popular in China, but a bit worse in the United States. Moreover, this is crazy to me: China’s favorite dance video is born in the 60s (! !), but in the United States, it seems that young people like to shoot dance videos the most,” she wrote.
中文翻譯非常精準(zhǔn),和原文在表意上幾乎沒有任何差別,如實(shí)還原了原文的意思!可見,在整段話、整篇文章的識別上,中文比英文更有優(yōu)勢!
中文是由一個個漢字構(gòu)成,長句很少,語法簡單,詞序簡單,在語句結(jié)構(gòu)上比線性的英語簡單的多,更有利于AI識別。
六、誰才是人工智能的未來?
在人工智能領(lǐng)域,英文勝在口語,中文勝在書面語,各有所長,誰能成為AI的母語還言之過早。但在比較復(fù)雜的內(nèi)容表達(dá)上,AI對中文的識別領(lǐng)先英文,所以我更看好中文的未來。
責(zé)編AJX
-
AI
+關(guān)注
關(guān)注
87文章
34000瀏覽量
275079 -
語音識別
+關(guān)注
關(guān)注
39文章
1773瀏覽量
113855 -
語言
+關(guān)注
關(guān)注
1文章
97瀏覽量
24424
發(fā)布評論請先 登錄
小智AI語音助手調(diào)試成功,母親節(jié)祝福語演示來啦
2.5D封裝為何成為AI芯片的“寵兒”?

《AI Agent 應(yīng)用與項目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用
寶駿汽車靈語智艙與DeepSeek完成深度融合
無刷電機(jī) 如是觀

把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動端側(cè)AI規(guī)模化拓展

薄膜發(fā)電為什么不能成為主流
云知聲口語評測技術(shù)應(yīng)用于教育領(lǐng)域
GenAI IaaS增速驚人,商湯科技躋身第一梯隊

自然語言處理是什么技術(shù)的一種應(yīng)用
自然語言處理包括哪些內(nèi)容
臺積電加速先進(jìn)封裝產(chǎn)能建設(shè)應(yīng)對AI芯片需求
蘋果CEO,一代不如一代?

評論