三、谷歌大型數據中心的神經網絡模擬技術啟動
谷歌(Google)已經開始啟用一種分布于該公司大型數據中心內的大規模神經網絡(neural network)軟件模擬技術,來研究標記數據和自主學習 (self-taught learning)之間的差異;谷歌的大型數據中心搭載了16,000顆處理器核心。來自斯坦福大學(Standford University)和谷歌公司的研究人員針對具有超過10億個連接的模型進行了訓練,經過一星期后,該網絡已經能從網絡視頻影片辨識出其中的一只貓。
谷歌向來以其搜索引擎而聞名,該公司表示,自主學習神經網絡的優勢是在于他們不需要使用標記數據。例如,為一幅貓的影像添加標簽,便是所謂的標記數據,但這種做法會消耗大量能源,而且讓教學網絡變得更加昂貴。
谷歌表示,未來該研究還可望拓展到圖像識別以外的范圍,包括語音識別和自然語言建模等應用研究。
經過訓練以后,網絡中的一個神經元對貓有著極強烈的反應。/ 資料來源:g谷歌
“我們的假設是神經網絡將學會去辨識這些影片中的共同目標。事實上,我們已經發現,一個人工神經元對貓的圖片有著極強烈的反應。最特別一點,在于研究人員從未告訴該網絡什么是貓,甚至從未替任何一幅貓的圖案打上標記。而這個神經網絡竟然從未標記過的YouTube影片中發現并注視著一只貓,谷歌研究員Jeff Dean說。
此外,谷歌也通過使用這種規模較大的神經網絡,谷歌也通過將大量網絡上的可用未標記影像和少數標記數據混合,并進行標準影像分類測試后,獲得了70%的精確度改善結果。
谷歌的研究人員希望未來能進一步擴大網絡規模,以確認性能是否會隨著網絡規模擴展而提升。Dean在他的博客中表示,目前的網絡已經能支持十億個連接,但仍遠不及可支持約100兆個連接的人腦。
谷歌的研究人員已經在今年6月26日至7月1日于蘇格蘭愛丁堡舉辦的國際機器學習大會(International Conference on Machine Learning, ICML 2012)中,提出這份有關神經網絡學習的論文。
評 論
請勿進行人身攻擊,謾罵以及任何違法國家相關法律法規的言論。
正在加載評論...