半導體是數字時代的基礎技術。它是硅谷名字的來源。它是過去半個世紀改變了社會各個方面的計算機革命的核心。 自從英特爾在1971年推出世界上第一個微處理器以來,計算能力的提高步伐令人嘆為觀止,且永不停息。根據摩爾定律,當今的計算機芯片比50年前的功能強大了數百萬倍。 然而,盡管數十年來處理能力飛速增長,但直到最近,計算機芯片的基本體系結構仍基本上保持靜態。在大多數情況下,芯片的創新需要進一步使晶體管小型化,以便將更多晶體管壓縮到集成電路中。幾十年來,英特爾和AMD等公司通過可靠地提高CPU性能而蓬勃發展,這一過程被Clayton Christensen稱為“持續創新”。 今天,這種情況正在以戲劇性的方式改變。AI迎來了半導體創新的新黃金時代。數十年來,機器學習的獨特需求和無限的機會第一次激發了企業家重新思考和重新思考芯片架構的最基本原則。 他們的目標是設計一種專為AI設計的新型芯片,它將為下一代計算提供動力。它是當今所有硬件中最大的市場機會之一。
新的計算范式
在計算的大部分歷史中,主要的芯片體系結構一直是CPU或中央處理器。如今,CPU無處不在:它們為筆記本電腦,移動設備和大多數數據中心供電。 1945年,傳奇的John von Neumann 設計了 CPU的基本體系結構。值得注意的是,此后其設計基本上保持不變:今天生產的大多數計算機仍是馮·諾依曼機器。 CPU在用例中的優勢是其靈活性的結果:CPU是通用計算機,能夠有效執行軟件所需的任何計算。但是,盡管CPU的主要優勢是多功能性,但是當今領先的AI技術需要非常特殊且密集的一組計算。 深度學習需要迭代執行數百萬或數十億個相對簡單的乘法和加法步驟,簡單那來說就是線性代數,深度學習的根本是參數微調,矩陣相乘。 這種重復的,計算量大的工作流程對硬件體系結構具有一些重要意義。并行化(處理器能夠同時而不是一個接一個地執行許多計算的能力)變得至關重要。與此相關的是,由于深度學習涉及大量數據的連續轉換,因此將芯片的內存和計算核心盡可能靠近地放置,可以通過減少數據移動來獲得巨大的速度和效率。 CPU 不足以支持機器學習的獨特需求。CPU按順序而不是并行地處理計算。它們的計算核心和內存通常位于單獨的模塊上,并通過帶寬受限的通信系統(總線)連接。這在數據移動中產生了瓶頸,稱為“馮·諾依曼瓶頸”。這就導致在CPU上訓練神經網絡效率極低。
鑒于機器學習應用在整個社會中正變得越來越普遍,傳統芯片無法處理現代AI算法這個問題變得越來越嚴峻。正如AI行業偉大的Yann LeCun最近說的那樣:“如果您預估未來的五,十年,您會發現計算機大部分時間都花在做深度學習之類的事情。” 至此,推動AI繁榮的芯片是GPU(圖形處理單元)。GPU架構是Nvidia在1990年代后期為游戲應用發明的。為了以高幀速率渲染計算機游戲的詳細圖形,GPU專門用于連續處理大量數據。與CPU不同,GPU可以并行完成數千個計算。 在2010年代初,AI社區開始意識到 Nvidia的游戲芯片實際上非常適合處理機器學習算法所需的工作負載類型。這就讓GPU找到了巨大的新市場。Nvidia抓住機遇,將自己定位為AI硬件市場領先的提供商。這就讓公司收獲了驚人的收益:從2013年到2018年,英偉達的市值躍升了 20倍。 然而,正如Gartner分析師Mark Hung所說,“每個人都同意GPU并非針對AI工作負載進行了優化。” GPU已被AI社區采用,但它并非為AI而生。
近年來,一大批企業家和技術人員開始重新構想計算機芯片,從頭開始對其進行優化,以釋放AI的無限潛力。用Alan Kay令人難忘的話來說:“真正認真對待軟件的人們應該自己制造硬件。” 在過去的24個月中,出現了五只AI芯片獨角獸。令人瞠目結舌的估值也吸引了更多新貴。傳統CPU的領導者為了避免被拋棄,也參與其中。僅英特爾一家就完成了這一類別的兩項重大收購:Nervana Systems(2016年4月以4.08億美元收購)和Habana Labs(2019年12月以20億美元收購)。在未來幾年中,隨著這場競賽的進行,將有數千億美元的企業價值被爭奪。
下一個英特爾?
巨大的市場機會和前景技術的挑戰相結合,激發他們創造出驚人的創意——有時是驚人的、設計理想的AI芯片的方法。 新一代AI芯片初創企業中最引人注目的就是Cerebras Systems。簡單地說,Cerebras的大膽方法是制造有史以來最大的芯片。最近該公司的價值為$ 1.7B,該公司已從包括Benchmark和Sequoia在內的頂級投資者籌集了$ 200M。 Cerebras芯片的規格令人難以置信。它比典型的微處理器大60倍左右。它是歷史上第一個容納超過1萬億個晶體管(準確地說是1.2萬億個)的芯片。它的片上內存為18 GB,這是有史以來最多的。 將所有計算能力打包到單個硅基板上可帶來誘人的好處:數據傳輸效率大大提高,內存與處理并置,大規模并行化。但是,如果想輕描淡寫工程上的挑戰,這是荒謬的。因為幾十年來,制造晶圓級芯片一直是半導體行業夢寐以求的夢想,但從未實現。 Cerebras首席執行官Andrew Feldman說:“每個規則,每個工具和每個制造設備都是為正常尺寸的“巧克力曲奇”設計的,我們提供了整個“曲奇紙”大小的產品。” “方法的每一步,我們都必須發明。” Cerebras的AI芯片已經投入商業使用:就在上周,Argonne National Laboratory宣布將使用Cerebras的芯片來幫助對抗冠狀病毒。 另一家采用全新的芯片設計新方法的公司是基于灣區的Groq。與Cerebras相比,Groq的芯片專注于推理,而不是模型訓練。創始團隊擁有世界一流的領域專業知識:Groq的團隊包括Google TPU項目的十個原始成員中的八個,這是迄今為止最成功的AI芯片工作之一。
Groq顛覆了業界的傳統常識,正在構建批量batch size為1的芯片,這意味著它可以一次處理一個數據樣本。據該公司稱,這種架構幾乎可以實現瞬時推斷(對于諸如自動駕駛汽車等對時間敏感的應用程序至關重要),而無需犧牲性能。Groq的芯片很大程度上是軟件定義的,從而使其具有獨特的靈活性和永不過時的特性。 該公司最近宣布其芯片達到每秒1萬億次運算的速度。如果為真,這將使其成為歷史上最快的單die芯片。 也許沒有一家公司比Lightmatter具有更出色的技術愿景。它是由光子學專家創立,總部位于波士頓。Lightmatter尋求構建一種AI微處理器,該微處理器不是由電信號而是由光束驅動的。該公司已從GV,Spark Capital和Matrix Partners籌集了3,300萬美元,以實現這一愿景。據該公司稱,光的獨特性能將使其芯片性能比現有解決方案高十倍。
此類別中還有許多其他玩家值得關注。兩家中國公司Horizon Robotics和Cambricon Technologies各自以更高的估值籌集了比其他任何競爭對手都更多的資金。帕洛阿爾托的SambaNova Systems 資金雄厚,技術精湛。盡管有關SambaNova計劃的細節仍然很少,但其技術似乎特別適合于自然語言處理。其他值得注意的初創公司包括Graphcore,Blaize,Mythic和Kneron。 幾家科技巨頭已經開始自己的內部努力來開發專用AI芯片。這些程序中最成熟的是上面提到的Google的Tensor處理單元(TPU)。像往常一樣,在技術曲線之前,谷歌于2015年開始研發TPU。最近,亞馬遜宣布其Inferentia AI芯片在2019年12月大張旗鼓地發布。特斯拉,Facebook和阿里巴巴以及其他技術巨頭都在參與其中。內部AI芯片程序。
結論
爭相開發將為即將到來的AI時代提供動力的硬件的競賽正在進行中。自硅谷成立以來,如今的半導體行業正在發生比以往任何時候都更多的創新。不可估量的數十億美元正在發揮作用。 下一代芯片將在未來幾年中塑造人工智能領域的輪廓和軌跡。用Yann LeCun 的話來說:“硬件功能。。。激勵并限制AI研究人員將想象并允許自己追求的想法類型。我們可以使用的工具比我們愿意承認的更能塑造我們的思想。”
編輯:hfy
-
英特爾
+關注
關注
61文章
10185瀏覽量
174227 -
神經網絡
+關注
關注
42文章
4812瀏覽量
103117 -
AI
+關注
關注
88文章
34657瀏覽量
276560 -
機器學習
+關注
關注
66文章
8499瀏覽量
134273
發布評論請先 登錄
AI驅動半導體與系統設計 Cadence開啟設計智能化新時代

Banana Pi 與瑞薩電子攜手共同推動開源創新:BPI-AI2N
北京市最值得去的十家半導體芯片公司
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
當我問DeepSeek AI爆發時代的FPGA是否重要?答案是......
AI賦能邊緣網關:開啟智能時代的新藍海
啟明云端2024火山引擎FORCE原動力大會·冬正在進行中,共赴AI探索未來科技盛宴

評論