如果一件事在別人眼中是坐冷板凳,是做臟活、累活,你是否還會堅持做下去呢?
石侃·中國科學院計算技術研究所副研究員格致論道第117期|2025年1月18日 北京
大家好,我是來自中國科學院計算技術研究所的石侃,一個 “斜杠科技工作者”。我在芯片領域有十多年的從業經驗,現在我在中國科學院從事芯片相關的學術研究;但同時我還是一個B站的科技UP主“老石談芯”,我的觀眾都叫我“老石”。
芯片:現代社會的基石
提到芯片,大家肯定都知道它的重要性。
不管是現在正熱的人工智能,還是生命醫藥、自動駕駛、網絡通信等等,你能想象的現代社會的所有科技,幾乎都離不開芯片——這一信息時代的基石性技術。
我從事芯片工作已經有很長時間了,芯片研發的過程其實是個很有趣的過程,這主要源于兩個方面。
首先,芯片的應用非常廣泛。一旦你從事了這個行業,大概率不用擔心自己會失業,因為很多行業都需要用到芯片技術。
第二個原因可能更重要:芯片研發是一個非常難的事情。作為芯片工程師,我們需要不斷地學習、不斷地充實自己,來應對和迎接這個充滿機遇和挑戰的時代。
那么問題就來了,芯片技術到底難在哪里?
芯片為什么這么難?
已完成:10%//////////
大家可能知道,一顆芯片的制造過程,本質上其實是一粒沙子的進化之旅。沙子可能是這個星球上取之不盡、用之不竭的東西;但把低價值的沙子做成高價值的芯片,附加的全部都是人類的智慧。
從沙子開始,我們需要對它進行提純,得到晶圓。然后,再對晶圓進行光刻、離子注入、刻蝕、封裝等一系列環節,才能從取之不盡、用之不竭的沙子變成最終的一顆小小的芯片。
那么說了這么多,有這么多的環節,其實芯片制造只是整個芯片開發流程的一部分,它并不等于芯片開發本身。
還有一個非常重要的環節,那就是芯片設計。它指的是根據需求完成電路設計,并讓電路能正常工作。然后,我們把設計好的電路交給芯片制造商,讓他們進行后期的制造,最終得到芯片的實體。
但這里還有另一個問題:如何保證芯片的功能和你一開始的設計是一樣的?

這里有一個很有意思的小故事。在1947年,一位非常著名的女性程序員Grace Hopper發現自己的電腦不工作了。經過仔細地排查和探索,她發現原來是電腦的繼電器里飛進去了一只蛾子。于是,她用鑷子小心翼翼地把這只蛾子給夾出來,然后貼到了一張紙上。
這有可能是我們整個計算機發展歷史上發現的第一個“bug”(蟲子),也就是漏洞。

如果說前面的例子過于久遠,那我們其實還有更多的例子。這里給各位出一個數學題,請問這個式子最終的結果等于多少?其實這個題目很簡單,因為在后面式子里,分子和分母其實是一樣的,可以消掉;然后減號前面的數和后面的數其實也是一樣的,所以同樣的數字相減,最后的答案應該等于0。但是,在實際的計算機和芯片當中,有可能得出來的結果并不是這樣。

比如,在英特爾的一個奔騰芯片中,得到的結果是255.00000000。這是怎么回事呢?原來有一個美國科學家在做科學研究時,當他運行這個式子的時候,怎么算都算不對。最后他才發現,原來在這顆芯片的一個浮點除法運算單元里,存在著一個沒有被發現的設計漏洞。
可不要小看這個設計漏洞,它帶來的后果其實是非常嚴重的。在20世紀90年代,英特爾花了4.75億美元在全球范圍內召回了所有出現這個問題的奔騰芯片。
所以回到剛才的問題,芯片技術到底難在哪里?在我看來,芯片的難點在于它需要一次性成功。做芯片不像軟件,你可以后期通過打補丁的方式,去修復各種問題。相比之下,芯片一旦走完了從沙子到芯片的進化之旅,你可能就已經花費成千上萬,甚至上億元去完成芯片的流片和制造,很難再修改了。
那么,下一個問題就是:現在有多少芯片項目能夠實現一次性成功?
“卡脖子”的芯片驗證
已完成:40% //////////
根據調查結果的數據,只有24%的芯片項目可以實現一次性成功。也就是說,有3/4的芯片項目由于存在著各種各樣的、大大小小的、沒有被發現的設計漏洞,所以至少需要再去開展一次流片,這就會花費大量的時間和金錢。

所以,問題的關鍵在于:我們如何能夠盡可能保證芯片在流片制造之前盡可能少有、或者是盡可能沒有bug、沒有設計漏洞。也就是我過去幾年一直在致力研究的方向。

同樣是根據這個研究數據,在整個芯片開發過程中,特別是隨著現在人工智能以及各種高新技術的發展,芯片變得越來越復雜。芯片驗證也由此成為整個芯片開發周期中占比非常高的環節,甚至超過了一半,達到了整個芯片設計周期的70%。
但很遺憾,芯片驗證也是一件很難的事情。我這里列出了一些天文數字,比如地球的周長、銀河系里可能存在的星星數量,或者是光年的長度。
在芯片驗證里,其實也存在著一個天文數字,那就是完全驗證一顆CPU核心所需要的周期數。這個天文數字到底代表什么意義呢?
如果我們用現在最先進的軟件仿真技術去完全驗證一顆CPU核心,需要至少15000年。而使用現在最先進的硬件仿真技術,可以把這個時間稍微縮短到30年。但我們都知道,開發一顆芯片不可能等15000年,也不可能等30年。
那么,問題的本質到底是什么?過去幾年我們其實一直在研究。我們發現,在芯片驗證中存在著一個所謂的“不可能三角”,也就是芯片驗證的高性能、良好的調試能力以及低成本;而這三個對芯片驗證至關重要的因素不可能同時滿足。對于現在主流的研究或方法來說,最多就是三者取其二,而這也就是導致芯片驗證效率非常低的一個本質原因。
總要有人去做一些不一樣的事情
已完成:60%//////////
由于這些原因,芯片驗證在過去一段時間里并沒有很大的發展。
在芯片公司里,芯片工程師可能更多地是在寫測試用例、跑回歸驗證。本質上,這是一個臟活累活。在學術領域也是如此,投身于芯片驗證研究的學者其實很少,特別是和現在大火的人工智能等熱門領域的研究相比,芯片驗證相關的研究是非常少的。
所以,有學術大佬跟我說過,在同樣的時間內,我能夠在人工智能領域發三篇甚至是更多的論文,但芯片驗證可能一篇也發不出來。
很遺憾,他說的是對的。
不過,總要有人去做一些不一樣的事情。
所以,在過去的幾年中,我一直帶領團隊從事芯片驗證的相關研究,并且從零到一構建了一個敏捷驗證研究體系。這個研究體系的核心是一個名叫ENCORE的驗證平臺,它基于一個特殊的芯片——現場可編程門陣列(FPGA)。ENCORE能夠大幅提升驗證效率,同時實現較好的驗證可調試性。
為了構建這個敏捷驗證研究體系,我們一方面需要在算法層面不斷優化漏洞挖掘、調試以及修復的效率;另一方面,我們也希望能夠構建一套端到端的基于可編程邏輯芯片(FPGA)的敏捷驗證加速平臺。在應用層面,我們希望這個平臺既能適用于通用處理器的驗證,比如CPU或GPU,也能適用于專用芯片的驗證,比如現在非常流行的AI加速器。
在過去一段時間里,我們在這個領域做了很多前沿的探索工作,包括前面提到的ENCORE以及很多的新研究。我們也把這些研究成果發表在了很多國際知名的學術會議上。
后面我們其實也在進行一些很有趣的工作,由于這些工作現在還沒有發表,所以就先不跟大家一一展示了。
如果大家對我們的工作感興趣,可以去我的B站主頁,或者是通過B站的后臺私信聯系我。現在,也有很多同學也想要參與進來,歡迎大家加入我們的團隊,一起從事這種很有趣的敏捷驗證學術研究。
讓更多人更了解芯片
已完成:80%//////////
但是在研究過程中,我逐漸發現這些科研成果或學術成果,主要是給我們這個小圈子里那些只懂芯片驗證以及相關領域的人看的。那么,如何能讓更多的人看到我們的工作、了解我們的科研、甚至參與到我們的工作當中來?
于是,我自然而然地想到了芯片科普,這同樣讓我感覺非常有意思。我從事科普已經四五年了,從一開始的文字,到后來在B站做視頻。芯片科普不僅給我帶來了很多收獲,也幫我結識了很多志同道合的朋友,以及喜歡并支持我的觀眾朋友們。

但是,做芯片科普視頻并不是一件簡單的事情,特別是在短視頻泛濫的今天。有同樣做科普的博主大佬也跟我說,在同樣的時間內,我做一期芯片硬核科普的長視頻,他可能能做10期,甚至是更多和熱點相關的短視頻,而且流量可能是我的很多倍。
很遺憾,他說的其實也是對的。
但在這個基礎上,我覺得還是需要有人堅持做一些難的事情。我就希望能夠把芯片科普和芯片驗證這兩個同樣難但同樣有趣的事情結合在一起,通過視頻和文字的形式向大家展示我們做的東西、發過的論文以及我們整個大團隊正在研究的開源芯片等內容。
除了芯片以外,我還會跟大家分享人工智能、計算機等硬核科技,也會和大家分享我的成長經歷、我讀過的書、我學到的知識。我知道,我自己其實并不是一個天才,也不是所謂的全面全能的專家和大牛。我更希望能夠作為大家的一個“向導”,跟大家分享我走過的路。
在這個過程中,我也很有幸采訪到了很多資深的專家以及業界的大咖,讓觀眾能夠更好地、更全面地去感受和理解芯片以及科技未來的發展趨勢。比如說在2024年,我有幸采訪到了AMD的CEO蘇姿豐博士。我就問她:“你覺得人工智能對于芯片的設計和驗證,會不會讓這個過程變得更加簡單和更加高效?”如果你想知道她是怎么回答的,可以去B站看這期的采訪視頻。
所以,回到今天想和大家分享的這個問題:芯片的科研和芯片的科普,到底哪個更有趣?當然,對我來說其實兩個都同樣有趣。原因很簡單,因為它們同樣很難。同時,它們都需要我非常長期、長久地去堅持下去。
很多人都說,我們需要做難而正確的事情。但是其實問題在于,在你做一件事情之前,你如何去判斷這件事情是正確的呢?如果一件事在別人眼中是坐冷板凳,在別人眼中是做臟活、累活,你是否還會堅持做下去呢?
所以,我更希望做難而長期的事情,比如芯片驗證的學術研究,比如做芯片硬核科普的長視頻。因為如果一件事情它難而且需要長期堅持的話,那它大概率就是正確的。
以上就是我今天想跟大家分享的全部內容。我是老石,謝謝大家!
-END-
聲明:
本號對所有原創、轉載文章的陳述與觀點均保持中立,推送文章僅供讀者學習和交流。文章、圖片等版權歸原作者享有,如有侵權,聯系刪除。
-
芯片
+關注
關注
459文章
52145瀏覽量
435895 -
芯片設計
+關注
關注
15文章
1062瀏覽量
55455 -
芯片制造
+關注
關注
10文章
673瀏覽量
29504
發布評論請先 登錄
十年堅持難涼熱血!小米自研手機SoC成了!
蘋果正研發用于AI服務器的專用芯片
2024深圳機器人協會年度評選揭曉!艾而特獲得“應用典型案例獎”

恒玄科技研發AI眼鏡專用芯片
ADA4941-1芯片DIS管腳如何正確對外連接控制其使能狀態和禁用狀態?

東風汽車已成功研發出三款車規級芯片
求助,TPA3116D2做的功放,輸入為正弦波,請幫忙看下輸出波形是否正確?
理想汽車籌建香港芯片研發辦公室,智駕芯片研發取得新進展
美國 inTEST 高低溫沖擊熱流儀助力半導體芯片研發

芯片熱管理,倒裝芯片封裝“難”在哪?

OpenAI與博通攜手探索新AI芯片研發
如何打造芯片國產化開源生態?Model系列HMI芯片:平頭哥內核,SDK開源貫徹到底!

評論