近日,《烏合麒麟撤回道歉,稱3D堆疊就是芯片優(yōu)化技術(shù)》事件在網(wǎng)上引起爭(zhēng)論,今天ASPENCORE記者歐陽(yáng)洋蔥同學(xué)進(jìn)一步對(duì)“ 14nm + 14nm 達(dá)成‘比肩’7nm 性能的問(wèn)題”展開了專業(yè)的分析。
原文如下:
說(shuō)點(diǎn)題外話,大家就當(dāng)看個(gè)熱鬧吧,既然說(shuō)舊工藝的“疊加”,那咱就聊聊疊加嘛。
首先還是強(qiáng)調(diào)一點(diǎn),現(xiàn)在所謂的幾 nm 工藝,這個(gè)幾 nm 的數(shù)字并不是指晶體管的 gate length(或溝道長(zhǎng)度)——很多人對(duì)此是存在誤解的。比如臺(tái)積電的 7nm 工藝,晶體管并不存在任何一個(gè)物理參數(shù)是 7nm。7nm 只是一個(gè)代號(hào),你也可以叫它 α nm。14nm、7nm 這樣的稱謂是歷史原因造成的,對(duì)此有興趣的可以看我的文章:為什么說(shuō)Intel 10nm工藝比別家7nm先進(jìn)?(上)
有關(guān) 14nm + 14nm 達(dá)成“比肩”7nm 性能的問(wèn)題,稍帶腦洞地說(shuō)兩點(diǎn),也算是無(wú)聊閑扯吧。
第一是光刻技術(shù)的“疊加”。把光刻比做是一把雕刻刀,用現(xiàn)在的“光刻刀”,只下刀一次的話,其實(shí)是無(wú)法“雕刻”出你期望的晶體管大小的(包括 EUV),而需要下好幾次刀。雖然這個(gè)“疊加”和某媒體所說(shuō)的 14nm + 14nm 并不是同一回事,但反正 14nm 也不是真的 14nm(前面說(shuō)了,這個(gè)數(shù)字沒意義),所以開個(gè)腦洞也沒什么。
比如說(shuō)三星的 8nm(8LPP)工藝,這種工藝下金屬堆棧部分的最小金屬間距是 44nm。我們知道 8nm 工藝,在光刻這道工序上還沒有應(yīng)用 EUV 極紫外光,仍然是 DUV 深紫外光,ArF(argon fluoride)光源本身的波長(zhǎng)是 193nm。
這把“光刻刀”不夠銳啊,咋辦呢?要克服衍射效應(yīng),“雕刻”更小的圖案,業(yè)界其實(shí)是引入了多種技術(shù)的,包括“疊加”的雙重曝光、四重曝光(quad patterning)之類的;也就是既然一次刻不出那么高的精度,那就多刻幾次(當(dāng)然還需要配合周邊的很多技術(shù))。
三星應(yīng)用的是一種叫 LELE 的技術(shù),也是 DUV 多重曝光的一種技術(shù)方向。其過(guò)程是這樣的(以下資料來(lái)自 Wikichip,圖片也來(lái)自 Wikichip,我只是搬運(yùn)工;我之前被 Wikichip 警告過(guò)一次,所以這里大家多點(diǎn)鏈接去看看原文吧。。。):
首先呢就是像上圖這樣,要有襯底、圖案層(device layer)、硬掩膜(hardmask)。假定我們的目標(biāo)是 64nm 的金屬互聯(lián)間距,那么 LELE 的步驟大致是下面這張圖這樣的:
這個(gè)步驟的大致過(guò)程就是光刻膠(photoresist)在 mask 覆蓋下曝光,形成需要的圖案。
第一步,上方有個(gè)掩膜圖案,在光源照射下,能做出 128nm 的間距(左上圖:Litho 1)。第二步,將圖案通過(guò)第一次蝕刻轉(zhuǎn)到硬掩膜之上——?dú)埩舻挠惭谀?huì)作為后續(xù)步驟的掩膜存在。
第三步,用另一組掩膜圖案和光刻膠,重復(fù)該過(guò)程,仍采用相同的 128nm 圖案間距進(jìn)行光刻。最后,再用硬掩膜和光刻膠作為蝕刻掩膜,二次蝕刻后就在下面的圖案層形成了所需的圖案。
由于兩次 litho-etch(光刻-蝕刻)操作,就形成了 64nm 的互聯(lián)間距。
不需要去深入研究這個(gè)過(guò)程,反正知道是通過(guò)了兩次差不多的操作才達(dá)成了 64nm 間距的。其實(shí)三星在 8nm 節(jié)點(diǎn)上用了 LELELELE,也就是四次上述的 LE 操作。說(shuō)人話就是要刻最多 4 次,才能刻出所需的精度。
當(dāng)然了,這個(gè)過(guò)程難度頗大,需要克服的工程難點(diǎn)也很多;而且步驟越多,成本也會(huì)越高;所以才需要用更銳的“光刻刀”嘛,比如 EUV 就比 DUV 更“銳”,也就不需要刻這么多次。但像 LELE 這樣的操作,是不是可簡(jiǎn)單認(rèn)為是某種舊工藝方案的“疊加”呢?(衰。。。說(shuō)得過(guò)去吧。。。
第二點(diǎn)是針對(duì)這個(gè)話題,現(xiàn)在數(shù)碼圈討論比較多的 die 的 3D 堆疊。其實(shí)當(dāng)時(shí)某媒體(微博)原文說(shuō)法是“雙芯疊加”,“特定的芯片設(shè)計(jì)方法”。人家也沒說(shuō)是垂直堆疊嘛(雖然感覺“疊”好像直覺上勢(shì)必得垂直方向了;不管了),
更沒說(shuō)雙芯必須同等 die size 或同等微架構(gòu)的比較。而且原文提到了“將疊加性能提升至比肩 7nm 芯片的程度,并且功耗發(fā)熱也很不錯(cuò)”。性能、功耗、成本分開來(lái)談,還是很好的說(shuō)法。
14nm 芯片只要堆料充分,性能超越 7nm 芯片不成問(wèn)題啊。比如 Rocket Lake 的 8 核 Intel 酷睿處理器(i9-11900K)性能,肯定比高通驍龍 865 性能強(qiáng)吧。前者是 Intel 14nm,后者是臺(tái)積電 7nm。這倆就不是一個(gè)平臺(tái)、一個(gè)定位,連 14nm 和 7nm 這倆名字對(duì)比的維度都不同(或者也可以比 7nm 的 Ryzen 5 5600U。。。)。
何況現(xiàn)在很多超算芯片也沒用尖端工藝,難道性能還比不上 5nm 手機(jī) SoC 了?這真的在于你堆了多少料,雖然達(dá)成同等性能,越早的工藝要付出的成本和功耗會(huì)顯著增加。(當(dāng)然工藝代差不能太大,否則會(huì)涉及到一些更現(xiàn)實(shí)的工程問(wèn)題)
這種對(duì)比只在于性能堆料,純比性能(Performance),根本就沒意義;又沒比效率、功耗(Power)和成本(Area)。原文只說(shuō)“功耗發(fā)熱也很不錯(cuò)”。。。“不錯(cuò)”多含糊。。。是不是。。。
至于 3D 垂直堆疊,不管是 Intel Fevoros,還是臺(tái)積電 CoWoS,芯片 die 堆起來(lái)應(yīng)該可以吧。不過(guò)應(yīng)該不是 compute die 直接疊,而且我估計(jì)如果兩層 14nm 要達(dá)成同代設(shè)計(jì) 7nm 芯片的性能,可能散熱會(huì)成問(wèn)題。所以還是不要垂直堆起來(lái)吧,就 die size 做大點(diǎn),或者多 die 以 side-by-side 的方式封裝就好了。。。
前一陣 AMD 推的 3D V-cache,前不久才寫了篇文章,這篇文章也總結(jié)了臺(tái)積電目前的 3DFabric 封裝工藝:把CPU三級(jí)緩存堆到192MB,AMD與臺(tái)積電的合謀以上算純開玩笑。。。
畢竟原文的說(shuō)法就相當(dāng)模糊,我們模糊點(diǎn)理解,也沒什么問(wèn)題吧。。。況且海思是做 IC 設(shè)計(jì)的,就算要做垂直堆疊,也必須與 foundry 廠合作才行,不是自己在家就搞一搞,然后就強(qiáng)于世界的。總體上就是扯。。。
補(bǔ)充:聲明一下,可能很多人沒搞清楚我想表達(dá)的東西,我的這篇回答只是個(gè)用于課外閱讀的科普;本回答提到了如果要說(shuō)“疊加”的話,在制造和封裝層面,哪里可以體現(xiàn)出“疊加”這個(gè)詞。
我并不贊同“雙芯疊加”就能讓 14nm“比肩”7nm,主要是效率方面。但用 14nm 造性能高于 7nm 工藝的芯片真的不是什么難事,只是功耗發(fā)熱不對(duì)等罷了。而且本回答的第一部分提到光刻的多重曝光,DUV “光刻刀”并不是 14nm 的專屬,EUV 也不是 7nm 的專屬。DUV 一樣可以造 7nm/10nm。。。
擴(kuò)展:
有關(guān)于舊工藝需要多大面積來(lái)實(shí)現(xiàn)新工藝的同等設(shè)計(jì)。這一點(diǎn)有興趣的同學(xué)可以去看看 Intel 今年桌面酷睿處理器的 Cypress Cove 核心。
Cypress Cove 就是個(gè) 14nm 工藝的核心,不過(guò)其設(shè)計(jì)是來(lái)自于 10nm 的 Sunny Cove(陽(yáng)光海灣)。或者說(shuō) Cypress Cove 實(shí)際上是 Sunny Cove 向前移植(backport)的核心。當(dāng)代不同制造工藝的移植,所需做的工作其實(shí)會(huì)比較繁瑣,包括因?yàn)楦蟮木w管和間距,布線之類的都可能在性能上表現(xiàn)出差別。
其實(shí)那些關(guān)心舊工藝做個(gè) 2x 面積的 die,能不能達(dá)成新工藝 1x 的 die 的,可以去研究下 Cypress Cove 和 Sunny Cove 的面積差異。我沒仔細(xì)去查過(guò),但估計(jì)應(yīng)該可以查到(雖然可能某些報(bào)告估計(jì)要收費(fèi))。。。。。。
貌似 Arm 平臺(tái)也有類似的例子吧。。。。。。
網(wǎng)友評(píng)論:終于有人聊些干貨了!
@HelltoHell:終于有干貨了,原文的說(shuō)法很雞賊,很廢話,主要也是以誤導(dǎo)人為目的的。但人那種說(shuō)法還真……沒什么錯(cuò)誤……
@jusdejude :這篇回答解釋的清楚!看完總算對(duì)這事兒有點(diǎn)概念了。這么說(shuō)來(lái),華為微博原文沒毛病啊,人轉(zhuǎn)發(fā)就更沒毛病了啊,那這些數(shù)碼專家揪著人家畫手咬文嚼字到底是他們自己也沒搞懂呢,還是借題發(fā)揮輸出怨氣呢?
還一堆在那洗比喻貼切的,兩杯50度水加一起不等于100度,這類比哪里貼切了?不應(yīng)該是,兩杯燙水加一起實(shí)現(xiàn)了另一杯燙水同樣的暖身體的功效嘛?
@Lee昂昨天:終于有人聊些干貨了,謝謝你
@負(fù)離子3 :因?yàn)?nm線路已經(jīng)足夠接近理論上限,本身就需要額外的設(shè)計(jì)來(lái)保障正常工作,使用更大面積的14nm線路來(lái)頂一樣性能的邏輯門數(shù)量,其實(shí)也沒有需要簡(jiǎn)單計(jì)算的四倍面積之多,兩倍都差不多性能了。
二來(lái)你以為這是堆料,沒堆,兩邊計(jì)算單元數(shù)量差不多。我們老說(shuō)新CPU比舊CPU更強(qiáng),是指在同樣的指甲蓋上填了更多的電路。這邊的事不一樣,這邊是用兩個(gè)指甲蓋放原來(lái)一個(gè)指甲蓋的東西。
三來(lái)就是功耗問(wèn)題,的確理論上會(huì)略大,但也就是略大而已,還是因?yàn)?nm這東西太接近理論上限了,額外的東西太多。現(xiàn)在的情況是工藝不成熟,設(shè)計(jì)不合理等原因才是大頭,不是原理。
四是理論上沒有亞空間突破的話,這個(gè)疊疊樂就是未來(lái),你一層園林再精巧還是比不過(guò)高樓大廈。我們需要的是裝入更多計(jì)算單元,為了這個(gè)我們還發(fā)展了更強(qiáng)的電力生產(chǎn)更強(qiáng)的散熱工具,所有一切條件都是為了這個(gè)核心服務(wù)的。
編輯:jq
-
芯片
+關(guān)注
關(guān)注
459文章
52145瀏覽量
435925 -
cpu
+關(guān)注
關(guān)注
68文章
11031瀏覽量
215941 -
光源
+關(guān)注
關(guān)注
3文章
731瀏覽量
68435 -
光刻膠
+關(guān)注
關(guān)注
10文章
328瀏覽量
30770 -
DUV
+關(guān)注
關(guān)注
1文章
56瀏覽量
3981
原文標(biāo)題:干貨:14nm + 14nm 如何才能達(dá)成“比肩”7nm 性能?
文章出處:【微信號(hào):wc_ysj,微信公眾號(hào):旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
廣明源172nm晶圓光清洗方案概述
三星在4nm邏輯芯片上實(shí)現(xiàn)40%以上的測(cè)試良率
突破14nm工藝壁壘:天準(zhǔn)科技發(fā)布TB2000晶圓缺陷檢測(cè)裝備
請(qǐng)問(wèn)DLP650LNIR用于800nm,35fs,1KHZ的損傷閾值是多少?
要設(shè)計(jì)CH氣體檢測(cè)設(shè)備應(yīng)用的激光源波長(zhǎng)為3370nm,請(qǐng)問(wèn)DMD微鏡的反射波長(zhǎng)是多少?
DLP9500UV在355nm納秒激光器應(yīng)用的損傷閾值是多少?
DLP9500UV在波長(zhǎng)為370nm脈沖激光下的DMD的峰值功率密度是多少?
三星重啟1b nm DRAM設(shè)計(jì),應(yīng)對(duì)良率與性能挑戰(zhàn)
歐洲啟動(dòng)1nm及光芯片試驗(yàn)線
消息稱臺(tái)積電3nm、5nm和CoWoS工藝漲價(jià),即日起效!
蘋果iPhone 17或沿用3nm技術(shù),2nm得等到2026年了!
臺(tái)積電產(chǎn)能爆棚:3nm與5nm工藝供不應(yīng)求
所謂的7nm芯片上沒有一個(gè)圖形是7nm的

評(píng)論