女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達的反擊:挾H100以令諸侯

Linelayout ? 來源:IC大家談 ? 2023-10-18 15:33 ? 次閱讀

論騷操作,硅谷恐怕沒有CEO能比得上黃仁勛

去年,黃仁勛向微軟、谷歌和亞馬遜這些云計算廠商提出了一個計劃:這些廠商都有很多搭載了英偉達GPU的服務器,由英偉達租用這些服務器,然后讓英偉達的工程師對其進行“優化”,再以英偉達的名義租給普通的AI企業,從中賺取差價。

說簡單點,以前微軟會直接把云服務賣給中小公司,現在由英偉達進來當中間商。當然按照英偉達官方的說法,此舉是為了“向云計算廠商展示在數據中心配置GPU的正確方法”[1]。

服務器還是那個服務器,但經過英偉達“優化”后,客戶就從微軟優化到英偉達了。但就是這樣一個匪夷所思的提議,除了亞馬遜之外,各大云計算廠商居然都同意了。

2023年3月,英偉達正式上線云計算服務DGX Cloud。事實證明,經過英偉達工程師的優化后,DGX Cloud在訓練大模型時表現得的確更好;在此基礎上,英偉達還破例允許短期租賃。僅僅半年時間,英偉達就拿下了軟件公司ServiceNow等大客戶。

科技公司愿意配合英偉達騷操作的真實原因,可能還是因為英偉達手中握有大模型時代最稀缺的資源——H100。

當下,幾乎所有的企業都沒有足夠的算力。連OpenAI創始人阿爾特曼,都曾在一次聽證會上無奈地表示:“如果人們減少使用ChatGPT,我們會非常高興,因為我們的GPU非常短缺[2]。”

買了多少H100,甚至可以成為決定AI成就的關鍵因素。這也讓英偉達有了“挾H100以令諸侯”的底氣。

計算機的“稀土”

通常來說,科技企業會通過購買云計算廠商的服務,來滿足算力需求。從2023年3月開始,微軟Azure、亞馬遜AWS等云計算廠商也先后上架了HGX H100的租賃服務,HGX H100是由4個或8個H100組成的服務器。

然而,當下供需嚴重失衡,云計算廠商這點H100存貨已經遠遠滿足不了市場的胃口。2023年H1的財報中,微軟專門更新了一條風險因素:如果無法獲得足夠多的AI芯片,云計算業務可能會中斷。

許多初創公司需要排隊等待3-12個月,一旦友商搶在自己前面,那可能就是幾十上百億估值的損失。

無數“H100窮人”們,只能被迫發揮主觀能動性,看誰的路子更野。

面對《紐約時報》的采訪,一位創業者將H100比作“稀土”。早些時候,他跑去請求美國國家科學基金會投資自己,僅僅因為基金會底下一個項目剛好有少數空置的H100。

在硅谷,AI創業者打招呼的方式,都變成了“我認識一個有H100的家伙”——不知道的還以為在買賣毒品[4]。

GPU Utils曾測算過H100搶購潮背后具體的需求數據:

對需要自己訓練大模型、追求大力出奇跡的企業來說,沒有個上萬塊H100都不好意思出門。由前DeepMind聯合創始人蘇萊曼創辦的InflectionAI,成立方才一年,已買了2.2萬個H100;至于Meta這樣財大氣粗的公司,很可能會購買10萬個甚至更多。

對微軟Azure等云計算廠商來說,每一家也都需要至少3萬個H100。而其余幾家私有云,還將消耗總計約10萬個H100。

測算后發現,僅美國大型科技公司和少數幾家明星初創公司,需求量已達到約43萬個[5]。如果再算上其他初創企業、研究機構、大學,乃至富裕國家的追逐、再加之黃牛、黑市等不可控因素,實際需求很可能遠大于這個數字。然而據英國《金融時報》爆料,今年H100的出貨量大約是55萬個[6]。

H100之所以令人如饑似渴,其中一個核心原因在于其近乎壟斷的市場地位。

面對大模型訓練對極致效率的需求,H100在大多數情況下都是最優解。

MPT-30B是第一個使用H100訓練的開源LLM(大語言模型),實際訓練只耗費了11.6天;相比之下,使用前一代的A100訓練則需要28.3天[7]。如若換成參數規模更龐大的AI,例如1800B的GPT-4,效率差異會更加明顯。跑馬圈地的時代,時間就是一切。

除此之外,H100在模型推理上的效率也遠高于A100。盡管H100的首發價約為3.3萬美元,如今二手市場價格更上漲至4-5萬美元;但若將H100和A100的性能分別除以各自的價格,能發現H100的性價比實際也高于A100。

6cee980e-6d00-11ee-939d-92fbcf53809c.png

6cf36992-6d00-11ee-939d-92fbcf53809c.png

MPT-30B的具體訓練、推理情況

黃仁勛說,“Buy more GPUs , the more money you save(買得多,省得多)”,似乎不無道理。

也正因為如此,即便美國限制了H/A100的對華出口,國內科技公司仍在搶購閹割版的H/A800——盡管閹割版的芯片間數據傳輸速度只有前者一半,意味著需要在大模型訓練上花費更多時間。

除需求量龐大之外,造成H100短缺的另一個原因是產能的嚴重不足。

H100芯片需要使用SK海力士的HBM內存,以及臺積電的CoWoS封裝——兩者都因過于昂貴,此前并沒能大規模市場化,預備產能并不多。由于產能爬坡尚需時間,有分析師預測H100的短缺至少會持續至明年一季度,也有人認為要到明年年底才有可能有所緩解[9]。

6d08e13c-6d00-11ee-939d-92fbcf53809c.png

H100內部結構

H100的空前盛況,讓黃仁勛在短短一年時間內體驗了一回坐過山車的感覺。

去年二季度,消費市場萎靡不振加上挖礦企業扎堆倒閉,英偉達交出了一份不及格的財報,“GPU滯銷,幫幫我們”的表情包一度遍地都是。一年之后,黃仁勛成功向資本市場展示了什么叫“反向暴雷”,同比營收暴漲854%,大幅超出了最樂觀分析師的預測。

巔峰換來了漫天的吹捧,但黃仁勛心里清楚,英偉達的頭上一直懸著一把劍。

不可避免的戰爭

今年8月,傳奇工程師吉姆·凱勒對媒體評論道,“我不認為GPU是運行AI的全部,世界憎惡壟斷[11]。”

此番發言雖有給自家AI芯片打廣告之嫌,卻也是業界的共識。

事實上,那些購買了最多H100的大型科技公司,基本都不太“安分”:微軟、谷歌、Meta,或多或少都嘗試過自研AI芯片。

這讓英偉達面臨著一個異常尷尬的處境:在AI芯片領域,自己與“大客戶”之間,未來幾乎必有一戰。

大型科技公司們選擇自研AI芯片,最初都源于一個非常質樸的需求——省錢,其中最典型的便是谷歌。

早在2014年,谷歌已啟動了自研芯片計劃。彼時,OpenAI的首席科學家伊利亞還在谷歌工作,打造出了一套頗具顛覆性的AI模型。該模型脫胎于伊利亞的“大力出奇跡”理念,只需要灌入足夠多且正確的數據,它便能更好地完成翻譯、語音識別等工作。然而待到實際應用時,谷歌卻犯了難:

如果將AI服務安裝至10億多臺安卓手機中,哪怕每個人每天只使用3分鐘,谷歌都需要2倍于當前數據中心的算力。當時谷歌已經建了15個數據中心,每個造價上億美金,“超級加倍”顯然不切實際。

最終,谷歌自研出了性能更強、功耗更低的TPU,大大提升了單個數據中心的算力供應,以一種更經濟實惠的方式解決了算力難題。

TPU的出現,令黃仁勛如坐針氈,開始了“爆改GPU”,很快在性能上實現了反超,其最新成果便是H100。不過,H100的售價實在過于昂貴。

如果按重量售賣H100,那么其每盎司售價將達到黃金的一半;即便對地球上最賺錢的科技公司而言,這筆“英偉達稅”也堪稱天文數字。

然而,H100的實際制造成本并不高。據金融咨詢公司Raymond James測算,H100的成本約為3320美金,僅占首發價的1/10,黃仁勛含淚賺10倍[12]。

自研芯片的經濟收益毋庸置疑,但除此之外其實還有另一個好處:垂直整合打造差異化。

堆疊算力不是簡單的往車里加汽油,需要考慮軟件適配性、自身業務需求等一系列問題。例如AI所使用的深度學習框架有多個派別,谷歌是TensorFlow,Meta用的PyTorch,而百度則有PaddlePaddle,硬件需要根據不同框架做適配。

專門定制的AI芯片,可以更加緊貼自身AI業務的需求。所以Meta在今年又重啟了自研芯片計劃,針對PyTorch框架定制了全新的MTIA芯片。

對大公司來說,考量芯片的核心其實不是算力,而是“單位美元提供的算力”,也就是成本。谷歌的TPU和特斯拉的Dojo都證明了,定制服務的成本是可以接受的。

眼下,“反抗的星火”已經點燃。據外媒爆料,大型科技公司的云計算團隊,已開始頻繁勸說客戶改用其自研芯片,而不是英偉達的GPU。英偉達固然是目前為止絕對的贏家,但沒人知道平衡什么時候會被打破。

不過,面對這場不可避免的戰爭,英偉達也留了后手。

挾H100以令諸侯

英偉達打出的第一張牌,叫CoreWeave。

CoreWeave成立于2017年,最初是一家以太坊挖礦公司,后來轉型做起了云計算業務。據CoreWeave創始人透露,2022年公司收入為3000萬美金,僅有微軟Azure的1/1133,在硅谷幾乎沒什么存在感。

然而到了2023年,CoreWeave突然一夜成名,接連簽下Inflection AI和Stability AI兩個大客戶,年營收預計將達到5億美金,一年翻16倍。除此之外,微軟甚至決定在未來幾年花費數十億美金購買其服務;其中僅2024年的訂單,已有20億美金。

改變CoreWeave命運的貴人,正是英偉達。

今年4月,英偉達參與了對CoreWeave的投資;但比起美元,英偉達還給了它一項更稀有的資源——H100。CoreWeave是全球第一家上線HGX H100租賃服務的云計算企業,比微軟Azure還要早一個月。

這番安排,其實是黃仁勛的有意為之。

H100近乎壟斷的市場地位加之嚴重短缺的現狀,讓英偉達手中多了一層權力:他可以自由決定優先供貨的對象。

相比自己跟Big Tech們同床異夢的塑料友誼,CoreWeave和英偉達是實打實的革命戰友。因此,英偉達削減了對大型科技公司的H100供應,轉而將這部分產能交給了CoreWeave等“自家兄弟”——它們曾確保不會自研芯片。

從結果來看,這一戰略不僅避免了囤積現象的出現,也確實搶到了大型科技公司的蛋糕:

例如前文提到的Stability AI,在2022年底時一直將亞馬遜AWS視作唯一云服務商;然而到了今年3月,困于算力不足的Stability AI,悄悄叩開了CoreWeave的大門。

事實上,英偉達手中并非僅有CoreWeave一張牌。這位手握H100的投資人,還投資了同為云計算公司的Lambda Labs,以及三家從事大模型、應用開發的明星初創企業。

在畝產十萬大模型的當下,H100是比美元還珍貴的硬通貨,也為英偉達創造了一個寶貴的窗口期:盡可能讓更多公司用上H100,趁早建立起生態,“把朋友搞得多多的”。

那么這個窗口期能持續多久呢?

尾聲

英偉達的一系列“騷操作”已經引來了美國反壟斷機構的注意,同時,全球瘋搶H100的現狀,很可能不會長期持續下去。

正如前文所述,H100產能受限是因為臺積電和SK海力士的預備產能不足;隨著新產線陸續落地,短缺狀況會逐漸得到緩解。

除此之外,旺盛的需求也未必會延續下去。

事實上,越來越多的科技公司和研究機構都選擇將大模型開源。隨著市場上的優質開源模型越來越多,初創企業和研究機構可以不必再自己動手訓練,轉而直接下載開源模型,根據自身業務需求進行開發或者推理。

Meta發布開源大模型Llama后,斯坦福、卡內基梅隆等多所高校的研究人員就曾聯合起來,以此為基礎打造了開源大模型Vicuna,很快便突破了200萬次下載。

6d435de4-6d00-11ee-939d-92fbcf53809c.png

Vicuna

在肉眼可見的未來,算力的主要使用場景很可能會從訓練轉向推理——屆時,H100便不再是獨孤求敗了。因為不同于追求極致效率的訓練場景,AI推理其實更看重性價比。

另一方面,以大模型為代表的生成式AI如今面臨的問題在于:面對高昂的算力成本,除了英偉達,大家都還沒賺到錢。

2006年CUDA平臺推出時,英偉達以超脫于行業的前瞻性推動了AI的飛速進步。而如今,英偉達氣勢如虹的業績似乎也是一種拷問:它是不是已經從AI的推動者,變成了AI前進的阻力?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    39

    文章

    7965

    瀏覽量

    139223
  • 英偉達
    +關注

    關注

    22

    文章

    3910

    瀏覽量

    93023
  • AI芯片
    +關注

    關注

    17

    文章

    1965

    瀏覽量

    35663

原文標題:英偉達的反擊:挾H100以令諸侯

文章出處:【微信號:IC大家談,微信公眾號:IC大家談】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    GPU 維修干貨 | 英偉 GPU H100 常見故障有哪些?

    ABSTRACT摘要本文主要介紹英偉H100常見的故障類型和問題。JAEALOT2025年5月5日今年,國家政府報告提出要持續推進“人工智能+”行動,大力發展人工智能行業,市場上對算力的需求持續
    的頭像 發表于 05-05 09:03 ?196次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規定專門為中國市場開發的定制芯片,H20芯片在訓練AI模型方面不如英偉其他芯片速度
    的頭像 發表于 04-16 16:59 ?992次閱讀

    英偉A100H100比較

    英偉A100H100都是針對高性能計算和人工智能任務設計的GPU,但在性能和特性上存在顯著差異。以下是對這兩款GPU的比較: 1. 架構與核心規格: A
    的頭像 發表于 02-10 17:05 ?3216次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    英偉H100芯片市場降溫

    隨著英偉新一代AI芯片GB200需求的不斷攀升,其上一代明星產品H100芯片卻遭遇了市場的冷落。據業內人士透露,搭載H100的服務器通常以8卡的形式進行出售或出租,而在去年,這類服務
    的頭像 發表于 10-28 15:42 ?1393次閱讀

    亞馬遜云科技宣布Amazon EC2 P5e實例正式可用 由英偉H200 GPU提供支持

    現已正式可用。亞馬遜云科技是首個將英偉H200 GPU用于生產環境的領先云提供商。與基于英偉H100
    的頭像 發表于 09-19 16:16 ?753次閱讀

    英偉或取消B100轉用B200A代替

    今年3月份,英偉在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現行H100/
    的頭像 發表于 08-08 17:19 ?813次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    英偉帶領芯片股飆升 英偉大漲4.76%

    1.08%,道指漲0.32%。 AI浪潮之下,業界預期正不斷加強,在AI算力需求的邊際拉動下、疊加消費電子復蘇,新一輪終端AI上新,相關行業正迎來具備較強持續性的上行周期;英偉在生成式人工智能浪潮中脫穎而出,其高性能計算芯片如H100
    的頭像 發表于 07-23 16:26 ?505次閱讀

    英偉在AI芯片市場還能領先多久?

    7月22日,國際媒體傳來消息,英偉在近年來興起的生成式人工智能浪潮中脫穎而出,其高性能計算芯片如H100等廣受業界青睞,推動了公司營收與利潤的大幅增長。這一強勁表現不僅助力英偉
    的頭像 發表于 07-22 16:18 ?850次閱讀

    英偉H20 AI芯片:中國市場新動向與業績預期

    在科技行業的持續關注下,英偉再次成為焦點。據英國《金融時報》7月5日的報道,英偉計劃在接下來的幾個月內向中國市場交付超過100萬顆新款
    的頭像 發表于 07-05 16:56 ?1418次閱讀

    英偉H200芯片將大規模交付

    英偉AI GPU市場迎來新動態,其H200型號上游芯片端已于第二季度下旬正式進入量產階段,預示著該產品將在第三季度后迎來大量交付。然而,英偉
    的頭像 發表于 07-04 10:29 ?1095次閱讀

    馬斯克自曝訓練Grok 3用了10萬塊NVIDIA H100

    在科技界的前沿陣地上,埃隆·馬斯克再次以其前瞻性的視野和大膽的嘗試引領著新的風潮。近日,馬斯克在社交媒體X上的一則回應,不經意間透露了其即將推出的AI聊天機器人Grok 3背后的驚人秘密——這款被馬斯克譽為“非常特別”的AI產品,竟然是通過10萬塊英偉
    的頭像 發表于 07-03 14:16 ?1175次閱讀

    只能跑Transformer的AI芯片,卻號稱全球最快?

    電子發燒友網報道(文/周凱揚)近日,一家由哈佛輟學生成立的初創公司Etched,宣布了他們在打造的一款“專用”AI芯片Sohu。據其聲稱該芯片的速度將是英偉H100的20倍,但只能
    的頭像 發表于 07-01 09:03 ?1854次閱讀

    首批1024塊H100 GPU,正崴集團將建中國臺灣最大AI計算中心

    中國臺灣當地正崴集團5月27日宣布,將與日本公司Ubitus共同打造人工智能(AI)計算中心,其中第一期將導入128個機柜,共計1024張英偉H100旗艦計算卡,旨在構建臺灣最大的AI計算中心。
    的頭像 發表于 05-29 10:05 ?1642次閱讀