女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

欲把AI計算成本打下來,谷歌高效益TPU正式開放

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-11-14 00:18 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))對于每個想要自己開發(fā)和部署AI模型的應(yīng)用開發(fā)者來說,硬件和服務(wù)器支出都是一筆不小的費(fèi)用。就以英偉達(dá)GPU為例,即便是消費(fèi)級的GPU,最近也迎來了一波漲價潮,更不用爆火的A100/H100等型號了。

即便是租賃服務(wù)器,基于這些熱門硬件的服務(wù)器也遠(yuǎn)算不上便宜,因此不少云服務(wù)廠商為了進(jìn)一步拉攏更多AI應(yīng)用開發(fā)者,紛紛推出了性價比更高的選項。這些選項有的是基于CPU的AI計算服務(wù)器,有的是基于第三方AI加速器打造的服務(wù)器,還有的則是由云服務(wù)廠商基于自研加速器打造且獨(dú)家提供的服務(wù)器。

谷歌高性價比TPU面世

谷歌在今年8月底發(fā)布了第五代的自研TPU,TPU v5e。谷歌稱該加速器實(shí)現(xiàn)了性能與成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下兩倍的訓(xùn)練性能,以及針對LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架構(gòu)


單個TPU v5e Pod由256個芯片互聯(lián),總帶寬超過400Tb/s,INT8總算力達(dá)100petaOps。而且谷歌為TPU v5e采用了更靈活的配置選項,其支持8個不同的虛擬機(jī)配置,單個切片支持單芯片到250多個芯片,如此一來客戶就可以根據(jù)自己的模型大小來選擇合適的配置。

而且過去借助谷歌TPU進(jìn)行的訓(xùn)練負(fù)載只局限于單個切片中,谷歌為此開發(fā)了Multislice技術(shù),可通過芯片間互聯(lián)以及數(shù)據(jù)中心網(wǎng)絡(luò)中的多個TPU Pod相連,從而將訓(xùn)練工作擴(kuò)展到數(shù)萬個芯片上。

為了進(jìn)一步擴(kuò)大對開發(fā)生態(tài)的支持,TPU v5e還內(nèi)置了對JAX、Pytorch和Tensorflow等領(lǐng)先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用開源工具的支持。

開放使用與自用

近日,谷歌終于宣布TPU v5e進(jìn)入公用階段,且在最新的MLPerf訓(xùn)練3.1測試中,TPUv5e獲得了更好的表現(xiàn)。在該測試中,谷歌改進(jìn)了創(chuàng)新的混合精度訓(xùn)練算法,除了原生支持的BF16外,還用到了INT8精度格式。這意味著客戶在提高了模型準(zhǔn)確性的同時,將花費(fèi)更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
從谷歌云對于TPU v5e的定價表來看,v5e在成本效益上確實(shí)有著極大的優(yōu)勢。不過需要注意的是,v5e與v2、v3 Pod類似,每個芯片中只有一個TensorCore,而v4 Pod的每個芯片中有兩個TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS,而v4的單芯片峰值算力為275TFLOPS,可即便如此,在按芯片小時的定價下,其所需成本依然低于v4。

在如此高的性價比下,谷歌不僅將TPU提供給外部開發(fā)者使用,其內(nèi)部一些開發(fā)項目也開始用上TPU v5e。比如其PaLM模型的創(chuàng)建,就用到了上文提到的Multislice技術(shù),谷歌的Bard團(tuán)隊同樣在用TPU v5e訓(xùn)練這一生成式AI聊天機(jī)器人

寫在最后

其實(shí)在TPUv5e開放使用之前,谷歌也正式開放了A3 VM這類GPU加速虛擬機(jī)的使用。這也是多數(shù)云服務(wù)廠商采用的多方案供應(yīng)策略,其自研加速器只需要為客戶提供一個高性價比的方案,而追求更高性能的客戶,依然可以選擇基于H100 GPU打造的服務(wù)器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34274

    瀏覽量

    275455
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    SiC價格打下來!兩年內(nèi)擬降30%,市場加速滲透

    過去,SiC的晶體生長速度慢、良率低,導(dǎo)致生產(chǎn)成本較高,一直限制了SiC的普及。 ? 不過在近期據(jù)媒體報道,有業(yè)內(nèi)人士預(yù)計,未來兩年SiC芯片價格將下降達(dá)30%,原因在于越來越多的本地廠商開始獲得電動汽車認(rèn)證并擴(kuò)大了其制造能力。SiC芯片將
    的頭像 發(fā)表于 08-03 00:59 ?5044次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用GPU,也不怎么迷信
    的頭像 發(fā)表于 06-05 13:39 ?193次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉GPU和<b class='flag-5'>TPU</b>!

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針
    發(fā)表于 04-28 11:05

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學(xué)習(xí)應(yīng)用設(shè)計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,尤其是深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)計算
    的頭像 發(fā)表于 04-22 09:41 ?933次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設(shè)計。這款功能強(qiáng)大的
    的頭像 發(fā)表于 04-12 11:10 ?1572次閱讀
    <b class='flag-5'>谷歌</b>第七代<b class='flag-5'>TPU</b> Ironwood深度解讀:<b class='flag-5'>AI</b>推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點(diǎn)層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設(shè)計的 TPU 芯片,
    的頭像 發(fā)表于 04-12 00:57 ?2102次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    和 Renesas一直致力于推動開源生態(tài)的發(fā)展,并積極合作打造高效開放計算平臺。BPI-AI2N & BPI-AI2N Car
    發(fā)表于 03-19 17:54

    傳DeepSeek自研芯片,廠商們要把AI成本打下來

    外購芯片的成本,掌握供應(yīng)鏈主動權(quán),另一方面隨著AI推理應(yīng)用的爆發(fā),AI推理芯片有機(jī)會被重新定義。 ? DeepSeek 不完全依賴英偉達(dá) ? 去年12月底發(fā)布的DeepSeek-V3模型,整個訓(xùn)練使用2048塊英偉達(dá)H800 G
    的頭像 發(fā)表于 02-16 00:09 ?3043次閱讀
    傳DeepSeek自研芯片,廠商們要把<b class='flag-5'>AI</b><b class='flag-5'>成本</b><b class='flag-5'>打下來</b>

    谷歌加速AI部門整合:AI Studio團(tuán)隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?618次閱讀

    AI云端計算資源的多維度優(yōu)勢

    AI云端計算資源,作為AI技術(shù)與云計算深度融合的產(chǎn)物,在成本效益、性能優(yōu)化、數(shù)據(jù)安全、靈活擴(kuò)展以
    的頭像 發(fā)表于 01-07 11:11 ?376次閱讀

    如何分析美國站群服務(wù)器的成本效益?

    美國站群服務(wù)器的成本效益分析是一個復(fù)雜但至關(guān)重要的過程,它涉及到多個方面的考量。主機(jī)推薦小編為您推薦美國站群服務(wù)器成本效益的詳細(xì)分析。
    的頭像 發(fā)表于 10-30 11:23 ?389次閱讀

    成本高效益 | 自連醫(yī)療設(shè)備無線化改造實(shí)例匯集

    原文標(biāo)題:低成本高效益 | 自連醫(yī)療設(shè)備無線化改造實(shí)例匯集 文章出處:【微信公
    的頭像 發(fā)表于 10-24 17:25 ?643次閱讀

    黃仁勛:AI未來關(guān)鍵在于推理,芯片成本驟降成核心要素

     英偉達(dá)CEO黃仁勛近期強(qiáng)調(diào),人工智能(AI)的未來趨勢將聚焦于具備“推理”能力的服務(wù),但這一愿景的實(shí)現(xiàn)需以降低計算成本為前提。這一觀點(diǎn)是在他與Arm首席執(zhí)行官Rene Haas的對話中提出的,該對話由Arm在其官方網(wǎng)站上發(fā)布。
    的頭像 發(fā)表于 10-10 14:35 ?654次閱讀

    谷歌發(fā)布革命性AI游戲引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驅(qū)動的游戲引擎——GameNGen,這一創(chuàng)新技術(shù)標(biāo)志著游戲開發(fā)領(lǐng)域的新紀(jì)元。GameNGen憑借其強(qiáng)大的計算能力,能夠在單個TPU上實(shí)現(xiàn)每秒20幀的實(shí)時游戲生成,每一幀畫面均源自精密的擴(kuò)散模
    的頭像 發(fā)表于 08-29 18:07 ?1083次閱讀

    TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進(jìn)行AI計算

    ,在訓(xùn)練尖端人工智能方面,大型科技公司正在尋找英偉達(dá)以外的替代品。 ? 不斷迭代的谷歌TPU 芯片 ? 隨著機(jī)器學(xué)習(xí)算法,特別是深度學(xué)習(xí)算法在各個領(lǐng)域的廣泛應(yīng)用,對于高效、低功耗的AI
    的頭像 發(fā)表于 07-31 01:08 ?3795次閱讀