以下文章來(lái)源于谷歌云服務(wù),作者 Google Cloud
作者:Dan Lenoski
職位: Google Cloud 工程副總裁
作者:Nandita Dukkipati
職位:Google Cloud 首席軟件工程師
在 Google,我們長(zhǎng)期使用以太網(wǎng)解決規(guī)模化問(wèn)題,重構(gòu)傳輸層,從而滿足突發(fā)高帶寬、高速率和低延遲的工作負(fù)載需求。例如對(duì)象存儲(chǔ)這一工作負(fù)載長(zhǎng)期以來(lái)需要這些網(wǎng)絡(luò)屬性,但隨著大規(guī)模 AI/ML 訓(xùn)練和高性能計(jì)算 (HPC) 等新用例的涌現(xiàn),此類需求再次大幅增長(zhǎng)。過(guò)去,我們通過(guò)向計(jì)算機(jī)協(xié)會(huì)和互聯(lián)網(wǎng)工程任務(wù)組提供我們的構(gòu)想,與業(yè)界公開(kāi)分享我們?cè)诹髁空巍砣刂啤⒇?fù)載平衡等方面的經(jīng)驗(yàn)。數(shù)年來(lái),這些構(gòu)想已在軟件和少數(shù)硬件中得以實(shí)現(xiàn)。但展望未來(lái),我們相信,借助專用且靈活的硬件輔助來(lái)實(shí)施這套方案,對(duì)整個(gè)行業(yè)更加有益。
為此,我們開(kāi)發(fā)了 Falcon,其性能比純軟件傳輸更上一層樓。在 OCP 全球峰會(huì)上,我們通過(guò)開(kāi)放計(jì)算項(xiàng)目(Open Compute Project) 向生態(tài)系統(tǒng)開(kāi)放 Falcon,該項(xiàng)目是利用 Google 的生產(chǎn)經(jīng)驗(yàn)幫助業(yè)界實(shí)現(xiàn)以太網(wǎng)現(xiàn)代化的不二之選。
Falcon 作為硬件輔助傳輸層而設(shè)計(jì),具有可靠性、高性能和低延遲的特點(diǎn),而且充分利用了經(jīng)過(guò)生產(chǎn)驗(yàn)證的技術(shù),包括 Carousel、Snap、Swift、PLB 以及 CSIG。

Falcon 的分層參見(jiàn)下圖,其中包括其相關(guān)功能。我們展示了 RDMA 和 NVM Express 上層協(xié)議 (ULP),不過(guò) Falcon 可根據(jù)生態(tài)系統(tǒng)的需要擴(kuò)展到其他 ULP。

Falcon 的底層使用三大關(guān)鍵技術(shù),在有損的高帶寬數(shù)據(jù)中心以太網(wǎng)絡(luò)實(shí)現(xiàn)低延遲。細(xì)粒度硬件輔助往返時(shí)間 (RTT) 測(cè)量、基于硬件的流量整形、快速準(zhǔn)確的數(shù)據(jù)包重傳,并與支持多路徑和 PSP 加密的 Falcon 連接相結(jié)合。在此基礎(chǔ)上,F(xiàn)alcon 從一開(kāi)始就被設(shè)計(jì)為一種多協(xié)議傳輸,能夠支持性能要求和應(yīng)用語(yǔ)義千差萬(wàn)別的上層協(xié)議。上層協(xié)議映射層不僅提供與 Infiniband Verbs RDMA 和 NVMe ULP 的開(kāi)箱即用兼容性,而且包含了對(duì)超大規(guī)模應(yīng)用至關(guān)重要的其他創(chuàng)新,例如靈活的排序語(yǔ)義和妥善的錯(cuò)誤處理。最后一點(diǎn)是,硬件和軟件協(xié)同設(shè)計(jì),配合運(yùn)行,幫助實(shí)現(xiàn)高信息傳輸速率、低延遲和高帶寬等屬性,同時(shí)保持靈活性,賦能可編程性和持續(xù)創(chuàng)新。
Falcon 反映出以太網(wǎng)繼續(xù)在我們的行業(yè)中扮演中堅(jiān)角色。Falcon 旨在實(shí)現(xiàn)超大規(guī)模的可預(yù)測(cè)高性能以及靈活性和可擴(kuò)展性。我們期待與社區(qū)和行業(yè)合作伙伴合作,對(duì)以太網(wǎng)進(jìn)行現(xiàn)代化改造,在 AI 驅(qū)動(dòng)的未來(lái)里滿足聯(lián)網(wǎng)需求。我們相信,F(xiàn)alcon 將成為這一領(lǐng)域里正在推進(jìn)的其他任務(wù)的重要補(bǔ)充。
行業(yè)視角
我們的行業(yè)合作伙伴對(duì) Falcon 開(kāi)發(fā)下一代以太網(wǎng)的前景充滿期待。
"我們非常認(rèn)可 Google 對(duì) Falcon 做出的貢獻(xiàn),它與超以太網(wǎng)聯(lián)盟的愿景一致,即推動(dòng)以太網(wǎng)成為 AI 和高性能計(jì)算的最佳數(shù)據(jù)中心結(jié)構(gòu),我們也期待在這一重要領(lǐng)域繼續(xù)推進(jìn)行業(yè)創(chuàng)新。"
—— 超以太網(wǎng)聯(lián)盟 (主要成員包括 AMD、Arista、Broadcom、Cisco、Eviden、Hewlett Packard Enterprise、Intel、Meta、Microsoft 和 Oracle)主席
Jetz 博士
"Falcon 率先應(yīng)用在英特爾 IPU E2000 系列產(chǎn)品中。作為以太網(wǎng)傳輸?shù)牡谝粋€(gè)應(yīng)用實(shí)例,這些 IPU 的價(jià)值得到了進(jìn)一步提升,可大規(guī)模增加長(zhǎng)尾端延遲和擁塞處理功能。英特爾是超以太網(wǎng)聯(lián)盟的指導(dǎo)成員,該聯(lián)盟致力于為高性能 AI 和高性能計(jì)算工作負(fù)載發(fā)展以太網(wǎng)。我們計(jì)劃在未來(lái)的 IPU 和以太網(wǎng)產(chǎn)品中部署基于此類標(biāo)準(zhǔn)的增強(qiáng)功能。"
——英特爾高級(jí)副總裁兼網(wǎng)絡(luò)與邊緣事業(yè)部
總經(jīng)理Sachin Katti
"我們很高興看到針對(duì) AI 和高性能計(jì)算等關(guān)鍵工作負(fù)載的高性能傳輸協(xié)議能夠在標(biāo)準(zhǔn)以太網(wǎng)/IP 網(wǎng)絡(luò)上運(yùn)行,并且大規(guī)模實(shí)現(xiàn)高應(yīng)用帶寬。"
——Arista Networks 軟件工程副總裁
Hugh Holbrook
"思科很高興看到 Falcon 對(duì)開(kāi)放計(jì)算項(xiàng)目的貢獻(xiàn)。長(zhǎng)期以來(lái)思科始終支持開(kāi)放標(biāo)準(zhǔn),堅(jiān)信廣泛的生態(tài)系統(tǒng)。現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)特別是 Al/ML 的發(fā)展速度和規(guī)模前所未有,對(duì)行業(yè)發(fā)展而言既是挑戰(zhàn)也是機(jī)遇。Falcon 解決了這些網(wǎng)絡(luò)面臨的諸多挑戰(zhàn),實(shí)現(xiàn)了網(wǎng)絡(luò)的高效利用。"
——思科研究員 Ofer Iny
"瞻博網(wǎng)絡(luò)是開(kāi)放生態(tài)系統(tǒng)的堅(jiān)定支持者,因此我們很高興看到 Falcon 向開(kāi)放計(jì)算項(xiàng)目社區(qū)開(kāi)放。Falcon 允許以太網(wǎng)作為數(shù)據(jù)中心網(wǎng)絡(luò)的首選,為要求苛刻的工作負(fù)載帶來(lái)高帶寬、低尾延遲和擁塞緩解。如今,F(xiàn)alcon 為業(yè)界提供了一個(gè)成熟的解決方案,處理復(fù)雜的 AI/ML 工作負(fù)載。"
——瞻博網(wǎng)絡(luò)首席技術(shù)官 Raj Yavatkar
"Marvell 大力支持并致力于開(kāi)放式以太網(wǎng)生態(tài)系統(tǒng)的發(fā)展,為 AI 等要求苛刻的新興工作負(fù)載提供支持。我們贊賞 Falcon 對(duì)開(kāi)放計(jì)算項(xiàng)目的貢獻(xiàn),歡迎 Google 與業(yè)界分享實(shí)踐經(jīng)驗(yàn)。"
——Marvel 高級(jí)副總裁兼網(wǎng)絡(luò)交換事業(yè)部總經(jīng)理 Nick Kucharewski

原文標(biāo)題:Google 向生態(tài)系統(tǒng)開(kāi)放可靠的低延遲硬件傳輸系統(tǒng) Falcon
文章出處:【微信公眾號(hào):谷歌開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
谷歌
+關(guān)注
關(guān)注
27文章
6223瀏覽量
107514
原文標(biāo)題:Google 向生態(tài)系統(tǒng)開(kāi)放可靠的低延遲硬件傳輸系統(tǒng) Falcon
文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
如何借助大語(yǔ)言模型打造人工智能生態(tài)系統(tǒng)

如何在光子學(xué)中利用電子生態(tài)系統(tǒng)

安森美PRISM生態(tài)系統(tǒng)助力相機(jī)開(kāi)發(fā)

英監(jiān)管機(jī)構(gòu)或優(yōu)先調(diào)查蘋(píng)果谷歌移動(dòng)生態(tài)系統(tǒng)
英國(guó)CMA將對(duì)蘋(píng)果谷歌移動(dòng)生態(tài)系統(tǒng)展開(kāi)調(diào)查
Hadoop 生態(tài)系統(tǒng)在大數(shù)據(jù)處理中的應(yīng)用與實(shí)踐
笙泉完善的MCU生態(tài)系統(tǒng)(ECO System),賦能高效開(kāi)發(fā)、提升競(jìng)爭(zhēng)優(yōu)勢(shì)
概倫電子亮相臺(tái)積電中國(guó)OIP生態(tài)系統(tǒng)論壇
對(duì)三星而言開(kāi)放生態(tài)系統(tǒng)是什么
小米15系列發(fā)布會(huì):Xiaomi HyperConnect邁向全球最大智能生態(tài)系統(tǒng)
英特爾和AMD組建x86生態(tài)系統(tǒng)咨詢小組
歐盟向蘋(píng)果施壓:開(kāi)放iOS與iPadOS操作系統(tǒng),否則面臨巨額罰款
使用Google Play獲得安全可靠的AI體驗(yàn)
意法半導(dǎo)體推出圖像傳感器應(yīng)用開(kāi)發(fā)生態(tài)系統(tǒng)
高通CEO安蒙:高通重構(gòu)Windows PC生態(tài)系統(tǒng)的性能領(lǐng)導(dǎo)力

評(píng)論