電子發燒友網報道(文/李彎彎)近段時間,由OpenAI推出的ChatGPT火遍全球,它幾乎可以生成任何形式的文本,從寫文章、編寫代碼,到回答復雜的數學問題。上線近兩個月,ChatGPT的注冊用戶就達到1億,成為史上用戶破億速度最快的軟件之一。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內,百度、阿里等頭部互聯網企業都已經宣布有相關的研究。那么,國內在發展AI語言處理大模型方面是否具備相應的條件,國產廠商可以如何把握這個機會?
在AIGC大模型發展上,國內具備哪些條件
從目前的情況來看,國內在發展這類大模型上可以說已經具備一定的條件。比如在算法層面,國內的互聯網公司以及一些研究院,已經具備研究語言大模型的基礎;在算力層面,國內的AI大算力芯片,以及在算力集群方面,也已經取得長足進步;在部署和服務方面,國內的云服務廠商可以提供各種服務渠道,讓基礎設施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現在的水平,是因為它六七年長時間的產品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數據集的標注、分揀、精煉上,也有很多創新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創始人兼COO張亞林在接受電子發燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態建設上,無論是現在很火的ChatGPT,還是之前備受關注的生成式AI公司Stability、Runway,他們在基礎模型、大模型的模型開發庫,用戶大量的應用上,都已經形成了可以觸達終端用戶的商業模式。而在國內,目前還沒樹立起這樣全棧的生態和商業模式。
不過,雖然國內在發展這類大模型方面存在不足,整體而言這對于國內廠商來是個很好的機會。從算力方面來看,人工智能技術的發展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內各類生成式AI大模型的訓練和部署將會加速,這對國內人工智能算力廠商來說無疑是個機會,國內廠商需要思考如何通過自身的算力發展,來持續推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構的創新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統,一個超大規模的集群系統,由幾千張加速卡、幾千顆芯片組成,還包括互聯和存儲。除了加速卡的性能之外,還要看整個系統的穩定性、集群的互聯效率、存儲的效率、以及分布式系統運行的穩定性。
第三是軟件生態,它是否能夠支持整個大模型的調試和開發。這要求企業不僅要能提供基礎的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調試者和開發者能夠更好的調試和開發這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設計,集群的穩定性,到整個軟件棧的完備性,這對于初創公司來說還有一段很長的路要走,需要持續的產品迭代。
那么國內在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發更經濟。
第二,最終呈現在用戶側的是整個的集群系統,就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯和存儲,很多服務器。因此,國內的AI大芯片廠商需要能夠站到系統的角度去看問題,包括整個系統的設計、調動能力、讓用戶易用,這些跟芯片本身的設計和開發能力會不太一樣。
第三,如何讓用戶在開發過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發散狀態,變成了有可能聚焦在某一些維度上就能夠很好的支撐和優化的狀態。
這給國內很多AI廠商提供了很好的思路,企業可以聚焦在比如大模型集群化的領域。國內廠商可以由此切入,誰能夠在這樣一個大規模AI生成領域,把訓練和推理整套集群系統,做得更優化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領域,燧原科技已經有了很深的積累。目前燧原科技已經迭代了兩代訓練和推理產品,第三代也已經在研發中。此外,燧原科技已經在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經積累的系統集群的經驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發展機會,燧原科技將從多個方面去做深度布局。第一是持續推進和迭代集群化產品和軟件生態棧,與更多戰略用戶一起優化集群系統,提高性價比和能效比;第二是與國內云服務商進行深度合作,通過他們的云服務平臺,觸達更多To B和To C用戶;第三是與國家相關機構合作制定更多關于AIGC標準和白皮書,探討未來發展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創生態。
小結
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產生活來說,ChatGPT等大模型的發展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數據集進一步加強,AIGC這類巨大模型將會愈發智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關產業帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關鍵。
ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內,百度、阿里等頭部互聯網企業都已經宣布有相關的研究。那么,國內在發展AI語言處理大模型方面是否具備相應的條件,國產廠商可以如何把握這個機會?
在AIGC大模型發展上,國內具備哪些條件
從目前的情況來看,國內在發展這類大模型上可以說已經具備一定的條件。比如在算法層面,國內的互聯網公司以及一些研究院,已經具備研究語言大模型的基礎;在算力層面,國內的AI大算力芯片,以及在算力集群方面,也已經取得長足進步;在部署和服務方面,國內的云服務廠商可以提供各種服務渠道,讓基礎設施能夠便捷實用,使算法在大算力平臺上很好的部署。
不足之處在于,第一,ChatGPT能夠達到現在的水平,是因為它六七年長時間的產品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數據集的標注、分揀、精煉上,也有很多創新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規模模型的推進。
第二,大模型的訓練離不開大算力,燧原科技創始人兼COO張亞林在接受電子發燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。
第三,在生態建設上,無論是現在很火的ChatGPT,還是之前備受關注的生成式AI公司Stability、Runway,他們在基礎模型、大模型的模型開發庫,用戶大量的應用上,都已經形成了可以觸達終端用戶的商業模式。而在國內,目前還沒樹立起這樣全棧的生態和商業模式。
不過,雖然國內在發展這類大模型方面存在不足,整體而言這對于國內廠商來是個很好的機會。從算力方面來看,人工智能技術的發展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。
隨著ChatGPT的爆火,國內各類生成式AI大模型的訓練和部署將會加速,這對國內人工智能算力廠商來說無疑是個機會,國內廠商需要思考如何通過自身的算力發展,來持續推動中國本土大模型的進步。
ChatGPT爆火,算力廠商如何把握機會
那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構的創新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。
其次是集群系統,一個超大規模的集群系統,由幾千張加速卡、幾千顆芯片組成,還包括互聯和存儲。除了加速卡的性能之外,還要看整個系統的穩定性、集群的互聯效率、存儲的效率、以及分布式系統運行的穩定性。
第三是軟件生態,它是否能夠支持整個大模型的調試和開發。這要求企業不僅要能提供基礎的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調試者和開發者能夠更好的調試和開發這些大模型,就是說還需要具備一個整套的軟件棧。
張亞林認為,從芯片設計,集群的穩定性,到整個軟件棧的完備性,這對于初創公司來說還有一段很長的路要走,需要持續的產品迭代。
那么國內在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發更經濟。
第二,最終呈現在用戶側的是整個的集群系統,就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯和存儲,很多服務器。因此,國內的AI大芯片廠商需要能夠站到系統的角度去看問題,包括整個系統的設計、調動能力、讓用戶易用,這些跟芯片本身的設計和開發能力會不太一樣。
第三,如何讓用戶在開發過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發散狀態,變成了有可能聚焦在某一些維度上就能夠很好的支撐和優化的狀態。
這給國內很多AI廠商提供了很好的思路,企業可以聚焦在比如大模型集群化的領域。國內廠商可以由此切入,誰能夠在這樣一個大規模AI生成領域,把訓練和推理整套集群系統,做得更優化、更完整、更易用,誰就能夠在這場游戲中拔得先機。
在人工智能算力領域,燧原科技已經有了很深的積累。目前燧原科技已經迭代了兩代訓練和推理產品,第三代也已經在研發中。此外,燧原科技已經在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經積累的系統集群的經驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。
同時,面對生成式AI大模型帶來的發展機會,燧原科技將從多個方面去做深度布局。第一是持續推進和迭代集群化產品和軟件生態棧,與更多戰略用戶一起優化集群系統,提高性價比和能效比;第二是與國內云服務商進行深度合作,通過他們的云服務平臺,觸達更多To B和To C用戶;第三是與國家相關機構合作制定更多關于AIGC標準和白皮書,探討未來發展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創生態。
小結
整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產生活來說,ChatGPT等大模型的發展將會帶來勞動力的釋放。
未來隨著模型的進一步擴大,數據集進一步加強,AIGC這類巨大模型將會愈發智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關產業帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關鍵。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
算力
+關注
關注
2文章
1133瀏覽量
15421 -
ChatGPT
+關注
關注
29文章
1586瀏覽量
8766
發布評論請先 登錄
相關推薦
熱點推薦
燧原科技助力美圖AI換裝全球爆火
2025蛇年元宵后,美圖公司旗下美顏相機憑借“AI換裝”功能爆火,獲得了國內外用戶的極大青睞,App下載量和使用量迅速激增的同時,也面臨了海量推理算力即時支持的挑戰。

算力基礎篇:從零開始了解算力
算力即計算能力(Computing Power),狹義上指對數字問題的運算能力,而廣義上指對輸入信息處理后實現結果輸出的一種能力。雖然處理的內容不同,但處理過程的能力都可抽象為算力。比

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯
感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。
本書主要講算力芯片CPU
發表于 10-15 22:08
淺析三大算力之異同
隨著一年多前ChatGPT的出現引爆人工智能(AI)浪潮,支撐大模型背后的“算力”概念突然闖進我們的視野,成為科技圈炙手可熱的新詞,引領著最新潮流。作為數字經濟時代新生產力,也許不少人

大模型時代的算力需求
現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型的算力,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
發表于 08-20 09:04
中科曙光入選2024算力服務產業圖譜及算力服務產品名錄
近日,中國信通院公布首個《算力服務產業圖譜(2024年)》及《算力服務產品名錄(2024年)》。曙光智算構建的全國一體化
評論