女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

垂直大模型競爭,能突破數據“卡點”嗎?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-05-19 14:04 ? 次閱讀

科技云報道原創。

AI大模型火遍全球,中國產業也激發了對人工智能應用的新熱情。

隨著各大廠商參與競逐,市場正在分化為通用與垂直兩大路徑,兩者在參數級別、應用場景、商業模式等方面差異已逐步顯現。

企業涌入垂直大模型賽道

通用AI大模型像ChatGPT,能夠處理各種領域和場景的自然語言,但由于需要巨大的計算資源和數據量,已經成為國內外大廠的重點項目。

這類企業往往有著強大的技術團隊和資金支持,且有著自己的場景和流量優勢。比如百度、阿里、騰訊、字節、華為等,在搜索、社交、電商、辦公等領域都有著自己的通用AI大模型。

相較之下,創業公司、細分領域企業很難在這樣的競爭中獲得先發優勢或者差異化優勢。

而垂直AI大模型只關注某個特定的領域或者場景,它能夠利用行業的數據和知識,提供更精準和高效的解決方案,更好地滿足用戶在某個領域或者場景下的需求和期待,如:醫療、金融、教育等。

同時,它可以利用一些開源或者閉源的通用AI大模型作為基礎,然后在其上進行指令微調(instruction tuning),來適應自己的目標領域或者場景。

因此,它的參數規模比通用大模型低一個量級,如果讓數據飛輪和模型訓練能夠很好結合,在某些特定領域甚至比通用大模型的效果更好、成本更低。

在這樣的背景下,越來越多的企業加入了垂直大模型的賽道。

5月18日,深信服發布國內首個自研安全大模型,成為安全領域GPT技術應用首秀;

5月5日,學而思宣布正在進行自研數學大模型的研發,命名為MathGPT,面向全球數學愛好者和科研機構;

3月,達觀數據公布正在開發曹植系統,專注于金融、政務、制造等垂直領域的大語言模型。

明確的商業化落地場景和更低的算力成本,為各類企業打開了進軍垂直大模型的大門。

垂直大模型的考驗

垂直大模型的優勢在于不夠大:算力不夠大、算法難度低,但并不代表垂直大模型誰都能做。

眾所周知,AI大模型三要素:算力、算法、數據,都是喂養AI的“飼料”。

先說算力。

大模型之所以“大”,就是因為參數眾多和數據量龐大。AI大模型所需要的計算量,大致上相當于參數量與數據量的乘積。

過去5年,AI大模型的參數量幾乎每年提升一個數量級,例如GPT-4參數量是GPT-3的16倍,達到1.6萬億個。

隨著圖像、音視頻等多模態數據的引入,大模型的數據量也在飛速膨脹。這意味著想要玩轉大模型,必須擁有大算力。

而一套垂直大模型的訓練和推理成本,做個參考,在數字人垂類技術場景中,可以做到比Open AI同參數規模的模型低一個量級,像啟元世界的戰略總監王思捷就曾提到:先構建更小的垂類模型(比如百億參數、十億參數),讓數據飛輪和模型訓練能夠很好結合,垂類模型在某些領域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已遠遠低于通用大模型,但對算力基礎設施的投入依然會阻擋部分小公司的入局。

再說算法。

在三要素中,算法的研發難度相對較低,每家公司都有自己實現大模型的路徑算法,且有眾多開源項目可作為參考,中國公司最容易縮短甚至抹平差距。

最后說數據。

高質量的數據是助力AI訓練與調優的關鍵,足夠多、足夠豐富的數據,是AI大模型的根基。

OpenAI此前披露,為了AI像人類那樣流暢交談,研發人員給GPT-3.5提供多達45TB的文本語料,相當于472萬套中國“四大名著”。這些語料的來源包括維基百科、網絡文章、書籍期刊等,甚至還將代碼開源平臺Github納入其中。

但是聚焦到細分行業,數據的獲取就沒那么容易了。

興業證券公開表示,要訓練專業的行業大模型,優質的行業數據、公共數據至關重要。

就國內數據市場而言,據發改委官方批露,我國政府數據資源占全國數據資源的比重超過3/4,但開放規模不足美國的10%,個人和企業可以利用的規模更是不及美國的7%。

而行業數據更是非常核心的私域數據,私域數據量越大,質量越高,就越有價值。

比如,一個醫療公司擁有大量醫療數據、病例數據,那么它就能開發出醫療垂直大模型類的產品。同理,建筑行業的項目數據、金融行業的用戶畫像數據、海運行業的船位數據等,都是賦能垂直大模型的關鍵。

但是這些私域數據都攥在企業自己手中,而且為了數據安全和合規,絕大部分機構是要本地化部署才會嘗試大模型訓練,很難想象企業會把自己的核心數據拿給別人去訓練。

此外,如何合理地給數據打上分級標簽、做好標注也非常重要。數據分級分類能夠幫助產品提效,而高精度的標注數據能夠進一步提升大模型的專業表現。

但現階段垂直行業想要獲取高精度標注數據的成本較高,而在公開數據庫中,行業專業數據也較少,因此對垂直大模型的建構提出了很高的要求。

總體而言,想要做好垂直大模型,數據的重要性,遠超過算力和算法。

數據,已成為企業突破垂直大模型的“卡點”。

手握行業數據領先一步

垂類大模型講求應用與場景先行的邏輯,而在國內更是強調產業側的價值。

一方面,在當前中國的智能化浪潮下,產業側數字化革新本就有廣闊的市場需求;另一方面,在toB生態下,基于垂直應用的實踐也有利于形成數據飛輪與場景飛輪。

而這一切的前提,是推出垂類大模型的公司在該行業已建立技術壁壘與護城河,即“人無我有”的競爭優勢。

如此看來,在垂直行業深耕多年的企業或將有更大的贏面。

這類企業在數據層面、大模型以及知識圖譜方面都有較為深厚的積累,對于大模型的優化更具優勢。同時,它們對于to B客戶需求和落地場景有很深的理解,能夠更好地保證垂直大模型產品的可信和可靠,滿足企業級對于安全可控合規的需求。

目前,已有一些垂類大模型在金融、教育、醫藥、營銷等場景中得到試煉。

例如,彭博社利用自身豐富的金融數據源,基于開源的GPT-3框架再訓練,開發出了金融專屬大模型BloombergGPT;

網易有道則面向教育場景,推出自研的類ChatGPT模型“子曰”;

在ChatGPT發布后僅幾周,谷歌公布了一個專門用于回答醫療保健相關問題的大型醫用語言模型Med-PaLM......

相信隨著越來越多企業入局,垂直大模型在各個行業和細分領域中將大量涌現。而那些能將一個垂直領域做專、做透,用高質量的數據持續優化模型,跑通商業閉環,構建起產業生態的企業,最終將把價值鏈做到足夠長。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7242

    瀏覽量

    91039
  • AI
    AI
    +關注

    關注

    87

    文章

    34294

    瀏覽量

    275476
  • ChatGPT
    +關注

    關注

    29

    文章

    1588

    瀏覽量

    8809
  • 大模型
    +關注

    關注

    2

    文章

    3033

    瀏覽量

    3835
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    數據標注與大模型的雙向賦:效率與性能的躍升

    ??在人工智能蓬勃發展的時代,大模型憑借其強大的學習與泛化能力,已成為眾多領域創新變革的核心驅動力。而數據標注作為大模型訓練的基石,為大模型性能提升注入關鍵動力,是
    的頭像 發表于 06-04 17:15 ?440次閱讀
    <b class='flag-5'>數據</b>標注與大<b class='flag-5'>模型</b>的雙向賦<b class='flag-5'>能</b>:效率與性能的躍升

    如何賦醫療AI大模型應用?

    “百模大戰”。不僅如此,這些通用AI大模型還逐漸滲透到各個垂直行業中,其中生命科學和醫療健康行業成為了拓展速度較快的一個領域。從2023年2月至10月初,國內市場上
    的頭像 發表于 05-07 09:36 ?138次閱讀
    如何賦<b class='flag-5'>能</b>醫療AI大<b class='flag-5'>模型</b>應用?

    絕味20歲生日會,鴨廠鵝廠聯手發布中國零售連鎖AI垂直場景大模型

    絕味×騰訊,首個中國零售連鎖AI垂直場景大模型的破殼之路
    的頭像 發表于 04-23 19:18 ?744次閱讀
    絕味20歲生日會,鴨廠鵝廠聯手發布中國零售連鎖AI<b class='flag-5'>垂直</b>場景大<b class='flag-5'>模型</b>

    模型時代 垂直化是數據市場發展趨勢 解決單點難題是核心競爭

    數據,作為一種革命性的生產資源,與算力、算法共同構成了人工智能產業的三大要素。受益于人工智能的蓬勃發展,人類加速進入到由數據驅動的數字化時代,數據作為核心要素的作用越來越重要。 01 大模型
    的頭像 發表于 04-09 11:48 ?132次閱讀

    人民出行首批入選廣西人工智能垂直模型,以科技投入帶領行業前行

    作為首批入選企業,憑借深度融合時空圖神經網絡、多目標優化算法、集成視覺傳感器的騎行安全監控及能源路由算法等前沿技術所打造的 “大數據監控可視化平臺 + APP 端實時推薦” 雙引擎系統,成功破解共享出行行業痛,在眾多競爭者中脫
    的頭像 發表于 03-19 09:18 ?361次閱讀

    垂直運動永磁同步直線電機的復合控制研究

    后,系統可以達到較好的抗干擾效果,基本上消除了響應滯后,準確的跟蹤輸入信號。文件過大,請點擊下方附件免費下載~~~*附件:20250312_垂直運動永磁同步直線電機的復合控制研究.docx
    發表于 03-12 17:07

    數據采集卡:示波器不是萬的!??!#數據采集卡 #示波器 #熱電偶 #信號

    數據采集卡
    西安阿爾泰電子科技發展有限公司
    發布于 :2025年03月07日 16:38:13

    熱變形微軟化測試儀:材料性能檢測的關鍵儀器

    在材料科學領域,熱變形微軟化測試儀發揮著舉足輕重的作用。它是一種用于精確測定材料在特定條件下熱變形溫度以及微軟化的專業儀器。和晟HS-XRW-300MA熱變形維
    的頭像 發表于 02-24 13:36 ?379次閱讀
    熱變形微<b class='flag-5'>卡</b>軟化<b class='flag-5'>點</b>測試儀:材料性能檢測的關鍵儀器

    通用大模型垂直行業的應用

    隨著DeepSeek這類通用大模型的普及,接下來會迎來更加精細化的垂直行業模型,那么哪些垂直行業會率先受益?以下是DeepSeek的整理預測,供大家參考。
    的頭像 發表于 02-10 15:44 ?696次閱讀

    天數智芯與無問芯穹合作突破集群訓練優化

    近日,天數智芯與無問芯穹宣布達成深度合作,并在千集群訓練優化領域取得了重大技術突破。這一合作基于天數智芯的天垓150卓越計算能力和無問芯穹自主研發的大模型訓練框架,共同推動了LLaMA千
    的頭像 發表于 01-21 14:31 ?743次閱讀

    科普知識丨熱變形維軟化測試儀是什么?

    軟化。熱變形溫度是指材料在一定負荷下,產生規定變形量時的溫度;維軟化則是在規定的升溫速率下,標準壓針在試樣上壓入規定深度時的溫度。通過對這些參數的精確測量,
    的頭像 發表于 01-08 10:40 ?389次閱讀
    科普知識丨熱變形維<b class='flag-5'>卡</b>軟化<b class='flag-5'>點</b>測試儀是什么?

    【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙

    ,NVDIA與微軟的競爭 。計算能力的飛速提升是大模型得以興起的重要基石。GPU/TPU 等高性能計算設備的迅猛發展,宛如為大模型的訓練打造了一臺強大的引擎。它們能夠以極高的速度處理海量的數據
    發表于 12-24 13:10

    【「大模型啟示錄」閱讀體驗】營銷領域大模型的應用

    使企業能夠提前洞察市場動向,制定前瞻性的市場策略,從而在競爭中占據有利地位。 通過分析廣告投放的效果數據,大模型可以幫助企業優化廣告內容和投放策略。這包括確定最佳的廣告渠道、投放時間和目標受眾,以及
    發表于 12-24 12:48

    Kaggle知識:使用大模型進行特征篩選

    方法依賴于數據集中的樣本進行統計推斷,而基于文本的方法需要描述性的上下文以更好地在特征和目標變量之間建立語義關聯。這種方法利用了大型語言模型(LLMs)中豐富的語
    的頭像 發表于 12-03 01:06 ?1653次閱讀
    Kaggle知識<b class='flag-5'>點</b>:使用大<b class='flag-5'>模型</b>進行特征篩選

    中國電信人工智能研究院完成首個全國產化萬萬參大模型訓練

    近日,中國電信人工智能研究院宣布了一項重大技術突破:成功完成國內首個基于全國產化萬集群訓練的萬億參數大模型。
    的頭像 發表于 09-30 16:41 ?1979次閱讀