女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

斯坦福團隊抄襲國產大模型,主要責任人失聯

Felix分析 ? 來源:電子發燒友 ? 作者:吳子鵬 ? 2024-06-05 00:10 ? 次閱讀

電子發燒友網報道(文/吳子鵬)近日,斯坦福大學AI團隊主導的Llama3-V開源模型被證實套殼抄襲國內清華與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5。該事件引起了業界的廣泛關注,也讓大家對于開源大模型的規范使用更加擔憂。

斯坦福Llama3V模型被證實抄襲

5月29日,斯坦福大學的一個AI團隊在Github等平臺發布了一款大模型,名為Llama3V,該模型的亮點是據稱只需要500美元就可以訓練出一個 SOTA多模態模型,模型效果可比肩GPT-4V、Gemini Ultra等大模型。

由于模型團隊來自斯坦福,且效果描述非常吸引眼球,因此該模型很快在社交平臺發酵,推特上相關話題的瀏覽量超過了30萬,迅速沖到了Hugging Face首頁。

不過,有用戶很快發現,Llama3-V大模型實際上是套殼面壁智能的MiniCPM-Llama3-V 2.5,但Llama3-V在發布信息中并沒有體現這一點,且稱只是使用了MiniCPM-Llama3-V 2.5的tokenizer。但這一說法讓用戶很難認同,隨后有用戶在Github頁面上指出了套殼的問題,但相關言論很快被斯坦福團隊刪除。

該用戶非常不滿隨后到MiniCPM-Llama3-V 2.5頁面下重述了這一問題,并提醒面壁智能重視此事。面壁團隊通過測試發現,Llama3V與MiniCPM-Llama3-V 2.5在“胎記”般案例上的表現100%雷同,做實了斯坦福團隊的抄襲行為。隨后,這一事件在國外媒體迅速發酵。

隨后不久,斯坦福Llama3-V團隊承認抄襲,斯坦福本科生Siddharth Sharma和Aksh Garg發布了道歉聲明,不過據稱是主要責任人的Mustafa Aljadery并沒有出現在道歉聲明中,這名學生來自南加利福尼亞大學,目前處于失蹤的狀態,是這一事件的主要過錯方。

Aksh Garg在道歉聲明中表示,“首先,我們要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa一起發布了Llama3-V,Mustafa為這個項目編寫了代碼,但從昨天起就無法聯系他。我與Siddharth Sharma主要負責幫助Mustafa進行模型推廣。我們倆查看了最新的論文,以驗證這項工作的新穎性,但并未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。我們向作者道歉,并對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任,并已撤下Llama3-V,再次致歉。”

6月3日,面壁智能CEO李大海與聯合創始人劉知遠先后發文,回應開源模型被斯坦福大學AI團隊抄襲一事。李大海表示:“我們對這件事深表遺憾。一方面感慨這也是一種受到國際團隊認可的方式,另一方面呼吁大家共建開放、合作、有信任的社區環境。”“我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。”

據介紹,MiniCPM-Llama3-V 2.5是MiniCPM-V系列的最新版本模型,基于SigLip-400M和Llama3-8B-Instruct構建,共參數規模為8B,相較于MiniCPM-V 2.0性能取得較大幅度提升。MiniCPM-Llama3-V 2.5在綜合了11個主流多模態大模型評測基準的OpenCompass榜單上平均得分65.1的成績,超越了GPT-4o、GPT-4V、Gemini Pro、Qwen-VL-Max等商用閉源模型。

開源大模型規范使用值得關注

開源大模型是指一種基于開源技術和大規模數據集構建的人工智能模型,具有開放性和可擴展性的特點。開源大模型與傳統的商業人工智能模型不同,其最大的特點在于開放性和可擴展性。這種模型的構建需要利用大量的開源工具和資源,包括開源的深度學習框架、開源的數據集和開源的算法等。

開源大模型是AI大模型發展的重要分支,擁有LLaMA、Grok-1、Stable Code Instruct-3B、Mistral 8x7B和零一萬物的Yi-34B等代表產品,這些大模型的發布和發展,不僅顯著增強了數據的安全性和隱私保護,更為用戶節省了大量成本,減少了對外部依賴的需求。

不過,由于是開源的,因此開源大模型一直以來都面臨著被抄襲的風險。實際上,上述提到的零一萬物的Yi-34B在去年也是深陷抄襲的漩渦里。2023年11月14日,一位國外開發者在Hugging Face開源主頁上評論稱,創新工場董事長兼CEO、零一萬物CEO李開復旗下 AI 公司“零一萬物”開源大模型Yi-34B,完全使用Meta研發的LIama開源模型架構,而只對兩個張量(Tensor)名稱進行修改。

根據零一萬物的說明,零一萬物在訓練模型過程中,沿用了GPT/LLaMA的基本架構,由于LLaMA社區的開源貢獻,讓零一萬物可以快速起步。零一萬物還在聲明中稱,模型結構僅是模型訓練其中一部分。Yi 開源模型在其他方面的精力,比如數據工程、訓練方法、baby sitting(訓練過程監測)的技巧、hyperparameter設置、評估方法以及對評估指標的本質理解深度、對模型泛化能力的原理的研究深度、行業頂尖的AI infra能力等。

實際上,在更早的2022年,智源研究院的大模型研究中心就被爆出了抄襲的問題,一篇擁有100位作者署名的綜述研究《A Roadmap for Big Model》被質疑抄襲了多篇論文內容,引發國內外學者和社區的廣泛關注與討論。另外,商湯、谷歌等公司都曾被指出存在抄襲問題。

目前,AI大模型在防止抄襲、版權歸屬等問題方面還存在很大的漏洞,行業法規明顯不健全,關于大模型使用已有作品進行訓練是否構成侵權,以及大模型生成物是否可以享有版權,這類事件也已經有案件發生。相信隨著行業的進一步發展,杜絕抄襲和版權歸屬將逐漸有法可依,這樣會更有利于大模型的發展。

結語

斯坦福團隊開源大模型抄襲事件暴露了開源大模型的濫用和監管問題,同時AI大模型也還有更深層次的數據和作品版權歸屬問題,因此不難看出AI大模型尚處于野蠻生長的階段,未來還需要逐步健全行業法規。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 大模型
    +關注

    關注

    2

    文章

    3026

    瀏覽量

    3825
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    斯坦福DG535脈沖發生器無法啟動故障診斷與維修方案

    近期深圳某院校送修一臺斯坦福DG535數字延時脈沖發生器,報修故障為開機之后面板卡住,操作沒有反應。對儀器進行初步檢測,儀器開機之后卡在啟動界面,指示燈全亮,按鍵沒有反應。
    的頭像 發表于 05-28 16:02 ?95次閱讀
    <b class='flag-5'>斯坦福</b>DG535脈沖發生器無法啟動故障診斷與維修方案

    中軟國際RAI治理能力獲權威認可

    近日,中軟國際在金融領域的負責任人工智能(RAI)實踐獲得權威認可,其創新方案被納入《IDC Perspective:金融行業負責任 AI 的實踐 —— 從治理框架到技術實現》研究報告
    的頭像 發表于 05-22 16:45 ?291次閱讀

    詳解《斯坦福 AI 報告 2025》:國產模型崛起、清華論文領先

    斯坦福AI指數報告這是一份影響力很大的報告,每年一期。該報告旨在追蹤、整合、提煉并可視化與人工智能(AI)相關的各類數據。報告提供無偏見、經過嚴格審查、來源廣泛的數據,幫助政策制定者、研究人員、高管
    的頭像 發表于 04-17 18:05 ?585次閱讀
    詳解《<b class='flag-5'>斯坦福</b> AI 報告 2025》:<b class='flag-5'>國產</b><b class='flag-5'>模型</b>崛起、清華論文領先

    斯坦福大學發布《2025 年人工智能指數報告》

    2025年4月,斯坦福2025HAI報告重磅發布。由李飛飛聯合領導的斯坦福大學以人為本人工智能研究所(StanfordHAI)發布了《2025年人工智能指數報告
    的頭像 發表于 04-11 11:08 ?524次閱讀
    <b class='flag-5'>斯坦福</b>大學發布《2025 年人工智能指數報告》

    昕軟件國內版PDF編輯器成功接入DeepSeek模型

    近日,昕軟件在互動平臺上宣布,其國內版PDF編輯器產品已經成功完成了DeepSeek模型的適配接入工作。這一舉措標志著昕軟件在AI技術融合方面取得了重要進展,為用戶提供了更加智能、高效的PDF
    的頭像 發表于 02-19 09:28 ?691次閱讀

    字節豆包大模型團隊提出稀疏模型架構

    字節跳動豆包大模型Foundation團隊近期研發出UltraMem,一種創新的稀疏模型架構,旨在解決推理過程中的訪存問題,同時確保模型效果不受影響。
    的頭像 發表于 02-13 15:25 ?531次閱讀

    阿里巴巴Qwen大模型助力開發低成本DeepSeek替代方案

    近日,阿里巴巴的開源Qwen2.5模型在AI領域再次展現其強大實力,為斯坦福大學與伯克利大學的研究人員提供了低成本的AI訓練解決方案。借助這一技術,兩所知名學府的研究團隊成功開發出價格低于50美元
    的頭像 發表于 02-12 13:42 ?872次閱讀

    Qwen大模型助力開發低成本AI推理方案

    阿里巴巴的開源Qwen2.5模型近期在AI領域引發了廣泛關注。這一大模型的推出,為斯坦福大學與伯克利大學的研究人員提供了強大的技術支持,使他們能夠成功開發出低成本的AI推理模型。 據悉
    的頭像 發表于 02-12 09:19 ?502次閱讀

    海光信息技術團隊成功適配DeepSeek大模型

    近日,海光信息技術團隊宣布,已成功完成DeepSeek-Janus-Pro多模態大模型與海光DCU(數據計算單元)的適配優化,并正式上線運行。這一成果標志著海光團隊在推動AI大模型
    的頭像 發表于 02-08 14:10 ?571次閱讀

    海光信息技術團隊完成模型與DCU國產化適配

    近期,中科曙光國家先進計算產業創新中心有限公司對外發布了一則重要消息。據悉,該公司的海光信息技術團隊已經成功完成了DeepSeek V3和R1模型與海光DCU(深度計算單元)的國產化適配工作,并
    的頭像 發表于 02-06 11:37 ?796次閱讀

    字節豆包大模型團隊成立AGI長期研究團隊Seed Edge

     據1月24日的報道,字節跳動旗下的豆包大模型團隊已悄然組建了一個專注于通用人工智能(AGI)的長期研究團隊,內部代號為“Seed Edge”。該團隊旨在鼓勵成員們大膽探索那些具有不確
    的頭像 發表于 01-24 15:03 ?1514次閱讀

    斯坦福STANFORD FS725銣鐘

    斯坦福STANFORD FS725銣鐘 SRS斯坦福FS725 10MHzRb頻率標準 ? SRS斯坦福FS72510MHzRb頻率標準FS725集成了一個銣振蕩器(SRS模型PRS1
    的頭像 發表于 12-13 15:22 ?437次閱讀

    斯坦福研究:電動汽車電池實際壽命比預估長得多

    。 這項研究是由斯坦福大學的普考特能源研究所與美國SLAC國家加速器實驗室共同成立的SLAC-斯坦福電池研究中心的科學家們完成的。經過超過兩年的時間,他們對92種商用鋰離子電池進行了詳盡的充放電測試。 結果顯示,當放電模式模擬真
    的頭像 發表于 12-11 17:24 ?552次閱讀

    STANFORD斯坦福SR830 鎖相放大器

    原裝STANFORD斯坦福SR830 鎖相放大器 鎖相放大器是一種對交變信號進行相敏檢波的放大器。鎖相放大器利用和被測信號有相同頻率和相位關系的參考信號作為比較基準,只對被測信號本身和那些與參考信號
    的頭像 發表于 11-23 16:38 ?488次閱讀

    國產儀器崛起:斯坦福替代方案來了!

    眾所周知,斯坦福的東西一直以來,好用,貴,貨期長動輒幾個月,很苦惱 今天,他來了,他的替代來了 首先是最經典的型號斯坦福SR830,它的頻率可以達到102.4 kHz ,18位的ADC,采樣率可以
    的頭像 發表于 07-10 17:05 ?730次閱讀
    <b class='flag-5'>國產</b>儀器崛起:<b class='flag-5'>斯坦福</b>替代方案來了!