女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟正式發(fā)布一個27億參數(shù)的語言模型—Phi-2

AI科技大本營 ? 來源:CSDN ? 2023-12-14 15:45 ? 次閱讀

先后和 OpenAI、Meta 牽手推動大模型發(fā)展的微軟,也正在加快自家小模型的迭代。就在今天,微軟正式發(fā)布了一個 27 億參數(shù)的語言模型——Phi-2。這是一種文本到文本的人工智能程序,具有出色的推理和語言理解能力。

同時,微軟研究院也在官方 X 平臺上如是說道,“Phi-2 的性能優(yōu)于其他現(xiàn)有的小型語言模型,但它足夠小,可以在筆記本電腦或者移動設(shè)備上運行”

Phi-2 的性能真能優(yōu)于大它 25 倍的模型?

對于Phi-2 的發(fā)布,微軟研究院在官方公告的伊始便直言,Phi-2 的性能可與大它 25 倍的模型相匹配或優(yōu)于。

這也讓人有些尷尬的事,不少網(wǎng)友評價道,這豈不是直接把 Google 剛發(fā)的 Gemini 最小型號的版本給輕松超越了?

9143919c-9a54-11ee-8b88-92fbcf53809c.png

那具體情況到底如何?

微軟通過時下一些如 Big Bench Hard (BBH)、常識推理(PIQA、WinoGrande、ARC easy 和 Challenge、SIQA)、語言理解(HellaSwag、OpenBookQA、MMLU(5-shot)、 SQuADv2、BoolQ)、數(shù)學(xué)(GSM8k)和編碼(HumanEval)等基準(zhǔn)測試,將 Phi-2 與 7B 和 13B 參數(shù)的 Mistral 和 Llama-2 進(jìn)行了比較。

最終得出僅擁有 27 億個參數(shù)的 Phi-2 ,超越了 Mistral 7B 和 Llama-2 7B 以及 13B 模型的性能。值得注意的是,與大它 25 倍的 Llama-2-70B 模型相比,Phi-2 還在多步推理任務(wù)(即編碼和數(shù)學(xué))上實現(xiàn)了更好的性能。

914e0758-9a54-11ee-8b88-92fbcf53809c.png

此外,如上文所提及的,微軟研究人員也直接在基準(zhǔn)測試中放上了其與Google 全新發(fā)布的 Gemini Nano 2 正面PK 的結(jié)果,不出所料,Phi-2盡管尺寸較小,但性能還是把Gemini Nano 2 超了。

91580fa0-9a54-11ee-8b88-92fbcf53809c.png

除了這些基準(zhǔn)之外,研究人員似是在暗諷 Google 前幾日在Gemini 演示視頻中造假一事,因為當(dāng)時 Google 稱其即將推出的最大、最強大的新人工智能模型 Gemini Ultra 能夠解決相當(dāng)復(fù)雜的物理問題,并且甚至糾正學(xué)生的錯誤。

事實證明,盡管 Phi-2 的大小可能只是 Gemini Ultra 的一小部分,但它也能夠正確回答問題并使用相同的提示糾正學(xué)生。

9163d164-9a54-11ee-8b88-92fbcf53809c.png

微軟的改進(jìn)

Phi-2 小模型之所以有如此亮眼的成績,微軟研究院在博客中解釋了原因。

一是提升訓(xùn)練數(shù)據(jù)的質(zhì)量。Phi-2 是一個基于 Transformer 的模型,其目標(biāo)是預(yù)測下一個單詞,它在 1.4T 個詞組上進(jìn)行了訓(xùn)練,這些詞組來自 NLP 和編碼的合成數(shù)據(jù)集和網(wǎng)絡(luò)數(shù)據(jù)集,包括科學(xué)、日常活動和心理理論等用于教授模型常識和推理的內(nèi)容。Phi-2 的訓(xùn)練是在 96 個 A100 GPU 上耗時 14 天完成的。

其次,微軟使用創(chuàng)新技術(shù)進(jìn)行擴(kuò)展,將其知識嵌入到 27 億參數(shù) Phi-2 中。

微軟指出,Phi-2 是一個基礎(chǔ)模型,沒有通過人類反饋強化學(xué)習(xí)(RLHF)進(jìn)行調(diào)整,也沒有經(jīng)過指導(dǎo)性微調(diào)。盡管如此,與經(jīng)過對齊的現(xiàn)有開源模型相比,微軟觀察到在毒性和偏差方面,Phi-2 有更好的表現(xiàn)。

917381cc-9a54-11ee-8b88-92fbcf53809c.png

寫在最后

話說 Phi-2 的發(fā)布的確在小模型的性能上實現(xiàn)了突破,不過也有媒體發(fā)現(xiàn)它還存在很大的局限性。

因為根據(jù)微軟研究許可證顯示,其規(guī)定了 Phi -2 只能用于“非商業(yè)、非創(chuàng)收、研究目的”,而不是商業(yè)用途。因此,想要在其之上構(gòu)建產(chǎn)品的企業(yè)就不走運了。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3773

    瀏覽量

    137122
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1201

    瀏覽量

    8634
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3022

    瀏覽量

    3819

原文標(biāo)題:只有 27 億參數(shù),微軟發(fā)布全新 Phi-2 模型!

文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    華為助力中國石油發(fā)布3000參數(shù)昆侖大模型

    5月28日,中國石油發(fā)布3000參數(shù)昆侖大模型,標(biāo)志著中國石油在人工智能領(lǐng)域又邁出關(guān)鍵步,全力推動“人工智能+”行動走深走實。 ? 中國
    的頭像 發(fā)表于 05-29 09:19 ?313次閱讀
    華為助力中國石油<b class='flag-5'>發(fā)布</b>3000<b class='flag-5'>億</b><b class='flag-5'>參數(shù)</b>昆侖大<b class='flag-5'>模型</b>

    小身板大能量:樹莓派玩轉(zhuǎn) Phi-2、Mistral 和 LLaVA 等AI大模型~

    你是否想過在自己的設(shè)備上運行自己的大型語言模型(LLMs)或視覺語言模型(VLMs)?你可能有過這樣的想法,但是想到要從頭開始設(shè)置、管理環(huán)
    的頭像 發(fā)表于 03-25 09:32 ?321次閱讀
    小身板大能量:樹莓派玩轉(zhuǎn) <b class='flag-5'>Phi-2</b>、Mistral 和 LLaVA 等AI大<b class='flag-5'>模型</b>~

    在算力魔方上本地部署Phi-4模型

    智能水平上的大飛躍。它不僅達(dá)到了之前只有Llama 3.1 405B模型才具備的智能水平,而且還超越了11月發(fā)布的GPT-4o模型。 本文我們將分享
    的頭像 發(fā)表于 01-15 11:05 ?398次閱讀
    在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

    微軟尋求在365 Copilot中引入非OpenAI模型

    擔(dān)心企業(yè)用戶在使用365 Copilot時面臨的成本和速度問題,因此正在尋求更多樣化的技術(shù)來源。盡管微軟與OpenAI之間有著緊密的合作關(guān)系,并允許微軟定制OpenAI的模型,但微軟
    的頭像 發(fā)表于 12-25 10:41 ?541次閱讀

    中國移動與中國石油發(fā)布700參數(shù)昆侖大模型

    近日,中國移動與中國石油在北京聯(lián)合舉辦了700參數(shù)昆侖大模型建設(shè)成果發(fā)布會,正式推出了這行業(yè)重量級的大
    的頭像 發(fā)表于 12-04 11:17 ?833次閱讀

    AMD發(fā)布10參數(shù)開源AI模型OLMo

    AMD公司近日宣布了項重大進(jìn)展,推出了首個完全開放的10參數(shù)語言模型系列——AMD OLMo。這舉措為開發(fā)者和研究人員提供了強大的AI
    的頭像 發(fā)表于 11-12 18:08 ?718次閱讀

    從零開始訓(xùn)練語言模型需要投資多少錢?

    ,前言 ? 在AI領(lǐng)域,訓(xùn)練大型語言模型(LLM)是
    的頭像 發(fā)表于 11-08 14:15 ?700次閱讀
    從零開始訓(xùn)練<b class='flag-5'>一</b><b class='flag-5'>個</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>需要投資多少錢?

    騰訊發(fā)布開源MoE大語言模型Hunyuan-Large

    的性能,標(biāo)志著騰訊在自然語言處理領(lǐng)域邁出了重要的步。 據(jù)了解,Hunyuan-Large的總參數(shù)量高達(dá)389B(即3890),這數(shù)字遠(yuǎn)
    的頭像 發(fā)表于 11-06 10:57 ?648次閱讀

    語言模型如何開發(fā)

    語言模型的開發(fā)是復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計、訓(xùn)練、微調(diào)和部署等多個階段。以下是對大
    的頭像 發(fā)表于 11-04 10:14 ?522次閱讀

    在英特爾酷睿Ultra7處理器上優(yōu)化和部署Phi-3-min模型

    2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三版本:mini(3.8B參數(shù))、small(7B
    的頭像 發(fā)表于 08-30 16:58 ?1200次閱讀
    在英特爾酷睿Ultra7處理器上優(yōu)化和部署<b class='flag-5'>Phi</b>-3-min<b class='flag-5'>模型</b>

    中國石油發(fā)布330參數(shù)昆侖大模型

    中國石油在近日于北京舉行的成果發(fā)布會上,震撼發(fā)布了擁有330參數(shù)的昆侖大模型,標(biāo)志著中國能源化工行業(yè)正式邁入大
    的頭像 發(fā)表于 08-29 18:10 ?1244次閱讀

    Hugging Face科技公司推出SmolLM系列語言模型

    7月22日最新資訊,Hugging Face科技公司在語言模型領(lǐng)域再創(chuàng)新高,正式推出了SmolLM系列——款專為適應(yīng)多樣計算資源而設(shè)計的緊湊型語言
    的頭像 發(fā)表于 07-23 16:35 ?602次閱讀

    谷歌Gemma 2語言模型升級發(fā)布,性能與安全性雙重飛躍

    近日,谷歌面向全球科研界與開發(fā)者群體隆重推出了全新升級的Gemma 2語言模型,標(biāo)志著人工智能技術(shù)在語言處理領(lǐng)域的又次重大進(jìn)步。此次
    的頭像 發(fā)表于 07-02 10:20 ?683次閱讀

    谷歌發(fā)布新型大語言模型Gemma 2

    在人工智能領(lǐng)域,大語言模型直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言
    的頭像 發(fā)表于 06-29 09:48 ?668次閱讀

    語言模型(LLM)快速理解

    自2022年,ChatGPT發(fā)布之后,大語言模型(LargeLanguageModel),簡稱LLM掀起了波狂潮。作為學(xué)習(xí)理解LLM的開始,先來整體理解
    的頭像 發(fā)表于 06-04 08:27 ?1662次閱讀
    大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>(LLM)快速理解