微軟研究院近期公開發布了Phi-3系列AI模型,該系列包括mini版(38億參數)、small版(70億參數)以及medium版(140億參數)。
微軟稱,帶有38億參數的phi-3-mini經過3.3萬億token的強化學習,其基礎表現已經超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機等移動設備上運行,并在phi-2模型(27億參數)的基礎上,進一步融合了嚴格篩選的網絡數據與合成數據。
盡管phi-3-mini在語言理解和推理方面已能匹敵大參數模型,但在TriviaQA等特定任務中仍受限于模型規模。
值得注意的是,phi-3-small和phi-3-medium兩款模型在MMLU測試中的得分分別達到了75.3和78.2。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6678瀏覽量
105564 -
移動設備
+關注
關注
0文章
515瀏覽量
55169 -
強化學習
+關注
關注
4文章
269瀏覽量
11553
發布評論請先 登錄
相關推薦
熱點推薦
從性能到商業,Grok3、GPT-4o、DeepSeek如何重塑AI版圖?
2025年2月,AI領域仿佛上演了一場激烈的“諸神之戰”,馬斯克旗下xAI發布的Grok3、OpenAI推出的GPT-4o以及持續憑借R1模型

馬斯克發布Grok 3大模型,超越GPT-4o
近日,科技巨頭馬斯克宣布其最新研發的人工智能大模型——Grok 3正式發布。這一消息引起了業界的廣泛關注。 據馬斯克介紹,Grok 3在數學推理、科學邏輯推理以及代碼寫作等多項能力上均
OpenAI即將發布GPT-4.5與GPT-5
,GPT-4.5將在未來幾周內率先亮相,它將是OpenAI通用GPT-4模型的繼承者。這款新的算法在技術上進行了諸多優化和升級,旨在為用戶提供更加精準、高效的AI服務。 而在
OpenAI即將推出GPT-5模型
先進技術,其中包括備受矚目的o3工具。通過整合這些技術,GPT-5模型將實現更加強大的功能和性能。 值得一提的是,GPT-5
OpenAI將發布更智能GPT模型及AI智能體工具
OpenAI近日透露了其未來發展的重要動向。據OpenAI首席產品官凱文·維爾(Kevin Weil)介紹,公司計劃推出更智能的GPT o3模型,并首次亮相AI智能體工具,這將使Cha
字節跳動豆包大模型1.5 Pro發布
近日,字節跳動旗下的豆包大模型迎來了全新的升級——豆包大模型1.5 Pro正式發布。這款全新模型在知識、代碼、推理、中文等多個測評基準上表現出色,綜合得分優于
字節跳動發布豆包大模型1.5 Pro
3.5 Sonnet等模型。 該模型采用大規模稀疏MoE架構,使用較小的激活參數進行預訓練,卻能等效7倍激活參數的Dense模型性能,遠超
OpenAI報告GPT-4o及4o-mini模型性能下降,正緊急調查
近日,全球領先的AI研究機構OpenAI發布了一份事故報告,引起了業界的廣泛關注。報告中指出,OpenAI目前正面臨GPT-4o和4o-mini這兩款重要模型
Meta重磅發布Llama 3.3 70B:開源AI模型的新里程碑
新的高度。 一,技術突破:開源智能的新高度 Llama 3.3 70B 模型的發布,標志著開源AI模型在智能水平上的一大飛躍。它不僅達到了之前只有 Llama 3.1 405B

微軟發布Azure AI Foundry,推動云服務增長
。 Azure AI Foundry為用戶提供了一個更為便捷的平臺,使得在支持人工智能的大型語言模型之間切換變得輕松自如。這一創新工具的發布,無疑將極大地降低AI應用的開發門檻,進一步
深信服發布安全GPT4.0數據安全大模型
近日,深信服在數據安全領域邁出了重要一步,正式發布了安全GPT4.0數據安全大模型。這一創新的大模型技術,旨在為用戶提供更高效、精準的數據安全解決方案。
Llama 3 模型與其他AI工具對比
Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術架構、性能表現、應用場景、定制化能力、開源與成本等方面。以下是對Llama
在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型
2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個版本:mini(3.8B參數)、small(7B參數)以及medium(14B參數)。

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜
GPT-4. GPT-4o mini的定價為每百萬輸入標記15美分和每百萬輸出標記60美分,比之前的前沿模型便宜了一個數量級,比GPT-3.5 Turbo便宜了60%以上。

評論