女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

愛芯通元NPU完成Llama 3和Phi-3大模型適配,推動AI大模型技術普及

愛芯元智AXERA ? 來源:愛芯元智AXERA ? 2024-04-26 16:57 ? 次閱讀

背景

AI大模型技術的持續進步正在推動千行百業智能化升級。近日,Meta、Microsoft相繼發布具有里程碑意義的Llama 3系列和Phi-3系列模型,其中Llama 3包括8B、70B兩種規格,Phi-3包括mini(3.8B)、small(7B)、medium(14B)三種規格。為了進一步給開發者提供更多嘗鮮,愛芯元智的NPU工具鏈團隊迅速響應,已基于AX650N平臺完成 Llama 3 8B和Phi-3-mini模型適配。

Llama 3

上周五,Meta發布了Meta Llama 3系列語言模型(LLM),具體包括一個8B模型和一個70B模型在測試基準中,Llama 3模型的表現相當出色,在實用性和安全性評估中,與那些市面上流行的閉源模型不相上下。

ef8a8238-03a9-11ef-a297-92fbcf53809c.png

在架構層面,Llama 3選擇了標準的僅解碼(decoder-only)式Transformer架構,采用包含128K token詞匯表的分詞器。Llama 3使用了超過15T的公開數據進行訓練,其中5%為非英文數據,涵蓋30多種語言,訓練數據量是前代Llama 2的七倍。

根據Meta的測試結果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多項性能基準上均超過了Gemma 7B和Mistral 7B Instruct,70B模型則超越了名聲在外的閉源模型Claude 3的中間版本Sonnet,和谷歌的Gemini Pro 1.5相比三勝兩負。

efa71060-03a9-11ef-a297-92fbcf53809c.png

實際上板結果

目前AX650N已經完成了Llama 3 8B Int8版本的適配,若采用Int4量化,每秒token數還能再翻一倍,能滿足正常的人機交流。

Phi-3

Llama 3剛發布沒多久,競爭對手就來了,而且是可以在手機上運行的小體量模型。

本周二,微軟發布了自研小尺寸模型Phi-3。盡管Phi-3-mini被優化至可部署在手機上,但它的性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。微軟表示,該創新主要在于用了質量更好的訓練數據集。

efcbd13e-03a9-11ef-a297-92fbcf53809c.jpg

efe2ec48-03a9-11ef-a297-92fbcf53809c.png

實際上板結果

目前AX650N已經完成了Phi-3-mini Int8版本的適配,已能滿足正常的人機交流。

其他成果

AX650N能第一時間完成Llama 3和Phi-3的適配,源于今年以來相關團隊悄悄完成了現有NPU工具鏈針對大語言模型的支持和調優。目前除了Llama 3之外,已經完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等國內外主流的開源大語言模型適配。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NPU
    NPU
    +關注

    關注

    2

    文章

    319

    瀏覽量

    19510
  • 愛芯元智
    +關注

    關注

    1

    文章

    99

    瀏覽量

    5055
  • LLM
    LLM
    +關注

    關注

    1

    文章

    319

    瀏覽量

    680
  • AI大模型
    +關注

    關注

    0

    文章

    364

    瀏覽量

    502

原文標題:愛芯通元NPU完成Llama 3和Phi-3大模型適配,推動AI大模型技術應用普及

文章出處:【微信號:愛芯元智AXERA,微信公眾號:愛芯元智AXERA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型
    的頭像 發表于 05-16 16:23 ?265次閱讀

    后摩智能NPU適配通義千問Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時不到1天,后摩智能自研NPU迅速實現Qwen3 系列模型(Qwen
    的頭像 發表于 05-07 16:46 ?349次閱讀

    NPU適配Qwen2.5-VL-3B視覺多模態大模型

    熟悉NPU的網友很清楚,從去年開始我們在端側多模態大模型適配上一直處于主動緊跟的節奏。先
    的頭像 發表于 04-21 10:56 ?1146次閱讀
    <b class='flag-5'>愛</b><b class='flag-5'>芯</b>通<b class='flag-5'>元</b><b class='flag-5'>NPU</b><b class='flag-5'>適配</b>Qwen2.5-VL-<b class='flag-5'>3</b>B視覺多模態大<b class='flag-5'>模型</b>

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    AI的演進正在逼近“終端智能涌現”的拐點,從通用模型向場景落地遷移成為關鍵議題。聯發科以“AI,應用無界”為主題召開天璣開發者大會2025(MDDC 2025),不僅聚合了全球生態
    發表于 04-13 19:52

    添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略

    能精準理解自然語言,生成高質量文本,還免費向全球開發者開放,極大地推動AI 技術普及與應用,為無數開發者打開了全新的探索大門。今天,我們就一起深入探討如何在 RK3588 開發板
    發表于 02-14 17:42

    天數智加速DeepSeek全系列模型適配

    R1-Distill-Qwen系列模型,包括1.5B、7B、14B和32B等不同參數版本,以及DeepSeek R1-Distill-Llama系列的8B和70B版本,均已完成適配
    的頭像 發表于 02-10 15:30 ?826次閱讀

    在算力魔方上本地部署Phi-4模型

    ?作者:算力魔方創始人/英特爾邊緣計算創新大使 劉力 前面我們分享了《Meta重磅發布Llama 3.3 70B:開源AI模型的新里程碑》,Llama 3.3 70B
    的頭像 發表于 01-15 11:05 ?409次閱讀
    在算力魔方上本地部署<b class='flag-5'>Phi</b>-4<b class='flag-5'>模型</b>

    Llama 3 與開源AI模型的關系

    在人工智能(AI)的快速發展中,開源AI模型扮演著越來越重要的角色。它們不僅推動技術的創新,還促進了全球開發者社區的合作。
    的頭像 發表于 10-27 14:42 ?686次閱讀

    Llama 3 模型與其他AI工具對比

    Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術架構、性能表現、應用場景、定制化能力、開源與成本等方面。以下是對
    的頭像 發表于 10-27 14:37 ?945次閱讀

    Llama 3 模型訓練技巧

    Llama 3 模型,假設是指一個先進的人工智能模型,可能是一個虛構的或者是一個特定領域的術語。 1. 數據預處理 數據是任何機器學習模型
    的頭像 發表于 10-27 14:24 ?793次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術的飛速發展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業帶來革命性的變化。在這場技術競賽中,Llama
    的頭像 發表于 10-27 14:17 ?1038次閱讀

    Llama 3 語言模型應用

    在人工智能領域,語言模型的發展一直是研究的熱點。隨著技術的不斷進步,我們見證了從簡單的關鍵詞匹配到復雜的上下文理解的轉變。 一、Llama 3 語言
    的頭像 發表于 10-27 14:15 ?657次閱讀

    英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型

    速度比原70B大模型提升2.2倍,具備更準確和更高效的運算效率;能夠大幅降低運行成本。 ? ? ? 通過NAS技術微調;大幅降低了內存消耗、計算復雜性;Llama-3.1-Nemotron-51B
    的頭像 發表于 09-26 17:30 ?835次閱讀

    在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型

    2024年4月23日,微軟研究院公布Phi-3系列AI模型,包含三個版本:mini(3.8B參數)、small(7B參數)以及medium(14B參數)。phi-3-mini是一個擁
    的頭像 發表于 08-30 16:58 ?1204次閱讀
    在英特爾酷睿Ultra7處理器上優化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

    NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企業和各國現在能夠使用自有數據與 Llama 3.1 405B 和 NVIDIA Nemotron 模型配對,來構建“超級模型” NVIDIA
    發表于 07-24 09:39 ?863次閱讀
    NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業打造自定義 <b class='flag-5'>Llama</b> 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>