近日,AI創新先鋒Zyphra公司在科技界投下了一顆震撼彈,正式揭曉其最新力作——Zamba2-mini 1.2B模型。這款被譽為端側SOTA(State-Of-The-Art)級別的小語言模型,以其卓越的性能參數和極致的壓縮效率,成為了業界關注的焦點。
Zamba2-mini 1.2B攜帶著驚人的12億參數量,卻能在嚴苛的4bit量化條件下,將內存占用控制在驚人的700MB以下,這一成就無疑是對AI模型輕量化探索的一次重大突破。其背后,是Zyphra團隊對模型架構的深度優化與大膽創新,成功融合了多種神經網絡設計的精髓,既保留了大型密集變壓器模型的高質量輸出特性,又實現了小模型難以企及的計算與內存效率。
Zamba2-mini 1.2B的問世,不僅為端側設備提供了更為強大的智能支持,更預示著AI技術在實際應用場景中的廣泛落地與深度融合。隨著這一技術的不斷成熟與普及,我們有理由相信,未來的端側AI將更加智能、高效,為人們的生活帶來更多便利與驚喜。
-
變壓器
+關注
關注
162文章
7786瀏覽量
139404 -
AI
+關注
關注
88文章
35109瀏覽量
279596 -
模型
+關注
關注
1文章
3519瀏覽量
50411
發布評論請先 登錄
在MAC mini4上安裝Ollama、Chatbox及模型交互指南

壁仞科技推出阿里QWQ-32B大模型一體機

OpenAI o3-mini模型思維鏈遭質疑
OpenAI或將推出o3 mini推理AI模型
OpenAI即將推出o3 mini推理AI模型
OpenAI即將推出o3-mini,降低高級推理門檻
圖森未來發布“Ruyi”視頻大模型,Ruyi-Mini-7B版本現已開源
Meta推出Llama 3.3 70B,AI大模型競爭白熱化
阿里國際推出全球首個B2B AI搜索引擎Accio
PerfXCloud重磅升級 阿里開源最強視覺語言模型Qwen2-VL-7B強勢上線!

英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型
馬斯克旗下xAI對Grok-2-mini進行速度升級
OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

評論