作者 / Clement Farabet, VP of Research, Google DeepMind; Tris Warkentin, Director, Google DeepMind
Gemma 開放模型系列是 Google 推動(dòng)實(shí)用 AI 技術(shù)普惠大眾的重要基石。上個(gè)月,Gemma 迎來了首個(gè)生日。回望過去一年,其成果斐然:全球下載量突破 1 億,社區(qū)欣欣向榮,衍生模型超過 6 萬個(gè)1。Gemma 生態(tài)的蓬勃發(fā)展,不斷激發(fā)我們的創(chuàng)新熱情。
Gemma 生態(tài)
我們在全球推出 Gemma 3,一系列基于 Gemini 2.0 模型同源技術(shù)打造的輕量級、先進(jìn)開放模型。它們是 Google 迄今為止在性能、可移植性和社會(huì)責(zé)任方面表現(xiàn)最出色的開放模型。Gemma 3 專為設(shè)備端高效運(yùn)行而設(shè)計(jì),讓手機(jī)、筆記本或工作站都能輕松駕馭,助力開發(fā)者隨心打造 AI 應(yīng)用。Gemma 3 提供 1B、4B、12B 和 27B 等多種規(guī)格,適合不同的硬件和性能需求。
接下來,我們將深入剖析 Gemma 3 的強(qiáng)大之處,為你介紹全新的 ShieldGemma 2,并引導(dǎo)你融入日益壯大的 Gemma 生態(tài)。
Gemma 3 為開發(fā)者解鎖更多創(chuàng)新可能
領(lǐng)先的單加速器模型:Gemma 3 以小巧的體積,實(shí)現(xiàn)頂尖的性能。它超越了 Llama-405B、DeepSeek-V3 和 o3-mini,在 LMArena 的初步人類偏好評估中名列前茅,可助力你在單 GPU 或 TPU 環(huán)境下,打造令人驚艷的用戶體驗(yàn)。
140 種語言,全球暢行:打造能與你的用戶無礙溝通的應(yīng)用。Gemma 3 開箱即支持超過 35 種語言,并針對 140 多種語言進(jìn)行了預(yù)訓(xùn)練。
強(qiáng)大的文本和視覺推理能力:輕松打造能深度解析圖片、文本和短視頻的應(yīng)用,開啟智能交互的無限潛能。
更大上下文窗口,駕馭復(fù)雜任務(wù):Gemma 3 支持 128k token 的上下文窗口,助力你的應(yīng)用深度理解和處理大量信息。
支持函數(shù)調(diào)用,構(gòu)建智能 AI 工作流:Gemma 3 支持函數(shù)調(diào)用和結(jié)構(gòu)化輸出,助你實(shí)現(xiàn)任務(wù)自動(dòng)化,構(gòu)建智能 "代理"。
量化模型,更快實(shí)現(xiàn)卓越性能:Gemma 3 提供官方量化版本,在保證精度的前提下,有效降低模型體積和計(jì)算資源消耗。
此圖展示了多款 AI 模型在 Chatbot Arena Elo 評分體系中的排名,分?jǐn)?shù) (頂部數(shù)值) 越高,代表用戶偏好度越高。底部的圓點(diǎn)代表預(yù)估的 NVIDIA H1 00 GPU 需求量。Gemma 3 27B 模型表現(xiàn)優(yōu)異,僅需單個(gè) GPU 即可運(yùn)行,而其他模型最多需要 32 個(gè)。
若想深入了解這些強(qiáng)大功能背后的技術(shù)細(xì)節(jié),以及對我們所用的負(fù)責(zé)任開發(fā)方法的全面解讀,請參閱 Gemma 3 技術(shù)報(bào)告。
以嚴(yán)格的安全規(guī)范,負(fù)責(zé)任地打造 Gemma 3
我們堅(jiān)信,開放模型必須經(jīng)過嚴(yán)密的風(fēng)險(xiǎn)評估。我們的策略是在創(chuàng)新與安全之間取得平衡,并依據(jù)模型性能調(diào)整測試力度。Gemma 3 的研發(fā)過程融入了完善的數(shù)據(jù)治理,通過精細(xì)調(diào)校和嚴(yán)謹(jǐn)?shù)幕鶞?zhǔn)測試,確保其與我們的安全準(zhǔn)則高度契合。盡管對更強(qiáng)大模型的深入測試,往往能為我們評估較弱模型提供參考,但鑒于 Gemma 3 在 STEM 領(lǐng)域的顯著提升,我們特別針對其在有害內(nèi)容生成方面的潛在濫用風(fēng)險(xiǎn),進(jìn)行了專項(xiàng)評估。結(jié)果顯示,該風(fēng)險(xiǎn)處于較低水平。
隨著業(yè)界不斷涌現(xiàn)更強(qiáng)大的模型,我們亟需共同探索與風(fēng)險(xiǎn)相匹配的安全策略。我們將持續(xù)學(xué)習(xí),并不斷優(yōu)化開放模型的安全實(shí)踐。
ShieldGemma 2:圖像應(yīng)用的內(nèi)置安全屏障
在 Gemma 3 發(fā)布之際,我們還同步推出了 ShieldGemma 2,一款基于 Gemma 3 架構(gòu)的強(qiáng)大 4B 圖像安全檢測工具。ShieldGemma 2 提供開箱即用的圖像安全解決方案,針對危險(xiǎn)內(nèi)容、色情內(nèi)容和暴力內(nèi)容三大類別,輸出安全標(biāo)簽。開發(fā)者可根據(jù)自身需求和用戶偏好,對 ShieldGemma 進(jìn)行深度定制。ShieldGemma 2 秉承開放理念,賦予開發(fā)者充分的靈活性和掌控力,并依托 Gemma 3 架構(gòu)的高效性能,推動(dòng)負(fù)責(zé)任的 AI 開發(fā)。
與你熟悉的工具無縫集成
Gemma 3 和 ShieldGemma 2 能夠無縫集成到你現(xiàn)有的工作流程中:
使用喜愛的工具進(jìn)行開發(fā):Gemma 3 和 ShieldGemma 2 全面支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch、Google AI Edge、UnSloth、vLLM 和 Gemma.cpp,讓你隨心選擇最適合項(xiàng)目需求的開發(fā)工具。
秒速上手,即刻開始試驗(yàn):立即體驗(yàn) Gemma 3,開啟開發(fā)進(jìn)程。你可以在 Google AI Studio 中盡情探索其強(qiáng)大功能,或通過 Kaggle 或 Hugging Face 下載模型。
個(gè)性定制,滿足獨(dú)特需求:Gemma 3 的代碼庫重構(gòu)升級,提供高效微調(diào)和推理的實(shí)用方案。你可以在 Google Colab、Vertex AI,甚至游戲顯卡等你偏好的平臺(tái)上,對模型進(jìn)行訓(xùn)練和適配。
靈活部署,方案隨心選擇:Gemma 3 支持多種部署方式,涵蓋 Vertex AI、Cloud Run、Google GenAI API、本地環(huán)境及其他平臺(tái),讓你根據(jù)應(yīng)用和架構(gòu)需求,自由選擇最佳部署方案。
NVIDIA GPU 優(yōu)化,盡享卓越性能:NVIDIA 直接對 Gemma 3 模型進(jìn)行了深度優(yōu)化,確保你在從 Jetson Nano 到最新 Blackwell 芯片的各類 GPU 上,都能獲得最佳性能。
Gemma 3 現(xiàn)已入駐 NVIDIA API Catalog,只需一次 API 調(diào)用,即可快速構(gòu)建原型。
跨越多種硬件平臺(tái),加速 AI 開發(fā)進(jìn)程:Gemma 3 不僅針對 Google Cloud TPU 做了深度優(yōu)化,還通過開源 ROCm 堆棧與 AMD GPU 實(shí)現(xiàn)了集成。對于 CPU 環(huán)境,Gemma.cpp 提供了直接高效的解決方案。
模型與工具構(gòu)筑的 "Gemma 宇宙"
Gemma 生態(tài)是一個(gè)由社區(qū)共建的龐大體系,匯聚了眾多 Gemma 模型與工具,為創(chuàng)新提供源源不斷的動(dòng)力。例如,AI Singapore 的 SEA-LION v3 致力于消除語言隔閡,促進(jìn)東南亞地區(qū)的交流;INSAIT 的 BgGPT 是首款以保加利亞語為核心的大語言模型,充分展現(xiàn)了 Gemma 卓越的多語言能力;Nexa AI 的 OmniAudio 則揭示了設(shè)備端 AI 的無限潛力,將先進(jìn)的音頻處理能力帶入人們的日常生活。
為助力學(xué)術(shù)研究的創(chuàng)新突破,我們正式啟動(dòng)了 Gemma 3 學(xué)術(shù)計(jì)劃。學(xué)術(shù)研究人員可申請價(jià)值 1 萬美元的 Google Cloud 抵用金,加速基于 Gemma 3 的研究進(jìn)程。申請通道即日開啟,持續(xù)四周。歡迎訪問我們的網(wǎng)站提交申請。
即刻開啟 Gemma 3 探索之旅
秉承我們對普及優(yōu)質(zhì) AI 的不懈追求,Gemma 3 應(yīng)運(yùn)而生,開啟全新篇章。準(zhǔn)備好探索 Gemma 3 的強(qiáng)大功能了嗎?請參考以下入門指南:
去上手探索
通過 Google AI Studio,無需任何設(shè)置,即可在瀏覽器中直接體驗(yàn)全精度的 Gemma 3。
在 Google AI Studio 中獲取 API 密鑰,然后通過 Google GenAI SDK 輕松調(diào)用 Gemma 3。
https://ai.google.dev/gemini-api/docs/sdks
定制和開發(fā)
從 Hugging Face、Ollama 或 Kaggle 下載 Gemma 3 模型。
利用 Hugging Face 的 Transformers 庫,或使用你偏好的開發(fā)環(huán)境,輕松對模型進(jìn)行微調(diào)和適配,使其滿足你的獨(dú)特需求。
部署和拓展
利用 Vertex AI,將你的 Gemma 3 定制成果大規(guī)模推向商業(yè)應(yīng)用。
使用 Ollama,在 Cloud Run 上進(jìn)行推理運(yùn)算。
通過 NVIDIA API Catalog 上手使用 NVIDIA NIM 推理微服務(wù)。
-
Google
+關(guān)注
關(guān)注
5文章
1787瀏覽量
58671 -
AI
+關(guān)注
關(guān)注
87文章
34197瀏覽量
275345 -
模型
+關(guān)注
關(guān)注
1文章
3486瀏覽量
49989
原文標(biāo)題:Gemma 3 發(fā)布:巔峰性能,單 GPU/TPU 即可運(yùn)行
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Gemini API集成Google圖像生成模型Imagen 3
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
Google Gemma 3開發(fā)者指南

Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
在龍芯3a6000上部署DeepSeek 和 Gemma2大模型
定制本地的ChatFile的AI問答系統(tǒng)

Google兩款先進(jìn)生成式AI模型登陸Vertex AI平臺(tái)
Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界
Google AI Edge Torch的特性詳解

谷歌推出效率與性能躍階的全新開放模型標(biāo)準(zhǔn)

Google Gemma 2模型的部署和Fine-Tune演示

評論