作者 / DeepMind 高級開發者關系經理 Joana Carrasqueira
今年的 Cloud Next 大會上,我們推出了一系列突破性更新與強大功能,旨在賦能廣大開發者,與大家攜手共創人工智能的未來。本次發布亮點包括:最新的 Gemini 2.5 思考模型,實時互動體驗的 Live API 的最新進展,以及正式面向開發者開放的高質量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發者推出了許多不容錯過的重要更新,一起來看看吧。
Gemini 2.5:構建新一代應用
我們近期推出了 Gemini 2.5 Pro,這是我們迄今為止性能最佳的 AI 模型,能展示出思考模型在生成響應之前進行推理的能力。作為我們迄今為止最先進的編碼模型,Gemini 2.5 Pro 能打造引人注目的 Web 應用,在開發智能體編程應用方面也表現出色。
Gemini 2.5 Pro 已經開始賦能在 Google AI Studio 中使用 Gemini API 構建應用的開發者,以及使用 Vertex AI 的企業客戶。
同時,我們宣布 Gemini 2.5 Flash 即將推出。作為我們熱門主力模型的演進版本,Gemini 2.5 Flash 在保持低延遲和高性價比的同時,融入了強大的思考能力。
這標志著我們朝著實現所有 Gemini 模型具備自適應思考能力這一愿景,邁出了重要一步。Gemini 2.5 模型為應用開發開辟了諸多全新的應用場景,包括支持更強大的智能體,管理多智能體系統,加速編碼輔助,以及利用高達 100 萬 token 的上下文輸入窗口,實現對整個代碼庫的生成式推理。
Veo 2 可用于生產環境
我們很高興地宣布,Gemini API 中的 Veo 2 現已正式面向生產環境開放使用。Veo 2 具備遵循簡單及復雜指令的能力,并能以豐富的視覺風格模擬真實世界的物理效果。Veo 2 使開發者能夠直接使用文本和圖像提示,在應用中生成高質量視頻內容:
文本到視頻 (t2v):通過文本描述生成視頻。
圖像到視頻 (i2v):從圖像生成視頻,并支持可選的文本提示,以實現更精準的指導。
以 Wolf Games 為例,該公司正在構建一個生成式游戲平臺,旨在創造高度個性化的互動敘事游戲體驗。借助 Veo 2,他們得以構建出極具動態表現力的電影級游戲場景,顯著提升了視頻的真實感、動作準確度和鏡頭控制。Wolf Games 表示,Veo 2 將其獲取理想視覺效果所需的迭代次數減少了 60% 以上,并大幅縮短了制作周期,從而加速了創意藍圖的實現。
即日起,您便可在 Google AI Studio 的 Gemini API 中使用 Veo 2:
質量:720p 分辨率,24 幀/秒。
時長:最長 8 秒的視頻片段。
定價:生成的視頻每秒 0.35 美元。
想立刻嘗試用視頻生成功能打造互動型應用嗎?敬請查閱我們的文檔、提示指南以及 Veo 2 入門教程。同時,歡迎了解 Vertex AI 在語音和音樂等其他模態的企業級生成媒體解決方案。
Gemini 模型 Live API:預覽版帶來全新功能
動態、實時的互動體驗對于構建下一代 AI 應用至關重要。Gemini 模型的 Live API 現已推出預覽版,旨在幫助開發者構建更強大、可擴展的應用,顯著提升速率限制。開發者現在即可通過 Google AI Studio 和 Vertex AI 中的 Gemini API 搶先體驗前沿功能。
使用 Live API 構建應用與智能體,開發者能輕松實現低延遲處理流式音頻、視頻和文本的能力,為創建如同真人般的對話、實時會議以及監控實時場景提供理想的解決方案。從 12 月推出實驗版以來,我們廣泛收集了開發者的反饋,并在此次公開試用版中引入了多項備受期待的功能:
支持 30 種全新語言并新增兩種語音選項。
支持可配置的語音活動檢測 (VAD),可更靈活地自定義 VAD 解決方案。
通過滑動上下文窗口實現近乎無限的會話時長。
以及更多增強功能。
這些功能以及強大的工具集成 (包括搜索、代碼執行和函數調用) 使 Live API 成為在高度互動型應用中使用 Gemini 2.0 Flash 等模型的理想選擇。
共創開發新紀元
我們對這些更新能如何挖掘開發者社區的巨大潛力感到無比振奮。從 Gemini 2.5 更為強大的思考能力,到通過 Live API 實現的實時互動,以及 Veo 2 突破性的視頻生成能力,我們熱切期待各位開發者能夠創造出令人矚目的創新成果!
-
Gemini
+關注
關注
0文章
64瀏覽量
7841 -
AI
+關注
關注
87文章
34171瀏覽量
275330 -
人工智能
+關注
關注
1804文章
48688瀏覽量
246405
原文標題:Gemini API 最新進展:Gemini 2.5 Flash & Pro、Live API、Veo 2
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
英特爾持續推進核心制程和先進封裝技術創新,分享最新進展

京東方華燦光電氮化鎵器件的最新進展
翱捷科技在5G領域的最新產品進展
垂直氮化鎵器件的最新進展和可靠性挑戰

Qorvo在手機RF和Wi-Fi 7技術上的最新進展及市場策略
FF將發布FX品牌最新進展

谷歌發布Gemini 2.0 AI模型
揭秘超以太網聯盟(UEC)1.0 規范最新進展(2024Q4)

Qorvo在射頻和電源管理領域的最新進展
芯片和封裝級互連技術的最新進展
高燃回顧|第三屆OpenHarmony技術大會精彩瞬間
5G新通話技術取得新進展
開發者申請Gemini 1.5 Pro API Key:輕松獲取Gemini 1.5 Pro模型API Key并開發部署AI應用

評論