電子發燒友網報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發者大會正式召開,從其發布的新品來看,這可以說是一場AI盛會。
在AI大模型方面,發布了Gemini 2.5 Pro、擴散語言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應用、圖像生成模型Imagen 4等。在硬件端,分別與三星、Xreal發布了Android XR頭顯、AR智能眼鏡等。在搜索端,發布了AI Mode搜索模式、Search Live等。
谷歌宣布新的Gemini訂閱計劃:AI Pro用戶定價月付19.99美元(折合人民幣約144元),就能夠使用Veo 2、Gemini 2.5 Pro等入門級產品;AI Ultra用戶定價月付249.99美元(折合人民幣約1804元),可一次性獲得Veo 3的無限訪問權限、使用Gemini 2.5 Pro深度思考模式等多項高級功能。
從軟件到應用,谷歌的AI生態已經越來越成熟,其AI大模型以及相應的服務也將越來越強大。
以Gemini 2.5 Pro為技術底座,谷歌開始反擊OpenAI
自上屆Google I/O開發者大會以來,谷歌已經宣布了十幾種模型的突破,并且發布了20多款AI產品和功能。自第一代Gemini模型發布以來,Gemini模型的Elo分數上升了300多分。此外,在AI代碼編輯器Cursor上,Gemini 2.5 Pro是今年增長最快的模型,能夠實現每分鐘產出數十萬行可接受的代碼。
谷歌DeepMind創始人兼CEO戴密斯·哈薩比斯表示,Gemini 2.5 Pro是谷歌有史以來最智能的模型,也是全球最強大的基礎模型。就在兩周前,谷歌發布了Gemini 2.5 Pro的預覽版,因此開發者可以立即使用并構建它,例如將草圖轉化為交互式應用程序、模擬3D城市等。
Gemini 2.5 Pro模型也已經接入LearnLM(專為學習場景微調的模型),提升了Gemini 2.5 Pro在學習場景的能力。
在大會上,谷歌還發布了Gemini 2.5 Flash的升級版。Gemini 2.5 Flash是一款輕量化AI大模型,具備速度更快、低成本的優勢。Gemini 2.5 Flash的升級版提升了推理、代碼和長上下文理解的能力,效率提升了 22%。Gemini 2.5 Flash將在6月初上市,Pro 版本也會緊隨其后。
Gemini 2.5 Pro 新增“思考預算”控件、更好的成本控制。Gemini 2.5 Pro和Gemini 2.5 Flash還支持原生音頻輸出,可以輕松地在24種不同語言之間切換,且能夠區分說話者背景聲音,建立更自然的對話體驗。在安全方面,谷歌表示,通過增強安全防護,Gemini 2.5 Pro和Gemini 2.5 Flash是谷歌迄今為止最安全的型號。
谷歌還發布了全新的模型:擴散語言模型Gemini Diffusion,其利用并行生成來實現極低的延遲,生成速度比Gemini 2.5 Flash還快5倍,編碼能力與之相當。
另外,谷歌一直在探索Gemini 思維、推理能力的前沿技術,基于使用 AlphaGo 的經驗,谷歌推出了Gemini 2.5 Pro "Deep Think"(深度思考模式)模型,采用了類AlphaGo的并行推理技術,能夠實現更加深入的思考,提升了Gemini 2.5 Pro 在學術與推理基準上應用體驗。在美國數學奧林匹克2025測試和Live Codebench編程測試取得領先的地位。
在過去十年,谷歌為現代AI時代奠定了很多技術基礎,從開創性推出Transformer等大模型架構支撐著所有大語言模型,到AlphaGo 和 Alphazero 等代理系統。谷歌也將持續加大基礎研究的廣度和深度,以實現通用AI所需的下一個突破。
谷歌與OpenAI的AI競爭,由于ChatGPT的出現,讓OpenAI反超谷歌一局,谷歌的搜索業務和AI產品都大受打擊。如今Gemini AI的重磅更新,是谷歌奪回技術和市場高地的關鍵。谷歌表示,Gemini AI已經是最好的基礎模型,但公司的目標是:努力拓展Gemini AI,使它成為“世界模型”。
谷歌在AI技術競賽中找回自己的節奏,選擇主動出擊、引領行業。除了Gemini AI,本次 I/O 大會的重磅:全新的AI搜索模式AI Mode。AI Mode模式也被認為是谷歌的一場“革命”,用AI機器人替代原來的搜索功能,將聊天機器人的對話能力嵌入搜索體驗中,支持繼續追問。該模式將在美國推出。
從技術路徑看,AI Mode模式以Gemini 2.5 Pro為底層模型,引入“查詢扇出(query fan-out)”技術,可跨子主題和多個數據源并行處理,再匯總成一段多模態長答復。技術路徑與DeepResearch相似。但也是谷歌試圖通過引入更先進的多模態數據處理能力、優化用戶體驗以及加強,反擊OpenAI的必要之舉。
當前,AI技術產業正在以超過預期的速度發展,不僅僅是谷歌和OpenAI。蘋果也在加速進入這個賽道,例如蘋果推出了Apple Intelligence。業內消息顯示蘋果也在推進AI技術的布局,未來或將允許第三方開發者使用其AI模型編寫軟件。這將成為蘋果推動新應用的開發,成為蘋果在推動AI領域趕超競爭對手的“底牌”。這一消息將在6月9日的全球開發者大會(WWDC)上有所答案。
“殺回”智能眼鏡戰場:Android XR發布、與生態伙伴聯手
除了大模型,谷歌此次Google I/O開發者大會的亮點還有“殺回”智能眼鏡行業。谷歌再次介紹了Android XR、Wear OS 6這兩大操作系統,并展示了兩款智能眼鏡產品。
谷歌在智能眼鏡項目上也有著超過10年的經驗,它不僅是這一領域的開拓者,也是不斷演進的見證者。從2015年的第一款智能眼鏡Google Glass(消費版)至今,谷歌在這個領域經歷了起起伏伏。谷歌并沒有放棄對智能眼鏡的追求。相反,它利用這段時間積累了豐富的經驗,并結合了最新的AI技術,以全新的視角重新審視這個市場。
一個有用的AI助手能夠讓你的生活更輕松,但是這種新形式能否讓你以新的方式體驗AI助手呢?谷歌表示,這正是我們推出Android XR的原因。
Android XR是谷歌聯合三星、高通打造的首個專為 Gemini 時代打造的 Android 平臺,支持不同形態的設備,包括VR頭顯、AR智能眼鏡等,包括支持VST(視頻透視)和OST(光學透視)在內的多樣化沉浸式設備。開發者可以基于Android XR定制自己的產品。
自去年發布Android XR開發者預覽版本以來,已有數百名開發者為該平臺進行開發,并且手機、平板電腦應用程序都可以運行。
在大會上,谷歌演示了基于Android XR的智能眼鏡功能,它支持實時翻譯、圖像記憶、地圖導航、拍照等功能。就在演示實時翻譯時,Gemini卡住,導致一副智能眼鏡的實時窗口死機。谷歌表示,“這是一個非常冒險的演示,但我們會嘗試一下。”這也說明,真正無縫銜接的AI虛擬世界還有一段距離,谷歌也在直面這個過程中的問題。
在大會上,谷歌介紹了兩款基于Android XR打造的AR設備,第一款是與三星合作的Project Moohan,這是一款谷歌眼鏡原型機,支持全彩顯示,能夠通過語音實現AI交互,搭載攝像頭能夠提供圖像識別功能。
谷歌宣布,公司與三星的合作關系將會提升至新的水平,將Android XR從頭顯拓展至智能眼鏡領域,雙方也已經在合作開發軟件和參考硬件平臺方面取得進展。
第二款是Project Aura,這是谷歌聯合XREAL共同推出的專為 Android XR 平臺打造的旗艦級 AR 眼鏡,Project Aura 基于 OST(光學透視)技術路線。這款產品的發布也標志著AR產業正式跨入“安卓時刻”。
Google副總裁、Android XR 負責人 Shahram Izadi介紹,表示,通過平臺開放性與 XREAL 在輕量化、便攜XR 硬件上的領先能力結合,我們正在推動空間體驗進入更直觀、更可及的 OST 時代,這是我們生態系統發展史上的重要時刻。
XREAL表示,此次聯合發布,集結了Google、XREAL與高通三方技術實力,形成覆蓋“平臺-硬件-芯片”的黃金鐵三角。
這一次,我們可以相信谷歌在經過多年的技術投入之后,不會輕易放棄AI智能眼鏡市場。從2025 Google I/O開發者大會可以看到,谷歌在智能眼鏡行業將不再是單打獨斗,包括與上游芯片企業合作、與下游智能眼鏡品牌合作。通過軟件、硬件賦能,加上谷歌在安卓 近數十億用戶基礎,谷歌正在擁抱一個更大的智能眼鏡生態。
谷歌認為人工智能的機遇是巨大的,而這取決于開發人員、技術建設者和解決方案商,以確保它能被更多人使用。
-
谷歌
+關注
關注
27文章
6223瀏覽量
107517 -
AI
+關注
關注
87文章
34173瀏覽量
275339
發布評論請先 登錄
評論