當AI以破竹之勢席卷千行百業,大模型技術正以驚人的速度迭代演進,重塑著智能世界的底層邏輯。
作為全球AIoT行業的引領者,移遠通信通過持續迭代和探索,在端側大模型解決方案上完成“三級跳”——在多模態感知、架構創新、模型兼容性三大核心維度實現跨越式突破,不僅重新定義了終端設備的智能化邊界,更為AI普惠化落地開辟了全新路徑。近日,移遠基于SG885G AI 算力模組的端側大模型解決方案,已成功運行LLaVA-7B、RWKV7、Qwen3-4B等大模型。
感知維度升級:引領多模態交互新范式
在智能終端的世界里,單一的語音對話或圖像識別,已無法滿足復雜場景的需求,多模態感知才是未來趨勢。移遠通信敏銳捕捉行業發展脈絡,在感知維度上持續創新,打造出“超級感官系統”,并不斷取得技術及應用突破。
自端側大模型解決方案發布以來,移遠通信基于全語音鏈路的方案已在德壹機器人項目中順利落地,賦予機器人“能說會道”的本領,使其語音交互能力更加自然、流暢。
近日,移遠成功在其SG885G模組上部署7B參數多模態大模型LLaVA,讓移動端擁有“火眼金睛”,實現實時物體識別與場景理解,完成了感知維度的再次重大升級。這一突破,讓移遠成為業界首個提供端側全模態感知解決方案的模組廠商。
值得一提的是,移遠還通過架構級創新,實現了文本、語音、視覺三大模態的深度融合。這種融合并非簡單的功能疊加,而是從底層架構出發,讓不同模態的信息能夠相互補充、相互促進,形成更全面、更準確的認知能力,使得客戶終端能夠在復雜的實際場景中實現更智能、更高效的交互。
架構創新探索:開辟端側AI計算新維度
在Transformer架構主導大模型領域的當下,移遠通信以前瞻性的眼光,積極布局非Transformer的技術路線,致力于為客戶提供更低算力、更少內存消耗的解決方案。
日前,移遠SG885G模組已實現成功運行RWKV7模型。RWKV(Receptance Weighted Key-Value)是一種極具創新性的神經網絡架構,巧妙地融合了循環神經網絡(RNN)的訓練效率與Transformer的建模能力。其核心設計在于通過線性注意力機制取代傳統Transformer的自注意力,這一改進有效解決了長序列處理中的計算瓶頸問題,同時還支持高效推理與并行訓練,在計算效率和模型性能之間取得了良好的平衡。
RWKV架構在多語言處理、小說創作、長期記憶保持等多個領域表現出色,展現出了廣泛的應用前景。移遠通信成功將其部署在端側模組上,意味著對于算力和內存資源有限的“小身板”終端設備,也能擁有強大的AI“大心臟”。
模型生態擴容:構建端側大模型“超級平臺”
在模型兼容性方面,移遠通信構建了覆蓋主流開源模型的端側適配體系,打造出了功能強大的端側大模型“超級平臺”。從Llama到通義千問,再到DeepSeek,移遠率先完成了對主流開源模型的全方位兼容,覆蓋參數規模從0.5B到8B,為不同場景的智能終端提供了豐富的模型選擇。
例如,移遠通信在其SG885G AI算力模組上,成功實現Qwen3-4B模型的穩定運行,并對模型架構和運行環境進行深度優化。實測數據顯示,相比Qwen2.5,優化后的Qwen3-4B模型,其平均響應延遲降低了40%,交互體驗直線升級。
站在AI技術變革的潮頭,移遠通信始終堅信:未來的智能,不應局限于云端的數據中心,而應該廣泛存在于每個終端、每個場景、每個人的掌心。通過持續的技術深耕與生態共建,移遠通信正攜手合作伙伴,讓端側大模型成為智能時代的“新基建”,推動AI技術在更廣闊的領域實現普惠化應用。
-
人工智能
+關注
關注
1806文章
49007瀏覽量
249274 -
AIoT
+關注
關注
8文章
1504瀏覽量
32426 -
AI大模型
+關注
關注
0文章
374瀏覽量
608
發布評論請先 登錄
廣和通加速通義千問Qwen3在端側全面落地
壁仞科技完成Qwen3旗艦模型適配
Arm CPU適配通義千問Qwen3系列模型
后摩智能NPU適配通義千問Qwen3系列模型
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式

移遠通信AI玩具整體解決方案全面升級:融合火山引擎RTC大模型,打造實時交互新體驗

評論