白山云科技正式發(fā)布“大模型API”產(chǎn)品,首發(fā)上線DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大語言模型。基于白山全球邊緣云架構(gòu)優(yōu)勢(shì),打造超低延時(shí)、超穩(wěn)定、簡單易用的API接口服務(wù),降低大模型應(yīng)用成本和開發(fā)門檻,助力企業(yè)和個(gè)人用戶快速開啟AI創(chuàng)新之旅。
專注邊緣推理,構(gòu)建“云邊端”算力協(xié)同新范式
隨著多模態(tài)交互、多輪會(huì)話、Agentic AI自主決策等復(fù)雜場(chǎng)景爆發(fā),傳統(tǒng)集中式數(shù)據(jù)中心的算力供給模式下,用戶面臨網(wǎng)絡(luò)時(shí)延的線性增長、算力成本的指數(shù)上升,更低延時(shí)、更優(yōu)成本的邊緣算力推理成為必需。邊緣推理通過分布式算力下沉與智能調(diào)度,能夠?yàn)楦邔?shí)時(shí)、高隱私、高性價(jià)比場(chǎng)景提供關(guān)鍵支撐,驅(qū)動(dòng)AI從集中式智能邁向“云-邊-端”全域協(xié)同智能。
聚焦邊緣推理場(chǎng)景,白山云基于全球1700+邊緣節(jié)點(diǎn)構(gòu)成的算力網(wǎng)絡(luò)基座,于今年3月推出“邊緣算力云平臺(tái)”并持續(xù)完善升級(jí),覆蓋從GPU算力資源到MaaS模型服務(wù)的一站式AI算力基礎(chǔ)設(shè)施,為用戶提供高性能、低成本的AI Infra解決方案。
·模型服務(wù):提供預(yù)構(gòu)建、開箱即用的LLM和多模態(tài)模型服務(wù)(陸續(xù)上線),只需一行代碼用戶即可完成模型切換與集成;基于邊緣節(jié)點(diǎn)的就近推理,為用戶帶來<300ms的超低延時(shí)推理體驗(yàn)。
·GPU算力服務(wù):包含GPU容器、彈性容器、裸金屬三大產(chǎn)品,靈活滿足客戶從專屬算力到輕量級(jí)彈性算力的不同選擇,為用戶高并發(fā)場(chǎng)景下的推理請(qǐng)求提供動(dòng)態(tài)擴(kuò)縮容+按需付費(fèi)的高性價(jià)比分布式異構(gòu)算力服務(wù)。
重構(gòu)“低延時(shí)、高穩(wěn)定、強(qiáng)安全”性能上限
1、服務(wù)網(wǎng)關(guān)全網(wǎng)調(diào)度技術(shù)
根據(jù)實(shí)時(shí)網(wǎng)絡(luò)狀況、節(jié)點(diǎn)負(fù)載和模型需求,將推理任務(wù)動(dòng)態(tài)分發(fā)至離用戶最近、最優(yōu)的邊緣節(jié)點(diǎn),用戶就近計(jì)算,推理響應(yīng)效率翻倍。
2、異構(gòu)算力彈性調(diào)度技術(shù)
結(jié)合全球虛擬網(wǎng)絡(luò)分層管理和區(qū)域自治能力,實(shí)現(xiàn)算力資源的多級(jí)彈性擴(kuò)縮容,支持百萬級(jí)并發(fā),推理實(shí)例啟動(dòng)時(shí)間縮短到5秒內(nèi)。
3、大文件加載優(yōu)化技術(shù)
利用多區(qū)域管理的分布式緩存,通過對(duì)大模型文件進(jìn)行數(shù)據(jù)集編排與親和性調(diào)度,大幅提升服務(wù)調(diào)度效率,模型文件全鏈路加載冷啟動(dòng)時(shí)長從10分鐘縮短到20秒。
4、算力服務(wù)單元推理優(yōu)化技術(shù)
在單節(jié)點(diǎn)上對(duì)推理任務(wù)進(jìn)行PD分離和并行計(jì)算,同時(shí)通過多卡多模型混跑,GPU利用率提升至56%,單節(jié)點(diǎn)模型推理效率提升2.04倍。
5、邊緣云原生安全技術(shù)
融合白山全球邊緣云平臺(tái)安全防護(hù)能力,基于安全網(wǎng)關(guān)、云WAF、抗D、零信任安全等安全產(chǎn)品與服務(wù),保障AI業(yè)務(wù)連續(xù)性與數(shù)據(jù)安全性。
白山云CEO霍濤表示:“大模型推理的實(shí)時(shí)性需求與成本壓力,正推動(dòng)邊緣算力從‘流量節(jié)點(diǎn)’向‘智能計(jì)算單元’進(jìn)化——這種深度融合正是下一代AI基礎(chǔ)設(shè)施的核心范式。白山云依托覆蓋全球60多個(gè)國家與地區(qū)、核心城市節(jié)點(diǎn)密度業(yè)界TOP 5的邊緣網(wǎng)絡(luò),正構(gòu)建‘日均萬億Token級(jí)推理處理’的邊緣智能平臺(tái)。我們正通過‘本地推理+云端協(xié)同’的混合架構(gòu),讓邊緣算力價(jià)值穿透工業(yè)質(zhì)檢、智能駕駛等20+垂直場(chǎng)景,切實(shí)破解企業(yè)智能化轉(zhuǎn)型中的‘實(shí)時(shí)性鴻溝’與‘算力成本墻’。”
-
API
+關(guān)注
關(guān)注
2文章
1609瀏覽量
64003 -
AI
+關(guān)注
關(guān)注
88文章
35093瀏覽量
279506 -
大模型
+關(guān)注
關(guān)注
2文章
3138瀏覽量
4059
發(fā)布評(píng)論請(qǐng)先 登錄
Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析
GAITC2025|張科:端云一體大模型推理應(yīng)用實(shí)戰(zhàn)
基于RAKsmart云服務(wù)器的AI大模型實(shí)時(shí)推理方案設(shè)計(jì)
中科馭數(shù)高性能網(wǎng)卡產(chǎn)品 成就DeepSeek推理模型網(wǎng)絡(luò)底座

適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開源庫加速并擴(kuò)展AI推理模型
AI大模型在汽車應(yīng)用中的推理、降本與可解釋性研究

Qwen大模型助力開發(fā)低成本AI推理方案
鯤云科技AI芯片CAISA 430成功適配DeepSeek R1模型

科大訊飛即將發(fā)布訊飛星火深度推理模型X1
阿里云發(fā)布開源多模態(tài)推理模型QVQ-72B-Preview
Amazon Bedrock推出多個(gè)新模型和全新強(qiáng)大的推理和數(shù)據(jù)處理功能

阿里云開源推理大模型QwQ
在設(shè)備上利用AI Edge Torch生成式API部署自定義大語言模型

評(píng)論