在人工智能的快速發(fā)展浪潮中,Kneron 始終緊跟最前沿的技術(shù),并不斷優(yōu)化自身的 AI 方案,以更強(qiáng)大的能力和更優(yōu)的性價(jià)比賦能各行各業(yè)。
如今,Kneron 取得了一個(gè)令人興奮的突破——借助 DeepSeek-R1 論文中提到的前沿訓(xùn)練技巧,Kneron 成功讓自研的 LLM 模型掌握了“思維鏈推理(Chain-of-Thought Reasoning)”和“自我反思(Reflection)”的能力,并已部署在 Kneo300 和 Kneo330 AI 一體機(jī)上,為企業(yè)提供更智能、更精準(zhǔn)的 AI 解決方案,Kneron智能決策系統(tǒng)已落地醫(yī)療金融等多個(gè)場(chǎng)景。
這意味著,Kneron 的 AI 不再僅僅是回答問(wèn)題或執(zhí)行任務(wù),而是能夠“思考”和“推理”,讓 AI 具備更強(qiáng)的邏輯推導(dǎo)能力,從而更好地理解復(fù)雜問(wèn)題,給出更可靠、更專業(yè)的答案。
Kneron 已經(jīng)在醫(yī)療、金融、企業(yè)客服等多個(gè)行業(yè)場(chǎng)景中成功應(yīng)用了這一創(chuàng)新技術(shù),幫助客戶實(shí)現(xiàn)更高效的 AI 賦能。
什么是“思維鏈推理”和“自我反思”?
在傳統(tǒng)的 AI 對(duì)話系統(tǒng)中,模型往往直接給出答案,但很多時(shí)候,這些答案缺乏邏輯推導(dǎo),容易出現(xiàn)前后矛盾或不夠嚴(yán)謹(jǐn)?shù)那闆r。而 “思維鏈推理” 讓 AI 學(xué)會(huì)像人類一樣,逐步拆解問(wèn)題,形成清晰的推理步驟,避免“拍腦袋”式的回答。
更重要的是,Kneron 的 AI 還具備了“自我反思(Reflection)”能力--在回答復(fù)雜問(wèn)題時(shí),它可以回顧自己的推理過(guò)程,檢查是否有邏輯錯(cuò)誤,并在發(fā)現(xiàn)問(wèn)題后主動(dòng)調(diào)整答案。這種能力在數(shù)學(xué)計(jì)算、金融分析、醫(yī)學(xué)診斷等領(lǐng)域尤其重要,因?yàn)檫@些場(chǎng)景需要 AI 不僅提供答案,還要保證答案的正確性和推理過(guò)程的嚴(yán)謹(jǐn)性。
經(jīng)訓(xùn)練提升后, KneronLLM-R1 可以有一個(gè)推理思考的過(guò)程,可以通過(guò)思考輸出更正確的答案。
突破創(chuàng)新:Kneron 如何做到的?
這次突破的核心在于 Kneron 采用了 DeepSeek-R1 論文中提出的強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)和蒸餾(Distillation)等技術(shù),使 AI 在訓(xùn)練過(guò)程中逐步學(xué)會(huì)推理和反思。其關(guān)鍵步驟包括:
1.高質(zhì)量數(shù)據(jù)整理與冷啟動(dòng)訓(xùn)練
參考 DeepSeek-R1 的方法,Kneron 通過(guò)構(gòu)建高質(zhì)量的思維鏈(Chain-of-Thought, CoT)數(shù)據(jù),精心篩選多輪推理示例,進(jìn)行冷啟動(dòng)訓(xùn)練。這一階段提高了模型的可讀性和穩(wěn)定性,使 AI 具備基本推理能力。
2.拒絕采樣 + 蒸餾
Kneron 采用拒絕采樣(Rejection Sampling),篩選出最優(yōu)推理路徑,并結(jié)合知識(shí)蒸餾(Knowledge Distillation),將Deepseek-r1及o1等大模型的推理能力遷移到輕量級(jí)模型,使 Kneron AI 既具備強(qiáng)大的推理能力,又能在 Kneo300 和 Kneo330 上高效運(yùn)行。
3.強(qiáng)化學(xué)習(xí)優(yōu)化推理能力
訓(xùn)練后期,Kneron 采用類似于 DeepSeek-R1 的強(qiáng)化學(xué)習(xí)策略,在訓(xùn)練過(guò)程中讓 AI 通過(guò)自對(duì)比和獎(jiǎng)勵(lì)機(jī)制學(xué)習(xí)最佳推理路徑。模型會(huì)生成多個(gè)不同的推理鏈,并根據(jù)準(zhǔn)確性和邏輯一致性進(jìn)行優(yōu)化。
4.語(yǔ)言一致性與長(zhǎng)文本優(yōu)化
由于 AI 需要適應(yīng)不同場(chǎng)景,Kneron 還借鑒 DeepSeek-R1 在語(yǔ)言優(yōu)化方面的方法,引入語(yǔ)言一致性獎(jiǎng)勵(lì),確保模型在復(fù)雜推理過(guò)程中保持邏輯清晰,避免回答混亂或前后矛盾。
最終,耐能成功將這一增強(qiáng)版 AI 部署在 Kneo300 和 Kneo330 AI 一體機(jī) 上,讓更多企業(yè)和開(kāi)發(fā)者可以直接使用具備推理能力的 AI,為他們的業(yè)務(wù)賦能。
更智能的 AI,如何助力行業(yè)升級(jí)?
這項(xiàng)技術(shù)的突破,正在幫助多個(gè)行業(yè)實(shí)現(xiàn) AI 賦能,耐能已經(jīng)在以下場(chǎng)景中實(shí)現(xiàn)落地應(yīng)用:
1. 醫(yī)療問(wèn)卷 AI 助手
在醫(yī)療行業(yè),醫(yī)生和醫(yī)院需要收集大量的患者信息,進(jìn)行健康評(píng)估。Kneron 的 AI 可在問(wèn)卷填寫(xiě)過(guò)程中進(jìn)行推理,根據(jù)患者的回答動(dòng)態(tài)調(diào)整問(wèn)題,并分析可能的健康風(fēng)險(xiǎn),提高診斷效率。
2.金融衍生品定價(jià) AI
金融衍生品定價(jià)涉及復(fù)雜數(shù)學(xué)計(jì)算和市場(chǎng)分析。Kneron AI 結(jié)合“思維鏈推理”技術(shù),精準(zhǔn)解析結(jié)構(gòu)與條款,融合金融數(shù)學(xué)模型,智能推導(dǎo)定價(jià)策略,為金融機(jī)構(gòu)提供高效、精準(zhǔn)的投資優(yōu)化與風(fēng)險(xiǎn)管控方案。
3. 金融數(shù)據(jù)分析助手
金融行業(yè)的數(shù)據(jù)繁多且復(fù)雜,傳統(tǒng)的 AI 只能提供簡(jiǎn)單的報(bào)表分析,而 Kneron 的 AI 能夠基于數(shù)據(jù)推理找出數(shù)據(jù)中的異常,幫助財(cái)務(wù)人員和分析師做出更高維度的分析。
4. 企業(yè)資料智能客服
許多企業(yè)客服需要處理大量的內(nèi)部文檔和客戶問(wèn)題,Kneron AI 可自動(dòng)讀取、理解企業(yè)文檔,并提供準(zhǔn)確的回答,降低企業(yè)客服成本,同時(shí)提升客戶體驗(yàn)。
5. 會(huì)議紀(jì)要 AI 助手
Kneron AI 可幫助企業(yè)自動(dòng)生成高質(zhì)量的會(huì)議紀(jì)要,不僅記錄內(nèi)容,還能分析會(huì)議重點(diǎn),提煉核心觀點(diǎn),幫助企業(yè)提升會(huì)議效率。
為什么選擇耐能?
這次技術(shù)升級(jí),充分展現(xiàn)了耐能在AI領(lǐng)域的創(chuàng)新能力和技術(shù)實(shí)力。耐能不僅能緊跟前沿技術(shù)趨勢(shì),還能將這些技術(shù)快速落地,為客戶提供極具性價(jià)比的軟硬一體 AI 解決方案。
Kneron AI 的核心優(yōu)勢(shì):
軟硬一體,性能更優(yōu):AI 直接運(yùn)行在 Kneo300 和 Kneo330 上,速度更快,成本更低,無(wú)需依賴云端計(jì)算,實(shí)現(xiàn)軟硬件深度協(xié)同優(yōu)化,顯著優(yōu)化部署成本與提高隱私安全指標(biāo)。
推理更強(qiáng),結(jié)果更精準(zhǔn):認(rèn)知推理能力突破,具備“思維鏈推理”和“自我反思”能力,在自然語(yǔ)言處理、復(fù)雜決策支持等場(chǎng)景提供更具邏輯性答案。
應(yīng)用靈活,行業(yè)適配廣:已落地醫(yī)療、金融、企業(yè)客服等多個(gè)場(chǎng)景,助力各行業(yè)智能升級(jí)。
在 AI 時(shí)代,擁有強(qiáng)大的推理能力意味著 AI 不僅能“回答問(wèn)題”,還能“思考問(wèn)題”。Kneron 的這一突破,為行業(yè)提供了一種全新的 AI 解決方案,幫助企業(yè)更高效地利用 AI,創(chuàng)造更大的價(jià)值。
-
AI
+關(guān)注
關(guān)注
88文章
35093瀏覽量
279525 -
模型
+關(guān)注
關(guān)注
1文章
3517瀏覽量
50404 -
耐能
+關(guān)注
關(guān)注
0文章
35瀏覽量
10923 -
DeepSeek
+關(guān)注
關(guān)注
1文章
797瀏覽量
1731
原文標(biāo)題:突破性融合DeepSeek-R1訓(xùn)練框架!Kneron AI實(shí)現(xiàn)行業(yè)芯片級(jí)思維鏈推理
文章出處:【微信號(hào):KneronChina,微信公眾號(hào):Kneron耐能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署

如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

在英特爾哪吒開(kāi)發(fā)套件上部署DeepSeek-R1的實(shí)現(xiàn)方式

RK3588開(kāi)發(fā)板上部署DeepSeek-R1大模型的完整指南
行芯完成DeepSeek-R1大模型本地化部署
添越智創(chuàng)基于 RK3588 開(kāi)發(fā)板部署測(cè)試 DeepSeek 模型全攻略
了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇
超星未來(lái)驚蟄R1芯片適配DeepSeek-R1模型
Deepseek R1大模型離線部署教程

廣和通支持DeepSeek-R1蒸餾模型
AIBOX 全系產(chǎn)品已適配 DeepSeek-R1

deepin UOS AI接入DeepSeek-R1模型
芯動(dòng)力神速適配DeepSeek-R1大模型,AI芯片設(shè)計(jì)邁入“快車道”!

評(píng)論