女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探討全球首個(gè)數(shù)據(jù)流AI芯片的背后

我快閉嘴 ? 來源:半導(dǎo)體行業(yè)觀察 ? 作者:半導(dǎo)體行業(yè)觀察 ? 2020-09-24 17:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在先進(jìn)工藝和架構(gòu)的協(xié)同下,芯片的性能在過去幾年獲得了爆發(fā)性的增長,尤其是在最近幾年火熱的人工智能行業(yè),這個(gè)取得的成就是有目共睹的。

據(jù)OpenAI在2018年年中發(fā)表的報(bào)告,自 2012 年以來,人工智能訓(xùn)練任務(wù)中使用的算力正呈指數(shù)級(jí)增長。人們對(duì)于算力的需求增長也超過 300,000 倍。作為對(duì)比,如果是以摩爾定律的速度,這個(gè)數(shù)字只會(huì)是12倍的增長。在他們看來,正是這些硬件性能的跨越式突破,才成就了現(xiàn)在的AI產(chǎn)業(yè)。

自2012年以來,AI對(duì)算力的要求(source:OpenAI)

Open AI的報(bào)告進(jìn)一步指出,成本考量和物理學(xué)特性等因素將會(huì)壓制傳統(tǒng)AI硬件性能的上升勢(shì)頭。但市場(chǎng)對(duì)AI算力的需求仍然處于增長期,為此探索新的硬件方案成為了AI芯片供應(yīng)商亟待解決的問題。不少廠商也都另辟蹊徑從多個(gè)方向解決廣為人知的“馮諾依曼瓶頸”。

在鯤云信息科技有限公司創(chuàng)始人牛昕宇博士(以下簡(jiǎn)稱牛博士)看來,一個(gè)不同于過往的新架構(gòu),是解決當(dāng)前AI問題的正確之選。他同時(shí)也指出,目前的AI芯片行業(yè),需要變革的不僅僅是架構(gòu)。

亟待變革的AI芯片架構(gòu)

對(duì)AI芯片行業(yè)有所了解的讀者都應(yīng)該知道,現(xiàn)在統(tǒng)治人工智能芯片市場(chǎng)的廠商主要是英偉達(dá),依靠GPU優(yōu)秀的并行計(jì)算能力和CUDA生態(tài),這家本來只是做顯卡的廠商在人工智能時(shí)代大放異彩。

除了英偉達(dá)之外,擁有龐大部署量的英特爾至強(qiáng)處理器和聲名在外的谷歌TPU和特斯拉FSD也是AI芯片市場(chǎng)一個(gè)不可忽略的角色。這些處理器有一個(gè)共同特點(diǎn),那就是他們無一例外采用了指令集架構(gòu)處理器。

這些架構(gòu)在實(shí)際應(yīng)用中不能發(fā)揮人工智能芯片的全部算力潛力,為此牛博士指出,在算力需求猛增的AI時(shí)代,需要一種新的芯片架構(gòu),這主要是由以下兩個(gè)原因決定的:

從硬件架構(gòu)上看,指令集架構(gòu)芯片中有部分芯片面積用于支持指令控制。更關(guān)鍵的問題在于,在指令執(zhí)行過程中,計(jì)算單元在多數(shù)時(shí)間內(nèi)處于等待的狀態(tài):等待計(jì)算所需數(shù)據(jù)的到來。從這個(gè)角度看,指令集架構(gòu)下的算力并沒有被充分發(fā)揮出來給到用戶。

另一方面,如上圖右邊所示,一個(gè)標(biāo)準(zhǔn)的五級(jí)指令集的每一條指令都要經(jīng)過讀取、解碼、執(zhí)行、讀寫內(nèi)存和把數(shù)據(jù)寫到寄存器里面去這五個(gè)步驟。在這些步驟中,只有執(zhí)行這一步驟是在執(zhí)行真正的計(jì)算。其他部分都是在做指令的讀取和解碼這樣的功能。雖然可以通過指令流水降低計(jì)算單元閑置,不過在實(shí)際執(zhí)行過程中,受限于指令間的依賴、以及指令間協(xié)同的時(shí)鐘不確定性,指令內(nèi)部的計(jì)算單元會(huì)出現(xiàn)閑置等挑戰(zhàn)。

牛博士舉例說到,英偉達(dá)T4在Batch=128或Batch最高的測(cè)試環(huán)境下,按照其官網(wǎng)公布的指標(biāo)去比對(duì)幾個(gè)網(wǎng)絡(luò)實(shí)際的使用算力,得出的結(jié)果是峰值算力的7%到30%左右。這意味著產(chǎn)品有很大部分的性能還不能完全發(fā)揮出來。

“如果大家都在類似架構(gòu)下競(jìng)爭(zhēng),在接近的芯片利用率前提下,芯片公司的產(chǎn)品升級(jí)最后會(huì)變成依賴制程工藝和軟件生態(tài)的比拼。而且,對(duì)比P4與T4產(chǎn)品的實(shí)測(cè)性能可以發(fā)現(xiàn),隨著峰值算力的增加,芯片的實(shí)際利用率有所降低”,牛博士補(bǔ)充說。

從目前的市場(chǎng)發(fā)展上看,包括英偉達(dá)在內(nèi)的多家AI芯片廠商都在沿著上述技術(shù)路線演進(jìn),但從當(dāng)前制程工藝的發(fā)展和材料本身的特性限制看來,繼續(xù)大幅提升峰值算力意味著更高的芯片成本,而隨著峰值算力降低的芯片利用率意味著給到用戶的實(shí)測(cè)算力并不會(huì)等比例線性提升。這與當(dāng)前AI應(yīng)用客戶更高算力性價(jià)比的需求是相背而行的。換而言之,尋找一個(gè)新的AI芯片架構(gòu)迫在眉睫。

“數(shù)據(jù)流架構(gòu)或許會(huì)是一個(gè)不錯(cuò)的選擇”,牛博士說。

根據(jù)他的觀點(diǎn),所有的計(jì)算架構(gòu)需要保證一個(gè)核心需求:加減乘除等計(jì)算操作能夠按照編程需求按特定次序完成對(duì)特定數(shù)據(jù)的計(jì)算。與傳統(tǒng)的馮·諾依曼架構(gòu)或控制流體系結(jié)構(gòu)進(jìn)行對(duì)比,數(shù)據(jù)流架構(gòu)并沒有指令相關(guān)的指令控制與執(zhí)行單元。數(shù)據(jù)流架構(gòu)依靠數(shù)據(jù)流動(dòng)次序,而不是指令執(zhí)行次序保證計(jì)算執(zhí)行順序,從而將計(jì)算與數(shù)據(jù)搬運(yùn)重疊,以實(shí)現(xiàn)更高的吞吐量和更低的延遲。

“在指令集架構(gòu)中,由于指令協(xié)同的不確定性,計(jì)算與數(shù)據(jù)讀寫無法深度重疊,部分時(shí)間計(jì)算單元處于等待數(shù)據(jù)狀態(tài),從而導(dǎo)致閑置計(jì)算單元和芯片利用率的下降。而數(shù)據(jù)流架構(gòu)中每個(gè)時(shí)鐘下所有計(jì)算單元的狀態(tài)是確定的,計(jì)算單元無需等待其它單元的計(jì)算,從而消除計(jì)算資源閑置。”牛博士表示。“這就像一個(gè)交響樂團(tuán),當(dāng)樂團(tuán)中每個(gè)人都按照統(tǒng)一的拍子進(jìn)行演奏時(shí),而且每個(gè)人在每個(gè)拍子下的動(dòng)作是確定的,樂團(tuán)中的樂器之間并不需要相互等待,可以按照自己的節(jié)拍并行的演奏,就會(huì)協(xié)作完成一首曲子。這就像數(shù)據(jù)流架構(gòu)中計(jì)算單元間的協(xié)作關(guān)系:通過精確的時(shí)鐘進(jìn)行協(xié)作,而并不存在先后依賴關(guān)系,所以無需等待。”牛博士補(bǔ)充說。據(jù)介紹,數(shù)據(jù)流架構(gòu)支持時(shí)鐘級(jí)的精確計(jì)算,讓每個(gè)數(shù)據(jù)流動(dòng)及計(jì)算在每個(gè)時(shí)鐘都可精確預(yù)計(jì),從而支持將數(shù)據(jù)流動(dòng)與計(jì)算深度重疊,消除計(jì)算單元閑置;于此同時(shí),數(shù)據(jù)流架構(gòu)中沒有指令,從而破除了指令集架構(gòu)的控制冗余以及等待指令讀取譯碼帶來的計(jì)算單元閑置問題,進(jìn)一步提升芯片利用率。此外,數(shù)據(jù)流架構(gòu)中一個(gè)數(shù)據(jù)流流水線中可深度整合大量計(jì)算單元,從而打破指令集架構(gòu)中峰值算力提升與芯片利用率的沖突問題:通過不斷加深數(shù)據(jù)流流水線,可以在提升峰值算力同時(shí),不降低流水線中計(jì)算單元閑置時(shí)間。”

正是因?yàn)閿?shù)據(jù)流架構(gòu)擁有如此多的優(yōu)勢(shì),包括Wave Computing、SambaNova和Groq在內(nèi)的多家公司投入了這個(gè)領(lǐng)域的研發(fā),值得一提的是Groq的初創(chuàng)團(tuán)隊(duì)還是由谷歌TPU的核心成員創(chuàng)立,由此可以看到數(shù)據(jù)流架構(gòu)的前景。

當(dāng)然,鯤云科技創(chuàng)始團(tuán)隊(duì)自1994年就開始探索數(shù)據(jù)流架構(gòu)在各個(gè)垂直領(lǐng)域的開發(fā)和落地,在數(shù)據(jù)流技術(shù)上具有深厚的積累,自然是這個(gè)架構(gòu)的積極支持者。也正是在這個(gè)背景下,團(tuán)隊(duì)創(chuàng)立了鯤云科技,從零開始探索針對(duì)深度學(xué)習(xí)的數(shù)據(jù)流架構(gòu),也就是CAISA。

AI芯片能力≠芯片峰值算力

在架構(gòu)類似的情況下,峰值算力是一個(gè)可以簡(jiǎn)單快速估算芯片實(shí)測(cè)性能的指標(biāo),也是在AI芯片設(shè)計(jì)中重點(diǎn)關(guān)注的指標(biāo)。然而近幾年,提升峰值算力的發(fā)展方向?qū)⑷斯ぶ悄苄酒陌l(fā)展推向了另一個(gè)極端:峰值算力(或每瓦的峰值算力)已經(jīng)成為評(píng)價(jià)一顆AI芯片性能的單一指標(biāo),導(dǎo)致大量AI芯片研發(fā)資源投入到如何把峰值算力推高。

然而對(duì)于用戶來說,峰值算力其實(shí)并不是他們的本質(zhì)需求。

“用戶真正關(guān)心的是AI芯片的實(shí)測(cè)算力,而不完全是峰值算力。峰值算力并不能直接釋放給用戶,真正釋放給用戶的要乘上一個(gè)系數(shù),叫做芯片利用率”,牛博士說。“峰值算力指標(biāo)假設(shè)每個(gè)芯片內(nèi)部計(jì)算單元每個(gè)時(shí)鐘都處于計(jì)算狀態(tài),而現(xiàn)有指令集架構(gòu)在運(yùn)算執(zhí)行中計(jì)算單元存在閑置”,牛博士強(qiáng)調(diào)。

以英偉達(dá)T4加速卡為例,常用的識(shí)別、檢測(cè)和分割的算法ResNet50、SSD-ResNet50和U-Net Industrial,在Batch=128或者最高性能的情況下,可以分別獲得32.1%、7.5%、11.9%的芯片利用率,這意味著在實(shí)際應(yīng)用中,只有7%到32%的峰值算力轉(zhuǎn)換為實(shí)測(cè)性能釋放給用戶,當(dāng)中帶來的芯片性能浪費(fèi)是顯而易見的。

“為了讓用戶獲得更高的性能,除了持續(xù)提高峰值性能以外,芯片利用率的提升會(huì)是一個(gè)更好的方案,因?yàn)檫@會(huì)在不增加芯片成本的情況下,大幅提升芯片的實(shí)測(cè)性能。這也是鯤云科技新推出的CAISA 芯片正在努力的方向”,牛博士說。

這是一款采用28nm工藝打造的芯片,搭載了四個(gè)CAISA 3.0引擎,具有超過1.6萬個(gè)MAC(乘累加)單元,峰值性能可達(dá)10.9TOPs。而通過PCIe 3.0×4接口與主處理器通信,同時(shí)具有雙DDR通道,可為每個(gè)CAISA芯片提供超過340Gbps的帶寬。

作為一款面向邊緣和數(shù)據(jù)中心推理的人工智能芯片,CAISA芯片可實(shí)現(xiàn)最高95.4%的芯片利用率。這就讓他們?cè)诩葷M足客戶在價(jià)格和功耗方面需求的同時(shí),還能為客戶提供更強(qiáng)的算力,提高了性價(jià)比。而之所以能做到如此高的芯片利用率,與鯤云科技的CAISA 3.0數(shù)據(jù)流架構(gòu)有莫大的關(guān)系。

在文章前面我們提到,鯤云科技首席科學(xué)家Wayne Luk陸永青院士從1994年就開始將數(shù)據(jù)流架構(gòu)應(yīng)用到各個(gè)垂直領(lǐng)域。經(jīng)歷了前十幾年的發(fā)展積累,到鯤云科技于2016年成立并在FPGA上實(shí)現(xiàn)交付,與客戶的交流迭代之后,完成了此次全新的架構(gòu)升級(jí)。

來到CAISA3.0中,數(shù)據(jù)計(jì)算與數(shù)據(jù)流動(dòng)的重疊,壓縮計(jì)算資源的每一個(gè)空閑時(shí)鐘;通過算力資源的動(dòng)態(tài)平衡,消除流水線的性能瓶頸;通過數(shù)據(jù)流的時(shí)空映射,最大化復(fù)用芯片內(nèi)的數(shù)據(jù)流帶寬,減少對(duì)外部存儲(chǔ)帶寬的需求。上述設(shè)計(jì)使CNN算法的計(jì)算數(shù)據(jù)在CAISA3.0內(nèi)可以實(shí)現(xiàn)不間斷的持續(xù)運(yùn)算,最高可實(shí)現(xiàn)95.4%的芯片利用率,在同等峰值算力條件下,可獲得相對(duì)于GPU 3倍以上的實(shí)測(cè)算力,從而為用戶提供更高的算力性價(jià)比。

相比旗艦款Xavier加速卡,搭載CAISA芯片的星空加速卡X3可以最高提供4.12倍實(shí)測(cè)性能提升;而與T4相比,鯤云科技也能提供最高3.91倍實(shí)測(cè)性能提升。這都是超高的芯片利用率提升所帶來的。得益于這個(gè)利用率,過往通過提升峰值性獲得更高性能而帶來的高成本問題,也迎刃而解。

也許很多人并沒有理解這個(gè)3.91倍背后的意義,讓我們舉個(gè)現(xiàn)有的例子來對(duì)比說明一下。

AI從業(yè)人員都知道,英偉達(dá)為了展現(xiàn)其T4的實(shí)力,在其官方網(wǎng)站上公布了這個(gè)加速卡跑在不同網(wǎng)絡(luò)模型下的性能指標(biāo)。作為AI芯片行業(yè)的風(fēng)向標(biāo),任何一款芯片想要說明自己的實(shí)力,只需要跑和T4一樣的網(wǎng)絡(luò),然后公布相關(guān)的Benchmark就可以如愿以償。早前被英特爾收購的Habana就是這樣做的。根據(jù)Habana所公布benchmark性能,相比于T4官網(wǎng)指標(biāo)(最新官網(wǎng)指標(biāo)為5415FPS),通過更高的峰值算力,Habana的產(chǎn)品提供了2.85倍實(shí)測(cè)性能提升。正是因?yàn)樵趯?shí)測(cè)性能上取得的領(lǐng)先,最終獲得Intel的青睞,讓他們以20億美元的估值被收購。

通過這個(gè)例子,我們也可以看到鯤云科技這個(gè)數(shù)字的真正價(jià)值。

在這個(gè)高性能芯片的支持下,鯤云科技打造了高算力性價(jià)比的AI計(jì)算平臺(tái)星空加速卡系列,并推出了X3和X9兩款產(chǎn)品。

其中星空X3加速卡是搭載單顆CAISA 芯片的數(shù)據(jù)流架構(gòu)深度學(xué)習(xí)推斷計(jì)算平臺(tái),為工業(yè)級(jí)半高半長單槽規(guī)格的PCIe板卡。得益于其輕量化的規(guī)格特點(diǎn),X3加速卡可以與不同類型的計(jì)算機(jī)設(shè)備進(jìn)行適配,包括個(gè)人電腦、工業(yè)計(jì)算機(jī)、網(wǎng)絡(luò)視頻錄像機(jī)、工作站、服務(wù)器等,滿足邊緣和高性能場(chǎng)景中的AI計(jì)算需求。相較于英偉達(dá)邊緣端旗艦產(chǎn)品Xavier,X3可實(shí)現(xiàn)1.48-4.12倍的實(shí)測(cè)性能提升。

X9加速卡為搭載4顆CAISA 芯片的深度學(xué)習(xí)推斷板卡,峰值性能43.6TOPS,主要滿足高性能場(chǎng)景下的AI計(jì)算需求。同英偉達(dá)旗艦產(chǎn)品T4相對(duì),X9在ResNet-50, YOLO v3等模型上的芯片利用率提升2.84-11.64倍。在實(shí)測(cè)性能方面,X9在ResNet50可達(dá)5240FPS,與T4性能接近,在YOLO v3、UNet Industrial等檢測(cè)分割網(wǎng)絡(luò),實(shí)測(cè)性能相較T4有1.83-3.91倍性能提升。在達(dá)到最優(yōu)實(shí)測(cè)性能下,X9處理延時(shí)相比于T4降低1.83-32倍。實(shí)測(cè)性能以及處理延時(shí)的大幅領(lǐng)先,讓數(shù)據(jù)流架構(gòu)為AI芯片的發(fā)展提供了提升峰值性能之外的另一條技術(shù)路線。

據(jù)了解,目前星空X3加速卡已經(jīng)推出市場(chǎng),而星空X9加速卡將于今年8月推出市場(chǎng)。

全球首個(gè)數(shù)據(jù)流AI芯片背后

從行業(yè)的現(xiàn)狀看來,鯤云科技是全球首家推出數(shù)據(jù)流AI芯片,并且提供第三方實(shí)測(cè)benchmark的中國芯片企業(yè)。這是前文說到的Wave Computing、SambaNova和Groq等國外明星初創(chuàng)企業(yè)所不能達(dá)到的成就。而通過數(shù)據(jù)流網(wǎng)絡(luò)中算子的不同配置和組合,鯤云科技的CAISA芯片更可支持到絕大多數(shù)的CNN算法,并能讓開發(fā)者輕易地將模型遷移到這個(gè)平臺(tái)上。。

能做到這樣,是其架構(gòu)和軟件相互協(xié)同獲得的成果。

CAISA3.0架構(gòu)可以通過流水線動(dòng)態(tài)重組實(shí)現(xiàn)對(duì)不同深度學(xué)習(xí)算法的高性能支持。通過CAISA架構(gòu)層的數(shù)據(jù)流引擎、全局?jǐn)?shù)據(jù)流網(wǎng)、全局?jǐn)?shù)據(jù)流緩存,以及數(shù)據(jù)流引擎內(nèi)部的人工智能算子模塊、局部數(shù)據(jù)流網(wǎng)、局部數(shù)據(jù)流緩存的分層設(shè)計(jì),在數(shù)據(jù)流配置器控制下,CAISA架構(gòu)中的數(shù)據(jù)流連接關(guān)系和運(yùn)行狀態(tài)都可以被自動(dòng)化動(dòng)態(tài)配置,從而生成面向不同AI算法的高性能定制化流水線。在保證高性能的前提下,支持用戶使用基于CAISA3.0架構(gòu)的計(jì)算平臺(tái)實(shí)現(xiàn)如目標(biāo)檢測(cè)、分類及語義分割等廣泛的人工智能算法應(yīng)用。

“專為CAISA3.0架構(gòu)配備的RainBuilder編譯工具鏈支持從算法到芯片的端到端自動(dòng)化部署”,牛博士強(qiáng)調(diào)。而在RainBuilder編譯工具鏈的支持下,用戶和開發(fā)者無需了解架構(gòu)的底層硬件配置,簡(jiǎn)單兩步即可實(shí)現(xiàn)算法快速遷移和部署。

據(jù)透露,RainBuilder編譯器可自動(dòng)提取主流AI開發(fā)框架(TensorFlow,Caffe,Pytorch,ONNX等)中開發(fā)的深度學(xué)習(xí)算法的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)信息,并面向CAISA結(jié)構(gòu)進(jìn)行優(yōu)化;工具鏈中的運(yùn)行時(shí)(Runtime)和驅(qū)動(dòng)(Driver)模塊負(fù)責(zé)硬件管理并為用戶提供標(biāo)準(zhǔn)的API接口,運(yùn)行時(shí)可以基于精確的CAISA性能模型,實(shí)現(xiàn)算法向CAISA架構(gòu)的自動(dòng)化映射,同時(shí)提供可以被高級(jí)語言直接調(diào)用的API接口;最底層的驅(qū)動(dòng)可以實(shí)現(xiàn)對(duì)用戶透明的硬件控制。RainBuilder工具鏈?zhǔn)褂煤?jiǎn)單,部署方便,通用性強(qiáng),可以讓用戶快速和低成本的部署和遷移已有算法到CAISA硬件平臺(tái)上。

回顧計(jì)算行業(yè)的發(fā)展,不同的應(yīng)用催生了不同的處理器架構(gòu)。早期PC的出現(xiàn),讓X86架構(gòu)和Intel名揚(yáng)天下;近十年移動(dòng)設(shè)備的出現(xiàn),又推動(dòng)了Arm架構(gòu)和高通的蓬勃發(fā)展。

現(xiàn)在,我們進(jìn)入了AI時(shí)代,也許一個(gè)屬于數(shù)據(jù)流處理器和鯤云科技的時(shí)代,從這刻開始正式上演。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235343
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52520

    瀏覽量

    441141
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35166

    瀏覽量

    280094
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249640
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA計(jì)劃打造全球首個(gè)工業(yè)AI云平臺(tái)

    NVIDIA 宣布,其正在為歐洲制造商構(gòu)建全球首個(gè)工業(yè) AI 云。這家總部位于德國的 AI 工廠將配備 1 萬個(gè) GPU,包括通過 NVIDIA DGX B200 系統(tǒng) 和 NVIDI
    的頭像 發(fā)表于 06-16 14:17 ?505次閱讀

    全球首個(gè)AI設(shè)計(jì)芯片系統(tǒng)誕生,來自中科院

    電子發(fā)燒友網(wǎng)綜合報(bào)道,近日,中國科學(xué)院計(jì)算技術(shù)研究所處理器芯片全國重點(diǎn)實(shí)驗(yàn)室聯(lián)合軟件研究所,推出全球首個(gè)基于人工智能技術(shù)的處理器芯片軟硬件全自動(dòng)設(shè)計(jì)系統(tǒng) ——“啟蒙”。 ? 該系統(tǒng)實(shí)現(xiàn)
    的頭像 發(fā)表于 06-16 00:11 ?2266次閱讀

    FX3板是否兼容2k和4k分辨率的視頻數(shù)據(jù)流

    ,實(shí)現(xiàn)了 1920 * 1080 @ 60 fps 的設(shè)計(jì),但現(xiàn)在我想檢查與上述更高分辨率的兼容性。 關(guān)于這一點(diǎn),我有幾個(gè)問題 1.FX3 板是否兼容 2k 和 4k 分辨率的視頻數(shù)據(jù)流? 2.視頻數(shù)據(jù)流
    發(fā)表于 05-23 06:35

    如何基于Kahn處理網(wǎng)絡(luò)定義AI引擎圖形編程模型

    本白皮書探討了如何基于 Kahn 處理網(wǎng)絡(luò)( KPN )定義 AI 引擎圖形編程模型。KPN 模型有助于實(shí)現(xiàn)數(shù)據(jù)流并行化,進(jìn)而提高系統(tǒng)的整體性能。
    的頭像 發(fā)表于 04-17 11:31 ?356次閱讀
    如何基于Kahn處理網(wǎng)絡(luò)定義<b class='flag-5'>AI</b>引擎圖形編程模型

    用FPGA配置TVP5150,把PAL制標(biāo)準(zhǔn)視頻轉(zhuǎn)換成BT656數(shù)據(jù)格式,能否把數(shù)據(jù)流直接給SAA7121?

    用FPGA配置TVP5150,把PAL制標(biāo)準(zhǔn)視頻轉(zhuǎn)換成BT656數(shù)據(jù)格式,請(qǐng)問能否把數(shù)據(jù)流直接給SAA7121這樣的編碼芯片,我這么做的,但是出來的圖像是紅色的,是不是寄存器沒配置對(duì)?還是其他什么原因?
    發(fā)表于 02-11 07:14

    鯤云科技AI芯片CAISA 430成功適配DeepSeek R1模型

    鯤云科技全新一代的可重構(gòu)數(shù)據(jù)流 AI 芯片 CAISA 430 成功適配 DeepSeek R1 蒸餾模型推理,這一創(chuàng)新舉措為大模型應(yīng)用的高效部署帶來了全新的解決方案,標(biāo)志著可重構(gòu)數(shù)據(jù)流
    的頭像 發(fā)表于 02-07 09:57 ?1520次閱讀
    鯤云科技<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>CAISA 430成功適配DeepSeek R1模型

    使用ADS1281做調(diào)制器,兩個(gè)調(diào)制器都是輸出1位的數(shù)據(jù)流,那合并之后數(shù)據(jù)流是幾位的呢?

    ]). 現(xiàn)在有以下兩個(gè)問題: 1.兩個(gè)調(diào)制器都是輸出1位的數(shù)據(jù)流,那合并之后數(shù)據(jù)流是幾位的呢? 2.如果取所有可能的情況,Y[n]的輸出范圍就是-24~+25,這個(gè)又要怎么理解呢?
    發(fā)表于 02-05 09:10

    適用于Oracle的SSIS數(shù)據(jù)流組件:提供快速導(dǎo)入及導(dǎo)出功能

    使用SSIS 數(shù)據(jù)流組件,通過與關(guān)鍵數(shù)據(jù)庫和云服務(wù)的 Oracle 數(shù)據(jù)集成來改進(jìn)您的 ETL 流程,這些組件提供快捷和可靠的數(shù)據(jù)導(dǎo)入和導(dǎo)出功能。 ? Oracle SSIS
    的頭像 發(fā)表于 01-15 10:51 ?1020次閱讀
    適用于Oracle的SSIS<b class='flag-5'>數(shù)據(jù)流</b>組件:提供快速導(dǎo)入及導(dǎo)出功能

    Devart SSIS數(shù)據(jù)流組件

    Devart SSIS 數(shù)據(jù)流組件是功能強(qiáng)大的工具,旨在簡(jiǎn)化 SQL Server Integration Services (SSIS) 包內(nèi)的 ETL 流程,使用戶無需編寫復(fù)雜的代碼即可
    的頭像 發(fā)表于 01-05 11:08 ?1137次閱讀
    Devart SSIS<b class='flag-5'>數(shù)據(jù)流</b>組件

    阿里國際推出全球首個(gè)B2B AI搜索引擎Accio

    近日,在歐洲科技峰會(huì)Web Summit上,阿里國際正式推出了全球首個(gè)B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的
    的頭像 發(fā)表于 11-15 16:53 ?1213次閱讀

    理解ECU數(shù)據(jù)流的分析方法

    隨著汽車電子化程度的提高,ECU在車輛中扮演的角色越來越重要。它們不僅控制著發(fā)動(dòng)機(jī)管理、變速箱、制動(dòng)系統(tǒng)等關(guān)鍵功能,還涉及到車輛的舒適性和安全性。 ECU數(shù)據(jù)流分析的重要性 故障診斷 :通過
    的頭像 發(fā)表于 11-05 11:07 ?1230次閱讀

    全球首個(gè)開源AI標(biāo)準(zhǔn)正式發(fā)布

    近日,在備受矚目的2024年ALL THINGS OPEN大會(huì)上,開源組織Open Source Initiative(OSI)宣布了一項(xiàng)重大突破——正式發(fā)布了開源人工智能定義(OSAID)1.0版本。這一里程碑式的成就標(biāo)志著全球首個(gè)開源
    的頭像 發(fā)表于 10-31 10:59 ?653次閱讀

    請(qǐng)問TLV320AIC3254EVM-K怎么讀取音頻數(shù)據(jù)流

    您好,我在學(xué)習(xí)TLV320AIC3254EVM-K開發(fā)板的過程中碰到一個(gè)這樣的問題,TI提供的軟件是否具備讀取I2S的音頻數(shù)據(jù)流的功能,或者是否有PC機(jī)軟件可以讀取音頻數(shù)據(jù)流,或者其它方法?請(qǐng)高手幫忙解決,萬分感謝!
    發(fā)表于 10-31 06:14

    統(tǒng)一日志數(shù)據(jù)流

    統(tǒng)一日志數(shù)據(jù)流圖 日志系統(tǒng)數(shù)據(jù)流圖 系統(tǒng)進(jìn)行日志收集的過程可以分為三個(gè)環(huán)節(jié): (1)日志收集和導(dǎo)入ElasticSearch (2)ElasticSearch進(jìn)行索引等處理 (3)可視化操作,查詢等
    的頭像 發(fā)表于 08-21 15:00 ?576次閱讀
    統(tǒng)一日志<b class='flag-5'>數(shù)據(jù)流</b>圖

    昆侖萬維發(fā)布全球首個(gè)AI流媒體音樂平臺(tái)Melodio

    昆侖萬維在科技創(chuàng)新領(lǐng)域再次邁出重要一步,正式推出了全球首個(gè)AI流媒體音樂平臺(tái)——Melodio,以及配套的AI音樂商用創(chuàng)作平臺(tái)Mureka。這兩款創(chuàng)新產(chǎn)品的問世,標(biāo)志著音樂產(chǎn)業(yè)正式邁入
    的頭像 發(fā)表于 08-14 17:44 ?1168次閱讀