QQ在線客服

上線高利用率AI芯片CAISA,「鯤云科技」提出芯片數(shù)據(jù)流架構(gòu)模式

2020-06-25 12:20 來(lái)源: 站長(zhǎng)資源平臺(tái) 瀏覽(571)人   

編輯:石亞瓊

配圖來(lái)源:Pexels

6月23日,鯤云科技在深圳的產(chǎn)品發(fā)布會(huì)發(fā)布全球首款數(shù)據(jù)流AI芯片CAISA,其定位于AI終端推理,目前已完成量產(chǎn)。

根據(jù)官方介紹,CAISA搭載了四個(gè)CAISA 3.0引擎,具有超過(guò)1.6萬(wàn)個(gè)MAC(乘累加)單元,峰值性能可達(dá)10.9TOPs。該芯片采用28nm工藝,通過(guò)PCIe 3.0×4接口與主處理器通信,同時(shí)具有雙DDR通道,可為每個(gè)CAISA芯片提供超過(guò)340Gbps的帶寬。

鯤云援引第三方數(shù)據(jù)顯示,搭載CAISA芯片的加速卡僅擁有英偉達(dá)同類產(chǎn)品 1/3的峰值算力,但是其通過(guò)95.4%的芯片利用率可以實(shí)現(xiàn)3倍左右的的實(shí)測(cè)性能。

大部分廠商的AI芯片均為指令集的計(jì)算架構(gòu),此次鯤云科技發(fā)布的CAISA芯片則為數(shù)據(jù)流架構(gòu)。鯤云表示,數(shù)據(jù)流架構(gòu)AI芯片提供較之于指令集架構(gòu)AI芯片更高的計(jì)算效率。指令集的計(jì)算架構(gòu)要求芯片的計(jì)算和控制是分離的,而控制過(guò)程中模塊間的數(shù)據(jù)移動(dòng)以及數(shù)據(jù)計(jì)算的過(guò)程中會(huì)存在等待周期,這會(huì)使得芯片的計(jì)算模塊存在閑置情況,這也是現(xiàn)有芯片利用率普遍低于30%的原因。而數(shù)據(jù)流架構(gòu)依托數(shù)據(jù)流流動(dòng)次序控制計(jì)算次序,采用計(jì)算流和數(shù)據(jù)流重疊運(yùn)行方式消除空閑計(jì)算單元。在實(shí)測(cè)中,數(shù)據(jù)流芯片可以與同峰值算力的指令集芯片表現(xiàn)出更高的芯片利用率以及更高的實(shí)測(cè)算力。

本次發(fā)布會(huì)鯤云科技也帶來(lái)了AI計(jì)算平臺(tái)星空加速卡X3以及X9。

星空X3加速卡是搭載單顆CAISA 芯片的數(shù)據(jù)流架構(gòu)深度學(xué)習(xí)推斷計(jì)算平臺(tái),為輕量化規(guī)格,X3加速卡因此可以與不同類型的計(jì)算機(jī)設(shè)備進(jìn)行適配,包括個(gè)人電腦、工業(yè)計(jì)算機(jī)、網(wǎng)絡(luò)視頻錄像機(jī)、工作站、服務(wù)器等?;贑AISA芯片的X3加速卡動(dòng)態(tài)功耗為20W左右。英偉達(dá)邊緣端旗艦產(chǎn)品Xavier 在深度學(xué)習(xí)網(wǎng)絡(luò)ResNet-50, YOLO v3中實(shí)測(cè)獲得的芯片利用率分別為21.1%、6.8%,而星空X3加速卡的結(jié)果為92.3%及82.4%,遠(yuǎn)高于前者??傮w算力表現(xiàn)可以達(dá)到Xavier的1.48-4.12倍。

X3 vs Xavier 性能對(duì)比圖

星空X9加速卡為搭載4顆CAISA 芯片的深度學(xué)習(xí)推斷板卡,峰值性能43.6TOPS,主要滿足高性能場(chǎng)景下的AI計(jì)算需求。實(shí)測(cè)性能方面,X9在ResNet50可達(dá)5240FPS,與T4性能接近,在YOLO v3、UNetIndustrial等檢測(cè)分割網(wǎng)絡(luò),實(shí)測(cè)性能相較T4有1.83-3.91倍性能提升。最優(yōu)實(shí)測(cè)性能下,X9處理延時(shí)相比于T4降低1.83-32倍。

X9 vs T4 性能對(duì)比圖

盡管數(shù)據(jù)流架構(gòu)顯著的提高了芯片算力的利用率,但是指令集的架構(gòu)支持各式各樣的數(shù)據(jù)組合,具有較強(qiáng)的通用性。CAISA目前工藝水平為28nm,這在晶體管數(shù)量、處理速度、溫升等方面較之于更加先進(jìn)工藝的芯片將會(huì)存在的劣勢(shì)。

鯤云科技認(rèn)為此次發(fā)布的芯片新品的核心競(jìng)爭(zhēng)力在于提供了更高的算力性價(jià)比。

AI芯片產(chǎn)品不同于SaaS等其他企業(yè)服務(wù)賽道,用戶衡量產(chǎn)品的好壞與否,基本是通過(guò)芯片的計(jì)算能力、通用性以及價(jià)格來(lái)進(jìn)行判斷。CAISA芯片的競(jìng)爭(zhēng)路線不是依靠更大的芯片面積和制程工藝提供更高的峰值算力,而是通過(guò)數(shù)據(jù)流動(dòng)控制計(jì)算順序來(lái)提升實(shí)測(cè)性能。

終端推理芯片賽道上,頭部廠商英偉達(dá)也部署了邊緣側(cè)Xavier芯片以及云端旗艦加速卡T4。鯤云科技創(chuàng)始人兼CEO牛昕宇告訴36氪,芯片賽道的競(jìng)爭(zhēng)是簡(jiǎn)單直接的,要素?zé)o非就是算力性價(jià)比、通用性以及遷移成本。用戶會(huì)根據(jù)自己的算力需求進(jìn)行產(chǎn)品篩選,然后比對(duì)價(jià)格。峰值算力的提升往往來(lái)自于工藝技術(shù)的迭代以及更大的芯片面積,這也就意味著更高的產(chǎn)品成本。但是此次鯤云CAISA架構(gòu)帶來(lái)的芯片利用率提升,并不需要更高的峰值算力從而讓用戶獲得更高的實(shí)測(cè)算力體現(xiàn),這可以減少企業(yè)所需的制造成本。

值得關(guān)注的是,英偉達(dá)憑借其極強(qiáng)的峰值算力以及軟件生態(tài)構(gòu)建了極高的競(jìng)爭(zhēng)壁壘。除了產(chǎn)品在算力上的優(yōu)勢(shì),英偉達(dá)憑借產(chǎn)品積累擁有極強(qiáng)的軟件生態(tài),現(xiàn)有用戶的轉(zhuǎn)換芯片的成本較高。牛昕宇表示,也許初創(chuàng)企業(yè)可以選擇其他進(jìn)行拓展,CAISA帶來(lái)的數(shù)據(jù)流架構(gòu)也許就會(huì)是下一個(gè)方向。

此外,鯤云將會(huì)為用戶配備RainBuilder編譯工具鏈,可以支持從算法到芯片的端到端自動(dòng)化部署,用戶和開(kāi)發(fā)者無(wú)需了解架構(gòu)的底層硬件配置。RainBuilder可自動(dòng)提取主流AI開(kāi)發(fā)框架(TensorFlow,Caffe,Pytorch,ONNX等)中開(kāi)發(fā)的深度學(xué)習(xí)算法的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)信息,并面向CAISA結(jié)構(gòu)進(jìn)行優(yōu)化。鯤云希望借助編譯工具鏈提供用戶較為方便的部署環(huán)境,同時(shí)也能完成較為低成本的算法遷移。

2017年鯤云科技獲得Pre-A輪投資時(shí),36氪曾對(duì)其進(jìn)行過(guò)報(bào)道(查看更多資訊請(qǐng)點(diǎn)這里)。此時(shí)鯤云科技正致力于研發(fā)本地化人工智能芯片平臺(tái),并在衛(wèi)星遙感、電力、智慧城市等垂直領(lǐng)域進(jìn)行落地。目前,鯤云科技已經(jīng)完成了天使輪,Pre-A輪及A輪融資,設(shè)有深圳、山東、倫敦研發(fā)中心,2019年于山東成立人工智能研究院,支持技術(shù)在各垂直領(lǐng)域的實(shí)際落地。

鯤云科技目前已經(jīng)與浪潮、戴爾達(dá)成戰(zhàn)略簽約,在AI加速計(jì)算領(lǐng)域進(jìn)行合作。其核心產(chǎn)品星空加速卡已發(fā)力于電力、教育、智能遙感、智能制造、智慧城市等領(lǐng)域。

企業(yè)們往往會(huì)首先從細(xì)分領(lǐng)域切入,并構(gòu)建自己的垂直生態(tài)圈。鯤云已經(jīng)在工廠智能安監(jiān)進(jìn)行了產(chǎn)品落地,也與南方電網(wǎng)等能源型企業(yè)達(dá)成合作。AI視覺(jué)在AI應(yīng)用市場(chǎng)份額占比較大,智慧城市、安防、智能工廠等領(lǐng)域均需要AI視覺(jué),人工智能視覺(jué)芯片將是鯤云的著重發(fā)力點(diǎn)。

終端推理賽道上,寒武紀(jì)推出應(yīng)用于手機(jī)終端、AI終端的第三代芯片1M ;華為海思也推出昇騰310應(yīng)用于AI終端,麒麟900應(yīng)用于華為手機(jī);地平線則分別上線XForce邊緣AI計(jì)算平臺(tái)以及征程應(yīng)用于安防以及自動(dòng)駕駛場(chǎng)景;比特大陸以CPU技術(shù)路線推出BM1880應(yīng)用于安防場(chǎng)景。

鯤云科技表示,公司已于2018年8月完成了一筆數(shù)千萬(wàn)的A輪融資,公司近兩年的發(fā)展方向?qū)?huì)是基于CAISA芯片的落地以及拓展?,F(xiàn)階段鯤云科技團(tuán)隊(duì)共70余人,主要以研發(fā)人員為主,公司目前有拓展服務(wù)人員從而適配產(chǎn)品落地的計(jì)劃。2020年鯤云科技已經(jīng)有近千萬(wàn)元人民幣的訂單量,伴隨著新品的上線,預(yù)估將會(huì)有新的營(yíng)收增長(zhǎng)階段。


【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息發(fā)郵件至 kefu@2898.com ,我們將及時(shí)溝通與處理。 本站內(nèi)容除了2898站長(zhǎng)資源平臺(tái)( www.afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容,涉及言論、版權(quán)與本站無(wú)關(guān)。
投稿

關(guān)注我們

站長(zhǎng)資源平臺(tái)微信公眾號(hào)

微信二維碼