含光劍出,AI推理芯片如何創(chuàng)新
2019云棲大會(huì)已經(jīng)揭開了帷幕,就在9月25日,阿里巴巴集團(tuán)首席技術(shù)官兼阿里云智能總裁、達(dá)摩院院長(zhǎng)張建鋒發(fā)表了題為《構(gòu)建數(shù)字經(jīng)濟(jì)基礎(chǔ)設(shè)施》的演講。在演講中,張建鋒重磅推出AI推理芯片含光800,引發(fā)了眾多關(guān)于它的討論。
近年來(lái)科技熱潮一波接著一波。從物聯(lián)網(wǎng)到可穿戴電子、從人工智能到5G,它們推進(jìn)了國(guó)家的科技發(fā)展路徑,與其同時(shí)也催生出了一大批創(chuàng)新公司:比如專精于安防的曠視科技、專精于視頻的極鏈科技等等。其中的人工智能(AI)便曾在1950年代、1980年代先后熱議過(guò),并因多項(xiàng)技術(shù)限制與過(guò)度期許而回復(fù)平淡。而到了2016年,它又隨著云端資料的增長(zhǎng)和影音辨識(shí)的需求,再次進(jìn)入了公眾的視野。
分析AI推理芯片,自然要從人工智能說(shuō)起。人工智能的運(yùn)用一般分為兩個(gè)階段,即開發(fā)與執(zhí)行,這也與其他大部分應(yīng)用程序相類似。在實(shí)際投入運(yùn)行前,人工智能需要進(jìn)行學(xué)習(xí)與訓(xùn)練,借助大量繁復(fù)的運(yùn)算來(lái)使模型獲得更佳的參數(shù)調(diào)整數(shù)據(jù),對(duì)運(yùn)算的精準(zhǔn)度、細(xì)膩度要求都相對(duì)較高;而在執(zhí)行階段,由于模型已經(jīng)訓(xùn)練完成,所以不再需要龐大的運(yùn)算量,再加上效率的考量,往往會(huì)采用較低的運(yùn)算精度。也就是說(shuō),在這兩個(gè)階段,所需要的芯片能力其實(shí)是有所差異的。
目前人類要實(shí)現(xiàn)人工智能,只能靠芯片,別無(wú)選擇。但是現(xiàn)有的 CPU、GPU、FPGA 等芯片的基本架構(gòu)早在這次人工智能突破之前就已經(jīng)存在了,并非為人工智能而專門設(shè)計(jì),因此它們并不能完美地承擔(dān)實(shí)現(xiàn)人工智能的任務(wù)。人工智能專家Michael I. Jordan也認(rèn)為,我們今天所做的還不能算是真正的AI,而只是利用技術(shù)來(lái)增強(qiáng)一部分的智能而已,也就是所謂的IA(Intelligence Augmentation:增強(qiáng)智能)。
所以近年來(lái),人們已經(jīng)開始普遍使用CPU之外的芯片來(lái)加速,例如GPGPU、FPGA、ASIC等,特別是GPGPU為多,原因在于GPGPU的高階軟體生態(tài)較為完備、可支援多種人工智能框架。相對(duì)的,F(xiàn)PGA需要熟悉低階硬體電路者方能開發(fā),而ASIC通常只針對(duì)限定的軟體或框架最佳化。雖然FPGA與ASIC較有難度與限制,但仍有科技大廠愿意投入,如Microsoft即主張用FPGA執(zhí)行人工智能運(yùn)算,Google則針對(duì)TensorFlow人工智能框架開發(fā)ASIC,即Cloud TPU芯片。
阿里此次推出的含光800,在業(yè)界標(biāo)準(zhǔn)的ResNet-50測(cè)試中推理性能達(dá)到78563IPS,比目前業(yè)界最好的 AI 芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。在杭州城市大腦的業(yè)務(wù)測(cè)試中,一顆含光800的算力相當(dāng)于十顆GPU。這固然令人驚喜,但更重要的是,平頭哥團(tuán)隊(duì)在過(guò)去一年中不斷探索芯片與場(chǎng)景的融合,如對(duì)算力需求較大的圖像視頻分析、搜索、推薦等業(yè)務(wù)場(chǎng)景。圍繞這一目標(biāo),平頭哥針對(duì)場(chǎng)景深度定制了芯片的軟硬件,例如自研了架構(gòu)、軟件編譯器、框架、工具鏈等,如先后發(fā)布的玄鐵910、無(wú)劍SoC平臺(tái),后期也針對(duì)INT數(shù)據(jù)類型做了大量?jī)?yōu)化。這說(shuō)明中國(guó)的AI推理芯片不再滿足于IA,而是試圖往真正的AI靠攏。
在推理芯片市場(chǎng)之外,人工智能的訓(xùn)練芯片市場(chǎng)也值得觀察。由于人工智能應(yīng)用的開發(fā)、訓(xùn)練、參數(shù)調(diào)整等工作并非時(shí)時(shí)在進(jìn)行,通常在歷經(jīng)一段時(shí)間的密集開發(fā)訓(xùn)練后回歸平淡,直到下一次修改調(diào)整才再次進(jìn)入密集運(yùn)算。因此,企業(yè)若為了人工智能應(yīng)用的開發(fā)訓(xùn)練購(gòu)置大量的伺服器等運(yùn)算力,每次訓(xùn)練完成后,大量的伺服器將閑置無(wú)用,直到下一次參數(shù)調(diào)整、密集訓(xùn)練時(shí)才能再次顯現(xiàn)價(jià)值。鑒于此,許多企業(yè)傾向?qū)⒚芗?xùn)練的運(yùn)算工作交付給云端服務(wù)供應(yīng)商,依據(jù)使用的運(yùn)算量、運(yùn)算時(shí)間付費(fèi),而不是自行購(gòu)置與維護(hù)龐大運(yùn)算系統(tǒng)。這也應(yīng)該是阿里只售賣基于含光800的阿里云服務(wù),而非芯片本身的原因之一。
目前推理芯片市場(chǎng)的主流想法依然是在規(guī)格上做文章,而清華大學(xué)微電子研究所所長(zhǎng)魏少軍教授則認(rèn)為這是完全錯(cuò)誤的思路,“差異化并不是靠規(guī)格設(shè)計(jì)出來(lái)的,這樣設(shè)計(jì)出來(lái)的差異化只存在于產(chǎn)品產(chǎn)出的那一段時(shí)間,之后就無(wú)法更改。別人追上來(lái),差異化越來(lái)越小,你的產(chǎn)品便出局!
所以說(shuō),如何讓推理芯片真正的具有智慧,才是我們當(dāng)前需要思考的。如果只是單純的推進(jìn)芯片的速度,收效只會(huì)越來(lái)越小。含光800已經(jīng)踏出了創(chuàng)新的第一步,可剩下的過(guò)程,依舊漫長(zhǎng)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 3 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 4 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 5 2025年8月人工智能投融資觀察
- 6 7 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 8 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車