“芯痛”之下阿里苦心研發(fā)NPU AI芯片究竟哪款PU更厲害?
4月19日,有消息稱,阿里巴巴達(dá)摩院正在研發(fā)一款神經(jīng)網(wǎng)絡(luò)芯片——Ali-NPU,主要運用于圖像視頻分析、機器學(xué)習(xí)等AI推理計算。按照設(shè)計,這款芯片性能將是目前市面上主流CPU、GPU架構(gòu)AI芯片的10倍,而制造成本和功耗僅為一半,其性價比超過40倍。
應(yīng)用上,通過此款芯片的研發(fā)將會更好的落地在圖像、視頻識別、云計算等商業(yè)場景中。據(jù)阿里達(dá)摩院研究員驕旸介紹說:“CPU、GPU作為通用計算芯片,為處理線程邏輯和圖形而設(shè)計,處理AI計算問題時功耗高,性價比低,在AI計算領(lǐng)域急需專用架構(gòu)芯片解決上述問題。阿里巴巴此款A(yù)li-NPU在AI領(lǐng)域積累了大量算法模型優(yōu)勢,以最小成本實現(xiàn)最大量的AI模型算法運算。”
昨日,OFweek人工智能網(wǎng)在《當(dāng)中興事件揭開“缺芯少魂”的遮羞布 AI能否迷途知返?》中簡單說明了英特爾、英偉達(dá)、AMD等傳統(tǒng)芯片處理器巨頭在CPU和GPU上存在的優(yōu)勢,而且它們都將人工智能定位為未來重要戰(zhàn)略。
事實上,隨著人工智能產(chǎn)業(yè)的發(fā)展,CPU、GPU、TPU、DPU、NPU、BPU……各種PU也開始爆發(fā)式出現(xiàn)。那么,究竟這些PU在性能和使用上有何異同,又有哪些優(yōu)劣呢?
CPU:計算力占據(jù)部分很小 擅長邏輯控制
CPU是最為普遍,最為常見的中央處理器。主要包括運算器(ALU)和控制單元(CU),除此之外還包括若干寄存器、高速緩存器和它們之間通訊的數(shù)據(jù)、控制及狀態(tài)的總線。依循馮諾依曼架構(gòu),CPU需要大量空間放置存儲單元和控制邏輯,計算能力只占據(jù)很小的部分,更擅長邏輯控制。
CPU結(jié)構(gòu)簡化圖
GPU:計算單元數(shù)量眾多 但無法單獨使用
GPU的誕生可以解決CPU在計算能力上的天然缺陷。采用數(shù)量眾多的計算單元和超長的流水線,善于處理圖像領(lǐng)域的運算加速。但GPU的缺陷也很明顯,即無法單獨工作,必須由CPU進(jìn)行控制調(diào)用才能工作。
CPU、GPU微架構(gòu)對比圖
TPU:高性能低功耗 然則開發(fā)周期長、轉(zhuǎn)換成本高
谷歌專門為 TensorFlow 深度學(xué)習(xí)框架定制的TPU,是一款專用于機器學(xué)習(xí)的芯片。TPU可以提供高吞吐量的低精度計算,用于模型的前向運算而不是模型訓(xùn)練,且能效更高。但它的缺陷主要是開發(fā)周期長、可配置性能有限,缺乏靈活性且轉(zhuǎn)換成本高。
DPU:可實現(xiàn)快速開發(fā)與產(chǎn)品迭代
國際上,Wave Computing最早提出DPU。在國內(nèi),DPU最早是由深鑒科技提出,是基于Xilinx可重構(gòu)特性的FPGA芯片,設(shè)計專用深度學(xué)習(xí)處理單元,且可以抽象出定制化的指令集和編譯器,從而實現(xiàn)快速的開發(fā)與產(chǎn)品迭代。
深鑒“雨燕”DPU平臺

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 大模型的盡頭是開源
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 人形機器人廠商,正在批量復(fù)刻宇樹G1
- 4 AI 時代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 5 華為公布昇騰芯片三年計劃,自研HBM曝光
- 6 硬剛英偉達(dá)!華為發(fā)布全球最強算力超節(jié)點和集群
- 7 機器人9月大事件|3家國產(chǎn)機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 8 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進(jìn)軍好萊塢
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?