當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機器人»AI芯片之爭白熱化的當(dāng)下，如何設(shè)計一款真正適用于終端的AI芯片？

AI芯片之爭白熱化的當(dāng)下，如何設(shè)計一款真正適用于終端的AI芯片？

發(fā)布日期：2018-04-08 瀏覽次數(shù)：857

核心提示：　　2017年，人工智能最火的風(fēng)口必定是AI芯片?！　I芯片的涌現(xiàn)，與深度進(jìn)修技巧的成熟及運用密弗成分。深度進(jìn)修的進(jìn)程可以簡化懂得為應(yīng)用年夜量標(biāo)注的數(shù)據(jù)停止練習(xí)，練習(xí)出一個卓有成效的模子，再將這一模子應(yīng)用于

　　2017年，人工智能最火的風(fēng)口必定是AI芯片。

　　AI芯片的涌現(xiàn)，與深度進(jìn)修技巧的成熟及運用密弗成分。深度進(jìn)修的進(jìn)程可以簡化懂得為應(yīng)用年夜量標(biāo)注的數(shù)據(jù)停止練習(xí)，練習(xí)出一個卓有成效的模子，再將這一模子應(yīng)用于新數(shù)據(jù)的揣摸。

　　這個耳熟能詳?shù)谋钏惴ㄊ菢淞⒃诙鄬幽暌狗秶窠?jīng)收集之上的，后者實質(zhì)上是包括了矩陣乘積和卷積操作的年夜運算量函數(shù)。常常須要先界說一個包括回歸成績的方差、分類時的穿插熵的價值函數(shù)，再數(shù)據(jù)分批傳遞進(jìn)收集，依據(jù)參數(shù)求導(dǎo)出價值函數(shù)值，從而更新全部收集模子。這平日意味著至多幾百萬次的相乘處置，盤算量偉大。淺顯來講，包括了數(shù)百萬次A*B+C的盤算，算力消費偉大。

　　為處理這一成績，AI芯片應(yīng)運而生。2017年開端，環(huán)繞AI芯片，半導(dǎo)體行業(yè)，戰(zhàn)事進(jìn)級，賽場上新老玩家暗流涌動，連橫合眾，年夜有“AI芯片太多，裝備都不敷用了”之勢。

　　時光進(jìn)入2018年，備受存眷的年夜小公司都將正式推出自研AI芯片。這些芯片也都被業(yè)界寄與厚望，能否能處理或許部門處理終端盤算困難？甚么樣的芯片能力夠真正順應(yīng)終端智能的需求？

　　這些都是我們非常獵奇且存眷的成績。因而也與一些創(chuàng)業(yè)者停止了交換。本文等于個中的一篇，來自于與探境科技CEO魯勇的訪談。今朝探境科技正研發(fā)實用于終真?zhèn)€AI芯片，在創(chuàng)業(yè)前魯勇曾在芯片廠商Marvell任高管，從事過存儲芯片的相干任務(wù)，而存儲恰是盤算以外一切芯片另外一焦點?；谶^往的閱歷、經(jīng)歷與不雅察，魯勇以為，做實用于終真?zhèn)€AI芯片，除要在盤算方面晉升，存儲優(yōu)化異樣相當(dāng)主要。

　　以下為注釋，來自36氪對魯勇的訪談內(nèi)容，36氪基于訪談內(nèi)容對其不雅點停止了整頓。

　　一

　　AI算法在芯片完成時碰到的焦點成績不是盤算資本而是存儲成績，強如GPU供給浩瀚的盤算資本，而現(xiàn)實盤算才能與盤算資本年夜為下降。

　　歸納綜合來講，存儲成績分為兩個部門，一個是帶寬成績，一個是功耗成績，這兩個成績的處理其實也是耦合在一路的。

　　詳細(xì)來講，深度進(jìn)修算法應(yīng)用年夜量存儲資本，即包含靜態(tài)模子參數(shù)，也包含收集層之間的靜態(tài)數(shù)據(jù)。關(guān)于靜態(tài)模子參數(shù)權(quán)重，動輒幾十兆上百兆樣本數(shù)目，沒法在片上SRAM保留，是以須要存入內(nèi)部DRAM。DRAM與AI盤算芯片間帶寬無限，假如芯片上盤算資本很年夜，但受存儲帶寬的瓶頸限制，現(xiàn)實盤算力年夜為降低。

　　打比喻來講，擔(dān)任存儲的DRAM和與擔(dān)任盤算的芯片就像是位于河兩岸的倉庫，全部運算的進(jìn)程可以類比從存儲的倉庫搬取數(shù)據(jù)、搬運過橋，將數(shù)據(jù)搬入盤算的單位停止處置，并高速輪回來去。而以后的AI芯片技巧重點晉升將數(shù)據(jù)搬入盤算單位后的處置速度，但由于搬出數(shù)據(jù)、過橋的進(jìn)程根本未發(fā)送變更，是以全體的效力晉升還絕對無限。

　　與之對應(yīng)的辦法等于戰(zhàn)勝存儲帶寬的手腕：一是削減數(shù)據(jù)量，下降所需數(shù)據(jù)帶寬，就是說想方法只需從倉庫搬出大批數(shù)據(jù)，便可以到達(dá)異樣的后果；二是更迷信的調(diào)劑數(shù)據(jù)應(yīng)用，晉升調(diào)劑的效力。

　?。?）削減數(shù)據(jù)容量

　　假如數(shù)據(jù)量下降了，這將整體上削減對DRAM的拜訪，在DRAM物理帶寬堅持不變的條件下，下降了DRAM的依附性，進(jìn)步了全體機能，同時削減DRAM拜訪也將年夜幅削減體系功耗開支。是以起首須要處理的成績是削減靜態(tài)參數(shù)權(quán)重的年夜小。平日的處理方法包含參數(shù)定點化，將每一個32bit浮點數(shù)削減為16bit以下的定點數(shù)，至多能下降50%乃至75%的存儲容量，也異樣幅度的下降了存儲帶寬的需求。理論證實16bit定點化可以采取線性量化的方法，而16bit以下定點化依據(jù)模子的分歧，有些須要采取非線性量化才可以到達(dá)保持模子機能的目標(biāo)。

　　今朝重要有模子剪枝、設(shè)計適于終端裝備的簡化收集兩種完成方法。模子剪枝作為進(jìn)一步下降模子容量和存儲帶寬的方法，是基于神經(jīng)收集模子存在年夜量冗余信息的基本，而另外一種從泉源開端從新設(shè)計適于終端裝備的簡化收集的方法也在逐步鼓起，從異樣范圍的收集機能來看，新設(shè)計的收集能夠比舊收集經(jīng)由過程剪枝再練習(xí)的方法更加簡略快捷，機能也更好。

　?。?）更迷信的調(diào)劑數(shù)據(jù)應(yīng)用

　　深度進(jìn)修的盤算年夜量應(yīng)用乘累加，即完成AXB+C的任務(wù)，這類乘累加單位（MAC）每次運算須要三個輸出，完成一個輸入。介入運算的數(shù)據(jù)包含事前預(yù)備好的權(quán)重參數(shù)和收集層發(fā)生的中央數(shù)據(jù)。每一個乘累加完成后的輸入平日也會作為下一次運算的輸出，是以若何調(diào)劑這些數(shù)據(jù)成為癥結(jié)。

　　功耗角度來講，從DRAM獲得數(shù)據(jù)所消費的功耗最年夜，從SRAM中獲得數(shù)據(jù)其次，從當(dāng)?shù)卮娣牌髦蝎@得數(shù)據(jù)消費功耗最低，但從本錢角度斟酌恰好相反，是以這三個分歧條理的存儲器的應(yīng)用異常癥結(jié)，我們愿望盡量削減DRAM的拜訪，最幻想的成果是僅從DRAM中讀取一次事前存好的模子參數(shù)，而不依附DRAM做任何其他任務(wù)。

　　從微觀上看，全部深度進(jìn)修運算盤算一次，進(jìn)入MAC的總數(shù)據(jù)量弘遠(yuǎn)于靜態(tài)數(shù)據(jù)的容量，由于不管是模子參數(shù)照樣中央數(shù)據(jù)都屢次被反復(fù)應(yīng)用，是以現(xiàn)實所需的數(shù)據(jù)帶寬異常年夜，而且當(dāng)一切這些數(shù)據(jù)都僅經(jīng)由過程DRAM被緩存應(yīng)用時，其功耗開支也是驚人的，是以充足應(yīng)用各級緩存的特征異常主要，設(shè)計一個公道的數(shù)據(jù)流，將屢次被反復(fù)應(yīng)用的數(shù)據(jù)放在離盤算資本較近的處所，大批讀取的數(shù)據(jù)放在DRAM中，將進(jìn)步盤算機能，下降體系功耗。

　　二

　　那末成績來了，若何能力設(shè)計一款真正實用于終真?zhèn)€AI芯片。

　　簡略的設(shè)計一個卷積加快器其實不能帶來深度進(jìn)修盤算機能上的進(jìn)步，及格的盤算架構(gòu)須要聯(lián)合對存儲成績的剖析來設(shè)計，不只要斟酌盤算架構(gòu)，也要斟酌存儲的數(shù)據(jù)流掌握，是以深度進(jìn)修的盤算特色并不是是一個簡略粗魯?shù)牟⑿斜P算成績。

　　起首照樣要斟酌浮點和定點盤算的成績，8 位的整數(shù)乘法比IEEE 754尺度下16位浮點乘法下降 6 倍的能耗，占用的芯單方面積也少 6 倍；而整數(shù)加法的差別是13倍的能耗與38倍的面積，是以終端AI芯片采取定點盤算將取得偉大收益。當(dāng)定點成為設(shè)計目的的時刻，要充足斟酌軟硬件的聯(lián)合，分歧收集對定點位數(shù)的影響水平是紛歧樣的，數(shù)據(jù)量化的詳細(xì)方法也有差別，有線性量化也有非線性量化的辦法，是以針對運用場景聯(lián)合軟件協(xié)同設(shè)計異常有需要。

　　其次深度進(jìn)修不是簡略粗魯?shù)牟⑿斜P算但依然有顯著的并行盤算特點，是以斟酌存儲成績后放入更多的盤算資本會年夜幅進(jìn)步盤算機能。起首將最多被反復(fù)應(yīng)用的數(shù)據(jù)放在接近盤算資本的處所，這相符較為風(fēng)行的In Memory Computing（存儲盤算一體化）的思惟，而且斟酌到以后工業(yè)程度，這更加現(xiàn)實，而經(jīng)由過程從新設(shè)計包含盤算單位的存儲單位或采取ReRAM等方法是將來的成長偏向。

　　第三要斟酌到深度進(jìn)修數(shù)據(jù)的另外一主要特征，即數(shù)據(jù)稀少化特征，也就是說在介入運算的數(shù)據(jù)中有年夜量的零值數(shù)據(jù)存在，這些零值數(shù)據(jù)便可以在存儲中被緊縮寄存，下降存儲容量和帶寬需求，也能夠在盤算中被進(jìn)一步驟度，削減運算壓力，進(jìn)步運算的有用機能。這些零值數(shù)據(jù)不只存在于模子參數(shù)中，也年夜量存在于神經(jīng)收集各層運算的中央數(shù)據(jù)中，這兩方面都須要停止斟酌。稀少數(shù)據(jù)在多焦點并行盤算中的調(diào)劑是個龐雜的成績，而分歧收集構(gòu)造也會帶來分歧的影響，是以將軟硬件協(xié)同設(shè)計，靜態(tài)調(diào)劑的調(diào)劑器長短常龐雜的設(shè)計難點。

　　最初要斟酌針對分歧收集的資本有用應(yīng)用率成績，因為神經(jīng)收集差別化較年夜，假如愿望針對分歧收集都有較高的資本有用應(yīng)用率，則須要在較細(xì)的顆粒度長進(jìn)行優(yōu)化，進(jìn)一步加深了數(shù)據(jù)流調(diào)劑器的龐雜度。

下一篇：李開復(fù)的達(dá)沃斯見聞：未來AI技術(shù)將影響8億人工作

上一篇：一天發(fā)21條推特，法國總統(tǒng)馬克龍邀谷歌來巴黎開AI實驗室

[ 行業(yè)資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類行業(yè)資訊

• 2025年全球人形機器人出貨量近1.8萬臺中國企業(yè) • 樂聚機器人與上電科簽署戰(zhàn)略合作協(xié)議
• 加速人形機器人進(jìn)工廠 • 蔚來資本領(lǐng)投，靈猴機器人再獲超億元Pre-B輪融
• 特斯拉“第三代人形機器人預(yù)計年產(chǎn)百萬臺”，產(chǎn) • 國內(nèi)首個自研智能建造機器人生態(tài)集群發(fā)布
• 百度等入股北京人形機器人創(chuàng)新中心，后者增資至 • 中國人形機器人行業(yè)發(fā)展迅猛大摩倍增2026年銷
• 特斯拉最新人形機器人2026年底前啟動量產(chǎn) • 特斯拉量產(chǎn)型第三代人形機器人Optimus將在本季

共0條 [查看全部] 相關(guān)評論

展會更多+

2026芯工業(yè)未來展

第21屆中國慈溪家

2026智能康養(yǎng)服務(wù)

2026亞洲國際物流

01-282026芯工業(yè)未來展(NICE)暨第26屆中國國際工業(yè)博覽會

01-272026中國（寧波）國際家電博覽會

01-27第21屆中國慈溪家用電器博覽會

01-092026中國（寧波）五金機電進(jìn)出口博覽會

01-072026智能康養(yǎng)服務(wù)機器人展暨第26屆中國工博會機器人展

視頻更多+

中舟智能固守科技

玉灃科技：精研滑

新松機器人自動化

羅克韋爾自動化（

10-11中舟智能固守科技創(chuàng)新新品首發(fā)添彩中國夢

10-11玉灃科技：精研滑臺十二載遙遙領(lǐng)先的模組

08-05新松機器人自動化股份有限公司

07-18羅克韋爾自動化（中國）企業(yè)宣傳片

07-18凌華科技機器手臂視覺導(dǎo)引解決方案

點擊排行

可賣爆米花、進(jìn)廠打“打零工”，

智元機器人與藍(lán)思科技攜手推動

機器人：優(yōu)必選今年產(chǎn)能將達(dá)萬臺

拓展海外市場、吸引全球研發(fā)中心

專家預(yù)測：2030年前全機器人汽

山東將加快工業(yè)母機機器人等產(chǎn)業(yè)

深耕水下機器人，山東未來機器人

瑞松科技：高精高速機器人投產(chǎn)下

中國人形機器人行業(yè)發(fā)展迅猛大

特斯拉量產(chǎn)型第三代人形機器人Op

欧美色视频日本片免费看,老熟女大屁股熟妇av,亚洲成v人影片在线观看,天天操狠狠操天天做,午夜美女啪啪视频播放,日韩三级影片中文字幕,真实国产乱子伦视频在线,日韩上床视频在线免费观看,欧美性爱2022天堂网

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機器人及行業(yè)應(yīng)用

智能機器人

工業(yè)自動化

智能裝備

AI芯片之爭白熱化的當(dāng)下，如何設(shè)計一款真正適用于終端的AI芯片？

• 2025年全球人形機器人出貨量近1.8萬臺中國企業(yè)	• 樂聚機器人與上電科簽署戰(zhàn)略合作協(xié)議
• 加速人形機器人進(jìn)工廠	• 蔚來資本領(lǐng)投，靈猴機器人再獲超億元Pre-B輪融
• 特斯拉“第三代人形機器人預(yù)計年產(chǎn)百萬臺”，產(chǎn)	• 國內(nèi)首個自研智能建造機器人生態(tài)集群發(fā)布
• 百度等入股北京人形機器人創(chuàng)新中心，后者增資至	• 中國人形機器人行業(yè)發(fā)展迅猛大摩倍增2026年銷
• 特斯拉最新人形機器人2026年底前啟動量產(chǎn)	• 特斯拉量產(chǎn)型第三代人形機器人Optimus將在本季

2026芯工業(yè)未來展	第21屆中國慈溪家
2026智能康養(yǎng)服務(wù)	2026亞洲國際物流

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（

欧美色视频日本片免费看,老熟女大屁股熟妇av,亚洲成v人影片在线观看,天天操狠狠操天天做,午夜美女啪啪视频播放,日韩三级影片中文字幕,真实国产乱子伦视频在线,日韩上床视频在线免费观看,欧美性爱2022天堂网

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機器人及行業(yè)應(yīng)用

智能機器人

工業(yè)自動化

智能裝備

AI芯片之爭白熱化的當(dāng)下，如何設(shè)計一款真正適用于終端的AI芯片？

AI芯片之爭白熱化的當(dāng)下，如何設(shè)計一款真正適用于終端的AI芯片？