2018-07-25
隨著摩爾定律的腳步放緩,人工智能(AI)正成為半導(dǎo)體產(chǎn)業(yè)的新指導(dǎo)原則。接下來(lái),從材料到組件——硬件、軟件與系統(tǒng)——都必須以全新途徑展開(kāi)更多的協(xié)作... 電子制作模塊
“摩爾定律已死,人工智能萬(wàn)歲!”(Moore’s Law is dead, long live AI.)。這是半導(dǎo)體產(chǎn)業(yè)最近的一個(gè)新口號(hào),就從日前于美國(guó)西部半導(dǎo)體展(Semicon West 2018)中一場(chǎng)由應(yīng)用材料(Applied Materials)贊助的全天活動(dòng)上響起。
應(yīng)材新市場(chǎng)與聯(lián)盟事業(yè)群資深副總裁Steve Ghanayem表示,“半導(dǎo)體工藝節(jié)點(diǎn)的時(shí)代列車(chē)即將邁入尾聲。接下來(lái),從材料到組件——硬件、軟件與系統(tǒng)——都必須以全新途徑展開(kāi)更多的合作。”Steve Ghanayem原來(lái)負(fù)責(zé)應(yīng)材的晶體管和互連部門(mén),目前則致力于尋找收購(gòu)和結(jié)盟的機(jī)會(huì),協(xié)助該公司朝向摩爾定律(Moore’s Law)以外的方向進(jìn)展。
當(dāng)然,摩爾定律還沒(méi)有完全消失;對(duì)于幾家公司來(lái)說(shuō),朝向更小型芯片的競(jìng)賽也仍持續(xù)進(jìn)行中。
在Semicon West的專(zhuān)題演講中,應(yīng)材首席執(zhí)行官Gary Dickerson表示,該公司不久將發(fā)布新的晶體管材料,它能將漏電流降低三個(gè)數(shù)量級(jí)以上。對(duì)于芯片制造商而言,這項(xiàng)消息幾乎就像2007年英特爾(Intel)在高k金屬閘方面取得進(jìn)展一樣重要。但是,今天這樣的進(jìn)展只會(huì)影響到規(guī)模越來(lái)越小的設(shè)計(jì)社群和公司。
根據(jù)人工智能(AI)內(nèi)存處理器(PIM)芯片設(shè)計(jì)公司Syntiant首席執(zhí)行官Kurt Busch估計(jì),7納米(nm)芯片投片大約要花1億美元,而從投片到第一款芯片產(chǎn)出大概要拖延到4個(gè)月的時(shí)間。“只有很少的公司能負(fù)擔(dān)得起這樣龐大的金額。而像我們這樣的一家新創(chuàng)公司,可沒(méi)辦法負(fù)擔(dān)1億美元的天文數(shù)字。”
不久前才離開(kāi)高通(Qualcomm)的服務(wù)器處理器架構(gòu)師Dileep Bhandarkar說(shuō):“我越來(lái)越不那么熱衷于最新的工藝節(jié)點(diǎn)了。它們對(duì)于像高通這樣的公司十分有利,但并不適用于其他所有人。”
伯克利大學(xué)榮譽(yù)教授David Patterson表示,“我認(rèn)為這大概就是摩爾定律終結(jié)的情況了。”他指出,臺(tái)積電(TSMC)的晶體管成本持平,英特爾也在致力于生產(chǎn)10nm芯片,“而有95%的架構(gòu)師認(rèn)為未來(lái)都脫離不了專(zhuān)用處理器。”Patterson曾經(jīng)參與Google TPU的設(shè)計(jì)。
最近才退休的前英特爾資深微技術(shù)影專(zhuān)家Yan Borodovsky則期望能從摩爾定律傳承火炬至AI,使其成為指引半導(dǎo)體產(chǎn)業(yè)未來(lái)道路的一盞明燈。
他說(shuō):“我認(rèn)為超越當(dāng)今馮·諾伊曼(von Neuman)的架構(gòu)將因‘超越摩爾定律’(more than Moore)而受益。例如,憶阻器交叉開(kāi)關(guān)可望成為神經(jīng)形態(tài)運(yùn)算的基本組成部份……超越摩爾定律的世界很可能是關(guān)于你可以在特定區(qū)域放置多少種類(lèi)的突觸以及他們有多么復(fù)雜…。”
應(yīng)材準(zhǔn)備發(fā)布可大幅降低漏電的晶體管材料(來(lái)源:Applied Materials)
致力于宣傳所謂“新認(rèn)知時(shí)代”(a new cognitive era)的IBM認(rèn)知解決方案暨研究資深副總John Kelly III表示,支持包括AI的2兆美元業(yè)務(wù)決策,就建立在1.5兆美元的IT業(yè)務(wù)之上。
Kelly說(shuō):“我經(jīng)歷過(guò)摩爾定律的早期階段,但現(xiàn)在發(fā)生的一些事情將真正改變這個(gè)世界,這些都與人工智能有關(guān)……這將帶來(lái)50年或更久的技術(shù)創(chuàng)新,并將推動(dòng)我們的半導(dǎo)體產(chǎn)業(yè)繼續(xù)向前發(fā)展。”
IBM最近為美國(guó)政府研究人員打造了13mW Summit系統(tǒng),這是第一臺(tái)專(zhuān)用于處理AI任務(wù)的超級(jí)計(jì)算機(jī),其中并搭載部份的輝達(dá)(Nvidia) GPU。Kelly說(shuō):“你不會(huì)再看到其他的傳統(tǒng)超級(jí)計(jì)算機(jī)了——因?yàn)樗鼈儗⒃谖磥?lái)的運(yùn)算中融入AI……。”
事實(shí)上,機(jī)器學(xué)習(xí)的一大挑戰(zhàn)在于推動(dòng)推論工作,以及最終在網(wǎng)絡(luò)邊緣為功耗受限的處理器進(jìn)行訓(xùn)練任務(wù)。對(duì)于像百度(Baidu)、Facebook和Google等巨擘而言,采用當(dāng)今的GPU可能要花數(shù)周的時(shí)間才能完成訓(xùn)練模型任務(wù),這可說(shuō)是個(gè)夢(mèng)魘。
Syntiant的Busch說(shuō):“我們將在五年內(nèi)看到邊緣開(kāi)始執(zhí)行一些訓(xùn)練。一開(kāi)始先在數(shù)據(jù)中心處理神經(jīng)網(wǎng)絡(luò)的前幾層,而最后幾層則在邊緣處理——這是不可避免的。”
AI將成為許多產(chǎn)業(yè)領(lǐng)域的性能驅(qū)動(dòng)力。針對(duì)以30格/秒(f/s)速率進(jìn)行高解析(HD)視訊串流進(jìn)行AI處理,大約需要每秒9.4TFLOS的運(yùn)算效能。Nvidia首席科學(xué)家Bill Dally在主題演講中表示,自動(dòng)駕駛車(chē)將會(huì)需要許多像這樣的高性能攝影機(jī)。
IBM的Kelly宣傳認(rèn)知運(yùn)算時(shí)代來(lái)臨(來(lái)源:EE Times)
隨著AI設(shè)下了更積極的新性能目標(biāo),業(yè)界也提出了實(shí)現(xiàn)這些愿景的新技術(shù)方向,包括在新材料、工藝、電路、架構(gòu)、封裝和算法方面的研究。簡(jiǎn)言之,必須為AI重新思考每一件事。
加州大學(xué)洛杉磯分校(UCLA)電子工程學(xué)系教授Jason Woo說(shuō):“我們一直在考慮將MRAM或ReRAM作為閃存(flash)的替代方案……但是,AI為采用新興內(nèi)存與不同材料的交叉架構(gòu)開(kāi)辟了新的亮點(diǎn),可用于實(shí)現(xiàn)更多的線性模擬微縮,就像可編程的憶阻器一樣。”
Woo及其研究團(tuán)隊(duì)一直在探索整合邏輯功能的三端比內(nèi)存數(shù)組。這是Syntiant和Mythic等新創(chuàng)公司以及IBM研究人員希望用于AI加速器(基于內(nèi)存內(nèi)運(yùn)算)的新型編程組件。
由于AI工作負(fù)載的平行本質(zhì),也為封裝技術(shù)帶來(lái)了絕佳機(jī)會(huì)。為數(shù)據(jù)中心進(jìn)行訓(xùn)練提供全光罩芯片設(shè)計(jì)的新創(chuàng)公司Cerebras Systems首席技術(shù)官Gary Lauterback說(shuō),我們不應(yīng)該局限于單芯片設(shè)計(jì),封裝方面也有很大的潛力,可以克服在Denard微縮中遇到的瓶頸。
許多最新的數(shù)據(jù)中心芯片都采用了2.5D堆棧的邏輯和內(nèi)存。同時(shí),臺(tái)積電正推出用于智能型手機(jī)和其他裝置的眾多晶圓級(jí)扇出封裝版本,工程師還需要一個(gè)能因應(yīng)AI需求的譯碼器。
Bhandarkar說(shuō):“從成本和性能來(lái)看,我還找不到任何理想的多芯片技術(shù)。至今見(jiàn)過(guò)最好的要算是英特爾的EMIB,但它也并非所有人都可以使用。”
Dally透過(guò)縮減神經(jīng)網(wǎng)絡(luò)的大小及其矩陣數(shù)學(xué)的精度,快速地簡(jiǎn)化了算法與任務(wù)。他說(shuō),采用混合精度數(shù)學(xué),超級(jí)計(jì)算機(jī)老將Jack Dongarra因而能在Summit系統(tǒng)上帶來(lái)exaFLOPS級(jí)的AI性能。
Nvidia的研究人員以低至2位展現(xiàn)浮點(diǎn)運(yùn)算的愿景,而Imec研究機(jī)構(gòu)則進(jìn)一步探索單一位的途徑。
Dally補(bǔ)充說(shuō),神經(jīng)網(wǎng)絡(luò)本身可以從根本上簡(jiǎn)化,以減少運(yùn)算量。他說(shuō),即使只使用了10%的神經(jīng)網(wǎng)絡(luò)權(quán)重和30%的啟動(dòng)效能,其準(zhǔn)確度也不至于降低到讓人無(wú)法接受。SqueezeNet就是針對(duì)嵌入式AI的案例之一。
Nvidia的Dally說(shuō)神經(jīng)網(wǎng)絡(luò)需要減少一些權(quán)重(來(lái)源:EE Times)
可怕的是必須走出已經(jīng)熟悉的道路,但這也可能是一件好事。Dally說(shuō):“成為一名計(jì)算機(jī)架構(gòu)師是一個(gè)非常激動(dòng)人心的時(shí)刻。如今,就讓摩爾定律其自然地發(fā)展吧!我們必須真的變得更加智慧。”
IBM的Kelly指出,如果這一切不幸都失敗了,那么就得發(fā)揮量子運(yùn)算的潛力了。IBM的實(shí)驗(yàn)室已開(kāi)發(fā)出一套50個(gè)量子位(qubit)的系統(tǒng)了。
他說(shuō):“在50到100個(gè)量子位之間,系統(tǒng)將在幾秒鐘內(nèi)完成運(yùn)算,這是當(dāng)今計(jì)算機(jī)永遠(yuǎn)達(dá)不到的……除了AI之外,這是我一生中見(jiàn)過(guò)的最重要的事情了——它改變了游戲規(guī)則。”
其他人則警告道,針對(duì)如何建構(gòu)和使用量子系統(tǒng),目前還有許多的基礎(chǔ)研究正在進(jìn)行中。
美國(guó)桑迪亞國(guó)家實(shí)驗(yàn)室(Sandia National Laboratories)首席技術(shù)研究員Conrad James說(shuō):“我們知道如何打造深度學(xué)習(xí)系統(tǒng),但并不了解它們?nèi)绾芜\(yùn)作……而且我們現(xiàn)在仍然處于嘗試不同技術(shù)的起步階段。量子研究則恰好相反。我們了解數(shù)學(xué)和物理,但并不知道如何打造量子系統(tǒng)。”
隨著摩爾定律逐漸式微,量子運(yùn)算的未來(lái)還有很長(zhǎng)的路要走。在指引未來(lái)發(fā)展方向的道路上,半導(dǎo)體產(chǎn)業(yè)幾乎沒(méi)有太多的選擇。AI萬(wàn)歲!
編譯:Susan Hong