最近幾年來(lái),大量資金投入到數(shù)據(jù)中心領(lǐng)域新型AI處理器的研發(fā)中。
但在投資熱潮的背后,我們也要注意問(wèn)題畢竟這個(gè)領(lǐng)域需要處理的問(wèn)題是具體的,結(jié)果是不可預(yù)測(cè)的,而且這個(gè)領(lǐng)域的競(jìng)爭(zhēng)對(duì)手財(cái)力雄厚,能夠提供用戶粘性強(qiáng)的產(chǎn)品
對(duì)于新的AI芯片設(shè)計(jì)公司來(lái)說(shuō),最大的問(wèn)題是來(lái)自終端的數(shù)據(jù)不足。
你需要多少個(gè)數(shù)據(jù)中心才能盈利。
通常,芯片設(shè)計(jì)公司在設(shè)計(jì)新的AI處理器時(shí),首先會(huì)發(fā)現(xiàn)一個(gè)基本問(wèn)題:——如何定義產(chǎn)品的靈活性它是為單一任務(wù)設(shè)計(jì)的嗎還是支持更多工作負(fù)載
這兩個(gè)問(wèn)題之間有一系列的解決方案,但與過(guò)去的很多解決方案相比,更難找到適合AI處理器的解決方案,尤其是對(duì)于數(shù)據(jù)中心的工作負(fù)載。
難度更大,因?yàn)樾枰胶獾囊蛩睾芏嘈枰谝欢ǖ某杀竞蜁r(shí)間內(nèi)設(shè)計(jì)制造芯片,并考慮成本和回報(bào)Synopsys公司人工智能產(chǎn)品和研發(fā)總監(jiān)斯泰利奧斯迪亞曼提迪斯解釋道這些限制縮小了人工智能處理器的潛在市場(chǎng)
我們什么時(shí)候可以在設(shè)計(jì)和制造定制芯片時(shí)賺錢Synopsys驗(yàn)證組工程副總裁Susheel Tadikonda說(shuō)
如果我們想為數(shù)據(jù)中心提供定制芯片,我們需要多少個(gè)數(shù)據(jù)中心才能盈利高價(jià)出售芯片也許是可能的,但光靠這一點(diǎn)是不夠的如果你為消費(fèi)電子設(shè)備設(shè)計(jì)和制造芯片,這個(gè)領(lǐng)域有10億臺(tái)設(shè)備,這是AISC芯片可以賺取更多利潤(rùn)的市場(chǎng)之一當(dāng)然,設(shè)備越大越好
可是,即使我們最終發(fā)現(xiàn)有多少數(shù)據(jù)中心可以盈利,我們也無(wú)法確定設(shè)計(jì)計(jì)劃。
西門子EDA戰(zhàn)略與業(yè)務(wù)發(fā)展高級(jí)經(jīng)理Anoop Saha表示:芯片的定制化程度越來(lái)越高,因此可以為非常具體的算法創(chuàng)建芯片,從而提供更高的能效和性能但這將犧牲部分市場(chǎng),縮短芯片壽命如果兩年后出現(xiàn)新的算法,為舊算法定制的芯片的價(jià)值會(huì)保持不變嗎很多事情都會(huì)互相牽制
一些邊緣算法確實(shí)已經(jīng)穩(wěn)定下來(lái)了這是因?yàn)榻?jīng)過(guò)多年的研究,業(yè)界已經(jīng)找到了一些針對(duì)多場(chǎng)景的最佳算法,比如我們已經(jīng)看到的CNN,以及針對(duì)喚醒詞檢測(cè),手寫(xiě)識(shí)別等具體應(yīng)用找到的算法最佳算法阿諾普薩哈補(bǔ)充道
芯片定制的優(yōu)勢(shì)
定制芯片,核心是了解——芯片定制給很多玩家?guī)?lái)了什么樣的工作量。
Xilinx人工智能與軟件產(chǎn)品市場(chǎng)總監(jiān)Nick Ni表示:大多數(shù)大型企業(yè)都成立了自己的芯片部門,并為數(shù)據(jù)中心的一些高工作負(fù)載打造芯片例如,如果谷歌認(rèn)為‘推薦’的神經(jīng)網(wǎng)絡(luò)是其數(shù)據(jù)中心最高的工作負(fù)載之一,那么它就有必要為此目的制造一種特殊的芯片如果排名第二的工作負(fù)載是語(yǔ)音識(shí)別,排名第三的工作負(fù)載是YouTube的視頻轉(zhuǎn)碼,那么為其構(gòu)建一個(gè)專門的芯片是有意義的
事實(shí)上,這里有很多機(jī)會(huì),但谷歌只是一個(gè)孤立的案例幾年前,谷歌發(fā)表了一篇廣受好評(píng)的論文,指出——數(shù)據(jù)中心的工作負(fù)載類型非常豐富,但沒(méi)有工作負(fù)載占比超過(guò)10%,這意味著仍然存在大量的小工作負(fù)載需要優(yōu)化
Synopsys的迪亞曼提迪斯說(shuō):大多數(shù)定制都是面向推理的,當(dāng)這些定制芯片轉(zhuǎn)向訓(xùn)練時(shí),它們需要浮點(diǎn)支持。
但如果需要的是一個(gè)100%應(yīng)用于推理的解,它的固定點(diǎn)數(shù)可能是8,甚至更低如果模型是固定的,基于推理設(shè)備定制有意義嗎例如,針對(duì)語(yǔ)音,視頻和其他重量級(jí)應(yīng)用的定制解決方案Hyperscaler實(shí)際上是在投資用于推理的芯片解決方案,這些解決方案適合他們自己在AI領(lǐng)域定制的高級(jí)模型和解決方案但是,如果需要處理多個(gè)應(yīng)用程序,則需要更多靈活性和可定制性
當(dāng)然,這對(duì)谷歌來(lái)說(shuō)是一個(gè)良性循環(huán)Synopsys的Tadikonda表示:TPU旨在滿足谷歌數(shù)據(jù)中心的特定工作負(fù)載谷歌開(kāi)始建設(shè)TPU,是因?yàn)樗庾R(shí)到需要建設(shè)大量的數(shù)據(jù)中心來(lái)處理如此龐大而復(fù)雜的數(shù)據(jù)和計(jì)算
第一代TPU很大,消耗了大量的電力,但通過(guò)不斷學(xué)習(xí)已經(jīng)得到了改進(jìn)這是這些TPU的作品,也就是谷歌
不是每個(gè)公司都可以使用谷歌的反饋回路,但其他公司確實(shí)有其他選擇西門子的Saha表示:我們發(fā)現(xiàn),其中一個(gè)關(guān)鍵點(diǎn)就是要重視并重視盡早選擇合適的架構(gòu)
也不是基于過(guò)去的經(jīng)驗(yàn),憑直覺(jué)做出的決定,因?yàn)楝F(xiàn)在還有太多的未知數(shù)業(yè)界正在做的,是在設(shè)計(jì)周期早期,依靠數(shù)據(jù)驅(qū)動(dòng)做出決定,這樣我們能夠在發(fā)現(xiàn)某些東西不起作用時(shí)迅速做出改變
這些決定是宏觀的,也可以是微觀的比如說(shuō),你的存儲(chǔ)元素與計(jì)算元素差距有多大Saha 問(wèn)道:再比如,多久執(zhí)行一次內(nèi)存讀取,這是一個(gè)重要的問(wèn)題,因?yàn)樽x取和寫(xiě)入將直接影響整體的能效業(yè)界正在尋找新的架構(gòu),沒(méi)有人知道什么樣的架構(gòu)才真正起作用不過(guò)可以確定的是,要有一定的可塑性,且在決定架構(gòu)之前,能夠確保有足夠的市場(chǎng)數(shù)據(jù)來(lái)支撐
硬件和算法迭代快
影響架構(gòu)選擇的另一個(gè)因素是硬件和算法的發(fā)展速度這決定了數(shù)據(jù)中心所有者從他們購(gòu)買的硬件中賺錢的時(shí)間,也決定了他們?cè)敢庵Ц兜膬r(jià)格,同時(shí)限定了芯片開(kāi)發(fā)的總成本
那么,數(shù)據(jù)中心芯片的使用壽命是多久。
通常情況下,芯片或電路板的壽命為三到四年,Xilinx 的 Ni 說(shuō)一些較為激進(jìn)的數(shù)據(jù)中心可能會(huì)在這一時(shí)間段內(nèi)升級(jí),還有一些則會(huì)持續(xù)使用更長(zhǎng)時(shí)間在人工智能領(lǐng)域,如果我們關(guān)注 Google TPU 的發(fā)布新聞,就能發(fā)現(xiàn)在過(guò)去六年左右的時(shí)間里,Google 發(fā)行了四個(gè)版本的 TPU,也就是說(shuō),幾乎每隔一兩年 Google 就會(huì)更換一次內(nèi)部硬件,針對(duì) AI 等快速變化的工作負(fù)載進(jìn)行優(yōu)化
換個(gè)角度來(lái)看,AI 芯片公司可能每 18 個(gè)月就有一次進(jìn)入數(shù)據(jù)中心的機(jī)會(huì)要攪動(dòng)這個(gè)市場(chǎng)并不容易,Saha 說(shuō)有兩個(gè)重要因素 —— 更換現(xiàn)有數(shù)據(jù)中心芯片的頻率,以及添加新東西的頻率我看見(jiàn)幾乎所有的數(shù)據(jù)中心都在嘗試更新的東西,幾乎每個(gè)構(gòu)建數(shù)據(jù)中心芯片的公司都在同一些終端客戶合作
市場(chǎng)多久更換一次正在工作的芯片只要芯片在工作,公司就會(huì)盡量延長(zhǎng)芯片的使用壽命一旦芯片進(jìn)入數(shù)據(jù)中心,持續(xù)的時(shí)間會(huì)很長(zhǎng)且難以更換這就是為什么我們可以看到大型數(shù)據(jù)中心芯片領(lǐng)域有大量投資
一部分投資者認(rèn)為這是贏家通吃的市場(chǎng),最終會(huì)有一至三個(gè)獲勝者獲得最大的市場(chǎng)份額一旦市場(chǎng)被這些公司占領(lǐng),這些公司的地位就很難被取代
設(shè)計(jì)面向 18 個(gè)月后的芯片
如果從今天開(kāi)始設(shè)計(jì)芯片,那么這顆芯片必須滿足 18 個(gè)月后需要滿足的條件。
當(dāng)我們決定對(duì)芯片進(jìn)行模塊化時(shí),我們還必須針對(duì)特定精度進(jìn)行優(yōu)化,Xilinx 的 Ni 說(shuō)例如,當(dāng)我們選擇在 8 位數(shù)精度上做文章時(shí),我們不得不立下賭約,當(dāng)這款產(chǎn)品成為主流時(shí),8 位仍然是主流
我們還要確保制造出的產(chǎn)品可以處理混合精度網(wǎng)絡(luò),其中一半是 8 位,四分之一是 4 位,另外四分之一是 1 位為此,我們?cè)?AI 引擎中執(zhí)行 8 位,其運(yùn)行基本性能非常快,然后可以在 FPGA 架構(gòu)中實(shí)現(xiàn) 4 位和 1 位 MAC 單元
設(shè)計(jì)時(shí)間和算法進(jìn)化的時(shí)間要保持一致在 18 個(gè)月內(nèi),應(yīng)用程序很可能會(huì)變得相當(dāng)不同,Tadikonda 警告說(shuō)我認(rèn)為今天的數(shù)據(jù)科學(xué)家不會(huì)向任何人保證他們將在未來(lái) 18 個(gè)月內(nèi)運(yùn)行與今天相同的模型
還有其他一系列決策也需要作出。
量化可能是許多能效指標(biāo)中的最大因素,Saha 說(shuō)量化將對(duì)推理產(chǎn)生更大的影響,推理分散在數(shù)據(jù)中心和邊緣之間,但在‘學(xué)習(xí)’端也需要一些量化當(dāng)我們量化成較低的位數(shù)時(shí),就意味著我們正在權(quán)衡能效而不是準(zhǔn)確性訓(xùn)練可能需要浮點(diǎn)數(shù),不過(guò)有一些新型浮點(diǎn)數(shù)出現(xiàn)谷歌在設(shè)計(jì)下一代 TPU 時(shí),他們創(chuàng)造了 Bfloat16,這是用于訓(xùn)練的大腦浮點(diǎn)數(shù)它與 IEEE 浮點(diǎn)數(shù)非常不同,它在精度上具有浮點(diǎn)數(shù)的優(yōu)勢(shì),但也具有顯著的能效優(yōu)勢(shì)
不過(guò)這將讓經(jīng)濟(jì)因素陷入困境。
對(duì)于如此規(guī)模的 ASIC,需要在快速變化節(jié)奏里付出巨大的努力,只有少數(shù)公司能夠保證其經(jīng)濟(jì)性,Tadikonda 說(shuō)因?yàn)橛嘘P(guān)這些數(shù)據(jù)的用例正在增加,所以算法正在發(fā)生變化我們今天認(rèn)為有效的算法明天不一定有效,想要跟上節(jié)奏并處于最前沿,就必須不斷創(chuàng)新或重新研發(fā) ASIC谷歌占據(jù)優(yōu)勢(shì),因?yàn)樗鼡碛凶銐蚨嗟臄?shù)據(jù)以至于能快速攪動(dòng)局面,它從自己的 TPU 中學(xué)到了很多東西,知道為了保證程序運(yùn)行地更好需要作出哪些改變
如果我是第三方芯片開(kāi)發(fā)商,我沒(méi)有這些數(shù)據(jù),就只能依靠我的客戶來(lái)提供,因此周轉(zhuǎn)周期會(huì)更長(zhǎng)谷歌的情況非常特殊
數(shù)據(jù)的缺乏也給驗(yàn)證帶來(lái)壓力浮點(diǎn)硬件的驗(yàn)證對(duì)滿足這些芯片的性能和功耗要求至關(guān)重要,OneSpin 市場(chǎng)營(yíng)銷主管 Rob Van Blommestein 說(shuō)
長(zhǎng)期以來(lái),浮點(diǎn)硬件設(shè)計(jì)的驗(yàn)證一直被認(rèn)為是一項(xiàng)重大挑戰(zhàn)FPU將浮點(diǎn)運(yùn)算的數(shù)學(xué)復(fù)雜性與需要復(fù)雜控制路徑的各種特殊情況相結(jié)合我們需要一種正式的驗(yàn)證解決方案,以驗(yàn)證由硬件浮點(diǎn)單元 計(jì)算出的算術(shù)運(yùn)算結(jié)果是否與 IEEE 754 標(biāo)準(zhǔn)規(guī)范準(zhǔn)確匹配
結(jié)論
人們常說(shuō),數(shù)據(jù)是新的石油,這一比喻在人工智能領(lǐng)域得以明顯體現(xiàn)。
對(duì)于芯片架構(gòu)師來(lái)說(shuō),這個(gè)比喻再恰切不過(guò)他們需要訪問(wèn)數(shù)據(jù)來(lái)改進(jìn)構(gòu)建更好的產(chǎn)品,這也是數(shù)據(jù)中心處理器用戶黏性高的原因,架構(gòu)師們一旦擁有數(shù)據(jù)中心處理器,就有機(jī)會(huì)獲得需要的數(shù)據(jù)
另一個(gè)唯一可行的辦法是加快設(shè)計(jì)速度來(lái)提升效率,推動(dòng)產(chǎn)品成本的回收 —— 但具有諷刺意味的是,在試圖通過(guò)提升效率來(lái)解決問(wèn)題的時(shí)候,AI 卻成為了唯一的阻礙者。
畢竟,AI 領(lǐng)域的算法進(jìn)化速度和變數(shù)實(shí)在是太大了。
本文地址:http://www.dayishuiji.com/finance/8702.html - 轉(zhuǎn)載請(qǐng)保留原文鏈接。免責(zé)聲明:本文轉(zhuǎn)載上述內(nèi)容出于傳遞更多信息之目的,不代表本網(wǎng)的觀點(diǎn)和立場(chǎng),故本網(wǎng)對(duì)其真實(shí)性不負(fù)責(zé),也不構(gòu)成任何其他建議;本網(wǎng)站圖片,文字之類版權(quán)申明,因?yàn)榫W(wǎng)站可以由注冊(cè)用戶自行上傳圖片或文字,本網(wǎng)站無(wú)法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。 |