【芯片】訓練時間降低90%以上!世界最大的芯片WSE有望打破AI計算瓶頸
發(fā)布日期:2020-01-04
點擊次數:580
【新智元導讀】還記得幾個月前問世的世界最大的AI芯片嗎?IEEE Spectrum團隊最近訪問了其制造商Cerebras的工廠,并對CEO和技術團隊進行了訪談,CerebrasCEO表示,這款劃時代的芯片有望突破AI的計算瓶頸,將訓練時間由幾周縮短到幾小時。戳右邊鏈接上新智元小程序了解更多!
人工智能計算機初創(chuàng)公司Cerebras Systems CEO兼聯(lián)合創(chuàng)始人Andrew Feldman表示,如今的人工智能僅僅只是開始。
正如他及其同僚所言,問題在于當今的深度神經網絡十分耗時且計算密集,訓練非常困難。比如,自動駕駛汽車要識別道路上遇到的所有重要物體,神經網絡需要向其顯示所有物體的很多、很多相關圖像。這一過程在數據中心進行,由耗電數十有時甚至數百千瓦的計算機完成,任務時間經常長達數周。
Cerebras的客戶抱怨說,使用當下的計算機訓練大型神經網絡的時間可能長達6周。照這樣,一年只能訓練6個神經網絡。“只有驗證更多想法才會產生新想法,” Feldman說。“如果能在2或3個小時內完成[網絡訓練],就可以嘗試數千個想法。”
當IEEE Spectrum訪問位于美國加州Los Altos的Cerebras總部時,這些客戶及一些潛在客戶已經通過橙色光纜把他們的訓練數據輸入4臺CS-1計算機。這些64厘米高的機器運轉起來,每臺消耗20千瓦,散發(fā)的熱量通過墻上的一個洞流到硅谷的大街上。
從外面看,CS-1機身并不大,每個機箱大約3/4是冷卻系統(tǒng),余下的1/4則是真正的革命:一臺性能強悍的計算機,幾乎完全由一整塊芯片組成。這塊芯片的面積高達46,255平方毫米,是任何一塊可以買到的處理器芯片的50+倍。這就是由Cerebras生產的世界最大芯片Wafer Scale Engine (WSE),它有12,000億個晶體管,400,000個AI可編程內核,18 GB超快速片上存儲器(SRAM)和100Petabits /s的結構帶寬。
Cerebras的統(tǒng)計數據令人震驚。據稱,一個10機架TPU二代集群(現在已更新為Google AI計算機的第三代集群)所耗電量是其5倍,占用空間是其30倍,而性能僅有搭載WSE芯片的計算機的1/3。單塊巨型芯片是否真正是AI社區(qū)所需,相信這個答案從今年開始就會清晰起來。美國加州山景城公司LinleyGroup的高級分析師Mike Demler說:“ [神經網絡]模型日益復雜,能夠快速訓練或再訓練確實很重要。”
Feldman說,2015年當Cerebras的創(chuàng)始人們開會時,他們想要打造完全適配當下AI工作場景的計算機,這些工作場景有若干項定義:它們需要快速移動大量數據,它們需要內存接近于處理器內核,并且這些內核不需要處理其他內核正在處理的數據。
這立即給了公司資深的計算機架構師一些啟發(fā)。首先,他們可以使用成千上萬個專門用于神經網絡相關計算的小型內核,而不是更少、更通用的內核;其次,這些內核應該互連在一起,可以快速而低耗的移動數據;最后,所有數據應該在處理器芯片上,而不是在單獨的存儲芯片上。
在這些內核之間來回移動數據的需求,正是WSE獨特性的來源。兩個內核之間移動數據最快、能耗最低的方法是將其放在同一硅基片。當數據必須從一個芯片傳輸至另一個芯片時,由于距離更長并且傳遞信號的“電線”必須更寬并且包裝密度更低,從而在速度和功耗上大打折扣。
所有通信在硅上的驅動力,以及對小內核和本地存儲器的渴望,都表明要盡可能生產大芯片,也許是整個硅晶圓那么大。Feldman說,很明顯,我們做不到這一點,但是這顯然有很大的好處。
數十年,工程師一直認為晶圓級芯片是一條死路。畢竟,IBM System/360大型機的首席架構師Gene Amdahl曾在一家名為Trilogy Systems的公司嘗試并失敗了,但它足夠令人稱奇。但是Lauterbach和Feldman說,任何與Amdahl方法的對比都已經過時。當時Amdahl使用的晶圓尺寸只有現在的1/10,而晶圓上相關器件的尺寸則是現在的30倍。
更重要的是,Trilogy無法處理生產芯片時出現的不可避免的錯誤。如果其他所有條件相同,隨著芯片增大,缺陷的可能性也會增加。如果你的芯片尺寸接近于一張信紙(8.5" *11"規(guī)格),那么缺陷在所難免。
但是Lauterbach看到了一種架構解決方案:由于他們針對的工作負載傾向于擁有數千個相同的小型內核,因此可以嵌入足夠多的冗余內核,這甚至可以解決1/100的缺陷造成的故障,并且依然不失為一塊功能強勁的大型芯片。
當然,Cerebras仍然不得不解決許多制造問題,才能打造其容錯性的giganto芯片。比如,光刻工具被設計為將其定義特征的樣式投射到相對較小的矩形上,并一遍遍重復進行。由于在晶片不同位置澆鑄不同樣式的高昂成本和巨大困難,這樣已經把打造單一晶圓的許多系統(tǒng)拒之門外。
Cerebras內部:冷卻系統(tǒng)占CS-1大部分,WSE芯片位于左后角。
但是WSE無需這樣。它就像布滿相同芯片的典型晶圓,與你平常制造的一樣。最大的挑戰(zhàn)是把這些偽芯片連接在一起。
芯片制造商在每個芯片周圍留下空白硅的細長邊緣,稱之為劃片線。晶圓通常沿著這些線切成小塊。Cerebras與臺積電(TSMC)合作開發(fā)了一種跨劃片線建立互連的方法,使每個偽芯片中的內核皆可通信。
現在,所有通信和內存在一塊硅片上,數據傳輸可以暢通無阻,從而產生每秒1,000 PB的內核到內核帶寬和每秒9 PB的SRAM到內核帶寬。Feldman說,這不僅僅是多,而是帶寬4個數量級的提升,因為我們在硅片上。
跨劃片線互連并不是需要的唯一發(fā)明。制造芯片的硬件必須進行改良。即使電子設計自動化軟件也要進行定制才能在如此大的芯片上工作。Feldman說,每條規(guī)則,每個工具,每個制造設備都旨在拾取一塊正常大小“巧克力芯片曲奇”,而[我們]要交付的是整個曲奇烤盤;方法的每一步,我們都必須發(fā)明。
他接著說,晶圓級集成在人們視野中消失了40年,但它肯定會在某個時候再出現;既然Cerebras已經做到,那扇門可能也會向其他人打開。“我們認為其他人將尋求與我們合作解決AI以外的問題。”他又說。
2018年,Google、百度及一些學術頂級機構開始制定基準,允許系統(tǒng)之間進行一一對應的比較。結果,MLPerf于2018年5月發(fā)布了訓練基準。
借助這些基準,神經網絡訓練技術在過去幾年取得長足進步。Nvidia DGX SuperPOD(本質上是有1,500塊GPU的超級計算機)可在80秒內完成ResNet-50圖像分類問題,與之相比,Nvidia DGX-1(大約在2017年)花費了8個小時,K80(在2015年)花費了25天。
Cerebras尚未發(fā)布MLPerf結果,以及任何其他可獨立一一核對的結果。相反,他們更傾向于讓客戶使用自己的神經網絡和數據來試用CS-1。
分析師認為,這種做法很常見。“每個公司都根據自身業(yè)務開發(fā)相關模型,” Moor Insights的AI分析師Karl Freund說。“這是客戶唯一關心的事情。”
舉個例子,早期的客戶阿貢國家實驗室的需求很大。最近在訓練神經網絡以實時識別不同類型的引力波事件時,科學家使用了阿貢實驗室耗電兆瓦級別的Theta超級計算機(排名第28的全球最強大系統(tǒng))資源的1/4。
把功耗降到僅幾千瓦對超算來說似乎是一個核心優(yōu)勢。這是否是一個吸引數據中心的賣點,不幸的是Lauterbach對此表示懷疑。他說:“雖然許多數據中心都在談節(jié)能降耗,但只是口頭說說,實際上并不在意,他們真正想要的是性能。這當然是一個幾乎和餐盤差不多大小的處理器芯片所能滿足的。”
深圳市晶友嘉電子有限公司在頻率器件行業(yè)已發(fā)展超過14年, 具備國際標準體系ISO9001、ISO14001等認證, 在深圳建有生產基地,能快速化響應市場需求,供應性能穩(wěn)定和高性價比的貼片和插件晶振;
貼片晶振產品廣泛的應用在電源管理、儀器儀表、PC及周邊小家電、通訊產品、邏輯電路、應用于DVB (數字機頂盒)、GPS(衛(wèi)星定位)、DVD及數碼相框、高性能MODEM、路由器、VPN接入服務器、無線路由器、網絡存儲設備(NAS)、VOIP網關、數字硬盤錄像機(Digital video recorder, DVR)、DSLAMs、高端打印機、教學演示網絡設備、交換機、機頂盒、稅控機、液晶顯示驅動、鼠標、鍵盤、藍牙音響、車載MP3、LCD控制板。
應用領域:新能源汽車電子、智能機器人、無人機、醫(yī)療電子、2.4G無線通訊、微波通信、光網絡通訊、藍牙、移動終端、物聯(lián)網、工業(yè)控制、及安防行業(yè)都取得一定的市場占有率。
晶友嘉是品質晶振生產廠家,歡迎來廠蒞臨指導,電話:0755-32840201
貼片晶振產品廣泛的應用在電源管理、儀器儀表、PC及周邊小家電、通訊產品、邏輯電路、應用于DVB (數字機頂盒)、GPS(衛(wèi)星定位)、DVD及數碼相框、高性能MODEM、路由器、VPN接入服務器、無線路由器、網絡存儲設備(NAS)、VOIP網關、數字硬盤錄像機(Digital video recorder, DVR)、DSLAMs、高端打印機、教學演示網絡設備、交換機、機頂盒、稅控機、液晶顯示驅動、鼠標、鍵盤、藍牙音響、車載MP3、LCD控制板。
應用領域:新能源汽車電子、智能機器人、無人機、醫(yī)療電子、2.4G無線通訊、微波通信、光網絡通訊、藍牙、移動終端、物聯(lián)網、工業(yè)控制、及安防行業(yè)都取得一定的市場占有率。
晶友嘉是品質晶振生產廠家,歡迎來廠蒞臨指導,電話:0755-32840201