你的位置:首頁 > 測試測量 > 正文

DRAM技術(shù)的極限在哪里?

發(fā)布時(shí)間:2017-12-20 來源:Kevin Fogarty 責(zé)任編輯:wenwei

【導(dǎo)讀】過去二十年來,基于 DRAM 的計(jì)算機(jī)內(nèi)存的存取帶寬已經(jīng)提升了 20 倍,容量增長了 128 倍。但延遲表現(xiàn)僅有 1.3 倍的提升,卡內(nèi)基梅隆大學(xué)的研究者 Kevin Chang 如是說,他提出了一種用于解決該問題的新型數(shù)據(jù)通路…
 
如果人類創(chuàng)造了一個(gè)真正有自我意識的人工智能,那么等待數(shù)據(jù)到達(dá)可能會讓它倍感沮喪。
 
過去二十年來,基于 DRAM 的計(jì)算機(jī)內(nèi)存的存取帶寬已經(jīng)提升了 20 倍,容量增長了 128 倍。但延遲表現(xiàn)僅有 1.3 倍的提升,卡內(nèi)基梅隆大學(xué)的研究者 Kevin Chang 如是說,他提出了一種用于解決該問題的新型數(shù)據(jù)通路。
 
現(xiàn)代計(jì)算機(jī)需要大量高速度、高容量的內(nèi)存才能保證持續(xù)運(yùn)轉(zhuǎn),尤其是工作重心是內(nèi)存數(shù)據(jù)庫、數(shù)據(jù)密集型分析以及越來越多的機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練功能的數(shù)據(jù)中心服務(wù)器。盡管研究人員已經(jīng)在尋找更好、更快的替代技術(shù)上努力了很多年,但在性能優(yōu)先的任務(wù)上,DRAM 仍舊是人們普遍采用的選擇。
 
這有助于解釋今年的 DRAM 銷量激增,盡管據(jù) IC Insights 報(bào)告稱供應(yīng)有限讓其平均售價(jià)增長了 74%。售價(jià)激增讓 DRAM 市場收入達(dá)到了創(chuàng)紀(jì)錄的 720 億美元,幫助將 IC 市場的總收入推升了 22%。據(jù)這份 IC Insights 報(bào)告說,如果沒有來自 DRAM 價(jià)格的額外增長(過去 12 個(gè)月增長了 111%),那么 2017 年整個(gè) IC 市場的增長將只能達(dá)到 9%,相比而言 2016 年僅有 4%。
 
對于 DRAM 這樣一個(gè)很多人都想替代的成熟技術(shù)而言(因?yàn)樗乃俣冗_(dá)不到處理器一樣快),這個(gè)數(shù)字確認(rèn)驚人。當(dāng)前或未來有望替代 DRAM 的技術(shù)有很多,但專家們似乎認(rèn)為這些技術(shù)還無法替代 DRAM 的性價(jià)比優(yōu)勢。就算用上 DRAM 技術(shù)上規(guī)劃的改進(jìn)方案以及 HBM2 和 Hybrid Memory Cube 等新型 DRAM 架構(gòu),DRAM 和 CPU 之間的速度差距依然還是存在。
 
Rambus 的系統(tǒng)與解決方案副總裁和杰出發(fā)明家 Steven Woo 在 CTO 辦公室中說,來自 JEDEC 的下一代 DRAM 規(guī)格 DDR5 的密度和帶寬都是 DDR4 的 2 倍,可能能夠帶來一些提速。
 
對于需要密集計(jì)算而且對時(shí)間敏感的金融技術(shù)應(yīng)用以及其它高端分析、HPC 和超級計(jì)算應(yīng)用而言,這將會非常重要——尤其是當(dāng)與專用加速器結(jié)合起來時(shí)。
 
Woo 說:“對更高內(nèi)存帶寬和更大內(nèi)存容量的需求是顯然存在的,但 DDR5 本身并不足以滿足這些需求,我們也不清楚其它哪些技術(shù)可能會取得成功。我們已經(jīng)看到很多處理過程(比如加密貨幣挖礦和神經(jīng)網(wǎng)絡(luò)訓(xùn)練)正從傳統(tǒng)的 x86 處理器向 GPU 和專用芯片遷移,或者對架構(gòu)進(jìn)行一些修改,讓數(shù)據(jù)中心中的處理更靠近數(shù)據(jù)的存儲位置,就像邊緣計(jì)算或霧計(jì)算。”
 
DRAM技術(shù)的極限在哪里?
圖 1:新標(biāo)準(zhǔn)的引入(source: Cadence)
 
據(jù) Babblabs 公司 CEO 兼斯坦福大學(xué) System X 的戰(zhàn)略顧問 Chris Rowen 說,對于在神經(jīng)網(wǎng)絡(luò)上訓(xùn)練機(jī)器學(xué)習(xí)應(yīng)用而言,GPU 顯然最受歡迎的,但芯片制造商和系統(tǒng)制造商也在實(shí)驗(yàn)一些稍微成熟的技術(shù),比如 GDDR5,這是一種為游戲機(jī)、顯卡和 HPC 開發(fā)的同步圖形 RAM,英偉達(dá)也正是這么使用它的。
 
DRAM技術(shù)的極限在哪里?
圖 2:內(nèi)存在芯片層次結(jié)構(gòu)中的位置(source:Rambus)
 
由 SK 海力士和三星制造的 HBM2 將一些高速 DRAM 芯片放在了增加了一些邏輯處理的層級以及提供了到處理器的高速數(shù)據(jù)鏈路的 interposer 之上,從而讓內(nèi)存與處理器之間的距離比 GDDR5 的設(shè)計(jì)更近。HBM2 是高速度至關(guān)重要的 2.5D 封裝中的一項(xiàng)關(guān)鍵元素。HBM2 是一項(xiàng)與 Hybrid Memory Cube 相競爭的 JEDEC 標(biāo)準(zhǔn)。Hybrid Memory Cube 是由 IBM 和美光開發(fā)的,使用了過硅通孔(TSV)來將不同的內(nèi)存層連接到基礎(chǔ)邏輯層。
 
應(yīng)用硅光子學(xué)的光學(xué)連接(optical connection)也能實(shí)現(xiàn)加速。到目前維持,大多數(shù)硅光子學(xué)應(yīng)用都在數(shù)據(jù)中心中的服務(wù)器機(jī)架和存儲之間以及高速網(wǎng)絡(luò)連接設(shè)備內(nèi)部。業(yè)內(nèi)專家預(yù)計(jì)這種技術(shù)將會在未來幾年里向離處理器更近的位置遷移,尤其是當(dāng)其封裝技術(shù)得到完全驗(yàn)證并且設(shè)計(jì)流程將這項(xiàng)技術(shù)包含進(jìn)來之后。光學(xué)方法的優(yōu)勢是發(fā)熱很慢而且速度非常快,但光波還是要在轉(zhuǎn)換成電信號之后才能存儲和處理數(shù)據(jù)。
 
另外還有 Gen-Z、CCIX、OpenCAPI 等新型互連標(biāo)準(zhǔn),也有 ReRAM、英特爾的相變 3D Xpoint、 3D NAND 和磁相變 MRAM 等新型內(nèi)存類型。
 
NVDIMM 速度更慢但容量更大,增加電池或超級電容可以實(shí)現(xiàn)非易失性,從而讓它們可以使用更低的功耗緩存比普通 DRAM 更多的數(shù)據(jù),并且還能保證它們在斷電時(shí)不會丟失交易數(shù)據(jù)。據(jù)八月份來自 Transparency Market Research 的一份報(bào)告稱,支持 NVDIMM 的芯片制造商包括美光和 Rambus,預(yù)計(jì)其銷售額將會從 2017 年的 7260 萬美元增長到 2025 年的 1.84 億美元。
 
選擇這么多,可能會讓人困惑,但針對機(jī)器學(xué)習(xí)或大規(guī)模內(nèi)存數(shù)據(jù)庫或視頻流來調(diào)整內(nèi)存性能會讓選擇更輕松一些,因?yàn)槠渲忻糠N任務(wù)都有不同的瓶頸。Rowen 說:“實(shí)現(xiàn)帶寬增長有一些主流的選擇——DDR3、DDR4、DDR5,但你也可以嘗試其它選擇,從而讓內(nèi)存帶寬滿足你想做的事情。”
 
Rowen 說,對于有意愿編寫直接控制 NAND 內(nèi)存的代碼的人來說,整個(gè)問題可能還會更簡單;而如果是鼓搗協(xié)議和接口層,讓 NAND 看起來就像是硬盤并且掩蓋在上面寫入數(shù)據(jù)的難度,那就可能會更加困難。“有了低成本、容量和可用性,我認(rèn)為在讓閃存存儲包含越來越多存儲層次上存在很多機(jī)會。” 冷卻 DRAM
 
Rambus 的內(nèi)存與接口部門的首席科學(xué)家 Craig Hampel 說,每一種內(nèi)存架構(gòu)都有自己的優(yōu)勢,但它們都至少有一個(gè)其它每一種集成電路都有的缺點(diǎn):發(fā)熱。如果你能可靠地排出熱量,你就可以將內(nèi)存、處理器、圖形協(xié)處理器和內(nèi)存遠(yuǎn)遠(yuǎn)更加緊密地堆積到一起,然后可以在節(jié)省出的空間中放入更多服務(wù)器,并且還能通過減少內(nèi)存與系統(tǒng)其它組件之間的延遲來提升性能。
 
液體冷卻是讓絕緣礦物油流經(jīng)組件的冷卻方法。據(jù) IEEE Spectrum 2014 年的一篇文章稱,液體冷卻讓香港的比特幣挖礦公司 Asicminer 的 HPC 集群的冷卻成本降低了 97%,并且還減少了 90% 的空間需求。
 
自 2015 年以來,Rambus 就一直在與微軟合作開發(fā)用于量子計(jì)算的內(nèi)存,這是微軟開發(fā)拓?fù)淞孔佑?jì)算機(jī)工作的一部分。因?yàn)榱孔犹幚砥髦荒茉诔蜏丨h(huán)境下運(yùn)行(低于 -292℉/-180℃/93.15K),所以 Rambus 正為該項(xiàng)目測試的 DRAM 也需要在這樣的環(huán)境下工作。Rambus 在 4 月份時(shí)擴(kuò)展了該項(xiàng)目,那時(shí)候 Hampel 說該公司已經(jīng)確信寒冷能帶來重大的性能增益。
 
DRAM技術(shù)的極限在哪里?
圖 3:低溫計(jì)算和存儲(source: Rambus)
 
比如,當(dāng) CMOS 足夠冷時(shí),CMOS 芯片的數(shù)據(jù)泄露(data leak)就會完全停止。幾乎就會變成非易失的。它的性能會增長,能讓內(nèi)存的速度趕上處理器的速度,從而消除 IC 行業(yè)內(nèi)一大最頑固的瓶頸。在 4K 到 7K 這樣極端低溫的環(huán)境下,線材將變成超導(dǎo)體,讓芯片僅需非常少的能量就能實(shí)現(xiàn)長距離通信。
 
低溫系統(tǒng)還有額外的優(yōu)勢。比起空調(diào)制冷,低溫系統(tǒng)能從堆疊的內(nèi)存芯片中抽取出更多熱量,從而可實(shí)現(xiàn)更大的堆疊(或其它組裝方式)密度,實(shí)現(xiàn)更高效的協(xié)作。Hampel 說:“抽取熱量讓你能將服務(wù)器機(jī)架的大小減小多達(dá) 70%,這意味著數(shù)據(jù)中心每立方英尺的密度增大了。這讓它們更容易維護(hù),也可以更容易地將它們放在之前無法到達(dá)的地方。”
 
更重要的是,如果在處理器層面上實(shí)現(xiàn)的效率提升與數(shù)據(jù)中心其它地方的提升基本一致,那么低溫系統(tǒng)可以讓現(xiàn)有的數(shù)據(jù)中心更有成本效益和實(shí)現(xiàn)更高效的計(jì)算,從而可以減少對更多數(shù)據(jù)中心的需求。
 
而且不需要非常冷就可以收獲其中大多數(shù)效益;將內(nèi)存冷卻到 77K(-321℉/-196℃)就能得到大多數(shù)效益了。
 
Hampel 說:“液氮很便宜——每加侖幾十美分,而且在達(dá)到大約 4 K 的超級冷之前,成本上漲其實(shí)也并不快。降到50K 左右其實(shí)并不貴。” 接近處理器
 
據(jù) Marvell 存儲部門總監(jiān) Jeroen Dorgelo 說,超低溫冷卻可以延長數(shù)據(jù)中心中 DRAM 的壽命,但隨著行業(yè)從 hyperscale 規(guī)模向 zettascale 規(guī)模演進(jìn),已有的任何芯片或標(biāo)準(zhǔn)都無法應(yīng)付這樣的數(shù)據(jù)流。他說,DRAM 雖快但功率需求大。NAND 不夠快,不適合擴(kuò)展,而大多數(shù)前沿的內(nèi)存(3D XPoint、MRAM、ReRAM)也還無法充分地?cái)U(kuò)展。
 
但是大多數(shù)數(shù)據(jù)中心還沒有處理好變得比現(xiàn)在遠(yuǎn)遠(yuǎn)更加分布式的需求。據(jù) Marvell 的連接、存儲和基礎(chǔ)設(shè)施業(yè)務(wù)部網(wǎng)絡(luò)連接 CTO Yaniv Kopelman 說,分布式有助于減少遠(yuǎn)距離發(fā)送給處理器的數(shù)據(jù)的量,同時(shí)可將大多數(shù)繁重的計(jì)算工作留在數(shù)據(jù)中心。
 
IDC 的數(shù)據(jù)中心硬件分析師 Shane Rau 說,社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)和幾乎其它每個(gè)地方的數(shù)據(jù)所帶來的壓力正迫使數(shù)據(jù)中心蔓延擴(kuò)展——在全國各地建立兩三個(gè)大規(guī)模數(shù)據(jù)中心,而不是在單一一個(gè)地方建一個(gè)超大規(guī)模數(shù)據(jù)中心。
 
Rau 說:“規(guī)模確實(shí)不一樣,但問題的關(guān)鍵仍然是延遲。比如說,如果我旁邊就有一個(gè)數(shù)據(jù)中心,我就不需要將我的數(shù)據(jù)移動太遠(yuǎn)距離,而且我可以在我的筆記本電腦上完成一些處理,更多的處理則在本地?cái)?shù)據(jù)中心中進(jìn)行,所以在數(shù)據(jù)到達(dá)它要到達(dá)的位置時(shí)已經(jīng)經(jīng)過一些處理了。很多人在談將處理工作放到存儲的位置是為了平衡不同設(shè)備基礎(chǔ)上的瓶頸?,F(xiàn)在,規(guī)模問題更多是關(guān)于讓數(shù)據(jù)中心在邊緣完成一些工作,即數(shù)據(jù)的產(chǎn)生位置和數(shù)據(jù)的最終去處之間。”
 
 
 
 
 
 
 
 
 
 
 
推薦閱讀:



用“沒電”電池給電路供電
淺談車用雷達(dá)的測試解決方案
如何提高隔離式電源的效率?
新型助聽器無線充電解決方案
BOM制作中容易碰到的四大“坑”
 
 
 
要采購機(jī)架么,點(diǎn)這里了解一下價(jià)格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉