GDDR是Graphics Double Data Rate的縮寫,全稱為雙圖像倍數(shù)據(jù)速率。它是一種專為圖形處理單元(GPU)設(shè)計(jì)的同步雙數(shù)據(jù)速率動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)。1998年,三星電子推出了首款16 Mb GDDR內(nèi)存芯片。自此拉開了GPU和CPU在內(nèi)存道路上的分道揚(yáng)鑣。起初,顯卡內(nèi)存兼容CPU內(nèi)存,主要使用DDR內(nèi)存,然而鑒于圖像處理需求逐年攀升,顯卡逐漸轉(zhuǎn)向采用專門為圖形處理器(GPU)設(shè)計(jì)GDDR。由于GDDR具有更高的數(shù)據(jù)傳輸速率和帶寬,在推動(dòng)GPU的發(fā)展過程中起到了很關(guān)鍵的作用。
GDDR技術(shù)發(fā)展歷程
歷經(jīng)二十余年發(fā)展,GDDR家族已經(jīng)迭代至第七代,GDDR家族主要有GDDR、GDDR2、GDDR3、GDDR4、GDDR5 和 GDDR6,以及最新推出的GDDR 7。在此,我們先看下前六代的技術(shù)和性能上的情況。
來源:imec
雖然GDDR專為GPU設(shè)計(jì),但是最開始的一二代GDDR和GDDR 2并沒有比DDR提升很多,因此也沒得到GPU廠商的大規(guī)模采用。所以GDDR的正式被認(rèn)可和迭代可以說是從GDDR3開始。
自GDDR3開始,Nvidia和AMD等主要GPU廠商的參與使得GDDR標(biāo)準(zhǔn)得到了大幅提升,得益于制程工藝的不斷進(jìn)步,GDDR3內(nèi)存的數(shù)據(jù)傳輸速率從最初的1GHz一路攀升至2.5GHz,實(shí)現(xiàn)了大幅提升,并保持了長達(dá)五年的生命周期,為現(xiàn)代圖形處理和計(jì)算提供了強(qiáng)大的支持。
GDDR4在GDDR3的基礎(chǔ)上,進(jìn)一步提升了數(shù)據(jù)傳輸速率和能效。雖然GDDR4在技術(shù)上取得了進(jìn)步,但由于當(dāng)時(shí)NVIDIA和ATI之間對于GDDR 4標(biāo)準(zhǔn)意見相左,且存在激烈的競爭關(guān)系,NVIDIA沒有采用GDDR 4,這導(dǎo)致其市場占有率相對有限,成本很高,GDDR4很快就被歷史所遺忘。
GDDR5大幅提升了帶寬和速度,成為2008年后高性能顯卡的標(biāo)配。GDDR5具有更高的時(shí)鐘頻率和數(shù)據(jù)傳輸速率,廣泛應(yīng)用于各類圖形處理和計(jì)算任務(wù)中。GDDR5之后,NVIDIA還與美光推出了GDDR5X半代產(chǎn)品,用于NVIDIA高端顯卡。
而GDDR6則在數(shù)據(jù)傳輸速率和能效方面進(jìn)一步提升,成為現(xiàn)代高端GPU的主流選擇。GDDR6X引入了PAM4(Pulse Amplitude Modulation 4)信號技術(shù),顯著提高了數(shù)據(jù)傳輸速率。Nvidia在其Ampere架構(gòu),如GeForce RTX 3080和RTX 3090,率先采用了GDDR6X內(nèi)存。
可以看出,從最初的GDDR到最新的GDDR6,GDDR內(nèi)存經(jīng)歷了多次技術(shù)迭代和性能提升。每一代GDDR內(nèi)存都在數(shù)據(jù)傳輸速率、帶寬和能效方面不斷優(yōu)化,滿足了GPU和圖形處理日益增長的需求。如今,它已成為人工智能和大數(shù)據(jù)應(yīng)用領(lǐng)域中最受歡迎的內(nèi)存芯片之一。
GDDR7大戰(zhàn)打響
目前,三星、美光和SK海力士均已開始提供GDDR7內(nèi)存樣品,GDDR 7大戰(zhàn)即將拉開序幕。
三星和SK海力士打頭陣
三星和SK海力士在今年3月份NVIDIA的GTC大會(huì)上均宣布了各家GDDR7的相關(guān)指標(biāo)。兩家公司都展示了16Gb(2GB)密度的產(chǎn)品,24Gb(3GB)更高版本沒有在這一波浪潮中展現(xiàn)。
按照三星的披露,三星GDDR7芯片能夠在僅1.1 V的DRAM電壓下實(shí)現(xiàn)32 Gbps的速度,這超過了JEDEC的GDDR7規(guī)范中的1.2 V,這一性能是通過首次應(yīng)用PAM3信號實(shí)現(xiàn)的。再加上三星特有的其他電源管理創(chuàng)新,能源效率提高了20%,將待機(jī)功耗降低 50%,從而減少整體功耗。三星還在封裝基板方面進(jìn)行了一些創(chuàng)新,它使用了一種導(dǎo)熱性高、熱阻低的環(huán)氧模塑料 (EMC) 進(jìn)行 GDDR7 封裝,以確保有源元件(IC本身)不會(huì)過熱,與 GDDR6 芯片相比,熱阻降低了70%。這些芯片采用512M x32組合,采用266針FBGA 封裝。
而SK海力士表示它將提供速度高達(dá)40 Gbps的GDDR7芯片。與其前身GDDR6相比,最新的GDDR7產(chǎn)品提供的最大帶寬達(dá)到160GB/s,是其上一代產(chǎn)品(GDDR6位80GB/s)的兩倍,功耗效率提升了40%,同時(shí),內(nèi)存密度提升了1.5倍,使得視覺效果也進(jìn)一步得到增強(qiáng)。獨(dú)立的四通道的模式,提高了內(nèi)存并行處理能力,每個(gè)通道支持32字節(jié)的數(shù)據(jù)訪問。除了四通道模式,GDDR7還支持雙通道模式,提供了靈活的配置選項(xiàng),以適應(yīng)不同的應(yīng)用需求和系統(tǒng)架構(gòu)。
SK海力士GDDR7技術(shù)指標(biāo)
(來源:SK海力士)
SK海力士GDDR7采用與GDDR6相同的板尺寸,大小為12mm x 14mm,這意味著在設(shè)計(jì)和制造過程中,GDDR7可以直接替換現(xiàn)有的GDDR6模塊,而無需對電路板進(jìn)行重新設(shè)計(jì)。此外,GDDR7內(nèi)存還配備了專用的內(nèi)存實(shí)現(xiàn)方案和PCB(印刷電路板)設(shè)計(jì),以最大化其性能和效率。
(來源:SK海力士)
SK海力士的16Gb GDDR7 芯片基本已經(jīng)準(zhǔn)備就緒,將在今年晚些時(shí)候批量出貨。三星的也在出樣品的過程中。
雖然尚不清楚誰將成為三星和SK海力士GDDR7內(nèi)存的首批客戶,但是考慮到兩家均在NVIDIA GTC2024上進(jìn)行展示,這也很清楚地表明NVIDIA是其中之一。
姍姍來遲的美光
2024年6月4日,美光宣布開始為下一代GPU提供GDDR7內(nèi)存樣品,它有28GB/s和32Gb/s兩種速度。新一代GDDR7采用美光科技的1β (1-beta) DRAM 技術(shù)制造,在能效和性能上實(shí)現(xiàn)了大幅提升。
美光在宣布這一消息時(shí)公布了一些誘人的數(shù)字。該公司表示,32Gb/s GDDR7提供的內(nèi)存帶寬比GDDR6高出60%,在384位總線上可達(dá)到1.5TB/s的內(nèi)存帶寬。這比其前代產(chǎn)品有了顯著的飛躍,前代產(chǎn)品在RTX 4090等 GPU上的384位內(nèi)存總線上最高可達(dá)1TB/s。同時(shí),工作電壓降低至1.2V,上一代為1.35V,美光表示,其GDDR7的效率比GDDR6 提高了50%,實(shí)現(xiàn)節(jié)能的方式主要包括分割電壓平面、部分設(shè)備運(yùn)行和休眠模式。采用FBGA更薄的封裝高度(1.1mm對比1.2mm)和高熱導(dǎo)EMC封裝,提供65%更好的熱阻,這為臺式機(jī)和筆記本電腦提供了更好的熱管理。
美光GDDR6與GDDR7特點(diǎn)比較
美光GDDR7的這些特性提升使其在游戲、生成式AI、高性能計(jì)算(HPC)領(lǐng)域前景廣闊。也就意味著GDDR7可能與HBM相競爭。如美光所述,在游戲領(lǐng)域,GDDR7預(yù)計(jì)在每秒幀數(shù)(FPS)方面可提升超過30%,特別是在光線追蹤和光柵化工作負(fù)載下;在生成式AI應(yīng)用中,GDDR7提供超過1.5 TB/s的高系統(tǒng)帶寬,預(yù)計(jì)可將生成式AI文本到圖像生成的響應(yīng)時(shí)間減少多達(dá)20%;對于HPC,GDDR7預(yù)計(jì)能夠減少處理時(shí)間,實(shí)現(xiàn)復(fù)雜工作負(fù)載(如動(dòng)畫、3D設(shè)計(jì)、科學(xué)仿真和金融建模)的無縫多任務(wù)處理。
據(jù)美光的公告,其GDDR7內(nèi)存將于2024年下半年直接從美光以及通過精選的全球渠道分銷商和經(jīng)銷商發(fā)售。NVIDIA使用美光的內(nèi)存是板上釘釘了,因?yàn)榇饲懊拦鈱iT為 Nvidia 制造了GDDR6x,不過在美光GDDR7的公告中也提到了AMD,因此AMD也可能會(huì)加入這一行列。
GDDR 7最大的技術(shù)變化
2024年3月,JEDEC發(fā)布了GDDR7 內(nèi)存標(biāo)準(zhǔn)規(guī)范。JEDEC 是微電子行業(yè)標(biāo)準(zhǔn)制定領(lǐng)域的全球領(lǐng)導(dǎo)者。如下圖所示,GDDR7的每引腳帶寬最高可達(dá)48 Gbps,遠(yuǎn)高于GDDR6和GDDR6X的24 Gbps。在256位總線寬度下,GDDR7的總帶寬達(dá)到1024 GB/sec,顯著高于GDDR6和GDDR6X的768 GB/sec。GDDR7的工作電壓為1.2 V,比GDDR6和GDDR6X的1.35 V更低。在信號技術(shù)上, GDDR7采用PAM-3信號技術(shù),而GDDR6X采用PAM-4,GDDR6則使用傳統(tǒng)的NRZ信號技術(shù)。GDDR7的最大密度達(dá)到64 Gb,是GDDR6和GDDR6X的兩倍。GDDR7采用266 FBGA封裝,高于GDDR6和GDDR6X的180 FBGA。
圖表展示了GDDR7相對于前幾代在帶寬、功耗和封裝上的顯著改進(jìn)。來源:anandtech
GDDR7最大的技術(shù)變化在于內(nèi)存總線從2位不歸零 (NRZ) 編碼轉(zhuǎn)換為3位脈沖(-1、0、+1)幅度調(diào)制 (PAM3) 編碼。PAM3使GDDR7能夠在兩個(gè)周期內(nèi)傳輸3位數(shù)據(jù),僅這一變化就讓數(shù)據(jù)傳輸效率提高了50%。隨著向PAM3信號的轉(zhuǎn)變,內(nèi)存行業(yè)有了一條新途徑來擴(kuò)展 GDDR 設(shè)備的性能并推動(dòng)圖形和各種高性能應(yīng)用的持續(xù)發(fā)展。
來源:三星
上圖可以很直觀的看出NRZ和PAM編碼的不同。
之前的GDDR標(biāo)準(zhǔn)使用非歸零(NRZ)技術(shù),通過兩種信號電平來傳輸編碼為1或0的數(shù)據(jù)。這種方法在多個(gè)GDDR世代中都足夠使用,但隨著時(shí)鐘速度和系統(tǒng)復(fù)雜性的增加,成為了一大瓶頸。為了解決這一挑戰(zhàn),美光與英偉達(dá)推出了采用多級信號技術(shù)的創(chuàng)新GDDR6X技術(shù)。美光是唯一提供GDDR6X的公司,GDDR6X利用PAM4信號技術(shù),提供了業(yè)界領(lǐng)先的>1.1 TB/s帶寬。
美光在GDDR6X方面的成功和經(jīng)驗(yàn)為下一代使用類似信號方法的GDDR奠定了基礎(chǔ)。雖然PAM3每周期傳輸?shù)谋忍財(cái)?shù)量低于GDDR6X上的PAM4,但PAM3提供了50%的更高電壓裕度,并且編碼復(fù)雜度更低,這減少了對內(nèi)存總線更高頻率的需求,緩解了由此產(chǎn)生的信號損失。
值得一提的是,GDDR7將能夠在PAM-3和NRZ之間切換,具體取決于所承受的負(fù)載。當(dāng)需要極高的性能時(shí),會(huì)激活 PAM-3,但對于降低能耗很重要的情況(例如非游戲、桌面使用),則會(huì)啟用 NRZ 以保持良好的散熱效果。
另外一個(gè)很大的技術(shù)變革是,GDDR 7內(nèi)存具有4個(gè)獨(dú)立通道,可優(yōu)化各種工作負(fù)載的數(shù)據(jù)流,因此延遲相對較低。
GDDR 通道架構(gòu)
(來源:anandtech)
寫在最后
三星、SK海力士、美光三大存儲(chǔ)巨頭均推出了自家的GDDR7內(nèi)存產(chǎn)品,并展開了激烈的競爭。誰能在這場技術(shù)競賽中脫穎而出,尚需時(shí)間驗(yàn)證。然而,這場較量不僅僅關(guān)乎市場份額的爭奪,更在于誰能在性能、能效和創(chuàng)新應(yīng)用上實(shí)現(xiàn)突破,引領(lǐng)下一代圖形內(nèi)存技術(shù)的發(fā)展方向。
至于GDDR7的顯卡何時(shí)問世?考慮到 AMD 和 Nvidia 每兩年發(fā)布新 GPU 架構(gòu)的節(jié)奏,NVIDIA 和 AMD 預(yù)計(jì)將在 2024 年下半年推出首款采用 GDDR7 的獨(dú)立 GPU。最可能的是消費(fèi)級Blackwell架構(gòu)產(chǎn)品和AMD的RDNA 4。讓我們拭目以待。