亚洲AV综合色区在线观看天天,免费人成动漫在线播放

“海盜”來(lái)襲 AMD下代顯卡核心技術(shù)前瞻

網(wǎng)友投稿2022-08-26 06:35:08

　　近段時(shí)間NVIDIA在顯卡市場(chǎng)可謂動(dòng)作頻頻，搶先發(fā)布了新一代Maxwell架構(gòu)，帶來(lái)了能耗比超高的GTX 750系列顯卡；后又陸續(xù)曝光了NVLINK、3D memory等下代頂級(jí)顯卡獨(dú)有的新技術(shù)。AMD顯然也不會(huì)閑著，和NVIDIA從主流市場(chǎng)著手布局下代顯卡的風(fēng)格不同，AMD選擇要玩就玩大的。前不久，AMD毫無(wú)征兆地就拋出了下代頂級(jí)顯卡的主要技術(shù)規(guī)格，更讓人興奮的是，AMD承諾讓玩家們?cè)谀陜?nèi)就看到它的身影......

　　按照AMD此前的規(guī)劃，R9 290X相對(duì)HD7970只是一個(gè)過(guò)渡升級(jí)產(chǎn)品。半導(dǎo)體工藝都為28nm，架構(gòu)改動(dòng)極小，僅從HD7970的GCN1.0升級(jí)到GCN1.1，Direct X支持能力也只從11.1版本小幅提高到11.2版本。拋開(kāi)TrueAudio等一系列外圍功能的演進(jìn)，就顯卡的計(jì)算能力來(lái)說(shuō)R9 290X的架構(gòu)變化并不大。只是R9 290X流處理器數(shù)量的增多最終確實(shí)帶來(lái)了比HD 7970高出40%左右的游戲能力，這樣的表現(xiàn)在玩家們看來(lái)可能不驚艷，但就升級(jí)換代任務(wù)來(lái)說(shuō)，R9 290X已經(jīng)圓滿完成了。

　　而現(xiàn)在是時(shí)候?qū)Α斑^(guò)渡”說(shuō)再見(jiàn)了，AMD下代旗艦很有可能在今年底就正式與玩家們見(jiàn)面。據(jù)悉這次AMD依舊會(huì)堅(jiān)持“島嶼群”的核心命名風(fēng)格，下代產(chǎn)品都將隸屬于“Pirate Islands”(海盜島)家族。相對(duì)上一次架構(gòu)和工藝都不變的升級(jí)，這次AMD至少承諾了架構(gòu)換代，GCN將從現(xiàn)在的1.x版本正式升級(jí)到GCN2.0版本。至于工藝水平，到目前為止AMD和NVIDIA都沒(méi)有宣布有關(guān)啟用20nm工藝的消息。倒是NVIDIA方面，原本最應(yīng)該用來(lái)實(shí)驗(yàn)新工藝水平的Maxwell新架構(gòu)主流顯卡GTX 750Ti/750系列依舊采用了28nm，這讓大家遐想不斷，難道坊間傳聞NVIDIA會(huì)跳過(guò)20nm直奔16n m而去的消息是真的？就當(dāng)前透露的AMD海盜島發(fā)布日期來(lái)說(shuō)，我們覺(jué)得AMD沒(méi)法直接跳過(guò)20nm，也不太可能再使用28nm……為何這么說(shuō)？先看看“海盜島”的規(guī)格再說(shuō)。

　　“海盜”相當(dāng)暴力！

　　首批曝光的AMD海盜島主要有三顆核心，Bermuda XTX(百慕大)、Fiji XTX(斐濟(jì))和TreasureIsland XTX(寶藏島)，應(yīng)該分別對(duì)應(yīng)R9 390X、R9 380X和R9 370X三個(gè)型號(hào)，用以取代現(xiàn)在的R9 290X、R9 280X和R9 270X。據(jù)悉，其中基于Bermuda XTX核心的R9390X將率先在今年11月左右發(fā)布，它將代表AMD下代顯卡的最高技術(shù)水平和性能水平。從曝光的規(guī)格來(lái)看，R9 390X相對(duì)當(dāng)前旗艦R9290X的提升顯著，無(wú)論流處理單元還是ROP光柵單元的規(guī)模增長(zhǎng)都超過(guò)了50%，其核心頻率也將繼續(xù)維持在約1000MHz的水平。假設(shè)AMD主體架構(gòu)不變，在現(xiàn)有GCN架構(gòu)的基礎(chǔ)上還有所增強(qiáng)，那么其理論計(jì)算性能也將獲得超過(guò)50%的增幅。為了滿足計(jì)算性能爆炸式增長(zhǎng)對(duì)數(shù)據(jù)帶寬的需求，AMD再次啟動(dòng)了512bit的顯存位寬設(shè)計(jì)，并且打算將顯存頻率拔高到7GHz的高度，換算下來(lái)顯存帶寬將達(dá)到驚人的448GB/s。

　　往下是R9 380X，應(yīng)該是用于取代R9 280X顯卡，核心為Fiji XTX。流處理器單元為3072個(gè)，紋理單元192個(gè)，ROP單元72個(gè)。從這個(gè)規(guī)格看，它其實(shí)已經(jīng)超過(guò)了當(dāng)前的頂級(jí)型號(hào)R9 290X。再加上預(yù)計(jì)的斐濟(jì)核心依舊會(huì)保持900MHz以上的核心頻率和頻率6GHz左右、位寬384bit的顯存規(guī)格，這將賦予它超越當(dāng)前頂級(jí)單心顯卡的計(jì)算能力。不過(guò)R9 380X的上市日期會(huì)更晚，預(yù)計(jì)要到2015年的時(shí)候才能與玩家見(jiàn)面。還有就是R9 370X，核心為T(mén)reasure Island XTX，擁有1536個(gè)流處理器單元，96個(gè)紋理單元，48個(gè)ROP單元，核心頻率900MHz左右，顯存頻率5GHz左右，位寬256bit

海力士的TSV硅穿孔技術(shù)路線圖，HBM在今年2、3季度之間就會(huì)用20nm工藝生產(chǎn)

　　海盜島不再堅(jiān)持小核心策略？

　　追求更高的計(jì)算性能一直是半導(dǎo)體芯片的設(shè)計(jì)初衷，所以AMD讓新一代顯卡的計(jì)算單元暴增無(wú)可厚非。而協(xié)調(diào)存儲(chǔ)、計(jì)算能力讓它們基本平衡，也一直是讓半導(dǎo)體芯片發(fā)揮出最佳性能的主要設(shè)計(jì)原則。因此，AMD為計(jì)算性能暴漲的“百慕大”配備夸張的高頻率512bit顯存系統(tǒng)原本也無(wú)可厚非。只是這有可能會(huì)讓一些玩家覺(jué)得這次的“海盜島”和AMD繼Radeon HD 2900XTX之后啟用的“小核心”策略有些相悖。

　　了解顯卡技術(shù)的玩家都知道，無(wú)論AMD還是NVIDIA的顯示芯片，其主要代工廠都是TSMC(臺(tái)積電)。而近年來(lái)顯示芯片的半導(dǎo)體工藝提速已經(jīng)不如以前那么快，物理極限的逼近讓工藝提升變得更加困難，良率也難以保證。實(shí)際上從2011年底，TSMC(臺(tái)積電)開(kāi)始用28nm工藝為AMD代工Radeon HD 7970顯示核心至今，TSMC的顯卡芯片量產(chǎn)工藝依舊停留在28nm水平。在此期間，AMD的顯示核心已經(jīng)由Tahiti(HD7970)升級(jí)到了現(xiàn)在的Hawaii(R929 0X)。值得注意的是，這兩代顯卡的基礎(chǔ)架構(gòu)都是GCN(前者為GCN1.0，后者為GCN1.1)，所以基本上R9 290X相對(duì)HD 7970的改變就是增加更多晶體管，更多的計(jì)算單元和更大的顯存控制器位寬。在工藝保持28nm不變的前提下，我們看到R9 290X的核心達(dá)到438mm2，比HD 7970的365mm2高出20%。分析晶體管數(shù)量，R9 290X擁有62億，HD 7970僅43億，前者比后者高出44%左右，遠(yuǎn)遠(yuǎn)超過(guò)芯片面積的提升比例。也就是說(shuō)TSMC的28nm工藝雖未換代，但新設(shè)計(jì)加上工藝改良還是讓芯片的晶體管密度獲得了較大提升。這也最終讓R9 290X能比HD 7970多出768個(gè)流處理器(提升幅度37.5%)和128bit顯存位寬(提升幅度33.3%)。

　　然而從現(xiàn)在曝光的R9 390X看，其流處理器個(gè)數(shù)在R9 290X基礎(chǔ)上提升1408個(gè)，提升幅度50%，遠(yuǎn)高于R9 290X相對(duì)HD 7970的提升。其它諸如紋理單元、光柵單元也一并大幅增長(zhǎng)。更重要的是，據(jù)悉以“百慕大”核心為代表的下代AMD顯卡架構(gòu)是大幅改良的GCN，改進(jìn)幅度比HD 7970到R9 290X更大，預(yù)計(jì)會(huì)稱為GCN2.0架構(gòu)。但依舊基于GCN則基本意味著運(yùn)算單元的框架設(shè)計(jì)不會(huì)有顛覆性改變，因此大致可以從R9 290X的規(guī)格推算出R9 390X的晶體管數(shù)量會(huì)增加50%甚至更多。也就是說(shuō)“百慕大”核心的晶體管數(shù)量極有可能是100億水平。就算制造工藝還能提供晶體管提升44%，芯片面積只提升20%的優(yōu)秀水平，那R9 390X也很有可能會(huì)是個(gè)龐然大物，甚至可能達(dá)到600mm2或更高。

HBM與3DS兩種3D堆棧式規(guī)范

新卡皇新工藝，20nm Ready？

　　實(shí)際上，TSMC能在初代28nm工藝的基礎(chǔ)上，將其逐漸完善，并在制造R9 290X時(shí)提供遠(yuǎn)超初代芯片密度的水平已經(jīng)難能可貴。而這也基本意味著TSMC的28nm工藝已經(jīng)成熟，很難再有進(jìn)一步提升，頂多是讓晶圓的瑕疵更少，良率更高。很顯然，這樣的工藝根本不可能用于海盜島家族的制造，芯片大小和發(fā)熱量將難以控制。要想保持晶體管密度的增長(zhǎng)，只能依靠線密度更小的新工藝，也許20nm會(huì)是AMD的最終選擇。

　　據(jù)了解，其實(shí)臺(tái)積電已經(jīng)在2013年7月的時(shí)候就已經(jīng)使用了20nm工藝幫客戶小批量試產(chǎn)芯片。到2013年底的時(shí)候，已經(jīng)基本具備了量產(chǎn)能力。只是初期工藝都只面對(duì)一些晶體管數(shù)量相對(duì)較少，核心較小的產(chǎn)品，難以保證在面對(duì)如GPU這樣對(duì)性能要求極高的大芯片時(shí)，還能保證足夠的量產(chǎn)良率和半導(dǎo)體質(zhì)量。當(dāng)然，TSMC也不會(huì)閑著，其20nm晶圓廠從去年至今一直都處于安裝新設(shè)備、更新工藝水平的升級(jí)中。計(jì)劃2014年第一季度就能每月生產(chǎn)5萬(wàn)片晶圓，其中2萬(wàn)片可以在以后升級(jí)到16nm工藝。能向下代工藝過(guò)渡，也就意味著工藝成熟度接近極限，也即是說(shuō)至少今年2季度起，TSMC的20nm工藝已經(jīng)能夠勝任高性能芯片的生產(chǎn)需求，只是說(shuō)要想大規(guī)模量產(chǎn)估計(jì)還需要時(shí)間。而這也有可能是AMD計(jì)劃在今年內(nèi)只推出頂級(jí)R9 390X的一個(gè)重要原因，很可能代工廠TSMC的產(chǎn)能和良率難以滿足“海盜島”家族的全線來(lái)襲。

半導(dǎo)體產(chǎn)業(yè)從來(lái)都是芯片未動(dòng)、工藝先行，“海盜島”的成敗，跟代工廠TSMC的工藝水平息息相關(guān)。

　　DirectX 12順理成章

　　還有就是有關(guān)Direct X特性的問(wèn)題，新一代顯示核心都會(huì)搭配改良的Direct X技術(shù)，幾乎成為業(yè)界不成文的規(guī)矩。這一次，不同于上兩次DirectX技術(shù)的小修小補(bǔ)，從DirectX 11到DirectX 11.1、DirectX 11.2的變化，而是又到了大幅更新?lián)Q代的時(shí)節(jié)。微軟已經(jīng)在今年的GDC大會(huì)上正式發(fā)布了新一代的DirectX 12，在此之后才會(huì)發(fā)布的“海盜島”沒(méi)有理由不支持新一代API。實(shí)際上根據(jù)微軟的介紹，DirectX 12很特別，是個(gè)不太挑硬件的全新A PI。此前NVIDIA就確認(rèn)除了新發(fā)布的基于Maxwell架構(gòu)的GTX750系列顯卡外，包括上代的開(kāi)普勒甚至更上一代的費(fèi)米架構(gòu)都能提供對(duì)Direct X12的支持。也就是說(shuō)從4、5年前的GeForce 200起，之后的顯卡均能支持該特效。而AMD方面，也是從第一代GCN架構(gòu)開(kāi)始，就能提供對(duì)DirectX 12的支持。當(dāng)然，相比NVIDIA，AMD這次顯得更加輕車(chē)熟路，因?yàn)镈irectX 12的最大特色――底層API優(yōu)化可以說(shuō)正是借鑒了AMD的Mantle API設(shè)計(jì)思路。

　　新的DirectX 12賦予了游戲開(kāi)發(fā)者追蹤GPU流水線、控制資源狀態(tài)轉(zhuǎn)換、控制資源重命名的控制權(quán)，并通過(guò)減少API和驅(qū)動(dòng)跟蹤、顯存控制權(quán)等手段提高底層執(zhí)行效率，防止幀速陡降或者短暫掛起等問(wèn)題。這種優(yōu)化底部硬件與軟件調(diào)度層的方式，和Mantle API極為類似。當(dāng)然AMD無(wú)疑對(duì)自己的產(chǎn)品更加了解，優(yōu)化程度更高但很難適用于其他GPU產(chǎn)品。而微軟的優(yōu)化顯然要考慮到更廣泛的兼容性，很難針對(duì)某一架構(gòu)優(yōu)化到最佳狀態(tài)。但AMD新架構(gòu)顯卡顯然能借此在更多不支持Mantle API的游戲中獲得更好的現(xiàn)。另外，DirectX 12針對(duì)多核CPU深度優(yōu)化，基本能為多核處理器帶來(lái)線性性能增長(zhǎng)，這能有效改善游戲?qū)μ幚砥鞯睦眯?，有助于新卡皇的性能發(fā)揮不再受制于處理器性能瓶頸。

　　超過(guò)50%的性能提升？值得期待的最終性能

　　雖說(shuō)已經(jīng)初步曝光了“海盜島”中高端顯示核心的主要規(guī)格，但難保AMD不會(huì)最終改變計(jì)劃。就算規(guī)格參數(shù)完全按照當(dāng)前曝光的設(shè)計(jì)，我們也只能從當(dāng)前已知的GCN1.1架構(gòu)來(lái)大概推測(cè)R9 390X能獲得比R9 290X高出約40～50%的性能。然而當(dāng)前并沒(méi)有更多關(guān)于GCN2.0架構(gòu)的詳細(xì)信息曝光，我們難以獲得GCN2.0架構(gòu)的準(zhǔn)確特性，也就無(wú)法獲知計(jì)算單元數(shù)量相等的情況下，GCN2.0相對(duì)GCN1.1的性能增幅；也不可能知道更多類似TrueAudio、曲面細(xì)分單元比等更詳細(xì)的特性增刪或者提升幅度。唯一可以肯定的是，AMD顯然不會(huì)讓新架構(gòu)的效率比老產(chǎn)品更低，而且AMD特地準(zhǔn)備的超高顯存帶寬也正是為了消除數(shù)據(jù)傳輸瓶頸，讓核心的計(jì)算性能更好地發(fā)揮。倘若一切順利，我們應(yīng)該能看到新旗艦有超過(guò)老旗艦50%的性能水平，而新顯卡的次旗艦，即R9 380X都能獲得超越當(dāng)前旗艦的實(shí)力?，F(xiàn)在AMD已經(jīng)布局完畢，很顯然，NVIDIA也不會(huì)毫無(wú)準(zhǔn)備。不知道已經(jīng)在主流級(jí)市場(chǎng)試水成功的Maxwell新架構(gòu)是否會(huì)有新的動(dòng)作，NVIDIA難道不想將Maxwell出色的能耗比帶入到頂級(jí)顯卡領(lǐng)域？無(wú)論如何，今年下半年將上演的新一輪顯卡王座之爭(zhēng)都值得玩家們期待！

　　TIPS：“海盜島”的高頻顯存源自HBM技術(shù)？

　　AMD已經(jīng)在R9 290X上成功實(shí)現(xiàn)了512bit顯存位寬設(shè)計(jì)，并且通過(guò)設(shè)計(jì)優(yōu)化，讓這個(gè)原本會(huì)占據(jù)大量芯片面積的單元成功瘦身，同工藝下竟比HD 7970上使用的384bit顯存控制器面積還小20%。但缺陷也顯而易見(jiàn)，當(dāng)前的設(shè)計(jì)和工藝難以讓顯存頻率工作在足夠高的水平上，主流產(chǎn)品皆能工作在6000MHz，部分高端型號(hào)已經(jīng)突破了7000MHz，而R9 290X的顯存頻率僅5000MHz。當(dāng)然，512bit的位寬，彌補(bǔ)了顯存頻率的不足，依舊能為R9 290X提供當(dāng)前最出色的顯存帶寬。但讓下代R9 390X依舊搭配如此規(guī)格，就顯然無(wú)法滿足暴增的計(jì)算單元對(duì)顯存帶寬的需求了。繼續(xù)增加顯存位寬？這可能會(huì)導(dǎo)致芯片面積過(guò)大，成本、發(fā)熱都過(guò)高，甚至難產(chǎn)的問(wèn)題。相對(duì)來(lái)說(shuō)，3D堆棧式存儲(chǔ)將是一種更穩(wěn)妥有效的解決方案。實(shí)際上AMD和Hynix聯(lián)合開(kāi)發(fā)3D堆棧式內(nèi)存有一段時(shí)間了，他們想將FPGA和傳感器領(lǐng)域已經(jīng)實(shí)踐的堆棧式設(shè)計(jì)應(yīng)用到高性能計(jì)算領(lǐng)域中，對(duì)CPU、GPU和APU等設(shè)備產(chǎn)生影響。目前的研究主要有3DS和HBM兩個(gè)方向。其中3DS強(qiáng)調(diào)成本與速度的均衡，針對(duì)主內(nèi)存，而HBM(high bandwidth memory，高帶寬記憶體)追求極限高帶寬，適合圖形和網(wǎng)絡(luò)高性能計(jì)算。年初時(shí)Hynix公司首席工程師Minsuk Suh就已經(jīng)表示HBM相關(guān)規(guī)范基本完善，結(jié)合上現(xiàn)在曝光的R9 390X將搭載頻率高達(dá)7000MHz的512bit顯存規(guī)格，我們估計(jì)“海盜島”可能已經(jīng)用上了HBM。HBM其實(shí)也是基于TSV硅穿孔技術(shù)，因此具備支持多線路1024通道讀寫(xiě)的特性，能提供高密度的高帶寬存儲(chǔ)。更重要的是，相比當(dāng)前顯卡上使用的GDDR5顯存，HBM能在提高65%總體性能的同時(shí)，還能將功耗降低40%甚至更多。

網(wǎng)友投稿2022-08-26 06:35:08