大片视频免费观看视频_欧美激情猛片xxxⅹ大3之樱桃_性饥渴艳妇性色生活片在线播放_啦啦啦www视频在线观看_宝贝~你里面好紧我好爽视频_国产国产人免费人成免费视频_来自GeoGebra 的交互式_欧美又色又爽又黄的A片18禁_色欲aⅴ亚洲情无码AV

“海盜”來(lái)襲 AMD下代顯卡核心技術(shù)前瞻

share

  近段時(shí)間NVIDIA在顯卡市場(chǎng)可謂動(dòng)作頻頻,搶先發(fā)布了新一代Maxwell架構(gòu),帶來(lái)了能耗比超高的GTX 750系列顯卡;后又陸續(xù)曝光了NVLINK、3D memory等下代頂級(jí)顯卡獨(dú)有的新技術(shù)。AMD顯然也不會(huì)閑著,和NVIDIA從主流市場(chǎng)著手布局下代顯卡的風(fēng)格不同,AMD選擇要玩就玩大的。前不久,AMD毫無(wú)征兆地就拋出了下代頂級(jí)顯卡的主要技術(shù)規(guī)格,更讓人興奮的是,AMD承諾讓玩家們?cè)谀陜?nèi)就看到它的身影......

  按照AMD此前的規(guī)劃,R9 290X相對(duì)HD7970只是一個(gè)過(guò)渡升級(jí)產(chǎn)品。半導(dǎo)體工藝都為28nm,架構(gòu)改動(dòng)極小,僅從HD7970的GCN1.0升級(jí)到GCN1.1,Direct X支持能力也只從11.1版本小幅提高到11.2版本。拋開(kāi)TrueAudio等一系列外圍功能的演進(jìn),就顯卡的計(jì)算能力來(lái)說(shuō)R9 290X的架構(gòu)變化并不大。只是R9 290X流處理器數(shù)量的增多最終確實(shí)帶來(lái)了比HD 7970高出40%左右的游戲能力,這樣的表現(xiàn)在玩家們看來(lái)可能不驚艷,但就升級(jí)換代任務(wù)來(lái)說(shuō),R9 290X已經(jīng)圓滿完成了。

  而現(xiàn)在是時(shí)候?qū)Α斑^(guò)渡”說(shuō)再見(jiàn)了,AMD下代旗艦很有可能在今年底就正式與玩家們見(jiàn)面。據(jù)悉這次AMD依舊會(huì)堅(jiān)持“島嶼群”的核心命名風(fēng)格,下代產(chǎn)品都將隸屬于“Pirate Islands”(海盜島)家族。相對(duì)上一次架構(gòu)和工藝都不變的升級(jí),這次AMD至少承諾了架構(gòu)換代,GCN將從現(xiàn)在的1.x版本正式升級(jí)到GCN2.0版本。至于工藝水平,到目前為止AMD和NVIDIA都沒(méi)有宣布有關(guān)啟用20nm工藝的消息。倒是NVIDIA方面,原本最應(yīng)該用來(lái)實(shí)驗(yàn)新工藝水平的Maxwell新架構(gòu)主流顯卡GTX 750Ti/750系列依舊采用了28nm,這讓大家遐想不斷,難道坊間傳聞NVIDIA會(huì)跳過(guò)20nm直奔16n m而去的消息是真的?就當(dāng)前透露的AMD海盜島發(fā)布日期來(lái)說(shuō),我們覺(jué)得AMD沒(méi)法直接跳過(guò)20nm,也不太可能再使用28nm……為何這么說(shuō)?先看看“海盜島”的規(guī)格再說(shuō)。

  “海盜”相當(dāng)暴力!

  首批曝光的AMD海盜島主要有三顆核心,Bermuda XTX(百慕大)、Fiji XTX(斐濟(jì))和TreasureIsland XTX(寶藏島),應(yīng)該分別對(duì)應(yīng)R9 390X、R9 380X和R9 370X三個(gè)型號(hào),用以取代現(xiàn)在的R9 290X、R9 280X和R9 270X。據(jù)悉,其中基于Bermuda XTX核心的R9390X將率先在今年11月左右發(fā)布,它將代表AMD下代顯卡的最高技術(shù)水平和性能水平。從曝光的規(guī)格來(lái)看,R9 390X相對(duì)當(dāng)前旗艦R9290X的提升顯著,無(wú)論流處理單元還是ROP光柵單元的規(guī)模增長(zhǎng)都超過(guò)了50%,其核心頻率也將繼續(xù)維持在約1000MHz的水平。假設(shè)AMD主體架構(gòu)不變,在現(xiàn)有GCN架構(gòu)的基礎(chǔ)上還有所增強(qiáng),那么其理論計(jì)算性能也將獲得超過(guò)50%的增幅。為了滿足計(jì)算性能爆炸式增長(zhǎng)對(duì)數(shù)據(jù)帶寬的需求,AMD再次啟動(dòng)了512bit的顯存位寬設(shè)計(jì),并且打算將顯存頻率拔高到7GHz的高度,換算下來(lái)顯存帶寬將達(dá)到驚人的448GB/s。

  往下是R9 380X,應(yīng)該是用于取代R9 280X顯卡,核心為Fiji XTX。流處理器單元為3072個(gè),紋理單元192個(gè),ROP單元72個(gè)。從這個(gè)規(guī)格看,它其實(shí)已經(jīng)超過(guò)了當(dāng)前的頂級(jí)型號(hào)R9 290X。再加上預(yù)計(jì)的斐濟(jì)核心依舊會(huì)保持900MHz以上的核心頻率和頻率6GHz左右、位寬384bit的顯存規(guī)格,這將賦予它超越當(dāng)前頂級(jí)單心顯卡的計(jì)算能力。不過(guò)R9 380X的上市日期會(huì)更晚,預(yù)計(jì)要到2015年的時(shí)候才能與玩家見(jiàn)面。還有就是R9 370X,核心為T(mén)reasure Island XTX,擁有1536個(gè)流處理器單元,96個(gè)紋理單元,48個(gè)ROP單元,核心頻率900MHz左右,顯存頻率5GHz左右,位寬256bit

海力士的TSV硅穿孔技術(shù)路線圖,HBM在今年2、3季度之間就會(huì)用20nm工藝生產(chǎn)

  海盜島不再堅(jiān)持小核心策略?

  追求更高的計(jì)算性能一直是半導(dǎo)體芯片的設(shè)計(jì)初衷,所以AMD讓新一代顯卡的計(jì)算單元暴增無(wú)可厚非。而協(xié)調(diào)存儲(chǔ)、計(jì)算能力讓它們基本平衡,也一直是讓半導(dǎo)體芯片發(fā)揮出最佳性能的主要設(shè)計(jì)原則。因此,AMD為計(jì)算性能暴漲的“百慕大”配備夸張的高頻率512bit顯存系統(tǒng)原本也無(wú)可厚非。只是這有可能會(huì)讓一些玩家覺(jué)得這次的“海盜島”和AMD繼Radeon HD 2900XTX之后啟用的“小核心”策略有些相悖。

  了解顯卡技術(shù)的玩家都知道,無(wú)論AMD還是NVIDIA的顯示芯片,其主要代工廠都是TSMC(臺(tái)積電)。而近年來(lái)顯示芯片的半導(dǎo)體工藝提速已經(jīng)不如以前那么快,物理極限的逼近讓工藝提升變得更加困難,良率也難以保證。實(shí)際上從2011年底,TSMC(臺(tái)積電)開(kāi)始用28nm工藝為AMD代工Radeon HD 7970顯示核心至今,TSMC的顯卡芯片量產(chǎn)工藝依舊停留在28nm水平。在此期間,AMD的顯示核心已經(jīng)由Tahiti(HD7970)升級(jí)到了現(xiàn)在的Hawaii(R929 0X)。值得注意的是,這兩代顯卡的基礎(chǔ)架構(gòu)都是GCN(前者為GCN1.0,后者為GCN1.1),所以基本上R9 290X相對(duì)HD 7970的改變就是增加更多晶體管,更多的計(jì)算單元和更大的顯存控制器位寬。在工藝保持28nm不變的前提下,我們看到R9 290X的核心達(dá)到438mm2,比HD 7970的365mm2高出20%。分析晶體管數(shù)量,R9 290X擁有62億,HD 7970僅43億,前者比后者高出44%左右,遠(yuǎn)遠(yuǎn)超過(guò)芯片面積的提升比例。也就是說(shuō)TSMC的28nm工藝雖未換代,但新設(shè)計(jì)加上工藝改良還是讓芯片的晶體管密度獲得了較大提升。這也最終讓R9 290X能比HD 7970多出768個(gè)流處理器(提升幅度37.5%)和128bit顯存位寬(提升幅度33.3%)。

  然而從現(xiàn)在曝光的R9 390X看,其流處理器個(gè)數(shù)在R9 290X基礎(chǔ)上提升1408個(gè),提升幅度50%,遠(yuǎn)高于R9 290X相對(duì)HD 7970的提升。其它諸如紋理單元、光柵單元也一并大幅增長(zhǎng)。更重要的是,據(jù)悉以“百慕大”核心為代表的下代AMD顯卡架構(gòu)是大幅改良的GCN,改進(jìn)幅度比HD 7970到R9 290X更大,預(yù)計(jì)會(huì)稱為GCN2.0架構(gòu)。但依舊基于GCN則基本意味著運(yùn)算單元的框架設(shè)計(jì)不會(huì)有顛覆性改變,因此大致可以從R9 290X的規(guī)格推算出R9 390X的晶體管數(shù)量會(huì)增加50%甚至更多。也就是說(shuō)“百慕大”核心的晶體管數(shù)量極有可能是100億水平。就算制造工藝還能提供晶體管提升44%,芯片面積只提升20%的優(yōu)秀水平,那R9 390X也很有可能會(huì)是個(gè)龐然大物,甚至可能達(dá)到600mm2或更高。

HBM與3DS兩種3D堆棧式規(guī)范

新卡皇新工藝,20nm Ready?

  實(shí)際上,TSMC能在初代28nm工藝的基礎(chǔ)上,將其逐漸完善,并在制造R9 290X時(shí)提供遠(yuǎn)超初代芯片密度的水平已經(jīng)難能可貴。而這也基本意味著TSMC的28nm工藝已經(jīng)成熟,很難再有進(jìn)一步提升,頂多是讓晶圓的瑕疵更少,良率更高。很顯然,這樣的工藝根本不可能用于海盜島家族的制造,芯片大小和發(fā)熱量將難以控制。要想保持晶體管密度的增長(zhǎng),只能依靠線密度更小的新工藝,也許20nm會(huì)是AMD的最終選擇。

  據(jù)了解,其實(shí)臺(tái)積電已經(jīng)在2013年7月的時(shí)候就已經(jīng)使用了20nm工藝幫客戶小批量試產(chǎn)芯片。到2013年底的時(shí)候,已經(jīng)基本具備了量產(chǎn)能力。只是初期工藝都只面對(duì)一些晶體管數(shù)量相對(duì)較少,核心較小的產(chǎn)品,難以保證在面對(duì)如GPU這樣對(duì)性能要求極高的大芯片時(shí),還能保證足夠的量產(chǎn)良率和半導(dǎo)體質(zhì)量。當(dāng)然,TSMC也不會(huì)閑著,其20nm晶圓廠從去年至今一直都處于安裝新設(shè)備、更新工藝水平的升級(jí)中。計(jì)劃2014年第一季度就能每月生產(chǎn)5萬(wàn)片晶圓,其中2萬(wàn)片可以在以后升級(jí)到16nm工藝。能向下代工藝過(guò)渡,也就意味著工藝成熟度接近極限,也即是說(shuō)至少今年2季度起,TSMC的20nm工藝已經(jīng)能夠勝任高性能芯片的生產(chǎn)需求,只是說(shuō)要想大規(guī)模量產(chǎn)估計(jì)還需要時(shí)間。而這也有可能是AMD計(jì)劃在今年內(nèi)只推出頂級(jí)R9 390X的一個(gè)重要原因,很可能代工廠TSMC的產(chǎn)能和良率難以滿足“海盜島”家族的全線來(lái)襲。

半導(dǎo)體產(chǎn)業(yè)從來(lái)都是芯片未動(dòng)、工藝先行,“海盜島”的成敗,跟代工廠TSMC的工藝水平息息相關(guān)。

  DirectX 12順理成章

  還有就是有關(guān)Direct X特性的問(wèn)題,新一代顯示核心都會(huì)搭配改良的Direct X技術(shù),幾乎成為業(yè)界不成文的規(guī)矩。這一次,不同于上兩次DirectX技術(shù)的小修小補(bǔ),從DirectX 11到DirectX 11.1、DirectX 11.2的變化,而是又到了大幅更新?lián)Q代的時(shí)節(jié)。微軟已經(jīng)在今年的GDC大會(huì)上正式發(fā)布了新一代的DirectX 12,在此之后才會(huì)發(fā)布的“海盜島”沒(méi)有理由不支持新一代API。實(shí)際上根據(jù)微軟的介紹,DirectX 12很特別,是個(gè)不太挑硬件的全新A PI。此前NVIDIA就確認(rèn)除了新發(fā)布的基于Maxwell架構(gòu)的GTX750系列顯卡外,包括上代的開(kāi)普勒甚至更上一代的費(fèi)米架構(gòu)都能提供對(duì)Direct X12的支持。也就是說(shuō)從4、5年前的GeForce 200起,之后的顯卡均能支持該特效。而AMD方面,也是從第一代GCN架構(gòu)開(kāi)始,就能提供對(duì)DirectX 12的支持。當(dāng)然,相比NVIDIA,AMD這次顯得更加輕車(chē)熟路,因?yàn)镈irectX 12的最大特色――底層API優(yōu)化可以說(shuō)正是借鑒了AMD的Mantle API設(shè)計(jì)思路。

  新的DirectX 12賦予了游戲開(kāi)發(fā)者追蹤GPU流水線、控制資源狀態(tài)轉(zhuǎn)換、控制資源重命名的控制權(quán),并通過(guò)減少API和驅(qū)動(dòng)跟蹤、顯存控制權(quán)等手段提高底層執(zhí)行效率,防止幀速陡降或者短暫掛起等問(wèn)題。這種優(yōu)化底部硬件與軟件調(diào)度層的方式,和Mantle API極為類似。當(dāng)然AMD無(wú)疑對(duì)自己的產(chǎn)品更加了解,優(yōu)化程度更高但很難適用于其他GPU產(chǎn)品。而微軟的優(yōu)化顯然要考慮到更廣泛的兼容性,很難針對(duì)某一架構(gòu)優(yōu)化到最佳狀態(tài)。但AMD新架構(gòu)顯卡顯然能借此在更多不支持Mantle API的游戲中獲得更好的現(xiàn)。另外,DirectX 12針對(duì)多核CPU深度優(yōu)化,基本能為多核處理器帶來(lái)線性性能增長(zhǎng),這能有效改善游戲?qū)μ幚砥鞯睦眯?,有助于新卡皇的性能發(fā)揮不再受制于處理器性能瓶頸。

  超過(guò)50%的性能提升?值得期待的最終性能

  雖說(shuō)已經(jīng)初步曝光了“海盜島”中高端顯示核心的主要規(guī)格,但難保AMD不會(huì)最終改變計(jì)劃。就算規(guī)格參數(shù)完全按照當(dāng)前曝光的設(shè)計(jì),我們也只能從當(dāng)前已知的GCN1.1架構(gòu)來(lái)大概推測(cè)R9 390X能獲得比R9 290X高出約40~50%的性能。然而當(dāng)前并沒(méi)有更多關(guān)于GCN2.0架構(gòu)的詳細(xì)信息曝光,我們難以獲得GCN2.0架構(gòu)的準(zhǔn)確特性,也就無(wú)法獲知計(jì)算單元數(shù)量相等的情況下,GCN2.0相對(duì)GCN1.1的性能增幅;也不可能知道更多類似TrueAudio、曲面細(xì)分單元比等更詳細(xì)的特性增刪或者提升幅度。唯一可以肯定的是,AMD顯然不會(huì)讓新架構(gòu)的效率比老產(chǎn)品更低,而且AMD特地準(zhǔn)備的超高顯存帶寬也正是為了消除數(shù)據(jù)傳輸瓶頸,讓核心的計(jì)算性能更好地發(fā)揮。倘若一切順利,我們應(yīng)該能看到新旗艦有超過(guò)老旗艦50%的性能水平,而新顯卡的次旗艦,即R9 380X都能獲得超越當(dāng)前旗艦的實(shí)力?,F(xiàn)在AMD已經(jīng)布局完畢,很顯然,NVIDIA也不會(huì)毫無(wú)準(zhǔn)備。不知道已經(jīng)在主流級(jí)市場(chǎng)試水成功的Maxwell新架構(gòu)是否會(huì)有新的動(dòng)作,NVIDIA難道不想將Maxwell出色的能耗比帶入到頂級(jí)顯卡領(lǐng)域?無(wú)論如何,今年下半年將上演的新一輪顯卡王座之爭(zhēng)都值得玩家們期待!

  TIPS:“海盜島”的高頻顯存源自HBM技術(shù)?

  AMD已經(jīng)在R9 290X上成功實(shí)現(xiàn)了512bit顯存位寬設(shè)計(jì),并且通過(guò)設(shè)計(jì)優(yōu)化,讓這個(gè)原本會(huì)占據(jù)大量芯片面積的單元成功瘦身,同工藝下竟比HD 7970上使用的384bit顯存控制器面積還小20%。但缺陷也顯而易見(jiàn),當(dāng)前的設(shè)計(jì)和工藝難以讓顯存頻率工作在足夠高的水平上,主流產(chǎn)品皆能工作在6000MHz,部分高端型號(hào)已經(jīng)突破了7000MHz,而R9 290X的顯存頻率僅5000MHz。當(dāng)然,512bit的位寬,彌補(bǔ)了顯存頻率的不足,依舊能為R9 290X提供當(dāng)前最出色的顯存帶寬。但讓下代R9 390X依舊搭配如此規(guī)格,就顯然無(wú)法滿足暴增的計(jì)算單元對(duì)顯存帶寬的需求了。繼續(xù)增加顯存位寬?這可能會(huì)導(dǎo)致芯片面積過(guò)大,成本、發(fā)熱都過(guò)高,甚至難產(chǎn)的問(wèn)題。相對(duì)來(lái)說(shuō),3D堆棧式存儲(chǔ)將是一種更穩(wěn)妥有效的解決方案。實(shí)際上AMD和Hynix聯(lián)合開(kāi)發(fā)3D堆棧式內(nèi)存有一段時(shí)間了,他們想將FPGA和傳感器領(lǐng)域已經(jīng)實(shí)踐的堆棧式設(shè)計(jì)應(yīng)用到高性能計(jì)算領(lǐng)域中,對(duì)CPU、GPU和APU等設(shè)備產(chǎn)生影響。目前的研究主要有3DS和HBM兩個(gè)方向。其中3DS強(qiáng)調(diào)成本與速度的均衡,針對(duì)主內(nèi)存,而HBM(high bandwidth memory,高帶寬記憶體)追求極限高帶寬,適合圖形和網(wǎng)絡(luò)高性能計(jì)算。年初時(shí)Hynix公司首席工程師Minsuk Suh就已經(jīng)表示HBM相關(guān)規(guī)范基本完善,結(jié)合上現(xiàn)在曝光的R9 390X將搭載頻率高達(dá)7000MHz的512bit顯存規(guī)格,我們估計(jì)“海盜島”可能已經(jīng)用上了HBM。HBM其實(shí)也是基于TSV硅穿孔技術(shù),因此具備支持多線路1024通道讀寫(xiě)的特性,能提供高密度的高帶寬存儲(chǔ)。更重要的是,相比當(dāng)前顯卡上使用的GDDR5顯存,HBM能在提高65%總體性能的同時(shí),還能將功耗降低40%甚至更多。

share