DX12測(cè)試:NVIDIA GTX 1080異步運(yùn)算仍落后A卡
NVIDIA Pascal架構(gòu)新卡GTX 1080做了很多努力工作減小Maxwell時(shí)代在DX12異步運(yùn)算(Async Compute)上對(duì)A卡的劣勢(shì),我們先來看一下NV的官方介紹——
異步計(jì)算
如今,GPU早已不再是單純的圖像渲染,尤其是在DirectX 12時(shí)代,GPU往往會(huì)被賦予更多的工作,如計(jì)算任務(wù)等等。
NVIDIA GeForce GTX 1080支持異步計(jì)算技術(shù),它可以快速而高效的并行處理多任務(wù),做到動(dòng)態(tài)負(fù)載平衡,以及像素級(jí)別的任務(wù)“搶占”,實(shí)現(xiàn)運(yùn)行效率的更大化。
在靜態(tài)模式下,當(dāng)GPU同時(shí)處理圖形渲染及計(jì)算兩個(gè)任務(wù)時(shí),這兩個(gè)任務(wù)的完成時(shí)間往往是不一樣的。如下圖Static Partitioning所示,圖形任務(wù)在60%時(shí)間點(diǎn)便完成了,剩下的40%時(shí)間則要等待計(jì)算任務(wù)完成,才能進(jìn)行下一個(gè)任務(wù)。這將造成大量的GPU空閑情況發(fā)生。
而在動(dòng)態(tài)負(fù)載平衡模式下(上圖Dynamic Balancing部分),圖形任務(wù)率先完成,用于這部分的GPU資源可馬上接管剩下的計(jì)算工作,縮短任務(wù)完成時(shí)間。
Preemption(搶占)指的是為了使重要工作可以快速完成,GPU會(huì)選擇關(guān)閉不太重要的工作,讓重要工作優(yōu)先處理。Pascal也是目前首個(gè)支持像素級(jí)別搶占的GPU架構(gòu),它可以讓GPU以更快的速度和更小的性能開銷完成搶占。
實(shí)際表現(xiàn)如何,外媒已經(jīng)在首款原生DX12游戲《奇點(diǎn)灰燼》正式版上進(jìn)行了測(cè)試,結(jié)果如下——
在4K、2K和1080P三種分辨率,開啟異步運(yùn)算支持后,GTX 1080在4K下并沒有獲得提升,甚至還不如DX11下的幀率。
反之A卡Fury X在三種分辨下都有增長,以1080P分辨為例,Fury X DX12+Async對(duì)DX11增幅為16%,GTX 1080為2%。
我們?cè)偻ㄟ^另外一家測(cè)試站對(duì)4K分辨的考察——
關(guān)閉異步運(yùn)算,R9 Fury X DX12對(duì)DX11提高7%,GTX 1080降幀2%,GTX 980 Ti更慘,降幀7%
開啟異步運(yùn)算,R9 Fury X DX12對(duì)DX11暴增18%,GTX 1080降幀3%,GTX 980 Ti降幀8%。
2K分辨——
N卡總算挽回了一些面子,但仍遠(yuǎn)輸A卡,另外Maxwell架構(gòu)對(duì)于異步的支持的確是不盡人意。
結(jié)論:
總上來看,Pascal的動(dòng)態(tài)分配對(duì)于DX12異步運(yùn)算進(jìn)行了大幅改進(jìn),但相較于先天優(yōu)勢(shì)的GCN存在差距。當(dāng)然,要強(qiáng)調(diào)的是,這僅僅是《奇點(diǎn)灰燼》一款DX12游戲,而且考察的是提升幅度而非幀數(shù)絕對(duì)值,后者N卡早發(fā)一代的優(yōu)勢(shì)還是很明顯的,僅作參考。
背景資料——AMD異步運(yùn)算簡介
AMD的做法是,GPU劃分出三條隊(duì)列,分別運(yùn)行渲染、計(jì)算、復(fù)制任務(wù),而且分別可達(dá)100%滿載,互不影響。這樣的好處有三點(diǎn),其一是可以實(shí)現(xiàn)更高的幀速率,讓游戲更加流暢;第二是在“虛擬現(xiàn)實(shí)”中的應(yīng)用,它可以減少延遲;第三則可以帶來更好的圖像質(zhì)量。