Intel核顯進(jìn)化史:何時(shí)吊打APU?
曾經(jīng)很早的時(shí)候,集成顯卡給人的印象只是能提供圖像輸出,玩游戲什么的就別想了,然后過(guò)了些年,NVIDIA和AMD相繼推出了高性能集顯芯片組,也就是C61與690G這類經(jīng)典產(chǎn)品,讓大家見(jiàn)識(shí)到集顯也是能玩大型游戲的,也就是這些高性能集顯成就了當(dāng)時(shí)AMD在低端平臺(tái)的高性價(jià)比,隨后這些iGP就被直接整合到CPU里面了,現(xiàn)在整合顯卡的主板已經(jīng)很稀有了。
AMD在收購(gòu)ATI后,首先提出了CPU與GPU融合的概念,然而第一個(gè)把實(shí)際產(chǎn)品做出來(lái)的卻是老對(duì)手Intel,早在2010年就推出了第一款整合GPU的CPU,隨后Intel的核顯每年都會(huì)隨酷睿系列處理器一同升級(jí)一次,現(xiàn)在已經(jīng)發(fā)展到了第六代,GPU的規(guī)模越長(zhǎng)越大,以前是買(mǎi)CPU送GPU,現(xiàn)在都快成買(mǎi)GPU送CPU了。
從第一代酷睿處理器Clarkdale到今天的第六代酷睿處理器Skylake,可見(jiàn)整合核顯的規(guī)模正在不斷的增大,性能也是以倍數(shù)增加,而CPU每次升級(jí)都是以提高能耗比為主,說(shuō)真的從Sandy Bridge到Skylake CPU的性能提升幅度并不算太突出,GPU性能反而成了每代處理器的性能提升重點(diǎn),下面我們就來(lái)回顧一下Intel的核顯進(jìn)化歷程。
首款整合GPU的CPU:Clarkdale
雖然說(shuō)Intel的做法有點(diǎn)狡猾,但是2010年推出的Clarkdale處理器確實(shí)是首款整合GPU的CPU,這款處理器由32nm制程CPU Die和45nm的GPU Die共同封裝在一塊PCB上組成,兩顆芯片使用QPI總線相連,通俗點(diǎn)來(lái)講Intel把CPU和北橋芯片用膠水粘在了一起。
Clarkdale系列處理器只有雙核的型號(hào),有Core i5-600和Core i3-500兩個(gè)型號(hào),在LGA 1156時(shí)代四核處理器是沒(méi)有整合GPU的。當(dāng)時(shí)的Intel把Clarkdale上的GPU統(tǒng)稱為“Intel HD Graphics”,這名字一直用到現(xiàn)在。而這個(gè)GPU其實(shí)就是G45上的X4500 HD的升級(jí)版,EU增加了兩個(gè)從而達(dá)到了12個(gè),核心頻率最高可以到900MHz,支持Hierarchical Z(層次Z緩存算法)與Fast Z Clear(快速Z清除)技術(shù),支持DX10、SM4.0,支持OpenGL 2.1,移動(dòng)版處理器的GPU可以通過(guò)Turbo Boost動(dòng)態(tài)調(diào)整頻率,而桌面版不行。
真正的核顯:Sandy Bridge
正在把CPU和GPU做到同一塊芯片上的是在2011年推出的Sandy Bridge架構(gòu)處理器,CPU、GPU、內(nèi)存控制器、PCI-E控制器全部整合到一個(gè)核心里面,它的最大改進(jìn)在于三級(jí)緩存改用了環(huán)形總線設(shè)計(jì),并且其核心、GFX以及顯示/媒體控制器可共享L3高速緩存。
Sandy Bridge的GPU主要包含了指令流處理器、媒體處理器、多格式媒體解碼器、執(zhí)行單元、統(tǒng)一執(zhí)行單元陣列、媒體取樣器、紋理采樣器以及指令緩沖等等,架構(gòu)與上一代相比有了較大修改。
Sandy Bridge按照型號(hào)劃分了標(biāo)準(zhǔn)版以及“K”系倍頻解鎖版本,標(biāo)準(zhǔn)版本GFX命名為HD Graphics 2000,而唯獨(dú)K系列所擁有的GFX為等級(jí)更高的HD Graphics 3000,兩者的區(qū)別是前者擁有6個(gè)EU,而后者則達(dá)到了12個(gè),全面支持Turbo Boost動(dòng)態(tài)調(diào)整頻率,最高頻率可達(dá)1350MHz,支持DX10.1、SM4.1,支持OpenGL 3.0,性能上HD Graphics 3000比上一代有了翻倍的增長(zhǎng)。
此外這一代核顯還增加了Quick Sync轉(zhuǎn)碼加速技術(shù),利用內(nèi)置的編碼器可以支持MPEG2、VC1和H.264視頻各種的硬件編碼,Sandy Bridge所整合的圖形核心已實(shí)現(xiàn)了視頻解碼和編碼兩部分的硬件加速功能,可為用戶在視頻轉(zhuǎn)碼時(shí)節(jié)省更多的時(shí)間。
迎來(lái)DX11時(shí)代:Ivy Bridge
在Ivy Bridge上Intel針對(duì)核顯的改進(jìn)還是兩個(gè)方向,首先是進(jìn)一步提高GPU的性能,并且讓其支持DX11,第二點(diǎn)則是繼續(xù)提高核顯的功能,多屏輸出、高分辨率支持等。
Ivy Bridge的GPU增強(qiáng)了幾何前端、光柵化、像素后端處理、采樣器、尋址單元的并行運(yùn)算能力,每周期可以執(zhí)行2個(gè)MAC操作,GPU可以直接讀取L3緩存中的數(shù)據(jù),圖形單元新增兩個(gè)可編程操作以及一個(gè)固定功能單元以支持曲面細(xì)分計(jì)算,并在解碼與顯示功能上做了升級(jí)。
同樣的核顯也分為兩種,分別是有16個(gè)EU單元的HD 4000和6個(gè)EU單元的的HD 2500,“K”系列處理器用的是HD 4000而其他處理器用的是HD 2500,最高頻率與SNB時(shí)代一樣是1350MHz,支持DX11、SM5.0,支持OpenGL 3.2,性能上HD 4000比上一代的HD 3000提升是67%。
Ivy Bridge支持Quick Sync 2.0編碼加速技術(shù),與第一代相比,2.0版不僅速度更快,而且畫(huà)質(zhì)也會(huì)更高。視頻輸出方面也從原來(lái)的雙屏上升到三屏輸出,最大分辨率從原來(lái)的2560*1600上升到4k*4k級(jí)別。
“銳炬”登場(chǎng):Haswell
Haswell采用的是Gen7.5核顯,這一代開(kāi)始Intel的核顯開(kāi)始了模塊化、可擴(kuò)展的設(shè)計(jì),Haswell的顯示核心采用兩級(jí)EU團(tuán)簇結(jié)構(gòu)設(shè)計(jì),上級(jí)的叫Slice,下級(jí)的叫Subslice,每個(gè)Subslice擁有10個(gè)EU,2組Subslice單元組成了1組Slice單元,這一代在GT1和GT2兩個(gè)級(jí)別之上又誕生了GT3核心,從此Intel就走上了暴力堆砌核顯規(guī)格的道路。
Haswell的GT1、GT2、GT3核顯分別擁有10個(gè)、20個(gè)和40個(gè)EU單元,此外還有一個(gè)帶嵌入式eDRAM的GT3e,核顯集成了128MB eDRAM,位寬512bit,帶寬可達(dá)64GB/s,這個(gè)嵌入式eDRAM是作為L(zhǎng)4緩存存在的,可以同時(shí)提升CPU和GPU性能。
Intel的核顯一直以來(lái)都用HD Graphics來(lái)命名,不過(guò)與NVIDIA的GeForce還有AMD的Radeon相比這個(gè)名字還是不夠霸氣,因此從Haswell處理器的核芯顯卡開(kāi)始,英特爾將引入新的名字“Iris”和“Iris Pro”,中文名為“銳炬”和“銳炬Pro”,分別對(duì)應(yīng)GT3以及GT3e核顯,具體型號(hào)則是Iris Graphics 5100和Iris Pro Graphics 5200。
這一代的桌面版酷睿處理器基本上都是使用GT2核顯,型號(hào)是HD Graphics 4600/4400,后者只用在Core i3-41xx系列處理器上,只有16個(gè)EU,對(duì)非K系列處理器來(lái)核顯性能是較上一代有大幅提升的,而真正需要高性能核顯的也是Core i3那種級(jí)別的,高端處理器基本都是配個(gè)獨(dú)顯。
奔騰和賽揚(yáng)處理器配的是GT1核顯,而這一代最強(qiáng)的GT3e核顯只出現(xiàn)在兩款桌面級(jí)處理器上,就是Core i7-4770R和Core i5-4670R,然而這兩個(gè)都不零售,是針對(duì)OEM市場(chǎng)的產(chǎn)品。
最強(qiáng)桌面核顯:Broadwell
Broadwell主要都是面向移動(dòng)市場(chǎng),在桌面零售市場(chǎng)上其實(shí)就只有兩個(gè)CPU,Core i7-5775C和Core i5-5675C,配備Intel目前最強(qiáng)的Iris Pro 6200核顯,擁有128MB的eDRAM緩存,另外倍頻無(wú)鎖,可進(jìn)行超頻。
Broadwell上使用的是Gen8圖形核心,Intel重新設(shè)計(jì)了Subslice單元,每組的EU單元從之前的10個(gè)下降到了8個(gè),在同樣的采樣器及調(diào)度器下這意味著每個(gè)EU單元的效率提升了,而彌補(bǔ)EU數(shù)量可以通過(guò)提升Subslice單元總數(shù)來(lái)完成,所以Broadwell的1組Slice單元有3組Subslice單元,EU單元總數(shù)是24個(gè),Broadwell的GT1、GT2、GT3核顯分別擁有12個(gè)、24個(gè)和48個(gè)EU單元。
桌面零售版那兩個(gè)配備的Iris Pro 6200屬于帶eDRAM的GT3e核心,得益于核心規(guī)模的大幅提升,Core i7-5775C的核顯性能較上一代Core i7-4790K提升了將近80%,而已由于現(xiàn)在的Skylake桌面版只有GT2核心,所以Broadwell架構(gòu)的這兩款處理器成為目前擁有最強(qiáng)核顯的桌面級(jí)處理器,然而這兩個(gè)處理器在國(guó)內(nèi)根本沒(méi)有正式上市,要買(mǎi)的話比較難找。
越堆越大的GPU:Skylake
Skylake使用的Gen9代GPU其實(shí)與Gen8有很多地方都是相似的,每組Subslice單元依舊是24個(gè)EU,但是最多可以擴(kuò)展到3組Slice單元,也就是說(shuō)最多會(huì)配備72個(gè)EU單元,因此Skylake也多出GT4這個(gè)級(jí)別的核顯。
Skylake的Gen9架構(gòu)支持DX12、OpenCL 2.x、OpenGL 5.x、Vulkan等圖形規(guī)范,支持新的編譯器堆棧,功耗范圍從4W-65W 不等。此外,Gen9還支持HEVC/H.265、AVC、SVC、VP8、MJPG硬件加速,支持?jǐn)z像頭RAW架構(gòu)。
多媒體方面,Gen9架構(gòu)支持單一固定功能單元以降低功耗,Quick Sync轉(zhuǎn)碼單元也設(shè)計(jì)了固定功能的編碼器以降低功耗、延遲。此外,Gen9的視頻解碼、轉(zhuǎn)碼加速還支持了HEVC(H.265)、VP8、MJPEG等標(biāo)準(zhǔn)。
然而GT3/GT3e/GT4e這樣的高性能核顯只使用在移動(dòng)版處理器上,桌面版的Skylake處理器基本上使用的只有24EU的GT2,雖然較桌面版Haswell來(lái)說(shuō)性能還是有所提升,但是幅度只有20%。另外還有兩個(gè)“P”后續(xù)的處理器用的是GT1核顯。
Intel這些年來(lái)在核顯確實(shí)下了不少功夫,性能提升幅度相當(dāng)?shù)拇螅腴T(mén)級(jí)顯卡基本上都被核顯趕盡殺絕了, 而反觀CPU,性能提升幅度就沒(méi)那么明顯了,降低功耗反而成了重點(diǎn),低功耗的處理器造就了現(xiàn)在超級(jí)本和各種Windows平板的盛行,而這些年來(lái)移動(dòng)設(shè)備上都采用高分辨率屏幕,這對(duì)核顯又有了性能上的需求,市場(chǎng)的需求影響了Intel近年來(lái)處理器方向的改進(jìn),未來(lái)Intel CPU也是以提升核顯性能并降低整體功耗為主。
該文章被收錄于:
編程器 ? https://www.chinafix.com/zt/1877-1.html