大片视频免费观看视频_欧美激情猛片xxxⅹ大3之樱桃_性饥渴艳妇性色生活片在线播放_啦啦啦www视频在线观看_宝贝~你里面好紧我好爽视频_国产国产人免费人成免费视频_来自GeoGebra 的交互式_欧美又色又爽又黄的A片18禁_色欲aⅴ亚洲情无码AV

NVIDIA Tegra K1技術詳解

share

  NVIDIA在2013年的CES上召開了自己的專場發(fā)布會,發(fā)布了Tegra 4 SoC芯片。時間過去了一年,NVIDIA又在CES2014的的專場發(fā)布會中發(fā)布了全新的Tegra K1 SoC芯片。如果說Tegra 4在2013年的表現(xiàn)的確不夠亮眼的話,那么新的Tegra K1會怎么樣?這顆被人寄予厚望的產(chǎn)品,能帶來NVIDIA又一次新的崛起嗎?   NVIDIA在CES 2014上發(fā)布了全新的Tegra K1處理器。這次發(fā)布會上令人震撼的消息主要有兩個:首先是NVIDIA在移動平臺全面引入了來自于桌面GPU的架構和技術特性,使得移動平臺的圖形性能、功能向前大幅度躍進。其次是NVIDIA首次公開了秘密研發(fā)多年的“丹佛計劃”,并將“丹佛計劃”的具體成果使用在了Tegra K1中。除此之外,TegraK1還在CPU核心、ISP設計以及節(jié)能設計等方面有獨特之處。   令人驚訝的圖形性能――Tegra K1初窺   根據(jù)NVIDIA在發(fā)布會上的信息,Tegra K1將有兩個版本:已經(jīng)發(fā)布上市的版本采用了四核心Cortex-A15的CPU搭配192個CUDA Core的開普勒架構GPU、以及其他一些功能性核心共同組成Tegra K1 SoC。此外,NVIDIA還將在2014年中期發(fā)布基于ARM 64位丹佛核心、也同樣搭配192個CUDA Core的另一個版本Tegra K1。有關這兩個版本核心的具體消息,本文將會做出詳細的介紹,這里先來看看大家喜聞樂見的性能比拼。

NVIDIA一直在推動著Tegra芯片的快速進化

  雖然目前沒有廠商宣稱已經(jīng)有Tegra K1的實際產(chǎn)品上市,但在CES2014上,聯(lián)想新發(fā)布的ThinkVision 28 4K顯示器搭配了ARM SoC芯片和安卓操作系統(tǒng)(也就是可以化身為特大號平板電腦的顯示器),結果外媒記者不小心發(fā)現(xiàn)這款顯示器使用的竟然是一顆頻率較低的Tegra K1。經(jīng)過簡單測試,Tegra K1早期版本的部分性能也大白于天下。

  由于時間有限,外媒的測試只包含了3DMark、GFXBench 2.7、安兔兔三個項目。在3DMark的測試中,Tegra K1的總分達到了22285分,超越高通驍龍800 30.5%、超越Tegra 4 34%,超越蘋果A7處理器53.6%。在圖形部分,Tegra K1的成績達到了24927分,超越高通驍龍800的Adreno 33038.8%、超越Tegra 4 45.9%、超越蘋果A7 31%。在3DMark的物理測試得到的CPU性能方面,Tegra K1的3D Mark Physics成績達到了16299分,超越高通驍龍800 10.7%、超越Tegra 4 8.7%、更是達到了蘋果A7的205%。GFXbench測試中,Tegra K1在公平的Offscreen模式下,平均幀數(shù)達到了48幀,遠遠高出蘋果A7的27幀、驍龍800的23幀和Tegra 4的20幀。不過在安兔兔測試中,Tegra K1由于系統(tǒng)、測試軟件版本等問題,總成績甚至沒有超越Tegra 4,失去了比較意義。由于測試樣機的原因,Tegra K1在這次測試中的頻率只有2.0GHz,并未達到之前宣傳的2.3GHz。不過即使如此,Tegra K1的性能還是出乎人們的預料。從GFXBench的數(shù)據(jù)來看,Tegra K1的GPU性能甚至達到了目前高通驍龍800的兩倍以上,這是非常驚人的勝出幅度。

  除了上述測試外,另一家媒體也得到了TegraK1的測試成績。他們依舊使用了GFXBench 2.7作為對比,不過對比的產(chǎn)品直接標明了圖形核心名稱:分別是擁有384個流處理器的NVIDIA GeForce GT 740M(GK107核心,開普勒架構)、Intel HD Graphics 4400和Intel HD Graphics 4200(就是Has NVIDIA一直在推動著Tegra芯片的快速進化well處理器中集成的顯卡)、Power VRG 6430(來自蘋果A7)、Adreno 330(來自驍龍800)、GeForce URL(來自Tegra 4的72個圖形核心)。測試表明,在1920×1080分辨率下,Tegra K1大約能跑出60幀的成績,性能是GT 740M112幀的大約一半,基本上和Intel HD Graphics 4400的57幀持平,明顯超出Intel HD Graphics 4200的47幀,更遠超PowerVRG6430的27幀、Adreno 330的24幀和Tegra 4的16幀。

  總體來看,這兩家的性能測試結果基本吻合,對Tegra K1的性能判斷也應該都是真實的,其強大的圖形性能令人側目。這還不算完,NVIDIA表示在壓力更大、負荷更重的GFXBench 3.0中,Tegra K1可以達到蘋果A7性能的最高三倍。那么,為什么Tegra K1的性能尤其是圖形性能如此強大呢?

  開普勒架構在每瓦特性能上的改進

  NVIDIA在進入統(tǒng)一渲染管線發(fā)展后,旗下G80、GT200、Fermi的CUDA計算核心都是以“大而全”的方向來設計的。一個CUDA Core中除了包含計算部分外,還包含了指令控制的模塊。以GF100為例,它的CUDA Core中既包含了整數(shù)處理單元,又包含了浮點處理單元,還包含了指令分發(fā)、操作數(shù)控制和結果排序等模塊。這樣做的結果是對GPU整體來說,CUDA Core的功能更強大,控制和操作更有效率,但是從另一個角度來說,計算效率不高,尤其是直接應用在性能提供上的晶體管比率較低。因此NVIDIA必須采用CUDA Core和GPU核心分頻的方式來保證高性能,這也導致了整個GPU的功耗過高。不僅如此,在Fermi之前的GPU上,指令需要在解碼后才完成相關性排序,并且整個指令的相關檢查、排序過程是在GPU內完成的,F(xiàn)ermi提供了一個比較復雜的多線程指令排序、控制單元,為GPU提供所有指令的關聯(lián)性檢查、分支預測以及指令處理等,整體效率比較低并且可能需要等待,往往會拖累整個計算流水線。

  在開普勒上,上述兩個問題都不復存在了。對開普勒而言,底層設計以最簡單的ALU代替,固定數(shù)量的ALU組成一個計算模塊(類似于AMD的CU單元,不過AMD的CU是64個ALU一組,NVIDIA將每個ALU都稱作CUDA Core),所有的指令排序、控制、緩存等為整組ALU服務,無論是整數(shù)還是浮點,經(jīng)過前端處理后,都能直接送入計算單元進行處理。如果說Fermi時代的每個CUDA Core都配備了相關的指令模塊的話,那么在開普勒上,每32個計算單元配備一個指令模塊,大幅度提升了提供性能的晶體管比率。不僅如此,在指令檢查等問題上,開普勒將有關指令相關性檢查的內容轉移至解碼之前,在經(jīng)過了相關的排序、選擇后,再進行解碼,這樣指令不會由于相關性檢查未通過而返回前端導致效率降低,明顯提升了GPU的運行效率。通過上述改進后,開普勒架構就成為我們今天看到的諸如GTX 770、GTX 780等顯卡的基本結構。NVIDIA在開普勒架構上的轉變,使得開普勒架構的性能功耗比大幅度提升,也使得NVIDIA有機會將開普勒架構應用在對性能功耗比要求極為苛刻的移動計算平臺上。

  開普勒進駐:強悍圖形核心

  說到Tegra K1的圖形性能,就不得不提起NVIDIA強大的桌面GPU架構――開普勒(Kepler)了。作為老牌的視覺計算廠商,NVIDIA的招牌產(chǎn)品就是GPU。桌面市場上,NVIDIA從Fermi時代后開始轉向重視GPU的每瓦特性能,開普勒架構的GPU產(chǎn)品是NVIDIA在每瓦特性能上的一次突破。

  開普勒進駐Tegra

  在之前的Tegra產(chǎn)品上,NVIDIA并沒有使用和桌面產(chǎn)品相同的GPU架構,而是采用了老舊的、源自NV40時代以及NVIDIA收購的芬蘭公司Hybrid Graphics所提出的混合架構。這個架構的優(yōu)勢在于在當時的情況下,能夠提供非常不錯的每瓦特性能和每晶體管性能,但是隨著技術進步,老架構的問題也逐漸凸顯,比如技術支持不夠先進,規(guī)格落后較多,尤其是在Tegra 4上,竟然無法提供對OpenGL ES 3.0的完整支持――雖然Tegra 4已經(jīng)支持了部分OpenGL ES 3.0中的關鍵性技術,但在快速發(fā)展的移動圖形技術面前,無法完整支持OpenGL ES 3.0不但顯得頗為落后,而且很難滿足NVIDIA Tegra系列頂級移動SoC的定位。因此,NVIDIA很早就宣稱自己肯定會將桌面GPU的技術帶到移動平臺來。

  終于,在Tegra K1上,NVIDIA將完整的一顆開普勒SMX單元納入了SoC中。其中包括了整個多形體引擎部分(完整支持頂點拾取、曲面細分等功能)、流處理器部分、特殊運算單元、線程調度、L2緩存、紋理模塊等全部SMX內容。其他方面,NVIDIA為Tegra K1配備了4個ROP單元和8個紋理單元。L2緩存更是一步到位增加到128KB,基本滿足現(xiàn)代GPU計算的需求??偟膩碚f,通過上述步驟,NVIDIA實現(xiàn)了在ARM SoC上從之前老舊的分離式渲染架構到目前先進的開普勒架構的躍進。此外,由于有了完整的一個開普勒核心,因此Tegra K1獲得了GPU部分的單精度和雙精度計算能力;不過雙精度計算能力由于缺乏相關的單元(和GK104一樣),其速度是單精度計算能力的1/24。

  目前的Tegra K1支持規(guī)格是所有ARM S oC中最為先進、齊全的。其規(guī)格完全支持諸如OpenGL 4.4、OpenGL ES 3.0、DirectX 11、OpenCL 1.2、CUDA 6.0以及移動GPU中常見的ASTC、ETC、DXT等多種紋理壓縮格式。相比前代產(chǎn)品Tegra 4,Tegra K1真正做到了規(guī)格和性能上的大躍進。

  為了證明自己GPU強大的規(guī)格以及驚人的性能,NVIDIA在發(fā)布會和會后多次展示了由Tegra K1帶來的實時渲染DEMO。其中包含了在開普勒發(fā)布時展示的人頭DEMO,主要展示了皮膚模擬、表情模擬以及曲面細分技術,此外還有基于計算渲染的全局光照技術、Unreal Engine 4基于Tegra K1的多個DEMO等。從這些DEMO的演示效果來看,Tegra K1本身的性能和所能呈現(xiàn)的圖形畫面是令人震撼的,基本上超越了目前所有主流SoC至少一個世代。在PC平臺上幾乎所有的特效都可以在Tegra K1上呈現(xiàn),雖然由于Tegra K1本身性能問題、部分DEMO縮減了特效,整體效果無法做得很完美,但至少Tegra K1在圖形部分的跨越性和顛覆性毋庸置疑。

  在Tegra K1發(fā)布時,NVIDIA還拋出了一份對比,宣稱TegraK1的浮點計算能力高達365GFLOPS,已經(jīng)遠遠超越了PS3和XBox 360。雖然這樣的對比有吸引眼球的意味在內,但是不得不說,Tegra K1的具體性能還是非常令人滿意的。目前一些消息稱部分PC游戲在經(jīng)過簡單的處理后,就能直接運行在Tegra K1上,效果甚至不亞于PC平臺??紤]到目前有多家廠商宣布基于Tegra 4的游戲機產(chǎn)品問世,我們不禁期待,Tegra K1的游戲機產(chǎn)品如果能以較低的價格,在安卓平臺上達到XBox 360、PS3的水準,是否會引起一場革命?

第三方媒體公布的NVIDIA Tegra K1的性能測試,可以看出Tegra K1的性能已經(jīng)超過了桌面級

集成顯卡Intel HD Graphics 4400。

Tegra K1的圖形核心源自開普勒架構。從開普勒架構開始,NVIDIA在設計GPU時首先注重的是移動平臺和性能功耗比。

由于基礎架構一樣,因此Tegra K1支持幾乎所有桌面顯卡的功能特性,同時功耗控制在2W以內。

NVIDIA在發(fā)布會上用搭載了Tegra K1的平板演示了著名的DirectX 11時代的人頭DEMO,震驚全場。

根據(jù)NVIDIA官方數(shù)據(jù),Tega K1的圖形性能已經(jīng)超越了XBox360和PS3。

下一代Tegra將使用性能功耗比更為優(yōu)秀的Maxwell產(chǎn)品,從而保持和桌面端同步。

大量的功耗控制技術保證Tegra K1即使使用開普勒架構的GPU也能將功耗控制在2W以內。

  功耗迷局:2W的GPU?

  開普勒的確很強大,但還有一個問題揮之不去,那就是功耗。開普勒再強大,依舊是面向桌面用戶的產(chǎn)品,在SoC產(chǎn)品中能使用嗎?根據(jù)NVIDIA在發(fā)布會上的數(shù)據(jù),Tegra K1在GPU部分的功耗不超過2W,真的這么低?

  這個數(shù)據(jù)實際上是有可能達到的:以GeForce GT 740M為例,這顆移動平臺使用的GPU擁有兩個SMX核心,包含了384個CUDA Core,它的TDP功耗為19W。其中3W左右會被用在內存控制單元、PCI- E總線以及其余的非GPU部分,這樣剩余的功耗只有16W。此外,由于工藝改變,大約6W的額外漏電不復存在(Tegra K1采用了漏電更低、更適合移動平臺的HPM工藝,并非桌面GPU使用的HP等工藝),功耗進一步降低到了10W左右??紤]到Tegra K1只有1個SMX,因此功耗會被控制在5W左右。在Tegra K1中,GPU觀察到的最大頻率只有900~950MHz,比桌面動輒1GHz以上低了不少,而且使用的電壓會更低,因此功耗降低到2W~3W并非難事。況且NVIDIA本身就對GPU的動態(tài)頻率、動態(tài)電壓技術爛熟于心,在動態(tài)調整的情況下實際運行功耗還會進一步降低。

  除了本身在規(guī)格上進行改動外,NVIDIA還使用了大量的技術來保證Tegra K1的功耗不會超標。在GPU部分,NVIDIA使用了諸如Rail Gating(軌道柵極)、Power Gating(功率柵極)、Multi-Level Clock Gating(多極時鐘柵極)、Optimized Interconnectand Data Patch(優(yōu)化的互聯(lián)和數(shù)據(jù)模塊)、Idle,Low- utilizationand Active Regimes(閑置、低功耗和活躍狀態(tài)的功耗控制)等多種技術來保證GPU功耗在絕大多數(shù)狀態(tài)下都能處于較高的性能功耗比狀態(tài)。

  根據(jù)NVIDIA的數(shù)據(jù),Tegra K1的GPU性能功耗比相比驍龍800的Adreno 330和蘋果A7的PowerVR SGX6400大幅勝出。在NVIDIA給出的測試環(huán)境(GFXBench 3.0以及1080pOffscreen分辨率)中,Tegra K1在提供相同的性能時,功耗表現(xiàn)都遠遠好于對比機型,其每瓦特性能是對比機型的1.5倍。

  Tegra K1的色彩壓縮技術

  NVIDIA在Tegra K1的發(fā)布會上還額外提到了色彩壓縮技術,其技術思想并不困難,不過實現(xiàn)起來還是不太容易。簡單來說,目前很多平板電腦、手機顯示內容在像素級別來看,大部分都是相同的。比如一張黑色的背景上面漂浮著幾個圖標。除了圖標和文字區(qū)域外,別的黑色背景部分的像素完全一樣。還有網(wǎng)站的網(wǎng)頁顯示,大部分都是白色背景。這些黑色、白色以及其它的均一色彩部分,雖然簡單,但是都牢牢占據(jù)了顯示帶寬――GPU又不認識哪些是一樣的背景,哪些是內容,因此只能統(tǒng)統(tǒng)顯示。色彩壓縮技術的難點在于智能識別不需要壓縮的文本和需要壓縮的色彩部分,因此一直以來都沒有很成熟的方案。

  在Tegra K1上,NVIDIA提出了一種色彩壓縮技術。簡單來說,NVIDIA希望通過一種特殊的算法,將平板電腦上相同的色彩盡可能地壓縮以節(jié)省帶寬、從而降低能耗并提高效率。尤其對網(wǎng)頁顯示、背景顯示等內容來說,色彩壓縮后數(shù)據(jù)的節(jié)省能夠提高能耗比。官方展示中,在待機畫面下,Tegra K1的GPU經(jīng)過色彩壓縮后節(jié)約了最多76%、最少43%的數(shù)據(jù)帶寬,整體表現(xiàn)很不錯。需要注意的是,色彩壓縮技術只對2D畫面有效,3D畫面下由于生成圖形快速而多變,因此色彩壓縮技術是無法實現(xiàn)的。

  寫在最后

  NVIDIA Tegra K1的最大變化是采用了192個與PC同代次的開普勒架構CUDA Core,從而實現(xiàn)了手持移動芯片圖形性能的飛躍。從之前的技術分析中,我們就可以認識到Tegra K1在圖形性能方面的提升。不過,Tegra K1之所以被稱為“革命性”的手持移動芯片,除了GPU部分的革新外,還有更多的創(chuàng)新被融合進包括CPU在內的其他部分。

share