圖形處理單元(GPU)是PC中僅次于CPU的重要芯片,價格和復雜性也不亞于CPU。
當然對于這樣昂貴且重要的芯片,得到的用戶關注也不弱于CPU,好在我們也有與CPU-Z類似的GPU規(guī)格檢查工具——GPU-Z,它當然也就成為了很多媒體和消費者了解GPU及顯卡信息時常用的軟件。不過大家對GPU-Z中繁雜的項目真的了解嗎,它究竟反映了GPU及其周邊、顯卡的那些信息呢?下面我們就以這款軟件的信息為例,讓大家更深入的了解一下GPU吧。○ 顯示卡頁面
● Name(名稱)
當然這一欄中的規(guī)格就是GPU的具體名稱了(圖1),如果同名GPU有不同的規(guī)格,例如NVIDIA GeForce GTX 1060有配置6GB和3GB不同的產品,其頻率等規(guī)格并不相同,那么也會在這一欄中顯示(圖2)。
如果希望進一步了解GPU,那么點擊旁邊的Lookup鍵,即可直接跳轉至TechPowerUp的網(wǎng)頁(圖3),其中不僅包括了這款GPU、公版顯卡的照片、具體信息等,還包括它與其他類似水平GPU的對比,以及一些比較典型的顯卡型號及參數(shù)。
● GPU
筆者認為這一欄的名稱應該改成核心編號,是廠商對顯示器核心的開發(fā)代號或編號。AMD GPU的代號和其CPU一樣,一般采用地名,但CPU多為大河名,而GPU則為島嶼/群島名稱,例如目前比較受關注的Radeon RX480的核心代號為“Ellesmere”(圖4),即為利斯摩爾島。
目前最流行的NVIDIA GPU,如圖1,2中所示,一般采用字母加編號的開發(fā)代號,第一位“G”表示GPU,第二位則表示了GPU世代,例如目前的Pascal核心世代,即為“P”,之前的“Maxwell”核心世代為“M”,“Kapler”核心世代則為“K”,“Fermi”核心世代當然就是“F”。數(shù)字編號則是表示這一GPU的定位,一般來講從低到高是定位從高端到低端的產品,這主要是因為GPU的發(fā)布順序一般是從旗艦到低端,例如圖1,2中的編號。
先發(fā)布旗艦型號,之后由高到低推出GPU的方式,也許和現(xiàn)在GPU的結構有關,現(xiàn)在的GPU的大量流水線可以看作是大量獨立的核心,而且采用了非常靈活的集群化設計(圖5),在推出低端產品時可以采用屏蔽N個核心集群的方式實現(xiàn)(圖6)。而在早期產品中,我們懷疑一些較低端的型號有可能就是有疵瑕的核心,通過屏蔽有疵瑕的核心群組或者降低頻率來實現(xiàn)穩(wěn)定運行,所以會有先發(fā)布擁有較多核心集群的旗艦產品,后推出較少集群和較低頻率的低端型號的現(xiàn)象。
其實目前最大的GPU供應商是英特爾,GPU-Z對其內置核芯顯卡給出的核心代號實際上是其定位,與獨立顯卡GPU的核心代號意義不同。英特爾核芯顯卡以性能和配置從低到高分為GT1、GT2、GT3、GT4等,而在各代CPU中,相同定位的核芯顯卡配置是不同的,例如Haswell核心處理器集成的GT2核芯顯卡帶有20個EU,而Skylake核心處理器集成的GT2核芯顯卡擁有24個EU。
● Revision(修訂版)
這里顯示的是GPU的修訂版本,理論上講,任何小的修改都會影響到這里的數(shù)據(jù)。作為非常復雜的半導體芯片,GPU設計存在一些bug是在所難免的,廠商一般會通過軟硬件兩方面進行彌補,硬件方面當然就是進行設計的步進,如圖1,2中的芯片修訂次數(shù)較少,而圖4中的修訂次數(shù)顯然較多。當然上市芯片的修訂版本數(shù)不一定就是A0,所以圖4不一定說明這款芯片上市后有過大量的改動,很可能是測試過程中進行了大量修訂。
● Technology(工藝)
當然這里指的就是GPU的制造工藝,在上篇中我們已經(jīng)提到,目前主要的芯片代工廠工藝長期落后于英特爾,所以NVIDIA和AMD的GPU長期被限制在28nm,直到2016年的新一代GPU才終于使用14/16nm工藝,也因此使芯片的功耗得以大幅降低,同時可以獲得更大的集成度。
● Die Size(核心面積)
核心面積是硅片的實際面積(圖7),晶體管數(shù)量越多當然硅片核心面積就越大,而制造工藝約精細,則硅片面積就越小,這一點在上篇中已經(jīng)提及。盡管最外層的芯片封裝和硅片核心面積不一致,甚至不一定反應硅片的實際大小,例如AMD和英特爾的各代CPU,從外形上看,金屬封蓋的大小就很類似。好在近期的GPU并沒有在封裝上安裝頂蓋,我們可以直接看到最緊密的封裝(圖8),它與硅片結合緊密,基本可以反映出硅片的實際尺寸,例如比較NVIDIA GeForce GTX 980/1080的芯片,就可以看出采用更精細制造工藝的GTX 1080面積更?。▓D9)。
● Release Date(推出日期)
盡管英文寫法相同,但從我們的測試看,這一欄中的數(shù)據(jù)應該不是芯片出廠日期,而是這一GPU型號的正式發(fā)布或上市日期。
● Transistors(晶體管)
此欄是芯片的晶體管數(shù)量,其中M是百萬(million)的縮寫,我們可以看到圖1,2,4中的GPU晶體管數(shù)量都非常龐大,均達到了數(shù)億個的量級。
● BIOS Version(BIOS版本)
此欄應該是顯卡的BIOS版本,從圖1,2,4可以看出,與主板的BIOS版本不同,顯卡版本號與GPU世代有關,但很難直接看出其推出日期等信息。
● Device ID(設備識別碼)
此欄顯示的是顯卡的設備識別碼,很多軟件其實就是通過這一代碼來識別硬件設備的,它對普通消費者來說意義不大,甚至可以通過BIOS進行欺騙。
● Subvendor(次級供貨商)
所謂的次級供貨商就是提供顯卡的廠商,與提供GPU的廠商有一定區(qū)別,不過在早期的公版旗艦卡上,我們可能會直接看到NVIDIA或AMD的“大名”,如圖1顯示的那樣。另外一些大型集團之下的子品牌會同時顯示,例如圖2中的Zotec(索泰)就是PC Partner(柏能)旗下的品牌。
●ROPs/TMUs(光柵化處理單元/紋理單元)
此欄中的數(shù)字分別是GPU中ROP和TMU的數(shù)目,ROPs的全稱為Raster Operations Units,中文即光柵化處理單元;TMUs的全稱是 Texture Mapping Units,即紋理單元。這兩個單元均位于GPU的核心集群中(圖10),可將GPU處理的數(shù)據(jù)轉換為用于顯示的圖像,光柵化處理單元將計算的頂點數(shù)據(jù)等轉換為符合分辨率的點,同時刪除不用顯示的部分,這樣才能進行輸出顯示,不過此時的輸出圖像只是一個框架,紋理單元的責任就是將紋理填充到架構中,形成可在平面顯示的,3D造型的外殼或皮膚。
雖然理論上講ROPs/TMUs的數(shù)目越多越好,但由于GPU架構的不同,各個廠商和各個世代的GPU設置有一定區(qū)別,會根據(jù)核心能力和最普遍的需求,并不存在必然的關系。
● Bus Interface(總線界面)
此欄說明的是顯卡接口的標準和實際插槽的標準,前一部分表示顯卡接口標準,近期顯卡基本都支持PCI-E 3.0標準,采用16通道接口。作為現(xiàn)在最流行的PC總線,PCI-E的最新規(guī)范為版本3.0,傳輸率達到8GHz|8GT/s,單通道的數(shù)據(jù)傳輸速度接近1GB/s,我們這里提到的顯卡使用16通道接口,說明其外部傳輸速度達到了16GB/s。
當然絕大多數(shù)PC顯卡也可以安裝到其他標準的PCI-E ×16插槽上,甚至只要電氣結構相同,PCI-E ×8插槽也可正常使用,例如圖1中的顯卡就插在一個PCI-E 1.1標準的×16插槽上(@×16 1.1),而很多支持雙顯卡系統(tǒng)的主板(圖11)也是采用了一個PCI-E ×16插槽和PCI-E ×8插槽,或者在使用單顯卡時在單插槽中使用16通道,插上雙顯卡后自動為兩個插槽各分配8個PCI-E通道。
在這一欄后的“?”是一個3D測試功能(圖12,13),因為很多顯卡有自動節(jié)能,在空閑時不會全速運行,因此檢測出來的PCI-E鏈接速度可能較低,通過一個小的3D測試使顯卡進入全速工作模式,以此來測得真實的PCI-E速度。
● Shader(渲染器)
雖然名字叫著色器,但實際上這一欄中是目前的GPU所含流處理器核心數(shù)量,這些流處理器已經(jīng)遠不是最初的GPU著色器,而是具有一定的通用數(shù)據(jù)處理能力。我們在上一篇中提到的異構計算,就是利用了目前GPU的這種架構。
因為流處理器是GPU的主要運算單元,所以在同架構產品中,其數(shù)量的多寡也就意味著性能的高低,如果不是架構差別太大,臨近幾代同廠商GPU的性能也可以這樣衡量。當然由于流處理器的結構不同,AMD、NVIDIA和英特爾之間是不能通過這一數(shù)量來衡量性能高低的,例如圖1中的NVIDIA GeForce GTX 1070流處理器數(shù)量比圖4中的AMD Radeon RX480還要少一些,但前者性能顯然全面超越后者,而英特爾核芯顯卡的類似單元為EU(Execution Unit ,執(zhí)行單元),單位性能要比AMD和NVIDIA的流處理器強得多,有人估算以數(shù)據(jù)吞吐能力等計算,一個EU可以相當于十多個,甚至更多獨顯GPU中的流處理器,所以一般產品只配置10~24個EU單元。
● DirectX Support(對DirectX支持)
DirectX的全稱為Direct eXtension,也有一些更簡化的稱呼是DX,它是由微軟公司創(chuàng)建的多媒體編程接口,被廣泛使用于Microsoft Windows和XBOX系列平臺上的游戲開發(fā)。其最新版本為DirectX 12。
對于顯卡來說,對DirectX版本的支持能力也是劃代的一個重要依據(jù),不過由于最近幾代GPU的架構類似,所以很多針對DirectX 11的GPU也可以支持DirectX 12,不過效率一般。在針對性設計上,各家的表現(xiàn)也不一樣,例如最新一代GPU中,NVIDIA更偏向于針對傳統(tǒng)應用的效率,而AMD則偏向于對DirectX 12的優(yōu)化,所以在同時支持DirectX 11/12的游戲中,N卡在DirectX 11模式下幀速更高,而A卡在DirectX 12模式下幀速更高。
● Pixel Fillrate/Texture Fillrate(像素填充率/紋理著色器)
和Shader這一指標一樣,所謂的Pixel Fillrate/Texture Fillrate也保持了很早以前GPU中還分為像素著色器(Pixel Shader)、紋理著色器(Texture Shader)時的稱呼,但在目前,它實際指的是能夠輸出到屏幕的像素/紋理數(shù)量,目前這一指標已經(jīng)與所謂的Shader無關了,只考慮ROPs/TMUs(光柵化處理單元/紋理單元)和運行頻率,顯示的數(shù)據(jù)其實分別為光柵化處理單元和紋理單元與運行頻率的乘積。
● Memory Type(顯存類型)
顯存雖然與內存顆粒類似,但采用不同的運行模式,等效頻率、帶寬等遠高于PC內存,且在名稱方面并不是嚴格對應的,例如曇花一現(xiàn)的GDDR4和目前的主流GDDR5技術都更接近DDR3。
在顯存類型后標注的是顯存顆粒的廠商,從圖1,2,4顯然可以看出,在GDDR5顆粒(圖14)領域,三星顯然是個中翹楚,這三款典型顯卡的GDDR5顆粒都由三星提供。
● Bus Width(總線位寬)
這里的數(shù)據(jù)指的是顯卡上顯存的位寬,這一數(shù)據(jù)表示顯存與GPU之間交換數(shù)據(jù)時,可以一次性交換的數(shù)據(jù)量。在同代GPU中,這一指標同樣反映著GPU的檔次,越高端的GPU顯存位寬越高,配合顯存的高運行頻率,可以與顯存進行高速數(shù)據(jù)交換,配合GPU的高速運行。
● Memory Size(顯存容量)
與PC內存類似,顯存的作用就是在GPU高速運行和數(shù)據(jù)處理時作為數(shù)據(jù)暫存的空間。當然強大的GPU也就需要大容量的顯存進行配合,因為高分辨率或特別復雜的圖形數(shù)據(jù)也是非常占空間的。從目前的游戲實際需求來看,4K分辨率時,游戲需要的顯存已經(jīng)達到3.5GB以上(圖15),因此中高端顯卡至少需要4GB的顯存才能滿足要求,考慮到未來的需求,最好配置6GB甚至更高容量的顯存。
● Bandwidth(帶寬)
所謂的顯存帶寬就是理論上每秒鐘GPU和顯存交換的數(shù)據(jù)量,這一數(shù)據(jù)就是總線位寬和顯存有效速度的乘積。注意顯存位寬采用了Bit(字節(jié))作為單位,而帶寬采用Byte(字符),所以其數(shù)值還需要進行換算,即1Byte=8Bit。
● Driver Version(驅動程序版本)
在這一欄中除了驅動程序的版本,也顯示了用戶目前所使用的操作系統(tǒng)版本,當然在目前,針對的操作系統(tǒng)版本也確實是顯示卡驅動的一個重要參數(shù),可以說確實屬于驅動程序版本的一部分。
● GPU Clock/Memory/Boost(GPU/顯存/突發(fā)時鐘)
GPU Clock和Memory是GPU和顯存在目前設置下的默認頻率而不是真正的實時運行速度,如果進行了超頻,或在某些廠商的驅動程序中選擇了不同頻率的場景模式(圖16),都會引起這3欄中數(shù)據(jù)的變化。
Boost頻率是GPU在安全溫度下自行超頻的頻率,可以應付一些突發(fā)的高端圖形需求,但無法長時間持續(xù)。
● Default Clock/Memory/Boost(默認GPU/顯存/突發(fā)頻率時鐘)
這一行中的3個數(shù)據(jù)是顯卡的默認運行頻率,與顯卡本身的設置有關,并不一定是GPU廠商的標準設置。
● AMD CrossFire/NVIDIA SLI(AMD/NVIDIA雙卡互聯(lián))
這一欄中顯示的是顯卡是否采用了雙卡互聯(lián)模式,并非是顯卡是否能支持這一模式。
● Computing(處理能力)
GPU-Z提供了4種GPU可以參與的非圖形計算功能,在支持的功能前方框內帶有“√”,即表示支持這一功能,其中“OpenCL”全稱為Open Computing Language(開放運算語言),就是我們前面提到多次的異構計算功能?!癈UDA”全稱為Compute Unified Device Architecture(統(tǒng)一計算設備架構),是NVIDIA推出的通用并行計算架構,包括軟件和相應的硬件架構,讓GPU能夠參與解決復雜的計算而不是只能處理圖形。使用C++和FORTRAN語言都能編寫CUDA架構程序,相應程序在支持CUDA架構的NVIDIA GPU上可以獲得很高的運行效率和性能。
“PhysX”的讀音和“Physics(物理)”一樣,可以看做是后者的變體寫法,它是AGEIA公司開發(fā)的物理運算引擎,可以讓3D場景中的物體運動、碰撞效果更自然。NVIDIA收購AGEIA公司后,PhysX引擎也就成為NVIDIA GPU支持的物理引擎。從圖4的測試結果可以看到,AMD目前并不支持這一引擎,其GPU支持的是Havok物理引擎,不過這一能力并未被歸入GPU-Z的檢測中。
從名稱就可以看出,DirectCompute是包含在DirectX中的功能,它也是一種用于GPU通用計算的應用程序接口。在圖1,2,4中我們看到的DirectCompute 5.0,是集成在DirectX 11內的版本。
● 顯卡選擇欄
如果在電腦中存在多個顯卡(在目前的電腦中非常常見),那么點擊GPU-Z的最下方的顯卡欄,就會出現(xiàn)一個下拉菜單。GPU-Z的默認顯卡一般是獨立顯卡,我們可以通過這一功能選擇處理器內置顯示單元。
○ Sensors(傳感器)頁面
在這一頁面中,我們可以看到顯卡、GPU等部分集成的多個傳感器的實時數(shù)據(jù)(圖17),我們可以選擇希望看到的傳感器數(shù)據(jù)和刷新速度(圖18),也可以選擇希望看到的數(shù)據(jù)類型(圖19)。另外我們如果點擊頁面下部Log to file前的選擇框,就會生成一個GPU-Z Sensor Log.txt的文件,其存儲目錄和文件名均可選。
○ 總結
通過GPU-Z,我們可以比較全面地了解顯卡的信息,為選購、比較顯卡提供參考。另外比較有趣的是,GPU-Z還自帶抓圖功能,大概是喜歡曬顯卡的用戶比較多吧。但需要注意的是,GPU-Z取得的很多信息是來自顯卡BIOS以及識別BIOS信息后從信息庫獲得的標準信息,所以如果顯卡BIOS被刷入其他信息的話,就會出現(xiàn)顯卡信息錯誤的情況,如果希望了解顯卡準確信息,還需要使用其他軟件,從多個方面對顯卡進行考察。
1.《gpuz怎么看顯卡接口看這里!細看電腦之芯(下)——通過GPU-Z認識顯卡》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《gpuz怎么看顯卡接口看這里!細看電腦之芯(下)——通過GPU-Z認識顯卡》僅供讀者參考,本網(wǎng)站未對該內容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉載時請保留本站內容來源地址,http://f99ss.com/gl/2982466.html