Svelate le prestazioni della nuova proposta top di gamma di AMD peril videogiocatore appassionato, basata su GPU della famiglia Fiji e per la prima volta abbinata a memoria HBM, High Bandwidth Memory. Dimensioni compatte grazie alle nuove memorie, ma un sistema di raffreddamento a liquido di tipo integrato che assicura silenziosità e consumi contenuti per la rivale diretta di GeForce GTX 980Ti.
Fiji: la nuova GPU di casa AMD
Si attendeva da molto tempo il debutto di una nuova architettura di GPU da parte di AMD, con la quale potersi posizionare ad un livello all’altezza dei recenti annunci di NVIDIA nel segmento top di gamma delle schede video. Alcuni giorni fa l’azienda americana ha presentato la propria nuova gamma di soluzioni della famiglia Radeon 300, proposte basate su GPU già presenti in commercio e rivitalizzate da incrementi nelle frequenze di clock e da differenti abbinamenti con la memoria video. La nostra analisi, con il test delle due schede Radeon R9 380 e Radeon R7 370 proposte da Asus, è disponibile online a questo indirizzo.
Quest’oggi scade l’embargo sulle analisi prestazionali della scheda Radeon R9 Fury X, la prima della famiglia Fury a debuttare sul mercato. Questo prodotto sarà seguito a metà Luglio dalla scheda Radeon R9 Fury, e più avanti dalla proposta Radeon R9 Fury Nano e da una declinazione con due GPU montate su singolo PCB per la quale AMD non ha ancora indicato il nome commerciale.
Radeon R9 Fury X implementa la GPU Fiji, in quella che presumiamo sia la declinazione più completa: troviamo 4.096 stream processors, un incremento del 45% rispetto ai 2.816 implementati nella GPU Hawaii adottata per le schede Radeon R9 290 e Radeon R9 390. Tutto questo a parità di tecnologia produttiva, quella con processo a 28 nanometri sviluppata dalla taiwanese TSMC e adottata del resto anche da NVIDIA per le proprie soluzioni della famiglia GeForce.
Fiji è una GPU estremamente complessa, nella quale trovano posto circa 8,9 miliardi di transistor per una superficie complessiva di 596 millimetri quadrati. Sono questi dati allineati a quelli del chip GM200, la soluzione che NVIDIA utilizza nelle schede GeForce GTX Titan X e GeForce GTX 980Ti che vanta una superficie di 601 millimetri quadrati e un totale di circa 8 miliardi di transistor. Nel confronto con il chip Hawaii i numeri di Fiji sono ben superiori, vista la superficie di circa 438 millimetri quadrati e i 6,2 miliardi di transistor che compongono la GPU adottata nelle schede delle famiglie Radeon R9 290 e Radeon R9 390.
Rivediamo nella tabella seguente le principali caratteristiche tecniche della scheda Radeon R9 Fury X a confronto con il modello Radeon R9 390X:
CPU |
Radeon R9 Fury X | Radeon R9 390X |
tipo GPU | Fiji | Hawaii |
architettura |
GCN 1.2 | GCN 1.1 |
stream processors | 4.096 | 2.816 |
base clock GPU | – | – |
boost clock GPU | 1.050 MHz | 1.050 MHz |
ROPs | 64 | 64 |
TMU | 256 | 176 |
clock memoria | 1.000 MHz | 6.000 MHz |
dotazione memoria | 4 Gbytes | 8 Gbytes |
bandwidth memoria | 512 GB/s | 384 GB/s |
bus memoria | 4096 bit | 512 bit |
alimentazione | 8pin+8pin | 8pin+6pin |
typical board power | 275 Watt | 275 Watt |
Dell’aumento nel numero di stream processors abbiamo già parlato, ma è interessante notare come questo non abbia avuto implicazioni sulla frequenza di clock massima della GPU che è sempre pari a 1.050 MHz. AMD continua con la politica adottata dal lancio delle schede Hawaii indicando la massima frequenza di clock raggiungibile dalla GPU durante l’uso, senza specificare quale sia quella minima. Se le caratteristiche di funzionamento in termini di temperatura del chip video e alimentazione lo permettono la scheda sarà sempre caratterizzata da questa frequenza di clock massima, mentre se dovessero sopraggiungere condizioni d’uso non compatibili la GPU vedrà una contrazione della propria frequenza di clock sino ad un valore che permetta di assicurare funzionamento stabile.
Dal versante memoria troviamo una delle principali novità della scheda Radeon R9 Fury X: si tratta della High Bandwidth Memory o HBM, presente in questa scheda in quantitativo di 4 Gbytes contro gli 8 Gbytes del modello Radeon R9 390X a causa delle limitazioni della tecnologia HBM nell’implementazione al momento attuale disponibile. La bandwidth massima teorica a disposizione è nettamente superiore ma resta da capire se il quantitativo di 4 Gbytes possa rappresentare un collo di bottiglia alle prestazioni velocistiche in quegli scenari d’uso tipici per un prodotto di questo tipo, quindi con risoluzione molto elevata accompagnata da impostazioni qualitative spinte.
Lo schema di funzionamento del chip Fiji evidenzia la radice di questa architettura, che è quella dell’altra GPU di classe GCN 1.2 prodotta da AMD. Parliamo della GPU Tonga, utilizzata in prodotti retail per sistemi desktop nella scheda Radeon R9 285. In Fiji quindi ritroviamo la tecnologia di color compression, utile per gestire nel modo più efficiente possibile la bandwidth della memoria video anche in abbinamento alla tecnologia HBM, con varie ottimizzazioni che vanno dall’aumento nella dimensione della cache L2 a cambiamenti nell’unità UVD. Da segnalare, e in questo c’è una similitudine con quanto fatto da NVIDIA con il chip GM200, come Fiji non sia una GPU ottimizzata per il calcolo in doppia precisione importante per gli ambiti di GPU computing: la potenza di calcolo in double precision è infatti pari a 1/16 di quella in single precision, contro un dato di 1/8 nella scheda Hawaii (che diventa 1/2 nelle declinazioni per Wodkstation della gamma FirePro).
Nel confronto tra Fiji e Hawaii notiamo come AMD abbia scelto con la nuova arrivata di espandere sensibilmente la potenza di elaborazione in termini di stream processors ma lasciando di fatto invariata rispetto ad Hawaii la capacità di elaborazione in termini di ROPs. Se quindi l’applicazione 3D eseguita è maggiormente dipendente dalla capacità di elaborare gli shader ecco che con Fiji si noterà un netto beneficio prestazionale, ben meno visibile nel momento in cui i frames siano limitati dal thrughput delle ROPs.
Estendendo il confronto alle architetture NVIDIA della famiglia GeForce con la GPU GM200 notiamo come queste ultime siano state sviluppate da NVIDIA conferendo un peso maggiore alla gestione dei poligoni e con una inferiore incidenza delle ROPs quali collo di bottiglia alle prestazioni complessive. Di conseguenza avremo scenari prestazionali sulla carta molto differenti tra le GPU AMD e quelle NVIDIA, con le prime che prediligono l’elaborazione dei pixel grazie ai molti stream processors e alla superiore bandwidth della memoria video e le seconde che sono da prediligere quando è chiamata in causa la gestione di un numero sempre più elevato di poligoni nelle scene 3D.