Pagina 2 di 24
Architettura FERMI e GF104:
In seguito alla presentazione dei chip grafici con architettura FERMI GF100 e destinati alla fascia enthusiast del mercato, GeForce GTX480 e GTX470, Nvidia si è dedicata alla cosidetta fascia mainstream dove solitamente si tenta di bilanciare in maniera ottimale il rapporto prezzo prestazioni. Con il chip GF104 Nvidia ha cercato di raggiungere questo obiettivo, rispetto al GF100 l’architettura del chip grafico GF104 è stata rivista, anche se si basa sul concetto di Graphics Processing Clusters (GPC), ognuno formato da Streaming Multiprocessor (SM).
(il chip GF100 e GF104 messi a confronto nelle versioni con tutti gli SM abilitati)
GF104 ha una dimensione del die pari a 332 millimetri quadrati ed è identifcato dalla sigla GF104-325-A1. Dotato di 1,95 miliardi di transistor, è costruito con tecnologia a 40nm ed ha pieno supporto alle ultime librerie Microsoft DX11. GF104 è dotato di 48 core, 4 unità dispatch e 8 unità Texture per ogni SM. Originariamente il GF104 ha 8 SM, ma Nvidia ha optato per abilitarne soltanto 7, disattivandone di fatto una. Questo è dovuto alla sforzo di massimizzare la resa produttiva, per avere un numero superiore di chip utilizzabili durante il processo produttivo delle fonderie. La scelta pertanto è stata quella di avere a disposizione un maggior numero di chip, sacrificando un pò le prestazioni che si avrebbero avuto con tutti gli 8 SM abilitati.
(Il chip grafico GF104 nella versione finale)
Se consideriamo il chip Nvidia GF104 senza unità disabilitate, è costituito da 2 Graphics Processing Clusters (GPC), ognuno delle quali dotata di 4 SM per un totale di 8 SM. A differenza di GF100, dove ogni SM è caratterizzato da 32 Cuda Core, GF104 integra 48 Cuda Core per ogni SM, pertanto il GF104 è composto da un numero massimo di 384 CUDA Core, 64 unità texture e 8 PolyMorph engine. Nvidia ha disabilitato un'unità SM in una delle due GPC, in questo modo abbiamo "soltanto" 7 unità SM funzionanti ed una disattivata. In questo modo troviamo 336 CUDA Core, 56 unità texture e sette PolyMorph engine.
L'unità PolyMorph Engine si occupa delle operazioni di Vertex Fetch, Tessellation, Viewport Transform, Attribute Setup, Stream Output ed all'interno di essa troviamo anche l'unità Tessellator. Nell'architettura Fermi la capacità di elaborazione in double precision in virgola mobile è decisamente superiore rispetto alla precedente architettura ed ha un valore pari alla metà rispetto a quando viene eseguito codice in singola precisione.
Il chip Nvidia GeForce GF104 è attualmente usato in tre tipologie di schede grafiche che differiscono per alcune caratteristiche. Riassumiamo nella tabella sottostante le caratteristiche principali del chip GF104 a confronto con il chip grafico GF100: