AMD HD 7900: Southern Islands al debutto [Preview] - Graphics Core Next Architetture (GCN)

Indice articoli

 

Graphics Core Next  Architetture (GCN)

Come già accennato nelle precedenti pagine, con la serie Southern Islands si assiste ad una vera e propria rivoluzione in questo settore. L'evoluzione nel settore grafico nella progettazione dei core grafici ha subito nel corso degli anni un costante miglioramento, abbiamo assistito a 3 ere principali:

AMD_Southern_Island_14

La prima era è stata basata su funzioni fisse di tipo matematico con un motore geometrico di trasformazione di tipo 3D e capacità di calcolo sull'illuminazione. La seconda era, invece, vede l'introduzione di semplici shaders. Abbiamo la presenza di un'interfaccia memoria con 8 Vertex Pipes, un core dedicato ai Pixel Shaders, 16 Pixel Pipes ed un setup engine, dopo le vertex pipes che elaborano i vertici e prepara i dati per poter essere elaborati dal pixel shader core.

La terza era è costituita invece da unità programmabili e con calcolo parallelo dei core, una prima evoluzione è stata la cosidetta VLIW5 che prevede quattro unità Stream Processing Units ed unità FMAD+ con alcune funzioni speciali, più unità di Branch. Nell'evoluzione VLIW4 invece non abbiamo più 4 Stream Processing Units ed una FMAD+, ma soltanto 4 unità di Stream Processing che includono in parte alcuni funzioni che prima erano delegate alla FMAD+.

AMD_Southern_Island_15

Con il GCN assistiamo ad una vera  e propria rivoluzione che possiamo definire benissimo quarta era, con un taglio alla passata generazione. Le novità introdotte sono notevoli, si passa ad un'architettura tutta nuova:

AMD_Southern_Island_16 tahiti_architetture_2

 

Abbiamo nuove performance e feature all'avanguardia rispetto alla precedente generazione: l'introduzione di operazioni computazionali è di tipo multitasking e nel corso degli anni vedremo in altre evoluzioni. L'architettura è progettata per migliorare l'efficienza nei consumi, ottimizzata per calcoli computazionali di tipo eterogeno, con massima scalabilità e flessibilità in ottica del concetto Fusion System Architetture.

compute_unit_architetture GCN_detail

 

Ogni unità GCN si chiama Compute Unit (CU) ed è composta principalmente da 4 SIMD, che potremmo identificare per semplicità come unità vettoriali in qualche modo analoghe alle unità di tipo SSE/AVX, ciascuno composto da 16 stream processors per un totale di 64 stream processors per ogni Compute Unit; 1 Scalar Unit che potremmo assimilare alla pipeline INT di una cpu moderna. In ogni CU troviamo 4 texture unit, per un totale di 128 presenti nella Radeon HD 7970. Ciascuna SIMD unit, presente in ogni CU, è dotata di un vector register da 64 Kbytes, una memoria di local data share da 64 Kbytes ed un'altra memoria da 4 Kbytes dedicata alla scalar unit per i propri registri.

Il nuovo core grafico è composto da fino a 32 CU GCN, nel modello di punta, e da un doppio Geometry Engine. Abbiamo la presenza di 8 Render Back-ends composte da 32 Color ROPs e 128 Z/Stencil ROPs. Una cache di secondo livello L2 fino a 768 KB in grado di leggere e scrivere i dati. Infine come già detto abbiamo un interfaccia verso la memoria di tipo a 384 bit e memorie di tipo GDDR5 che garantiscono una band width fino a 264 GB/s. In ultimo abbiamo la presenza per la prima volta di un controller di tipo PCI-Express 3.0.

AMD_Southern_Island_17 AMD_Southern_Island_18

Le nuove capacità computazionali garantiscono una maggiore efficienza ed una utilizzazione fino a più di quattro volte superiore rispetto alla HD 6970, davvero un notevole risultato. La tessellation ha subito un netto miglioramento, andando a colmare ed incrementare il distacco nei confronti delle schede avversarie. Adesso, in base al tipo di fattore di tessellation arriviamo fino ad un 4x rispetto alla vecchia generazione ed in particolare in alcuni giochi e bench il miglioramento è netto.

AMD_Southern_Island_19

Un altro importante miglioramento introdotto è la Partially Resident Textures (PRT), che consente il caricamento delle cosiddette Mega Textures: la dimensione massima di una texture è stata aumentata a 32TB (16k x 16k x 8 x 128-bit per texel). Inoltre l'accesso alle texture è accelerato in hardware, usando la memoria della scheda grafica come cache locale. Ciò è stato fatto sopratutto per il GPU computing, dove vengono elaborate grosse moli di dati e in questo modo il comportamento della GPU si avvicina a quello di una CPU con memoria virtuale, senza allocazione e deallocazione manuale dei dati da elaborare. Ma tale caratteristica potrebbe anche essere sfruttata nei giochi, potendo finalmente usare texture molto grandi senza preoccuparsi della memoria della scheda, in quanto solo la parte utilizzata in un dato momento sarebbe caricata in memoria locale.


AMD_Southern_Island_20

Altro miglioramento riguarda la qualità di immagine dei filtri Anisotropico, in particolare grazie ad un nuovo algoritmo vi è un nuovo riferimento nella qualità delle immagini. In realtà tale nuovo algoritmo non è altro che una modifica dei pesi del filtro anisotropico e quindi è abilitato di default e non comporta penalizzazioni in termini di prestazioni.

 

 

Corsair