Nuova architettura FERMI e GF110:
In maniera sostanziale il nuovo chip GF110 prodotto da Nvidia ha sostituito il vecchio GF100, il quale veniva usato per la GeForce GTX 480, ed è dotato della medesima architettura.
Il chip grafico è dotato di 4 Graphics Processing Clusters (GPC), ognuno dei quai contiene 1 Raster Engine, 4 Stream Multiprocessors (SM). Ogni SM contiene 32 CUDA core, 16 unità Load/Store, 4 Special Function Units, 4 Texture Units, 2 Warp Schedulers ed 1 Dispatch Unit. Troviamo anche una unità Polymorph Engine che si occupa delle operazioni di tesselazione, 48KB+16KB L1 cache, le Unità di Registro e le ROPs. A servizio del memory controller (6 x 64bit) abbiamo la L2 cache.
A conti fatti abbiamo un GF100 senza alcuna limitazione, vi ricordiamo infatti che nella GeForce GTX 480 un’unità SM era disabilitata per garantire alte rese produttive. Adesso Nvidia grazie agli affinamenti del processo produttivo e di altri fattori di progettazione compiuti dalle fonderie, è riuscita a restituirci un GF100 senza alcuna limitazione, migliorato inoltre in alcuni aspetti.
Troviamo in questo modo ben 512 unità CUDA core funzionanti a 1.544 MHz, 64 TMU, 48 ROPs, controller a 384bit, 1536 MB di memoria video del tipo GDDR5, funzionanti a 4.008 MHz e che garantiscono una banda passante di ben 192,4 GB/s. Naturalmente il core grafico lavora sempre in rapporto 1:2 rispetto ai CUDA core, infatti ha una frequenza di 772 MHz nella versione reference di Nvidia. Possiamo ossservare sotto una tabella che mette in evidenza le caratteristiche architetturali di GF110:
Vi sono state anche altre ottimizzazioni che in alcuni casi possono portare a differenze significative. In precedenza con il chip grafico Nvidia GF100, le proprie unità erano in grado di computare 1 texture address e 4 fetch a 32bit/INT8 texture samples per clock, 2 64bit/FP16 texture samples per clock, oppure 1 128bit/FP32 texture sample per clock. Già con il chip GF104 le texture units hanno subito un miglioramento riuscendo a renderizzare 4 samples/clock per istruzioni a 32bit e 64bit. Allo stesso modo in GF 110 troviamo questa capacità di calcolo, adesso il chip è in grado di processare istruzioni 32bit (INT8) e 64bit(FP16) alla stessa velocità, vale a dire ben 4 istruzioni per ciclo di clock. Questo, anche se non ha un impatto immediato in tutti i giochi, in qualcuno specie tra i più recenti si traduce in un vantaggio sostanziale rispetto a GF100. Riassumiamo questo concetto nella tabella seguente:
Altre modifiche, più esterne, riguardano il sistema di dissipazione, relativo alla versione reference Nvidia, che adesso è più efficace e silenzioso, grazie all’adozione della tecnologia a camera di vapore ed ad un generale restilyng del sistema di dissipazione.
In aggiunta Nvidia ha dotato sul proprio PCB ben 3 controller Hardware Monitoring Manage Power, che monitorizzano in maniera istantanea la corrente assorbita. In questo modo non appena si va oltre certe specifiche PCI-E, con particolari applicazioni come OCCT o FurMark, fanno in modo che i clock sono variati in modo da far rientrare il sistema secondo le specifiche PCI-E.
Riassumiamo brevemente le modifiche che sono state apportate al nuovo chip grafico GF110 rispetto al precedente GF100: