Per i datacenter è un serio problema ciò, infatti i nuovi processori IA Nvidia Blackwell hanno riscontrato seri problemi di surriscaldamento, quindi quando istallati in server di elevate capacità. Come riportato da The Information, queste difficoltà hanno causato non pochi ritardi e cambiamenti di design, provocando anche una preoccupazione generale per importanti clienti come Google, Meta e Microsoft riguardo alla possibilità di implementare in maniera tempestiva questi server nei loro personali centri dati.
I problemi che riscontrano questi processori Nvidia non possono essere trascurati
Secondo fonti vicine i vari problemi si presentano quando le GPU Blackwell, progettate per AI e computer ad alte prestazioni, vengono utilizzate con dei server aventi in parallelo fino a 72 processori. Il consumo energetico ammonta fino a 120kW per rack. Quindi c’è la necessità di rivedere la progettazione dei rack server dovuta alla conseguente limitazione prestazionale delle GPU dovute al surriscaldamento. Quest’ultimo rischia di danneggiare la componente hardware. Per ovviare il problema, Nvidia ha richiesto ai fornitori modifiche progettuali, infatti la revisione ingegneristica di questi chip mira proprio al miglioramento del raffreddamento dei server. Nonostante ormai sia normale adottare tali adeguamenti, hanno contribuito al posticipare la spedizione prevista di questi chip. Comunquè si è ricordato che le modifiche sono parti del processo normale di sviluppo, sottolineando il fatto che il prodotto finale garantisca le prestazioni e l’affidabilità richiesta.
Le GPU blackwell, ha subito un ritardo nella sua produzione causa di un difetto progettuale. Le unità B100 e B200 sfruttano la tecnologia di packaging CoWoS-L di TMSC, che connettono due chiplet attraverso un RDL interposer con ponti di silicio locale (LSI), facendo raggiungere la velocità di trasferimento dati fino a 10TB/s. L’espansione termica di questi punti ha portato a quei difetti nella resa del sistema. Nvidia ha risolto adottando delle modifiche agli strati superiori di metallo del silicio delle GPU e alla struttura di bump.