Simulazioni e Titan V  – Risultati non affidabili per la scienza

Simulazioni e Titan V – Risultati non affidabili per la scienza

Non è la prima volta che copriamo alcune delle GPU ed architetture made in nVidia; cominciando dai rumor in merito ad Ampere, passando per Turing ed infine oggi tocca a Volta. Stando ad un articolo presente sul portale del londinese The Register infatti, nell’ambito scientifico la “GPU più potente mai creata” non sembra cavarsela tanto bene; il connubio simulazioni e Titan V infatti sembra produrre risultati differenti svariate volte. Sarebbe tranquillamente ammissibile se stessimo parlando di una texture, ed anche se si fosse trattato di una qualsiasi GPU che non costasse circa 3’500 €; ma quando ci sono di mezzo test scientifici che richiedono una possibilità di errore pari a zero, beh, non ci siamo proprio.

Simulazioni e Titan V – C’è qualquadra che non cosa

Un ingegnere anonimo ha dichiarato alla testata londinese di avere riscontrato risultati errati nel 10% dei casi; e nello specifico i problemi si sono verificati durante una simulazione nell’interazione fra una proteina ed un enzima. Per intenderci, queste operazioni prevedono si un sistema di equazioni del moto particolarmente complesse; ma creando un ambiente in cui variabili e condizioni sono identiche, non vi è una ragione logica per cui debbano cambiare i risultati. Ad “addolcire la pillola” si può aggiungere che l’anomalia si verifica su due delle quattro Titan V in possesso dell’ingegnere; anche se statisticamente irrilevante, si può affermare che al momento il 50% delle schede sono affette dall’errore.

nVidia inizialmente si è rifiutata di commentare sul problema insorto, ma è stato rilasciato un comunicato in cui è anche stata indicata Amber come applicazione affetta dal problema. Vi lascio con una traduzione del comunicato da parte di nVidia; ed a noi non rimane che restare sintonizzati per seguire gli sviluppi della vicenda.

Tutte le nostre GPU lavorano correttamente, la nostra linea Tesla, che è dotata di ECC (Error-Correcting Code Memory) è designata per questo genere di simulazioni a larga scala. Chiunque dovesse avere problemi può mettersi in contatto con support@nvidia.com

COMMENTS

DISQUS: 0