L’Intelligenza artificiale cambierà il modo in cui facciamo ricerca chimica

GPT-3 può trasformare l'analisi chimica, rendendola più veloce e più facile da usare

[8 Febbraio 2024]

L’intelligenza artificiale sta diventando uno strumento fondamentale nella ricerca chimica, fornendo nuovi metodi per affrontare sfide complesse con cui si confrontano gli approcci tradizionali. Un sottotipo di intelligenza artificiale che ha visto un utilizzo crescente in chimica è il machine learning – l’apprendimento automatico – che utilizza algoritmi e modelli statistici per prendere decisioni basate su dati ed eseguire compiti per i quali non è stato esplicitamente programmato. Ma,  per fare previsioni affidabili, l’apprendimento automatico richiede anche grandi quantità di dati, che non sono sempre disponibili nella ricerca chimica. Semplicemente, piccoli dataset chimici non forniscono informazioni sufficienti sulle quali questi algoritmi possono esercitarsi, il che ne limita l’efficacia.

Il nuovo studio “Leveraging large language models for predictive chemistry”, pubblicato su Nature machine intelligence da un team di ricercatori dell’École Polytechnique Fédérale de Lausanne (EPFL) e dell’HelmholtzZentrum Berlin für Materialien und Energie (HZB) ha trovato una soluzione in modelli linguistici di grandi dimensioni come GPT-3. I ricercatori svizzeri e tedeschi spiegano che «Questi modelli sono pre-addestrati su enormi quantità di testi e sono noti per le loro ampie capacità di comprendere e generare testi simili a quelli umani. GPT-3 costituisce la base della più popolare ChatGPT di intelligenza artificiale».

Lo studio svela un nuovo approccio che semplifica notevolmente l’analisi chimica utilizzando l’intelligenza artificiale e il principale autore, Kevin Jablonka dell’EPFL e dell’HZB, sottolinea che «Contrariamente allo scetticismo iniziale, il metodo non pone direttamente domande sulla chimica a GPT-3. GPT-3 non ha visto la maggior parte della letteratura chimica, quindi se poniamo una domanda chimica a ChatGPT, le risposte sono generalmente limitate a ciò che si può trovare su Wikipedia. Invece, perfezioniamo GPT-3 con un piccolo dataset  convertito in domande e risposte, si crea un nuovo modello in grado di fornire approfondimenti chimici accurati.

Il leader del team di ricerca, Berend Smit, spiega a sua voltra che «Questo processo prevede di fornire a GPT-3 un elenco curato di domande e risposte. Ad esempio, per le leghe ad alta entropia, è importante sapere se una lega si presenta in un’unica fase o ha più fasi. L’elenco curato di domande e risposte è del tipo: Q = “Il <nome della lega ad alta entropia> è monofase?” A= “Sì/No”. In letteratura abbiamo trovato molte leghe per le quali è nota la risposta e abbiamo utilizzato questi dati per mettere a punto GPT-3. Quel che otteniamo è un modello di intelligenza artificiale perfezionato addestrato a rispondere a questa domanda solo con un sì o un no. Nei test, il modello, addestrato con relativamente poche domande e risposte, ha risposto correttamente a oltre il 95% di problemi chimici molto diversi, spesso superando la precisione dei modelli di apprendimento automatico all’avanguardia. l punto è che è facile come fare una ricerca bibliografica, che funziona per molti problemi chimici», Uno degli aspetti più sorprendenti di questo studio è la sua semplicità e velocità. I modelli tradizionali di machine learning richiedono mesi per svilupparsi e richiedono una conoscenza approfondita. Al contrario, l’approccio sviluppato da Jablonka richiede 5 minuti e nessuna conoscenza.

All’Epfl dicono che «Le implicazioni dello studio sono profonde. Introduce un metodo semplice come condurre una ricerca bibliografica, applicabile a vari problemi chimici. La capacità di formulare domande come “La resa di un [prodotto chimico] preparato con questa [ricetta] è elevata?” e ricevere risposte precise può rivoluzionare il modo in cui la ricerca chimica viene pianificata e condotta».

Gli autori dello studio sono convinti che «Oltre a una ricerca bibliografica, interrogare un modello fondamentale [ad esempio, GPT-3,4] potrebbe diventare un modo di routine per avviare un progetto sfruttando la conoscenza collettiva codificata in questi modelli fondamentali».

Oppure, come riassume succintamente Smit, «Questo cambierà il modo in cui facciamo chimica».