Dove le rocce e l’IA si scontrano l’intersezione tra mineralogia e visione artificiale a zero-shot

Intersezione tra mineralogia e visione artificiale a zero-shot

I minerali sono sostanze naturali, inorganiche, con una composizione chimica definita e una struttura cristallina. Sono i mattoni fondamentali delle rocce e svolgono un ruolo cruciale in vari processi geologici e industriali. Identificare e classificare i minerali è un processo molto complesso e richiede competenze specializzate. Per svolgere questo compito, i geologi devono dedicare ore e a volte giorni alla preparazione del campione e a vari tipi di analisi.

Aggiungendo alla complessità c’è il fatto che una significativa proporzione dei minerali necessita ancora di una ricerca più approfondita, lasciandoci solo con poche centinaia di minerali studiati in modo esaustivo su un totale di 6.000 minerali attualmente identificati.

Come risultato, sono in corso ampi sforzi globali per colmare questa lacuna attraverso una ricerca e uno studio approfonditi. Introdurre l’intelligenza artificiale in questo processo può svolgere un ruolo fondamentale nel trovare errori e semplificare le attività di routine che tradizionalmente sono gestite dagli esperti. Sfruttare l’intelligenza artificiale per la diagnostica visiva ha il potenziale per liberare i mineralogisti professionisti dai compiti di routine, consentendo loro di dedicare il loro tempo a sfide più complesse.

Di conseguenza, in collaborazione con Sber AI e la Lomonosov Moscow State University, l’Artificial Intelligence Research Institute ha creato un benchmark di dataset di riconoscimento dei minerali per modelli di visione artificiale. Il dataset si chiama MineralImage5k. Hanno utilizzato il dataset del Fersman Mineralogical Museum. I fondi del museo contengono oltre 170.000 campioni (circa 5.000 specie minerali). Questa collezione è una delle più grandi collezioni di minerali a livello mondiale.

Il dataset contiene campioni grezzi, il che lo rende molto simile a quelli trovati in montagna o nei letti dei fiumi ed è diviso in tre sottoinsiemi che mettono alla prova i ricercatori nella classificazione, segmentazione e stima delle dimensioni dei minerali. Dopo aver raccolto il dataset, i ricercatori hanno effettuato un’analisi delle immagini e pulito questo dataset. Prima hanno rimosso le immagini corrotte, poi hanno rimosso le immagini con rapporti di aspetto elevati, poiché la maggior parte dei modelli di visione artificiale funziona con input quadrati. Hanno anche aggiunto del padding alle immagini se la differenza tra i lati dell’immagine era troppo alta. Hanno inoltre rimosso le immagini duplicate in quanto le immagini duplicate contribuiscono alla perdita di memoria. Infine, hanno ridimensionato le immagini rimanenti a 1024 pixel.

Tuttavia, l’intelligenza artificiale può avere difficoltà a osservare immagini di minerali perché potrebbe essere necessario sapere quale parte della roccia è il minerale che desideriamo. Per aiutare, i ricercatori hanno fornito circa 100 immagini extra con etichette che mostrano esattamente dove si trova il minerale. Hanno utilizzato un modello che apprende da immagini e parole per mostrare quanto fosse buono il loro test. Hanno verificato quanto bene funzionasse dopo aver insegnato al modello le immagini di MineralImage5k.

I ricercatori hanno sottolineato che desiderano ottenere più immagini per il loro test in futuro. Si concentrano anche su altri studi, creando diversi insiemi di immagini con più minerali e rocce. Potrebbero anche utilizzare altri tipi di informazioni per migliorare ulteriormente l’intelligenza artificiale. Infine, gli esperti di minerali, gli esperti di visione artificiale e gli esperti di intelligenza artificiale devono lavorare insieme per migliorare il riconoscimento dei minerali.