Equilibrio tra innovazione e sostenibilità Analisi dell’impatto ambientale dell’IA generativa

Equilibrio tra innovazione e sostenibilità Analisi dell'impatto ambientale dell'IA generativa

Uno sguardo più approfondito all’impatto ambientale dei modelli linguistici e alle soluzioni sostenibili.

Crediti Kohji Asakawa da Pixabay

L’associazione francese Data for Good ha pubblicato un white paper che esplora le problematiche sociali ed ambientali legate all’IA generativa. Mi ha particolarmente interessato l’impatto ambientale dei modelli linguistici, che è meno trattato rispetto agli aspetti etici. Ecco ciò che ho imparato:

TL;DR

  • Contesto: i leader mondiali si sono impegnati a ridurre le emissioni entro il 2050 di almeno 2°C. Ciò implica una riduzione delle emissioni del 43% tra il 2020 e il 2030 (per limitare il riscaldamento a 1,5°C, vedere sezione C.1.1 nel rapporto IPCC). Tuttavia, nello spazio digitale, le emissioni non stanno diminuendo ma aumentando annualmente dal 2 al 7%.
  • L’addestramento di GPT-3 ha prodotto un’enorme emissione di 2200 tonnellate di CO2 equivalente, paragonabile a 1600 voli di andata e ritorno da Parigi a New York.
  • Con 13 milioni di utenti, l’utilizzo mensile di ChatGPT corrisponde a 10.000 tonnellate di CO2. Contribuirebbe allo 0,1% dell’impronta di carbonio annuale delle persone in Francia/Regno Unito se tutti lo utilizzassero oggi e al 0,5% del nostro obiettivo nel 2050.
  • L’impatto di ChatGPT+, basato su GPT-4, potrebbe essere 10-100 volte superiore, aumentando fino al 10% dell’impronta di carbonio annuale attuale… o al 50% dell’impronta che ci siamo prefissati.
  • Ci sono molti modi per ridurre l’impatto nell’uso di tali modelli: utilizzarli in modo ragionevole e optare per servizi cloud con comprovate performance ambientali.
Impronta di carbonio annuale di un cittadino del Regno Unito

Contesto

Per valutare l’impatto ambientale di qualsiasi cosa, possiamo stimare la sua impronta di carbonio: misura le emissioni totali di gas serra causate direttamente e indirettamente da un individuo, un’organizzazione o un prodotto, espresse in tonnellate equivalenti di anidride carbonica (CO2e). Per metterlo in prospettiva, l’impronta di carbonio annuale media è di circa 8-13 tonnellate per persona nel Regno Unito o in Francia, 21 tonnellate negli Stati Uniti e 6 tonnellate in tutto il mondo. Considererò 10 tonnellate come nostra impronta attuale.

Ecco alcuni esempi (con fonti):

Per mantenere l’aumento della temperatura globale al di sotto dei 2 gradi, dobbiamo mirare a ridurre la nostra impronta di carbonio globale a 2 tonnellate per persona entro il 2050. C’è molto lavoro da fare per ridurre le nostre emissioni dell’80 o 90%, e la domanda continua in aumento dei servizi digitali che supera i miglioramenti di efficienza non sta aiutando. Come si inserisce l’IA generativa in questa equazione, e cosa possiamo fare per allineare i nostri progressi digitali ai nostri obiettivi ambientali?

Impatto dell’addestramento:

Crediti Victor Freitas da Unsplash

Nella fase di addestramento, alimentiamo i modelli di linguaggio con dati selezionati in modo che possano imparare da essi e diventare capaci di rispondere alle nostre richieste.

Lo studio ha analizzato due grandi modelli di linguaggio:1. Bloom open source2. GPT-3 proprietario di OpenAI

Risultati chiave:- Impronta di carbonio di Bloom: Inizialmente stimata a 30 tonnellate, è stata rivista a 120 tonnellate dopo un’analisi approfondita.- Impronta di carbonio di GPT-3: Stimata in 2200 tonnellate, equivalente a 1600 voli di ritorno da Parigi a New York.

Un punto di vista comune è che va bene che questi modelli abbiano costi di addestramento elevati perché vengono utilizzati ampiamente da molti utenti.

Impatto dell’inferenza

Crediti Fitsum Admasu da Unsplash

L’inferenza nel Machine Learning avviene quando utilizziamo un modello addestrato per fare previsioni su dati in tempo reale. Ora stiamo valutando l’impatto dell’esecuzione di ChatGPT.

Sulla base dell’assunzione che Chatgpt abbia 13 milioni di utenti attivi che effettuano in media 15 richieste, l’impronta di carbonio mensile è di 10.000 tonnellate di CO2. E l’apprendimento chiave per me è che questo è molto più grande dell’impatto dell’addestramento.

Per un utente, l’aggiunta all’impronta di carbonio annuale è di 12 mesi * 10000 tonnellate / 13 milioni di utenti = 9 chilogrammi di CO2eq all’anno per utente, equivalente allo 0,1% dell’impronta di carbonio annuale media attuale, o allo 0,5% della nostra impronta target.

Ma cosa succede se quella persona utilizza ChatGPT insieme a GPT-4? L’impronta di GPT-4 è 10-100 volte più grande di quella di GPT-3. Questa impronta vale tra 100 chilogrammi di CO2e e 1 tonnellata aggiuntiva, fino al 10% dell’impronta di carbonio di un cittadino francese, e il doppio se stai facendo del tuo meglio per ridurla. Se consideriamo la nostra impronta target nel 2050, ciò rappresenta il 50%! Che brutta storia.

E se, un giorno, ogni interazione che hai con qualsiasi applicazione nella tua vita facesse richieste a modelli di linguaggio? Pensiero spaventoso.

La buona notizia è che utilizzare ampiamente l’API di gpt4 è così costoso che non possiamo permettere ai nostri utenti di effettuare 15 richieste al giorno, a meno che i nostri utenti non siano disposti a pagare un abbonamento mensile di oltre 100$, cosa che il mio mercato di riferimento sul prodotto che sto sviluppando (un assistente personale alla meditazione) non è disposto a fare. E non solo le piccole imprese non possono permetterselo: nemmeno Google e Microsoft possono permettersi di sostituire i loro motori di ricerca con un modello delle dimensioni di GPT4, il che aumenterebbe di 100 volte il costo delle loro query.

Raccomandazioni

Le raccomandazioni sono le seguenti:

  • Rimanere sobri: Può essere tentante sostituire un intero progetto IT con ChatGPT-4, ma invece possiamo mettere in discussione l’utilità del progetto, la reale necessità di utilizzare un modello di linguaggio e limitarne l’uso a casi specifici che ne hanno veramente bisogno. Ad esempio, utilizzare un modello molto più piccolo di GPT-4 ogni volta che è possibile. Pensateci due volte prima di utilizzare (lo in) ChatGPT+.
  • Ottimizzare la formazione e l’uso: Su questo punto, le tecniche sono numerose, in continua evoluzione e i data scientist dovrebbero già utilizzarle… per ridurre i costi. Consistono principalmente nel ridurre l’uso dell’infrastruttura, il che a sua volta riduce il consumo di elettricità e quindi le emissioni di carbonio. In sostanza, formiamo un modello solo se è necessario; se lo facciamo, pianifichiamolo in modo da evitare di sprecare risorse. E utilizziamo il modello più piccolo che soddisfi adeguatamente le esigenze.
  • Selezionare il Paese migliore per ospitare il server sulla base della sua impronta di carbonio energetica. E qui arriva l’orgoglio francese: l’impronta di carbonio della nostra energia nucleare primaria è 7 volte inferiore rispetto agli Stati Uniti. Tuttavia, se tutti voi iniziate a ospitare i vostri modelli di linguaggio qui: in quel caso, probabilmente importeremo l’energia del carbone dai nostri cari vicini 🔥.
  • Scegliere il miglior servizio cloud in base alle sue prestazioni ambientali (questi dati sono a volte pubblici; altrimenti ci sono strumenti per misurare/stimare come https://mlco2.github.io/impact/) – favorire i servizi cloud che utilizzano i loro server per periodi più lunghi (tuttavia, gli iperscalatori tendono a mantenere l’hardware per non più di 4 anni) e i data center con un alto livello di condivisione.

Siete interessati a ridurre il vostro impatto?

Se sia che siate singoli individui o aziende, ci sono risorse ed esperti disponibili per guidarvi verso un percorso sostenibile.

A livello individuale:
– Se volete valutare la vostra impronta di carbonio, ci sono molti strumenti online. Personalmente, misurare la mia impronta di carbonio mi ha aperto gli occhi e mi ha spinto a esplorare modi per avere un impatto positivo. Se vivete nel Regno Unito, controllate https://footprint.wwf.org.uk/
– Per acquisire una conoscenza di base sulla scienza che sta dietro ai cambiamenti climatici: https://climatefresk.org/
– Per approfondire le azioni che potete intraprendere e stimare quanto possono ridurre la vostra impronta di carbonio, un altro workshop della durata di 3 ore: https://en.2tonnes.org/

A livello aziendale: Molte aziende stanno esplorando questi argomenti e ecco cosa possono fare:

  • Educare i propri dipendenti (con i workshop suggeriti sopra),
  • Eseguire audit e misurare la propria impronta di carbonio,
  • Progettare strategie per migliorare i propri punteggi ESG (Ambientale, Sociale e di Governance aziendale).

Ho appreso di questo brillante studio grazie a delle persone fantastiche che ho incontrato di recente, da Toovalu e Wavestone. Date un’occhiata a quello che fanno!

Se avete trovato errori nelle mie stime o volete aggiungere le vostre opinioni, lasciate un commento e condividete se l’avete trovato interessante.

🙌 Grazie per aver dedicato del tempo a leggere questo articolo, spero sia stato illuminante! Un grande ringraziamento a Thibaut, Léo, Benoit e Diane per i loro preziosi feedback e contributi a questo articolo 🙏.

E se desideri rimanere aggiornato sulle Applicazioni Integrate Generative e sull’IA responsabile, seguimi su Linkedin 👋.