La scelta per le aziende tra modelli open-source e proprietari per implementare l’IA generativa

La scelta delle aziende tra modelli open-source e proprietari per l'implementazione dell'IA generativa

Il boom di interesse nell’IA generativa ha portato a più di 350 aziende attive nel settore entro la metà del 2023 [1], con proposte di valore che vanno dai modelli fondamentali ai casi d’uso specifici. Questa vasta scelta di fornitori ha reso necessaria una decisione attentamente informata da parte delle aziende che vogliono implementare questa tecnologia emergente, in cui i criteri dovrebbero andare oltre la semplice posizione del marchio o la differenza di prezzo. Questo articolo analizza una delle dimensioni di questo approccio multifattoriale: l’adozione di un modello di apprendimento linguistico open source o proprietario (LLM, Language Learning Model).

La Figura 1 mostra i principali attori del mercato dell’IA generativa, suddivisi tra soluzioni open source e closed source (cioè proprietarie). Tra le grandi aziende tecnologiche, Google, Microsoft (Open AI) e Amazon offrono prodotti proprietari, mentre Meta (Facebook) e NVIDIA offrono modelli open source. Le aziende che sono già grandi consumatori dei servizi dei giganti tecnologici, come ad esempio lo storage cloud o i prodotti di analisi, potrebbero decidere di rimanere con il loro attuale fornitore per beneficiare dell’integrazione scalabile e senza soluzione di continuità dell’IA generativa nell’ecosistema esistente. Per il resto del panorama competitivo, lo spazio open source è dominato da aziende come Anthropic, Inflection e Cohere, mentre Hugging Face, Mistral AI e Stabilitiy.ai guidano il settore closed source.

Le aziende che sono già consumatori dei servizi dei giganti tecnologici potrebbero decidere di rimanere con il loro attuale fornitore per beneficiare dell’integrazione dell’IA generativa nell’ecosistema esistente.

Figura 1: Principali attori che offrono modelli di IA generativa open source e closed source

Criteri per scegliere tra modelli di IA generativa open source e proprietary

Ogni azienda dovrebbe adottare un approccio sfumato per calcolare il proprio ROI (ritorno sull’investimento) quando considera un fornitore per implementare l’IA generativa. Le differenze da tenere in considerazione non riguardano solo la scelta tra open source e closed source, ma anche all’interno delle due categorie. La Figura 2 fornisce un riepilogo dei fattori rilevanti.

Prezzi

In sostanza, l’open source è gratuito, ma potrebbero esserci tariffe associate a licenze o servizi aggiuntivi che non fanno parte dell’offerta principale. Le politiche di prezzo dei fornitori closed source sono molto variabili, poiché il mercato sta ancora imparando il valore generato. La struttura di prezzo più diffusa si basa sulla dimensione del token di input e di output (ovvero la lunghezza del testo). Un altro approccio è basato sul numero di volte in cui viene chiamato, indipendentemente dalla lunghezza del testo. Google utilizza il primo approccio, mentre Microsoft ha una metodologia ibrida più complessa. Amazon non ha ancora divulgato in dettaglio la sua struttura di prezzo.

La struttura di prezzo più diffusa si basa sulla dimensione del token di input e di output.

Flessibilità

La considerazione della flessibilità è bipartita. La prima riguarda il livello di personalizzazione possibile, dove l’open source vince in quanto è l’utente a decidere come utilizzarlo. Le offerte closed source potrebbero differire in questo senso, ad esempio, Amazon e Microsoft sono considerate avere una maggiore diversità nei loro modelli fondamentali per l’uso enterprise rispetto a Google attualmente. Il secondo aspetto riguarda il problema del vendor lock-in. Mentre i modelli di accesso aperto potrebbero essere facili da migrare da una fonte all’altra in quanto non ci sarebbero vincoli contrattuali, non esiste ancora chiarezza su come è possibile passare da un fornitore all’altro nel caso di un’istanza closed source.

La considerazione della flessibilità è bipartita: il livello di personalizzazione e il problema del vendor lock-in.

Trasparenza

I modelli open source sono naturalmente più trasparenti, poiché la valutazione delle loro prestazioni è crowdsourcing. Le informazioni sulle potenziali vulnerabilità vengono anche raccolte rapidamente e condivise ampiamente, mentre tali dati difficilmente sono resi disponibili per i modelli proprietari. Ad esempio, rispetto ad altri giganti tecnologici, Amazon al momento fornisce la quantità minore di informazioni su come i suoi modelli si comportano rispetto agli altri.

Competenze

I risparmi derivanti dall’accesso gratuito dei modelli open source possono essere compensati dai maggiori costi delle risorse umane. Sono necessarie più competenze, sia in termini di numero che di grado di specializzazione, per implementare modelli open source. In primo luogo, tali competenze non sono facilmente disponibili in quanto la tecnologia stessa è ancora nei suoi primi sviluppi e la domanda è senza precedenti. In secondo luogo, questi posti di lavoro si collocherebbero nella fascia salariale più alta e quindi sarebbero costosi da assumere e mantenere. D’altra parte, un team di Data Science e Sviluppatori più piccolo con una conoscenza generalizzata di IA potrebbe essere sufficiente per i clienti dei prodotti proprietari.

I risparmi derivanti dall’assenza di costi di accesso per i modelli open source potrebbero essere compensati dai maggiori costi delle risorse umane.

Supporto

Lo sviluppo e la manutenzione del codice e dell’infrastruttura sottostante sono più agevoli per i modelli closed source e sarebbero inclusi come parte dell’offerta alle aziende. Un servizio clienti dedicato è anche probabile che sia disponibile per i fornitori closed source, offrendo assistenza nella risoluzione di problemi, ecc., cosa che in generale mancherebbe nell’opzione open source.

Velocità di lancio

Mentre i modelli stessi sono rapidamente accessibili per l’open source, la velocità di implementazione potrebbe essere inferiore rispetto al caso dei modelli closed source a causa delle loro interfacce ben confezionate e facili da usare. Questo, unito al processo di assunzione che richiede tempo, potrebbe comportare un complessivo più lento ingresso al mercato per l’open source.

Prestazioni

In media, si ritiene che i modelli proprietari abbiano prestazioni migliori rispetto a quelli open source, anche se questa differenza si sta riducendo nel tempo. La differenza è principalmente dovuta al fatto che, in media, i fornitori open source potrebbero non avere il grande livello di risorse necessario per concentrarsi nel raggiungimento di un tale vantaggio competitivo attraverso un approccio iterativo, poiché l’addestramento di LLM è costoso, richiedendo grandi capacità di storage e calcolo intensivo. Infatti, entro il terzo trimestre del 2023, il finanziamento di circa $670 milioni per le prime cinque startup open source è stato oscurato da quello delle società closed source di circa $20 miliardi [2].

Figura 2: Considerazioni nella scelta tra offerte open source e closed source di Gen AI

Entro il terzo trimestre del 2023, il finanziamento di circa $670 milioni per le prime cinque startup open source è stato oscurato da quello delle società closed source di circa $20 miliardi.

Altri due punti da considerare sono la privacy e i diritti di proprietà intellettuale (IP). L’open source è meno soggetto al problema della privacy e della divulgazione dei dati in quanto viene adottato internamente. Tuttavia, la maggior parte dei fornitori closed source offre la possibilità di proteggere i dati aziendali in modo che non vengano utilizzati per ulteriori allenamenti dei loro modelli. Il contrasto in termini di privacy dipende maggiormente dalle condizioni contrattuali del fornitore specifico e in misura minore dalle due categorie considerate qui.

Dato che la normativa riguardo ai diritti di proprietà intellettuale dei dati utilizzati per addestrare LLM non è ancora stata definita, la novità delle soluzioni open source comporta un rischio maggiore dovuto a fattori regolatori, in quanto viene addestrata esclusivamente su dati pubblici. Tuttavia, anche i fornitori closed source potrebbero dover dettagliare i loro apporti se richiesto dalla legge in futuro. Come ciò influisce sui clienti dei fornitori di Gen AI dipende ancora dalle disposizioni adottate da ciascun attore, indipendentemente dal fatto che si tratti di open o closed source.

Dato che la scelta tra modelli open source e proprietari potrebbe influenzare significativamente un’azienda, è imperativo valutare prontamente i pro e i contro nel loro insieme.

Fonti: [1] Dealroom, [2] CB Insights

Avviso di non responsabilità: Le opinioni e le vedute espresse in questo blog personale sono esclusivamente quelle dell’autore e non rappresentano le opinioni di organizzazioni o aziende. Non sono incluse informazioni private o proprietarie.

In quanto opera originale, vi prego di segnalare eventuali errori o omissioni.

Crediti fotografici: Roozbeh Eslami