Bard sta migliorando nella logica e nel ragionamento.
Bard is improving in logic and reasoning.
Oggi vengono lanciate due migliorie per Bard. Innanzitutto, Bard è diventato migliore nei compiti matematici, nelle domande di codifica e nella manipolazione di stringhe. Inoltre, ha una nuova funzione di esportazione su Google Sheets: quando Bard genera una tabella nella sua risposta – come se gli chiedi di “creare una tabella per le iscrizioni volontarie per il mio rifugio per animali” – ora puoi esportarla direttamente in Sheets.
Migliori risposte per i compiti avanzati di ragionamento e matematica
Una nuova tecnica chiamata “esecuzione del codice implicito” aiuta Bard a rilevare i compiti di calcolo ed eseguire il codice in background. Di conseguenza, può rispondere con maggiore precisione a compiti matematici, domande di codifica e compiti di manipolazione di stringhe. Così Bard migliorerà nel rispondere a compiti come:
- Quali sono i fattori primi di 15683615?
- Calcola il tasso di crescita dei miei risparmi
- Inverti la parola “Lollipop” per me
Approfondiamo questa nuova capacità e come sta aiutando Bard a migliorare le sue risposte.
- Casi d’uso rivoluzionari dell’IA nell’industria della logistica
- Arte generata dall’AI le implicazioni etiche e i dibattiti
- 10 errori che NON dovresti MAI fare in Python.
Miglioramento delle capacità di ragionamento e logica
I grandi modelli di linguaggio (LLM) sono come motori di previsione: quando viene dato un compito, generano una risposta prevedendo quali parole sono probabili che seguano. Di conseguenza, sono stati estremamente capaci in compiti linguistici e creativi, ma più deboli in aree come il ragionamento e la matematica. Per aiutare a risolvere problemi più complessi con capacità avanzate di ragionamento e logica, affidarsi esclusivamente all’output LLM non è sufficiente.
Il nostro nuovo metodo consente a Bard di generare ed eseguire il codice per potenziare le sue capacità di ragionamento e matematica. Questo approccio trae ispirazione da una dicotomia ben studiata nell’intelligenza umana, notevolmente coperta nel libro di Daniel Kahneman “Pensare, veloce e lento” – la separazione del pensiero “Sistema 1” e “Sistema 2”.
- Il pensiero del Sistema 1 è veloce, intuitivo ed effortless. Quando un musicista jazz improvvisa sul momento o un battitore cieco pensa a una parola e la vede apparire sullo schermo, sta usando il pensiero del Sistema 1.
- Il pensiero del Sistema 2, al contrario, è lento, deliberato ed effortful. Quando esegui una divisione lunga o impari a suonare uno strumento, stai usando il Sistema 2.
In questa analogia, gli LLM possono essere considerati come operanti esclusivamente sotto il Sistema 1, producendo rapidamente testo ma senza profonda riflessione. Ciò porta a alcune incredibili capacità, ma può cadere a corto in alcuni modi sorprendenti. (Immagina di cercare di risolvere un problema matematico usando solo il Sistema 1: non puoi fermarti e fare l’aritmetica, devi solo sparare la prima risposta che ti viene in mente.) Il calcolo tradizionale si allinea strettamente con il pensiero del Sistema 2: è formulato e inflessibile, ma la giusta sequenza di passaggi può produrre risultati impressionanti, come soluzioni per la divisione lunga.
Con questo ultimo aggiornamento, abbiamo combinato le capacità di entrambi gli LLM (Sistema 1) e il codice tradizionale (Sistema 2) per migliorare l’accuratezza delle risposte di Bard. Attraverso l’esecuzione del codice implicito, Bard identifica i compiti che potrebbero beneficiare del codice logico, lo scrive “sotto il cofano”, lo esegue e utilizza il risultato per generare una risposta più accurata. Finora, abbiamo visto che questo metodo migliora l’accuratezza delle risposte di Bard a problemi di parole e matematica basati sul calcolo nei nostri dataset di sfide interni di circa il 30%.
Anche con questi miglioramenti, Bard non avrà sempre ragione – ad esempio, Bard potrebbe non generare il codice per aiutare la risposta del compito, il codice che genera potrebbe essere errato o Bard potrebbe non includere il codice eseguito nella sua risposta. Detto questo, questa migliorata capacità di rispondere con capacità strutturate e basate sulla logica è un passo importante verso la resa di Bard ancora più utile. Resta sintonizzato per ulteriori aggiornamenti.