Presentazione di PaLM 2

PaLM 2 introduction.

Quando si ripensa alle più grandi innovazioni nell’ambito dell’AI degli ultimi dieci anni, Google è stata all’avanguardia per molte di esse. Il nostro lavoro innovativo nei modelli di base è diventato il fondamento per l’industria e i prodotti alimentati da AI che miliardi di persone utilizzano quotidianamente. Continuando a far avanzare queste tecnologie in modo responsabile, c’è un grande potenziale per utilizzi trasformativi in aree estremamente ampie come la sanità e la creatività umana.

Nell’ultimo decennio di sviluppo dell’AI, abbiamo imparato che tanto è possibile quanto più si sviluppano reti neurali – infatti, abbiamo già visto emergere sorprendenti e piacevoli capacità da modelli di grandi dimensioni. Ma abbiamo imparato attraverso la nostra ricerca che non è così semplice come “più grande è meglio” e che la creatività della ricerca è la chiave per costruire grandi modelli. I progressi più recenti su come progettiamo e addestriamo i modelli ci hanno insegnato come sbloccare la multimodalità, l’importanza del feedback umano nel loop e come costruire modelli in modo più efficiente che mai. Questi sono potenti blocchi di costruzione mentre continuiamo a far avanzare lo stato dell’arte nell’AI costruendo modelli che possono portare un vero beneficio alle persone nella loro vita quotidiana.

Introduzione di PaLM 2

Sulla base di questo lavoro, oggi presentiamo PaLM 2, il nostro modello di lingua di nuova generazione. PaLM 2 è un modello di lingua all’avanguardia con migliorate capacità multilingue, di ragionamento e di codifica.

  • Multilinguismo: PaLM 2 è più pesantemente addestrato su testo multilingue, che spazia su oltre 100 lingue. Ciò ha significativamente migliorato la sua capacità di comprendere, generare e tradurre testo sfumato – inclusi modi di dire, poesie e indovinelli – in una vasta gamma di lingue, un problema difficile da risolvere. PaLM 2 supera anche gli esami avanzati di competenza linguistica al livello di “padronanza”.
  • Ragionamento: Il dataset ampio e variegato di PaLM 2 include documenti scientifici e pagine web che contengono espressioni matematiche. Di conseguenza, dimostra capacità migliorate in logica, ragionamento del buon senso e matematica.
  • Codifica: PaLM 2 è stato pre-addestrato su una grande quantità di dataset di codice sorgente pubblicamente disponibili. Ciò significa che eccelle nei linguaggi di programmazione popolari come Python e JavaScript, ma può anche generare codice specializzato in lingue come Prolog, Fortran e Verilog.

Una famiglia versatile di modelli

Anche se PaLM 2 è più capace, è anche più veloce e efficiente dei modelli precedenti – ed è disponibile in diverse dimensioni, il che lo rende facile da implementare per una vasta gamma di casi d’uso. Metteremo a disposizione PaLM 2 in quattro dimensioni, dalla più piccola alla più grande: Gecko, Otter, Bison e Unicorn. Gecko è così leggero che può funzionare su dispositivi mobili ed è abbastanza veloce per ottime applicazioni interattive su dispositivo, anche quando offline. Questa versatilità significa che PaLM 2 può essere sintonizzato per supportare intere classi di prodotti in modi più ampi, per aiutare più persone.

Alimentare oltre 25 prodotti e funzionalità di Google

Oggi, a I/O, abbiamo annunciato oltre 25 nuovi prodotti e funzionalità alimentati da PaLM 2. Ciò significa che PaLM 2 sta portando le ultime capacità avanzate di AI direttamente nei nostri prodotti e alle persone – inclusi consumatori, sviluppatori e aziende di tutte le dimensioni in tutto il mondo. Ecco alcuni esempi:

  • Le migliori capacità multilingue di PaLM 2 ci stanno consentendo di espandere Bard in nuove lingue, a partire da oggi. Inoltre, sta alimentando il nostro recente aggiornamento di codifica annunciato.
  • Workspace offre funzionalità per aiutarti a scrivere in Gmail e Google Docs e ad aiutarti a organizzarti in Google Sheets, tutte sfruttando le capacità di PaLM 2 con una velocità che aiuta le persone a svolgere il lavoro meglio e più velocemente.
  • Med-PaLM 2, addestrato dai nostri team di ricerca sanitaria con conoscenze mediche, può rispondere a domande e riassumere informazioni da una varietà di testi medici densi. Raggiunge risultati di competenza medica all’avanguardia ed è stato il primo grande modello di lingua a esibirsi a livello di “esperto” su domande di tipo U.S. Medical Licensing Exam. Stiamo ora aggiungendo capacità multimodali per sintetizzare informazioni come radiografie e mammografie per migliorare un giorno gli esiti dei pazienti. Med-PaLM 2 aprirà a un piccolo gruppo di clienti Cloud per feedback più avanti quest’estate per identificare casi d’uso sicuri ed utili.

Formato video non supportato

  • Sec-PaLM è una versione specializzata di PaLM 2 addestrata su casi d’uso di sicurezza e un potenziale salto per l’analisi della sicurezza informatica. Disponibile tramite Google Cloud, utilizza l’AI per aiutare ad analizzare e spiegare il comportamento di script potenzialmente maligni e per individuare meglio quali script rappresentano effettivamente minacce per le persone e le organizzazioni in tempi senza precedenti.
  • Dal mese di marzo, abbiamo fornito un’anteprima dell’API di PaLM a un piccolo gruppo di sviluppatori. A partire da oggi, gli sviluppatori possono registrarsi per utilizzare il modello PaLM 2 o i clienti possono utilizzare il modello in Vertex AI con privacy, sicurezza e governance di livello enterprise. PaLM 2 alimenta anche Duet AI per Google Cloud, un collaboratore generativo di AI progettato per aiutare gli utenti a imparare, costruire e operare più velocemente che mai.

Avanzare nel futuro dell’AI

PaLM 2 ci mostra l’impatto di modelli altamente capaci di varie dimensioni e velocità – e che i modelli di IA versatili raccolgono veri benefici per tutti. Tuttavia, così come siamo impegnati a rilasciare gli strumenti di intelligenza artificiale più utili e responsabili oggi, stiamo anche lavorando per creare i migliori modelli di base di Google.

I nostri team di ricerca Brain e DeepMind hanno raggiunto molti momenti fondamentali nell’IA nell’ultimo decennio, e stiamo unendo questi due team di classe mondiale in un’unica unità, per continuare ad accelerare il nostro progresso. Google DeepMind, supportato dalle risorse computazionali di Google, non solo porterà nuove incredibili capacità ai prodotti che usi ogni giorno, ma aprirà la strada in modo responsabile per la prossima generazione di modelli di IA.

Siamo già al lavoro su Gemini – il nostro prossimo modello creato dall’inizio per essere multimodale, altamente efficiente nelle integrazioni di strumenti e API e costruito per consentire future innovazioni, come la memoria e la pianificazione. Gemini è ancora in formazione, ma sta già mostrando capacità multimodali mai viste prima nei modelli precedenti. Una volta messo a punto e rigorosamente testato per la sicurezza, Gemini sarà disponibile in varie dimensioni e capacità, proprio come PaLM 2, per garantire che possa essere implementato su diversi prodotti, applicazioni e dispositivi a beneficio di tutti.