Di cosa è composto DALL·E 3? (Il MIGLIORE modello di testo-immagine di OpenAI)
La composizione della rete neurale di DALL·E 3 Il miglior modello di testo-immagine di OpenAI
Migliorare la generazione di immagini con migliori didascalie
Originariamente pubblicato su louisbouchard.ai, leggilo 2 giorni prima sul mio blog!
Guarda il video:
L’anno scorso siamo rimasti sbalorditi da DALL·E 2, il primo modello di generazione di immagini da testo di OpenAI che ha impressionato molto. Ma oggi preparatevi a entrare in un mondo in cui l’arte e la tecnologia si fondono come mai prima d’ora con la sua terza versione!
Scopriamo DALL·E 3 con un nuovo articolo rilasciato da OpenAI e scopriamo gli sviluppi che lo pongono molto avanti rispetto a DALL·E 2!
Addestrato su didascalie di immagini generate altamente descrittive, DALL·E 3 non si limita a seguire gli input, ma dà loro vita. I risultati sono incredibili, e non solo capisce gli input, ma comprende anche la storia che si nasconde dietro ad essi. Il progresso rispetto al 2020 è semplicemente incredibile.
- 7 Piattaforme per Ottenere Lavori di Data Science Ben Remunerati
- Come proteggere la tua identità digitale nell’era delle immagini potenziate dall’intelligenza artificiale
- Se sei un appassionato di lingue, devi conoscere le capacità multilingue di ChatGPT
Al cuore dell’abilità di DALL·E 3 c’è un robusto software di didascalie per immagini. Tutto ruota attorno alle didascalie delle immagini, quindi il testo viene inserito durante l’addestramento insieme all’immagine che dovrebbe essere in grado di generare. Questo nuovo software di didascalie per immagini è il principale fattore che rende DALLE 3 molto migliore di DALLE 2. Modelli precedenti venivano addestrati inizialmente in modo auto-supervisionato con coppie di immagini e testo prese da internet. Immagina una foto su Instagram e la sua didascalia o hashtag. Non sempre sono informative o addirittura correlate. Gli autori dell’articolo descrivono principalmente il soggetto principale nella foto, non l’intera storia dietro di essa o l’ambiente e il testo che appare nell’immagine insieme al soggetto principale. Inoltre, non specificano dove si trova tutto nell’immagine, informazione utile per garantire la ricreazione accurata di un’immagine simile. Ancora peggio, molte didascalie sono solo battute o pensieri non correlati o poesie condivise insieme alle immagini. A questo punto, addestrarsi con tali…