L’aspetto non raccontato di RAG Affrontare le sue sfide nelle ricerche specifiche del dominio

L'aspetto inaspettato di RAG Affrontare le sfide nella ricerca di dominio specifico

Utilizzando la ricerca ibrida, la classificazione gerarchica e l’incorporazione dell’insegnante per affrontare documenti specifici del dominio che presentano somiglianze per la nostra configurazione RAG.

Tecnologia di ricerca generativa potenziata da AI (immagine generata con MidJourney)

Carsales si posiziona come una piattaforma automobilistica leader, che serve i mercati delle auto e dei veicoli commerciali in Australia, Cile, Corea del Sud e Stati Uniti. La nostra ambizione è ridefinire l’esperienza di acquisto e vendita delle auto, stabilendo standard senza precedenti. A tal fine, una delle nostre caratteristiche fondamentali è un completo strumento di ricerca che analizza decine di migliaia di articoli editoriali legati all’automobile. Attualmente abbiamo integrato la ricerca di Google – progettata appositamente per il nostro contenuto editoriale e presentata attraverso un iframe – i risultati, seppur decenti, si basano principalmente su associazioni lessicali (parole chiave), a volte mancando la vera essenza o semantica dietro una query di ricerca.

Risultati di ricerca utilizzando la ricerca di Google esistente

Ad esempio, una ricerca su “Quanti airbag ha la Toyota Corolla 2020?” fornirebbe risultati per qualsiasi articolo con le parole “Toyota Corolla” e “airbag”, ecc. Tuttavia, questi articoli trattano principalmente richiami di airbag piuttosto che il numero effettivo di airbag. C’è una forte richiesta dal lato aziendale di migliorare non solo tecnologicamente questo strumento, ma anche ridisegnarne l’interfaccia per renderlo più integrato nel nostro sito web, superando così il semplice risultato di una ricerca di Google in un iframe.

Nel luglio 2023, abbiamo realizzato uno dei nostri hackathon globali semestrali. Questo evento vede di solito la partecipazione di vari dipartimenti, in cui vengono formati team, idee presentate e, entro un breve periodo di 3 giorni, vengono trasformati in prototipi funzionanti. Data la crescente importanza dei Modelli di Grandi Dimensioni Linguistiche (LLM), abbiamo identificato un progetto ideale per questo hackathon: rinnovare il nostro strumento di ricerca utilizzando un LLM. Inoltre, abbiamo vinto l’hackathon! Merito al nostro fantastico team che ha lavorato duramente su questo progetto!

In questo articolo, inizieremo descrivendo il concetto fondamentale del nostro progetto. Successivamente, parleremo del nostro approccio preliminare RAG. In seguito, evidenzieremo le sfide…