I ricercatori di intelligenza artificiale (AI) di KAIST presentano KTRL+F un compito di ricerca incrementata della conoscenza all’interno di un documento che richiede l’identificazione in tempo reale di obiettivi semantici all’interno di un documento.

I ricercatori di intelligenza artificiale (AI) di KAIST presentano KTRL+F un avanzato strumento per la ricerca incrementata della conoscenza all'interno di un documento, con identificazione in tempo reale degli obiettivi semantici.

L’attività KTRL+F è un problema di ricerca in-documenti potenziato dalla conoscenza che richiede l’identificazione in tempo reale dei bersagli semantici all’interno di un documento, incorporando la conoscenza esterna attraverso una singola query naturale. I modelli esistenti affrontano sfide come allucinazioni, bassa latenza e difficoltà nell’utilizzare conoscenze superficiali. Per affrontare ciò, i ricercatori del KAIST AI e Samsung Research propongono un modello di Recupero Frase Potenziato dalla Conoscenza, che trova un equilibrio tra velocità e prestazioni.

A differenza delle tradizionali attività di Comprensione della Lettura Automatica, KTRL+F valuta i modelli in base alla loro capacità di utilizzare informazioni al di là del contesto fornito. Il modello proposto bilancia efficacemente velocità e prestazioni incorporando la conoscenza esterna nell’embedding della frase. Il modello potenzia la conoscenza contestuale, consentendo una ricerca e un recupero accurati e completi all’interno del documento per un accesso alle informazioni migliorato.

KTRL+F affronta le limitazioni degli strumenti tradizionali di corrispondenza lessicale e della comprensione della lettura automatica. Si concentra sull’identificazione in tempo reale dei bersagli semantici all’interno di un documento, sfruttando la conoscenza esterna attraverso una singola query naturale. Le metriche di valutazione valutano la capacità del modello di individuare tutti i marcatori semantici, utilizzare comandi esterni e operare in tempo reale. KTRL+F mira a migliorare l’efficienza nell’accesso alle informazioni attraverso una capacità di ricerca all’interno del documento migliore.

KTRL+F affronta le sfide nell’identificazione in tempo reale dei bersagli semantici. Il modello bilancia velocità e prestazioni potenziando la conoscenza esterna nell’embedding della frase. Vengono analizzati vari modelli di riferimento, inclusi modelli generativi, estrattivi e basati sul recupero, utilizzando metriche come List EM, List Overlap F1 e Robustness Score. Viene valutata l’incorporazione della conoscenza esterna e uno studio degli utenti convalida l’esperienza di ricerca migliorata ottenuta risolvendo KTRL+F.

I modelli generativi sfruttano in modo efficace i modelli di linguaggio pre-allenati, ma l’aumento della capacità migliora solo a volte le prestazioni. Il SequenceTagger, un modello estrattivo, deve recuperare terreno a causa della sua incapacità di utilizzare la conoscenza esterna. Il modello proposto bilancia velocità e prestazioni potenziando la conoscenza superficiale nell’embedding della frase. Uno studio degli utenti conferma che gli utenti possono ridurre il tempo di ricerca e le query con il modello, convalidandone l’efficacia nel migliorare l’esperienza di ricerca.

In conclusione, KTRL+F introduce un’attività di ricerca in-documenti potenziata dalla conoscenza e propone un modello di Recupero Frase Potenziato dalla Conoscenza. Il modello bilancia efficacemente velocità e prestazioni potenziando la conoscenza esterna nell’embedding della frase. La scalabilità e la praticità di KTRL+F suggeriscono opportunità per futuri sviluppi nel recupero delle informazioni e nell’aumentazione della conoscenza.

Le future direzioni di ricerca includono l’esplorazione di un’architettura addestrabile end-to-end per l’elaborazione in tempo reale che recupera e integra la conoscenza esterna in un indice consultabile. Si suggerisce di estendere KTRL+F per incorporare conoscenze tempestive, come le notizie, e di indagare sull’importanza della conoscenza superficiale di alta qualità confrontando i modelli con diversi linkers di entità. Si raccomanda inoltre una valutazione ulteriore del design di aggregazione della conoscenza nel modello proposto e ulteriori esperimenti per comprendere i modelli di riferimento e le loro limitazioni in KTRL+F.