Migliorare l’elaborazione intelligente dei documenti di AWS con l’IA generativa

Migliorare l'elaborazione dei documenti di AWS con l'IA generativa

La classificazione, l’estrazione e l’analisi dei dati possono essere sfide per le organizzazioni che gestiscono grandi volumi di documenti. Le soluzioni tradizionali di elaborazione dei documenti sono manuali, costose, suscettibili di errori e difficili da scalare. L’elaborazione intelligente dei documenti (IDP) di AWS, con servizi di intelligenza artificiale come Amazon Textract, consente di sfruttare la tecnologia di machine learning (ML) all’avanguardia per elaborare rapidamente e accuratamente i dati da qualsiasi documento o immagine scansionata. L’intelligenza artificiale generativa (generative AI) si integra con Amazon Textract per automatizzare ulteriormente i flussi di lavoro di elaborazione dei documenti. Funzionalità come la normalizzazione dei campi chiave e la sintesi dei dati di input supportano cicli più rapidi per la gestione dei flussi di lavoro di elaborazione dei documenti, riducendo nel contempo il potenziale per gli errori.

La generative AI è guidata da ampi modelli di ML chiamati modelli di base (FMs). I FMs stanno trasformando il modo in cui è possibile affrontare i carichi di lavoro di elaborazione documentale tradizionalmente complessi. Oltre alle capacità esistenti, le aziende hanno bisogno di sintetizzare categorie specifiche di informazioni, incluse le informazioni di debito e credito da documenti come relazioni finanziarie e estratti conto bancari. I FMs facilitano la generazione di tali informazioni dai dati estratti. Per ottimizzare il tempo dedicato alla revisione umana e migliorare la produttività dei dipendenti, gli errori come i numeri di telefono con cifre mancanti, i documenti mancanti o gli indirizzi senza numeri civici possono essere segnalati in modo automatico. Nel contesto attuale, è necessario dedicare risorse per svolgere tali attività tramite revisione umana e script complessi. Questo approccio è noioso e costoso. I FMs possono aiutare a completare queste attività più velocemente, con meno risorse e trasformando formati di input variabili in un modello standard che può essere ulteriormente elaborato. Presso AWS, offriamo servizi come Amazon Bedrock, il modo più semplice per creare e scalare applicazioni generative AI con FMs. Amazon Bedrock è un servizio completamente gestito che mette a disposizione FMs di aziende leader nel settore dell’intelligenza artificiale e di Amazon tramite un’API, in modo da poter trovare il modello che meglio si adatta alle proprie esigenze. Offriamo anche Amazon SageMaker JumpStart, che consente ai professionisti del ML di scegliere tra una vasta selezione di FMs open source. I professionisti del ML possono distribuire i FMs su istanze dedicate di Amazon SageMaker da un ambiente isolato di rete e personalizzare i modelli utilizzando SageMaker per l’addestramento e la distribuzione del modello.

Ricoh offre soluzioni per il luogo di lavoro e servizi di trasformazione digitale progettati per aiutare i clienti a gestire e ottimizzare il flusso di informazioni all’interno delle loro aziende. Ashok Shenoy, VP dello sviluppo delle soluzioni di portfolio, afferma: “Stiamo aggiungendo l’intelligenza artificiale generativa alle nostre soluzioni IDP per aiutare i nostri clienti a completare il loro lavoro in modo più rapido e accurato, sfruttando nuove funzionalità come Q&A, sintesi e output standardizzati. AWS ci consente di sfruttare l’intelligenza artificiale generativa mantenendo i dati di ciascun cliente separati e sicuri”.

In questo post, condivideremo come migliorare la soluzione IDP su AWS con l’intelligenza artificiale generativa.

Migliorare il pipeline IDP

In questa sezione, esamineremo come il tradizionale pipeline IDP può essere arricchito dai FMs e presenteremo un caso d’uso di esempio utilizzando Amazon Textract con i FMs.

L’IDP di AWS è composto da tre fasi: classificazione, estrazione e arricchimento. Per ulteriori dettagli su ciascuna fase, fare riferimento all’elaborazione intelligente dei documenti con i servizi di intelligenza artificiale AWS: Parte 1 e Parte 2. Nella fase di classificazione, i FMs possono ora classificare i documenti senza ulteriori addestramenti. Ciò significa che i documenti possono essere categorizzati anche se il modello non ha mai visto esempi simili in precedenza. Nella fase di estrazione, i FMs normalizzano i campi di data e verificano gli indirizzi e i numeri di telefono, garantendo al contempo una formattazione coerente. Nella fase di arricchimento, i FMs consentono l’inferenza, il ragionamento logico e la sintesi. Utilizzando i FMs in ciascuna fase dell’IDP, il flusso di lavoro sarà più efficace e le prestazioni miglioreranno. Il diagramma seguente illustra il pipeline IDP con l’intelligenza artificiale generativa.

Fase di estrazione del pipeline IDP

Quando i FMs non possono elaborare direttamente documenti nei loro formati nativi (come PDF, immagine, jpeg e tiff) come input, è necessario un meccanismo per convertire i documenti in testo. Per estrarre il testo dal documento prima di inviarlo ai FMs, è possibile utilizzare Amazon Textract. Con Amazon Textract, è possibile estrarre righe e parole e passarle ai FMs successivi. L’architettura seguente utilizza Amazon Textract per l’estrazione accurata del testo da qualsiasi tipo di documento prima di inviarlo ai FMs per ulteriori elaborazioni.

Tipiamente, i documenti sono composti da informazioni strutturate e semi-strutturate. Amazon Textract può essere utilizzato per estrarre testo grezzo e dati da tabelle e moduli. La relazione tra i dati nelle tabelle e nei moduli svolge un ruolo vitale nell’automazione dei processi aziendali. Certi tipi di informazioni potrebbero non essere processati da FMs. Di conseguenza, possiamo scegliere se archiviare queste informazioni in un archivio downstream o inviarle a FMs. La figura seguente è un esempio di come Amazon Textract può estrarre informazioni strutturate e semi-strutturate da un documento, oltre a righe di testo che devono essere processate da FMs.

Utilizzare i servizi serverless AWS per riassumere con FMs

Il pipeline IDP illustrato in precedenza può essere automatizzato senza problemi utilizzando i servizi serverless AWS. I documenti altamente non strutturati sono comuni nelle grandi aziende. Questi documenti possono spaziare dai documenti della Securities and Exchange Commission (SEC) nell’industria bancaria ai documenti di copertura nell’industria delle assicurazioni sanitarie. Con l’evoluzione dell’AI generativa su AWS, le persone in questi settori stanno cercando modi per ottenere un riassunto da quei documenti in modo automatizzato ed economico. I servizi serverless aiutano a fornire il meccanismo per creare rapidamente una soluzione per l’IDP. Servizi come AWS Lambda, AWS Step Functions e Amazon EventBridge possono aiutare a costruire il pipeline di elaborazione dei documenti con l’integrazione dei FMs, come mostrato nel diagramma seguente.

L’applicazione di esempio utilizzata nell’architettura precedente è guidata dagli eventi. Un evento è definito come un cambiamento di stato che è avvenuto di recente. Ad esempio, quando un oggetto viene caricato in un bucket di Amazon Simple Storage Service (Amazon S3), Amazon S3 emette un evento di creazione oggetto. Questa notifica di evento da Amazon S3 può attivare una funzione Lambda o un flusso di lavoro di Step Functions. Questo tipo di architettura è definita come architettura basata sugli eventi. In questo post, la nostra applicazione di esempio utilizza un’architettura basata sugli eventi per elaborare un documento di dimissioni mediche di esempio e riassumere i dettagli del documento. Il flusso funziona come segue:

  1. Quando un documento viene caricato in un bucket S3, Amazon S3 attiva un evento di creazione oggetto.
  2. Il bus degli eventi predefinito di EventBridge propaga l’evento a Step Functions in base a una regola di EventBridge.
  3. Il flusso di lavoro della macchina a stati elabora il documento, iniziando da Amazon Textract.
  4. Una funzione Lambda trasforma i dati analizzati per il passaggio successivo.
  5. La macchina a stati invoca un endpoint SageMaker, che ospita il FM utilizzando l’integrazione diretta con AWS SDK.
  6. Un bucket di destinazione S3 di riepilogo riceve la risposta di riepilogo raccolta dal FM.

Abbiamo utilizzato l’applicazione di esempio con un modello Hugging face flan-t5 per riassumere il seguente riepilogo di dimissioni del paziente utilizzando il flusso di lavoro di Step Functions.

Il flusso di lavoro di Step Functions utilizza l’integrazione AWS SDK per chiamare le API AnalyzeDocument di Amazon Textract e InvokeEndpoint del runtime di SageMaker, come mostrato nella figura seguente.

Questo flusso di lavoro produce un oggetto JSON di riepilogo che viene memorizzato in un bucket di destinazione. L’oggetto JSON ha il seguente aspetto:

{
  "summary": [
    "John Doe è un uomo di 35 anni che ha avuto problemi di stomaco per due mesi. Ha preso degli antibiotici per le ultime due settimane, ma non è riuscito a mangiare molto. Ha avuto molti dolori addominali, gonfiore e affaticamento. Ha anche notato un cambiamento nel colore delle feci, che ora sono più scure. Ha preso degli antiacidi per le ultime due settimane, ma non gli aiutano più. Ha avuto molto affaticamento ed è stato impossibilitato a lavorare per le ultime due settimane. Ha anche avuto molti dolori addominali, gonfiore e affaticamento. Ha preso degli antiacidi per le ultime due settimane, ma non gli aiutano più. Ha avuto molto affaticamento ed è stato impossibilitato a lavorare per le ultime due settimane. Ha anche avuto molti dolori addominali, gonfiore e affaticamento. Ha preso degli antiacidi per le ultime due settimane, ma non gli aiutano più. Ha avuto molto affaticamento ed è stato impossibilitato a lavorare per le ultime due settimane. Ha anche avuto molti dolori addominali, gonfiore e affaticamento. Ha preso degli antiacidi per le ultime due settimane, ma non gli aiutano più."
  ],
  "forms": [
    {
      "key": "Ph: ",
      "value": "(888)-(999)-(0000) "
    },
    {
      "key": "Fax: ",
      "value": "(888)-(999)-(1111) "
    },
    {
      "key": "Nome del paziente: ",
      "value": "John Doe "
    },
    {
      "key": "ID paziente: ",
      "value": "NARH-36640 "
    },
    {
      "key": "Genere: ",
      "value": "Maschio "
    },
    {
      "key": "Medico curante: ",
      "value": "Mateo Jackson, PhD "
    },
    {
      "key": "Data di ammissione: ",
      "value": "07-set-2020 "
    },
    {
      "key": "Data di dimissione: ",
      "value": "08-set-2020 "
    },
    {
      "key": "Destinazione della dimissione: ",
      "value": "Casa con servizi di supporto "
    },
    {
      "key": "Condizioni preesistenti / sviluppate che influiscono sul soggiorno in ospedale: ",
      "value": "Uomo di 35 anni che lamenta problemi di stomaco da 2 mesi. Il paziente riferisce dolore addominale epigastrico non radiante. Il dolore viene descritto come bruciore e bruciore, intermittente della durata di 1-2 ore e che è peggiorato progressivamente. Gli antiacidi erano utilizzati per alleviare il dolore ma non più; nulla aggrava il dolore. Dolore non correlato al giorno o ai pasti. Il paziente nega stitichezza o diarrea. Il paziente nega sangue nelle feci ma ha notato che sono più scure. Il paziente riferisce anche nausea. Negazione di malattia o febbre recenti. Riferisce anche affaticamento da 2 settimane e gonfiore dopo aver mangiato. ROS: Negativo tranne per le scoperte sopra elencate Meds: Motrin una volta a settimana. Tums in passato. PMHx: Dolore alla schiena e spasmi muscolari. Nessuna storia di interventi chirurgici. NKDA. FHx: Zio ha un'ulcera sanguinante. Hx sociale: Fuma dal 15 anni, 1/2-1 PPD. Nessun uso recente di EtOH. Negazione di uso di droghe illecite. Lavora in costruzione ad alta elevazione. Dieta di cibo spazzatura. Esercizi 3-4 volte a settimana ma ha smesso 2 settimane fa. "
    },
    {
      "key": "Riepilogo: ",
      "value": "alcune restrizioni di attività suggerite, ciclo completo di antibiotici, fare un controllo con il medico in caso di ricaduta, dieta rigorosa "
    }
  ]
 }

Generare questi riassunti utilizzando l’IDP con l’implementazione serverless su larga scala aiuta le organizzazioni a ottenere dati significativi, concisi e presentabili in modo conveniente. Step Functions non limita il metodo di elaborazione dei documenti a un documento alla volta. La sua funzione di mappa distribuita può riassumere grandi quantità di documenti in base a un programma.

L’applicazione di esempio utilizza un modello flan-t5 di Hugging face; tuttavia, è possibile utilizzare un endpoint FM a scelta. La formazione e l’esecuzione del modello escono dallo scopo dell’applicazione di esempio. Seguire le istruzioni nel repository GitHub per distribuire un’applicazione di esempio. L’architettura precedente è una guida su come orchestrare un flusso di lavoro IDP utilizzando Step Functions. Fare riferimento al laboratorio IDP Generative AI per istruzioni dettagliate su come creare un’applicazione con i servizi IA di AWS e FM.

Configura la soluzione

Seguire i passaggi nel file README per configurare l’architettura della soluzione (ad eccezione degli endpoint di SageMaker). Una volta che si dispone di un endpoint SageMaker disponibile, è possibile passare il nome dell’endpoint come parametro al modello.

Pulizia

Per risparmiare costi, eliminare le risorse distribuite nel tutorial:

  1. Seguire i passaggi nella sezione di pulizia del file README.
  2. Eliminare tutti i contenuti dal bucket S3 e quindi eliminare il bucket tramite la console di Amazon S3.
  3. Eliminare eventuali endpoint SageMaker creati tramite la console di SageMaker.

Conclusione

L’IA generativa sta cambiando il modo in cui è possibile elaborare documenti con l’IDP per ottenere informazioni. I servizi IA di AWS come Amazon Textract insieme ai FM di AWS possono aiutare a elaborare con precisione qualsiasi tipo di documento. Per ulteriori informazioni su come lavorare con l’IA generativa su AWS, fare riferimento all’annuncio dei nuovi strumenti per la creazione con l’IA generativa su AWS.