Cerca intelligentemente i contenuti di Drupal utilizzando Amazon Kendra

Cerca con intelligenza contenuti di Drupal sfruttando Amazon Kendra

Amazon Kendra è un servizio di ricerca intelligente alimentato da machine learning (ML). Amazon Kendra ti aiuta ad aggregare facilmente contenuti da diverse repository in un indice centralizzato che ti consente di cercare rapidamente tutti i dati aziendali e trovare la risposta più accurata. Drupal è un software di gestione dei contenuti. Viene utilizzato per creare molti dei siti web e delle applicazioni che utilizziamo ogni giorno. Drupal ha un’ottima serie di funzionalità, come la creazione di contenuti semplice e diretta, prestazioni affidabili e sicurezza. Molte organizzazioni utilizzano Drupal per archiviare i propri contenuti. Uno dei requisiti principali per molti clienti che utilizzano Drupal è la capacità di trovare facilmente e in modo sicuro informazioni accurate in tutti i documenti delle fonti di dati.

Con il connettore Drupal di Amazon Kendra, puoi indicizzare i contenuti di Drupal, filtrare i tipi di contenuti personalizzati che desideri indicizzare e cercare facilmente i contenuti di Drupal utilizzando la ricerca intelligente di Amazon Kendra.

In questo post ti mostreremo come utilizzare il connettore Drupal di Amazon Kendra per configurare il connettore come fonte di dati per il tuo indice di Amazon Kendra e cercare i documenti di Drupal. In base alla configurazione del connettore Drupal, puoi sincronizzare il connettore per eseguire il crawl e indicizzare diversi tipi di contenuti di Drupal come blog e wiki. Il connettore elabora anche le informazioni sul controllo degli accessi (ACL) per ogni file. Le informazioni sull’ACL vengono utilizzate per il filtraggio del contesto utente, in cui i risultati di ricerca per una query vengono filtrati in base all’accesso autorizzato da parte dell’utente.

Prerequisiti

Per provare il connettore Amazon Kendra per Drupal utilizzando questo post come riferimento, hai bisogno dei seguenti elementi:

Configurazione della fonte di dati utilizzando il connettore Amazon Kendra per Drupal

Per aggiungere una fonte di dati al tuo indice Amazon Kendra utilizzando il connettore Drupal, puoi utilizzare un indice esistente o creare un nuovo indice. Quindi completa i seguenti passaggi. Per ulteriori informazioni su questo argomento, consulta la Guida dello sviluppatore di Amazon Kendra.

  1. Sulla console di Amazon Kendra, apri il tuo indice e scegli Fonti dati nel riquadro di navigazione.
  2. Scegli Aggiungi fonte dati.
  3. Nella sezione Drupal, scegli Aggiungi connettore.
  4. Nella sezione Specifica dettagli fonte dati, inserisci un nome e una descrizione e scegli Avanti.
  5. Nella sezione Definire l’accesso e la sicurezza, per URL host di Drupal, inserisci l’URL del sito Drupal.
  6. Per configurare i certificati SSL, puoi creare un certificato autofirmato per questa configurazione utilizzando il comando openssl x509 -in mydrupalsite.pem -out drupal.crt e archiviare il certificato in un bucket Amazon Simple Storage Service (Amazon S3). Per ulteriori dettagli sulla generazione di una chiave privata e del certificato, consulta Generazione dei certificati.
  7. Scegli Sfoglia S3 e seleziona il bucket S3 con il certificato SSL.
  8. Nella sezione Autenticazione, hai due opzioni:
    • Usa Secrets Manager per creare nuove credenziali di autenticazione Drupal. Hai bisogno di un nome utente e di una password dell’amministratore di Drupal (inoltre, di un ID client e di un segreto client per l’autenticazione OAuth 2.0).
    • Usa un segreto Secrets Manager esistente che contiene le credenziali di autenticazione di Drupal che vuoi che il connettore acceda (inoltre, di un ID client e di un segreto client per l’autenticazione OAuth 2.0).
  9. Scegli Salva e aggiungi segreto.
  10. Per Ruolo IAM, scegli Crea un nuovo ruolo o scegli un ruolo IAM esistente configurato con le politiche IAM appropriate per accedere al segreto di Secrets Manager, all’indice Amazon Kendra e alla fonte dati.

Riferirsi a Ruoli IAM per le origini dati per le autorizzazioni richieste per il ruolo IAM.

  1. Scegliere Avanti.
  2. Nella sezione Configura impostazioni sincronizzazione, selezionare Articoli, Pagine di base, Blocchi di base, Tipi di contenuto personalizzati e Blocchi personalizzati insieme alle opzioni per il crawl dei commenti e degli allegati se necessario.
  3. Facoltativamente, inserire i modelli di inclusione/esclusione per i titoli delle entità.
  4. Fornire informazioni sullo scopo della sincronizzazione (completa o solo delta) e specificare la pianificazione dell’esecuzione.
  5. Scegliere Avanti.
  6. Nella sezione Imposta associazioni campi, aggiungere i campi personalizzati di Drupal che si desidera sincronizzare e le rispettive associazioni dei campi di Amazon Kendra. I campi richiesti sono pre-mappati da Amazon Kendra.
  7. Scegliere Avanti.
  8. Rivedere le impostazioni di configurazione e salvare l’origine dati.
  9. Scegliere Sincronizza ora sull’origine dati creata per avviare la sincronizzazione dei dati con l’indice Amazon Kendra.

Il tempo necessario per eseguire il crawl e sincronizzare i contenuti in Amazon Kendra varia in base al volume del contenuto e alla velocità di trasmissione.

Ora è possibile cercare i contenuti Drupal indicizzati utilizzando la console di ricerca o un’applicazione di ricerca. Facoltativamente, è possibile effettuare una ricerca con ACL con i seguenti passaggi aggiuntivi.

  1. Andare alla pagina di indice che hai creato e nella scheda Controllo accesso utenti, scegliere Modifica impostazioni.
  2. Sotto Impostazioni controllo accesso, selezionare , mantenere i valori predefiniti per Nome utente e Gruppi, scegliere JSON per Tipo di token e mantenere l’espansione utente-gruppo come Nessuna.
  3. Nella pagina successiva, mantenere i valori predefiniti (o modificarli in base alle esigenze di capacità) e scegliere Aggiorna.

Esegui una ricerca intelligente con Amazon Kendra

Prima di provare a cercare sulla console di Amazon Kendra o utilizzare l’API, assicurati che la sincronizzazione delle fonti di dati sia completa. Per verificare, visualizza le fonti di dati e verifica se l’ultima sincronizzazione è stata completata con successo.

  1. Per avviare la tua ricerca, sulla console di Amazon Kendra, scegli Ricerca contenuti indicizzati nel riquadro di navigazione.

Verrai reindirizzato alla console di ricerca di Amazon Kendra. Ora puoi cercare informazioni dai documenti Drupal che hai indicizzato utilizzando Amazon Kendra.

  1. In questo post, cerchiamo un documento memorizzato nella fonte di dati di Drupal.
  2. Espandi Test query con un token di accesso e scegli Applica token.
  3. Per Username, inserisci l’indirizzo email associato al tuo account Drupal.
  4. Scegli Applica.

Ora l’utente può vedere solo i contenuti a cui ha accesso in base al nome utente o ai gruppi specificati. Nell’esempio, l’utente Drupal con l’email [email protected] non ha accesso a documenti su Drupal, quindi non ne vengono visualizzati.

Limitazioni

Nota le seguenti limitazioni nell’utilizzo di questa soluzione:

  • I tipi di contenuto (come articolo o pagina di base) non associati a una vista non possono essere indicizzati.
  • Se un amministratore non ha accesso a un blocco, non è possibile estrarre i dati da quel blocco.
  • Il corpo del documento per articolo, pagina di base, blocco di base, tipo di contenuto definito dall’utente e tipo di blocco definito dall’utente viene visualizzato in formato HTML. Se il contenuto HTML non è ben formato, allora le etichette correlate all’HTML appariranno nel corpo del documento e quindi saranno visibili nei risultati di ricerca di Amazon Kendra. Lo stesso vale per i commenti degli articoli, delle pagine di base, dei blocchi di base, dei tipi di contenuto definiti dall’utente e dei tipi di blocco definiti dall’utente.
  • I tipi di contenuto o i tipi di blocco senza descrizione o corpo non saranno inclusi nell’indice di Amazon Kendra perché esiste una validazione sul lato SDK di Amazon Kendra. Tuttavia, Drupal consente di creare il tipo di contenuto senza descrizione o corpo. Solo i commenti e gli allegati dei rispettivi tipi di contenuti o tipi di blocchi (se esistono) saranno inclusi nell’indice di Amazon Kendra.

Pulizia

Per evitare costi futuri, pulisci le risorse create come parte di questa soluzione. Se hai creato un nuovo indice Amazon Kendra durante il test di questa soluzione, eliminalo. Se hai solo aggiunto una nuova fonte di dati utilizzando il connettore Amazon Kendra per Drupal, elimina quella fonte di dati. Elimina eventuali utenti IAM creati.

Conclusione

Con il connettore Drupal di Amazon Kendra, la tua organizzazione può cercare contenuti memorizzati in un sito Drupal in modo sicuro utilizzando la ricerca intelligente alimentata da Amazon Kendra. In questo post, ti abbiamo presentato l’integrazione, ma ci sono molte altre funzionalità aggiuntive che non abbiamo coperto, come ad esempio:

  • Puoi mappare campi aggiuntivi agli attributi dell’indice di Amazon Kendra e abilitarli per la creazione di faccette, la ricerca e la visualizzazione nei risultati di ricerca
  • Puoi integrare la fonte di dati di Drupal con la funzionalità di arricchimento personalizzato dei documenti (CDE) in Amazon Kendra per eseguire ulteriori logiche di mappatura degli attributi e persino la trasformazione personalizzata dei contenuti durante l’ingestione

Per saperne di più sulle possibilità con Drupal, consultare la Guida dello sviluppatore di Amazon Kendra.

Per ulteriori informazioni su altri connettori integrati di Amazon Kendra per fonti dati popolari, consultare la pagina Amazon Kendra Connectors.