Top 5 librerie Python per estrarre testo dalle immagini

Top 5 librerie Python per estrarre testo dalle immagini' can be condensed to 'Le migliori 5 librerie Python per estrarre testo dalle immagini'.

Capire e padroneggiare gli strumenti OCR per la localizzazione e il riconoscimento del testo

Foto di Anna Sullivan su Unsplash

L’Optical Character Recognition è un problema vecchio, ma ancora sfidante che coinvolge la rilevazione e il riconoscimento del testo da dati non strutturati, inclusi immagini e documenti in formato PDF. Ha applicazioni interessanti nel settore bancario, nell’e-commerce e nella moderazione dei contenuti sui social media.

Ma come per ogni argomento nel campo della scienza dei dati, ci sono un’enorme quantità di risorse quando si cerca di imparare come risolvere il compito OCR. Ecco perché sto scrivendo questo tutorial, che può aiutarti ad iniziare.

In questo articolo, mostrerò alcune librerie Python che ti consentono di estrarre rapidamente il testo dalle immagini senza troppi problemi. L’illustrazione delle librerie è seguita da un esempio pratico. Il dataset utilizzato è preso da Kaggle. Per semplificare i concetti, sto utilizzando solo un’immagine del film Rush.

Cominciamo!

Immagine dal dataset textOCR. Fonte.

Indice:

  1. pytesseract
  2. EasyOCR
  3. Keras-OCR
  4. TrOCR
  5. docTR

1. pytesseract

È una delle librerie Python più popolari per il riconoscimento ottico dei caratteri. Utilizza il motore Tesseract-OCR di Google per estrarre il testo dalle immagini. Sono supportate molteplici lingue. Verifica qui se la tua lingua è supportata. Hai solo bisogno di poche righe di codice per convertire l’immagine in testo:

# installazione!sudo apt install tesseract-ocr!pip install pytesseractimport pytesseractfrom pytesseract import Outputfrom PIL import Imageimport cv2img_path1 = '00b5b88720f35a22.jpg'text = pytesseract.image_to_string(img_path1, lang='ita')print(text)

Questo è l’output: