Tesseract è un motore per il riconoscimento ottico dei caratteri, compatibile con diversi sistemi operativi. Rilasciato sotto Licenza Apache, è un software libero.
Originariamente sviluppato da Hewlett-Packard negli anni 80, venne rilasciato come open source nel 2005 e poi sponsorizzato da Google dal 2006.
In questo articolo, andiamo a vedere come installare Tesseract nel nostro Raspberry Pi, o più in generale in Linux, e come testarlo attraverso la riga di comando prima e con un semplice script poi.
Sono diversi i linguaggi che supportano tesseract, in questo articolo ci focalizziamo sull’utilizzo di Python.
Installazione su Raspberry Pi
L’installazione in Linux è molto semplice. Apri una shell e digita il seguente comando:
Una volta installato nel tuo sistema, passiamo ad installare il wrapper Python (compatibile con Python 2.7 e 3.6+) chiamato pytesseract:
Un altra possibilità per installare pytesseract è quella di specificare la versione dell’interprete Python che si vuole usare. Per esempio, se vuoi installare pytesseract nella tua installazione di Python3, puoi usare:
python3 -m pip install pytesseract
Se hai bisogno di ulteriori informazioni a riguardo di come installare i pacchetti Python, fai riferimento a come installare i pacchetti Python su Windows con PIP.
Command Line Test
Prima di tuffarsi nello script Python, controlliamo come tesseract funziona nella sua versione da riga di comando.
Per far ciò, consideriamo la seguente immagine di esempio:
Il nostro obiettivo è quello di tradurre in chiaro, le parole presenti. Salva l’immagine in locale, chiamiamola picture.png.
Una volta salvata, apri una shell nella stessa cartella in cui hai salvato precedentemente l’immagine e digita il seguente comando:
Il comando è semplice, dopo il nome del tool, dobbiamo inserire il nome dell’immagine (se si trova in una cartella diversa, dobbiamo specificare il path per poterla raggiungere) seguito da un file in cui tesseract può salvare ciò che legge. In questo caso ho usato stdout, così che il risultato viene stampato direttamente nella shell.
Se tutto è ok, dovresti vedere il testo correttamente stampato a schermo.
Tesseract viene fornito con diverse opzioni che possono essere usate per migliorare le performance in lettura. Controlla la documentazione per maggiori informazioni.
Python Test
Bene, adesso è tempo di testare tesseract in Python.
Apri la stessa cartella in cui hai salvato l’immagine picture.png, e crea un nuovo file di testo.
Se vuoi farlo usando la shell, digita:
al suo interno, scriviamo le seguente righe di codice:
Come puoi vedere, abbiamo fatto uso anche di un altra liberia chiamata PIL (Pillow) che è ampiamente usata quando si ha a che fare con immagini.
Se non l’avessi ancora installata, digita il seguente comando nella tua shell:
Dopo averla caricata, passiamo l’immagine al comando di pytesseract che restituirà il testo come risultato.
Conclusioni
In questo articolo abbiamo visto come installare tesseract su Raspberry Pi, o più in generale sul tuo sistema Linux, e come usarlo.
Per maggiori dettagli su come usare proficuamente tesseract, fai riferimento alla documentazione ufficiale.
Tieni di conto anche che, per raggiungere le migliori performance, devi processare l’immagine in modo che, ad esempio, il testo risulti nero con sfondo bianco (e non viceversa), la dimensioni del carattere deve essere fissata (intorno ai 12pt) e eventuali rumori devono essere ridotti il più possibile.
Scrivi un commento