OCR - Riconoscimento ottico dei caratteri

Che cos'è l'OCR?

OCR è l'acronimo di Riconoscimento ottico dei caratteri. Questo processo viene utilizzato per riconoscere la rappresentazione visiva del testo, ad esempio in un'immagine. Sulla base di ciò, OCR può creare vero testo che può poi essere modificato, copiato, cambiato, ecc. Funziona molto bene con testo digitato e stampato e solo in casi molto rari con testo manoscritto.

Come funziona il riconoscimento ottico dei caratteri?

OCR può funzionare in due modi: un carattere alla volta oppure una parola alla volta. Il primo è quello più comunemente utilizzato, poiché il secondo richiede che la lingua separi le parole utilizzando uno spazio.

All'inizio, i processori OCR venivano addestrati a riconoscere singoli caratteri in un tipo di carattere specifico. Oggi, la maggior parte dei font con e senza grazie è conosciuta e può essere riconosciuta da OCR. Anche scansioni storte e immagini non perfettamente dritte vengono interpretate abbastanza bene. Questo grazie alla pre-elaborazione che molti programmi OCR effettuano. Include correzione dell'inclinazione e rimozione dei difetti, conversione della scansione o immagine in scala di grigi e altro ancora.

Casi d'uso del riconoscimento ottico dei caratteri

Perché mai dovresti avere bisogno o voler usare OCR? Ecco alcuni casi d'uso comuni:

  • Crea appunti basati su diapositive di lezioni e presentazioni che hai fotografato
  • Estrai testo da documenti che sono stati acquisiti come immagini
  • Digitalizza la tua documentazione cartacea e rendila ricercabile per numeri di fattura o simili

Come usare OCR

  1. Vai a un convertitore da PDF a Word di PDF2Go
  2. Carica il tuo file tramite drag & drop oppure caricalo dal tuo hard disk, da Dropbox o Google Drive.
  3. Per il riconoscimento del testo scegli "Converti con OCR". Configura le impostazioni OCR in base alle tue esigenze.
  4. Nelle impostazioni opzionali scegli Microsoft Word (.docx) o Word 2003 o precedente (.doc) dal menu a tendina.
  5. Fai clic su "START".