Was ist OCR?
OCR ist die Abkürzung für Optische Zeichenerkennung. Dieser Prozess wird verwendet, um die visuelle Darstellung von Text zu erkennen, zum Beispiel in einem Bild. Auf dieser Basis kann OCR echten Text erzeugen der dann bearbeitet, kopiert, verändert usw. werden kann. Es funktioniert sehr gut mit getipptem und gedrucktem Text und nur in sehr seltenen Fällen mit handschriftlichem Text.
Wie funktioniert optische Zeichenerkennung?
OCR kann auf zwei Arten arbeiten: ein Zeichen nach dem anderen oder ein Wort nach dem anderen. Erstere ist die am häufigsten verwendete Methode, da letztere voraussetzt, dass die Sprache Wörter durch ein Leerzeichen trennt.
Anfangs wurden OCR-Prozessoren darauf trainiert, einzelne Zeichen zu erkennen in einer bestimmten Schriftart. Inzwischen sind den meisten OCR-Programmen die gängigen Sans-Serif- und Serif-Schriften bekannt und können erkannt werden. Selbst schiefe Scans und Bilder, die nicht zu 100 % gerade sind, werden recht gut interpretiert. Das ist dank des Pre-Processings möglich, das viele OCR-Programme durchführen. Es umfasst das Begradigen und Säubern, das Umwandeln des Scans oder Bildes in Graustufen und mehr.
Anwendungsfälle der optischen Zeichenerkennung
Warum sollten Sie OCR überhaupt benötigen oder verwenden wollen? Hier sind einige häufige Anwendungsfälle:
- Erstellen Sie Notizen anhand von Vorlesungs- und Präsentationsfolien, die Sie fotografiert haben
- Text aus Dokumenten auslesen, die als Bilder eingescannt wurden
- Ihre Unterlagen digitalisieren und nach Rechnungsnummern oder Ähnlichem durchsuchbar machen
So verwenden Sie OCR
- Gehen Sie zum PDF-zu-Word-Konverter des PDF2Go
- Laden Sie Ihre Datei per Drag & Drop hoch oder von Ihrer Festplatte, Dropbox oder Google Drive.
- Wählen Sie für die Texterkennung "Mit OCR konvertieren". Passen Sie die OCR-Einstellungen an Ihre Anforderungen an.
- Wählen Sie in den optionalen Einstellungen Microsoft Word (.docx) oder Word 2003 oder älter (.doc) aus dem Dropdown-Menü.
- Klicken Sie auf "START".