Что такое OCR?
OCR - это сокращение от оптического распознавания символов. Этот процесс используется для распознавания визуального представления текста, например на изображении. На основе этого OCR может создавать реальный текст который затем можно редактировать, копировать, изменять и т. д. Он очень хорошо работает с печатным и набранным текстом и лишь в очень редких случаях с рукописным текстом.
Как работает оптическое распознавание символов?
OCR может работать двумя способами: по одному символу за раз или по одному слову за раз. Первый способ используется чаще всего, так как второй требует, чтобы язык разделял слова пробелами.
Сначала OCR-системы обучали распознавать отдельные символы в определенном шрифте. Сейчас большинству шрифтов с засечками и без засечек OCR уже известен и может их распознавать. Даже неровные сканы и изображения, которые не выровнены на 100%, интерпретируются достаточно хорошо. Это возможно благодаря предобработке которую выполняют многие программы OCR. Она включает выравнивание и удаление шумов, перевод скана или изображения в градации серого и многое другое.
Сценарии использования оптического распознавания символов
Зачем вообще нужен OCR? Вот несколько распространенных вариантов использования:
- Создание заметок по конспектам лекций и слайдам презентаций, которые вы сфотографировали
- Извлечение текста из документов, отсканированных как изображения
- Оцифровка документов и возможность поиска по номеру счета и другим данным
Как использовать OCR
- Перейдите на конвертер PDF в Word PDF2Go
- Загрузите файл перетаскиванием или выберите его с жесткого диска, из Dropbox или Google Drive.
- Для распознавания текста выберите "Преобразовать с OCR". Настройте параметры OCR в соответствии с вашими потребностями.
- В дополнительных настройках выберите Microsoft Word (.docx) или Word 2003 и более ранние версии (.doc) в раскрывающемся списке.
- Нажмите "СТАРТ".