什么是 OCR?
OCR 是 Optical Character Recognition(光学字符识别)的缩写。此过程用于 识别文本的可视化表现形式,例如图像中的文字。基于此,OCR 可以 生成可编辑的实际文本 ,之后即可编辑、复制和修改等。它对键入和打印的文本效果很好,对手写文字则仅在极少数情况下有效。
光学字符识别是如何工作的?
OCR 可以通过两种方式工作: 逐个字符识别 或逐个单词识别。前者更为常用,因为后者要求语言使用空格来分隔单词。
在最初,OCR 处理器被 训练为识别特定字体中的单个字符 。现在,大多数无衬线和衬线字体都已被 OCR 所识别并能正确处理。即使是倾斜或不完全对齐的扫描件和图像,OCR 也能有不错的识别效果。这要归功于许多 OCR 程序执行的 预处理 ,包括去倾斜和去噪点、将扫描件或图像转为灰度等。
光学字符识别的使用场景
为什么你需要或希望使用 OCR?以下是几个常见场景:
- 根据拍摄的讲义和演示文稿幻灯片创建笔记
- 从以图像形式扫描的文档中提取文字
- 将纸质文件数字化,并按发票号等内容进行搜索
如何使用 OCR
- 前往 PDF转Word转换器 PDF2Go 的
- 通过拖放上传文件,或从本地硬盘、Dropbox 或 Google Drive 上传。
- 在文本识别中选择 "Convert with OCR"。根据需要配置 OCR 设置。
- 在可选设置中,从下拉菜单中选择 Microsoft Word (.docx) 或 Word 2003 或更早版本 (.doc)。
- 点击 "START"。