OCR - 光学字符识别

什么是 OCR?

OCR 是 Optical Character Recognition(光学字符识别)的缩写。此过程用于 识别文本的可视化表现形式,例如图像中的文字。基于此,OCR 可以 生成可编辑的实际文本 ,之后即可编辑、复制和修改等。它对键入和打印的文本效果很好,对手写文字则仅在极少数情况下有效。

光学字符识别是如何工作的?

OCR 可以通过两种方式工作: 逐个字符识别 或逐个单词识别。前者更为常用,因为后者要求语言使用空格来分隔单词。

在最初,OCR 处理器被 训练为识别特定字体中的单个字符 。现在,大多数无衬线和衬线字体都已被 OCR 所识别并能正确处理。即使是倾斜或不完全对齐的扫描件和图像,OCR 也能有不错的识别效果。这要归功于许多 OCR 程序执行的 预处理 ,包括去倾斜和去噪点、将扫描件或图像转为灰度等。

光学字符识别的使用场景

为什么你需要或希望使用 OCR?以下是几个常见场景:

  • 根据拍摄的讲义和演示文稿幻灯片创建笔记
  • 从以图像形式扫描的文档中提取文字
  • 将纸质文件数字化,并按发票号等内容进行搜索

如何使用 OCR

  1. 前往 PDF转Word转换器 PDF2Go 的
  2. 通过拖放上传文件,或从本地硬盘、Dropbox 或 Google Drive 上传。
  3. 在文本识别中选择 "Convert with OCR"。根据需要配置 OCR 设置。
  4. 在可选设置中,从下拉菜单中选择 Microsoft Word (.docx) 或 Word 2003 或更早版本 (.doc)。
  5. 点击 "START"。