如何在线将 PDF 转换为 PDF/A

5 个简单步骤,让你的 PDF 适用于长期归档环境

你有一个 PDF 文档,需要将其转换为 PDF/A,但不确定如何操作以及应该选择哪个版本?如果是这样,我们很乐意为你提供指南,帮助你将PDF 转换为 PDF/A 文件

在本文中,你将了解不同的PDF/A 版本符合性级别以及如何将文档转换为首选的 PDF/A 格式

应选择哪个 PDF/A 版本和符合性级别

在将文件转换为 PDF/A 之前,转换工具会要求你选择一个PDF/A 标准(PDF/A-1、PDF/A-2、PDF/A-3)和一个符合性级别(a、b 和 u)。它们乍一看很相似,但你所选择的选项会影响整个转换过程,使其可以非常简单完成,或需要进行一些必要修改。

了解 PDF/A 版本和符合性级别,有助于根据你的需求提升文档的价值。

当你将一个普通 PDF 文件转换为原始的PDF/A-1 标准时,通常需要进行最多的更改。例如,由于无法使用较新的图像压缩技术,文件体积可能会增大。

PDF/A-1 规定了两个符合性级别:

  • PDF/A-1b - B 级(基础)符合性。 强制要求:必须嵌入字体、包含颜色管理指导和元数据。 PDF/A-1b 多用于归档扫描文档或现有 PDF 文件生成的文档。
  • PDF/A-1a - A 级(可访问)符合性。

A 级的额外要求:

  • 语言规范,
  • 分层的文档结构,
  • 带标签的文本片段以及对图像和符号的描述性文本,
  • 到 Unicode 的字符映射。

PDF/A-1a 文件更易于导航,文档内容更便于重复使用,对视力受损用户来说也更易阅读。文本在可重现性方面通常更好。与基础级别不同,可访问级别允许用户在文档中搜索关键词。

PDF/A-2 相比之下所需调整更少,因为它允许 JPEG2000 压缩、透明元素和 PDF 图层。因此,你的文件体积会更小。 PDF/A-2 有 3 种类型:PDF/A-2a、PDF/A-2u 和 PDF/A-2b。

如前所述,标准的第 2 部分提供了一些附加功能:

  • JPEG 2000 图像压缩
  • 支持透明效果和图层
  • 嵌入 OpenType 字体
  • 根据 PDF 高级电子签名标准提供数字签名支持
  • 可嵌入 PDF/A 文件,以便用单个文件归档一组文档

PDF/A-2a 和 PDF/A-2b 分别对应 PDF/A-1 中的 a 级和 b 级符合性。而 PDF/A-2u 表示在 B 级符合性(PDF/A-2b)的基础上,额外要求文档中的所有文本都具有 Unicode 映射。

PDF/A-3 与 PDF/A-2 基本相同,但它还允许嵌入非 PDF/A 文件。如果你计划使用或处理大量带有非 PDF/A 附件的文件,PDF/A-3 会是一个不错的选择。 该格式可以视为“一站式”方案,因为 PDF/A 本身可以确保扫描文档在长期内可读,MRC 压缩可大幅减小文件大小,OCR 使其可被搜索,而附件功能则满足你的文档交换需求。请选择最符合你归档需求的格式。

符合性级别要点概览:

  • B 级(基础)符合性是最容易实现的级别。它只要求文档符合可靠查看的相关规范。从长期来看,文档在查看或打印时的显示效果会保持一致。
  • A 级(可访问)符合性在满足 B 级所有要求的基础上,增加了提升文档可访问性的功能。它确保文本可以可靠搜索和复制,使内容对屏幕阅读器等辅助技术的视力受损用户更加友好。
  • U 级(Unicode)符合性是在 PDF/A-2 中引入的。它保证文档文本可以映射到标准 Unicode 字符编码。

如何将 PDF 转换为 PDF/A?

PDF 转 PDF/A 转换工具可以高效地将你的 PDF 文档转换为标准化的 ISO 版本。你无需在电脑上下载和安装新程序。我们的 PDF/A 转换器让你可以在线便捷地将 PDF 转换为 PDF/A。 按照以下步骤操作:

编辑 PDF
  1. 点击“Choose File”选择要上传的 PDF 文件。你也可以拖放 PDF 文件。还可以从互联网(输入 URL)或云存储服务(Google Drive、Dropbox)上传文件。
  2. 选择你希望转换到的 PDF/A 格式:PDF/A-1b、PDF/A-2b 或 PDF/A-3b。
  3. 可选设置:启用 严格模式(Enable strict mode) 以访问所有符合性级别(a、b 和 u)。
  4. 点击Start开始转换过程。
  5. 下载新的 PDF/A 文件。

值得注意: 虽然更高的符合性级别(a 或 u)确实可以提升文档价值,但也可能更耗时。通过选择 B 级符合性(例如 PDF/A-2b),你的文档即可符合可靠查看的规范,而无需额外要求,从而为你节省宝贵时间。

PDF/A 可以搜索吗?

是的,可以!PDF/A 允许进行文本识别处理,这也是 PDF/A 的主要优势之一。数字生成内容的文本会保存在文档中,包括通过光学字符识别(OCR)提取的文本,这意味着即使是扫描得到的 PDF/A 文档也可以被搜索。

“符合 PDF/A 标准”是什么意思?

PDF/A compliant(符合 PDF/A 标准)仅表示你的文件满足 PDF/A 格式的要求。 部分 PDF/A 符合性要求包括:

  • 所有内容已嵌入(字体、颜色、文本、图像等)
  • 禁止音频和视频内容。
  • 文件未加密。
  • 文件不包含对外部内容的引用。
  • 文件遵循基于标准的元数据规范。
  • 交互式 PDF 表单字段必须具有外观字典。
  • 文件不包含 JavaScript。

验证如何处理?有必要吗?

由于并不总是容易判断现有 PDF 文件是否真正符合 ISO 的 PDF/A 标准,建议进行一次验证检查,以审查文档的所有相关部分。

如何验证 PDF/A 文件?

可以使用 PDF/A 验证工具来确认某个文件是否真正为 PDF/A 文件。这些是在线工具,用于检查是否满足了标准的所有要素。 使用我们的在线转换器创建的 PDF/A 文件符合 ISO 标准,并通过了Vera PDF 验证。Vera PDF 是一个开源的文件格式验证工具,覆盖所有 PDF/A 部分和符合性级别。