우리는 종종 PDF가 무엇인지 안다고 생각하지만, 실제로는 자세히 설명되는 경우가 많지 않습니다. 이 글은 기술적인 내용을 과하게 다루지 않으면서도 PDF에 대해 명확하고 간단하게 이해할 수 있도록 돕는 것을 목표로 합니다. PDF의 내부 구조와 여전히 널리 사용되는 이유 등 기본 개념을 다룰 예정입니다. 그럼 시작해 볼까요?
PDF 기초
정의
PDF 은(는) 다음의 약자입니다: Portable Document Format. 전자 문서 형식으로, 종이 문서처럼 보이고 동작하도록 설계되었습니다. "Portable"이라는 말은 어디에서 어떻게 보더라도 PDF가 동일하게 보여야 한다는 의미입니다.
역사
PDF는 1991년 Adobe에서 만들었으며, 누구나 PDF를 생성, 편집, 열람하는 도구를 개발할 수 있도록 오픈 표준이 되었습니다. 2008년에는 ISO 표준, 으로 제정되어 더욱 널리 사용되게 되었습니다.
특징
PDF의 핵심 특징 중 하나는 자체 완결적이라는 점입니다. 문서를 표시하는 데 필요한 모든 것이 파일 안에 포함되어 있습니다. 이 덕분에 PDF는 전송 및 보관이 쉽고 아카이브. 하기에도 적합합니다. 또한 PDF 뷰어인 Adobe Reader는 무료이기 때문에 널리 사용되고 있습니다. PDF 구조를 이해하면 Acrobat 같은 도구를 활용해 문서 작업을 더 효율적으로 할 수 있습니다.
PDF는 어떻게 작동할까?
간단한 PDF
기본적으로 PDF는 여러 개의 개별 페이지. 를 담고 있는 바인더나 폴더와 비슷합니다. PDF에 페이지를 추가하거나, 분할하거나, 다른 PDF로 옮길 수 있으며, 실제 종이 바인더의 페이지를 다루는 것과 거의 비슷합니다.
또한 PDF에는 전체 문서에 적용되는 데이터 세트가 포함되는데, 이를 문서 레벨 데이터. 라고 합니다. 여기에는 문서 보안 정보, 메타데이터, 전체 문서에 적용되는 기타 속성들이 포함됩니다.
잠금장치가 있고 안쪽이나 바깥쪽 표지에 정보가 적혀 있는 실제 종이 바인더를 떠올려 보세요. 이 종이 바인더의 비유는 이러한 속성이 전자 PDF 문서에서 어떻게 작동하는지 이해하는 데 도움이 됩니다.
PDF에 더 많은 것들
물론 PDF에는 이보다 더 많은 요소가 있습니다. 문서 레벨을 조금 더 자세히 살펴보겠습니다.
PDF에는 다음이 포함됩니다:
- 북마크: 북마크는 목차처럼 문서 내를 이동할 수 있는 탐색 수단입니다.
- 보안 데이터: 문서에 대한 액세스를 제어합니다.
- 파일 첨부: PDF에 실제 파일을 첨부한 것으로, PDF가 마치 ZIP 파일처럼 동작하게 합니다.
- 문서 스크립트: 문서 레벨의 스크립트는 PDF를 열거나 인쇄하는 등의 문서 레벨 이벤트에 의해 실행됩니다.
- 양식 필드와 데이터: 페이지 위에 있는 양식 필드와의 사용자 상호작용에도 불구하고, 이 필드들은 문서 레벨에서 관리됩니다. 필드는 전체 문서에서 공통으로 사용되며, 위젯 은(는) 특정 페이지에 배치된 해당 필드의 표시 방식과 사용자 인터페이스입니다.
- 문서 메타데이터: 작성자, 제목, 키워드 등의 정보가 포함됩니다.
- 다양한 리소스: 폰트, 색 공간, 이미지, 비디오 등 문서의 다른 부분에서 사용하는 요소들이 포함됩니다.
PDF 페이지는 사용자가 보고 상호작용하는 부분입니다. 이 페이지는 내용을 그려 주는 렌더링 엔진을 통해 표시됩니다. 렌더링 엔진은 폰트, 색 공간 정의, 이미지와 같은 리소스를 필요로 하며, 이러한 리소스는 PDF 안에 포함되어 있어 PDF의 이식성을 높여 줍니다. 다만 폰트는 예외로, 반드시 PDF에 포함될 필요는 없습니다.
폰트를 임베드하면 해당 폰트가 PDF 안에 포함됩니다. 임베드되지 않은 경우 Acrobat은 사용자의 시스템에서 폰트를 찾거나, 임베드가 필요 없는 기본 폰트를 사용합니다. 따라서 PDF가 항상 완전히 자체 완결적인 것은 아닙니다.
요소 유형
페이지에는 두 가지 유형의 요소가 있습니다: 정적 페이지 콘텐츠 및 주석 목록. 정적 페이지 콘텐츠에는 모든 일반 텍스트, 그래픽, 이미지(문서의 기본 내용)가 포함됩니다.
주석 은(는) 양식 필드 위젯, 댓글 및 마크업 도구, 멀티미디어 도구 등 사용자가 상호작용할 수 있는 특별한 요소입니다. 정적 콘텐츠와 달리 주석은 항상 보일 필요는 없습니다. 예를 들어 링크는 페이지에서 공간을 차지하지만, 눈에 보이는 모양이 없을 수도 있는 주석입니다.
원과 같은 주석을 그리면 빨간색 원형 선 모양으로 표시됩니다. PDF 구조 내부에서는 페이지 콘텐츠와 주석이 모두 동일한 벡터 그래픽 언어. 렌더링 엔진은 먼저 페이지 콘텐츠를 그리고, 그 다음 지정된 순서에 따라 주석을 그립니다. 이러한 레이어 방식으로 인해 주석이 페이지 콘텐츠 위에 떠 있는 것처럼 보입니다.
주석은 PDF에 동적인 및 대화형 기능 을(를) 제공합니다. 주석은 키 입력이나 마우스 클릭과 같은 사용자 동작에 반응하는 페이지의 유일한 요소입니다. 예를 들어 원 주석은 선택, 이동, 크기 조절이 가능합니다.
주석 유형에 따라 상호작용 방식이 달라집니다. 메모 주석은 사용자가 텍스트를 입력하도록 하고, 이동은 가능하지만 크기 조절은 불가능합니다. 각 주석 유형은 사용자 입력에 고유하게 반응하여, 기본 페이지 콘텐츠 위에 표시되면서 PDF의 대화형 기능을 향상시킵니다.
PDF 편집
PDF의 페이지 콘텐츠는 정적으로 유지되도록 설계되었습니다. Adobe Reader에서 볼 때, Reader에는 수정 도구가 없기 때문에 페이지 콘텐츠는 변경할 수 없습니다. 하지만 Adobe Acrobat에서는 내용을 직접 편집할 수 있습니다. 가장 좋은 편집 방법은 문서를 만든 원본 애플리케이션에서 수정하는 것입니다.
변경을 완료한 후 문서를 다시 PDF로 저장하세요. 이 방법은 문서의 무결성을 유지하고 서식 및 내용 정확성과 관련된 잠재적 문제를 방지합니다.
팁: 빠른 편집이 필요하다면, PDF2Go의 PDF To Word Converter. 를 사용해 PDF를 편집 가능한 Word 문서로 변환하여 보다 쉽게 자세한 수정을 할 수 있습니다. 편집을 마친 뒤에는 문서를 다시 PDF 형식으로 저장할 수 있습니다.
그래픽 연산자
그래픽 연산자 는 PDF 콘텐츠를 정확하게 렌더링하는 데 필수적인 요소입니다. 이 연산자들은 그래픽 언어의 핵심을 이루며, 텍스트와 같은 정적 콘텐츠이든 주석과 같은 동적 요소이든 PDF 페이지에 표시되는 모든 내용을 결정합니다.
벡터 그래픽은 그려지는 내용을 정확히 기술한 것으로, 이러한 연산자를 사용해 구성됩니다. 이들은 선이 시작되고 끝나는 위치, 색상, 두께 및 기타 시각적 속성과 같은 중요한 세부 정보를 지정합니다. 이와 같은 상세한 명령 집합 덕분에 PDF의 모든 그래픽 요소는 다양한 뷰어와 인쇄 과정에서 정확하게 재현됩니다.
PDF 구조
PDF의 내부 구조는 트리 형태로 상상할 수 있습니다. 최상위에는 문서 수준 속성(메타데이터, 스크립트, 페이지, 보안 정보, AcroForm)이 있고, 그 아래에는 여러 페이지가 있으며 각 페이지에는 정적 콘텐츠, 와 이를 렌더링하기 위해 사용되는 리소스 집합, 그리고 주석.
목록이 포함됩니다. 주석은 PDF 내부의 리소스를 사용한다는 점에 유의해야 합니다. 주석에 시각적 모양이 있다면, 기본 페이지 콘텐츠에 사용되는 것과 동일한 벡터 그래픽 언어를 사용합니다. 즉, 정확한 렌더링과 표시를 위해 기본 콘텐츠와 동일한 리소스가 필요합니다.
AcroForm
하나의 AcroForm 은(는) PDF 전체에 걸친 모든 양식 필드와 해당 데이터를 위한 마스터 목록과 같습니다. 각 페이지에서 보이는 필드 위젯은 이 기본 목록 항목의 사본입니다. 흥미롭게도 이러한 양식 필드 위젯은 PDF 구조에서 댓글 및 마크업 주석과 함께 나열됩니다.
페이지에 표시되는 모든 내용을 렌더링하는 엔진 입장에서는, 주석이 양식 필드이든 마크업이든 모두 표시해야 할 요소로 동일하게 취급됩니다. 이러한 주석 유형 간의 실제 차이는 시각적 표현 방식이 아니라 상호작용을 처리하는 방식에 있습니다.
마무리
PDF의 구조와 기능을 이해하면 양식 작성, 문서 보안, 안정적인 정보 공유 등에서 PDF의 잠재력을 온전히 활용할 수 있습니다. 신뢰할 수 있는 PDF 도구를, PDF 도구를 사용해, 이 널리 쓰이는 형식의 강력한 기능을 자유롭게 탐색하고 활용해 보세요!