আমরা প্রায়ই ধরে নিই যে আমরা PDF কী তা জানি, কিন্তু খুব কমই এটি বিস্তারিতভাবে বোঝানো হয়। এই প্রবন্ধের লক্ষ্য হলো খুব বেশি টেকনিক্যাল না হয়ে PDF সম্পর্কে পরিষ্কার ও সরল ধারণা দেওয়া। আমরা মূল বিষয়গুলো কভার করব, যেমন PDF-এর ভেতরের গঠন এবং কেন এটি এখনো এত জনপ্রিয় একটি ফরম্যাট। তাহলে শুরু করা যাক।
PDF এর মৌলিক ধারণা
সংজ্ঞা
PDF এর পূর্ণরূপ Portable Document Format. এটি একটি ইলেকট্রনিক ডকুমেন্ট ফরম্যাট, যা দেখতে ও ব্যবহার করতে কাগজের নথির মতোই ডিজাইন করা হয়েছে। "Portable" শব্দটি বোঝায় যে PDF যেখানেই বা যেভাবেই দেখা হোক না কেন, একই রকম দেখাবে।
ইতিহাস
PDF ১৯৯১ সালে Adobe তৈরি করে এবং এটি একটি ওপেন স্ট্যান্ডার্ড হয়ে ওঠে, যাতে যে কেউ PDF তৈরি, সম্পাদনা ও দেখার টুল তৈরি করতে পারে। ২০০৮ সালে এটি একটি ISO স্ট্যান্ডার্ড, হিসেবে মানক করা হয়, যা এর ব্যাপক ব্যবহারে আরও সহায়তা করেছে।
বৈশিষ্ট্য
PDF-এর একটি গুরুত্বপূর্ণ বৈশিষ্ট্য হলো এটি স্বনির্ভর; ডকুমেন্ট দেখানোর জন্য যা যা দরকার সবকিছুই ফাইলের ভেতর থাকে। এতে PDF ফাইল আদান-প্রদান, সংরক্ষণ ও আর্কাইভ. করা সহজ হয়। এছাড়া PDF ভিউয়ার Adobe Reader ফ্রি হওয়ায় এর ব্যাপক ব্যবহার গড়ে উঠেছে। PDF-এর গঠন বুঝলে Acrobat-এর মতো টুল আরও দক্ষভাবে আপনার ডকুমেন্ট প্রজেক্টে ব্যবহার করতে সুবিধা হবে।
PDF কীভাবে কাজ করে?
সহজ PDF
মূলত একটি PDF হলো আলাদা আলাদা পৃষ্ঠা. ধরে রাখা একটি বাইন্ডার বা ফোল্ডারের মতো। আপনি একটি PDF-এ পৃষ্ঠা যোগ করতে, ভাগ করতে এবং এক PDF থেকে আরেক PDF-এ পৃষ্ঠা সরাতে পারেন, ঠিক যেন কাগজের পৃষ্ঠা নিয়ে বাইন্ডারে কাজ করছেন।
PDF-এ আরও এমন কিছু ডেটা থাকে যা পুরো ডকুমেন্টের জন্য প্রযোজ্য, যাকে বলা হয় ডকুমেন্ট লেভেল ডেটা. এতে ডকুমেন্টের সিকিউরিটি সংক্রান্ত তথ্য, মেটাডেটা, এবং পুরো ডকুমেন্টের জন্য প্রযোজ্য অন্যান্য প্রপার্টি থাকে।
একটি তালাবদ্ধ কাগজের ফাইলের মতো কল্পনা করুন, যার ভেতরের বা বাইরের কভারে কিছু তথ্য লেখা আছে। এই কাগজের ফাইলের উদাহরণটি বোঝায় কীভাবে এগুলো ইলেকট্রনিক PDF ডকুমেন্টে প্রপার্টি হিসেবে কাজ করে।
PDF সম্পর্কে আরও
অবশ্যই, PDF নিয়ে জানার মতো এর চেয়েও অনেক কিছু আছে। চলুন ডকুমেন্ট লেভেল অংশটি একটু কাছ থেকে দেখি।
একটি PDF-এ থাকে:
- বুকমার্ক: বুকমার্ক একটি নেভিগেশন ব্যবস্থার মতো কাজ করে, অনেকটা সূচিপত্রের মতো।
- সিকিউরিটি ডেটা: এটি ডকুমেন্টে কারা প্রবেশ করতে পারবে তা নিয়ন্ত্রণ করে।
- ফাইল অ্যাটাচমেন্ট: এগুলো আসল ফাইল, যেগুলো PDF-এর সাথে সংযুক্ত থাকে, ফলে PDF কিছুটা zip ফাইলের মতো কাজ করতে পারে।
- ডকুমেন্ট স্ক্রিপ্ট: ডকুমেন্ট লেভেলের স্ক্রিপ্ট বিভিন্ন ইভেন্টে চালু হয়, যেমন PDF খোলা বা প্রিন্ট করার সময়।
- ফর্ম ফিল্ড ও ডেটা: পৃষ্ঠা上的 ফর্ম ফিল্ডের সাথে ব্যবহারকারী ইন্টারঅ্যাক্ট করলেও এগুলো ডকুমেন্ট লেভেলে রাখা হয়। ফিল্ডগুলো পুরো ডকুমেন্টের জন্য গ্লোবাল, আর উইজেট হলো নির্দিষ্ট পৃষ্ঠায় সেই ফিল্ডগুলোর স্থানীয় দেখন-ধরন ও ব্যবহারকারীমুখী ইন্টারফেস।
- ডকুমেন্ট মেটাডেটা: এতে লেখক, শিরোনাম এবং কীওয়ার্ডের মতো তথ্য থাকে।
- বিভিন্ন রিসোর্স: এগুলোর মধ্যে ফন্ট, কালার স্পেস, ছবি, ভিডিও ইত্যাদি থাকে, যা ডকুমেন্টের অন্যান্য অংশে ব্যবহৃত হয়।
PDF-এর পৃষ্ঠাগুলোই হলো সেই অংশ, যা ব্যবহারকারী দেখে ও ব্যবহার করে। এই পৃষ্ঠাগুলো একটি রেন্ডারিং ইঞ্জিনের মাধ্যমে দেখানো হয়, যা পৃষ্ঠার কনটেন্ট আঁকে। রেন্ডারিং ইঞ্জিনের জন্য ফন্ট, কালার স্পেস ডেফিনিশন ও ছবি ইত্যাদি রিসোর্স প্রয়োজন হয়। এই রিসোর্সগুলো PDF-এর ভেতরেই থাকে, যা এর পোর্টেবিলিটি বাড়ায়। তবে ফন্ট একটি ব্যতিক্রম। ফন্ট সবসময় PDF-এ এম্বেড থাকা বাধ্যতামূলক নয়।
কোনো ফন্ট এম্বেড করা থাকলে সেটি PDF-এর মধ্যে থাকে। এম্বেড না থাকলে Acrobat ব্যবহারকারীর সিস্টেমে ওই ফন্ট খুঁজে দেখে বা এম্বেড ছাড়াই ব্যবহার করা যায় এমন কোনো ডিফল্ট ফন্ট ব্যবহার করে। তাই কিছু ক্ষেত্রে PDF পুরোপুরি স্বনির্ভর থাকে না।
এলিমেন্টের ধরন
একটি পৃষ্ঠায় দু ধরনের এলিমেন্ট থাকে: স্ট্যাটিক পেজ কনটেন্ট এবং অ্যানোটেশনের তালিকা. স্ট্যাটিক পেজ কনটেন্টের মধ্যে থাকে সব সাধারণ টেক্সট, গ্রাফিক্স এবং ইমেজ (মূল ডকুমেন্ট কনটেন্ট)।
অ্যানোটেশন হল বিশেষ উপাদান, যার সঙ্গে ব্যবহারকারী ইন্টারঅ্যাক্ট করতে পারেন, যেমন ফর্ম ফিল্ড উইজেট, মন্তব্য ও মার্কআপ টুল, এবং মাল্টিমিডিয়া টুল। স্ট্যাটিক কনটেন্টের বিপরীতে, অ্যানোটেশন সব সময় দৃশ্যমান হতে হয় না। উদাহরণস্বরূপ, একটি লিংক হল এমন একটি অ্যানোটেশন যা পেজে জায়গা দখল করে, কিন্তু এর কোনো দৃশ্যমান উপস্থিতি নাও থাকতে পারে।
যখন একটি অ্যানোটেশন, যেমন একটি বৃত্ত, আঁকা হয়, এটি লাল বৃত্তাকার লাইনের রূপে দেখা যায়। PDF-এর স্ট্রাকচারের ভেতরে, পেজ কনটেন্ট ও অ্যানোটেশন দুটোই একই ভেক্টর গ্রাফিক্স ভাষা. রেন্ডারিং ইঞ্জিন আগে পেজ কনটেন্ট আঁকে, তারপর নির্দিষ্ট ক্রমানুসারে অ্যানোটেশনগুলো আঁকে। এই স্তরবিন্যাস পদ্ধতিতে অ্যানোটেশনগুলোকে এমন দেখা যায় যেন তারা পেজ কনটেন্টের উপর ভাসছে।
অ্যানোটেশন PDF-এ ডায়নামিক এবং ইন্টারঅ্যাক্টিভ ফিচার প্রদান করে। এগুলোই পেজের একমাত্র উপাদান যা কী-বোর্ড ইনপুট ও মাউস ক্লিকের মতো ব্যবহারকারীর ক্রিয়ার প্রতি সাড়া দেয়। যেমন, একটি বৃত্ত অ্যানোটেশন নির্বাচন, সরানো এবং রিসাইজ করা যায়।
বিভিন্ন ধরনের অ্যানোটেশন ভিন্ন ভিন্ন ইন্টারঅ্যাকশন প্রদান করে। উদাহরণস্বরূপ, একটি নোট অ্যানোটেশন ব্যবহারকারীকে টেক্সট লিখতে বলে এবং সেটি সরানো যায়, কিন্তু রিসাইজ করা যায় না। প্রতিটি অ্যানোটেশন টাইপ ব্যবহারকারীর ইনপুটে আলাদা ভাবে সাড়া দেয়, ফলে মূল পেজ কনটেন্টের উপর প্রদর্শিত হয়েও PDF-এর ইন্টারঅ্যাক্টিভ সক্ষমতা বাড়ায়।
PDF সম্পাদনা
PDF-এ পেজ কনটেন্টকে সাধারণত স্ট্যাটিক ধরা হয়। Adobe Reader-এ দেখলে পেজ কনটেন্ট অপরিবর্তনীয় থাকে, কারণ এতে পরিবর্তনের জন্য প্রয়োজনীয় টুল নেই। তবে Adobe Acrobat-এ আপনি সরাসরি কনটেন্ট সম্পাদনা করতে পারেন। তবু সবচেয়ে ভাল হয় আসল যে অ্যাপ্লিকেশন দিয়ে ডকুমেন্টটি তৈরি করা হয়েছিল, সেখানেই এডিট করা।
পরিবর্তন শেষ হলে, ডকুমেন্টটি আবার PDF হিসেবে সেভ করুন। এই পদ্ধতি ডকুমেন্টের অখণ্ডতা বজায় রাখে এবং ফরম্যাটিং ও কনটেন্টের নির্ভুলতার সম্ভাব্য সমস্যাগুলোর ঝুঁকি কমায়।
পরামর্শ: দ্রুত এডিটের প্রয়োজন হলে, PDF2Go তার PDF To Word Converter. দিয়ে একটি সুবিধাজনক অনলাইন সমাধান প্রদান করে। এই টুলের সাহায্যে আপনি আপনার PDF-কে এডিটযোগ্য Word ডকুমেন্টে রূপান্তর করতে পারেন, ফলে বড় পরিবর্তন করাও সহজ হয়। এডিট শেষ হলে আপনি সহজেই ডকুমেন্টটি আবার PDF ফরম্যাটে সেভ করতে পারবেন.
গ্রাফিক অপারেটর
গ্রাফিক অপারেটর হল PDF কনটেন্ট সঠিকভাবে রেন্ডার করার মৌলিক উপাদান। এই অপারেটরগুলো, যা গ্রাফিক্স ভাষার মূল অংশ, ঠিক করে দেয় PDF পেজে কী কী দেখা যাবে, তা স্ট্যাটিক কনটেন্ট (যেমন টেক্সট) হোক বা ডায়নামিক উপাদান (যেমন অ্যানোটেশন)।
একটি ভেক্টর গ্রাফিক, অর্থাৎ ঠিক কী আঁকা হবে তার সুনির্দিষ্ট বর্ণনা, এই অপারেটর ব্যবহার করে গঠিত হয়। এগুলো নির্ধারণ করে কোন লাইন কোথা থেকে শুরু হবে এবং কোথায় শেষ হবে, এর রং, পুরুত্ব এবং অন্যান্য ভিজ্যুয়াল বৈশিষ্ট্য কী হবে। এই বিস্তারিত ইনস্ট্রাকশন সেট নিশ্চিত করে যে PDF-এর প্রতিটি গ্রাফিক উপাদান বিভিন্ন ভিউয়িং প্ল্যাটফর্ম এবং প্রিন্টিং প্রক্রিয়ায় সঠিকভাবে পুনরুত্পাদিত হয়।
PDF স্ট্রাকচার
একটি PDF-এর অভ্যন্তরীণ স্ট্রাকচারকে একটি গাছের মতো কল্পনা করা যায়। উপরে থাকে ডকুমেন্ট লেভেলের বৈশিষ্ট্য (মেটাডাটা, স্ক্রিপ্ট, পেজ, সিকিউরিটি ইনফো, AcroForm), তারপর থাকে এক সেট পেজ, যার প্রত্যেকটিতে থাকে স্ট্যাটিক কনটেন্ট, এক সেট রিসোর্স যা সেই কনটেন্ট রেন্ডার করতে ব্যবহৃত হয়, এবং থাকে অ্যানোটেশনের.
একটি তালিকা। মনে রাখুন, অ্যানোটেশনগুলো PDF-এর ভেতরের রিসোর্স ব্যবহার করে। কোনো অ্যানোটেশনের দৃশ্যমান উপস্থিতি থাকলে, এটি মূল পেজ কনটেন্টের জন্য ব্যবহৃত একই ভেক্টর গ্রাফিক ভাষা ব্যবহার করে। অন্যভাবে বললে, সঠিকভাবে রেন্ডার ও প্রদর্শনের জন্য এটি প্রাইমারি কনটেন্টের মতোই একই রিসোর্স প্রয়োজন করে।
AcroForm
একটি AcroForm হল সমগ্র PDF ডকুমেন্ট জুড়ে সব ফর্ম ফিল্ড এবং তাদের ডেটার একটি মূল তালিকার মতো। প্রতিটি পেজে আপনি যে ফিল্ড উইজেট দেখেন, তা মূল তালিকার একটি এন্ট্রির কপি। লক্ষণীয়, এই ফর্ম ফিল্ড উইজেটগুলোকে PDF স্ট্রাকচারে মন্তব্য ও মার্কআপ অ্যানোটেশনের পাশাপাশি তালিকাভুক্ত করা হয়।
পেজে সবকিছু প্রদর্শনকারী রেন্ডারিং ইঞ্জিনের দৃষ্টিতে, সব অ্যানোটেশনই, তা ফর্ম ফিল্ড হোক বা মার্কআপ, সমানভাবে প্রদর্শনযোগ্য উপাদান হিসেবে বিবেচিত হয়। এই অ্যানোটেশন টাইপগুলোর প্রকৃত পার্থক্য হলো কীভাবে তারা ইন্টারঅ্যাক্টিভভাবে আচরণ করে, তাদের ভিজ্যুয়াল উপস্থাপনায় নয়।
সারসংক্ষেপ
PDF-এর স্ট্রাকচার এবং সক্ষমতা বোঝা আপনাকে এর পূর্ণ সম্ভাবনা কাজে লাগাতে সাহায্য করে, তা ফর্ম তৈরি করা, ডকুমেন্ট সুরক্ষিত করা বা কেবল নির্ভরযোগ্যভাবে তথ্য শেয়ার করা যাই হোক না কেন। নির্ভরযোগ্য PDF টুল, ব্যবহার করে নির্দ্বিধায় এই বহুল ব্যবহৃত ফরম্যাটের শক্তিশালী ফিচারগুলো এক্সপ্লোর ও কাজে লাগান!