OCR क्या है?
OCR का संक्षिप्त रूप है ऑप्टिकल कैरेक्टर रिकग्निशन। इस प्रक्रिया का उपयोग किया जाता है टेक्स्ट के दृश्य रूप को पहचानने के लिए, जैसे कि किसी इमेज में। इसके आधार पर, OCR वास्तविक टेक्स्ट बना सकता है जिसे बाद में एडिट, कॉपी, बदला आदि किया जा सकता है। यह टाइप किए गए और प्रिंटेड टेक्स्ट के साथ बहुत अच्छी तरह काम करता है, और हाथ से लिखे टेक्स्ट के साथ बहुत ही कम मामलों में।
ऑप्टिकल कैरेक्टर रिकग्निशन कैसे काम करता है?
OCR दो तरीकों से काम कर सकता है: एक बार में एक कैरेक्टर या एक बार में एक शब्द। पहला तरीका सबसे ज़्यादा उपयोग होता है क्योंकि दूसरे तरीके में भाषा में शब्दों को स्पेस के ज़रिए अलग-अलग किया जाना जरूरी होता है।
शुरुआत में, OCR प्रोसेसर को एक-एक कैरेक्टर को पहचानने के लिए प्रशिक्षित किया जाता था किसी विशेष फॉन्ट में। अब तक, ज़्यादातर सैंस और सेरिफ फॉन्ट OCR को ज्ञात हैं और पहचाने जा सकते हैं। टेढ़े-मेढ़े स्कैन और 100% सीधे न होने वाली इमेज भी काफ़ी अच्छी तरह इंटरप्रेट की जाती हैं। यह संभव होता है प्री-प्रोसेसिंग की वजह से जो कई OCR प्रोग्राम करते हैं। इसमें डेस्क्यूइंग और डीस्पेकलिंग, स्कैन या इमेज को ग्रेस्केल में बदलना आदि शामिल हैं।
ऑप्टिकल कैरेक्टर रिकग्निशन के उपयोग
आपको OCR की ज़रूरत क्यों पड़ सकती है या आप इसे क्यों उपयोग करना चाहेंगे? यहां कुछ आम उपयोग दिए गए हैं:
- लेक्चर और प्रेजेंटेशन स्लाइड्स की फोटो से नोट्स बनाएं
- इमेज के रूप में स्कैन किए गए डॉक्युमेंट्स से टेक्स्ट निकालें
- अपने पेपरवर्क को डिजिटाइज़ करें और उसे इनवॉइस नंबर या इसी तरह की चीजों के लिए सर्च करने योग्य बनाएं
OCR का उपयोग कैसे करें
- पर जाएँ PDF से Word कनवर्टर के PDF2Go
- अपनी फाइल को ड्रैग एंड ड्रॉप के ज़रिए या अपने हार्ड ड्राइव, Dropbox या Google Drive से अपलोड करें।
- टेक्स्ट रिकग्निशन के लिए "Convert with OCR" चुनें। OCR सेटिंग्स को अपनी ज़रूरत के अनुसार कॉन्फ़िगर करें।
- वैकल्पिक सेटिंग्स में ड्रॉपडाउन मेन्यू से Microsoft Word (.docx) या Word 2003 या उससे पुराना (.doc) चुनें।
- "START" पर क्लिक करें।