OCR - التعرف الضوئي على الحروف

ما هي تقنية OCR؟

OCR هو اختصار لـ Optical Character Recognition. تُستخدم هذه العملية لـ التعرّف على التمثيل البصري للنص، على سبيل المثال في صورة. استنادًا إلى ذلك، يمكن لـ OCR أن ينشئ نصًا فعليًا يمكن بعد ذلك تحريره ونسخه وتعديله، إلخ. يعمل بشكل جيد جدًا مع النصوص المطبوعة والمنسوخة آليًا، ونادرًا ما ينجح مع النصوص المكتوبة يدويًا.

كيف يعمل التعرف الضوئي على الحروف؟

يمكن لـ OCR أن يعمل بطريقتين: حرف واحد في كل مرة أو كلمة واحدة في كل مرة. الطريقة الأولى هي الأكثر استخدامًا لأن الثانية تتطلب أن تستخدم اللغة مسافة للفصل بين الكلمات.

في البداية، كانت معالجات OCR تُدرَّب على التعرّف على الحروف الفردية ضمن خط معيّن. حاليًا، يمكن لـ OCR التعرّف على معظم الخطوط ذات الزوايا والحواف (sans و serif). حتى عمليات المسح المائلة أو الصور غير المستقيمة تمامًا يتم تفسيرها بشكل مقبول. يعود ذلك إلى المعالجة المسبقة التي تقوم بها العديد من برامج OCR. وتشمل تصحيح الميل وإزالة الشوائب، وتحويل المسح أو الصورة إلى تدرجات الرمادي، وغير ذلك.

حالات استخدام التعرف الضوئي على الحروف

لماذا قد تحتاج أو ترغب في استخدام OCR؟ فيما يلي بعض حالات الاستخدام الشائعة:

  • إنشاء ملاحظات استنادًا إلى شرائح المحاضرات والعروض التقديمية التي التقطت لها صورًا
  • استخراج النص من المستندات التي تم مسحها ضوئيًا كصور
  • رقمنة مستنداتك الورقية وجعلها قابلة للبحث عن أرقام الفواتير أو ما يشبهها

طريقة استخدام OCR

  1. انتقل إلى محوّل PDF إلى Word من PDF2Go
  2. قم برفع ملفك عبر السحب والإفلات أو برفعه من القرص الصلب أو Dropbox أو Google Drive.
  3. للتعرّف على النص اختر "Convert with OCR". اضبط إعدادات OCR بما يناسب احتياجاتك.
  4. في الإعدادات الاختيارية اختر Microsoft Word (.docx) أو Word 2003 أو أقدم (.doc) من قائمة الاختيارات.
  5. انقر على "START".