آموزشسخت افزار

OCR چیست؟ آشنایی کامل با تکنولوژی تبدیل عکس به متن

OCR مخفف Optical Character Recognition به معنی تشخیص کاراکتر نوری است. استفاده اولیه از این فن‌آوری رو می‌تونیم در تکنولوژهایی مانند تلگراف یا ایجاد دستگاه‌های مطالعه برای نابینایان جستجو کرد. گاهی اوقات نیاز داریم که اسناد اسکن شده یا تصاویری که حاوی متن هستند رو به فایل‌های قابل ویرایش تبدیل کنیم، اینجاست که OCR می‌تونه به ما کمک کنه. OCR چیست؟ یه نرم‌افزاری هست که از اون برای تبدیل عکس یا نوشته موجود در تصاویر به متن قابل ویرایش استفاده میشه. این نرم‌افزار سندهایی رو که شامل متن هستن توسط اسکنر اسکن می‌کنه و متن‌های اون‌ها رو به فایل‎‌های قابل ویرایش تبدیل می‌کنه. نت‌رانی‌های عزیز، با من همراه باشید تا بیشتر با این تکنولوژی آشنا بشیم.

سیستم‌های OCR ترکیبی از سخت‌افزار و نرم‌افزار رو شامل میشه که برای تبدیل عکس به نوشته استفاده می‌شه. در حالت سخت‌افزاری از یه اسکنر یا برد مدار ویژه برای خوندن متن استفاده میشه و در حالت نرم‌افزاری پردازش پیشرفته کاراکترها انجام می‌گیره.

مقاله‌های پیشنهادی:

راهنمای خرید اسکنر و انواع آن

برای اینکه این متون قابل استفاده و ویرایش باشند باید متنی که اسکن می‌شه بسیار واضح و روشن باشه تا توسط نرم‌افزار قابل شناسایی باشه. معمولا نرم‌افزار OCR به طور رایگان در بعضی از اسکنرها وجود داره اما در مقایسه با نرم‌افزارهای حرفه‌ای که تشخیص بالایی دارند امکانات اون‌ها محدوده. استفاده از اسکنرهایی که نرم‌افزار OCR به طور رایگان در اون‌ها قرار داده شده برای کاربرای خانگی کافیه اما برای مشاغل حرفه‌ای بهتره از نرم‌افزار OCR حرفه‌ای استفاده کنیم. در اینترنت انواع نسخه‌های رایگان نرم‌افزار OCR وجود داره تا کاربران در صورت نیاز بتونن اون رو دانلود کرده و به صورت محدود استفاده کنن.

نرم‌افزار OCR به طور رایگان در بعضی از اسکنرها وجود داره اما در مقایسه با نرم‌افزارهای حرفه‌ای که تشخیص بالایی دارند امکانات اون‌ها محدوده.

OCR چیست و چگونه کار می‌کند؟

هنگامی که اسناد رو اسکن می‌کنیم عکس‌ها را به صورت سیاه و سفید ذخیره می‌کنه، تصاویری که اسکن شدن برای منطقه‌هایی که نور کم یا زیاد دارن مورد تجزیه و تحلیل قرار می‌گیرن. مناطقی که از نور زیادی برخوردارن به عنوان زمینه و مناطقی که از نور کمی برخوردارن به عنوان کاراکتر شناخته می‌شن. سپس مناطقی که نور کمی دارند و تاریک هستند برای پیدا کردن اعداد و حروف الفبایی بیشتر مورد پردازش قرار می‌گیرن.

نرم‌افزارهای OCR با استفاده از دو روش تشخیص الگویی و ویژگی برای پیدا کردن کاراکترها بهره می‌برن که هر کدوم از این روش‌ها رو به شما توضیح می‌دیم.

 OCR چگونه کار می‌کند؟
تصویر 1- نحوه‌ی کار OCR

تشخیص الگویی

برای تشخیص کاراکترها در اسنادی که اون‌ها رو اسکن کردیم برنامه OCR قسمت‌هایی از متن رو در قالب و فونت‌های مختلف ارائه میده، سپس تصویری که در پایگاه داده‌مون ذخیره شده با تصویر حرف به صورت پیکسل به پیکسل مقایسه میشه. برای متن‌هایی که تایپ شدن بیشتر از این روش استفاده می‌شه.

تشخیص ویژگی

یک روش پیچیده برای شناسایی کاراکتر‌هاست که به عنوان شناسایی کاراکتر هوشمند (ICR) نیز شناخته میشه، برنامه OCR یه سری قانون‌هایی رو برای تشخیص کاراکترهای موجود در اسناد اسکن شده در رابطه با ویژگی یه حرف مثل A یا یه شماره خاص اعمال می‌کنه. ویژگی‌ یه حرف می‌تونه منحنی‌های یه کاراکتر یا خطوط زاویه‌دار باشه، مثلا در حرف A ممکن به شکل دوتا خط مورب که یه خط افقی در بین اون‌ها قرار داره ذخیره بشه.

نحوه تشخیص کاراکترها توسط OCR
تصویر 2- نحوه‌ی تشخیص یک کارکتر توسط OCR

وقتی که یه کاراکتر شناسایی شد به یه کد اسکی (ASCII) تبدیل می‌شه تا جهت تغییرات بیشتر در کامپیوتر استفاده بشه. قبل از اینکه یه سندی رو جهت استفاده‌های بعدی ذخیره کنید باید خطاهای اون رو ویرایش کنین و از درستی چیدمان کاراکترهای پیچیده اطمینان حاصل نمایید.

فرآیند تبدیل عکس به متن با استفاده از OCR

افراد عادی در طول روز نیاز زیادی به اسکن کردن اسناد یا تبدیل آن‌ها به متن‌های قابل ویرایش ندارن، اما بسیاری از کاربران مانند دانشجویان نیازمند تبدیل کتاب‌های چاپ شده یا مقاله‌ها به متن‌های قابل ویرایش هستن که در ادامه ما نحوه‌ی تبدیل اون‌ها رو به متن توسط OCR به شما توضیح میدیم.

آماده کردن متن‌های چاپ شده

در مرحله‌ی اول شما باید یک نسخه چاپی با کیفیت از متن یا کتابی که می‌خواید اون‌ رو به فایل قابل ویرایش تبدیل کنین داشته باشین. ممکنه یه سری از کتاب‌ها یا اسناد قدیمی باشن و متن چاپ شده اون‌ها زیاد با کیفیت نباشه، در این صورت شما می‌تونید از اون‌ها کپی بگیرین و دقت اون‌ها رو افزایش بدین. در خروجی OCR کیفیت متن یا کتاب چاپ شده تاثیر بالایی داره.

اسکن کردن اسناد

بعد از اینکه متن‌های چاپ شده‌مون رو با کیفیت بالاتری آماده کردیم باید اون‌ها رو توسط اسکنر تبدیل به فایل‌های دیجیتالی بکنیم. برای این‌کار بهتره از اسکنرهای ورقه‌ای استفاده کنیم تا اسناد رو با سرعت بیشتری اسکن کنه، حتی از دوربین‌هایی که کیفیت خیلی بالایی دارند می‌تونیم برای تبدیل کردن فایل‌ها استفاده کنیم.

سیاه و سفید کردن اسناد

در اولین مرحله اسناد توسط ابزارهای OCR‌ تبدیل به نسخه‌هایی به دو رنگ سیاه و سفید میشن، یعنی توسط این ابزارها، رنگ‌های اضافی از بین میرن و فقط دو رنگ سیاه و سفید باقی میمونن.

تبدیل سند به متن توسط OCR‌

برنامه‌های OCR که اسناد رو تبدیل به متن‌های قابل ویرایش می‌کنن تفاوت‌های کمی باهم دارن، این برنامه‌ها اسناد رو کاراکتر به کاراکتر اسکن می‌کنن. زمان‌های قبل، برنامه‌های OCR سرعت کمی در تبدیل اسناد به متن داشتند اما امروزه سرعت آن‌ها بیشتر شده است.

غلط‌یابی کردن متن‌ها

یه سری از برنامه‌های OCR امکان بازبینی و اصلاح صفحه‌های اسکن شده رو برای کاربر فراهم می‌کنن، بعضی از این برنامه‌ها هم به قابلیت‌هایی مانند غلط‌یابی مجهز هستند که با استفاده از اون‌ها می‌تونیم کلمه‌های غلط رو با درست جایگزین کنیم.

تحلیل الگویی متن

برنامه‌های OCR به غیر از متن‌ها قابلیت شناسایی المان‌ها رو نیز دارن و می‌تونن اون‌ها رو تبدیل به المان‌های گرافیکی کنن، مثلا اگه جدولی رو از متن اسکن شده شناسایی کرده باشه ، اون ‌رو در فایل نهایی به همون صورت جدول نشون میده.

کاربردهای گوناگون OCR

  • کمک به افراد نابینا و کم‌بینا
  • ورود اطلاعات برای اسناد تجاری مثل چک، صورت‌حساب بانکی
  • سرعت بیشتر در تبدیل اسناد چاپ شده یا اسکن شده به متون قابل ویرایش
  • امکان جستجو در تصایر الکترونیکی اسناد چاپ شده مانند کتاب‌های گوگل
  • تشخیص خودکار شماره پلاک در نرم‌افزارهای پلاک‌خوان
  • شکست سیستم ضد ربات CAPTCHA، هر چند که CAPTCHA صرفا جهت جلوگیری از OCR طراحی شده.

مزایای استفاده از OCR چیست

قبلا برای اینکه بتونیم محتوای اسناد رو تغییر بدیم مجبور بودیم اون‌ها رو دوباره تایپ کنیم اما امروزه با استفاده از نرم‌افزار OCR دیگه نیازی به تایپ مجدد متون نبوده و به راحتی می‌تونیم اسناد اسکن شده رو به فایل‌های قابل ویرایش تبدیل کرد. از مهم‌ترین مزایای استفاده از این نرم‌افزار می‌تونیم به کاهش خطا هنگام تایپ، صرفه‌جویی در زمان و جستجو در متون اشاره کنیم.

OCR چیست و چگونه کار می‌کند؟
تصویر3- پردازش OCR و تبدیل عکس به متن

امروزه بسیاری از سازمان‌های بزرگ از این نرم‌افزار برای سرعت بخشیدن به کارهای خود و تبدیل اسناد اسکن شده به متون‌های قابل ویرایش استفاده می‌کنن. با استفاده از این نرم‌افزار خطاهای انسانی کاهش بسیاری داشته و روند ورود اطلاعات سریع‌تر انجام می‌گیره. این نرم‌افزار امروزه می‌تونه کلمات، کاراکترها و جملات رو به راحتی شناسایی ‌کنه و عکس‌ها رو به نوشته‌های قابل ویرایش تبدیل ‌کنه.

تاریخچه OCR

در سال 1914 امانوئل گلدبرگ ماشینی رو تولید کرد که کاراکترها رو می‌خوند و اون‌ها رو تبدیل به کد تلگراف استاندارد می‌کرد. هم‌زمان ادموند فورنیر d’Albe Optophone رو توسعه داد، یه اسکنر دستی که وقتی صفحات چاپ شده رو اسکن می‌کنه متن‌ها رو به صورت حروف یا کاراکترهای خاص تولید می‌کنه.

در اواخر دهه 1920 و 1930 امانوئل گلدبرگ یه ماشین آماری رو برای جستجوی بایگانی‌های میکروفیلم با استفاده از سیستم شناسایی کد نوری توسعه داد. در سال 1931 حق ثبت این اختراع به آمریکا داده شد و حق ثبت اختراع توسط IBM به دست اومد.

در سال 1950 یه مهندس به اسم دیوید اچ شپرد دستگاهی رو اختراع کرد که قابلیت تبدیل متن‌های چاپ شده رو به فرمت‌های قابل خوندن در ماشین تبدیل می‌کرد که بعدا این دستگاه رو به ارتش آمریکا فروخت. شپرد بعدها یه شرکت مخصوص OCR راه‌اندازی کرد، همچنین دیوید اچ شپرد فونت Farrington B رو مختص خوندن در دستگاه‌های OCR توسعه داد که اون‌رو به اسم OCR-7B میشناسن و برای چاپ عددها روی کارت‌های اعتباری استفاده می‌کنن.

یکی دیگه از افرادی که در فناوری OCR تاثیر زیادی داشت لارنس رابرتس بود که در MIT تحقیق می‌کرد و با تکیه به فونت OCR-A یکی از اولین سیستم‌های تشخیص متن رو توسعه داد. همزمان رسانه‌های RCA و Reader’s Digest در تلاش بودن که اولین نمونه از دستگاه‌های OCR رو به بازار جهانی عرضه کنن. دهه‌ی 1960 در مراکز پستی برای دسته‌بندی نامه‌ها و اسکن آدرس‌ها از دستگاه‌های OCR استفاده میشد.

در سال 1974 ری کرزویل (Ray Kurzweil) یه دستگاهی رو برای اسکن متن و خوندن متن‌ها برای افراد نابینا توسعه داد، بعدها زیراکس شرکت کامپیوتری Kurzweil رو خریداری کرد. در سال 1993 اولین دستگاهی که قابلیت تشخیص دست‌خط رو داشت تولید شد. Apple Newton MessagePad روی نمایشگرهای لمسی قابلیت تشخیص دست‌خط کاربران رو داشت. تشخیص دست‌خط کاربران در دهه‌ی 1990 به یه قابلیت محبوب در کامپیوترهای همراه تبدیل شد که یکی از پیشگامان تولید آن‌ها شرکت پالکم بود.

دانشمندان دانشگاه کارنگی ملون در سال 2000 پیشنهاد دادن که برای بهبود برنامه‌های OCR از سیستم‌های CAPTCHA که ضد اسکن هستند استفاده شود. برای سیستم‌های OCR در سال 2007 با ورود آیفون به بازار جهانی گوشی‌های هوشمند یه رخداد مهم دیگه اتفاق افتاد که این گوشی‌ها توانایی اسکن با دوربین و تبدیل کردن به متن رو داشتن.

نحوه‌ی اسکن کردن با موبایل
تصویر 4- اسکن با موبایل و تبدیل عکس به متن قابل ویرایش

حرف آخر

با استفاده از OCR دیگه به راحتی می‌تونید جزوه‌هایی که از اون‌ها عکس گرفتین یا اسناد قدیمی رو اسکن کرده و فایل‌هاتون رو به متن‌های قابل ویرایش تبدیل کنین. با استفاده از این روش هم در زمان صرفه‌جویی کردین و هم خطاها به طرز چشمگیری کاهش پیدا می‌کنه. امیدوارم از مقاله‌ای که در مورد OCR چیست؟ نوشتیم لذت برده باشین، اگه سوالی در مورد مقاله براتون پیش اومد می‌تونین در بخش نظرات اون رو مطرح کنین و مطمئن باشین که در اسرع وقت من یا همکارانم پاسخ شما عزیزان رو میدیم.

دانلود فایل pdf این مقاله:

فایل pdf مقاله

سوالات متداول

OCR چیست؟

OCR یه فناوری هست که با استفاده از اون می‌تونیم عکس‌ها رو به نوشته تبدیل کنیم. در این فناوری، دستگاه با تشخیص نوری متن‌هایی که در عکس‌ هستند رو تشخیص داده و به فایل قابل ویرایش تبدیل می‌کنه.

OCR تشکیل شده از چه کلمه‌هایی است؟

OCR مخفف Optical Character Recognition بوده و به معنای تشخیص نوری متن است.

مزایای استفاده از OCR

از مزایای OCR می‌تونیم به سرعت بیشتر در ورود داده‌ها، صرفه‌جویی در زمان و کاهش خطای انسانی اشاره کرد.

سمیرا انزابی

فارغ التحصیل کارشناسی مهندسی نرم افزار و تولید کننده محتوا در مجله نت ران
خبرنامه
Notify of
guest
0 نظرات
Inline Feedbacks
View all comments

نوشته های مشابه

دکمه بازگشت به بالا