
OCR چیست؟ آشنایی کامل با تکنولوژی تبدیل عکس به متن
OCR مخفف Optical Character Recognition به معنی تشخیص کاراکتر نوری است. استفادهی اولیه از این فنآوری رو میتونیم در تکنولوژهایی مانند تلگراف یا دستگاههای مطالعهی نابینایان ببینیم. گاهی اوقات نیاز داریم که اسناد اسکنشده یا تصاویر حاوی متن رو به فایلهای ویرایشی تبدیل کنیم، اینجاست که OCR میتونه به ما کمک کنه. OCR چیست؟ نرمافزاریه که از اون برای تبدیل عکس یا نوشتهی موجود در تصاویر به متن قابل ویرایش استفاده میشه. این نرمافزار سندها رو اسکن میکنه و متنهای اونها رو به فایلهای قابل ویرایش تبدیل میکنه. نت رانیهای عزیز، با من همراه باشید تا بیشتر با این تکنولوژی آشنا بشید.
سیستمهای OCR ترکیبی از سختافزار و نرمافزار رو شامل میشه که برای تبدیل عکس به نوشته از اونها استفاده میشه. در حالت سختافزاری از اسکنر یا برد مدار ویژه برای خوندن متن استفاده میشه و در حالت نرمافزاری کارکترها بهصورت پیشرفته پردازش میشن.
متتن اسکنشده باید واضح و روشن باشه تا نرمافزار بتونه اون رو به فایل ویرایشی تبدیل کنه. معمولا نرمافزار OCR بهطور رایگان در بعضی از اسکنرها وجود داره اما در مقایسه با نرمافزارهای حرفهای که تشخیص بالایی دارند امکاناتش محدوده. برای کاربران خانگی استفاده از اسکنرهایی که به طور رایگان نرمافزار OCR در اونها قرار داده شده کافیه اما برای مشاغل حرفهای بهتره از نرمافزار OCR حرفهای استفاده بشه. در اینترنت انواع نسخههای رایگان OCR وجود داره و شما میتونید اونها رو دانلود کنید و برای مدتی محدود ازشون استفاده کنید.
OCR چیست و چگونه کار میکند؟
هنگامی که اسناد رو اسکن میکنیم OCR عکسها را به صورت سیاه و سفید ذخیره میکنه. بعد اونها رو بررسی میکنه تا مناطق کم و زیاد نوی اونها رو تشخیص بدید. بر همین مبنا مناطقی که نور زیادی دارند به عنوان زمینه و مناطقی که از نور کمی دارند به عنوان کاراکتر شناخته میشن. سپس مناطقی که نور کمی دارند و تاریک هستند برای پیدا کردن اعداد و حروف الفبایی بیشتر مورد پردازش قرار میگیرند.
نرمافزارهای OCR از دو روش تشخیص الگویی و ویژگی برای پیدا کردن کاراکترها استفاده میکنن. در ادامه هر کدوم از این روشها رو به شما توضیح میدیم.

تشخیص الگویی
برنامهی OCR برای تشخیص کاراکترها در اسناد اسکنشده قسمتهایی از متن رو در قالب و فونتهای مختلف ارائه میده، سپس تصویری رو که در پایگاه داده ذخیره شده با تصویر حرف به صورت پیکسل به پیکسل مقایسه میکنه. از این روش بیشتر برای متنهای تایپشده استفاده میشه.
تشخیص ویژگی
یک روش پیچیده برای شناسایی کاراکترهاست که به عنوان شناسایی کاراکتر هوشمند (ICR) نیز شناخته میشه. OCR قانونهایی برای تشخیص کاراکترهای موجود در اسناد اسکنشده داره. مثلاً ویژگی یک حرف میتونه منحنیهای کاراکتر یا خطوط زاویهدار باشه. مثلا در حرف A ممکن به شکل دوتا خط مورب که یه خط افقی در بین اونها قرار داره ذخیره بشه.

وقتی که کاراکتر شناسایی شد به کد اسکی (ASCII) تبدیل میشه تا در کامپیوتر ذخیره بشه. قبل از اینکه یه سندی رو جهت استفادههای بعدی ذخیره کنید باید خطاهای اون رو ویرایش کنین و از درستی چیدمان کاراکترهای پیچیده مطمئن بشید.
فرآیند تبدیل عکس به متن با استفاده از OCR
افراد عادی در طول روز نیاز به اسکن کردن اسناد یا تبدیل اونها به متنهای قابل ویرایش نیازی ندارن، اما بسیاری از کاربران مانند دانشجویان نیازمند تبدیل کتابهای چاپ شده یا مقالهها به متنهای قابل ویرایش هستن. در ادامه ما نحوهی تبدیل اونها رو توسط OCR به شما توضیح میدیم.
آماده کردن متنهای چاپ شده
در مرحلهی اول شما باید یک نسخهی چاپی با کیفیت از متن یا کتاب مدنظرتون داشته باشید. ممکنه یه سری از کتابها یا اسناد قدیمی باشن و متن چاپ شدهی اونها زیاد با کیفیت نباشه، در این صورت شما میتونید از اونها کپی بگیرین و دقت اونها رو افزایش بدین. در خروجی OCR کیفیت متن یا کتاب چاپشده تاثیر بالایی داره.
اسکن کردن اسناد
بعد از اینکه متنهای چاپ شدهمون رو با کیفیت بالاتری آماده کردیم باید اونها رو توسط اسکنر تبدیل به فایلهای دیجیتالی بکنیم. برای اینکار بهتره از اسکنرهای ورقهای استفاده کنیم تا اسناد رو با سرعت بیشتری اسکن کنه، حتی از دوربینهایی که کیفیت خیلی بالایی دارند هم میتونیم برای تبدیل کردن فایلها استفاده کنیم.
سیاه و سفید کردن اسناد
در اولین مرحله اسناد توسط ابزارهای OCR به نسخههای به سیاه و سفید تبدیل میشن، یعنی توسط این ابزارها، رنگهای اضافی از بین میرن و فقط دو رنگ سیاه و سفید باقی میمونن.
تبدیل سند به متن توسط OCR
اغلب برنامههای OCR تفاونت کمی با هم دارن. این برنامهها اسناد رو کاراکتر به کاراکتر اسکن میکنن. زمانهای قبل، برنامههای OCR سرعت کمی داشتند اما امروزه سرعت اونها بیشتر شده است.
غلطیابی کردن متنها
یه سری از برنامههای OCR امکان بازبینی و اصلاح صفحههای اسکنشده رو برای کاربر فراهم میکنن، بعضی از این برنامهها هم به قابلیتهایی مانند غلطیابی مجهز هستند که با استفاده از اونها میتونیم کلمههای غلط رو با درست جایگزین کنیم.
تحلیل الگویی متن
برنامههای OCR به غیر از متنها قابلیت شناسایی المانها رو نیز دارن و میتونن اونها رو تبدیل به المانهای گرافیکی کنن، مثلا اگه جدولی رو از متن اسکن شده شناسایی کرده باشه ، اون رو در فایل نهایی به همون صورت جدول نشون میده.
کاربردهای گوناگون OCR
- کمک به افراد نابینا و کمبینا
- ورود اطلاعات برای اسناد تجاری مثل چک، صورتحساب بانکی
- سرعت بیشتر در تبدیل اسناد چاپ شده یا اسکن شده به متون قابل ویرایش
- امکان جستجو در تصایر الکترونیکی اسناد چاپ شده مانند کتابهای گوگل
- تشخیص خودکار شماره پلاک در نرمافزارهای پلاکخوان
- شکست سیستم ضد ربات CAPTCHA، هر چند که CAPTCHA صرفا جهت جلوگیری از OCR طراحی شده.
مزایای استفاده از OCR چیست
قبلا برای اینکه بتونیم محتوای اسناد رو تغییر بدیم مجبور بودیم اونها رو دوباره تایپ کنیم اما امروزه با استفاده از نرمافزار OCR دیگه نیازی به تایپ مجدد متون نیست و بهراحتی میتونیم اسناد اسکن شده رو به فایلهای قابل ویرایش تبدیل کرد. از مهمترین مزایای استفاده از این نرمافزار میتونیم به کاهش خطا هنگام تایپ، صرفهجویی در زمان و جستجو در متون اشاره کنیم.

امروزه بسیاری از سازمانهای بزرگ از این نرمافزار برای سرعت بخشیدن به کارهای خود و تبدیل اسناد اسکن شده به متون قابل ویرایش استفاده میکنن. با استفاده از این نرمافزار خطاهای انسانی کاهش پیدا میکنه و روند ورود اطلاعات سریعتر انجام میگیره. این نرمافزار امروزه میتونه کلمات، کاراکترها و جملات رو بهراحتی شناسایی کنه و عکسها رو به نوشتههای قابل ویرایش تبدیل کنه.
تاریخچه OCR
در سال 1914 امانوئل گلدبرگ ماشینی رو تولید کرد که کاراکترها رو میخوند و اونها رو تبدیل به کد تلگراف استاندارد میکرد. همزمان ادموند فورنیر d’Albe Optophone رو توسعه داد. نوعی اسکنر دستی که وقتی صفحات چاپشده رو اسکن میکنه متنها رو بهصورت حروف یا کاراکترهای خاص تولید میکنه.
در اواخر دههی 1920 و 1930 امانوئل گلدبرگ یه ماشین آماری رو برای جستجوی بایگانیهای میکروفیلم با استفاده از سیستم شناسایی کد نوری توسعه داد. در سال 1931 حق ثبت این اختراع به آمریکا داده شد و حق ثبت اختراع توسط IBM به دست اومد.
در سال 1950 یه مهندس به اسم دیوید اچ شپرد دستگاهی رو اختراع کرد که میتونست متنهای چاپشده رو به فرمت قابل خواندن در ماشیت تبدیل کنه. شپرد این دستگاه رو به ارتش آمریکا فروخت و بعدها یه شرکت مخصوص OCR راهاندازی کرد. او کسی بود که فونت Farrington B رو برای دستگاههای OCR توسعه داد. امروزه این فونت رو به نام OCR-7B میشناسن و برای چاپ عددها روی کارتهای اعتباری استفاده میکنن.
یکی دیگه از افرادی که در فناوری OCR تاثیر زیادی داشت لارنس رابرتس بود که در MIT تحقیق میکرد و با تکیه به فونت OCR-A یکی از اولین سیستمهای تشخیص متن رو توسعه داد. همزمان رسانههای RCA و Reader’s Digest در تلاش بودن که اولین نمونه از دستگاههای OCR رو به بازار جهانی عرضه کنن. در دههی 1960 در مراکز پستی برای دستهبندی نامهها و اسکن آدرسها از دستگاههای OCR استفاده میشد.
در سال 1974 ری کرزویل (Ray Kurzweil) دستگاهی رو برای اسکن متن و خوندن متنها برای افراد نابینا توسعه داد. بعدها زیراکس شرکت کامپیوتری Kurzweil رو خرید. در سال 1993 اولین دستگاهی که توانایی تشخیص دستخط رو داشت تولید شد. Apple Newton MessagePad میتونست روی نمایشگرهای لمسی دستخط کاربران رو تشخیص بده. تشخیص دستخط کاربران در دههی 1990 به یه قابلیت محبوب در کامپیوترهای همراه تبدیل شد که یکی از پیشگامان تولید اون شرکت پالکم بود.
دانشمندان دانشگاه کارنگی ملون در سال 2000 پیشنهاد دادن که برای بهبود برنامههای OCR از سیستمهای ضد اسکن CAPTCHA استفاده شود. در سال 2007 و با ورود آیفون به بازار جهانی گوشیهای هوشمند، OCR میتونست از طریق دوربین متنها رو اسکن و به متن تبدیل کنه.

حرف آخر
با استفاده از OCR میتونید جزوهها یا اسناد قدیمی رو اسکن کرده و فایلهاتون رو به متنهای قابل ویرایش تبدیل کنین. با استفاده از این روش هم در زمان صرفهجویی میشه و هم خطاها به طرز چشمگیری کاهش پیدا میکنه. امیدوارم از مقالهای که در مورد OCR چیست؟ نوشتیم لذت برده باشین، اگه سوالی در مورد مقاله براتون پیش اومد میتونین در بخش نظرات اون رو مطرح کنین و مطمئن باشین که در اسرع وقت من یا همکارانم پاسخ شما عزیزان رو میدیم.
دانلود فایل pdf این مقاله:
سوالات متداول
OCR یه فناوریه که با استفاده از اون میتونیم عکسها رو به نوشته تبدیل کنیم. در این فناوری، دستگاه با تشخیص نوری، متنهایی داخل عکس رو تشخیص میده و اونها رو به فایل ویرایشی تبدیل میکنه.
OCR مخفف Optical Character Recognition و به معنای تشخیص نوری متن است.
از مزایای OCR میتونیم به سرعت بیشتر در ورود دادهها، صرفهجویی در زمان و کاهش خطای انسانی اشاره کنیم.
عالی
خواهش میکنم علی جان.