OCR چیست؟ آشنایی کامل با تکنولوژی تبدیل عکس به متن

آخرین به روز رسانی: ۱۷ آبان ۱۴۰۱

۲ ۲,۶۷۲ زمان مطالعه: ۶ دقیقه

OCR مخفف Optical Character Recognition به معنی تشخیص کاراکتر نوری است. استفاده‌ی اولیه از این فن‌آوری رو می‌تونیم در تکنولوژهایی مانند تلگراف یا دستگاه‌های مطالعه‌ی نابینایان ببینیم. گاهی اوقات نیاز داریم که اسناد اسکن‌شده یا تصاویر حاوی متن رو به فایل‌های ویرایشی تبدیل کنیم، اینجاست که OCR می‌تونه به ما کمک کنه. OCR چیست؟ نرم‌افزاریه که از اون برای تبدیل عکس یا نوشته‌ی موجود در تصاویر به متن قابل ویرایش استفاده میشه. این نرم‌افزار سندها رو اسکن می‌کنه و متن‌های اون‌ها رو به فایل‎‌های قابل ویرایش تبدیل می‌کنه. نت‌ رانی‌های عزیز، با من همراه باشید تا بیشتر با این تکنولوژی آشنا بشید.

سیستم‌های OCR ترکیبی از سخت‌افزار و نرم‌افزار رو شامل میشه که برای تبدیل عکس به نوشته از اون‌ها استفاده میشه. در حالت سخت‌افزاری از اسکنر یا برد مدار ویژه برای خوندن متن استفاده میشه و در حالت نرم‌افزاری کارکترها به‌صورت پیشرفته پردازش میشن.

مقاله‌های پیشنهادی:

راهنمای خرید اسکنر و انواع آن

متتن اسکن‌شده باید واضح و روشن باشه تا نرم‌افزار بتونه اون رو به فایل ویرایشی تبدیل کنه. معمولا نرم‌افزار OCR به‌طور رایگان در بعضی از اسکنرها وجود داره اما در مقایسه با نرم‌افزارهای حرفه‌ای که تشخیص بالایی دارند امکاناتش محدوده. برای کاربران خانگی استفاده از اسکنرهایی که به طور رایگان نرم‌افزار OCR در اون‌ها قرار داده شده کافیه اما برای مشاغل حرفه‌ای بهتره از نرم‌افزار OCR حرفه‌ای استفاده بشه. در اینترنت انواع نسخه‌های رایگان OCR وجود داره و شما می‌تونید اون‌ها رو دانلود کنید و برای مدتی محدود ازشون استفاده کنید.

نرم‌افزار OCR به طور رایگان در بعضی از اسکنرها وجود داره اما در مقایسه با نرم‌افزارهای حرفه‌ای که تشخیص بالایی دارند امکانات اون‌ها محدوده.

مطالب نوشته

OCR چیست و چگونه کار می‌کند؟

هنگامی که اسناد رو اسکن می‌کنیم OCR عکس‌ها را به صورت سیاه و سفید ذخیره می‌کنه. بعد اون‌ها رو بررسی می‌کنه تا مناطق کم و زیاد نوی اون‌ها رو تشخیص بدید. بر همین مبنا مناطقی که نور زیادی دارند به عنوان زمینه و مناطقی که از نور کمی دارند به عنوان کاراکتر شناخته میشن. سپس مناطقی که نور کمی دارند و تاریک هستند برای پیدا کردن اعداد و حروف الفبایی بیشتر مورد پردازش قرار می‌گیرند.

نرم‌افزارهای OCR از دو روش تشخیص الگویی و ویژگی برای پیدا کردن کاراکترها استفاده می‌کنن. در ادامه هر کدوم از این روش‌ها رو به شما توضیح می‌دیم.

OCR چگونه کار می‌کند؟ — تصویر 1- نحوه‌ی کار OCR

تشخیص الگویی

برنامه‌ی OCR برای تشخیص کاراکترها در اسناد اسکن‌شده قسمت‌هایی از متن رو در قالب و فونت‌های مختلف ارائه میده، سپس تصویری رو که در پایگاه داده‌ ذخیره شده با تصویر حرف به صورت پیکسل به پیکسل مقایسه می‌کنه. از این روش بیشتر برای متن‌های تایپ‌شده استفاده میشه.

تشخیص ویژگی

یک روش پیچیده برای شناسایی کاراکتر‌هاست که به عنوان شناسایی کاراکتر هوشمند (ICR) نیز شناخته میشه. OCR قانون‌هایی برای تشخیص کاراکترهای موجود در اسناد اسکن‌شده داره. مثلاً ویژگی‌ یک حرف می‌تونه منحنی‌های کاراکتر یا خطوط زاویه‌دار باشه. مثلا در حرف A ممکن به شکل دوتا خط مورب که یه خط افقی در بین اون‌ها قرار داره ذخیره بشه.

نحوه تشخیص کاراکترها توسط OCR — تصویر 2- نحوه‌ی تشخیص یک کارکتر توسط OCR

وقتی که کاراکتر شناسایی شد به کد اسکی (ASCII) تبدیل میشه تا در کامپیوتر ذخیره بشه. قبل از اینکه یه سندی رو جهت استفاده‌های بعدی ذخیره کنید باید خطاهای اون رو ویرایش کنین و از درستی چیدمان کاراکترهای پیچیده مطمئن بشید.

فرآیند تبدیل عکس به متن با استفاده از OCR

افراد عادی در طول روز نیاز به اسکن کردن اسناد یا تبدیل اون‌ها به متن‌های قابل ویرایش نیازی ندارن، اما بسیاری از کاربران مانند دانشجویان نیازمند تبدیل کتاب‌های چاپ شده یا مقاله‌ها به متن‌های قابل ویرایش هستن. در ادامه ما نحوه‌ی تبدیل اون‌ها رو توسط OCR به شما توضیح میدیم.

آماده کردن متن‌های چاپ شده

در مرحله‌ی اول شما باید یک نسخه‌ی چاپی با کیفیت از متن یا کتاب مدنظرتون داشته باشید. ممکنه یه سری از کتاب‌ها یا اسناد قدیمی باشن و متن چاپ شده‌ی اون‌ها زیاد با کیفیت نباشه، در این صورت شما می‌تونید از اون‌ها کپی بگیرین و دقت اون‌ها رو افزایش بدین. در خروجی OCR کیفیت متن یا کتاب چاپ‌شده تاثیر بالایی داره.

اسکن کردن اسناد

بعد از اینکه متن‌های چاپ شده‌مون رو با کیفیت بالاتری آماده کردیم باید اون‌ها رو توسط اسکنر تبدیل به فایل‌های دیجیتالی بکنیم. برای این‌کار بهتره از اسکنرهای ورقه‌ای استفاده کنیم تا اسناد رو با سرعت بیشتری اسکن کنه، حتی از دوربین‌هایی که کیفیت خیلی بالایی دارند هم می‌تونیم برای تبدیل کردن فایل‌ها استفاده کنیم.

سیاه و سفید کردن اسناد

در اولین مرحله اسناد توسط ابزارهای OCR‌ به نسخه‌های به سیاه و سفید تبدیل میشن، یعنی توسط این ابزارها، رنگ‌های اضافی از بین میرن و فقط دو رنگ سیاه و سفید باقی میمونن.

تبدیل سند به متن توسط OCR‌

اغلب برنامه‌های OCR تفاونت کمی با هم دارن. این برنامه‌ها اسناد رو کاراکتر به کاراکتر اسکن می‌کنن. زمان‌های قبل، برنامه‌های OCR سرعت کمی داشتند اما امروزه سرعت اون‌ها بیشتر شده است.

غلط‌یابی کردن متن‌ها

یه سری از برنامه‌های OCR امکان بازبینی و اصلاح صفحه‌های اسکن‌شده رو برای کاربر فراهم می‌کنن، بعضی از این برنامه‌ها هم به قابلیت‌هایی مانند غلط‌یابی مجهز هستند که با استفاده از اون‌ها می‌تونیم کلمه‌های غلط رو با درست جایگزین کنیم.

تحلیل الگویی متن

برنامه‌های OCR به غیر از متن‌ها قابلیت شناسایی المان‌ها رو نیز دارن و می‌تونن اون‌ها رو تبدیل به المان‌های گرافیکی کنن، مثلا اگه جدولی رو از متن اسکن شده شناسایی کرده باشه ، اون ‌رو در فایل نهایی به همون صورت جدول نشون میده.

کاربردهای گوناگون OCR

کمک به افراد نابینا و کم‌بینا
ورود اطلاعات برای اسناد تجاری مثل چک، صورت‌حساب بانکی
سرعت بیشتر در تبدیل اسناد چاپ شده یا اسکن شده به متون قابل ویرایش
امکان جستجو در تصایر الکترونیکی اسناد چاپ شده مانند کتاب‌های گوگل
تشخیص خودکار شماره پلاک در نرم‌افزارهای پلاک‌خوان
شکست سیستم ضد ربات CAPTCHA، هر چند که CAPTCHA صرفا جهت جلوگیری از OCR طراحی شده.

مزایای استفاده از OCR چیست

قبلا برای اینکه بتونیم محتوای اسناد رو تغییر بدیم مجبور بودیم اون‌ها رو دوباره تایپ کنیم اما امروزه با استفاده از نرم‌افزار OCR دیگه نیازی به تایپ مجدد متون نیست و به‌راحتی می‌تونیم اسناد اسکن شده رو به فایل‌های قابل ویرایش تبدیل کرد. از مهم‌ترین مزایای استفاده از این نرم‌افزار می‌تونیم به کاهش خطا هنگام تایپ، صرفه‌جویی در زمان و جستجو در متون اشاره کنیم.

OCR چیست و چگونه کار می‌کند؟ — تصویر3- پردازش OCR و تبدیل عکس به متن

امروزه بسیاری از سازمان‌های بزرگ از این نرم‌افزار برای سرعت بخشیدن به کارهای خود و تبدیل اسناد اسکن شده به متون‌ قابل ویرایش استفاده می‌کنن. با استفاده از این نرم‌افزار خطاهای انسانی کاهش پیدا می‌کنه و روند ورود اطلاعات سریع‌تر انجام می‌گیره. این نرم‌افزار امروزه می‌تونه کلمات، کاراکترها و جملات رو به‌راحتی شناسایی ‌کنه و عکس‌ها رو به نوشته‌های قابل ویرایش تبدیل ‌کنه.

تاریخچه OCR

در سال 1914 امانوئل گلدبرگ ماشینی رو تولید کرد که کاراکترها رو می‌خوند و اون‌ها رو تبدیل به کد تلگراف استاندارد می‌کرد. هم‌زمان ادموند فورنیر d’Albe Optophone رو توسعه داد. نوعی اسکنر دستی که وقتی صفحات چاپ‌شده رو اسکن می‌کنه متن‌ها رو به‌صورت حروف یا کاراکترهای خاص تولید می‌کنه.

در اواخر دهه‌ی 1920 و 1930 امانوئل گلدبرگ یه ماشین آماری رو برای جستجوی بایگانی‌های میکروفیلم با استفاده از سیستم شناسایی کد نوری توسعه داد. در سال 1931 حق ثبت این اختراع به آمریکا داده شد و حق ثبت اختراع توسط IBM به دست اومد.

در سال 1950 یه مهندس به اسم دیوید اچ شپرد دستگاهی رو اختراع کرد که می‌تونست متن‌های چاپ‌شده رو به فرمت قابل‌ خواندن در ماشیت تبدیل کنه. شپرد این دستگاه رو به ارتش آمریکا فروخت و بعدها یه شرکت مخصوص OCR راه‌اندازی کرد. او کسی بود که فونت Farrington B رو برای دستگاه‌های OCR توسعه داد. امروزه این فونت رو به نام OCR-7B میشناسن و برای چاپ عددها روی کارت‌های اعتباری استفاده می‌کنن.

یکی دیگه از افرادی که در فناوری OCR تاثیر زیادی داشت لارنس رابرتس بود که در MIT تحقیق می‌کرد و با تکیه به فونت OCR-A یکی از اولین سیستم‌های تشخیص متن رو توسعه داد. هم‌زمان رسانه‌های RCA و Reader’s Digest در تلاش بودن که اولین نمونه از دستگاه‌های OCR رو به بازار جهانی عرضه کنن. در دهه‌ی 1960 در مراکز پستی برای دسته‌بندی نامه‌ها و اسکن آدرس‌ها از دستگاه‌های OCR استفاده میشد.

در سال 1974 ری کرزویل (Ray Kurzweil) دستگاهی رو برای اسکن متن و خوندن متن‌ها برای افراد نابینا توسعه داد. بعدها زیراکس شرکت کامپیوتری Kurzweil رو خرید. در سال 1993 اولین دستگاهی که توانایی تشخیص دست‌خط رو داشت تولید شد. Apple Newton MessagePad می‌تونست روی نمایشگرهای لمسی دست‌خط کاربران رو تشخیص بده. تشخیص دست‌خط کاربران در دهه‌ی 1990 به یه قابلیت محبوب در کامپیوترهای همراه تبدیل شد که یکی از پیشگامان تولید اون شرکت پالکم بود.

دانشمندان دانشگاه کارنگی ملون در سال 2000 پیشنهاد دادن که برای بهبود برنامه‌های OCR از سیستم‌های ضد اسکن CAPTCHA استفاده شود. در سال 2007 و با ورود آیفون به بازار جهانی گوشی‌های هوشمند، OCR می‌تونست از طریق دوربین متن‌ها رو اسکن و به متن تبدیل کنه.

نحوه‌ی اسکن کردن با موبایل — تصویر 4- اسکن با موبایل و تبدیل عکس به متن قابل ویرایش

حرف آخر

با استفاده از OCR می‌تونید جزوه‌ها یا اسناد قدیمی رو اسکن کرده و فایل‌هاتون رو به متن‌های قابل ویرایش تبدیل کنین. با استفاده از این روش هم در زمان صرفه‌جویی میشه و هم خطاها به طرز چشمگیری کاهش پیدا می‌کنه. امیدوارم از مقاله‌ای که در مورد OCR چیست؟ نوشتیم لذت برده باشین، اگه سوالی در مورد مقاله براتون پیش اومد می‌تونین در بخش نظرات اون رو مطرح کنین و مطمئن باشین که در اسرع وقت من یا همکارانم پاسخ شما عزیزان رو میدیم.

دانلود فایل pdf این مقاله:

فایل pdf مقاله

سوالات متداول

OCR چیست؟

OCR یه فناوریه که با استفاده از اون می‌تونیم عکس‌ها رو به نوشته تبدیل کنیم. در این فناوری، دستگاه با تشخیص نوری، متن‌هایی داخل عکس رو تشخیص میده و اون‌ها رو به فایل ویرایشی تبدیل می‌کنه.

OCR تشکیل شده از چه کلمه‌هایی است؟

OCR مخفف Optical Character Recognition و به معنای تشخیص نوری متن است.

مزایای استفاده از OCR چیست؟

از مزایای OCR می‌تونیم به سرعت بیشتر در ورود داده‌ها، صرفه‌جویی در زمان و کاهش خطای انسانی اشاره کنیم.