تشخیص کاراکتر نوری (OCR) به نرم افزاری اطلاق می شود که نسخه دیجیتالی یک سند چاپ شده، تایپ شده یا دست نویس را ایجاد می کند که رایانه ها می توانند بدون نیاز به تایپ دستی یا وارد کردن متن، آن را بخوانند. OCR به طور کلی در اسناد اسکن شده در قالب PDF استفاده می شود، اما همچنین می تواند یک نسخه قابل خواندن توسط کامپیوتر از متن در یک فایل تصویر ایجاد کند.
OCR چیست
OCR که به عنوان تشخیص متن نیز شناخته می شود، فناوری نرم افزاری است که کاراکترهایی مانند اعداد، حروف، و علائم نگارشی (که به آنها حروف نیز می گویند) را از اسناد چاپی یا نوشتاری به شکل الکترونیکی تبدیل می کند که به راحتی توسط رایانه ها شناسایی و خوانده می شود. سایر برنامه های نرم افزاریبرخی از برنامههای OCR این کار را زمانی انجام میدهند که یک سند با دوربین دیجیتال اسکن یا عکس گرفته میشود و برخی دیگر میتوانند این فرآیند را برای اسنادی که قبلاً بدون OCR اسکن یا عکسبرداری شدهاند اعمال کنند. OCR به کاربران امکان می دهد در اسناد PDF جستجو کنند، متن را ویرایش کنند و اسناد را دوباره قالب بندی کنند.
Getty Images
OCR برای چه استفاده می شود؟
برای نیازهای اسکن سریع و روزمره، OCR ممکن است چیز مهمی نباشد. اگر مقدار زیادی اسکن انجام میدهید، جستجو در فایلهای PDF برای یافتن دقیق مورد نیاز، میتواند مقدار زیادی در زمان صرفهجویی کند و عملکرد OCR را در برنامه اسکنر شما مهمتر کند. در اینجا موارد دیگری وجود دارد که OCR به آنها کمک می کند:
- پردازش و ورود خودکار داده ها (مثال: سیستم های ردیابی متقاضیان شغل برای رزومه).
- قابل جستجو کردن کتابهای اسکن شده.
- تبدیل اسکن های دست نویس به متن قابل خواندن توسط رایانه.
- قابل استفاده بیشتر اسناد توسط برنامه های خواننده که به کاربران کم بینا کمک می کنند.
- حفظ اسناد و روزنامه های تاریخی و همچنین قابل جستجو کردن آنها.
- استخراج و انتقال داده ها به برنامه های حسابداری (مثال: رسیدها و فاکتورها).
- نمایه سازی اسناد برای استفاده توسط موتورهای جستجو.
- تشخیص پلاک راننده توسط دوربین سرعت و نرم افزار دوربین نور قرمز.
- سینتی سایزرهای گفتار برای افرادی که نمی توانند صحبت کنند - فیزیکدان نظری، استیون هاوکینگ، شاید شناخته شده ترین کاربر یک برنامه ترکیب کننده گفتار باشد.
خط پایین
چرا فقط عکس نگیرید، درست است؟ زیرا شما نمی توانید چیزی را ویرایش کنید یا متن را جستجو کنید زیرا فقط یک تصویر است. اسکن سند و اجرای نرم افزار OCR می تواند آن فایل را به چیزی تبدیل کند که می توانید ویرایش کنید و بتوانید جستجو کنید.
تاریخچه OCR
در حالی که اولین استفاده از تشخیص متن به سال 1914 برمی گردد، توسعه و استفاده گسترده از فناوری های مرتبط با OCR به طور جدی در دهه 1950 آغاز شد، به ویژه با ایجاد فونت های بسیار ساده که تبدیل به دیجیتالی آسان تر بود. متن قابل خواندن اولین مورد از این فونت های ساده شده توسط دیوید شپرد ایجاد شد و معمولاً با نام OCR-7B شناخته می شود. OCR-7B هنوز در صنعت مالی برای فونت استاندارد مورد استفاده در کارت های اعتباری و کارت های نقدی استفاده می شود. در دهه 1960، خدمات پستی در چندین کشور، از جمله ایالات متحده، بریتانیا، کانادا و آلمان، شروع به استفاده از فناوری OCR برای سرعت بخشیدن به مرتبسازی نامهها کردند. OCR هنوز هم فناوری اصلی است که برای مرتبسازی نامهها برای خدمات پستی در سراسر جهان استفاده میشود. در سال 2000، دانش کلیدی از محدودیتها و قابلیتهای فناوری OCR برای توسعه برنامههای CAPTCHA مورد استفاده برای متوقف کردن رباتها و هرزنامهها استفاده شد.
در طول دههها، OCR به دلیل پیشرفت در حوزههای فناوری مرتبط مانند هوش مصنوعی، یادگیری ماشین و بینایی رایانه، دقیقتر و پیچیدهتر شده است.امروزه نرمافزار OCR از تشخیص الگو، تشخیص ویژگی و متنکاوی برای تبدیل اسناد سریعتر و دقیقتر از همیشه استفاده میکند.
سوالات متداول
چگونه اسناد را با تلفن یا رایانه لوحی خود اسکن کنم؟
در iOS، برنامه Notes را باز کنید و یک یادداشت جدید ایجاد کنید. دوربین را باز کنید و سپس روی Scan Documents ضربه بزنید. در Android، Google Drive را باز کنید و Plus (+ را انتخاب کنید)، سپس برای اسکن Scan ضربه بزنید. با تلفن خود سند دهید.
چگونه از OCR در Adobe Acrobat استفاده کنم؟
فایل PDF حاوی یک تصویر اسکن شده را باز کنید، سپس Tools > ویرایش PDF را انتخاب کنید. Acrobat به طور خودکار OCR را اعمال می کند تا بتوانید متن را ویرایش کنید. فقط جایی را که میخواهید ویرایش کنید انتخاب کنید و شروع به تایپ کنید.
تفاوت بین OCR و OMR چیست؟
Optical Mark Recognition (OMR) نرم افزاری است که علائم را روی کاغذ، معمولاً یک صفحه حبابی، تشخیص می دهد. OMR برای پردازش نتایج امتحانات، نظرسنجی ها، پرسشنامه ها و حتی انتخابات استفاده می شود. برخلاف OCR، OMR نمیتواند علامتهای موجود در صفحه را رمزگشایی کند، اما فقط تأیید میکند که علامتها آنجا هستند.