تشخیص کاراکتر نوری (OCR) چیست؟

فهرست مطالب:

2024 نویسنده: Abigail Brown | [email protected]. آخرین اصلاح شده: 2023-12-17 06:46

تشخیص کاراکتر نوری (OCR) به نرم افزاری اطلاق می شود که نسخه دیجیتالی یک سند چاپ شده، تایپ شده یا دست نویس را ایجاد می کند که رایانه ها می توانند بدون نیاز به تایپ دستی یا وارد کردن متن، آن را بخوانند. OCR به طور کلی در اسناد اسکن شده در قالب PDF استفاده می شود، اما همچنین می تواند یک نسخه قابل خواندن توسط کامپیوتر از متن در یک فایل تصویر ایجاد کند.

OCR چیست

OCR که به عنوان تشخیص متن نیز شناخته می شود، فناوری نرم افزاری است که کاراکترهایی مانند اعداد، حروف، و علائم نگارشی (که به آنها حروف نیز می گویند) را از اسناد چاپی یا نوشتاری به شکل الکترونیکی تبدیل می کند که به راحتی توسط رایانه ها شناسایی و خوانده می شود. سایر برنامه های نرم افزاریبرخی از برنامه‌های OCR این کار را زمانی انجام می‌دهند که یک سند با دوربین دیجیتال اسکن یا عکس گرفته می‌شود و برخی دیگر می‌توانند این فرآیند را برای اسنادی که قبلاً بدون OCR اسکن یا عکس‌برداری شده‌اند اعمال کنند. OCR به کاربران امکان می دهد در اسناد PDF جستجو کنند، متن را ویرایش کنند و اسناد را دوباره قالب بندی کنند.

اسکن روزنامه تاریخی با نرم افزار OCR.

Getty Images

OCR برای چه استفاده می شود؟

برای نیازهای اسکن سریع و روزمره، OCR ممکن است چیز مهمی نباشد. اگر مقدار زیادی اسکن انجام می‌دهید، جستجو در فایل‌های PDF برای یافتن دقیق مورد نیاز، می‌تواند مقدار زیادی در زمان صرفه‌جویی کند و عملکرد OCR را در برنامه اسکنر شما مهم‌تر کند. در اینجا موارد دیگری وجود دارد که OCR به آنها کمک می کند:

پردازش و ورود خودکار داده ها (مثال: سیستم های ردیابی متقاضیان شغل برای رزومه).
قابل جستجو کردن کتابهای اسکن شده.
تبدیل اسکن های دست نویس به متن قابل خواندن توسط رایانه.
قابل استفاده بیشتر اسناد توسط برنامه های خواننده که به کاربران کم بینا کمک می کنند.
حفظ اسناد و روزنامه های تاریخی و همچنین قابل جستجو کردن آنها.
استخراج و انتقال داده ها به برنامه های حسابداری (مثال: رسیدها و فاکتورها).
نمایه سازی اسناد برای استفاده توسط موتورهای جستجو.
تشخیص پلاک راننده توسط دوربین سرعت و نرم افزار دوربین نور قرمز.
سینتی سایزرهای گفتار برای افرادی که نمی توانند صحبت کنند - فیزیکدان نظری، استیون هاوکینگ، شاید شناخته شده ترین کاربر یک برنامه ترکیب کننده گفتار باشد.

خط پایین

چرا فقط عکس نگیرید، درست است؟ زیرا شما نمی توانید چیزی را ویرایش کنید یا متن را جستجو کنید زیرا فقط یک تصویر است. اسکن سند و اجرای نرم افزار OCR می تواند آن فایل را به چیزی تبدیل کند که می توانید ویرایش کنید و بتوانید جستجو کنید.

تاریخچه OCR

در حالی که اولین استفاده از تشخیص متن به سال 1914 برمی گردد، توسعه و استفاده گسترده از فناوری های مرتبط با OCR به طور جدی در دهه 1950 آغاز شد، به ویژه با ایجاد فونت های بسیار ساده که تبدیل به دیجیتالی آسان تر بود. متن قابل خواندن اولین مورد از این فونت های ساده شده توسط دیوید شپرد ایجاد شد و معمولاً با نام OCR-7B شناخته می شود. OCR-7B هنوز در صنعت مالی برای فونت استاندارد مورد استفاده در کارت های اعتباری و کارت های نقدی استفاده می شود. در دهه 1960، خدمات پستی در چندین کشور، از جمله ایالات متحده، بریتانیا، کانادا و آلمان، شروع به استفاده از فناوری OCR برای سرعت بخشیدن به مرتب‌سازی نامه‌ها کردند. OCR هنوز هم فناوری اصلی است که برای مرتب‌سازی نامه‌ها برای خدمات پستی در سراسر جهان استفاده می‌شود. در سال 2000، دانش کلیدی از محدودیت‌ها و قابلیت‌های فناوری OCR برای توسعه برنامه‌های CAPTCHA مورد استفاده برای متوقف کردن ربات‌ها و هرزنامه‌ها استفاده شد.

در طول دهه‌ها، OCR به دلیل پیشرفت در حوزه‌های فناوری مرتبط مانند هوش مصنوعی، یادگیری ماشین و بینایی رایانه، دقیق‌تر و پیچیده‌تر شده است.امروزه نرم‌افزار OCR از تشخیص الگو، تشخیص ویژگی و متن‌کاوی برای تبدیل اسناد سریع‌تر و دقیق‌تر از همیشه استفاده می‌کند.

سوالات متداول

چگونه اسناد را با تلفن یا رایانه لوحی خود اسکن کنم؟

در iOS، برنامه Notes را باز کنید و یک یادداشت جدید ایجاد کنید. دوربین را باز کنید و سپس روی Scan Documents ضربه بزنید. در Android، Google Drive را باز کنید و Plus (+ را انتخاب کنید)، سپس برای اسکن Scan ضربه بزنید. با تلفن خود سند دهید.

چگونه از OCR در Adobe Acrobat استفاده کنم؟

فایل PDF حاوی یک تصویر اسکن شده را باز کنید، سپس Tools > ویرایش PDF را انتخاب کنید. Acrobat به طور خودکار OCR را اعمال می کند تا بتوانید متن را ویرایش کنید. فقط جایی را که می‌خواهید ویرایش کنید انتخاب کنید و شروع به تایپ کنید.

تفاوت بین OCR و OMR چیست؟

Optical Mark Recognition (OMR) نرم افزاری است که علائم را روی کاغذ، معمولاً یک صفحه حبابی، تشخیص می دهد. OMR برای پردازش نتایج امتحانات، نظرسنجی ها، پرسشنامه ها و حتی انتخابات استفاده می شود. برخلاف OCR، OMR نمی‌تواند علامت‌های موجود در صفحه را رمزگشایی کند، اما فقط تأیید می‌کند که علامت‌ها آنجا هستند.