Avir Logo
back

OCR

تبدیل متون چاپی و دست‌نویس به فایل متنی

سامانه OCR برای پاسخگویی به نیازهای کاربران برای زبان های فارسی و انگلیسی در سال 1401 توسعه یافته است.

این سامانه نه تنها در پردازش فونت های تایپی سرآمد است، بلکه از توانایی پردازش متون زبان فارسی شبه نسخ خطی نیز برخوردار میباشد. سیستم OCR ما برای ساده سازی وظایف مدیریت اسناد شما طراحی شده و مجموعه ای از ویژگی های قدرتمند را ارائه می دهد که فرآیند دیجیتالی کردن اسناد را ساده می کند.

یکی از ویژگی های برجسته آن، پیش پردازش مبتنی بر هوش مصنوعی است که به طور خودکار متن را در تصاویر تشخیص می دهد، خطای پرسپکتیو را تصحیح کرده و نویز و سایه ها را از اسناد حذف می کند.

به علاوه مجموعه دادگان شبه دست‌نویس و دست نویس واقعی بزرگی نیز توسط مجموعه آماده و لیبل گذاری آن انجام شده است که شبکه ها نیز بر روی این مجموعه دادگان آموزش دیده است.

نمونه تصاویر ورودی و خروجی ماژول پیش‌پردازش

نمونه OCR فونت های شبیه دستنویس فارسی

نمونه OCR متن های دستنویس واقعی

عملکرد مناسب شبکه تشخیص کلمات

چرا OCR مهم است:

فناوری OCR به چند دلیل در عصر دیجیتال بسیار مهم است:

کارایی: زمان و تلاش مورد نیاز برای رونویسی متن چاپ شده یا دست نویس را به شدت کاهش می دهد و بهره وری را افزایش می دهد.

قابلیت جستجو: نمایه سازی و جستجوی آسان متن در اسناد را امکان پذیر می کند و بازیابی و تجزیه و تحلیل داده ها را افزایش می دهد.

ذخیره سازی : OCR با ایجاد پشتیبان های دیجیتال به حفظ اسناد تاریخی و ارزشمند کمک می کند.

کاربرد ها :
  1. سیستم OCR ما طیف وسیعی از اهداف را انجام می دهد و آن را به ابزاری ضروری برای بخش های مختلف تبدیل می کند. در اینجا برخی از کاربرد های آن آورده شده است:
  2. انتشارات: تبدیل محتوای نوشته شده در کتاب ها و نسخه های خطی به متون تایپی و قابل ویرایش جهت اسانتر کردن آرشیو و به اشتراک گذاری
  3. ادارات و شرکت ها: تسهیل تبدیل اسناد بایگانی مانند کارت ملی، شناسنامه و سایر اسناد رسمی به پرونده های الکترونیکی و مدیریت اسناد
  4. تشخیص خودکار شماره پلاک و ...
  5. سفارشی سازی : فراتر از این برنامه های کاربردی استاندارد، ماژول OCR ما این قابلیت را دارد که بتوان آن را متناسب با فونت(های) خاص، طرح‌بندی سند یا شرایط خاص متناسب با نیاز های شما تنظیم کرد.
  6. اسکن اسناد : ماژول OCR ما می تواند به عنوان یک اسکنر سند مستقل عمل کند، شبیه به برنامه های محبوب مانند CamScanner. این فرآیند تبدیل اسناد فیزیکی به فرمت دیجیتال را ساده می کند.