اگر به حوزه هوش مصنوعی علاقهمند باشید یا در این صنعت فعالیت داشته باشید، یکی از مفاهیم بنیادی که با آن سر و کار دارید، دید ماشین یا بینایی ماشین است. بینایی ماشین (Machine vision) از آخرین فناوریهای هوش مصنوعی استفاده میکند تا به تجهیزات صنعتی توانایی دیدن و تجزیه و تحلیل وظایف در تولید هوشمند، کنترل کیفیت و ایمنی کارگران را بدهد. در این مطلب همراه ما باشید تا به طور کامل با فناوری هوش مصنوعی آشنا شویم.
بینایی ماشین چیست؟
بینایی ماشین توانایی کامپیوتر برای دیدن است. از یک یا چند دوربین فیلمبرداری، تبدیل آنالوگ به دیجیتال (ADC) و پردازش سیگنال دیجیتال (DSP) استفاده می کند. داده های به دست آمده به یک کامپیوتر یا ربات کنترل کننده می رود. بینایی ماشین از نظر پیچیدگی شبیه به تشخیص صدا است.
بینایی ماشین گاهی اوقات با اصطلاح بینایی کامپیوتری ترکیب می شود. این فناوری اغلب با هوش مصنوعی (AI)، یادگیری ماشینی و یادگیری عمیق برای تسریع پردازش تصویر ادغام می شود.
بینایی ماشین یکی از فناوری های پایهگذار اتوماسیون صنعتی است. این تکنولوژی چندین دهه است که به بهبود کیفیت محصول، سرعت تولید و بهینهسازی تولید و تدارکات کمک کرده است. اکنون، این فناوری اثبات شده و کاربردی در حال ادغام با هوش مصنوعی و انتقال به صنعت هوشمند یا « Industry 4.0» است.
تاریخچهای از بینایی ماشین و سیستمهای بینایی ماشین کلاسیک
ماشینها قبل از پیدایش هوش مصنوعی و یادگیری ماشین میتوانستند «ببینند». در اوایل دهه 1970، کامپیوترها شروع به استفاده از الگوریتمهای خاص برای پردازش تصاویر و تشخیص ویژگیهای اساسی کردند. این فناوری بینایی ماشین کلاسیک میتوانست لبههای شی را برای قرار دادن یک قطعه تشخیص دهد، تفاوتهای رنگی را که نشاندهنده نقص بود، پیدا کند و کارهایی از این قبیل را انجام دهد.
بینایی ماشین کلاسیک شامل عملیات نسبتاً سادهای است که نیازی به هوش مصنوعی ندارد. متن باید ساده و واضح باشد، مانند بارکد. شکلها باید قابل پیش بینی و متناسب با یک الگوی دقیق باشند. سیستم بینایی ماشین کلاسیک نمیتواند دست خط را بخواند، برچسب چروک افتاده و ناواضح را رمزگشایی کند یا سیب را از پرتقال تشخیص دهد.
با این وجود، بینایی ماشین کلاسیک تأثیر زیادی بر تولید و صنایع مختلف داشته است. ماشینها خسته نمیشوند، بنابراین میتوانند عیوب را سریعتر و مطمئنتر از چشم انسان تشخیص دهند. به علاوه، ماشینها محدودیتهای بینایی انسان را ندارند. دوربینهای بینایی ماشین تخصصی میتوانند از تصویربرداری حرارتی برای تشخیص ناهنجاریهای حرارتی و اشعه ایکس برای تشخیص عیوب میکروسکوپی و خستگی فلز استفاده کنند.
بینایی ماشین چگونه کار میکند؟ نحوه کار دید ماشین
بینایی ماشین از دوربینها برای گرفتن اطلاعات بصری از محیط اطراف استفاده میکند. سپس با استفاده از ترکیب سخت افزار و نرم افزار، تصاویر را پردازش و اطلاعات را برای استفاده در برنامههای مختلف آماده میکند. فناوری بینایی ماشین اغلب از اپتیکهای تخصصی برای بدست آوردن تصاویر استفاده میکند. این رویکرد اجازه میدهد تا ویژگیهای خاصی از تصویر پردازش، تجزیه و تحلیل و اندازه گیری شود.
به عنوان مثال، یک برنامه بینایی ماشین به عنوان بخشی از یک سیستم تولیدی میتواند برای تجزیه و تحلیل مشخصه خاصی از قطعهای استفاده شود که در خط مونتاژ تولید میشود. بینایی ماشین میتواند تعیین کند که آیا قطعه با معیارهای کیفی مطابقت دارد یا خیر و اگر مطابقت نداشت، قطعه را کنار میگذارد.
سیستمهای بینایی ماشین در تنظیمات تولید، معمولاً به موارد زیر نیاز دارند:
- نورپردازی: نور، شی یا صحنه را روشن میکند تا ویژگی های آن قابل مشاهده باشد.
- لنز: این قطعه، تصویر را میگیرد و به عنوان نور به سنسور دوربین میرساند.
- برد تصویربرداری، گیرنده ی قاب تصویر یا سنسور: این دستگاهها برای پردازش تصویر از دوربین و تبدیل آن به فرمت دیجیتال به صورت پیکسل با هم کار میکنند. حسگرهای تصویر، نور را با استفاده از فناوری نیمه رسانای اکسید فلزی تکمیلی یا دستگاهی با شارژ، به سیگنال های الکتریکی تبدیل میکنند.
- پردازنده: پردازنده، نرم افزار و الگوریتمهای مرتبطی را اجرا میکند که تصویر دیجیتال را پردازش و اطلاعات مورد نیاز را استخراج میکند.
- ارتباط: این سیستمها، دوربینهای بینایی ماشین و سیستم پردازش را قادر میسازند تا با سایر عناصر سیستم بزرگتر ارتباط برقرار کنند و معمولاً از سیگنال ورودی/خروجی مجزا یا اتصال سریال استفاده میکنند.
دو نوع دوربین در ساخت ماشین بینایی مورد استفاده قرار میگیرد: دوربینهای اسکن ناحیهای و دوربین های اسکن خطی. در زیر نحوه کار آنها را بیان میکنیم:
- اسکن ناحیهای یا منطقهای: این دوربینها با استفاده از حسگر مستطیلی، در یک فریم عکس میگیرند. تعداد پیکسلهای سنسور با عرض و ارتفاع تصویر مطابقت دارد. دوربین های اسکن ناحیهای برای اسکن اشیایی استفاده میشوند که از نظر عرض و ارتفاع هم اندازه هستند.
- اسکن خطی: این دوربینها، تصویر را به صورت پیکسل به پیکسل میسازند. دوربینهای اسکن خطی برای عکس گرفتن از اشیای در حال حرکت یا اندازه های نامنظم مناسب هستند. حسگر، هنگام گرفتن عکس با یک حرکت خطی از روی یک جسم عبور میکند. دوربینهای اسکن خطی مانند دوربینهای اسکن ناحیهای محدود به وضوح خاصی نیستند.
لنزهای دوربین از نظر کیفیت نور متفاوت هستند. دو ویژگی مهم در هر سیستم بینایی، حساسیت و وضوح لنز است که دارای ویژگی های زیر است:
- حساسیت: توانایی ماشین برای دیدن در نور کم یا تشخیص تکانههای ضعیف در طول موجهای نامرئی است.
- وضوح یا رزولوشن: عبارت است از میزان تمایزی که یک ماشین میتواند بین اشیا قائل شود.
به طور کلی، هرچه وضوح بیشتر باشد، میدان دید محدودتر است. حساسیت و وضوح به یکدیگر وابسته هستند. اگر سایر عوامل ثابت باشند، افزایش حساسیت باعث کاهش وضوح و افزایش وضوح باعث کاهش حساسیت میشود.
چشم انسان به طول موجهای الکترومغناطیسی از 390 تا 770 نانومتر حساس است. دوربین های فیلمبرداری میتوانند به طیف وسیعی از طول موجهای بسیار گستردهتر از آن حساس باشند. برخی از سیستمهای بینایی ماشین در طول موجهای مادون قرمز، فرابنفش یا اشعه ایکس کار میکنند.
بینایی ماشین دوچشمی که استریو نیز نامیده میشود به کامپیوتری با پردازنده پیشرفته نیاز دارد. علاوه بر این، استریو به دوربینهای با وضوح بالا، مقدار زیادی رم و برنامه نویسی هوش مصنوعی برای درک عمق نیاز دارد.
کاربردهای بینایی ماشین و موارد استفاده از آن
بینایی ماشین در طیف وسیعی از صنایع برای انجام وظایف مختلف کاربرد دارد؛ از مهمترین کاربردهای بینایی ماشین میتوان به موارد زیر اشاره کرد:
- تجزیه و تحلیل اجزای الکترونیکی: بینایی ماشین در ساخت بردهای مدار برای کارهایی مانند بازرسی خمیر لحیم کاری و قرار دادن قطعات استفاده میشود.
- تشخیص کاراکتر نوری: Optical character recognition یا به اختصار OCR به کامپیوتر این امکان را میدهد متن چاپ شده یا دست نویس را از تصاویر استخراج کند.
یکی از محصولات شرکت هوش مصنوعی آویر، OCR است که توانایی تبدیل متون چاپی یا دست نویس به فایل متنی را به صورت دقیق دارد. برای اطلاعات بیشتر کلیک کنید.
- دستخط و تشخیص امضا: با این ویژگیها، کامپیوتر میتواند الگوهای موجود در تصاویر دست خط و امضا را تشخیص دهد.
- تشخیص شی: در صنعت خودروسازی، خودروهای خودران از تشخیص اشیا بر روی تصاویر گرفته شده توسط دوربینها برای شناسایی موانع در جاده استفاده میکنند. سیستمهای بینایی ماشین همچنین موقعیت اشیا را تعیین میکنند، مانند قرار دادن مناسب برچسب روی جعبه قرص یا دیگر محصولات برچسبخورده.
- الگو شناسی: تجزیه و تحلیل تصویربرداری پزشکی از تشخیص الگو برای تشخیص بر اساس فناوریهایی مانند تصویربرداری رزونانس مغناطیسی، اسکن خون و اسکن مغز استفاده میکند.
- بازرسی مواد: قابلیتهای بینایی ماشین در سیستمهای بازرسی مواد، کنترل کیفیت را تضمین میکند. بینایی ماشین عیوب، نقصها و آلایندهها را در طیف وسیعی از مواد و محصولات بررسی میکند.
- بازرسی ارز: بینایی ماشین برای تجزیه و تحلیل ارزها برای شناسایی اسکناسهای تقلبی استفاده میشود.
- شمارش اقلام: این قابلیت برای شمارش اقلامی مانند قرص در یک بسته یا بطری در یک جعبه استفاده میشود.
بینایی ماشین و هوش مصنوعی
هوش مصنوعی در بینایی ماشین برای تسریع فرآیند تصمیم گیری استفاده می شود. هوش مصنوعی قادر است حجم زیادی از تصاویر و اطلاعات داده را پردازش کند که قبلاً جمعآوری آنها بسیار دشوار بود.
نمونههایی از نحوه استفاده از هوش مصنوعی در بینایی ماشین به شرح زیر است:
امضا و تشخیص کاراکتر به سطحی از تفاوتهای ظریف نیاز دارد که هوش مصنوعی میتواند به آن کمک کند.
در تولید، هوش مصنوعی به تشخیص اشیا و بازرسی مواد کمک میکند تا سیستمهای بینایی ماشین را قادر سازد تا تغییرات قابل قبول در شکل و بافت یک شی یا ماده را درک کنند.
در تضمین و کنترل کیفیت، یک سیستم مجهز به هوش مصنوعی میتواند ناهنجاریهای قابل قبول را تفسیر کند و هر چیزی را که با یک مشخصات مطابقت ندارد، فوراً رد نکند.
بینایی ماشین و رباتیک
بینایی ماشین، همراه با هوش مصنوعی و یادگیری عمیق، نقش روباتها را در انجام وظایف خط تولید، مانند انتخاب، مرتبسازی، قرار دادن و انجام اسکن خط تولید، گسترش میدهد. این ترکیب از فناوریها همچنین رباتیک را قادر میسازد در محیط های دیگر مانند سوپرمارکتها، بیمارستانها و رستورانها کار کند.
به عنوان مثال، یک ربات با بینایی ماشین میتواند در راهروهای سوپرمارکت حرکت کند و دادههای موجودی محصولات موجود در قفسه های فروشگاه را جمع آوری کند. این دستگاه با استفاده از فناوری شناسایی فرکانس رادیویی برای خواندن بارکد، محصولات را اسکن میکند و از ایجاد موانع در راهروهای شلوغ جلوگیری کند. فروشگاههای خردهفروشی آمازون گو (Amazon Go) از سیستمهای مبتنی بر بینایی ماشین برای نظارت بر موجودی و بررسی مشتریان در زمانی که آماده پرداخت هستند، استفاده میکنند.
فناوری بینایی ماشین اتوماسیون و توالی فرآیندها را در برنامههای مختلف ممکن میسازد. بینایی ماشین همچنین همکاری بین رباتها و انسانها را کارآمدتر و ایمنتر میکند.
به عنوان مثال، در یک سوپرمارکت، یک ربات می تواند به انجام وظایف مدیریت موجودی اختصاص داده شود تا کارمندان انسانی زمان بیشتری برای کمک به مشتریان داشته باشند. این ربات می تواند اسکن موجودی را بیشتر از افراد و با دقت بیشتری انجام دهد. در خط مونتاژ، رباتهای بینایی ماشین میتوانند مواد خطرناک را تجزیه و تحلیل کنند و کارهای خطرناک دیگری را بدون قرار دادن کارگران در معرض شرایط ناامن انجام دهند.
تفاوت بین بینایی ماشین و بینایی کامپیوتر چیست؟
در برخی موارد، دو اصطلاح بینایی ماشین و بینایی کامپیوتر به صورت مترادف به کار میروند. در موارد دیگر، تمایز ایجاد می شود.
بینایی ماشین با کاربردهای صنعتی توانایی دیدن کامپیوتر مرتبط است. اصطلاح بینایی کامپیوتر معمولاً برای توصیف هر فناوری به کار میرود که در آن کامپیوتر وظیفه دیجیتالی کردن یک تصویر، پردازش دادههای موجود در آن و انجام نوعی اقدام را دارد.
تمایز دیگری که میان بینایی ماشین و بینایی کامپیوتر گاهی اوقات ایجاد میشود در قدرت پردازش است — یعنی تفاوت بین ماشین و کامپیوتر. سیستم بینایی ماشین معمولاً قدرت پردازش کمتری دارد و در محیطهای تولیدی استفاده میشود و کارهای عملی را با سرعت بالا انجام میدهد تا دادههای مورد نیاز برای تکمیل یک کار مشخص را به دست آورد.
سیستمهای بینایی کامپیوتر تا حد امکان دادهها را درباره اشیا یا صحنهها جمعآوری میکنند و هدفشان درک کامل آنهاست. بینایی کامپیوتر برای جمعآوری اطلاعات عمومی و قابل انتقال که ممکن است برای کارهای مختلف اعمال شود، بهتر است. بینایی کامپیوتر همچنین میتواند بدون دوربین انجام شود زیرا این اصطلاح، به توانایی رایانه برای پردازش تصاویر از هر منبعی از جمله اینترنت اشاره دارد.
و در پایان این که…
بینایی ماشین یکی از کاربردهای فراوان هوش مصنوعی در تولید است. احتمال میرود که بینایی ماشین در آینده رشد چشمگیری داشته باشد. پتانسیل برای کاربردهای جدید با بهبود فناوری در سیستمهای بینایی افزایش مییابد. فناوری های جدید به طور مداوم در حال توسعه و پیشرفت هستند. یادگیری عمیق، محاسبات ابری، پردازشگرهای سریعتر، و ابزارهای یکپارچهسازی داده ها، امکانات جدیدی را در بینایی کامپیوتر به ارمغان می آورند.