یادگیری ماشین (MACHINE LEARNING) و هوش مصنوعی

بوسیله تحریریه یونیکس مگ به روز رسانی شده در 15 مرداد 1402 0

وقتی برای اولین بار دوربین‌های IP وارد بازار شدند، فقط دستگاه‌هایی برای فیلم برداری بودند و پردازش سیستم به عهده سرور مدیریت تصاویر بود. در طی سال‌های بعد شرکت‌های تولید کننده دوربین مداربسته به فکر تولید دوربین‌هایی با CPU مناسب جهت Edge Processing افتادند. با افزایش قدرت محاسباتی، این فرصت برای شرکت‌ها فراهم شد تا تجزیه و تحلیل‌های پیشرفته‌تری را در دوربین تعبیه کنند و از فناوری یادگیری ماشین (MACHINE LEARNING) و هوش مصنوعی استفاده نمایند.

چندین مزیت برای جذاب تر کردن تجزیه و تحلیل مبتنی بر لبه را وجود داشت:

مصرف پهنای باند کمتر: به جای پخش هر فریم از فیلم خام برای سرور جهت تجزیه و تحلیل، دوربین مداربسته می‌تواند تصاویر را از قبل پردازش کند و فقط اندازه‌ی رویداد را ارسال کند.
نیازهای ذخیره سازی پایین‌تر: فقط با ارسال فیلمی از محتوا به سرور، تصاویر کمتری برای بایگانی در آرایه ذخیره سازی وجود دارد.
هزینه‌های عملیاتی کمتر: پردازش محرمانه‌ی ویدئو نسبت به انحصار چرخه پردازنده در سرور هزینه کمتری داشت. اولین الگوریتم‌های وارد شده به دوربین مداربسته بر اساس تغییرات پیکسل در میدان دید بود. وقتی تغییرات به آستانه خاصی رسیدند، تجزیه و تحلیل اتفاق می افتاد و تصویر حرکت شناسایی شده را به سرور می‌فرستاد. بر اساس مفهوم آستانه پیکسل، تجزیه و تحلیل‌های محرمانه مانند دست کاری دوربین و تشخیص خط مقطعی به دنبال آن ممکن ممکن شد.

آنچه در این مقاله می خوانید:

یادگیری ماشین چگونه بر پیشرفت ویدئو تأثیر می گذارد؟

در سال ۲۰۲۰ تولیدکنندگان در حال ساخت دوربین‌های مداربسته‌ای هستند که واحدهای پردازش یادگیری عمیق (DLPU) در آن‌ها تعبیه شده‌اند، و به توسعه دهندگان نرم افزار امکان می‌دهد هوش هنری (AI) را در الگوریتم‌های تجزیه و تحلیل ویدیویی خود ادغام کنند. این امیدهای جدیدی را ایجاد کرده است که یادگیری ماشین و یادگیری عمیق راه حل فوق العاده ای خواهد بود که صنعت امنیت مدت‌هاست وعده‌ی آن را داده است. با این حال، با توجه به تغییرات محیط نظارت تصویری، تحقق این وعده هنوز راهی طولانی در پیش دارد. این بدان دلیل است که یادگیری ماشین می‌تواند مقدار زیادی از منابع را قبل از دستیابی به یک نتیجه دقیق و ثابت مصرف کند. ما از مثال تشخیص چهره استفاده خواهیم کرد. اگر می‌خواستید اپلیکیشن را با استفاده از هوش مصنوعی ایجاد کنید، برای آموزش برنامه جهت طبقه بندی یک تصویر به عنوان یک چهره، به یک فرایند تکراری احتیاج دارید. این به معنای جمع آوری و برچسب زدن هزاران تصویر از چهره و وارد کردن آنها در اپلیکیشن است، سپس آزمایش اپلیکیشن بعد از هر چرخه ورودی تا زمانی که تعیین کنید که برنامه به اندازه کافی در مورد ویژگی‌های یک چهره آموخته است. در آن مرحله، مدل آموزش دیده به یک برنامه تمام شده تبدیل می‌شود. اما بعد از آن، هوش مصنوعی چیز جدیدی یاد نمی‌گیرد.

بیشتر بخوانید: چرا باید لینوکس را یاد بگیریم؟

اکنون چالش های تشخیص چهره را از منظر دوربین مداربسته در نظر بگیرید

نه تنها شما باید برنامه را برای تشخیص چهره کامل از جلو آموزش دهید، بلکه تصاویر گرفته شده از چند زاویه، تصاویر در سایه و نور خورشید و شرایط متغیر آب و هوایی، تصاویر با موهای صورت، کلاه، عینک، خال کوبی و سایر تفاوت‌های متمایز را نیز باید آموزش دهید. و اگر اپلیکیشن با تصویری تازه روبرو شود که هیچ نقطه داده‌ای برای آن وجود ندارد، می‌تواند به آن مراجعه کند، ممکن است در تشخیص تصویر به عنوان صورت ناموفق باشد. این بدان معنا نیست که از همان ابتدای تجزیه و تحلیل ویدیو، گام‌های قابل توجهی برداشته شده است. به عنوان مثال، تشخیص حرکت ویدئو را در نظر بگیرید. ما با تشخیص تغییرات pixel در صحنه فاصله زیادی داشتیم. امروزه تجزیه و تحلیل تشخیص حرکت برای شناسایی الگوها طراحی شده است. آنها می‌توانند داده‌های غیر ضروری مانند سایه‌ها، عبور اشیا مانند ماشین و شاخه‌ها، درخشش از یک چراغ جلو، حتی پرندگان را فیلتر کنند – که منجر به کاهش قابل توجه هشدارهای مثبت کاذب می‌شود. سایر تجزیه و تحلیل‌های ویدئویی مانند تشخیص پلاک و طبقه بندی اشیا (مانند نوع خودرو، رنگ، ساخت و مدل) نیز در طول سال‌ها با قابلیت تشخیص دقیق و انتقال داده‌های اساسی و نادیده گرفتن هر چیز غیر مرتبط با کار خاص مورد نظر، بسیار پیشرفته شده‌اند. این یعنی یادگیری ماشین.

محاسبات ابری چگونه احتمالات را گسترش می‌دهد؟

صنعت تجزیه و تحلیل ویدئو به یک اکوسیستم عظیم از ابزارهای حل مسئله تبدیل شده است. اما برای دستیابی به هوش پیش بینی بیشتر، بسیاری از این الگوریتم‌ها به مجموعه داده‌های بزرگ‌تر اطلاعات و قدرت پردازش بیشتر وابسته‌اند تا به سطح قابل قبولی از دقت برسند. این امر باعث شده است که بسیاری از مشاغل بدانند که قدرت محاسبات و مجموعه داده‌های موجود در لبه اصلی، هسته اصلی و کافی برای انجام کار نیستند. بنابراین، آنها به گزینه سوم برای عملیات تجزیه و تحلیل خود روی آورده‌اند: رایانش ابری. استفاده از سرویس رایانش ابری مزایای خاصی را به همراه دارد که نه لبه و نه هسته نمی‌توانند آن را فراهم کنند:

مقیاس پذیری عالی: استفاده از یک مدل رایانش ابری قدرت پردازش تقریباً نامحدودی را ارائه می‌دهد و به کاربران امکان می‌دهد به مجموعه‌ی عظیم داده‌ها و تصاویر برای آموزش الگوریتم‌های تجزیه و تحلیل ویدئو برای اهداف موردنظر دسترسی داشته باشند.
قابلیت انعطاف پذیری عالی. خدمات رایانش ابری یک راه حل الاستیک است. مشاغل فقط بر اساس نیاز از منابع ارائه دهنده استفاده می‌کنند. سرمایه گذاری ابتدایی پایین‌تر. مشاغل مجبور به خرید، نگهداری و به روز رسانی منابع سرور محلی نیستند، این امکان برای شرکت‌های با امکانات مالی کمتر امکان دسترسی به منابع سخت افزاری و نرم افزاری پیشرفته تقریباً نامحدود و بدون سرمایه گذاری هنگفت را فراهم می‌کند. آنها می‌توانند از تجزیه و تحلیل ویدیو به عنوان یک سرویس استفاده کنند و هزینه را به بودجه عملیاتی خود اختصاص دهند.

حرکت از مالکیت به سمت گشودن ابزارهای توسعه استاندارد علاوه بر دقت بیشتر، یکی از دلایل جذابیت تجزیه و تحلیل ویدیویی این است که بسیاری از الگوریتم‌های جدید سخت افزاری هستند.

در آغاز، تولیدکنندگان فقط اجازه دادند تجزیه و تحلیل‌های ایجاد شده توسط تیم توسعه نرم افزار داخلی خود آنها در دوربین‌های آنها جاسازی شود. با افزایش تقاضا برای راه حل‌های سفارشی، تولیدکنندگان کم کم محصولات خود را به روی توسعه دهندگان شخص ثالث باز کردند. اما، یک شرط اساسی وجود داشت. برای اجرای برنامه‌ها در آن دوربین‌ها، این توسعه دهندگان خارجی مجبور به استفاده از ابزار و بستر توسعه اختصاصی برنامه تولید کننده خود آنها شدند. با چند مورد معدود استثنا، این به طور کلی مفید بودن یک برنامه را برای خط تولید یک تولید کننده محدود می‌کند.
با افزایش اینترنت اشیا و بهترین نژاد و اکوسیستم‌های مختلط، این موقعیت دیگر پایدار نبود زیرا توانایی کاربران در رشد سیستم‌های خود را محدود می‌کرد. امروزه فشار زیادی برای ابزارهای توسعه متن باز مبتنی بر رابط‌های برنامه نویسی برنامه کاربردی استاندارد صنعت وجود دارد. هدف ایجاد یک چارچوب توسعه مشترک است که بتواند از تجزیه و تحلیل ویدئو در چندین رده پشتیبانی کند. به عبارت دیگر، هر نرم افزار تحلیلی که در این چارچوب نوشته شده باشد، با دستگاه‌های edge، سرورهای پیش فرض یا رایانش ابری قابلیت تعامل دارد. دلیل دیگر استفاده از این رویکرد منبع باز این است که توسعه دهندگان می‌توانند به کتابخانه وسیعی از نرم افزار یادگیری ماشین و دید رایانه‌ای ثابت شده دسترسی داشته باشند که بر اساس آن می‌توانند کد منبع خود را بسازند.

این امر سرعت توسعه نرم افزار و ایجاد نوآوری را به طرز چشمگیری تسریع می‌کند، که باعث می‌شود ارزش دوربین‌های همه تولید کنندگان افزایش یابد.

انتقال از تجزیه و تحلیل ویدیو از امنیت به فعالیت‌های تجاری با گذشت زمان، بسیاری از تجزیه و تحلیل‌های ویدئویی ایجاد شده برای نظارت و امنیت، به فعالیت‌های تجاری، به ویژه خرده فروشی و مراقبت‌های بهداشتی راه پیدا کرده‌اند. به‌عنوان مثال، تجزیه و تحلیل‌های کم اهمیت در فروشگاه‌ها برای شناسایی احتمالی سرقت در مغازه یا نیاز مشتری به کمک کارکنان خدمات استفاده می‌شود. در حقیقت، برخی از خرده فروشان در حال اتصال تجزیه و تحلیل ویدیو در سیستم‌های صوتی هوشمند هستند تا پیامی را به مشتری مبنی بر اینکه کمک در راه است ارسال کنند.

ثابت شده است که این یک بازدارنده‌ی بزرگ در برابر سرقت و از دست رفتن فرصت‌های فروش است. در مراقبت‌های بهداشتی، برخی از بیمارستان‌ها از تجزیه و تحلیل تشخیص خطی برای ایجاد هشدار در زمانی استفاده می‌کنند که بیماران سرگردان‌اند یا تلاش برای خارج شدن از رختخواب بدون استفاده از کمک دارند. بعضی از بیمارستان‌ها در حال تقویت تجزیه و تحلیل ویدیویی خود با تجزیه و تحلیل صوتی (مانند پرخاشگری و شناسایی گلوله) و سیستم آدرس عمومی برای کاهش خشونت در محیط کار هستند. نرم افزار تشخیص چهره در حال اصلاح است تا ببیند آیا افراد ماسک زده‌اند تا از رعایت پروتکل‌های ایمنی و بهداشت اطمینان حاصل کنند. هنگام دستیابی به ظرفیت تعیین شده توسط کدهای فعلی شهرداری، تجزیه و تحلیل سکونت برای مدیریت هشدار استفاده می‌شود. و بسیاری از نوآوری‌های دیگر در دست ساخت است.
ایجاد یک راه حل چند مرحله‌ای برای تجزیه و تحلیل ویدئو، از زمان تشخیص ساده تغییر پیکسل، تجزیه و تحلیل ویدیو مسیری طولانی را طی کرده است. توسعه دهندگان نرم افزار آنها را به عنوان راه حل‌های چند لایه طراحی می‌کنند که می‌توانند در لبه، هسته و ابر قرار بگیرند، و به کاربران قابلیت این انعطاف را می‌دهد تا تجزیه و تحلیل خود را در هر کجا که مناسب‌تر و مقرون به صرفه باشد، مستقر و مدیریت کنند. آنها از ابزارهای منبع باز برای ساخت این برنامه‌ها به عنوان سخت افزار استفاده می‌کنند و به کاربران این آزادی را می‌دهند تا بهترین گزینه برای نصب خود را انتخاب کنند.
با پیشرفت، توسعه دهندگان برنامه‌ها به تلاش برای تجزیه و تحلیل ادامه می‌دهند تا بتوانند تفاوت‌های ظریف در رفتار و محیط را شناسایی و ارزیابی کنند. این هدف با بهره گیری از میراث پیشینیان آنها و استفاده از قدرت هوش مصنوعی و یادگیری ماشین محقق خواهد شد. این امر منجر به عملکردهای دقیق و پیش بینی کننده تری می‌شود که می‌تواند به مشتریان کمک کند تا از پس چالش‌های روزمره‌ای که در عملیات امنیتی و تجاری خود با آن‌ها روبرو هستند.