یادگیری ماشین (MACHINE LEARNING) و هوش مصنوعی
وقتی برای اولین بار دوربینهای IP وارد بازار شدند، فقط دستگاههایی برای فیلم برداری بودند و پردازش سیستم به عهده سرور مدیریت تصاویر بود. در طی سالهای بعد شرکتهای تولید کننده دوربین مداربسته به فکر تولید دوربینهایی با CPU مناسب جهت Edge Processing افتادند. با افزایش قدرت محاسباتی، این فرصت برای شرکتها فراهم شد تا تجزیه و تحلیلهای پیشرفتهتری را در دوربین تعبیه کنند و از فناوری یادگیری ماشین (MACHINE LEARNING) و هوش مصنوعی استفاده نمایند.
چندین مزیت برای جذاب تر کردن تجزیه و تحلیل مبتنی بر لبه را وجود داشت:
مصرف پهنای باند کمتر: به جای پخش هر فریم از فیلم خام برای سرور جهت تجزیه و تحلیل، دوربین مداربسته میتواند تصاویر را از قبل پردازش کند و فقط اندازهی رویداد را ارسال کند.
نیازهای ذخیره سازی پایینتر: فقط با ارسال فیلمی از محتوا به سرور، تصاویر کمتری برای بایگانی در آرایه ذخیره سازی وجود دارد.
هزینههای عملیاتی کمتر: پردازش محرمانهی ویدئو نسبت به انحصار چرخه پردازنده در سرور هزینه کمتری داشت. اولین الگوریتمهای وارد شده به دوربین مداربسته بر اساس تغییرات پیکسل در میدان دید بود. وقتی تغییرات به آستانه خاصی رسیدند، تجزیه و تحلیل اتفاق می افتاد و تصویر حرکت شناسایی شده را به سرور میفرستاد. بر اساس مفهوم آستانه پیکسل، تجزیه و تحلیلهای محرمانه مانند دست کاری دوربین و تشخیص خط مقطعی به دنبال آن ممکن ممکن شد.
یادگیری ماشین چگونه بر پیشرفت ویدئو تأثیر می گذارد؟
در سال ۲۰۲۰ تولیدکنندگان در حال ساخت دوربینهای مداربستهای هستند که واحدهای پردازش یادگیری عمیق (DLPU) در آنها تعبیه شدهاند، و به توسعه دهندگان نرم افزار امکان میدهد هوش هنری (AI) را در الگوریتمهای تجزیه و تحلیل ویدیویی خود ادغام کنند. این امیدهای جدیدی را ایجاد کرده است که یادگیری ماشین و یادگیری عمیق راه حل فوق العاده ای خواهد بود که صنعت امنیت مدتهاست وعدهی آن را داده است. با این حال، با توجه به تغییرات محیط نظارت تصویری، تحقق این وعده هنوز راهی طولانی در پیش دارد. این بدان دلیل است که یادگیری ماشین میتواند مقدار زیادی از منابع را قبل از دستیابی به یک نتیجه دقیق و ثابت مصرف کند. ما از مثال تشخیص چهره استفاده خواهیم کرد. اگر میخواستید اپلیکیشن را با استفاده از هوش مصنوعی ایجاد کنید، برای آموزش برنامه جهت طبقه بندی یک تصویر به عنوان یک چهره، به یک فرایند تکراری احتیاج دارید. این به معنای جمع آوری و برچسب زدن هزاران تصویر از چهره و وارد کردن آنها در اپلیکیشن است، سپس آزمایش اپلیکیشن بعد از هر چرخه ورودی تا زمانی که تعیین کنید که برنامه به اندازه کافی در مورد ویژگیهای یک چهره آموخته است. در آن مرحله، مدل آموزش دیده به یک برنامه تمام شده تبدیل میشود. اما بعد از آن، هوش مصنوعی چیز جدیدی یاد نمیگیرد.
بیشتر بخوانید: چرا باید لینوکس را یاد بگیریم؟
اکنون چالش های تشخیص چهره را از منظر دوربین مداربسته در نظر بگیرید
نه تنها شما باید برنامه را برای تشخیص چهره کامل از جلو آموزش دهید، بلکه تصاویر گرفته شده از چند زاویه، تصاویر در سایه و نور خورشید و شرایط متغیر آب و هوایی، تصاویر با موهای صورت، کلاه، عینک، خال کوبی و سایر تفاوتهای متمایز را نیز باید آموزش دهید. و اگر اپلیکیشن با تصویری تازه روبرو شود که هیچ نقطه دادهای برای آن وجود ندارد، میتواند به آن مراجعه کند، ممکن است در تشخیص تصویر به عنوان صورت ناموفق باشد. این بدان معنا نیست که از همان ابتدای تجزیه و تحلیل ویدیو، گامهای قابل توجهی برداشته شده است. به عنوان مثال، تشخیص حرکت ویدئو را در نظر بگیرید. ما با تشخیص تغییرات pixel در صحنه فاصله زیادی داشتیم. امروزه تجزیه و تحلیل تشخیص حرکت برای شناسایی الگوها طراحی شده است. آنها میتوانند دادههای غیر ضروری مانند سایهها، عبور اشیا مانند ماشین و شاخهها، درخشش از یک چراغ جلو، حتی پرندگان را فیلتر کنند – که منجر به کاهش قابل توجه هشدارهای مثبت کاذب میشود. سایر تجزیه و تحلیلهای ویدئویی مانند تشخیص پلاک و طبقه بندی اشیا (مانند نوع خودرو، رنگ، ساخت و مدل) نیز در طول سالها با قابلیت تشخیص دقیق و انتقال دادههای اساسی و نادیده گرفتن هر چیز غیر مرتبط با کار خاص مورد نظر، بسیار پیشرفته شدهاند. این یعنی یادگیری ماشین.
محاسبات ابری چگونه احتمالات را گسترش میدهد؟
صنعت تجزیه و تحلیل ویدئو به یک اکوسیستم عظیم از ابزارهای حل مسئله تبدیل شده است. اما برای دستیابی به هوش پیش بینی بیشتر، بسیاری از این الگوریتمها به مجموعه دادههای بزرگتر اطلاعات و قدرت پردازش بیشتر وابستهاند تا به سطح قابل قبولی از دقت برسند. این امر باعث شده است که بسیاری از مشاغل بدانند که قدرت محاسبات و مجموعه دادههای موجود در لبه اصلی، هسته اصلی و کافی برای انجام کار نیستند. بنابراین، آنها به گزینه سوم برای عملیات تجزیه و تحلیل خود روی آوردهاند: رایانش ابری. استفاده از سرویس رایانش ابری مزایای خاصی را به همراه دارد که نه لبه و نه هسته نمیتوانند آن را فراهم کنند:
مقیاس پذیری عالی: استفاده از یک مدل رایانش ابری قدرت پردازش تقریباً نامحدودی را ارائه میدهد و به کاربران امکان میدهد به مجموعهی عظیم دادهها و تصاویر برای آموزش الگوریتمهای تجزیه و تحلیل ویدئو برای اهداف موردنظر دسترسی داشته باشند.
قابلیت انعطاف پذیری عالی. خدمات رایانش ابری یک راه حل الاستیک است. مشاغل فقط بر اساس نیاز از منابع ارائه دهنده استفاده میکنند. سرمایه گذاری ابتدایی پایینتر. مشاغل مجبور به خرید، نگهداری و به روز رسانی منابع سرور محلی نیستند، این امکان برای شرکتهای با امکانات مالی کمتر امکان دسترسی به منابع سخت افزاری و نرم افزاری پیشرفته تقریباً نامحدود و بدون سرمایه گذاری هنگفت را فراهم میکند. آنها میتوانند از تجزیه و تحلیل ویدیو به عنوان یک سرویس استفاده کنند و هزینه را به بودجه عملیاتی خود اختصاص دهند.
حرکت از مالکیت به سمت گشودن ابزارهای توسعه استاندارد علاوه بر دقت بیشتر، یکی از دلایل جذابیت تجزیه و تحلیل ویدیویی این است که بسیاری از الگوریتمهای جدید سخت افزاری هستند.
در آغاز، تولیدکنندگان فقط اجازه دادند تجزیه و تحلیلهای ایجاد شده توسط تیم توسعه نرم افزار داخلی خود آنها در دوربینهای آنها جاسازی شود. با افزایش تقاضا برای راه حلهای سفارشی، تولیدکنندگان کم کم محصولات خود را به روی توسعه دهندگان شخص ثالث باز کردند. اما، یک شرط اساسی وجود داشت. برای اجرای برنامهها در آن دوربینها، این توسعه دهندگان خارجی مجبور به استفاده از ابزار و بستر توسعه اختصاصی برنامه تولید کننده خود آنها شدند. با چند مورد معدود استثنا، این به طور کلی مفید بودن یک برنامه را برای خط تولید یک تولید کننده محدود میکند.
با افزایش اینترنت اشیا و بهترین نژاد و اکوسیستمهای مختلط، این موقعیت دیگر پایدار نبود زیرا توانایی کاربران در رشد سیستمهای خود را محدود میکرد. امروزه فشار زیادی برای ابزارهای توسعه متن باز مبتنی بر رابطهای برنامه نویسی برنامه کاربردی استاندارد صنعت وجود دارد. هدف ایجاد یک چارچوب توسعه مشترک است که بتواند از تجزیه و تحلیل ویدئو در چندین رده پشتیبانی کند. به عبارت دیگر، هر نرم افزار تحلیلی که در این چارچوب نوشته شده باشد، با دستگاههای edge، سرورهای پیش فرض یا رایانش ابری قابلیت تعامل دارد. دلیل دیگر استفاده از این رویکرد منبع باز این است که توسعه دهندگان میتوانند به کتابخانه وسیعی از نرم افزار یادگیری ماشین و دید رایانهای ثابت شده دسترسی داشته باشند که بر اساس آن میتوانند کد منبع خود را بسازند.
این امر سرعت توسعه نرم افزار و ایجاد نوآوری را به طرز چشمگیری تسریع میکند، که باعث میشود ارزش دوربینهای همه تولید کنندگان افزایش یابد.
انتقال از تجزیه و تحلیل ویدیو از امنیت به فعالیتهای تجاری با گذشت زمان، بسیاری از تجزیه و تحلیلهای ویدئویی ایجاد شده برای نظارت و امنیت، به فعالیتهای تجاری، به ویژه خرده فروشی و مراقبتهای بهداشتی راه پیدا کردهاند. بهعنوان مثال، تجزیه و تحلیلهای کم اهمیت در فروشگاهها برای شناسایی احتمالی سرقت در مغازه یا نیاز مشتری به کمک کارکنان خدمات استفاده میشود. در حقیقت، برخی از خرده فروشان در حال اتصال تجزیه و تحلیل ویدیو در سیستمهای صوتی هوشمند هستند تا پیامی را به مشتری مبنی بر اینکه کمک در راه است ارسال کنند.
ثابت شده است که این یک بازدارندهی بزرگ در برابر سرقت و از دست رفتن فرصتهای فروش است. در مراقبتهای بهداشتی، برخی از بیمارستانها از تجزیه و تحلیل تشخیص خطی برای ایجاد هشدار در زمانی استفاده میکنند که بیماران سرگرداناند یا تلاش برای خارج شدن از رختخواب بدون استفاده از کمک دارند. بعضی از بیمارستانها در حال تقویت تجزیه و تحلیل ویدیویی خود با تجزیه و تحلیل صوتی (مانند پرخاشگری و شناسایی گلوله) و سیستم آدرس عمومی برای کاهش خشونت در محیط کار هستند. نرم افزار تشخیص چهره در حال اصلاح است تا ببیند آیا افراد ماسک زدهاند تا از رعایت پروتکلهای ایمنی و بهداشت اطمینان حاصل کنند. هنگام دستیابی به ظرفیت تعیین شده توسط کدهای فعلی شهرداری، تجزیه و تحلیل سکونت برای مدیریت هشدار استفاده میشود. و بسیاری از نوآوریهای دیگر در دست ساخت است.
ایجاد یک راه حل چند مرحلهای برای تجزیه و تحلیل ویدئو، از زمان تشخیص ساده تغییر پیکسل، تجزیه و تحلیل ویدیو مسیری طولانی را طی کرده است. توسعه دهندگان نرم افزار آنها را به عنوان راه حلهای چند لایه طراحی میکنند که میتوانند در لبه، هسته و ابر قرار بگیرند، و به کاربران قابلیت این انعطاف را میدهد تا تجزیه و تحلیل خود را در هر کجا که مناسبتر و مقرون به صرفه باشد، مستقر و مدیریت کنند. آنها از ابزارهای منبع باز برای ساخت این برنامهها به عنوان سخت افزار استفاده میکنند و به کاربران این آزادی را میدهند تا بهترین گزینه برای نصب خود را انتخاب کنند.
با پیشرفت، توسعه دهندگان برنامهها به تلاش برای تجزیه و تحلیل ادامه میدهند تا بتوانند تفاوتهای ظریف در رفتار و محیط را شناسایی و ارزیابی کنند. این هدف با بهره گیری از میراث پیشینیان آنها و استفاده از قدرت هوش مصنوعی و یادگیری ماشین محقق خواهد شد. این امر منجر به عملکردهای دقیق و پیش بینی کننده تری میشود که میتواند به مشتریان کمک کند تا از پس چالشهای روزمرهای که در عملیات امنیتی و تجاری خود با آنها روبرو هستند.