امروزه اینترنت، اشتراکگذاری انواع اطلاعات را برای همگان آسان کرده است. با این حال، محتوای خشن در وب تأثیر زیانآوری روی کسانی که قدرت قضاوت درست را ندارند مخصوصاً نوجوانان میگذارد. این مقاله، روشی را برای تشخیص خشونت در ویدئو ارائه میکند، این روش تحلیل ویژگی آرام تبعیضانه (D-SFA) را معرفی میکند تا یادگیری توابع ویژگی آرام از انبوه صحنهها در ویدئو انجام گیرد.
پس از آن با توابع ویژگی آرام یادگیری شده، ویژگیهای بدست آمدهی انباشتهی مربعی شکل (ASD) برای ارائهی ویدئو استخراج میشوند. در نهایت، یک ماشین برداری پشتیبان خطی (SVM) برای طبقهبندی آموزش میبیند. ما همچنین یک دیتاست ویدئوی خشن (VV) با ٢٠٠ نمونهی خشونتآمیز و ٢٠٠ نمونهی بدون خشونت جمعآوری شده از اینترنت و فیلمها ساختهایم. نتایج تجربی روی دیتاست جدید، کارایی روش پیشنهادی را نشان میدهد.
با رشد سریع وبسایتهای شبکه اجتماعی مثل فیسبوک، توئیتر و یوتیوب، ویدئوهای زیادی هر روز آپلود میشود. همانطور که ما از اطلاعات مفید این سایتها لذت میبریم، برخی ویدئوهای حاوی خشونت نیز توسط کاربران قابل دسترسی هستند. در افرادی که قدرت قضاوت صحیح ندارند مثل کودکان و نوجوانانی که در معرض این محتوا هستند ممکن است منجر به رفتارهای خشونت آمیز شود یا حتی آثار جرم در آنها با تقلید از آنچه در این فیلمها دیدهاند آشکار شود. بنابراین واضح است که نیاز به محافظت از چنین گروههای حساس جامعه با استفاده از تشخیص دهندههای اتوماتیک، کارا و مؤثر امری ضروری است. با وجود اینکه تشخیص خشونت موضوع داغی در بینایی کامپیوتر نیست اما امری بسیار مهم است. برخی روشها تاکنون برای حل این مسئله پیشنهاد شده است. در [١] نویسندگان از هشت ویژگی رادیویی در زمینهی زمان و فرکانس به عنوان ورودی دستهبندی کنندهی باینری استفاده کردهاند که محتوای ویدئو را با توجه به میزان خشونت در آن اندازه شناسایی میکند. سپس آنها کار خود را با استفاده از شبکههای بیزین به مسئلهی طبقهبندی چند کلاسه تعمیم دادهاند.