در این مقاله، روش طبقه بندی تصاویر خشونت آمیز وب را ارائه می کنیم. این موضوع بسیار مهم است زیرا کاربرد بسیاری در زمینه های مختلف مثل فیلتر کردن وب سایت های خشونت آمیز دارد. ما پیشنهاد ترکیب تکنیک های تحلیل تصویر و داده کاوی را می دهیم تا خصوصیات سطح پایینی که از رنگ های تصاویر استخراج شده را به خصوصیات خشن بالاتر موجود در تصویر مرتبط کنیم. مقایسه ای نیز روی تکنیک های مختلف داده کاوی خواهیم داشت تا بتوانیم تصاویر خشن وب را دسته بندی کنیم. همچنین، توضیح می دهیم که ترکیب روش های یادگیری چگونه روی دقت کار تأثیر می گذارد. نتایج ما نشان می دهد که این روش می تواند محتوای خشن را به طور کارایی تشخیص دهد.
شبکه گسترده جهانی (WWW) روی همه جنبه های جامعه شامل تجارت، علوم، سیاست و دولت، روابط فردی و سلامتی تأثیر زیادی داشته است. با این حال، وب روند نزولی داشته است. در حین گشت و گذار در اینترنت دسترسی به محتوای نزاعی مثل محتواهای خشونت آمیز آسان است. در واقع، کودکان در معرض شدید خشونت در اینترنت هستند؛ از سایت های کم عمق با حالت های بیرحمانه گرفته تا نمایش های مزاحمت آمیز شکنجه و آزار. امروزه کودکان و نوجوانان می توانند موزیک های خشن و ویدئو کلیپ ها و تصاویر خشن را با یک کلیک ماوس از اینترنت دانلود کنند. افراد جوان نیز از وب برای سیاحت استفاده می کنند و خلاقیت خود را به روش های مختلفی با ساختن فیلم ها، موزیک، وب سایت و بلاگ ها یا خاطرات آنلاین نشان می دهند.
کار اولیه ما یک سیستم فیلتر و شناسایی محتوای خشن وب به نام WebAngels filter را پیشنهاد می دهد که از تحلیل های ساختاری و زمینه ای استفاده می کند. ابزار ارزیابی ما کارایی روش را برای شناسایی و فیلتر صفحات خشن وب نشان می دهد. با این وجود WebAngels filter با مشکلاتی در طبقه بندی سایت های خشن که فقط دارای محتوای خشن گرافیکی هستند مواجه است. در این مقاله، این مسئله را بررسی کرده و یک روش جدید طبقه بندی تصاویر خشن پیشنهاد می دهیم. ما روی استفاده از توصیف کننده های رنگ و ترکیب طبقه بندها تمرکز می کنیم تا دقت طبقه بندی تصاویر خشن وب را بهبود بخشیم.
ادامه مقاله به این ترتیب سازماندهی شده است: در بخش 2 مروری روی کارهای انجام شده داریم. روش پیشنهادی برای طبقه بندی تصاویر خشن وب در بخش 3 ارائه می شود. نتایج ارزیابی و مقایسه ها در بخش 4 بحث می شود.