بهبود مدل کاربر در وبسایت به صورت خودکار با استفاده از معناشناسی با مفاهیم خاص دامنه

  • عنوان کامل: بهبود مدل کاربر در وبسایت به صورت خودکار با استفاده از معناشناسی با مفاهیم خاص دامنه
  • قیمت: 21,360 تومان

چکیده

گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار می­رود. برای مقابله با این مشکل، سیستم­های شخصی­سازی وب ارائه شده­اند که محتوا و سرویس­های یک وب­سایت را با افراد براساس علایق و رفتار گردشی آن­ها سازگار می­کنند. یک مولفه­ی اساسی در هر سیستم شخصی­سازی وب، مدل کاربر آن است. محتوای صفحات یک وب­سایت را می­توان به منظور ایجاد مدل دقیق­تری از کاربر مورد استفاده قرار داد، اما رویکردهای مبتنی بر کلمات کلیدی نگرش عمیقی از وب­سایت ندارند. اخیرا تحقیقاتی برای ترکیب کردن معنای موجود در وب­سایت در نمایش کاربران آن انجام شده است. تمامی این تلاش­ها یا از یک رده­بندی یا واژگان شناختی خاص و دست ساخته و یا از واژگان­شناختی­های عمومی مانند WordNet برای نگاشت مشاهده صفحات به عناصر معنایی استفاده می­کنند. با این وجود ساختن یک سلسله مراتب از مفاهیم به صورت دستی زمان­بر و هزینه­بر است. از سوی دیگر منابع معنایی لغوی عمومی از پوشش کم عبارات خاص دامنه رنج می­برند. در این پایان نامه ما قصد داریم که هر دوی این نقص­ها را برطرف کنیم. دستاورد اصلی ما این است که مکانیسمی برای بهبود نمایش کاربر در وب­سایت به صورت خودکار و با استفاده از یک منبع معنایی لغوی جامع معرفی می­کنیم. ما از Wikipedia، بزرگ­ترین دایره­المعارف امروزی به عنوان یک منبع غنی معنایی برای بهبود ساخت خودکار مدل برداری از علایق کاربر بهره­برداری می­کنیم. معماری ارائه شده شامل تعدادی مولفه است که عبارتند از: پیش پردازش اولیه، استخراج مفاهیم دامنه­ی وب سایت، استخراج کلمات کلیدی از وب­سایت، سازنده­ی بردار کلمات کلیدی و نگاشت کلمات کلیدی به مفاهیم. دستاورد مهم دیگر استفاده از ساختار وب سایت برای محدود کردن خودکار مفاهیم خاص دامنه می­باشد.

کلمات کلیدی

  • مدلسازی کاربر
  • کاوش Wikipedia
  • تکنیک­های معنایی
  • شخصی­ سازی وب

فهرست مطالب

فصل اول:مقدمه 1

1- مقدمه 2

1-1- دلایل نیاز به شخصیسازی وب 2

1-1-1- گرانبار شدن اطلاعات 2

1-1-2- نیاز به جذب مشتری پابرجای برای وبسایت 3

1-2- تعریف شخصیسازی وب 3

1-3- فواید سیستم شخصیسازی وب 3

1-4- تفاوت شخصیسازی وب با تطبیق طرح کلی سایت 3

1-5- طبقهبندی عملکردهای اصلی شخصیسازی وب 4

1-6- نیازمندیهای اصلی سیستم شخصیسازی وب 5

1-7- رویکرد های موجود در شخصی سازی وب 6

1-8- نقش وب کاوی کاربرد وب در شخصیسازی وب 7

1-9- نیاز به استفاده از محتوا در شخصیسازی وب 7

1-10- نیاز به استفاده از معنا در شخصیسازی وب 8

1-11- هدف پروژه 9

1-12- نحوهی گردآوری مراجع 9

1-13- رویکرد بکار رفته در تحقیق 10

1-14- ساختار پایان نامه 10

فصل دوم:مطالب پیش زمینه 11

2- مطالب پیش زمینه 12

مقدمه 12

2-1- شخصی سازی وب براساس وب کاوی کاربرد وب 12

2-1-1- آماده سازی و مدلسازی داده 14

2-1-1-1- منابع و انواع داده 15

2-1-1-1-1- داده های کاربرد 15

2-1-1-1-1-1- فرمت های ثبت 16

2-1-1-1-1-2- منابع داده های کاربرد 17

2-1-1-1-2- داده های محتوا 21

2-1-1-1-3- داده های ساختار 22

2-1-1-1-4- داده های کاربران 22

2-1-1-2- آماده سازی و پیش پردازش دادهها 23

2-1-1-2-1- پاکسازی داده ها 23

2-1-1-2-2- شناسایی کاربر 24

2-1-1-2-3- تشخیص مشاهده صفحه 26

2-1-1-2-4- تشخیص جلسه کاربر 26

2-1-1-2-5- تکمیل مسیر 27

2-1-1-2-6- تشخیص تراکنش 28

2-1-1-2-7- پیش پردازش نهایی داده های کاربرد 30

2-1-1-2-8- یکپارچه سازی داده ها از منابع گوناگون 31

2-1-2- کشف الگو از داده های کاربرد وب 32

2-1-2-1- سطوح و انواع تحلیل 32

2-1-2-2- وظایف داده کاوی بر روی داده های کاربرد وب 33

2-1-2-2-1- کاوش قواعد انجمنی 34

2-1-2-2-2- کشف الگوهای ترتیبی 35

2-1-2-2-3- خوشه بندی 40

2-1-3- استفاده از الگوهای کشف شده جهت شخصی سازی وب 43

2-1-4- زمینه های تحقیقاتی شخصی سازی وب 43

2-2- منابع معنایی لغوی 45

2-2-1- فرهنگ لغت 45

2-2-2- فرهنگ های جامع 45

2-2-3- واژگان شناختی و رده بندی 46

2-2-3-2- رده بندی 48

2-2-3-3- واژگان شناختی ها و رده بندی های موجود 49

2-2-3-3-1- واژگان شناختی های مربوط به یک دامنه خاص 49

2-2-3-3-2- واژگان شناختی های عمومی 49

2-2-3-3-2-1- CYC و OpenCYC 50

2-2-3-3-2-2- WordNet 50

2-2-3-3-2-3- دایرکتوری های وب 51

2-2-3-4- زبان های نمایش واژگان شناختی 52

2-2-4- فرهنگ های عمومی 53

2-2-4-1- Wikipedia 53

2-2-4-1-1- نقاط ضعف و قوت Wikipedia 54

2-2-4-1-2- ساختار Wikipedia 55

2-2-4-1-3- انواع اطلاعات معنایی لغوی در Wikipedia 56

فصل سوم:کارهای انجام شده در زمینه مدلسازی کاربر در شخصی سازی وب با استفاده از محتوای وب 58

3- کارهای انجام شده در زمینه مدلسازی کاربر در شخصی سازی وب با استفاده از محتوای وب 59

مقدمه 59

3-1- تکنیک های مورد استفاده 60

3-1-1- تکنیک tf-idf 60

3-1-2- تکنیک تحلیل معنایی پنهان 60

3-1-3- تکنیک های مربوط به محاسبه ارتباط معنایی دو کلمه 61

3-1-3-1- معیارهای ارتباط معنایی مهم در ساختارهای سلسله مراتبی 61

3-1-3-1-1- رویکردهای مبتنی بر مسیر 61

3-1-3-1-2- رویکردهای مبتنی بر محتوای اطلاعات 62

3-1-3-1-3- رویکردهای مبتنی بر همپوشانی متن 62

3-1-3-2- رویکردهای محاسبه ارتباط معنایی دو کلمه برای روابط غیر رابطه هست 63

3-1-3-3- کارهای انجام شده در مورد محاسبه ارتباط معنایی دو کلمه در Wikipedia 63

3-2- رویکردهای انجام شده در زمینه مدلسازی کاربر در وب سایت با استفاده از محتوای صفحات 64

3-2-1- رویکردهای بر مبنای کلمات کلیدی 65

3-2-2- رویکردهای معنایی 66

3-2-2-1- روش های آماری 66

3-2-2-2- روش های مبتنی بر سلسله مراتب 67

جمع بندی 72

فصل چهارم: 73

روش پیشنهادی 73

4- روش پیشنهادی 74

4- روش پیشنهادی 74

مقدمه 74

4-1- تعریف مساله 74

4-2- طراحی روش جدید 74

4-2-1- مولفه پیش پردازش اولیه ثبت 75

4-2-2- مولفه استخراج کلمات کلیدی از صفحات وب سایت 75

4-2-3- مولفه استخراج مفاهیم دامنه از وب سایت 78

4-2-4- مولفه سازنده بردار کلمات کلیدی 80

4-2-5- مولفه نگاشت 82

4-6- دیاگرام های UML قسمت های اصلی سیستم 84

4-7- بررسی تطابق طرح پیشنهادی با صورت مساله 85

جمع بندی 86

منایع 87

پرداخت قیمت و دریافت فایل

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.