تشخیص عبارت گفته شده در زبان پرس و جوی

  • عنوان انگلیسی مقاله: Query-by-Example Spoken Term Detection For OOV Terms
  • عنوان فارسی مقاله: تشخیص عبارت گفته شده در زبان پرس و جوی Query-by-Example برای عبارات OOV
  • دسته: زبانشناسی - علوم اجتماعی - روانشناسی
  • فرمت فایل ترجمه شده: WORD (قابل ویرایش)
  • تعداد صفحات فایل ترجمه شده: 15
  • دانلود رایگان نسخه اصلی مقاله

چکیده ترجمه

هدف تکنولوژی تشخیص عبارت گفته شده(STD) این بوده که بتوانیم واژگانی را در مجموعه بزرگی از محتوای گفتاری، مورد جستجو قرار دهیم. در این مقاله، ما مواردی را مطرح خواهیم کرد که در آن عبارات مد نظر جستجو(پرس و جوها)، مثال هایی صوتی هستند. این مورد، یا به وسیله تشخیص بخش مد نظر در جریان صوتی صورت خواهد گرفت و یا به وسیله گفتن عبارت پرس و جو. معمولا پرس و جوها مرتبط با شاخص های نام گذاری شده و کلمات خارجی هستند، که عموما پوشش ضعیفی در واژگان مربوط به سیستم های تشخیص گفتار پیوسته واژگان بزرگ(LVCSR) دارند. در تمامی این مقاله، ما بر روی جستجوی Query-By-Example برای چنین عباراتی که فاقد واژگان هستند(OOV) متمرکز خواهیم شد.

ما یک مبدل وضعیت محدود(FST) را بر مبنای سیستم شاخص گذری و جستجو ایجاد خواهیم کرد[1] تا مسئله جستجوی Query-By-Example را برای عبارات OOV و به صورت ارائه هر دوی پرس و جو و شاخص به عنوان شبکه های آوایی از خروجی یک سیستم LVCSR حل شود. ما نتایجی را که متفاوت از مکانیسم های ارائه و تولید است هم برای پرس و جو و هم شاخص هایی که با یک واژه ایجاد شده است، ارائه خواهیم داد. همچنین متدی دو مرحله ای را ارائه خواهیم داد که از جستجوی Query-by-Example و با استفاده از بهترین واژگان تشخیص داده شده استفاده کرده و اثبات خواهد کرد که این روش می توان کارائی قابل ملاحظه ای را داشته باشد که مقدار آن به وسیله مقدار وزن دهی شده عبارت واقعی(ATWV)، به میزان 0.479 در مقایسه با مقدار 0.325 که از تلفظ رفرنس برای OOV ها استفاده کرده است، اندازه گیری شده است. بهبودی های بیشتری را نیز می توان به وسیله روش دو گذره(دو مرحله ای) و فیلترینگ با استفاده از شمارش های مورد انتظار از سیستم فرهنگ لغت LVCSR بدست آورد.

اطلاعات فایل

  • فرمت: zip
  • حجم: 0.46 مگابایت
  • شماره ثبت: 411

پرداخت قیمت و دریافت فایل

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.