شنبه ۲۹ فروردین ۱۳۸۸ - ۱۲:۰۵
زبان‌شناسان به یاری مهندسان بیایند

حسين صامتی در سخنرانی خود در حوزه هوش مصنوعی (همایش آواشناسی و واج‌شناسی -- پنجشنبه ۲۷ فروردین -- بنیاد ایران‌شناسی) گفت: کار در زمينه هوش مصنوعي زياد و پيچيده است و در طول کار همواره با مشکلاتي روبرو مي‌شويم که لازم است زبانشناسان به کمک ما بيايند و مشکلات ما را در حوزه زبان حل کنند.

به گزارش خبرگزاری کتاب ايران (ايبنا)، صامتي، عضو هيات علمي دانشگاه صنعتي شريف، در این همایش درباره «مسايل آوايي زبان فارسي در پردازش رايانه‌اي گفتار» به سخنراني پرداخت.

او كاربردهاي پردازش گفتار را برشمرد:
تبديل متن به گفتار(متن نوشته شده به صوت تبديل می‌شود)،‌ فشرده‌سازي گفتار، بهسازي گفتار، ‌تشخيص گوينده، تاييد گوينده، ‌تبديل گفتار و خلاصه‌سازي گفتار. 

سخنراني او، به «تبديل متن به گفتار» و «تبديل گفتار به متن» محدود شده بود.

او ادامه داد: واحدهای ساختار گفتار عبارتند از: پاراگراف،‌ جمله، كلمه، هجا، دو واجي ، سه واجي و واج. اينكه كدام واحد آوايي را انتخاب مي‌كنيم بستگی به هدف دارد.

وي در اين‌باره آماري ارائه داد: تعداد واج‌هاي زبان فارسي به ۳۰ عدد مي‌رسد: ۹۰۰ دو واجي و ۲۷۰۰۰ سه واجی. ولي تا کنون از همه آنها استفاده نشده است. تعداد سه واجي‌هاي كاربردي بين ۱۲ تا ۱۵ هزار است و ۴۰۰ هجاي كاربردي نیز وجود دارد.

او ادامه داد: سنتز گفتار، همان تبديل متن به گفتار است. اين فرايند توسط يك ديكشنري با روش‌هاي قانونمند يا آماري انجام مي‌شود. در اين روش واحدهاي آوايي مختلف را ضبط و نگهداري مي كنيم که هنگام ساخته شدن، پشت سرهم پخش مي‌شود. با اين روش‌ها كل سير تكاملي انسان را مدل می‌كنند و با تنظيم پارامترهاي موردنظر می‌توانيم صداي واج مورد نياز را توليد كنيم.

صامتي تاکيد کرد: بازشناسي گفتار كار پيچيده‌اي است. پيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار عبارتند از : ميزان وابستگي يا استقلال گوينده، ‌پيوسته يا گسسته بودن گفتار، اندازه واژگان، ‌محدوديت‌هاي زباني و كارايي در حضور "نوفه"(همان "نویز" انگلیسی به معنای "سر و صدا").

وی سپس بازشناسي گفتار را از گذشته تا كنون در ۵ دهه اخير مرور كرد و مشكل اصلي اين فرايند را ابهام آكوستيكي و ميزان اشتباه بين كلمات دانست.

در پايان،‌ دو برنامه از برنامه‌هاي نرم افزاري تهيه شده توسط يکي از دانشجويان دکتري هوش مصنوعي معرفي شد.

ابتدا نرم‌افزار «ديکته گفتاري نويسا» به نمايش گذاشته شد. در اين نرم‌افزار که براي زبان معيار تهيه شده است، متن‌هاي خوانده شده از صفحات روزنامه، به کلمات تبديل، و تايپ می‌شوند.

نرم‌افزار ديگر، ‌«سيستم واژه ياب» بود. در اين برنامه تعدادي کلمات براي سيستم تعريف می‌شود که سیستم به آنها واکنش نشان می‌دهد. اين سيستم معمولا براي مسائل امنيتي استفاده مي‌شود که در آنها، برخي کلمات کليدي از حساسيت ويژه‌اي برخوردارند. 

عضو هيات علمي دانشگاه صنعتي شريف در پايان گفت: کار در زمينه هوش مصنوعي زياد و پيچيده است و در طول کار همواره با مشکلاتي روبرو مي‌شويم که لازم است زبانشناسان به کمک ما بيايند و مشکلات ما را در حوزه زبان حل کنند.

نظر شما

شما در حال پاسخ به نظر «» هستید.

برگزیده

پربازدیدترین

تازه‌ها

اخبار مرتبط