حسين صامتی در سخنرانی خود در حوزه هوش مصنوعی (همایش آواشناسی و واجشناسی -- پنجشنبه ۲۷ فروردین -- بنیاد ایرانشناسی) گفت: کار در زمينه هوش مصنوعي زياد و پيچيده است و در طول کار همواره با مشکلاتي روبرو ميشويم که لازم است زبانشناسان به کمک ما بيايند و مشکلات ما را در حوزه زبان حل کنند.
او كاربردهاي پردازش گفتار را برشمرد:
تبديل متن به گفتار(متن نوشته شده به صوت تبديل میشود)، فشردهسازي گفتار، بهسازي گفتار، تشخيص گوينده، تاييد گوينده، تبديل گفتار و خلاصهسازي گفتار.
سخنراني او، به «تبديل متن به گفتار» و «تبديل گفتار به متن» محدود شده بود.
او ادامه داد: واحدهای ساختار گفتار عبارتند از: پاراگراف، جمله، كلمه، هجا، دو واجي ، سه واجي و واج. اينكه كدام واحد آوايي را انتخاب ميكنيم بستگی به هدف دارد.
وي در اينباره آماري ارائه داد: تعداد واجهاي زبان فارسي به ۳۰ عدد ميرسد: ۹۰۰ دو واجي و ۲۷۰۰۰ سه واجی. ولي تا کنون از همه آنها استفاده نشده است. تعداد سه واجيهاي كاربردي بين ۱۲ تا ۱۵ هزار است و ۴۰۰ هجاي كاربردي نیز وجود دارد.
او ادامه داد: سنتز گفتار، همان تبديل متن به گفتار است. اين فرايند توسط يك ديكشنري با روشهاي قانونمند يا آماري انجام ميشود. در اين روش واحدهاي آوايي مختلف را ضبط و نگهداري مي كنيم که هنگام ساخته شدن، پشت سرهم پخش ميشود. با اين روشها كل سير تكاملي انسان را مدل میكنند و با تنظيم پارامترهاي موردنظر میتوانيم صداي واج مورد نياز را توليد كنيم.
صامتي تاکيد کرد: بازشناسي گفتار كار پيچيدهاي است. پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار عبارتند از : ميزان وابستگي يا استقلال گوينده، پيوسته يا گسسته بودن گفتار، اندازه واژگان، محدوديتهاي زباني و كارايي در حضور "نوفه"(همان "نویز" انگلیسی به معنای "سر و صدا").
وی سپس بازشناسي گفتار را از گذشته تا كنون در ۵ دهه اخير مرور كرد و مشكل اصلي اين فرايند را ابهام آكوستيكي و ميزان اشتباه بين كلمات دانست.
در پايان، دو برنامه از برنامههاي نرم افزاري تهيه شده توسط يکي از دانشجويان دکتري هوش مصنوعي معرفي شد.
ابتدا نرمافزار «ديکته گفتاري نويسا» به نمايش گذاشته شد. در اين نرمافزار که براي زبان معيار تهيه شده است، متنهاي خوانده شده از صفحات روزنامه، به کلمات تبديل، و تايپ میشوند.
نرمافزار ديگر، «سيستم واژه ياب» بود. در اين برنامه تعدادي کلمات براي سيستم تعريف میشود که سیستم به آنها واکنش نشان میدهد. اين سيستم معمولا براي مسائل امنيتي استفاده ميشود که در آنها، برخي کلمات کليدي از حساسيت ويژهاي برخوردارند.
عضو هيات علمي دانشگاه صنعتي شريف در پايان گفت: کار در زمينه هوش مصنوعي زياد و پيچيده است و در طول کار همواره با مشکلاتي روبرو ميشويم که لازم است زبانشناسان به کمک ما بيايند و مشکلات ما را در حوزه زبان حل کنند.
نظر شما