جمعه ۲ اسفند ۱۳۹۸ - ۱۵:۵۶
سنتز گفتار انسان به کمک فناوری‌های روز

کتاب «سنتز گفتار»، با معرفی اپلیکیشن‌‌های کاربردی تولید مصنوعی گفتار انسان، کاربردها و مکانیسم کارکرد آن‌ها را برای پژوهشگران و علاقه‌مندان این فناوری‌ها توضیح می‌دهد.

به گزارش خبرگزاری کتاب ایران(ایبنا)، سنتز گفتار، تولید مصنوعی گفتار انسان است و به فناوری‌‌ای اطلاق می‌شود که به کمک آن واحدهای گفتار به گفتار تبدیل می‌شوند. هدف از سنتز گفتار، پیاده‌سازی سامانه‌ای است که واحدهای گفتار را دریافت کرده و گفتار متناظر را تولید کند. سیستم کامپیوتری که برای تولید این آواهای مصنوعی به‌کار می‌رود، سنتزکننده گفتار نامیده می‌شود. امروزه یکی از وظایف اصلی آواشناسان، مهندسان علوم گفتاری و پژوهشگرانی که علاقه‌مند به فعالیت در حوزه گفتار هستند، تسلط بر نرم‌افزارهای ساخت محرک‌های مصنوعیِ گفتار یا همان سنتزکننده‌های گفتار است. پیشرفت‌های علمی و تکنولوژیکی، ساخت کامپیوترهای جدید، تولید نرم‌افزارهای کامپیوتری به همراه درکی مناسب از ویژگی‌های آکوستیکی آواها، شرایط کنترل صحیح محرک‌ها را به‌گونه‌ای فراهم کرده که یافته‌های تجربی، قابلیت هماهنگی با نتایج نظری را به‌دست آورده‌اند.
 
کتاب «سنتز گفتار؛ مروری بر اپلیکیشن KlattWorks و نرم‌افزارهای جانبی» نوشته باب مک‌مورای با ترجمه شیرین‌زهرا همت‌نیا و ماندانا نوربخش به‌تازگی راهی بازار نشر شده است. این کتاب در 20 فصل مخاطب را با این اپلیکیشن کاربردی سنتز گفتار آشنا و در ادامه امکانات و مکانیسم‌های آن‌را توضیح می‌دهد. معرفی دیگر اپلیکیشن‌های کاربردی همچون IPOX و طرح و بررسی برخی از مشکلات و سوالات رایج در این حوزه از دیگر مباحث اثر حاضر است. ارائه یک پیوست کاربردی و دو واژه‌نامه انگلیسی به فارسی و فارسی به انگلیسی، از دیگر ویژگی‌های این کتاب محسوب می‌شود.
 

طبیعی و قابل درک بودن، ویژگی‌ مهم محرک‌های سنتز گفتار
نویسنده این کتاب معتقد است یکی از مهم‌ترین مسائل مطرح در مورد سنتزکننده‌های گفتار این است که محرک‌های تولید شده توسط آن‌ها باید «طبیعی» و «قابل درک» باشند. در تشریح این موضوع در کتاب آمده است: «منظور از «طبیعی» آن است که آوای تولید شده به صدای انسان شبیه بوده و حالت ماشینی و ساختگیِ کمتری داشته باشد و هدف از «قابل درک» سهولت در تشخیص و درک آوای تولید شده است. یک سیستم سنتزکننده گفتار ایده‌آل، باید هر دو ویژگی را دربر داشته باشد. پیشگامان ساخت نرم‌افزارهای سنتزکننده گفتار، از یک‌سو با برقراری ارتباط میان آواهای طبیعی، علوم ریاضی و علوم رایانه‌ای و از سوی دیگر با طراحی، تولید و ارتقای سطح نرم‌افزارهای کنونی، تلاش نموده‌اند به این فناوری برتر دست یابند. با این‌حال، هریک از نرم‌افزارهای طراحی شده با وجود داشتن برخی محاسن، کاستی‌هایی را نیز دربرداشته است. در این میان، KlattWorks نه در جایگاه یک موتور سنتزکننده مطرح می‌باشد و نه به‌عنوان اپلیکیشنی جدید برای آنالیز سازه، بلکه یک نرم‌افزار مدیریت پارامتر است که با همراهی دیگر اپلیکیشن‌ها، قابلیت‌های بی‌نظیری را به‌دست آورده است.»
 
آشنایی با اپلیکیشن IPOX
« IPOX یک موتور تبدیل واج به گفتار است که توسط آزمایشگاه آواشناسی و موسسه تحقیقات درکی دانشگاه آکسفورد تهیه شده است. این نرم‌افزار از سنتزکننده Klatt برای تولید کلمات انگلیسی بریتانیایی استفاده می‌کند. نکته حائز اهمیت این است که این نرم‌افزار، گام‌های میانی سنتز را ذخیره کرده و برای کاربر این امکان را فراهم می‌کند که پارامترهای اساسی را تنها از طریق واج‌ها تنظیم کند که به‌عنوان پایه در سنتز بسیار مفید خواهد بود.»


تولید پیوستارِ گفتار
«از دهه 1950 پیوستارهایی که با استفاده از سنتز گفتار تولید می‌شود، ابزاری کارآمد در مطالعات درک گفتار بوده است. به این ترتیب پژوهشگران توانستند با ثابت نگه داشتن بسیاری از متغیرها، تنها یک یا چند فاکتور را در گام‌های کوچک و به‌طور سیستماتیک تغییر دهند. از سوی دیگر، اپلیکیشن KlattWorks به منظور تسهیل نمودن ساخت پیوستارِ گفتار تهیه شده است. درحالی‌که تسهیلاتی مانند ساخت اسکریپت، به تولید پیوستار به‌صورت دستی کمک می‌کند، وجود یک مولد پیوستار در این نرم‌افزار، میزان تلاش برای ساخت محرک‌ها به‌صورت دستی را کاهش می‌دهد.»
 
نخستین چاپ کتاب «سنتز گفتار؛ مروری بر اپلیکیشن KlattWorks و نرم‌افزارهای جانبی» در 139 صفحه با شمارگان یک‌هزار نسخه به بهای 30 هزار تومان از سوی انتشارات سیاهرود به بازار نشر عرضه شده است.

نظر شما

شما در حال پاسخ به نظر «» هستید.

برگزیده

پربازدیدترین

تازه‌ها