محمدرضا فلاحتی فومنی، عضو هیأت علمی رسمی گروه پژوهشی زبانشناسی رایانهای مرکز منطقهای اطلاعرسانی علوم و فناوری شیراز است كه به عنوان مدیر اداره همکاریهای علمی و بینالمللی مرکز و دبیر مجله انگلیسی زبان International Journal of Information Science and Technology از انتشارات مرکز فعالیت كرده است. وی همچنين مدرس دانشگاه آزاد اسلامی بوده است.
به گزارش خبرگزاری کتاب ایران(ایبنا) فلاحتی فومنی سال 1352 در رشت متولد شد. پس از دریافت مدرک کارشناسی مترجمی زبان انگلیسی از دانشگاه آزاد اسلامی واحد رشت وارد مقطع کارشناسی ارشد زبانشناسی همگانی دانشگاه شیراز شد و در 1379 با رتبه ممتاز فارغالتحصیل گردید. وی از تابستان 1386 مامور به تحصيل براي دريافت مدرك دکتری زبانشناسی (گرایش زبانشناسی رایانهای) در دانشگاه میسور هندوستان است.
حاصل فعاليتهاي پژوهشی وی تا کنون 15 مقاله (به زبانهای فارسی و انگلیسی در مجلات داخلی و خارجی در خصوص ماشین ترجمه، معناشناسی، جامعهشناسی زبان و زبانشناسی رایانهای)، 7 کتاب و 5 طرح پژوهشی بوده است. از جمله ترجمه و تدوین كتاب «معناشناسی و بازیابی اطلاعات» با همكاري با همکاری دکتر جعفر مهراد و طرح «تهیه واژهنامه همنگاشت زبان فارسی» همکاری شاپوررضا برنجیان و «تجزیه و تحلیل چگونگی عملکرد موتور یک ماشین ترجمه مستقیم» اشاره نمود.
با فلاحتي فومني به بهانه انجام پاياننامه دكتري و فعاليتهايش در خصوص زبانشناسي رايانهاي به گفت و گو نشستهايم.
به اعتقاد او زبانشناسی رایانهای یا زبانشناسی محاسباتی، علمی میانرشتهای است که از تعامل بین علم زبانشناسی و علوم رایانهای، بهویژه هوش مصنوعی پدید آمده است. در حقیقت یکی از اهداف اساسی هوش مصنوعی مدلبندی رایانهای قوه ادراک انسان است و رسالت زبانشناسی نیز در کلیت خود شناخت قوه زبانی و تحلیل و توصیف نحوی، معنایی، آوایی و ... آن است. گاه پردازش زبان طبیعی نیز توسط برخی محققان هموزن زبانشناسی رایانهای به کاربرده میشود.
فلاحتي درباره زير شاخههاي اين رشته می گوید: در طی 62 سال گذشته تحقیقات چنان گسترده و متنوعی در این حیطه به عمل آمده که دیگر به گمانم نتوان آن را یک زیرشاخه به حساب آورد. در حقیقت این علم خود زیر شاخههای متعددی را شامل شده که از مهمترین آنها میتوان به دو زیرشاخه کلان نظری و کاربردی اشاره نمود.
بخش نظری آن از زبانشناسی نظری و علوم ادراکی به خصوص روانشناسی زبان و دانش رایانه بهره فراوان میبرد و میکوشد زبان را در چارچوب نظریههای زبانی و با بهرهگیری از علم رایانه، در قالب برنامههای نرمافزاری مختلف تحلیل و توصیف کند.
وی می افزاید: در بخش کاربردی نیز یکی از اهداف اساسی زبانشناسی رایانهای، ساخت ماشینهای ترجمه بوده است. در بخش کاربردی بیشتر به ابزارها، تکنیکها و روشهایی پرداخته میشود که مدلبندی زبان را میسر میسازد. این ابزارها و تکنیکها ذیل عناوینی چون مهندسی زبان و فناوری زبان گرد هم میآیند.
این پژوهشگر می گوید: اعتقاد من بر این است که حیطههای میانرشتهای در مقايسه با رشتههای محض همواره از جذابیت بیشتری برخوردار بودهاند که دلیل آن هم به تمرکز میان رشتهها بر روی نیازهای واقعی و جنبههای کاربردی علوم بر میگردد. دلیل دیگر جذابیت این رشته را در تنوع حیطههای تحقیقاتی و نیز تنوع تخصصهای مورد نیاز میدانم که افراد با تخصصهای گوناگون را برای انجام تحقیقی واحد در یک جا گرد هم میآورد.
فلاحتي فومني درباره تاريخ زبانشناسي رايانهاي ميگويد: سابقه نخستین تحقیقاتی که کوشیدند با استفاده از رایانه، زبان طبیعی را مورد پردازش قرار دهند به سال 1946 برمیگردد. تمرکز اصلی در آن سال و سالهای بعد بر روی ماشین ترجمه بود. آن هم ترجمه از روسی به انگلیسی که این تمرکز ریشه در اوضاع سیاسی جهان در آن ایام داشت. طی دهه 50 و 60 آمریکا و انگلستان سرمایه گذاریهای بسیاری در این زمینه انجام دادند. بعدها اروپا هم وارد میدان شد و در پی یک کار گروهی، ماشین ترجمه سیسترن وارد بازار شد. نقاط ضعف ماشینهای ترجمه ساخته شده به ویژه در خصوص متون کنترل نشده، سبب گردید محققان مطالعات گستردهای را در خصوص زبانشناسی صوری و راههای احتمالی بکارگیری آن به انجام برسانند.
و در ادامه مي افزايد: زبانشناسی رایانهای با کار لوهن (1958) وارد حیطه چکیدهنویسی خودکار شد که تحقیقات این حیطه تاکنون نیز ادامه دارد. بازشناسی گفتار، تولید گفتار (برای کمک به معلولین و افراد فاقد قوه تکلم)، تولید، مدیریت و همچنین ارائه متون از طریق رایانه و اینترنت و سرانجام ایجاد و ارائه اطلاعات فرامتنی نمونههایی از زمینههای تحقیقاتی اخیر در این حیطهاند.
هميشه اين سوال بوده كه این رشته بیشتر به علم رایانه نزدیک است یا به علم زبانشناسی؟ به تعبير ديگر بهتر است علاقمندان علوم رايانه به سراغ زبانشناسي بيايند يا علاقمندان زبانشناسي به دنبال شناخت رايانه و امكانات و تواناييهاي آن باشند؟. فلاحتی در این باره اظهار می دارد: متخصصان علوم رایانه بدون استفاده

علمی میانرشتهای است که از تعامل بین علم زبانشناسی و علوم رایانهای، بهویژه هوش مصنوعی پدید آمده است
از نظریههای زبانی و تولیدات علمی زبانشناسان، هرگز قادر نخواهند بود هیچ نوع تحقیقی را که با زبان در ارتباط باشد به انجام برسانند و در واقع مفاهیم زبانشناسی شالوده و سنگبنا است. از طرف دیگر، بدون بکارگیری امکانات نرمافزاری و سختافزاری موجود در علوم رایانه، یک زبانشناس قادر به پردازش زبان در سطح کلان و ابردادهها نیست و مجبور است برای انجام تحلیلهای ساده از آن نیروها در زمانی بسیار طولانی استفاده نماید که در مورد اخیر نمیتوان احتمال خطای انسانی را نیز نادیده گرفت. بنابراین من این رشته را وامدار هر دو علم زبانشناسی و رایانه میدانم چرا که به محض جدایی این دو، زبانشناسی رایانهای مفهومی نخواهد داشت. بنابراین علاقهمندان هر دو رشته باید با مفاهیم رشتههای یکدیگر آشنا شوند.
او عقيده دارد كه هر دو گروه يعني هم زبانشناسان و هم متخصصان رايانه به دانشهای تخصصی خود که بخشی از زبانشناسی رایانهای را تشکیل میدهد مجهزند، اما آنچه به آن نیاز داریم تربیت دانشجویان و محققانی است که به ابزار هر دو علم و تا حدی علوم وابسته دیگر مانند مهندسی و علوم شناختی مجهز باشند که از طریق راهاندازی این رشته به صورت تخصصی مرتفع خواهد شد.
وي به برخي از مشكلات تحقيق در اين علم اشاره می کند: منابعي که به شکلی با مفاهیم زبانشناسی رایانهای مرتبط باشند وجود دارد اما از نظر منابع تخصصی رشته و همچنین دادههای زبانی ماشینخوان قابل دسترس و ملزومات تحقیق، فقیر هستیم که یک دلیل آن نبود این رشته در ایران به صورت تخصصی است. اینها مشکلات تحقیقند. وقتی دو سال پیش با برخی نویسندگان در خصوص چاپ کتابهایی در این زمینه صحبت میکردم بیشتر آنها نگران بازار فروش بودند اما انتشار کتاب «معناشناسی و بازیابی اطلاعات» با استقبال خوبی مواجه شد و به نظر میرسد راهاندازی این رشته به صورت تخصصی بر حجم انتشارات نیز خواهد افزود.
فلاحتي براي گسترش و رشد اين علم پیشنهاد می کند: اول باید روی زبان فارسی کارهای زبانشناختی اساسی و تحلیلی به انجام برسد. دیگر زمان کلیگویی و ارائه چند شاهد و مثال به سر آمده. باید تحلیلهایی کامل به انجام برسد و کار امور زیربنایی مانند تهیه واژهنامهها، اصطلاحنامههای تخصصی و پیکرههای زبانی ماشین-خوان توسعه یابد چرا که این موارد، پیششرطی اساسی برای انجام هر نوع تحقیق در خصوص زبانشناسی رایانهای است.
و می افزاید: پیشنهاد دوم شروع آموزش زبانشناسی رایانهای از مقطع کارشناسی و توسعه آن در کارشناسی ارشد است. به نظر من، دوره دکتری حتی به جای پرداختن به زبانشناسی رایانهای باید صرفاً به یکی از زیربخشهایش محدود شود.
فلاحتی ادامه می دهد: سوم آنکه نتایج تحقیقات به عمل آمده ضمن حفظ موازینی در دسترس علاقهمندان و محققان قرار گیرد. در حال حاضر همان تحقیقات محدودی هم که در کشور به انجام میرسد تا حد زیادی تکراری است البته راهی برای آگاهي از آنها وجود ندارد و تنها اطلاع ما، خواندن مقالهها و یا خلاصه گزارشهاست. به جای دوبارهکاری چنانچه نرمافزارهای ساخته شده قابل دسترسی باشند، محققان میتوانند با هدف ارتقاء آن نرمافزارها آنها را مورد تحلیل قرار دهند. این کاری است که در دنیا به انجام میرسد که از آن جمله میتوان به برنامه TREC اشاره کرد که تاکنون ویرایشهای مختلف آن ارائه شده و مورد سنجش محققان قرار گرفته است. شاید ترس از انتشار ارزیابیها و آشکار شدن اشکالات نرمافزارها عاملی باشد برای عدم تمایل محققان به فراهم آوردن امکان دسترسی به منبع اصلی نرمافزارها چرا که بر روی بازار فروش تأثیر میگذارد ولی تا چیزی مورد ارزیابی قرار نگیرد بهبود پیدا نمیکند.
وی به عنوان آخرین پیشنهاد می گوید: با توجه به نوپا بودن این نوع تحقیقات در ایران توصیه میشود کار با ترجمه منابع مفید خارجی آغاز شود. منتها باید این کار با احتیاط همراه باشد و چشم بسته ویژگیهای زبان-وابسته زبانهای دیگر را برای توصیف فارسی به کار نگیریم.
غالبا میگویند طبیعت خط فارسی با ذات تحقیقات رایانهای سازگاری ندارد. اما فلاحتي با این نظر موافق نیست: تاکنون بیش از 50 مقاله از نویسندگان ایرانی خواندهام که به نوعی با مسئله خط فارسی و مشکلات آن مربوط بودهاند. برخی خط فارسی را همانطور که گفتید با ذات تحقیقات رایانهای سازگار نمیدانند. برخی هم دنبال چارهجوییاند و پیشنهاد یکدستسازی خط فارسی را مطرح میکنند. برخی نظر خود را در راستا یا تقابل با کتاب دستورالعمل خط فارسی در فرهنگستان زبان تهیه شده، مطرح میکنند. اگرچه در بحثهاي زبانی صرف، این نوع مقالهها و کارها میتواند مفید باشد ولی در مباحث زبانشناسی رایانهای چارهساز نیست. ما باید بپذیریم که خط فارسی داراي گوناگونی اشکال، تنوع املایی و ... است و با آن متنهای فراوان نگاشته شده. پس اگر بخواهیم آن اطلاعات را هرز ندهیم باید به همین صورت آن را وارد محیط رایانهای

ترجمه را آمیزهای از علم و هنر میدانم. ترجمه در حقیقت خلق یک اثر است و از این رو مترجم هنرمند است.
کنیم. اینجا صحبت تکنیک پیش میآید که چطور در محیط رایانهای به این تنوع، نظام ببخشیم. به نظر من این کار در فارسی از برخی زبانهای دیگر سختتر اما ممکن است. سختی آن نیز به نوع حروف الفبا و الگوی ترکیب آنها و همچنین روال واژهسازی و ترکیبات واژگانی در زبان فارسی برمیگردد. برخی از پیچیدگیهای زبان فارسی را نیز میتوان از طریق تهیه فهرستهای بسته مرتفع نمود. این کار اگرچه میزان حافظه مورد نیاز برای تهیه برنامه را افزایش میدهد اما در صورت ترکیب با الگوریتمهای مناسب، تفاوت قابلملاحظهای در فضای مورد نیاز برای ذخیره ایجاد نمیکند. ریشه این سوء تفاهم تا حد زیادی ناشی از عدم آشنایی متخصصان زبانشناسی و رایانه با مفاهیم هر دو رشته است.
«چطور ممکن است که یک مترجم پس از سالها تلاش علمي و کسب تجربه به جايي برسد كه بتواند ترجمه كند و حالا صحبت از ترجمه ماشيني است. واقعا ميتوان كار ترجمه را - كه برخي آن را فن و عدهاي آن را هنر ميدانند ـ به ماشين سپرد؟» فلاحتي در اين خصوص می گوید: من ترجمه را آمیزهای از علم و هنر میدانم. ترجمه در حقیقت خلق یک اثر است و از این رو مترجم هنرمند است. از طرفی قواعد و اصولی که مترجم به آن مجهز شده چارچوبی علمی را پیش رویش میگذارد و مترجم در آن چارچوبی که بر میگزیند عمل میکند. پس از این جهت او را باید اهل فن به حساب آورد. جالب است واژگانی هم که زبانهای مختلف برای اشاره به ترجمه برمیگزینند متفاوت است که بر این ابهام میافزاید. در انگلیسی به آن «مطالعات ترجمه» میگویند، در آلمانی «علم ترجمه» گفته میشود، در روسی ترجمه چیزی بین توانش، شهود و آگاهی است. در خصوص ماشین ترجمه، از سال 1946 روی این حیطه کار شده، اما تحقیقات اولیه با موفقیت چندانی همراه نبوده و حتی هم اکنون بهتر است آن را ترجمهای نیمه خودکار به حساب آوریم که در آن پیشویرایش و پسویرایش نقش مهمی را ایفا مینماید.
وی می افزاید: برخی به خطا موتور جستجوی گوگل را دارای قابلیت سریع و با کیفیت ترجمه برخی متون می دانند که درست نیست. گوگل دارای بخشی به نام Translate This Page است که جلوی برخی مدخلها وجود دارد و به شما پیشنهاد میدهد مواردی را در صورت تمایل به یکی از زبانهایی که معرفی کرده ترجمه کنید. این ترجمهها مورد بررسی قرار میگیرد و در نهایت وارد گوگل می شود و شما چنانچه اتفاقی با مدخلی از این دست مواجه شوید و زبان مورد نظر را تغییر دهید، بلافاصله با ترجمهای خیره کننده و عالی مواجه میشوید که در واقع ترجمهای انسانی است.
فلاحتی به آینده خوشبين است: ماشینهای ترجمه در پرداختن به متنهای کنترل نشده با مشکلات عدیده مواجهاند، اما در خصوص متنهای کنترل شده به پیشرفتهای خوبی رسیدهاند و باور دارم با پیشرفت زبانشناسی، بر کیفیت کار ماشین ترجمه افزوده خواهد شد. من عملکرد دو ماشین ترجمه انگلیسی به فارسی را از دیدی تحلیلی و در چارچوب معیارهای سنجش ترجمه بررسی کردهام و اگر چه عملکرد آنها بیش از 35 درصد به عملکرد کار مترجمان متخصص شباهت نداشت ولي ریشههای بسياری از خطاها به سادگی و از طریق ارائه الگوریتمهای نحوی قابل رفع بود که به نظر میرسید در این نرمافزارها لحاظ نشده باشد. یکی از همکارانم در کشور سوریه نیز این کار را با ماشینهای ترجمه عربی انجام داد و به نتایج مشابهی رسید. پس میتوان اوضاع را از آنچه هست بهتر کرد.
وی در خصوص تدريس اين رشته ميگويد: در حال حاضر در نظام آموزش عالی ما رشتهای به نام زبانشناسی رایانهای وجود ندارد و غالبا در بخشهای زبانشناسی، علوم رایانه و مثلا هوش مصنوعی برخی دانشگاهها، واحدهایی که به نوعی در خدمت زباشناسی رایانهای است ارائه میشود. بیشتر پایاننامهها و تحقیقات نرمافزاری هم توسط متخصصان رایانه و تحقیقات زیر بنايی توسط زبانشناسان در بخشهای زبانشناسی دانشگاهها و برخی موسسات پژوهشی به انجام میرسد. به نظرم این روند دردی را دوا نمیکند. در سالهای اخیر در دنيا گرایش چشمگیر و رو به رشدی برای تدریس این رشته در بخشی مستقل با نام زبانشناسی رایانهای مشاهده میشود.
وي ادامه مي دهد: نکته اول این است که باید چنین رشتهای را وارد نظام آموزشی کرد. نکته دوم به بحث مقطع آموزش بر میگردد. نظرم این است که آموزش زبانشناسی را به جای مقطع کارشناسی ارشد از کارشناسی شروع کنیم و دانشجو را با واحدهای درسی مختلف و مرتبط با زبانشناسی و رایانه برای ورود به دوره کارشناسی ارشد و پس از آن دکتری آماده نماییم. در دوره کارشناسی ارشد به اطلاعات عمق و وسعت داده میشود و در دوره دکتری دانشجو میتواند با گزینش یکی از زیرشاخههای زبانشناسی رایانهای در آن حیطه به صورت تخصصی مطالعه و تحقیق کند. اگر نیل به این مهم در حال حاضر میسر نباشد همجواری بخشهای رایانه و زبانشناسی و مشارکت آنها در اجرای دورههای آموزشی توصیه میگردد.