جمعه ۲۲ آذر ۱۳۹۸ - ۱۲:۴۵
فیلی: توقع زیادی از ترجمه‌های ماشینی داریم

هشام فیلی، معاون سامانه‌های نرم افزاری مرکز فناوری اطلاعات و فضای مجازی دانشگاه تهران در نشت ترجمه ماشینی مبتنی بر پیکره به سرگذشت ترجمه ماشینی و چالش میان این نوع ترجمه با ترجمه انسانی اشاره کرد.

به گزارش خبرگزاری کتاب ایران (ایبنا) سخنرانی علمی ترجمه ماشینی مبتنی بر پیکره از سلسله‌ نشست‌های زبان‌شناسی در مطالعات میان‌رشته‌ای روز چهارشنبه (20 آذرماه) در پژوهشگاه علوم و فناوری اطلاعات با حضور هشام فیلی، عضو هیات علمی دانشگاه تهران برگزار شد. لازم به ذکر است  الهام علایی ابوذر عضو هیات علمی این پژوهشگاه دبیری این مراسم را برعهده داشت. 
 
فیلی در ابتدای سخنرانیش درباره اهمیت ترجمه ماشینی و کاربردهایش گفت: ترجمه ماشینی یکی از کاربردهای کوپراس‌(تصمیم‌گیری چندشاخصه در علم نرم‌افزار) است. در اصل مجموعه‌ای از اطلاعات است که یا به صورت متن در ترجمه ماشینی نمود دارد یا یه در قالب آوا مورد استفاده قرار می‌گیرد. چامسکی جزو صاحب‌نظرانی بوده که معتقد به روش‌های مبتنی بر پیکره یا استفاده از هوش مصنوعی نبود. وی می‌گوید؛ کوپراس به درد نخور است در عوض فردی به نام ویلمو می‌گوید قطعا هیچ کوپراسی نیست که کل حیطه لغتی یک زبان را پوشش دهد. بنابراین همیشه ناقص است، اما در هر هر کوپراسی که من مشاهده کردم یک سری المان‌هایی را در بهره‌گیری از ترجمه ماشینی فهمیدم  که در جای دیگر وجود نداشته است. با توجه به گفته ویلیمو دانشمندان به این روش امیدوار شدند و آن را ادامه دادند.
 
 
وی افزود: افرادی که در حوزه ترجمه ماشینی فعالیت می‌کنند علاقه دارند از روشی استفاده کنند که ماشین طراحی شده در سطح ترجمه جمله‌ها باشد. روش کوپراس علاوه بر کاربردهایش در ترجمه ماشینی از سال 2000 به بعد بسیار فراگیر شد. طبق آمارهای سایت گوگل از کیفیت ترجمه ماشینی در سال 2016، اینگونه برآورد شد که ترجمه ماشینی تا سال مذکور هنوز به کیفیت امروزی نرسیده بود اما در این دو الی سه سال اخیر  پیشرفت چشمگیری داشته است. بر اساس این آمار تا سال 2016 بیش از 143 میلیارد کلمه در طول روز ترجمه می‌شد. در همان سال فیسبوک هم طبق آماری که داده بود در طول روز بیش از دو میلیارد درخواست ترجمه داشته است.

فیلی ادامه داد: نزدیک به 50درصد وب‌سایت‌های دنیا انگلیسی  و بعد چینی هستند اما 20درصد مردم دنیا زبانشان انگلیسی است. این نشان می‌دهد که چقدر نیاز به زبان انگلیسی مهم است. اینکه ما از ترجمه چه استفاده‌هایی می‌کنیم واضح است اما علاوه بر عموم مردم، مترجمان هم می‌توانند از موتورهای ماشین‌های ترجمه یا ابزارهای آن استفاده کنند. با این حال هنوز اختلاف زیادی میان مترجمان هوشمند و مترجمان انسانی وجود دارد و هنوز ماشین‌های ترجمه به پای مترجمان انسانی نرسیده‌اند.
 
این پژوهشگر با اشاره به صرفه‌جویی در هزینه با بهره‌گیری از ترجمه ماشینی گفت: پس از مدتی کارشناسان در حوزه ترجمه آزمایشی را انجام دادند، آن‌ها تصمیم گرفتند متون توسط مترجمان ماشینی ترجمه شوند و در نهایت انسان آن را ادیت کند تا ببیند آیا در صرف هزینه و زمان می‌توان صرفه‌جویی کرد یا نه که تا یک دهه گذشته فرقی با روند قبلی نداشت. یعنی مترجمان انسانی ترجیح می‌دادند ترجمه‌های ماشینی را به دور بریزند و دوباره ترجمه کنند. اما در شرایط فعلی با در نظر گرفتن بالاترین کیفیت ترجمه ماشینی می‌توان گفت یک مترجم ماشینی در طول روز سه برابر یک مترجم انسانی می‌تواند ترجمه کند.

فیلی ادامه داد: بخش زیادی از ترجمه‌های B 2 B هستند یعنی عین یک عبارت را بدون در نظر گرفتن فرهنگ زبانی ترجمه می‌کند. در واقع امروزه اپلیکیشن‌ها و نرم‌افزارهای ترجمه تخصصی زیادی وارد بازار شده است که علاوه بر ترجمه مستقیم فرهنگ موضوعی را هم در نظر می‌گیرد. باید گفت ترجمه‌های ماشینی در زمینه متون تخصصی کیفیت بالایی دارند اما اگر بخواهیم در یک روش همه حوزه‌ها را به سطح بالایی برسانیم هنوز این آرزو محقق نشده است. ما می‌توانیم همه حوزه‌ها را تا سطح متوسط برسانیم تا اینکه در 10 سال گذشته گوگل با استفاده از این روش انقلاب عظیمی را در ترجمه ماشینی به وجود آورد. البته در سال 2014 اسکایپ ترجمه صدا به متن را داشت و ترجمه انگلیسی به اسپانیایی اولین محصول این نرم‌افزار بوده است. تاکنون گجت‌های زیادی آمده است که هرکدام روش‌های خاص خود را دارد.
 
وی با اشاره به تاریخچه ترجمه ماشینی گفت: اغلب افراد تصور می‌کنند ترجمه ماشینی بعد از هوش مصنوعی به وجود آمد در حالی که اولین سیستم‌ها در زمینه ترجمه ماشینی در سال 1952 بسیار قبل‌تر از هوش مصنوعی به وجود آمد. در آن زمان همه افراد به مدت 10 سال خوشبین بودند و تصور می‌کردند دیگر اختلافات و نافهمی‌های زبانی از بین خواهد رفت. در این حین روسیه و آمریکا فعالیت‌های زیادی انجام دادند و زمان و پول زیادی را هزینه کردند تا اینکه به این نتیجه رسیدند هنوز برای رسیدن به هدفشان راه طولانی در پیش دارند و این نوع ترجمه‌های ماشینی هم چندان موثر نخواهد بود. تا اینکه در سال 1975 توقع خود را پایین آوردند و پروژه‌های مختلفی در سراسر جهان پیشرفته از جمله فرانسه و ژاپن شروع شد و برنامه‌های خود را دوباره بازنویسی کردند. در نهایت در اواسط دهه 80 شرکت‌هایی سیستم‌های پیشرفته ماشین‌های ترجمه را تولید کردند.
 
وی ادامه داد: در اواخر دهه 80 علم زبان‌شناسی به بلوغ خود رسیده بود و ترجمه حافظه‌ای هم به وجود آمد. تا اینکه اوایل دهه 90 اتفاق بزرگی به وجود آمد و مفهوم استفاده از کوپراس  (تصمیم‌گیری چندشاخصه در علم نرم‌افزار) در ترجمه وارد شد و اولین محصولش روانه بازار شد. بدین ترتیب تا سال 1999 با روش آماری کوپراس بسیار فراگیر شد و اوایل سال 2000 سیستم‌های آنلاین ترجمه‌ ماشینی تولید شد.

وی ادامه داد: در ترجمه آماری متبنی بر کوپراس باید گفت که گرامر را کنار گذاشت چراکه با آمارها سرو کار داشت و چندان به زبان‌شناسی اهمیت نمی‌داد. این روش براساس نمادها کار ترجمه را انجام می‌دهد. اما بعدها اطلاعات زبان‌شناسی هم به آن اضافه شد. ایده اصلی آن بود که از روی تجملات موازی به ترجمه کلمات برسند و در مراحل بعدی تشخیص دهند که چه عبارتی دارای چه ترجمه‌ای است. این روش زمانی جواب می‌دهد که ترجمه جملات بسیار زیاد باشد و این روش پیشرفت زیادی کرد به همین دلیل شرکت‌های زیادی از جمله گوگل به دنبال آن رفتند. منطق آن این بود که از جفت جملات استفاده می‌کرد و به ترجمه‌ها می‌رسید و این اطلاعات در یک بخشی ذخیره می‌شد.

فیلی با اشاره به اهمیت کتاب در پبشرفت روش کوپراس در ترجمه ماشینی ادامه داد: اتفاقی که در این حین افتاد این بود که کاربران کوپراس نیازمند حجم بسیار زیاد جملات شدند. در اینجا کتاب‌ها به کمک این روش آمدند. چراکه دارای حجم بسیار زیادی از جملات بودند. لازم به ذکر است پارلمان کانادا اولین کشوری بود که با استفاده از این روش ترجمه تمام مذاکرات پارلمانی خود را به دو زبان انگلیسی و فرانسوی انجام می‌دهد و همزمان نوشته می‌شود. بعد از آن خبرگزاری‌های بسیاری از آن استفاده کردند. یکی از اصلی‌ترین نمودهای این روش در زیرنویس فیلم‌ها و ترجمه قرآن و دیگر کتب مقدس است.

به گفته فیلی، وارن ویور ایده‌پرداز اصلی کوپراس بود که 60 سال بعد ایده وی جان گرفت. نگاه وی به زبان به شدت کدگذاری شده بود و همین امر باعث شد که این روش را در ترجمه ایجاد کند. همانگونه که پیش‌تر هم گفته شد از دهه نود روش‌های آماری کوپراس که، فراگیر شد. این روش دارای منابع آزاد (open source) بود و سبب شد که جستجو واژه بسیار راحت‌تر از پیش باشد.

این عضو هیات علمی دانشگاه تهران ادامه داد: از سال 2010 به بعد هوش مصنوعی بسیار تغییر کرد و به شکل عجیبی به سمت یادگیری عمیق با شبکه عصبی رفت که نوعی شبیه‌سازی از مغز است که هرچیزی را می‌تواند یاد بگیرد، از جمله ترجمه. بعد از این سال یادگیری عمیق براساس استفاده از شبکه عصبی در سال 2014 به‌وجود آمد و یک اتفاق عجیب رخ داد اینکه کیفیت ترجمه ماشینی به یک‌باره افزایش یافت و روش‌های دیگر را از رده خارج کردند. در واقع این روش ترجمه مفهوم به مفهوم را انجام می‌دهد. واقعیت این است که همیشه توقع ما از ترجمه عقب‌تر از واقعیت است و الان هم با توجه به ورود هوش مصنوعی در ترجمه ماشینی اشتباه دهه پنجاه را تکرار می‌کنیم اینکه فکر می‌کنیم ترجمه‌های ماشینی می‌تواند جای ترجمه‌های انسانی را بگیرد در حالی که اینگونه نیست.
 
وی در انتها یادآور شد: از سال 2016 به بعد هرکدام از ترجمه‌های ماشینی به NMT (ترجمه مبتنی بر هوش مصنوعی) تبدیل شدند و در ایران ما در سایت فرازبین از این روش استفاده می‌کنیم. گفتنی است این روش نیازمند سخت‌افزار بسیار پیچیده و حجم ذخیره اطلاعات زیاد است. نطفه این روش از پردازنده‌های بازی‌های رایانه‌ای شکل گرفت. از همین سال به بعد تمام شرکت‌ها از جمله گوگل، فیسبوک و دیگر شرکت‌ها به NMT روی آوردند. اخیرا با شرکت به نام شبکه مترجمین در حال انجام یک آزمایشی هستیم که آیا مترجم ماشینی می‌تواند با توجه به این پیشرفت‌ها جایگزین مترجم انسانی شود یا خیر؟ برای پیشرفت این امر کتاب‌های زیادی را جمع‌آوری کردیم که بتوانیم در تمام زمینه‌ها کاربردی کنیم.

نظر شما

شما در حال پاسخ به نظر «» هستید.

برگزیده

پربازدیدترین

تازه‌ها