Web Analytics Made Easy - Statcounter
به نقل از «ایسنا»
2024-04-29@21:47:53 GMT

پس از این نیازی به مترجم انسانی نیست؟

تاریخ انتشار: ۱۹ آبان ۱۴۰۱ | کد خبر: ۳۶۳۷۹۴۹۲

پس از این نیازی به مترجم انسانی نیست؟

ایسنا/خراسان رضوی یک تحقیقی کیفیت ترجمه‌های ادبی هوش مصنوعی را در مقایسه با ترجمه‌های انسانی ارزیابی کرد.

به نقل از تک‌اکسپلور، پیشرفت‌های اخیر در زمینه یادگیری ماشینی(ML) کیفیت ابزارهای ترجمه خودکار را تا حد زیادی بهبود بخشیده است.

در حال حاضر ابزار کنونی اغلب برای ترجمه جملات اساسی و همچنین متون کوتاه یا اسناد غیر رسمی استفاده می‌شود.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

متون ادبی مانند رمان یا داستان کوتاه هنوز به‌ طور کامل توسط مترجمان انسانی متخصص ترجمه می‌شود که در درک معانی انتزاعی و پیچیده و ترجمه آن به زبانی دیگر مجرب هستند. در حالی که چند تحقیق توانایی مدل‌های محاسباتی را برای ترجمه متون ادبی بررسی کرده‌اند اما یافته‌ها در این زمینه هنوز محدود است.

محققان دانشگاه ماساچوست امهرست آمریکا به‌ تازگی مطالعه‌ای انجام داده‌اند که کیفیت ترجمه‌های متون ادبی تولید شده توسط ماشین‌ها را با مقایسه آن‌ها با ترجمه‌های متنی مشابه ایجاد شده توسط انسان بررسی و برخی از کاستی‌های مدل‌های محاسباتی موجود برای ترجمه متون خارجی به انگلیسی را برجسته کرد.

کاترین تای و همکارانش، از پژوهشگران این تحقیق، گفتند: ترجمه ماشینی(MT) دارای ظرفیت تکمیل کار مترجمان انسانی با بهبود روش‌های آموزشی و کارایی کلی آن‌هاست. ترجمه ادبی نسبت به تنظیمات سنتی ترجمه ماشینی محدودیت کمتری دارد زیرا مترجمان باید معادل‌سازی معنا، خوانایی و تفسیرپذیری انتقادی را در زبان مقصد متعادل کنند. این ویژگی همراه با زمینه پیچیده در سطح گفتمان موجود در متون ادبی، ترجمه ماشینی ادبی را برای مدل‌سازی و ارزیابی محاسباتی نیز چالش برانگیزتر می‌کند.

هدف اصلی کار اخیر تای و همکارانش درک بهتر روش‌هایی بود که ابزارهای پیشرفته ترجمه ماشینی در مقایسه با ترجمه‌های انسانی هنوز در ترجمه متون ادبی شکست می‌خورند. امید آنان این بود که این کار به شناسایی زمینه‌های خاصی که توسعه‌دهندگان باید روی بهبود عملکرد این مدل‌ها تمرکز کنند، کمک کند.

تای و همکارانش توضیح دادند: ما یک مجموعه داده(PAR۳) از رمان‌های غیرانگلیسی زبان را در حوزه عمومی جمع‌آوری می‌کنیم که هر کدام در سطح پاراگراف با ترجمه‌های انسانی و خودکار انگلیسی تراز شده‌اند.

مجموعه داده جدیدی که توسط محققان برای دامنه تحقیق خود گردآوری شده است، شامل ۱۲۱ هزار پاراگراف استخراج شده از ۱۱۸ رمان است که در اصل به زبان‌های مختلف به‌ جز انگلیسی نوشته شده‌اند. برای هر یک از این پاراگراف‌ها مجموعه داده شامل چندین ترجمه انسانی مختلف همچنین ترجمه‌ای است که توسط ترجمه گوگل(Google translate) تولید شد.

محققان با استفاده از معیارهای رایج برای ارزیابی ابزارهای ترجمه ماشینی، کیفیت ترجمه‌های انسانی این پاراگراف‌های ادبی را با ترجمه‌های مترجم گوگل مقایسه کردند. همزمان آنان از مترجمان انسانی متخصص پرسیدند که کدام ترجمه‌ها را ترجیح می‌دهند؛ در حالی که آنان را ترغیب کردند تا مواردی را با کمترین ترجیح ترجمه خود شناسایی کنند.

تای و همکارانش اظهار کردند: با استفاده از مجموعه داده(PAR۳) متوجه شدیم که مترجمان ادبی خبره ترجمه‌های انسانی مرجع را به پاراگراف‌های ترجمه‌ شده ماشینی به میزان ۸۴ درصد ترجیح می‌دهند؛ در حالی که معیارهای پیشرفته ترجمه ماشینی خودکار با این اولویت‌ها مرتبط نیست. کارشناسان خاطرنشان می‌کنند خروجی‌های ترجمه ماشینی نه تنها حاوی ترجمه‌های نادرست بلکه خطاهای مخل گفتمان و تناقضات سبکی است.

به‌ طور کلی یافته‌های جمع‌آوری‌ شده توسط تای و همکارانش نشان می‌دهد معیارهای ارزیابی ترجمه ماشینی(به‌ عنوان مثال BLEU،  BLEURT و BLONDE) ممکن است موثر نباشد زیرا مترجمان انسانی با پیش‌بینی‌های آن‌ها موافق نبودند.

قابل توجه این‌ است بازخوردی که آنان از مترجمان انسانی جمع‌آوری کردند، به محققان این امکان را داد که موارد خاصی را با ترجمه‌های ایجاد شده توسط ترجمه گوگل شناسایی کنند.

این گروه تحقیقاتی با استفاده از بازخورد متخصصان انسانی به‌ عنوان یک راهنما در نهایت یک مدل خودکار پس از ویرایش بر اساس GPT-۳، یک رویکرد یادگیری عمیق که توسط یک گروه تحقیقاتی در شرکت هوش مصنوعی OpenAI معرفی شد، ایجاد کنند.  آنان دریافتند که مترجمان انسانی متخصص ترجمه‌های ادبی تولید شده توسط این مدل را به میزان ۶۹ درصد ترجیح می‌دهند.

در آینده یافته‌های این تحقیق می‌تواند به تحقیقات جدید در مورد استفاده از ابزار ترجمه ماشینی برای ترجمه متون ادبی کمک کند.

علاوه بر این مجموعه داده PAR۳ که توسط تای و همکارانش گردآوری شده، می‌تواند توسط گروه‌های دیگر برای آموزش یا ارزیابی مدل‌های زبان خود استفاده شود.

محققان نتیجه گرفتند: به‌ طور کلی کار ما چالش‌های جدیدی را برای پیشرفت در ترجمه ماشینی ادبی آشکار می‌کند و ما امیدواریم که انتشار عمومی مجموعه داده PAR۳ محققان را تشویق کند تا با آن‌ها مقابله کنند.

یافته‌های این تحقیق در مجله arXiv منتشر شده است.

انتهای پیام

منبع: ایسنا

کلیدواژه: استانی علمی و آموزشی ترجمه هوش مصنوعی ترجمه های انسانی ترجمه ماشینی مجموعه داده برای ترجمه ترجمه متون متون ادبی یافته ها شده توسط مدل ها

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت www.isna.ir دریافت کرده‌است، لذا منبع این خبر، وبسایت «ایسنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۶۳۷۹۴۹۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

کتاب نشانه‌شناسی شکلک‌ها منتشر شد

به گزارش خبرگزاری صدا و سیما مرکز ایلام؛ کتاب نشانه‌شناسی شکلک‌ها «گسترش زبان دیداری در عصر اینترنت» ترجمه دکتر «مریم تفرجی‌یگانه»، به همت انتشارات دانشگاه ایلام منتشر شده است.
نشانه شناسی شکلک‌ها نوشته «مرکل دنسی» است که با ترجمه خانم مریم تفرجی یگانه عضو هیأت علمی دانشگاه ایلام ترجمه شده است.
در بخشی از این کتاب آمده است: نوشتن به معنای اشتراک گذاری بخشی از وضعیت بشری در خصوص خواستن و به اشتراک‌گذاری چیز‌ها است.
 فرهنگ لغت پائولو (۱۹۴۷) سال آکسفورد تنها رویداد سال ۲۰۱۵ میلادی نبود که اهمیت اجتماعی و ارتباطی رو به رشد شکلک‌ها را استخراج کرد.
موسیقی دانان، هنرمندان، سیاستمداران و تبلیغ کنندگان در میان بسیاری دیگر در توئیت‌ها در وب سایت‌ها و در سایت حوزه‌های دیجیتال شروع به استفاده از آن‌ها کردند. حتی هنرمندان مشهور حوزه موسیقی مانند: «سرپاول مک کارتنی از بیت لس» با استفاده از اسکایپ برای ایجاد ۱۰ شکلک شاد و سرزنده با نام شکلک‌های عاشقانه در برنامه جدیدش استفاده کرد.
اسکایپ قبلاً به معرفی شکلک‌های زنده سفارشی پرداخته بود که به داخل هر چیزی از تصاویر استودیو‌های بزرگ سینمایی تا آن پادشاهی‌های سمبلیک با سنت‌های ایتالیایی ضربه بزنید این کار برای اسکایپ غیر معمولی و عجیب نیست. برای جامعه مدرن، نوعی ضرورت به نظر می‌رسد که قادر باشد شکلک‌ها را به گونه‌ای با هم ادغام کند که بتواند یک سبک تازه و نوین از نوشتار و برقراری ارتباط را ایجاد کند و این ضرورت محدود به افراد شاخص در جهان دیجیتال نیست؛ بلکه می‌تواند به هر کسی از پاول مک کارتنی تا هیلاری کلینتون ارتباط پیدا کند. شکلک‌های سیاستمداران آمریکایی برای کاربران گوشی‌های آیفون و اندروید ساخته شد و موسوم به هیل موجی بودند.

اشاعه و گسترش شکلک‌ها چندین سؤال اساسی در خصوص چگونگی برقراری ارتباط و به ویژه دلایل برقراری ارتباط را به شیوه کمدی مطرح می‌کند.
 قبل از هر گونه تلاش برای بررسی این پرسش لازم است به عقب برگردیم و نگاهی به نوع و نقش سیستم‌های نگارشی و نوشتاری و چگونگی تکامل آن‌ها در زندگی بشر بیندازیم.
 این مباحث تاریخی که به من اجازه ایجاد چهارچوبی نظری می‌دهد که لازمه بحث در مورد پدیده شکلک‌ها از نظر نشانه شناسی خواهد بود.

دیگر خبرها

  • نوجوان سمنانی به بخش داستانِ باشگاه ادبی «قاف» راه یافت
  • قم قطب صنعت کفش ماشینی کشور
  • اسامی ۵۳ نوجوان راه‌یافته به باشگاه قاف اعلام شد
  • نقد کتاب مویه های آمو
  • داستان فلسطین آنقدر جذاب است که نیازی به تخیل ندارد
  • ۱۱۰ فرصت اقتصادی خراسان جنوبی به ۲ زبان ترجمه شد
  • ترجمه «قلمروزدایی علم و دین» روانه بازار نشر شد
  • کمی مهربان باشیم (بررسی زندگی و آثار دکتر هروی)
  • ارزش صادرات فرش ماشینی به ۲۸۰ میلیون دلار رسید
  • کتاب نشانه‌شناسی شکلک‌ها منتشر شد