پس از این نیازی به مترجم انسانی نیست؟
تاریخ انتشار: ۱۹ آبان ۱۴۰۱ | کد خبر: ۳۶۳۷۹۴۹۲
ایسنا/خراسان رضوی یک تحقیقی کیفیت ترجمههای ادبی هوش مصنوعی را در مقایسه با ترجمههای انسانی ارزیابی کرد.
به نقل از تکاکسپلور، پیشرفتهای اخیر در زمینه یادگیری ماشینی(ML) کیفیت ابزارهای ترجمه خودکار را تا حد زیادی بهبود بخشیده است.
در حال حاضر ابزار کنونی اغلب برای ترجمه جملات اساسی و همچنین متون کوتاه یا اسناد غیر رسمی استفاده میشود.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
محققان دانشگاه ماساچوست امهرست آمریکا به تازگی مطالعهای انجام دادهاند که کیفیت ترجمههای متون ادبی تولید شده توسط ماشینها را با مقایسه آنها با ترجمههای متنی مشابه ایجاد شده توسط انسان بررسی و برخی از کاستیهای مدلهای محاسباتی موجود برای ترجمه متون خارجی به انگلیسی را برجسته کرد.
کاترین تای و همکارانش، از پژوهشگران این تحقیق، گفتند: ترجمه ماشینی(MT) دارای ظرفیت تکمیل کار مترجمان انسانی با بهبود روشهای آموزشی و کارایی کلی آنهاست. ترجمه ادبی نسبت به تنظیمات سنتی ترجمه ماشینی محدودیت کمتری دارد زیرا مترجمان باید معادلسازی معنا، خوانایی و تفسیرپذیری انتقادی را در زبان مقصد متعادل کنند. این ویژگی همراه با زمینه پیچیده در سطح گفتمان موجود در متون ادبی، ترجمه ماشینی ادبی را برای مدلسازی و ارزیابی محاسباتی نیز چالش برانگیزتر میکند.
هدف اصلی کار اخیر تای و همکارانش درک بهتر روشهایی بود که ابزارهای پیشرفته ترجمه ماشینی در مقایسه با ترجمههای انسانی هنوز در ترجمه متون ادبی شکست میخورند. امید آنان این بود که این کار به شناسایی زمینههای خاصی که توسعهدهندگان باید روی بهبود عملکرد این مدلها تمرکز کنند، کمک کند.
تای و همکارانش توضیح دادند: ما یک مجموعه داده(PAR۳) از رمانهای غیرانگلیسی زبان را در حوزه عمومی جمعآوری میکنیم که هر کدام در سطح پاراگراف با ترجمههای انسانی و خودکار انگلیسی تراز شدهاند.
مجموعه داده جدیدی که توسط محققان برای دامنه تحقیق خود گردآوری شده است، شامل ۱۲۱ هزار پاراگراف استخراج شده از ۱۱۸ رمان است که در اصل به زبانهای مختلف به جز انگلیسی نوشته شدهاند. برای هر یک از این پاراگرافها مجموعه داده شامل چندین ترجمه انسانی مختلف همچنین ترجمهای است که توسط ترجمه گوگل(Google translate) تولید شد.
محققان با استفاده از معیارهای رایج برای ارزیابی ابزارهای ترجمه ماشینی، کیفیت ترجمههای انسانی این پاراگرافهای ادبی را با ترجمههای مترجم گوگل مقایسه کردند. همزمان آنان از مترجمان انسانی متخصص پرسیدند که کدام ترجمهها را ترجیح میدهند؛ در حالی که آنان را ترغیب کردند تا مواردی را با کمترین ترجیح ترجمه خود شناسایی کنند.
تای و همکارانش اظهار کردند: با استفاده از مجموعه داده(PAR۳) متوجه شدیم که مترجمان ادبی خبره ترجمههای انسانی مرجع را به پاراگرافهای ترجمه شده ماشینی به میزان ۸۴ درصد ترجیح میدهند؛ در حالی که معیارهای پیشرفته ترجمه ماشینی خودکار با این اولویتها مرتبط نیست. کارشناسان خاطرنشان میکنند خروجیهای ترجمه ماشینی نه تنها حاوی ترجمههای نادرست بلکه خطاهای مخل گفتمان و تناقضات سبکی است.
به طور کلی یافتههای جمعآوری شده توسط تای و همکارانش نشان میدهد معیارهای ارزیابی ترجمه ماشینی(به عنوان مثال BLEU، BLEURT و BLONDE) ممکن است موثر نباشد زیرا مترجمان انسانی با پیشبینیهای آنها موافق نبودند.
قابل توجه این است بازخوردی که آنان از مترجمان انسانی جمعآوری کردند، به محققان این امکان را داد که موارد خاصی را با ترجمههای ایجاد شده توسط ترجمه گوگل شناسایی کنند.
این گروه تحقیقاتی با استفاده از بازخورد متخصصان انسانی به عنوان یک راهنما در نهایت یک مدل خودکار پس از ویرایش بر اساس GPT-۳، یک رویکرد یادگیری عمیق که توسط یک گروه تحقیقاتی در شرکت هوش مصنوعی OpenAI معرفی شد، ایجاد کنند. آنان دریافتند که مترجمان انسانی متخصص ترجمههای ادبی تولید شده توسط این مدل را به میزان ۶۹ درصد ترجیح میدهند.
در آینده یافتههای این تحقیق میتواند به تحقیقات جدید در مورد استفاده از ابزار ترجمه ماشینی برای ترجمه متون ادبی کمک کند.
علاوه بر این مجموعه داده PAR۳ که توسط تای و همکارانش گردآوری شده، میتواند توسط گروههای دیگر برای آموزش یا ارزیابی مدلهای زبان خود استفاده شود.
محققان نتیجه گرفتند: به طور کلی کار ما چالشهای جدیدی را برای پیشرفت در ترجمه ماشینی ادبی آشکار میکند و ما امیدواریم که انتشار عمومی مجموعه داده PAR۳ محققان را تشویق کند تا با آنها مقابله کنند.
یافتههای این تحقیق در مجله arXiv منتشر شده است.
انتهای پیام
منبع: ایسنا
کلیدواژه: استانی علمی و آموزشی ترجمه هوش مصنوعی ترجمه های انسانی ترجمه ماشینی مجموعه داده برای ترجمه ترجمه متون متون ادبی یافته ها شده توسط مدل ها
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.isna.ir دریافت کردهاست، لذا منبع این خبر، وبسایت «ایسنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۶۳۷۹۴۹۲ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
کتاب نشانهشناسی شکلکها منتشر شد
به گزارش خبرگزاری صدا و سیما مرکز ایلام؛ کتاب نشانهشناسی شکلکها «گسترش زبان دیداری در عصر اینترنت» ترجمه دکتر «مریم تفرجییگانه»، به همت انتشارات دانشگاه ایلام منتشر شده است.
نشانه شناسی شکلکها نوشته «مرکل دنسی» است که با ترجمه خانم مریم تفرجی یگانه عضو هیأت علمی دانشگاه ایلام ترجمه شده است.
در بخشی از این کتاب آمده است: نوشتن به معنای اشتراک گذاری بخشی از وضعیت بشری در خصوص خواستن و به اشتراکگذاری چیزها است.
فرهنگ لغت پائولو (۱۹۴۷) سال آکسفورد تنها رویداد سال ۲۰۱۵ میلادی نبود که اهمیت اجتماعی و ارتباطی رو به رشد شکلکها را استخراج کرد.
موسیقی دانان، هنرمندان، سیاستمداران و تبلیغ کنندگان در میان بسیاری دیگر در توئیتها در وب سایتها و در سایت حوزههای دیجیتال شروع به استفاده از آنها کردند. حتی هنرمندان مشهور حوزه موسیقی مانند: «سرپاول مک کارتنی از بیت لس» با استفاده از اسکایپ برای ایجاد ۱۰ شکلک شاد و سرزنده با نام شکلکهای عاشقانه در برنامه جدیدش استفاده کرد.
اسکایپ قبلاً به معرفی شکلکهای زنده سفارشی پرداخته بود که به داخل هر چیزی از تصاویر استودیوهای بزرگ سینمایی تا آن پادشاهیهای سمبلیک با سنتهای ایتالیایی ضربه بزنید این کار برای اسکایپ غیر معمولی و عجیب نیست. برای جامعه مدرن، نوعی ضرورت به نظر میرسد که قادر باشد شکلکها را به گونهای با هم ادغام کند که بتواند یک سبک تازه و نوین از نوشتار و برقراری ارتباط را ایجاد کند و این ضرورت محدود به افراد شاخص در جهان دیجیتال نیست؛ بلکه میتواند به هر کسی از پاول مک کارتنی تا هیلاری کلینتون ارتباط پیدا کند. شکلکهای سیاستمداران آمریکایی برای کاربران گوشیهای آیفون و اندروید ساخته شد و موسوم به هیل موجی بودند.
اشاعه و گسترش شکلکها چندین سؤال اساسی در خصوص چگونگی برقراری ارتباط و به ویژه دلایل برقراری ارتباط را به شیوه کمدی مطرح میکند.
قبل از هر گونه تلاش برای بررسی این پرسش لازم است به عقب برگردیم و نگاهی به نوع و نقش سیستمهای نگارشی و نوشتاری و چگونگی تکامل آنها در زندگی بشر بیندازیم.
این مباحث تاریخی که به من اجازه ایجاد چهارچوبی نظری میدهد که لازمه بحث در مورد پدیده شکلکها از نظر نشانه شناسی خواهد بود.