Published March 17, 2023 | Version v1
Publication Open

Masakhane Web: A Machine Translation Platform for African Languages

  • 1. African Institute for Mathematical Sciences Ghana
  • 2. University of Pretoria

Description

Abstract Low-resource languages pose a particularly difficult challenge to neu-ral machine translation (NMT), and there appears to be insufficient machine translation (MT) systems to support African language accessibility. Masakhane Web, an NMT system for African languages, is proposed in this paper. Our approach is an open-source platform that is free, flexible, and produces reasonably accurate translations for African languages. The platform makes use of Masakhane community-trained MT models. It enables users to generate new data by providing feedback on translations, which is then used to retrain the models to improve them. Ultimately, our goal is to create a platform that can provide accurate translations for African languages and make the process of creating MT models easier for those who lack the technical expertise. Furthermore, we include strategies for domain experts to evaluate the system and explain how the platform can be used as a data collection source to improve MT for African languages.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تشكل اللغات منخفضة الموارد تحديًا صعبًا بشكل خاص للترجمة الآلية العصبية (NMT)، ويبدو أن أنظمة الترجمة الآلية (MT) غير كافية لدعم إمكانية الوصول إلى اللغة الأفريقية. تم اقتراح Masakhane Web، وهو نظام NMT للغات الأفريقية، في هذه الورقة. نهجنا هو منصة مفتوحة المصدر مجانية ومرنة وتنتج ترجمات دقيقة بشكل معقول للغات الأفريقية. تستفيد المنصة من نماذج مسرح ماجنت المدربة من قبل مجتمع الماساخان. يمكّن المستخدمين من إنشاء بيانات جديدة من خلال تقديم ملاحظات حول الترجمات، والتي يتم استخدامها بعد ذلك لإعادة تدريب النماذج لتحسينها. في نهاية المطاف، هدفنا هو إنشاء منصة يمكنها توفير ترجمات دقيقة للغات الأفريقية وجعل عملية إنشاء نماذج الترجمة الآلية أسهل لأولئك الذين يفتقرون إلى الخبرة التقنية. علاوة على ذلك، نقوم بتضمين استراتيجيات لخبراء المجال لتقييم النظام وشرح كيفية استخدام المنصة كمصدر لجمع البيانات لتحسين الترجمة الآلية للغات الأفريقية.

Translated Description (French)

Résumé Les langues à faibles ressources posent un défi particulièrement difficile à la traduction automatique neu-ral (NMT), et il semble que les systèmes de traduction automatique (MT) soient insuffisants pour prendre en charge l'accessibilité des langues africaines. Masakhane Web, un système NMT pour les langues africaines, est proposé dans ce document. Notre approche est une plate-forme open source gratuite, flexible et produisant des traductions raisonnablement précises pour les langues africaines. La plateforme utilise des modèles de MT formés par la communauté de Masakhane. Il permet aux utilisateurs de générer de nouvelles données en fournissant des commentaires sur les traductions, qui sont ensuite utilisées pour recycler les modèles afin de les améliorer. En fin de compte, notre objectif est de créer une plate-forme capable de fournir des traductions précises pour les langues africaines et de faciliter le processus de création de modèles de TA pour ceux qui n'ont pas l'expertise technique. En outre, nous incluons des stratégies pour que les experts du domaine évaluent le système et expliquent comment la plate-forme peut être utilisée comme source de collecte de données pour améliorer la MT pour les langues africaines.

Translated Description (Spanish)

Resumen Los idiomas de bajos recursos plantean un desafío particularmente difícil para la traducción automática neu-ral (NMT), y parece que no hay suficientes sistemas de traducción automática (MT) para apoyar la accesibilidad de los idiomas africanos. Masakhane Web, un sistema NMT para lenguas africanas, se propone en este documento. Nuestro enfoque es una plataforma de código abierto que es gratuita, flexible y produce traducciones razonablemente precisas para los idiomas africanos. La plataforma utiliza modelos de TA entrenados por la comunidad de Masakhane. Permite a los usuarios generar nuevos datos al proporcionar comentarios sobre las traducciones, que luego se utilizan para volver a entrenar los modelos para mejorarlos. En última instancia, nuestro objetivo es crear una plataforma que pueda proporcionar traducciones precisas para los idiomas africanos y facilitar el proceso de creación de modelos de TA para aquellos que carecen de la experiencia técnica. Además, incluimos estrategias para que los expertos en el campo evalúen el sistema y expliquen cómo se puede utilizar la plataforma como fuente de recopilación de datos para mejorar la TA para los idiomas africanos.

Files

latest.pdf.pdf

Files (433.7 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:d7abc9fd070cbf53b95a0e7a2e8d9315
433.7 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مسخاني ويب: منصة ترجمة آلية للغات الأفريقية
Translated title (French)
Masakhane Web : une plateforme de traduction automatique pour les langues africaines
Translated title (Spanish)
Masakhane Web: una plataforma de traducción automática para idiomas africanos

Identifiers

Other
https://openalex.org/W4327698594
DOI
10.21203/rs.3.rs-2646015/v1

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Ghana

References

  • https://openalex.org/W2963506925
  • https://openalex.org/W3173162544