Comparison and analysis of the machine learning in the movie subtitle document classification
Creators
- 1. Peking University
- 2. University of Melbourne
- 3. University of Sydney
Description
With the rapid iteration of film and technology, the quantity of movie related subtitle document has been rapidly expanded. However, the issue of classifying these documents is becoming non-negligible. This paper aims to compare different methods of classification of every machine learning algorithm on movie subtitle document and then analyse the result of each method. For the classification of movie subtitle document, this paper mostly does the following features of the work: firstly, retrieve of movie subtitle document and pre-processing step of text document. Secondly, deletion of the irrelevant text and extraction of the related texts, the methods are unsupervised machine learning approach and supervised machine learning approach respectively. Furthermore, analyse each classifier in various model which applied with different approach. Lastly, compare the result of different approach and each model then display the results.
Translated Descriptions
Translated Description (Arabic)
مع التكرار السريع للفيلم والتكنولوجيا، تم توسيع كمية مستندات الترجمة المتعلقة بالفيلم بسرعة. ومع ذلك، فإن مسألة تصنيف هذه الوثائق أصبحت لا يستهان بها. تهدف هذه الورقة إلى مقارنة الطرق المختلفة لتصنيف كل خوارزمية للتعلم الآلي في مستند الترجمة المصاحبة للفيلم ثم تحليل نتيجة كل طريقة. لتصنيف مستند العنوان الفرعي للفيلم، تقوم هذه الورقة في الغالب بالميزات التالية للعمل: أولاً، استرداد مستند العنوان الفرعي للفيلم وخطوة المعالجة المسبقة للمستند النصي. ثانيًا، حذف النص غير ذي الصلة واستخراج النصوص ذات الصلة، والأساليب هي نهج التعلم الآلي غير الخاضع للإشراف ونهج التعلم الآلي الخاضع للإشراف على التوالي. علاوة على ذلك، قم بتحليل كل مصنف في نموذج مختلف تم تطبيقه بنهج مختلف. أخيرًا، قارن نتيجة النهج المختلف وكل نموذج ثم اعرض النتائج.Translated Description (French)
Avec l'itération rapide du film et de la technologie, la quantité de documents de sous-titres liés au film a été rapidement augmentée. Cependant, la question de la classification de ces documents devient non négligeable. Cet article vise à comparer différentes méthodes de classification de chaque algorithme d'apprentissage automatique sur un document de sous-titres de film, puis à analyser le résultat de chaque méthode. Pour la classification du document de sous-titres de film, cet article fait principalement les caractéristiques suivantes de l'œuvre : tout d'abord, récupérer le document de sous-titres de film et l'étape de prétraitement du document texte. Deuxièmement, la suppression du texte non pertinent et l'extraction des textes connexes, les méthodes sont respectivement une approche d'apprentissage automatique non supervisée et une approche d'apprentissage automatique supervisée. En outre, analysez chaque classificateur dans différents modèles appliqués avec une approche différente. Enfin, comparez le résultat de différentes approches et chaque modèle affiche ensuite les résultats.Translated Description (Spanish)
Con la rápida iteración de la película y la tecnología, la cantidad de documentos de subtítulos relacionados con la película se ha expandido rápidamente. Sin embargo, el tema de la clasificación de estos documentos se está volviendo no desdeñable. Este documento tiene como objetivo comparar diferentes métodos de clasificación de cada algoritmo de aprendizaje automático en el documento de subtítulos de películas y luego analizar el resultado de cada método. Para la clasificación del documento de subtítulos de película, este documento realiza principalmente las siguientes características del trabajo: en primer lugar, recuperar el documento de subtítulos de película y el paso de preprocesamiento del documento de texto. En segundo lugar, la eliminación del texto irrelevante y la extracción de los textos relacionados, los métodos son el enfoque de aprendizaje automático no supervisado y el enfoque de aprendizaje automático supervisado, respectivamente. Además, analice cada clasificador en varios modelos que se aplicaron con un enfoque diferente. Por último, compare el resultado de un enfoque diferente y cada modelo mostrará los resultados.Files
36d4aa5a1bf84975b254e47e399b3c13.marked_7lQhQHG.pdf.pdf
Files
(867.6 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:e09787662b68acfc8dddc45e3306ef84
|
867.6 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- مقارنة وتحليل التعلم الآلي في تصنيف وثيقة الترجمة السينمائية
- Translated title (French)
- Comparaison et analyse de l'apprentissage automatique dans la classification des documents de sous-titres de films
- Translated title (Spanish)
- Comparación y análisis del aprendizaje automático en la clasificación de documentos de subtítulos de películas
Identifiers
- Other
- https://openalex.org/W4383560278
- DOI
- 10.54254/2755-2721/5/20230669