Comparison of Three Machine Learning Models for the Detection of Emails Spam
- 1. Al-Balqa Applied University
Description
Abstract Recently, machine learning has been applied into different major areas such as text classification, machine translation, and spam detection. The great performance of machine learning algorithms into several fields provided the humans with opportunities to tackle some of their hard jobs to be handled by machine learning systems. These tasks seem effortless for machines, and need less time as the amount of texts or spams need to be classified is huge. Hence, in his paper, we propose three different models for the task of emails spam detection. The three models are trained and validated on a public spam dataset. Experimentally, the models performed differently and it was seen that the Naïve Bayes outperformed the other machine learning algorithms in terms of accuracy and other evaluation metrics.
Translated Descriptions
Translated Description (Arabic)
الملخص في الآونة الأخيرة، تم تطبيق التعلم الآلي في مجالات رئيسية مختلفة مثل تصنيف النصوص والترجمة الآلية واكتشاف البريد العشوائي. أتاح الأداء الرائع لخوارزميات التعلم الآلي في العديد من المجالات للبشر فرصًا لمعالجة بعض وظائفهم الصعبة التي يجب أن تتعامل معها أنظمة التعلم الآلي. تبدو هذه المهام سهلة للآلات، وتحتاج إلى وقت أقل لأن كمية النصوص أو الرسائل غير المرغوب فيها التي يجب تصنيفها ضخمة. ومن ثم، نقترح في ورقته البحثية ثلاثة نماذج مختلفة لمهمة اكتشاف البريد الإلكتروني غير المرغوب فيه. يتم تدريب النماذج الثلاثة والتحقق من صحتها على مجموعة بيانات عامة غير مرغوب فيها. من الناحية التجريبية، كان أداء النماذج مختلفًا وشوهد أن نايف بايز تفوقت على خوارزميات التعلم الآلي الأخرى من حيث الدقة ومقاييس التقييم الأخرى.Translated Description (French)
Résumé Récemment, l'apprentissage automatique a été appliqué dans différents domaines majeurs tels que la classification de texte, la traduction automatique et la détection de spam. La grande performance des algorithmes d'apprentissage automatique dans plusieurs domaines a fourni aux humains des opportunités de s'attaquer à certains de leurs travaux difficiles à gérer par les systèmes d'apprentissage automatique. Ces tâches semblent sans effort pour les machines et nécessitent moins de temps car la quantité de textes ou de spams à classer est énorme. Par conséquent, dans son article, nous proposons trois modèles différents pour la tâche de détection des courriels indésirables. Les trois modèles sont formés et validés sur un ensemble de données de spam public. Expérimentalement, les modèles ont fonctionné différemment et il a été constaté que les Bayes naïfs surpassaient les autres algorithmes d'apprentissage automatique en termes de précision et d'autres mesures d'évaluation.Translated Description (Spanish)
Resumen Recientemente, el aprendizaje automático se ha aplicado en diferentes áreas principales, como la clasificación de textos, la traducción automática y la detección de spam. El gran rendimiento de los algoritmos de aprendizaje automático en varios campos brindó a los humanos la oportunidad de abordar algunos de sus trabajos difíciles para ser manejados por sistemas de aprendizaje automático. Estas tareas parecen fáciles para las máquinas y requieren menos tiempo, ya que la cantidad de mensajes de texto o spam que deben clasificarse es enorme. De ahí que en su ponencia propongamos tres modelos diferentes para la tarea de detección de spam en correos electrónicos. Los tres modelos están entrenados y validados en un conjunto de datos públicos de spam. Experimentalmente, los modelos funcionaron de manera diferente y se vio que el Naïve Bayes superó a los otros algoritmos de aprendizaje automático en términos de precisión y otras métricas de evaluación.Files
      
        latest.pdf.pdf
        
      
    
    
      
        Files
         (368.2 kB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| md5:1b079f4feaaa7998c4221d6921b8c4c2 | 368.2 kB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
- مقارنة بين ثلاثة نماذج للتعلم الآلي للكشف عن رسائل البريد الإلكتروني غير المرغوب فيها
- Translated title (French)
- Comparaison de trois modèles d'apprentissage automatique pour la détection des courriels indésirables
- Translated title (Spanish)
- Comparación de tres modelos de aprendizaje automático para la detección de spam de correos electrónicos
Identifiers
- Other
- https://openalex.org/W4317796225
- DOI
- 10.21203/rs.3.rs-1445507/v1
References
- https://openalex.org/W1851422430
- https://openalex.org/W2726343436
- https://openalex.org/W2803620130
- https://openalex.org/W2884352268
- https://openalex.org/W327991062