An Intelligent Framework Based on Deep Learning for SMS and e-mail Spam Detection
- 1. Pir Mehr Ali Shah Arid Agriculture University
- 2. Gomal University
- 3. Taibah University
- 4. University of Leicester
Description
The use of short message service (SMS) and e-mail have increased too much over the last decades. 80% of people do not read e-mails while 98% of cell phone users daily read their SMS. However, these communication media are unsafe and can produce malicious attacks called spam. The e-mails that pretend to be from a trusted company to provide "financial or personal information" are phishing e-mails. These e-mails contain some links; users might download malicious software on their computers when they click on them. Most techniques and models are developed to automatically detect these "SMS and e-mails" but none of them achieved 100% accuracy. In previous studies using machine learning (ML), spam detection using a small dataset has resulted in lower accuracy. To counter this problem, in this paper, multiple classifiers of ML and a classifier of deep learning (DL) were applied to the SMS and e-mail dataset for spam detection with higher accuracy. After conducting experiments on the real dataset, the researchers concluded that the proposed system performed better and more accurately than previously existing models. Specifically, the support vector machine (SVM) classifier outperformed all others. These results suggest that SVM is the optimal choice for classification purposes.
Translated Descriptions
Translated Description (Arabic)
زاد استخدام خدمة الرسائل القصيرة (SMS) والبريد الإلكتروني بشكل كبير خلال العقود الماضية. 80 ٪ من الناس لا يقرأون رسائل البريد الإلكتروني بينما 98 ٪ من مستخدمي الهواتف المحمولة يقرؤون رسائلهم النصية القصيرة يوميًا. ومع ذلك، فإن وسائط الاتصال هذه غير آمنة ويمكن أن تنتج هجمات ضارة تسمى الرسائل غير المرغوب فيها. رسائل البريد الإلكتروني التي تتظاهر بأنها من شركة موثوق بها لتقديم "معلومات مالية أو شخصية" هي رسائل بريد إلكتروني احتيالية. تحتوي رسائل البريد الإلكتروني هذه على بعض الروابط ؛ قد يقوم المستخدمون بتنزيل برامج ضارة على أجهزة الكمبيوتر الخاصة بهم عند النقر عليها. تم تطوير معظم التقنيات والنماذج للكشف التلقائي عن هذه "الرسائل النصية القصيرة ورسائل البريد الإلكتروني" ولكن لم يحقق أي منها دقة بنسبة 100 ٪. في الدراسات السابقة باستخدام التعلم الآلي (ML)، أدى اكتشاف البريد العشوائي باستخدام مجموعة بيانات صغيرة إلى دقة أقل. لمواجهة هذه المشكلة، في هذه الورقة، تم تطبيق مصنفات متعددة لتعلم الآلة ومصنف للتعلم العميق (DL) على مجموعة بيانات الرسائل النصية القصيرة والبريد الإلكتروني للكشف عن البريد العشوائي بدقة أعلى. بعد إجراء تجارب على مجموعة البيانات الحقيقية، خلص الباحثون إلى أن النظام المقترح كان أداؤه أفضل وأكثر دقة من النماذج الموجودة سابقًا. على وجه التحديد، تفوق مصنف آلة ناقلات الدعم (SVM) على جميع المصنفات الأخرى. تشير هذه النتائج إلى أن SVM هو الخيار الأمثل لأغراض التصنيف.Translated Description (French)
L'utilisation du service de messages courts (SMS) et du courrier électronique a trop augmenté au cours des dernières décennies. 80 % des personnes ne lisent pas les e-mails tandis que 98 % des utilisateurs de téléphones portables lisent quotidiennement leurs SMS. Cependant, ces supports de communication ne sont pas sûrs et peuvent produire des attaques malveillantes appelées spam. Les e-mails qui prétendent provenir d'une entreprise de confiance pour fournir des « informations financières ou personnelles » sont des e-mails d'hameçonnage. Ces e-mails contiennent des liens ; les utilisateurs peuvent télécharger des logiciels malveillants sur leurs ordinateurs lorsqu'ils cliquent dessus. La plupart des techniques et des modèles sont développés pour détecter automatiquement ces « SMS et e-mails », mais aucun d'entre eux n'a atteint une précision de 100 %. Dans des études antérieures utilisant l'apprentissage automatique (ML), la détection du spam à l'aide d'un petit ensemble de données a entraîné une précision plus faible. Pour contrer ce problème, dans cet article, plusieurs classificateurs de ML et un classificateur d'apprentissage profond (DL) ont été appliqués à l'ensemble de données SMS et e-mail pour la détection du spam avec une plus grande précision. Après avoir mené des expériences sur l'ensemble de données réelles, les chercheurs ont conclu que le système proposé fonctionnait mieux et plus précisément que les modèles existants. Plus précisément, le classificateur de machine à vecteurs de support (SVM) a surpassé tous les autres. Ces résultats suggèrent que la MVS est le choix optimal à des fins de classification.Translated Description (Spanish)
El uso del servicio de mensajes cortos (SMS) y el correo electrónico ha aumentado demasiado en las últimas décadas. El 80% de las personas no lee correos electrónicos, mientras que el 98% de los usuarios de teléfonos celulares leen diariamente sus SMS. Sin embargo, estos medios de comunicación no son seguros y pueden producir ataques maliciosos llamados spam. Los correos electrónicos que pretenden ser de una empresa de confianza para proporcionar "información financiera o personal" son correos electrónicos de phishing. Estos correos electrónicos contienen algunos enlaces; los usuarios pueden descargar software malicioso en sus equipos cuando hacen clic en ellos. La mayoría de las técnicas y modelos están desarrollados para detectar automáticamente estos "SMS y correos electrónicos", pero ninguno de ellos logró una precisión del 100%. En estudios previos que utilizan aprendizaje automático (ML), la detección de spam utilizando un pequeño conjunto de datos ha dado como resultado una menor precisión. Para contrarrestar este problema, en este documento, se aplicaron múltiples clasificadores de ML y un clasificador de aprendizaje profundo (DL) al conjunto de datos de SMS y correo electrónico para la detección de spam con mayor precisión. Después de realizar experimentos en el conjunto de datos real, los investigadores concluyeron que el sistema propuesto funcionaba mejor y con mayor precisión que los modelos existentes anteriormente. Específicamente, el clasificador de la máquina de vectores de soporte (SVM) superó a todos los demás. Estos resultados sugieren que la SVM es la opción óptima para fines de clasificación.Files
6648970.pdf.pdf
Files
(15.9 kB)
Name | Size | Download all |
---|---|---|
md5:5b345930383a6aa94c2fe363242322ea
|
15.9 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- إطار ذكي يعتمد على التعلم العميق للكشف عن الرسائل النصية القصيرة والبريد الإلكتروني غير المرغوب فيها
- Translated title (French)
- Un cadre intelligent basé sur le Deep Learning pour la détection de spam par SMS et e-mail
- Translated title (Spanish)
- Un marco inteligente basado en el aprendizaje profundo para la detección de spam por SMS y correo electrónico
Identifiers
- Other
- https://openalex.org/W4386880507
- DOI
- 10.1155/2023/6648970
References
- https://openalex.org/W1141949320
- https://openalex.org/W1968955064
- https://openalex.org/W1983838073
- https://openalex.org/W1996262124
- https://openalex.org/W2009729849
- https://openalex.org/W2030711406
- https://openalex.org/W2036166268
- https://openalex.org/W2074339481
- https://openalex.org/W2113922297
- https://openalex.org/W2136828682
- https://openalex.org/W2171602566
- https://openalex.org/W2185177373
- https://openalex.org/W2338083885
- https://openalex.org/W2471881951
- https://openalex.org/W2483572929
- https://openalex.org/W2567149662
- https://openalex.org/W2571819921
- https://openalex.org/W2576815293
- https://openalex.org/W2591945600
- https://openalex.org/W2609225916
- https://openalex.org/W2724222212
- https://openalex.org/W2753189782
- https://openalex.org/W2754695216
- https://openalex.org/W2771340047
- https://openalex.org/W2783922631
- https://openalex.org/W2797652130
- https://openalex.org/W2801332331
- https://openalex.org/W2801802177
- https://openalex.org/W2886073571
- https://openalex.org/W2888021909
- https://openalex.org/W2901292257
- https://openalex.org/W2917544878
- https://openalex.org/W2921477761
- https://openalex.org/W2962707464
- https://openalex.org/W2962777114
- https://openalex.org/W2971852873
- https://openalex.org/W2996930874
- https://openalex.org/W3011823135
- https://openalex.org/W3044192484
- https://openalex.org/W3082362580
- https://openalex.org/W3088451060
- https://openalex.org/W3170569526
- https://openalex.org/W4295837454
- https://openalex.org/W4298436655
- https://openalex.org/W4313324655
- https://openalex.org/W4313640622
- https://openalex.org/W4318262241
- https://openalex.org/W4321600494