Published January 1, 2023 | Version v1
Publication

Android malicious attacks detection models using machine learning techniques based on permissions

  • 1. University of Jordan
  • 2. Saudi Electronic University
  • 3. Applied Science Private University
  • 4. Middle East University

Description

The Android operating system is the most used mobile operating system in the world, and it is one of the most popular operating systems for different kinds of devices from smartwatches, IoT, and TVs to mobiles and cockpits in cars. Security is the main challenge to any operating system. Android malware attacks and vulnerabilities are known as emerging risks for mobile devices. The development of Android malware has been observed to be at an accelerated speed. Most Android security breaches permitted by permission misuse are amongst the most critical and prevalent issues threatening Android OS security. This research performs several studies on malware and non-malware applications to provide a recently updated dataset. The goal of proposed models is to find a combination of noise-cleaning algorithms, features selection techniques, and classification algorithms that are noise-tolerant and can achieve high accuracy results in detecting new Android malware. The results from the empirical experiments show that the proposed models are able to detect Android malware with an accuracy that reaches 87%, despite the noise in the dataset. We also find that the best classification results are achieved using the RF algorithm. This work can be extended in many ways by applying higher noise ratios and running more classifiers and optimizers.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

نظام التشغيل أندرويد هو نظام التشغيل المحمول الأكثر استخدامًا في العالم، وهو أحد أنظمة التشغيل الأكثر شيوعًا لأنواع مختلفة من الأجهزة من الساعات الذكية وإنترنت الأشياء وأجهزة التلفزيون إلى الهواتف المحمولة وقمرات القيادة في السيارات. الأمن هو التحدي الرئيسي لأي نظام تشغيل. تُعرف هجمات البرامج الضارة ونقاط الضعف في Android بأنها مخاطر ناشئة على الأجهزة المحمولة. لوحظ أن تطوير برامج أندرويد الضارة يتم بسرعة متسارعة. تعد معظم خروقات أمان Android المسموح بها بسبب إساءة استخدام الأذونات من بين أكثر المشكلات خطورة وانتشارًا التي تهدد أمان نظام التشغيل Android. يُجري هذا البحث العديد من الدراسات حول البرمجيات الخبيثة والتطبيقات غير الخبيثة لتوفير مجموعة بيانات محدثة مؤخرًا. الهدف من النماذج المقترحة هو العثور على مزيج من خوارزميات تنظيف الضوضاء وتقنيات اختيار الميزات وخوارزميات التصنيف التي تتسامح مع الضوضاء ويمكن أن تحقق نتائج عالية الدقة في الكشف عن البرامج الضارة الجديدة للأندرويد. وتظهر نتائج التجارب التجريبية أن النماذج المقترحة قادرة على اكتشاف برمجيات أندرويد الخبيثة بدقة تصل إلى 87%، على الرغم من الضوضاء في مجموعة البيانات. كما نجد أن أفضل نتائج التصنيف تتحقق باستخدام خوارزمية التردد اللاسلكي. يمكن تمديد هذا العمل بعدة طرق من خلال تطبيق نسب ضوضاء أعلى وتشغيل المزيد من المصنفات والمحسنات.

Translated Description (French)

Le système d'exploitation Android est le système d'exploitation mobile le plus utilisé au monde, et c'est l'un des systèmes d'exploitation les plus populaires pour différents types d'appareils, des smartwatches, IoT et téléviseurs aux mobiles et cockpits dans les voitures. La sécurité est le principal défi de tout système d'exploitation. Les attaques et les vulnérabilités des logiciels malveillants Android sont connues sous le nom de risques émergents pour les appareils mobiles. Le développement de logiciels malveillants Android a été observé à une vitesse accélérée. La plupart des violations de sécurité Android autorisées par une utilisation abusive des autorisations font partie des problèmes les plus critiques et les plus répandus menaçant la sécurité du système d'exploitation Android. Cette recherche réalise plusieurs études sur les logiciels malveillants et les applications non malveillantes pour fournir un ensemble de données récemment mis à jour. L'objectif des modèles proposés est de trouver une combinaison d'algorithmes de nettoyage du bruit, de techniques de sélection des fonctionnalités et d'algorithmes de classification qui sont tolérants au bruit et peuvent obtenir des résultats de haute précision dans la détection de nouveaux logiciels malveillants Android. Les résultats des expériences empiriques montrent que les modèles proposés sont capables de détecter les logiciels malveillants Android avec une précision qui atteint 87%, malgré le bruit dans l'ensemble de données. Nous constatons également que les meilleurs résultats de classification sont obtenus à l'aide de l'algorithme RF. Ce travail peut être étendu de nombreuses façons en appliquant des rapports de bruit plus élevés et en exécutant plus de classificateurs et d'optimiseurs.

Translated Description (Spanish)

El sistema operativo Android es el sistema operativo móvil más utilizado en el mundo, y es uno de los sistemas operativos más populares para diferentes tipos de dispositivos, desde relojes inteligentes, IoT y televisores hasta móviles y cabinas en automóviles. La seguridad es el principal desafío para cualquier sistema operativo. Los ataques de malware y las vulnerabilidades de Android se conocen como riesgos emergentes para dispositivos móviles. Se ha observado que el desarrollo de malware para Android se está acelerando. La mayoría de las infracciones de seguridad de Android permitidas por el uso indebido de permisos se encuentran entre los problemas más críticos y frecuentes que amenazan la seguridad del sistema operativo Android. Esta investigación realiza varios estudios sobre aplicaciones maliciosas y no maliciosas para proporcionar un conjunto de datos recientemente actualizado. El objetivo de los modelos propuestos es encontrar una combinación de algoritmos de limpieza de ruido, técnicas de selección de características y algoritmos de clasificación que sean tolerantes al ruido y puedan lograr resultados de alta precisión en la detección de nuevo malware para Android. Los resultados de los experimentos empíricos muestran que los modelos propuestos son capaces de detectar malware para Android con una precisión que alcanza el 87%, a pesar del ruido en el conjunto de datos. También encontramos que los mejores resultados de clasificación se logran utilizando el algoritmo RF. Este trabajo se puede ampliar de muchas maneras aplicando relaciones de ruido más altas y ejecutando más clasificadores y optimizadores.

Additional details

Additional titles

Translated title (Arabic)
نماذج الكشف عن الهجمات الخبيثة للأندرويد باستخدام تقنيات التعلم الآلي بناءً على الأذونات
Translated title (French)
Modèles de détection d'attaques malveillantes Android utilisant des techniques d'apprentissage automatique basées sur les autorisations
Translated title (Spanish)
Modelos de detección de ataques maliciosos en Android que utilizan técnicas de aprendizaje automático basadas en permisos

Identifiers

Other
https://openalex.org/W4386048940
DOI
10.5267/j.ijdns.2023.8.019

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Jordan

References

  • https://openalex.org/W4386048940