Published June 30, 2023 | Version v1
Publication Open

Feature Selection and Dynamic Network Traffic Congestion Classification based on Machine Learning for Internet of Things

  • 1. Beni-Suef University
  • 2. University of Craiova

Description

The network traffic congestion classifier is essential for network monitoring systems. Network traffic characterization is a methodology to classify traffic into several classes supporting various attributes. In this paper, payload-based classification is suggested for network traffic characterization. It has a broad scope of utilization like network security assessment, intrusion identification, QoS supplier, et cetera; furthermore, it has significance in investigating different suspicious movements in the network. Numerous supervised classification techniques like Support Vector Machines and unsupervised clustering methods like K-Means connected are used in traffic classification. In current network conditions, minimal supervised data and unfamiliar applications influence the usual classification procedure's performance. This paper implements a methodology for network traffic classification using clustering, feature extraction, and variety for the Internet of Things (IoT). Further, K-Means is used for network traffic clustering datasets, and feature extraction is performed on grouped information. KNN, Naïve Bayes, and Decision Tree classification methods classify network traffic because of extracted features, which presents a performance measurement between these classification algorithms. The results discuss the best machine learning algorithm for network congestion classification. According to the outcome, clustering (k-means) with network classification (Decision Tree) generates a higher accuracy, 86.45 %, than other clustering and network classification

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد مصنف ازدحام حركة مرور الشبكة ضروريًا لأنظمة مراقبة الشبكة. توصيف حركة مرور الشبكة هو منهجية لتصنيف حركة المرور إلى عدة فئات تدعم سمات مختلفة. في هذه الورقة، يُقترح التصنيف القائم على الحمولة لتوصيف حركة مرور الشبكة. لديها نطاق واسع من الاستخدام مثل تقييم أمن الشبكة، وتحديد التسلل، ومورد جودة الخدمة، وما إلى ذلك ؛ علاوة على ذلك، لها أهمية في التحقيق في التحركات المشبوهة المختلفة في الشبكة. يتم استخدام العديد من تقنيات التصنيف الخاضعة للإشراف مثل آلات ناقلات الدعم وطرق التجميع غير الخاضعة للإشراف مثل K - Means connected في تصنيف حركة المرور. في ظروف الشبكة الحالية، يؤثر الحد الأدنى من البيانات الخاضعة للإشراف والتطبيقات غير المألوفة على أداء إجراء التصنيف المعتاد. تنفذ هذه الورقة منهجية لتصنيف حركة مرور الشبكة باستخدام التجميع واستخراج الميزات والتنوع لإنترنت الأشياء (IoT). علاوة على ذلك، يتم استخدام K - Means لمجموعات بيانات تجميع حركة مرور الشبكة، ويتم استخراج الميزات على معلومات مجمعة. تصنف طرق تصنيف KNN و Naïve Bayes و Decision Tree حركة مرور الشبكة بسبب الميزات المستخرجة، والتي تقدم قياسًا للأداء بين خوارزميات التصنيف هذه. تناقش النتائج أفضل خوارزمية للتعلم الآلي لتصنيف ازدحام الشبكة. وفقًا للنتيجة، فإن التجميع العنقودي (k - means) مع تصنيف الشبكة (شجرة القرار) يولد دقة أعلى، 86.45 ٪، من التجميع العنقودي الآخر وتصنيف الشبكة

Translated Description (French)

Le classificateur de congestion du trafic réseau est essentiel pour les systèmes de surveillance du réseau. La caractérisation du trafic réseau est une méthodologie permettant de classer le trafic en plusieurs classes prenant en charge divers attributs. Dans cet article, une classification basée sur la charge utile est suggérée pour la caractérisation du trafic réseau. Il a un large champ d'utilisation comme l'évaluation de la sécurité du réseau, l'identification des intrusions, le fournisseur de QoS, etc. ; en outre, il a une importance dans l'enquête sur différents mouvements suspects dans le réseau. De nombreuses techniques de classification supervisées telles que les machines à vecteurs de support et les méthodes de regroupement non supervisées telles que les K-Means connectés sont utilisées dans la classification du trafic. Dans les conditions actuelles du réseau, les données supervisées minimales et les applications inconnues influencent les performances de la procédure de classification habituelle. Cet article met en œuvre une méthodologie pour la classification du trafic réseau à l'aide du clustering, de l'extraction de fonctionnalités et de la variété pour l'Internet des objets (IoT). En outre, K-Means est utilisé pour des ensembles de données de regroupement de trafic réseau, et l'extraction de caractéristiques est effectuée sur des informations groupées. Les méthodes de classification KNN, Naïve Bayes et Decision Tree classent le trafic réseau en fonction des fonctionnalités extraites, ce qui présente une mesure de performance entre ces algorithmes de classification. Les résultats discutent du meilleur algorithme d'apprentissage automatique pour la classification de la congestion du réseau. Selon le résultat, le regroupement (k-means) avec une classification de réseau (arbre de décision) génère une précision plus élevée, 86,45 %, que les autres regroupements et classifications de réseau

Translated Description (Spanish)

El clasificador de congestión de tráfico de red es esencial para los sistemas de monitoreo de red. La caracterización del tráfico de red es una metodología para clasificar el tráfico en varias clases que admiten varios atributos. En este documento, se sugiere una clasificación basada en la carga útil para la caracterización del tráfico de red. Tiene un amplio alcance de utilización, como la evaluación de la seguridad de la red, la identificación de intrusos, el proveedor de QoS, etc.; además, tiene importancia en la investigación de diferentes movimientos sospechosos en la red. En la clasificación del tráfico se utilizan numerosas técnicas de clasificación supervisada, como las máquinas de vectores de soporte, y métodos de agrupación no supervisados, como las K-Means conectadas. En las condiciones actuales de la red, los datos supervisados mínimos y las aplicaciones desconocidas influyen en el rendimiento del procedimiento de clasificación habitual. Este documento implementa una metodología para la clasificación del tráfico de red utilizando clustering, extracción de características y variedad para el Internet de las cosas (IoT). Además, K-Means se utiliza para conjuntos de datos de clúster de tráfico de red, y la extracción de características se realiza en información agrupada. Los métodos de clasificación KNN, Naïve Bayes y Decision Tree clasifican el tráfico de red debido a las características extraídas, lo que presenta una medición del rendimiento entre estos algoritmos de clasificación. Los resultados discuten el mejor algoritmo de aprendizaje automático para la clasificación de la congestión de la red. Según el resultado, la agrupación (k-medias) con clasificación de red (árbol de decisiones) genera una mayor precisión, 86,45 %, que otras agrupaciones y clasificaciones de red

Files

98.pdf

Files (1.2 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:635e495ef51d3bf0e55f4ab9d48524fb
1.2 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
اختيار الميزة وتصنيف ازدحام حركة مرور الشبكة الديناميكي بناءً على التعلم الآلي لإنترنت الأشياء
Translated title (French)
Sélection des fonctionnalités et classification dynamique de la congestion du trafic réseau basée sur l'apprentissage automatique pour l'Internet des objets
Translated title (Spanish)
Selección de funciones y clasificación dinámica de congestión de tráfico de red basada en aprendizaje automático para Internet de las cosas

Identifiers

Other
https://openalex.org/W4383822055
DOI
10.31185/wjcms.150

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Egypt

References

  • https://openalex.org/W1481277647
  • https://openalex.org/W1483650506
  • https://openalex.org/W1521553548
  • https://openalex.org/W166342712
  • https://openalex.org/W1980801609
  • https://openalex.org/W1985987493
  • https://openalex.org/W1994258596
  • https://openalex.org/W2011628134
  • https://openalex.org/W2012095206
  • https://openalex.org/W2017658349
  • https://openalex.org/W2025001960
  • https://openalex.org/W2072759571
  • https://openalex.org/W2078220749
  • https://openalex.org/W2099878307
  • https://openalex.org/W2101222264
  • https://openalex.org/W2112219590
  • https://openalex.org/W2119271160
  • https://openalex.org/W2119436991
  • https://openalex.org/W2138449377
  • https://openalex.org/W2140542782
  • https://openalex.org/W2149274049
  • https://openalex.org/W2156123711
  • https://openalex.org/W2334641510
  • https://openalex.org/W2511505324
  • https://openalex.org/W2611847050
  • https://openalex.org/W2750674396
  • https://openalex.org/W2942890744
  • https://openalex.org/W2963197901
  • https://openalex.org/W2966297204
  • https://openalex.org/W3025804100
  • https://openalex.org/W3032948302
  • https://openalex.org/W3105068857
  • https://openalex.org/W3109401222
  • https://openalex.org/W3127070321
  • https://openalex.org/W3177048707
  • https://openalex.org/W3210206998
  • https://openalex.org/W4296065799
  • https://openalex.org/W4311988202
  • https://openalex.org/W4328026319