Sliding principal component and dynamic reward reinforcement learning based IIoT attack detection
Creators
- 1. Vellore Institute of Technology University
- 2. Alliance University
- 3. King Abdulaziz University
- 4. Amhara Regional Agricultural Research Institute
Description
The Internet of Things (IoT) involves the gathering of all those devices that connect to the Internet with the purpose of collecting and sharing data. The application of IoT in the different sectors, including health, industry has also picked up the threads to augment over the past few years. The IoT and, by integrity, the IIoT, are found to be highly susceptible to different types of threats and attacks owing to the networks nature that in turn leads to even poor outcomes (i.e., increasing error rate). Hence, it is critical to design attack detection systems that can provide the security of IIoT networks. To overcome this research work of IIoT attack detection in large amount of evolutions is failed to determine the certain attacks resulting in a minimum detection performance, reinforcement learning-based attack detection method called sliding principal component and dynamic reward reinforcement learning (SPC-DRRL) for detecting various IIoT network attacks is introduced. In the first stage of this research methodology, preprocessing of raw TON_IoT dataset is performed by employing min-max normalization scaling function to obtain normalized values with same scale. Next, with the processed sample data as output, to extract data from multi-sources (i.e., different service profiles from the dataset), a robust log likelihood sliding principal component-based feature extraction algorithm is applied with an arbitrary size sliding window to extract computationally-efficient features. Finally, dynamic reward reinforcement learning-based IIoT attack detection model is presented to control the error rate involved in the design. Here, with the design of dynamic reward function and introducing incident repository that not only generates the reward function in an arbitrary fashion but also stores the action results in the incident repository for the next training, therefore reducing the attack detection error rate. Moreover, an IIoT attack detection system based on SPC-DRRL is constructed. Finally, we verify the algorithm on the ToN_IoT dataset of University of New South Wales Australia. The experimental results show that the IIoT attack detection time and overhead along with the error rate are reduced considerably with higher accuracy than that of traditional reinforcement learning methods.
Translated Descriptions
Translated Description (Arabic)
يتضمن إنترنت الأشياء (IoT) جمع كل تلك الأجهزة التي تتصل بالإنترنت بغرض جمع البيانات ومشاركتها. كما أن تطبيق إنترنت الأشياء في القطاعات المختلفة، بما في ذلك الصحة، والصناعة قد التقطت الخيوط لتعزيزها على مدى السنوات القليلة الماضية. وجد أن إنترنت الأشياء، وبالنزاهة، إنترنت الأشياء، عرضة بشكل كبير لأنواع مختلفة من التهديدات والهجمات بسبب طبيعة الشبكات التي تؤدي بدورها إلى نتائج سيئة (أي زيادة معدل الخطأ). وبالتالي، من الأهمية بمكان تصميم أنظمة الكشف عن الهجمات التي يمكن أن توفر أمن شبكات إنترنت الأشياء الصناعية. للتغلب على هذا العمل البحثي للكشف عن هجمات إنترنت الأشياء الصناعية في كمية كبيرة من التطورات، فشل في تحديد الهجمات المعينة التي تؤدي إلى الحد الأدنى من أداء الكشف، وطريقة الكشف عن الهجمات القائمة على التعلم المعزز تسمى المكون الرئيسي المنزلق وتعلم تعزيز المكافأة الديناميكية (SPC - DRRL) للكشف عن مختلف هجمات شبكة إنترنت الأشياء الصناعية. في المرحلة الأولى من منهجية البحث هذه، يتم إجراء المعالجة المسبقة لمجموعة بيانات TON_IoT الخام من خلال استخدام وظيفة قياس التطبيع بالحد الأدنى الأقصى للحصول على قيم طبيعية بنفس المقياس. بعد ذلك، مع بيانات العينة المعالجة كمخرجات، لاستخراج البيانات من مصادر متعددة (أي ملفات تعريف خدمة مختلفة من مجموعة البيانات)، يتم تطبيق خوارزمية استخراج الميزات الرئيسية القائمة على المكون الرئيسي لاحتمال انزلاق السجل القوي مع نافذة منزلقة ذات حجم عشوائي لاستخراج ميزات فعالة حسابيًا. أخيرًا، يتم تقديم نموذج الكشف عن هجمات إنترنت الأشياء الصناعية القائم على تعزيز المكافآت الديناميكية للتحكم في معدل الخطأ الذي ينطوي عليه التصميم. هنا، مع تصميم وظيفة المكافأة الديناميكية وإدخال مستودع الحوادث الذي لا ينشئ وظيفة المكافأة بطريقة تعسفية فحسب، بل يخزن أيضًا نتائج الإجراء في مستودع الحوادث للتدريب التالي، وبالتالي يقلل من معدل خطأ اكتشاف الهجوم. علاوة على ذلك، تم إنشاء نظام للكشف عن هجمات إنترنت الأشياء الصناعية يعتمد على SPC - DRRL. أخيرًا، نتحقق من الخوارزمية الموجودة في مجموعة بيانات ToN_IoT لجامعة نيو ساوث ويلز أستراليا. تُظهر النتائج التجريبية أن وقت اكتشاف هجوم إنترنت الأشياء الصناعية والنفقات العامة جنبًا إلى جنب مع معدل الخطأ يتم تقليلها بشكل كبير بدقة أعلى من طرق التعلم المعززة التقليدية.Translated Description (French)
L'Internet des objets (IoT) implique la collecte de tous les appareils qui se connectent à Internet dans le but de collecter et de partager des données. L'application de l'IoT dans les différents secteurs, y compris la santé, l'industrie a également repris les fils pour augmenter au cours des dernières années. L'IoT et, par intégrité, l'IIoT, se révèlent très sensibles à différents types de menaces et d'attaques en raison de la nature des réseaux qui, à son tour, conduit à des résultats même médiocres (c'est-à-dire un taux d'erreur croissant). Par conséquent, il est essentiel de concevoir des systèmes de détection des attaques qui peuvent assurer la sécurité des réseaux IIoT. Pour surmonter ce travail de recherche sur la détection d'attaques IIoT dans une grande quantité d'évolutions, il est impossible de déterminer certaines attaques entraînant une performance de détection minimale, une méthode de détection d'attaques basée sur l'apprentissage par renforcement appelée composant principal glissant et apprentissage par renforcement de récompense dynamique (SPC-DRRL) pour détecter diverses attaques réseau IIoT est introduite. Dans la première étape de cette méthodologie de recherche, le prétraitement de l'ensemble de données RAW TON_IoT est effectué en utilisant la fonction de mise à l'échelle de normalisation min-max pour obtenir des valeurs normalisées avec la même échelle. Ensuite, avec les données d'échantillon traitées en sortie, pour extraire des données de sources multiples (c'est-à-dire, différents profils de service à partir de l'ensemble de données), un algorithme d'extraction de caractéristiques basé sur des composants principaux glissants de probabilité de journal robuste est appliqué avec une fenêtre glissante de taille arbitraire pour extraire des caractéristiques efficaces sur le plan du calcul. Enfin, un modèle de détection d'attaque IIoT basé sur l'apprentissage par renforcement de récompense dynamique est présenté pour contrôler le taux d'erreur impliqué dans la conception. Ici, avec la conception de la fonction de récompense dynamique et l'introduction d'un référentiel d'incidents qui non seulement génère la fonction de récompense de manière arbitraire, mais stocke également les résultats de l'action dans le référentiel d'incidents pour la formation suivante, réduisant ainsi le taux d'erreur de détection d'attaque. De plus, un système de détection d'attaque IIoT basé sur SPC-DRRL est construit. Enfin, nous vérifions l'algorithme sur l'ensemble de données ToN_IoT de l'Université de Nouvelle-Galles du Sud en Australie. Les résultats expérimentaux montrent que le temps et les frais généraux de détection des attaques IIoT ainsi que le taux d'erreur sont considérablement réduits avec une précision supérieure à celle des méthodes d'apprentissage par renforcement traditionnelles.Translated Description (Spanish)
El Internet de las cosas (IoT) implica la recopilación de todos aquellos dispositivos que se conectan a Internet con el propósito de recopilar y compartir datos. La aplicación de IoT en los diferentes sectores, incluida la salud, la industria también ha recogido los hilos para aumentar en los últimos años. El IoT y, por integridad, el IIoT, son altamente susceptibles a diferentes tipos de amenazas y ataques debido a la naturaleza de las redes que a su vez conduce a resultados incluso pobres (es decir, aumento de la tasa de error). Por lo tanto, es fundamental diseñar sistemas de detección de ataques que puedan proporcionar la seguridad de las redes IIoT. Para superar este trabajo de investigación de la detección de ataques IIoT en una gran cantidad de evoluciones, no se logran determinar los ciertos ataques que resultan en un rendimiento de detección mínimo, se introduce un método de detección de ataques basado en el aprendizaje de refuerzo llamado componente principal deslizante y aprendizaje dinámico de refuerzo de recompensa (SPC-DRRL) para detectar varios ataques de red IIoT. En la primera etapa de esta metodología de investigación, el preprocesamiento del conjunto de datos TON_IoT sin procesar se realiza empleando la función de escala de normalización mínima-máxima para obtener valores normalizados con la misma escala. A continuación, con los datos de muestra procesados como salida, para extraer datos de múltiples fuentes (es decir, diferentes perfiles de servicio del conjunto de datos), se aplica un algoritmo de extracción de características basado en componentes principales deslizante de probabilidad de registro robusto con una ventana deslizante de tamaño arbitrario para extraer características computacionalmente eficientes. Finalmente, se presenta un modelo de detección de ataques IIoT basado en el aprendizaje de refuerzo dinámico de recompensas para controlar la tasa de error involucrada en el diseño. Aquí, con el diseño de la función de recompensa dinámica y la introducción del repositorio de incidentes que no solo genera la función de recompensa de manera arbitraria, sino que también almacena los resultados de la acción en el repositorio de incidentes para la próxima capacitación, lo que reduce la tasa de error de detección de ataques. Además, se construye un sistema de detección de ataques IIoT basado en SPC-DRRL. Finalmente, verificamos el algoritmo en el conjunto de datos ToN_IoT de la Universidad de Nueva Gales del Sur, Australia. Los resultados experimentales muestran que el tiempo y la sobrecarga de detección de ataques IIoT junto con la tasa de error se reducen considerablemente con mayor precisión que los métodos tradicionales de aprendizaje por refuerzo.Files
s41598-023-46746-0.pdf.pdf
Files
(2.4 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:3962191272e51513db29c1e7f32f46b2
|
2.4 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- انزلاق المكون الرئيسي وكشف هجوم إنترنت الأشياء الصناعية القائم على تعزيز المكافآت الديناميكية
- Translated title (French)
- Composante principale glissante et apprentissage par renforcement de récompense dynamique basé sur la détection d'attaque IIoT
- Translated title (Spanish)
- Detección de ataques IIoT basada en el componente principal deslizante y el refuerzo dinámico de recompensas
Identifiers
- Other
- https://openalex.org/W4389057519
- DOI
- 10.1038/s41598-023-46746-0
References
- https://openalex.org/W3022437389
- https://openalex.org/W3098309759
- https://openalex.org/W3154213948
- https://openalex.org/W3166434018
- https://openalex.org/W3179240416
- https://openalex.org/W3188199838
- https://openalex.org/W3196498354
- https://openalex.org/W3203932036
- https://openalex.org/W3206599325
- https://openalex.org/W4200138341
- https://openalex.org/W4280653480
- https://openalex.org/W4285106051
- https://openalex.org/W4285227650
- https://openalex.org/W4285294415
- https://openalex.org/W4288440925
- https://openalex.org/W4293498872
- https://openalex.org/W4297329009
- https://openalex.org/W4297830846
- https://openalex.org/W4312847977
- https://openalex.org/W4327893913
- https://openalex.org/W4381850058