Hybrid convolution neural network with channel attention mechanism for sensor-based human activity recognition
- 1. University of Phayao
- 2. King Mongkut's University of Technology North Bangkok
Description
Abstract In the field of machine intelligence and ubiquitous computing, there has been a growing interest in human activity recognition using wearable sensors. Over the past few decades, researchers have extensively explored learning-based methods to develop effective models for identifying human behaviors. Deep learning algorithms, known for their powerful feature extraction capabilities, have played a prominent role in this area. These algorithms can conveniently extract features that enable excellent recognition performance. However, many successful deep learning approaches have been built upon complex models with multiple hyperparameters. This paper examines the current research on human activity recognition using deep learning techniques and discusses appropriate recognition strategies. Initially, we employed multiple convolutional neural networks to determine an effective architecture for human activity recognition. Subsequently, we developed a hybrid convolutional neural network that incorporates a channel attention mechanism. This mechanism enables the network to capture deep spatio-temporal characteristics in a hierarchical manner and distinguish between different human movements in everyday life. Our investigations, using the UCI-HAR, WISDM, and IM-WSHA datasets, demonstrated that our proposed model, which includes cross-channel multi-size convolution transformations, outperformed previous deep learning architectures with accuracy rates of 98.92%, 98.80%, and 98.45% respectively. These results indicate that the suggested model surpasses state-of-the-art approaches in terms of overall accuracy, as supported by the research findings.
Translated Descriptions
Translated Description (Arabic)
في مجال الذكاء الآلي والحوسبة في كل مكان، كان هناك اهتمام متزايد بالتعرف على النشاط البشري باستخدام أجهزة الاستشعار القابلة للارتداء. على مدى العقود القليلة الماضية، استكشف الباحثون على نطاق واسع الأساليب القائمة على التعلم لتطوير نماذج فعالة لتحديد السلوكيات البشرية. لعبت خوارزميات التعلم العميق، المعروفة بقدراتها القوية على استخراج الميزات، دورًا بارزًا في هذا المجال. يمكن لهذه الخوارزميات استخراج الميزات التي تتيح أداءً ممتازًا للتعرف. ومع ذلك، فقد تم بناء العديد من مناهج التعلم العميق الناجحة على نماذج معقدة ذات معايير مفرطة متعددة. تبحث هذه الورقة البحثية الحالية حول التعرف على النشاط البشري باستخدام تقنيات التعلم العميق وتناقش استراتيجيات التعرف المناسبة. في البداية، استخدمنا شبكات عصبية التفافية متعددة لتحديد بنية فعالة للتعرف على النشاط البشري. بعد ذلك، طورنا شبكة عصبية التفافية هجينة تتضمن آلية لانتباه القناة. تمكن هذه الآلية الشبكة من التقاط الخصائص المكانية الزمانية العميقة بطريقة هرمية والتمييز بين الحركات البشرية المختلفة في الحياة اليومية. أظهرت تحقيقاتنا، باستخدام مجموعات بيانات UCI - HAR و WISDM و IM - WSHA، أن نموذجنا المقترح، الذي يتضمن تحويلات الالتفاف متعددة الأحجام عبر القنوات، فاق أداء بنيات التعلم العميق السابقة بمعدلات دقة بلغت 98.92 ٪ و 98.80 ٪ و 98.45 ٪ على التوالي. تشير هذه النتائج إلى أن النموذج المقترح يتجاوز أحدث الأساليب من حيث الدقة الإجمالية، كما تدعمها نتائج البحث.Translated Description (French)
Résumé Dans le domaine de l'intelligence artificielle et de l'informatique omniprésente, la reconnaissance de l'activité humaine à l'aide de capteurs portables suscite un intérêt croissant. Au cours des dernières décennies, les chercheurs ont largement exploré les méthodes basées sur l'apprentissage pour développer des modèles efficaces pour identifier les comportements humains. Les algorithmes d'apprentissage profond, connus pour leurs puissantes capacités d'extraction de fonctionnalités, ont joué un rôle de premier plan dans ce domaine. Ces algorithmes peuvent facilement extraire des fonctionnalités qui permettent d'excellentes performances de reconnaissance. Cependant, de nombreuses approches d'apprentissage profond réussies ont été construites sur des modèles complexes avec plusieurs hyperparamètres. Cet article examine les recherches actuelles sur la reconnaissance de l'activité humaine à l'aide de techniques d'apprentissage en profondeur et discute des stratégies de reconnaissance appropriées. Dans un premier temps, nous avons utilisé plusieurs réseaux de neurones convolutionnels pour déterminer une architecture efficace pour la reconnaissance de l'activité humaine. Par la suite, nous avons développé un réseau neuronal convolutionnel hybride qui intègre un mécanisme d'attention des canaux. Ce mécanisme permet au réseau de capturer les caractéristiques spatio-temporelles profondes de manière hiérarchique et de distinguer les différents mouvements humains dans la vie quotidienne. Nos enquêtes, utilisant les ensembles de données UCI-HAR, WISDM et IM-WSHA, ont démontré que notre modèle proposé, qui comprend des transformations de convolution multicanal de taille multiple, surpassait les architectures d'apprentissage profond précédentes avec des taux de précision de 98,92 %, 98,80 % et 98,45 % respectivement. Ces résultats indiquent que le modèle suggéré surpasse les approches de pointe en termes de précision globale, comme le confirment les résultats de la recherche.Translated Description (Spanish)
Resumen En el campo de la inteligencia artificial y la computación ubicua, ha habido un creciente interés en el reconocimiento de la actividad humana mediante sensores portátiles. En las últimas décadas, los investigadores han explorado ampliamente los métodos basados en el aprendizaje para desarrollar modelos efectivos para identificar los comportamientos humanos. Los algoritmos de aprendizaje profundo, conocidos por sus potentes capacidades de extracción de características, han desempeñado un papel destacado en esta área. Estos algoritmos pueden extraer convenientemente características que permiten un excelente rendimiento de reconocimiento. Sin embargo, muchos enfoques exitosos de aprendizaje profundo se han basado en modelos complejos con múltiples hiperparámetros. Este documento examina la investigación actual sobre el reconocimiento de la actividad humana utilizando técnicas de aprendizaje profundo y discute las estrategias de reconocimiento apropiadas. Inicialmente, empleamos múltiples redes neuronales convolucionales para determinar una arquitectura efectiva para el reconocimiento de la actividad humana. Posteriormente, desarrollamos una red neuronal convolucional híbrida que incorpora un mecanismo de atención de canal. Este mecanismo permite a la red capturar características espacio-temporales profundas de manera jerárquica y distinguir entre diferentes movimientos humanos en la vida cotidiana. Nuestras investigaciones, utilizando los conjuntos de datos UCI-HAR, WISDM e IM-WSHA, demostraron que nuestro modelo propuesto, que incluye transformaciones de convolución multicanal de múltiples tamaños, superó a las arquitecturas de aprendizaje profundo anteriores con tasas de precisión del 98,92%, 98,80% y 98,45%, respectivamente. Estos resultados indican que el modelo sugerido supera los enfoques más avanzados en términos de precisión general, según lo respaldan los hallazgos de la investigación.Files
s41598-023-39080-y.pdf.pdf
Files
(2.3 MB)
Name | Size | Download all |
---|---|---|
md5:cf0bbc644c0c8bb2a9c99dfcf8c55af8
|
2.3 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- الشبكة العصبية الالتوائية الهجينة مع آلية الانتباه للقناة للتعرف على النشاط البشري القائم على أجهزة الاستشعار
- Translated title (French)
- Réseau neuronal à convolution hybride avec mécanisme d'attention des canaux pour la reconnaissance de l'activité humaine basée sur des capteurs
- Translated title (Spanish)
- Red neuronal de convolución híbrida con mecanismo de atención de canal para el reconocimiento de la actividad humana basado en sensores
Identifiers
- Other
- https://openalex.org/W4385277267
- DOI
- 10.1038/s41598-023-39080-y
References
- https://openalex.org/W146508469
- https://openalex.org/W1976749869
- https://openalex.org/W1986553199
- https://openalex.org/W1996020380
- https://openalex.org/W2012557818
- https://openalex.org/W2017634428
- https://openalex.org/W2030500981
- https://openalex.org/W2068148300
- https://openalex.org/W2073401630
- https://openalex.org/W2103673867
- https://openalex.org/W2118293052
- https://openalex.org/W2124218221
- https://openalex.org/W2131774270
- https://openalex.org/W2165131075
- https://openalex.org/W2172140247
- https://openalex.org/W2183341477
- https://openalex.org/W2194775991
- https://openalex.org/W2270470215
- https://openalex.org/W2295647538
- https://openalex.org/W2304267454
- https://openalex.org/W2320625002
- https://openalex.org/W2526801412
- https://openalex.org/W2531409750
- https://openalex.org/W2594265094
- https://openalex.org/W2598391117
- https://openalex.org/W2736191430
- https://openalex.org/W2752782242
- https://openalex.org/W2851629429
- https://openalex.org/W2947403743
- https://openalex.org/W2948204427
- https://openalex.org/W2949871389
- https://openalex.org/W2952181509
- https://openalex.org/W2959203930
- https://openalex.org/W2962971773
- https://openalex.org/W2964334073
- https://openalex.org/W2996716854
- https://openalex.org/W3008117179
- https://openalex.org/W3011785450
- https://openalex.org/W3017361427
- https://openalex.org/W3027425326
- https://openalex.org/W3058709557
- https://openalex.org/W3084255915
- https://openalex.org/W3104887532
- https://openalex.org/W3110336329
- https://openalex.org/W3124448441
- https://openalex.org/W3135100418
- https://openalex.org/W3162538709
- https://openalex.org/W3182319652
- https://openalex.org/W4200317051
- https://openalex.org/W4213129473
- https://openalex.org/W4220769291
- https://openalex.org/W4283359809
- https://openalex.org/W4294012891
- https://openalex.org/W4295079697
- https://openalex.org/W4310645200