Active Learning Based Federated Learning for Waste and Natural Disaster Image Classification
Creators
- 1. Hamad bin Khalifa University
- 2. University of Engineering and Technology Peshawar
- 3. University of Nebraska at Kearney
- 4. College of Business and Technology
- 5. Information Technology University
Description
The feasibility of Federated Learning (FL) is highly dependent on the training and inference capabilities of local models, which are subject to the availability of meaningful and annotated data. The availability of such data is in turn contingent on the tedious and time-consuming annotation job that typically requires the manual analysis of training samples. Active Learning (AL) provides an alternative solution allowing a Machine Learning (ML) model to automatically choose and label the data from which it learns without involving manual inspection of each training sample. In this work, we explore how FL can benefit from unlabelled data available at each participating client using AL. To this aim, we propose an AL-based FL framework by employing and evaluating several AL methods in two different application domains. Through an extensive experimentation setup, we show that AL is equally useful in federated and centralized learning by achieving comparable results with manually labeled data using fewer samples without involving human annotators in collecting training data. We also demonstrated that the proposed method is dataset/application independent by evaluating the proposed method in two interesting applications, namely natural disaster analysis and waste classification, having different properties and challenges. Promising results are obtained on both applications resulting in comparable results against the best-case scenario where each sample is manually analyzed and annotated (Baseline 1), and improvement of 3.1% and 4% with best methods respectively over the training sets with irrelevant images on natural disaster and waste classification datasets (Baseline 2).
Translated Descriptions
Translated Description (Arabic)
تعتمد جدوى التعلم الموحد (FL) بشكل كبير على قدرات التدريب والاستدلال للنماذج المحلية، والتي تخضع لتوافر بيانات ذات مغزى ومشروحة. ويتوقف توافر هذه البيانات بدوره على وظيفة التعليق التوضيحي المملة والمستهلكة للوقت التي تتطلب عادة التحليل اليدوي لعينات التدريب. يوفر التعلم النشط (AL) حلاً بديلاً يسمح لنموذج التعلم الآلي (ML) باختيار وتسمية البيانات التي يتعلم منها تلقائيًا دون إشراك الفحص اليدوي لكل عينة تدريب. في هذا العمل، نستكشف كيف يمكن للعمل الجبري الاستفادة من البيانات غير المسماة المتاحة لدى كل عميل مشارك باستخدام اللغة العربية. ولتحقيق هذا الهدف، نقترح إطار عمل اللغة الأجنبية القائم على اللغة العربية من خلال توظيف وتقييم العديد من طرق اللغة العربية في مجالين مختلفين من مجالات التطبيق. من خلال إعداد تجريبي مكثف، نظهر أن اللغة العربية مفيدة بنفس القدر في التعلم الموحد والمركزي من خلال تحقيق نتائج قابلة للمقارنة مع البيانات المصنفة يدويًا باستخدام عينات أقل دون إشراك المفسرين البشريين في جمع بيانات التدريب. أظهرنا أيضًا أن الطريقة المقترحة هي مجموعة بيانات/تطبيق مستقل من خلال تقييم الطريقة المقترحة في تطبيقين مثيرين للاهتمام، وهما تحليل الكوارث الطبيعية وتصنيف النفايات، ولها خصائص وتحديات مختلفة. يتم الحصول على نتائج واعدة على كلا التطبيقين مما يؤدي إلى نتائج قابلة للمقارنة مقابل سيناريو أفضل الحالات حيث يتم تحليل كل عينة يدويًا وتعليقها (خط الأساس 1)، وتحسين بنسبة 3.1 ٪ و 4 ٪ مع أفضل الطرق على التوالي على مجموعات التدريب مع صور غير ذات صلة بمجموعات بيانات تصنيف الكوارث الطبيعية والنفايات (خط الأساس 2).Translated Description (French)
La faisabilité de l'apprentissage fédéré (FL) dépend fortement des capacités de formation et d'inférence des modèles locaux, qui sont soumis à la disponibilité de données significatives et annotées. La disponibilité de ces données dépend à son tour du travail d'annotation fastidieux et fastidieux qui nécessite généralement l'analyse manuelle d'échantillons de formation. L'apprentissage actif (AL) fournit une solution alternative permettant à un modèle d'apprentissage automatique (ML) de choisir et d'étiqueter automatiquement les données à partir desquelles il apprend sans impliquer d'inspection manuelle de chaque échantillon de formation. Dans ce travail, nous explorons comment FL peut bénéficier de données non étiquetées disponibles chez chaque client participant à l'aide d'AL. À cette fin, nous proposons un cadre de LF basé sur AL en employant et en évaluant plusieurs méthodes d'AL dans deux domaines d'application différents. Grâce à une configuration d'expérimentation étendue, nous montrons que l'AL est tout aussi utile dans l'apprentissage fédéré et centralisé en obtenant des résultats comparables avec des données étiquetées manuellement en utilisant moins d'échantillons sans impliquer d'annotateurs humains dans la collecte de données d'entraînement. Nous avons également démontré que la méthode proposée est indépendante de l'ensemble de données/de l'application en évaluant la méthode proposée dans deux applications intéressantes, à savoir l'analyse des catastrophes naturelles et la classification des déchets, ayant des propriétés et des défis différents. Des résultats prometteurs sont obtenus sur les deux applications, ce qui donne des résultats comparables par rapport au meilleur scénario où chaque échantillon est analysé et annoté manuellement (ligne de base 1), et une amélioration de 3,1 % et 4 % respectivement avec les meilleures méthodes par rapport aux ensembles de formation avec des images non pertinentes sur les ensembles de données de classification des catastrophes naturelles et des déchets (ligne de base 2).Translated Description (Spanish)
La viabilidad del Aprendizaje Federado (FL) depende en gran medida de las capacidades de capacitación e inferencia de los modelos locales, que están sujetos a la disponibilidad de datos significativos y anotados. La disponibilidad de dichos datos a su vez depende del trabajo de anotación tedioso y lento que generalmente requiere el análisis manual de las muestras de capacitación. El Aprendizaje Activo (AL, por sus siglas en inglés) proporciona una solución alternativa que permite que un modelo de Aprendizaje Automático (ML, por sus siglas en inglés) elija y etiquete automáticamente los datos a partir de los cuales aprende sin involucrar la inspección manual de cada muestra de En este trabajo, exploramos cómo FL puede beneficiarse de los datos no etiquetados disponibles en cada cliente participante que utiliza AL. Con este objetivo, proponemos un marco de FL basado en AL empleando y evaluando varios métodos de AL en dos dominios de aplicación diferentes. A través de una extensa configuración de experimentación, mostramos que AL es igualmente útil en el aprendizaje federado y centralizado al lograr resultados comparables con datos etiquetados manualmente utilizando menos muestras sin involucrar a anotadores humanos en la recopilación de datos de entrenamiento. También demostramos que el método propuesto es independiente del conjunto de datos/aplicación al evaluar el método propuesto en dos aplicaciones interesantes, a saber, el análisis de desastres naturales y la clasificación de residuos, que tienen diferentes propiedades y desafíos. Se obtienen resultados prometedores en ambas aplicaciones, lo que resulta en resultados comparables con el mejor de los casos, donde cada muestra se analiza y anota manualmente (Línea de base 1), y una mejora del 3.1% y 4% con los mejores métodos, respectivamente, sobre los conjuntos de capacitación con imágenes irrelevantes sobre desastres naturales y conjuntos de datos de clasificación de desechos (Línea de base 2).Files
      
        09261337.pdf.pdf
        
      
    
    
      
        Files
         (245 Bytes)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| md5:e287a8dae68d89177d8ef6df37c34403 | 245 Bytes | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
- التعلم المتحد القائم على التعلم النشط لتصنيف صورة النفايات والكوارث الطبيعية
- Translated title (French)
- Apprentissage actif basé sur l'apprentissage fédéré pour la classification des images de déchets et de catastrophes naturelles
- Translated title (Spanish)
- Aprendizaje activo basado en el aprendizaje federado para la clasificación de imágenes de residuos y desastres naturales
Identifiers
- Other
- https://openalex.org/W3099912322
- DOI
- 10.1109/access.2020.3038676
            
              References
            
          
        - https://openalex.org/W2075359503
- https://openalex.org/W2107131609
- https://openalex.org/W2108598243
- https://openalex.org/W2194775991
- https://openalex.org/W2560439068
- https://openalex.org/W2767079719
- https://openalex.org/W2768447691
- https://openalex.org/W2772752821
- https://openalex.org/W2800524086
- https://openalex.org/W2847413819
- https://openalex.org/W2899218398
- https://openalex.org/W2913885682
- https://openalex.org/W2915252171
- https://openalex.org/W2943940366
- https://openalex.org/W2948478927
- https://openalex.org/W2954070046
- https://openalex.org/W2963185843
- https://openalex.org/W2963745697
- https://openalex.org/W2963947170
- https://openalex.org/W2967357336
- https://openalex.org/W2979417040
- https://openalex.org/W2995878390
- https://openalex.org/W2997264611
- https://openalex.org/W3004416465
- https://openalex.org/W3004925702
- https://openalex.org/W3011110392
- https://openalex.org/W3015636663
- https://openalex.org/W3025091470
- https://openalex.org/W3026089740
- https://openalex.org/W3028515142
- https://openalex.org/W3042816745
- https://openalex.org/W3086607052
- https://openalex.org/W3103802018