Published December 7, 2021 | Version v1
Publication Open

Opportunistic Use of Crowdsourced Workers for Online Relabeling of Potential Adversarial Examples

  • 1. Hamad bin Khalifa University
  • 2. Mohammed V University
  • 3. University of Technology Sydney
  • 4. Nanyang Technological University

Description

Deep Neural Networks (DDNs) have achieved tremendous success in handling various Machine Learning (ML) tasks, such as speech recognition, Natural Language Processing, and image classification. However, they have shown vulnerability to well-designed inputs called adversarial examples. Researchers in industry and academia have proposed many adversarial example defense techniques. However, none can provide complete robustness. The cutting-edge defense techniques offer partial reliability. Thus, complementing them with another layer of protection is a must, especially for mission-critical applications. This paper proposes a novel Online Selection and Relabeling Algorithm (OSRA) that opportunistically utilizes a limited number of crowdsourced workers (budget-constraint crowdsourcing) to maximize the ML system's robustness. OSRA strives to use crowdsourced workers effectively by selecting the most suspicious inputs (the potential adversarial examples) and moving them to the crowdsourced workers to be validated and corrected (relabeled). As a result, the impact of adversarial examples gets reduced, and accordingly, the ML system becomes more robust. We also proposed a heuristic threshold selection method that contributes to enhancing the prediction system's reliability. We empirically validated our proposed algorithm and found that it can efficiently and optimally utilize the allocated budget for crowdsourcing. It is also effectively integrated with a state-ofthe- art black-box (transfer-based) defense technique, resulting in a more robust system. Simulation results show that OSRA can outperform a random selection algorithm by 60% and achieve comparable performance to an optimal offline selection benchmark. They also show that OSRA's performance has a positive correlation with system robustness.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

حققت الشبكات العصبية العميقة (DDNs) نجاحًا هائلاً في التعامل مع مختلف مهام التعلم الآلي (ML)، مثل التعرف على الكلام ومعالجة اللغة الطبيعية وتصنيف الصور. ومع ذلك، فقد أظهروا ضعفًا أمام المدخلات المصممة جيدًا والتي تسمى الأمثلة العدائية. اقترح باحثون في الصناعة والأوساط الأكاديمية العديد من تقنيات الدفاع عن الأمثلة العدائية. ومع ذلك، لا يمكن لأي منها أن يوفر متانة كاملة. توفر تقنيات الدفاع المتطورة موثوقية جزئية. وبالتالي، فإن استكمالها بطبقة أخرى من الحماية أمر لا بد منه، خاصة بالنسبة للتطبيقات الحرجة للمهام. تقترح هذه الورقة خوارزمية جديدة للاختيار وإعادة التسمية عبر الإنترنت (OSRA) تستخدم بشكل انتهازي عددًا محدودًا من العمال من مصادر جماعية (الاستعانة بمصادر جماعية محدودة الميزانية) لزيادة قوة نظام غسل الأموال. تسعى أسراء جاهدة لاستخدام العمال الذين يتم التعهيد الجماعي بشكل فعال من خلال اختيار المدخلات الأكثر إثارة للشك (الأمثلة العدائية المحتملة) ونقلها إلى العمال الذين يتم التعهيد الجماعي للتحقق من صحتها وتصحيحها (إعادة تصنيفها). ونتيجة لذلك، ينخفض تأثير الأمثلة العدائية، وبالتالي يصبح نظام غسل الأموال أكثر قوة. اقترحنا أيضًا طريقة اختيار العتبة الاستكشافية التي تساهم في تعزيز موثوقية نظام التنبؤ. لقد تحققنا تجريبيًا من صحة خوارزميتنا المقترحة ووجدنا أنها يمكن أن تستفيد بكفاءة وعلى النحو الأمثل من الميزانية المخصصة للتعهيد الجماعي. كما أنه مدمج بشكل فعال مع أحدث تقنية دفاع الصندوق الأسود (القائم على النقل)، مما يؤدي إلى نظام أكثر قوة. تُظهر نتائج المحاكاة أن أوسرا يمكن أن تتفوق على خوارزمية الاختيار العشوائي بنسبة 60 ٪ وتحقق أداءً مشابهًا لمعيار الاختيار الأمثل دون اتصال بالإنترنت. كما أنها تظهر أن أداء أوسرا له علاقة إيجابية مع قوة النظام.

Translated Description (French)

Les réseaux de neurones profonds (DDN) ont obtenu d'énormes succès dans la gestion de diverses tâches d'apprentissage automatique (ML), telles que la reconnaissance vocale, le traitement du langage naturel et la classification des images. Cependant, ils ont montré leur vulnérabilité à des intrants bien conçus appelés exemples contradictoires. Des chercheurs de l'industrie et du monde universitaire ont proposé de nombreux exemples de techniques de défense contradictoires. Cependant, aucun ne peut fournir une robustesse complète. Les techniques de défense de pointe offrent une fiabilité partielle. Ainsi, il est indispensable de les compléter par une autre couche de protection, en particulier pour les applications critiques. Cet article propose un nouvel algorithme de sélection et de réétiquetage en ligne (OSRA) qui utilise de manière opportuniste un nombre limité de travailleurs crowdsourcés (crowdsourcing à contraintes budgétaires) pour maximiser la robustesse du système de ML. OSRA s'efforce d'utiliser efficacement les travailleurs crowdsourcés en sélectionnant les intrants les plus suspects (les exemples contradictoires potentiels) et en les transférant aux travailleurs crowdsourcés pour qu'ils soient validés et corrigés (réétiquetés). En conséquence, l'impact des exemples contradictoires est réduit et, par conséquent, le système de BC devient plus robuste. Nous avons également proposé une méthode de sélection de seuil heuristique qui contribue à améliorer la fiabilité du système de prédiction. Nous avons validé empiriquement notre algorithme proposé et constaté qu'il peut utiliser efficacement et de manière optimale le budget alloué au crowdsourcing. Il est également efficacement intégré à une technique de défense de boîte noire (basée sur le transfert) ultramoderne, ce qui permet d'obtenir un système plus robuste. Les résultats de la simulation montrent QUE l'OSRA peut surpasser un algorithme de sélection aléatoire de 60 % et atteindre des performances comparables à un benchmark de sélection hors ligne optimal. Ils montrent également que les PERFORMANCES d'osra ont une corrélation positive avec la robustesse du système.

Translated Description (Spanish)

Las redes neuronales profundas (DDN) han logrado un gran éxito en el manejo de varias tareas de aprendizaje automático (ML), como el reconocimiento de voz, el procesamiento del lenguaje natural y la clasificación de imágenes. Sin embargo, han mostrado vulnerabilidad a entradas bien diseñadas llamadas ejemplos contradictorios. Los investigadores de la industria y el mundo académico han propuesto muchas técnicas de defensa de ejemplo contradictorio. Sin embargo, ninguno puede proporcionar una robustez completa. Las técnicas de defensa de vanguardia ofrecen una fiabilidad parcial. Por lo tanto, es imprescindible complementarlos con otra capa de protección, especialmente para aplicaciones de misión crítica. Este documento propone un nuevo algoritmo de selección y reetiquetado en línea (osra) que utiliza de manera oportunista un número limitado de trabajadores de crowdsourcing (crowdsourcing con restricciones presupuestarias) para maximizar la solidez del sistema de ML. OSRA se esfuerza por utilizar a los trabajadores de crowdsourcing de manera efectiva seleccionando los insumos más sospechosos (los posibles ejemplos contradictorios) y trasladándolos a los trabajadores de crowdsourcing para que sean validados y corregidos (reetiquetados). Como resultado, el impacto de los ejemplos contradictorios se reduce y, en consecuencia, el sistema de ML se vuelve más robusto. También propusimos un método de selección de umbral heurístico que contribuye a mejorar la fiabilidad del sistema de predicción. Validamos empíricamente nuestro algoritmo propuesto y descubrimos que puede utilizar de manera eficiente y óptima el presupuesto asignado para el crowdsourcing. También se integra de manera efectiva con una técnica de defensa de caja negra (basada en transferencia) de última generación, lo que resulta en un sistema más robusto. Los resultados de la simulación muestran que OSRA puede superar a un algoritmo de selección aleatoria en un 60% y lograr un rendimiento comparable a un punto de referencia de selección fuera de línea óptimo. También muestran que el RENDIMIENTO de osra tiene una correlación positiva con la robustez del sistema.

Files

31600043.pdf.pdf

Files (16.6 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:5cc12d543ec61f502267e4e1c02fc959
16.6 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
الاستخدام الانتهازي للعمال الذين يعتمدون على التعهيد الجماعي لإعادة وضع العلامات على الإنترنت لأمثلة الخصومة المحتملة
Translated title (French)
Utilisation opportuniste de travailleurs crowdsourcés pour le réétiquetage en ligne d'exemples adverses potentiels
Translated title (Spanish)
Uso oportunista de trabajadores de crowdsourcing para el reetiquetado en línea de posibles ejemplos adversarios

Identifiers

Other
https://openalex.org/W4200391718
DOI
10.36227/techrxiv.17088941.v1

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Morocco

References

  • https://openalex.org/W1531947739
  • https://openalex.org/W2163605009
  • https://openalex.org/W2194775991
  • https://openalex.org/W2230740169
  • https://openalex.org/W2543296129
  • https://openalex.org/W2554692997
  • https://openalex.org/W2570343428
  • https://openalex.org/W2594877703
  • https://openalex.org/W2606529538
  • https://openalex.org/W2619479788
  • https://openalex.org/W2778624544
  • https://openalex.org/W2786118190
  • https://openalex.org/W2789758093
  • https://openalex.org/W2790754501
  • https://openalex.org/W2802314446
  • https://openalex.org/W2809895662
  • https://openalex.org/W2911510572
  • https://openalex.org/W2912070915
  • https://openalex.org/W2949311987
  • https://openalex.org/W2950048339
  • https://openalex.org/W2950468330
  • https://openalex.org/W2962759300
  • https://openalex.org/W2963001136
  • https://openalex.org/W2963143631
  • https://openalex.org/W2963920068
  • https://openalex.org/W2963952467
  • https://openalex.org/W2964082701
  • https://openalex.org/W2964116600
  • https://openalex.org/W2964197269
  • https://openalex.org/W2969902687
  • https://openalex.org/W3006076803
  • https://openalex.org/W3008151842
  • https://openalex.org/W3014006537
  • https://openalex.org/W3019166713
  • https://openalex.org/W3090036562
  • https://openalex.org/W3091857398
  • https://openalex.org/W3100732527
  • https://openalex.org/W3103340107
  • https://openalex.org/W3185921569
  • https://openalex.org/W3213779919
  • https://openalex.org/W4286894239
  • https://openalex.org/W4287068394
  • https://openalex.org/W4288359148
  • https://openalex.org/W4293580221
  • https://openalex.org/W4293846201
  • https://openalex.org/W4297814571
  • https://openalex.org/W4300677102
  • https://openalex.org/W4301726735