Mitigating Machine Learning Bias Between High Income and Low-Middle Income Countries for Enhanced Model Fairness and Generalizability
Creators
- 1. Institute of Biomedical Science
- 2. University of Oxford
- 3. Oxford University Clinical Research Unit
- 4. Oxford University Hospitals NHS Trust
Description
Collaborative efforts in artificial intelligence (AI) are increasingly common between high-income countries (HICs) and low- to middle-income countries (LMICs). Given the resource limitations often encountered by LMICs, collaboration becomes crucial for pooling resources, expertise, and knowledge. Despite the apparent advantages, ensuring the fairness and equity of these collaborative models is essential, especially considering the distinct differences between LMIC and HIC hospitals. In this study, we show that collaborative AI approaches can lead to divergent performance outcomes across HIC and LMIC settings, particularly in the presence of data imbalances. Through a real-world COVID-19 screening case study, we demonstrate that implementing algorithmic-level bias mitigation methods significantly improves outcome fairness between HIC and LMIC sites while maintaining high diagnostic sensitivity. We compare our results against previous benchmarks, utilizing datasets from four independent United Kingdom Hospitals and one Vietnamese hospital, representing HIC and LMIC settings, respectively.
Translated Descriptions
Translated Description (Arabic)
أصبحت الجهود التعاونية في مجال الذكاء الاصطناعي شائعة بشكل متزايد بين البلدان ذات الدخل المرتفع (HICs) والبلدان منخفضة إلى متوسطة الدخل (LMICs). نظرًا لقيود الموارد التي غالبًا ما تواجهها البلدان المنخفضة والمتوسطة الدخل، يصبح التعاون أمرًا بالغ الأهمية لتجميع الموارد والخبرات والمعرفة. على الرغم من المزايا الواضحة، فإن ضمان عدالة وإنصاف هذه النماذج التعاونية أمر ضروري، لا سيما بالنظر إلى الاختلافات الواضحة بين مستشفيات LMIC و HIC. في هذه الدراسة، نظهر أن مناهج الذكاء الاصطناعي التعاونية يمكن أن تؤدي إلى نتائج أداء متباينة عبر إعدادات HIC و LMIC، لا سيما في وجود اختلالات في البيانات. من خلال دراسة حالة لفحص COVID -19 في العالم الحقيقي، نثبت أن تنفيذ طرق التخفيف من التحيز على مستوى الخوارزميات يحسن بشكل كبير من عدالة النتائج بين مواقع HIC و LMIC مع الحفاظ على حساسية تشخيصية عالية. نقارن نتائجنا بالمعايير السابقة، باستخدام مجموعات البيانات من أربعة مستشفيات مستقلة في المملكة المتحدة ومستشفى فيتنامي واحد، تمثل إعدادات HIC و LMIC، على التوالي.Translated Description (French)
Les efforts de collaboration en matière d'intelligence artificielle (IA) sont de plus en plus fréquents entre les pays à revenu élevé (PRI) et les pays à revenu faible à intermédiaire (PRFI). Compte tenu des limites de ressources souvent rencontrées par les PRFI, la collaboration devient cruciale pour la mise en commun des ressources, de l'expertise et des connaissances. Malgré les avantages apparents, il est essentiel d'assurer la justice et l'équité de ces modèles collaboratifs, en particulier compte tenu des différences distinctes entre les hôpitaux des PRFI et des hic. Dans cette étude, nous montrons que les approches collaboratives de l'IA peuvent conduire à des résultats de performance divergents dans les contextes hic et LMIC, en particulier en présence de déséquilibres de données. Grâce à une étude de cas de dépistage de la COVID-19 dans le monde réel, nous démontrons que la mise en œuvre de méthodes d'atténuation des biais au niveau algorithmique améliore considérablement l'équité des résultats entre les sites hic et LMIC tout en maintenant une sensibilité diagnostique élevée. Nous comparons nos résultats aux repères précédents, en utilisant des ensembles de données provenant de quatre hôpitaux indépendants du Royaume-Uni et d'un hôpital vietnamien, représentant respectivement les contextes hic et LMIC.Translated Description (Spanish)
Los esfuerzos de colaboración en inteligencia artificial (IA) son cada vez más comunes entre los países de ingresos altos (HIC) y los países de ingresos bajos a medios (LMIC). Dadas las limitaciones de recursos que a menudo encuentran los PIBM, la colaboración se vuelve crucial para poner en común los recursos, la experiencia y el conocimiento. A pesar de las aparentes ventajas, es esencial garantizar la equidad y equidad de estos modelos de colaboración, especialmente teniendo en cuenta las claras diferencias entre los hospitales de LMIC y HIC. En este estudio, mostramos que los enfoques colaborativos de IA pueden conducir a resultados de rendimiento divergentes en los entornos de HIC y LMIC, particularmente en presencia de desequilibrios de datos. A través de un estudio de caso de detección de COVID-19 en el mundo real, demostramos que la implementación de métodos de mitigación de sesgo a nivel algorítmico mejora significativamente la equidad de resultados entre los sitios de HIC y LMIC mientras se mantiene una alta sensibilidad de diagnóstico. Comparamos nuestros resultados con puntos de referencia anteriores, utilizando conjuntos de datos de cuatro hospitales independientes del Reino Unido y un hospital vietnamita, que representan los entornos de HIC y LMIC, respectivamente.Files
2024.02.01.24302010.full.pdf.pdf
Files
(713.9 kB)
Name | Size | Download all |
---|---|---|
md5:20e626d3fa29991622e59f147cf7328f
|
713.9 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- التخفيف من التحيز للتعلم الآلي بين البلدان ذات الدخل المرتفع والبلدان ذات الدخل المتوسط المنخفض من أجل تعزيز نموذج الإنصاف والتعميم
- Translated title (French)
- Atténuer les préjugés liés à l'apprentissage automatique entre les pays à revenu élevé et les pays à revenu faible et intermédiaire pour améliorer l'équité et la généralisabilité des modèles
- Translated title (Spanish)
- Mitigar el sesgo de aprendizaje automático entre los países de ingresos altos y los de ingresos medios bajos para mejorar la equidad y la generalización del modelo
Identifiers
- Other
- https://openalex.org/W4391515285
- DOI
- 10.1101/2024.02.01.24302010