Published April 10, 2017 | Version v1
Publication Open

Use of a machine learning framework to predict substance use disorder treatment success

  • 1. Fundación Ciencias Exactas y Naturales
  • 2. Consejo Nacional de Investigaciones Científicas y Técnicas
  • 3. University of Buenos Aires
  • 4. University of Iowa
  • 5. University of California, Berkeley

Description

There are several methods for building prediction models. The wealth of currently available modeling techniques usually forces the researcher to judge, a priori, what will likely be the best method. Super learning (SL) is a methodology that facilitates this decision by combining all identified prediction algorithms pertinent for a particular prediction problem. SL generates a final model that is at least as good as any of the other models considered for predicting the outcome. The overarching aim of this work is to introduce SL to analysts and practitioners. This work compares the performance of logistic regression, penalized regression, random forests, deep learning neural networks, and SL to predict successful substance use disorders (SUD) treatment. A nationwide database including 99,013 SUD treatment patients was used. All algorithms were evaluated using the area under the receiver operating characteristic curve (AUC) in a test sample that was not included in the training sample used to fit the prediction models. AUC for the models ranged between 0.793 and 0.820. SL was superior to all but one of the algorithms compared. An explanation of SL steps is provided. SL is the first step in targeted learning, an analytic framework that yields double robust effect estimation and inference with fewer assumptions than the usual parametric methods. Different aspects of SL depending on the context, its function within the targeted learning framework, and the benefits of this methodology in the addiction field are discussed.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

هناك عدة طرق لبناء نماذج التنبؤ. عادة ما تجبر ثروة تقنيات النمذجة المتاحة حاليًا الباحث على الحكم، بداهة، على ما سيكون على الأرجح أفضل طريقة. التعلم الفائق (SL) هو منهجية تسهل هذا القرار من خلال الجمع بين جميع خوارزميات التنبؤ المحددة ذات الصلة بمشكلة تنبؤ معينة. يولد SL نموذجًا نهائيًا جيدًا على الأقل مثل أي من النماذج الأخرى التي تم أخذها في الاعتبار للتنبؤ بالنتيجة. الهدف الشامل من هذا العمل هو تقديم اللغة المصدر للمحللين والممارسين. يقارن هذا العمل أداء الانحدار اللوجستي، والانحدار المعاقب، والغابات العشوائية، والشبكات العصبية للتعلم العميق، و SL للتنبؤ بنجاح علاج اضطرابات تعاطي المخدرات (SUD). تم استخدام قاعدة بيانات على مستوى البلاد تضم 99،013 مريضًا يعانون من سوء التغذية الحاد. تم تقييم جميع الخوارزميات باستخدام المنطقة الموجودة تحت منحنى خصائص تشغيل جهاز الاستقبال (AUC) في عينة اختبار لم يتم تضمينها في عينة التدريب المستخدمة لتناسب نماذج التنبؤ. تراوحت المساحة تحت المنحنى للنماذج بين 0.793 و 0.820. كان SL متفوقًا على جميع الخوارزميات التي تمت مقارنتها باستثناء واحدة. يتم تقديم شرح لخطوات SL. SL هي الخطوة الأولى في التعلم المستهدف، وهو إطار تحليلي ينتج عنه تقدير تأثير قوي مزدوج واستدلال مع افتراضات أقل من الأساليب البارامترية المعتادة. تتم مناقشة الجوانب المختلفة للغة المصدر اعتمادًا على السياق ووظيفتها ضمن إطار التعلم المستهدف وفوائد هذه المنهجية في مجال الإدمان.

Translated Description (French)

Il existe plusieurs méthodes pour construire des modèles de prédiction. La richesse des techniques de modélisation actuellement disponibles oblige généralement le chercheur à juger, a priori, quelle sera probablement la meilleure méthode. Le Super Learning (SL) est une méthodologie qui facilite cette décision en combinant tous les algorithmes de prédiction identifiés pertinents pour un problème de prédiction particulier. SL génère un modèle final qui est au moins aussi bon que n'importe lequel des autres modèles considérés pour prédire le résultat. L'objectif global de ce travail est de présenter la SL aux analystes et aux praticiens. Ce travail compare les performances de la régression logistique, de la régression pénalisée, des forêts aléatoires, des réseaux neuronaux d'apprentissage profond et du SL pour prédire le succès du traitement des troubles liés à la consommation de substances (SUD). Une base de données nationale comprenant 99 013 patients sous traitement SUD a été utilisée. Tous les algorithmes ont été évalués en utilisant la zone sous la courbe caractéristique de fonctionnement (ASC) du récepteur dans un échantillon de test qui n'était pas inclus dans l'échantillon d'entraînement utilisé pour adapter les modèles de prédiction. L'ASC pour les modèles variait entre 0,793 et 0,820. SL était supérieur à tous les algorithmes comparés sauf un. Une explication des étapes SL est fournie. SL est la première étape de l'apprentissage ciblé, un cadre analytique qui produit une estimation et une inférence d'effet doublement robustes avec moins d'hypothèses que les méthodes paramétriques habituelles. Différents aspects de la SL en fonction du contexte, de sa fonction dans le cadre d'apprentissage ciblé et des avantages de cette méthodologie dans le domaine de la toxicomanie sont discutés.

Translated Description (Spanish)

Existen varios métodos para construir modelos de predicción. La riqueza de las técnicas de modelado actualmente disponibles suele obligar al investigador a juzgar, a priori, cuál será probablemente el mejor método. Super learning (SL) es una metodología que facilita esta decisión al combinar todos los algoritmos de predicción identificados pertinentes para un problema de predicción en particular. SL genera un modelo final que es al menos tan bueno como cualquiera de los otros modelos considerados para predecir el resultado. El objetivo general de este trabajo es presentar SL a analistas y profesionales. Este trabajo compara el rendimiento de la regresión logística, la regresión penalizada, los bosques aleatorios, las redes neuronales de aprendizaje profundo y la SL para predecir el tratamiento exitoso de los trastornos por uso de sustancias (SUD). Se utilizó una base de datos nacional que incluía 99.013 pacientes con tratamiento SUD. Todos los algoritmos se evaluaron utilizando el área bajo la curva característica operativa (AUC) del receptor en una muestra de prueba que no se incluyó en la muestra de entrenamiento utilizada para ajustar los modelos de predicción. El AUC para los modelos osciló entre 0,793 y 0,820. SL fue superior a todos menos uno de los algoritmos comparados. Se proporciona una explicación de los pasos de SL. SL es el primer paso en el aprendizaje dirigido, un marco analítico que produce una estimación del efecto doblemente robusta y una inferencia con menos supuestos que los métodos paramétricos habituales. Se discuten diferentes aspectos de la SL dependiendo del contexto, su función dentro del marco de aprendizaje dirigido y los beneficios de esta metodología en el campo de la adicción.

Files

journal.pone.0175383&type=printable.pdf

Files (994.8 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:404a850430740362570c8c17d13aeb82
994.8 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
استخدام إطار التعلم الآلي للتنبؤ بنجاح علاج اضطراب تعاطي المخدرات
Translated title (French)
Utilisation d'un cadre d'apprentissage automatique pour prédire le succès du traitement des troubles liés à la consommation de substances
Translated title (Spanish)
Uso de un marco de aprendizaje automático para predecir el éxito del tratamiento del trastorno por consumo de sustancias

Identifiers

Other
https://openalex.org/W2606184753
DOI
10.1371/journal.pone.0175383

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Argentina

References

  • https://openalex.org/W1488186001
  • https://openalex.org/W1839921965
  • https://openalex.org/W1919353527
  • https://openalex.org/W1967721571
  • https://openalex.org/W2006617902
  • https://openalex.org/W2035706069
  • https://openalex.org/W2039369833
  • https://openalex.org/W2043293600
  • https://openalex.org/W2055115121
  • https://openalex.org/W2065614902
  • https://openalex.org/W2068560144
  • https://openalex.org/W2073502055
  • https://openalex.org/W2087408844
  • https://openalex.org/W2102614609
  • https://openalex.org/W2132232588
  • https://openalex.org/W2141776694
  • https://openalex.org/W2146374094
  • https://openalex.org/W2168328473
  • https://openalex.org/W2170801186
  • https://openalex.org/W2325242000
  • https://openalex.org/W2328176404
  • https://openalex.org/W2341251727
  • https://openalex.org/W2555468919
  • https://openalex.org/W28412257
  • https://openalex.org/W2911964244
  • https://openalex.org/W4231109964
  • https://openalex.org/W4233056867
  • https://openalex.org/W4248240383
  • https://openalex.org/W76250260