Published November 6, 2023 | Version v1
Publication Open

Optimal Look-Back Period to Identify True Incident Cases of Diabetes in Medical Insurance Data in the Chinese Population: Retrospective Analysis Study

  • 1. Peking Union Medical College Hospital
  • 2. Chinese Academy of Medical Sciences & Peking Union Medical College
  • 3. National Center for Chronic and Noncommunicable Disease Control and Prevention
  • 4. Qingdao University

Description

Accurate estimation of incidence and prevalence is vital for preventing and controlling diabetes. Administrative data (including insurance data) could be a good source to estimate the incidence of diabetes. However, how to determine the look-back period (LP) to remove cases with preceding records remains a problem for administrative data. A short LP will cause overestimation of incidence, whereas a long LP will limit the usefulness of a database. Therefore, it is necessary to determine the optimal LP length for identifying incident cases in administrative data.This study aims to offer different methods to identify the optimal LP for diabetes by using medical insurance data from the Chinese population with reference to other diseases in the administrative data.Data from the insurance database of the city of Weifang, China from between January 2016 and December 2020 were used. To identify the incident cases in 2020, we removed prevalent patients with preceding records of diabetes between 2016 and 2019 (ie, a 4-year LP). Using this 4-year LP as a reference, consistency examination indexes (CEIs), including positive predictive values, the κ coefficient, and overestimation rate, were calculated to determine the level of agreement between different LPs and an LP of 4 years (the longest LP). Moreover, we constructed a retrograde survival function, in which survival (ie, incident cases) means not having a preceding record at the given time and the survival time is the difference between the date of the last record in 2020 and the most recent previous record in the LP. Based on the survival outcome and survival time, we established the survival function and survival hazard function. When the survival probability, S(t), remains stable, and survival hazard converges to zero, we obtain the optimal LP. Combined with the results of these two methods, we determined the optimal LP for Chinese diabetes patients.The κ agreement was excellent (0.950), with a high positive predictive value (92.2%) and a low overestimation rate (8.4%) after a 2-year LP. As for the retrograde survival function, S(t) dropped rapidly during the first 1-year LP (from 1.00 to 0.11). At a 417-day LP, the hazard function reached approximately zero (ht=0.000459), S(t) remained at 0.10, and at 480 days, the frequency of S(t) did not increase. Combining the two methods, we found that the optimal LP is 2 years for Chinese diabetes patients.The retrograde survival method and CEIs both showed effectiveness. A 2-year LP should be considered when identifying incident cases of diabetes using insurance data in the Chinese population.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد التقدير الدقيق لحالات الإصابة والانتشار أمرًا حيويًا للوقاية من مرض السكري والسيطرة عليه. يمكن أن تكون البيانات الإدارية (بما في ذلك بيانات التأمين) مصدرًا جيدًا لتقدير الإصابة بمرض السكري. ومع ذلك، فإن كيفية تحديد فترة الرجوع إلى الوراء (LP) لإزالة الحالات ذات السجلات السابقة لا تزال تمثل مشكلة بالنسبة للبيانات الإدارية. ستتسبب الناظمة القلبية اللاسلكية القصيرة في المبالغة في تقدير الإصابة، في حين أن الناظمة القلبية اللاسلكية الطويلة ستحد من فائدة قاعدة البيانات. لذلك، من الضروري تحديد طول الناظمة القلبية اللاسلكية الأمثل لتحديد حالات الحوادث في البيانات الإدارية. تهدف هذه الدراسة إلى تقديم طرق مختلفة لتحديد الناظمة القلبية اللاسلكية المثلى لمرض السكري باستخدام بيانات التأمين الطبي من السكان الصينيين مع الإشارة إلى الأمراض الأخرى في البيانات الإدارية. تم استخدام البيانات من قاعدة بيانات التأمين لمدينة ويفانغ، الصين من بين يناير 2016 وديسمبر 2020. لتحديد حالات الحوادث في عام 2020، قمنا بإزالة المرضى السائدين الذين لديهم سجلات سابقة لمرض السكري بين عامي 2016 و 2019 (أي، التهاب القطنية لمدة 4 سنوات). باستخدام برنامج السيولة هذا لمدة 4 سنوات كمرجع، تم حساب مؤشرات فحص الاتساق (CEIs)، بما في ذلك القيم التنبؤية الإيجابية، ومعامل κ، ومعدل المبالغة في التقدير، لتحديد مستوى الاتفاق بين مختلف برامج السيولة وبرنامج السيولة لمدة 4 سنوات (أطول برنامج سيولة). علاوة على ذلك، أنشأنا وظيفة البقاء على قيد الحياة إلى الوراء، حيث يعني البقاء على قيد الحياة (أي حالات الحوادث) عدم وجود سجل سابق في الوقت المحدد ووقت البقاء على قيد الحياة هو الفرق بين تاريخ السجل الأخير في عام 2020 وأحدث سجل سابق في برنامج السيولة. استنادًا إلى نتيجة البقاء على قيد الحياة ووقت البقاء على قيد الحياة، أنشأنا وظيفة البقاء على قيد الحياة ووظيفة خطر البقاء على قيد الحياة. عندما يظل احتمال البقاء على قيد الحياة، S(t)، مستقرًا، ويتقارب خطر البقاء على قيد الحياة إلى الصفر، نحصل على الناظمة القلبية اللاسلكية المثلى. جنبًا إلى جنب مع نتائج هاتين الطريقتين، حددنا الناظمة القلبية اللاسلكية المثلى لمرضى السكري الصينيين. كانت اتفاقية κ ممتازة (0.950)، مع قيمة تنبؤية إيجابية عالية (92.2 ٪) ومعدل مبالغة منخفض (8.4 ٪) بعد الناظمة القلبية اللاسلكية لمدة عامين. أما بالنسبة لوظيفة البقاء على قيد الحياة إلى الوراء، فقد انخفض S(t) بسرعة خلال السنة الأولى من البزل القطني (من 1.00 إلى 0.11). في الناظمة القلبية اللاسلكية لمدة 417 يومًا، وصلت وظيفة الخطر إلى الصفر تقريبًا (ht= 0.000459)، وظلت S(t) عند 0.10، وفي 480 يومًا، لم يزيد تواتر S(t). بالجمع بين الطريقتين، وجدنا أن الناظمة القلبية اللاسلكية المثلى هي سنتان لمرضى السكري الصينيين. أظهرت كل من طريقة البقاء على قيد الحياة إلى الوراء و CEIs فعالية. يجب النظر في برنامج السيولة لمدة عامين عند تحديد حالات الإصابة بمرض السكري باستخدام بيانات التأمين لدى السكان الصينيين.

Translated Description (French)

Une estimation précise de l'incidence et de la prévalence est essentielle pour prévenir et contrôler le diabète. Les données administratives (y compris les données d'assurance) pourraient être une bonne source pour estimer l'incidence du diabète. Cependant, la façon de déterminer la période de rétrospective (LP) pour supprimer les cas avec les enregistrements précédents reste un problème pour les données administratives. Un LP court entraînera une surestimation de l'incidence, tandis qu'un LP long limitera l'utilité d'une base de données. Par conséquent, il est nécessaire de déterminer la longueur optimale de la LP pour identifier les cas incidents dans les données administratives. Cette étude vise à proposer différentes méthodes pour identifier la LP optimale pour le diabète en utilisant les données d'assurance médicale de la population chinoise en référence à d'autres maladies dans les données administratives. Les données de la base de données d'assurance de la ville de Weifang, en Chine, entre janvier 2016 et décembre 2020 ont été utilisées. Pour identifier les cas incidents en 2020, nous avons retiré les patients prévalents ayant des antécédents de diabète entre 2016 et 2019 (c.-à-d. une LP de 4 ans). En utilisant cette LP de 4 ans comme référence, les indices d'examen de cohérence (IEC), y compris les valeurs prédictives positives, le coefficient κ et le taux de surestimation, ont été calculés pour déterminer le niveau de concordance entre les différentes LP et une LP de 4 ans (la LP la plus longue). De plus, nous avons construit une fonction de survie rétrograde, dans laquelle la survie (c'est-à-dire les cas incidents) signifie ne pas avoir d'enregistrement précédent à l'heure donnée et le temps de survie est la différence entre la date du dernier enregistrement en 2020 et l'enregistrement précédent le plus récent dans le LP. Sur la base des résultats de survie et du temps de survie, nous avons établi la fonction de survie et la fonction de risque de survie. Lorsque la probabilité de survie, S(t), reste stable et que le risque de survie converge vers zéro, nous obtenons la LP optimale. Combiné aux résultats de ces deux méthodes, nous avons déterminé la LP optimale pour les patients diabétiques chinois. L'accord κ était excellent (0,950), avec une valeur prédictive positive élevée (92,2%) et un faible taux de surestimation (8,4%) après une LP de 2 ans. En ce qui concerne la fonction de survie rétrograde, S(t) a chuté rapidement au cours de la première LP de 1 an (de 1,00 à 0,11). À un LP de 417 jours, la fonction de danger a atteint environ zéro (ht= 0,000459), S(t) est resté à 0,10 et à 480 jours, la fréquence de S(t) n'a pas augmenté. En combinant les deux méthodes, nous avons constaté que la LP optimale est de 2 ans pour les patients diabétiques chinois. La méthode de survie rétrograde et les IEC ont toutes deux montré leur efficacité. Une LP à 2 ans doit être envisagée lors de l'identification des cas incidents de diabète en utilisant les données d'assurance dans la population chinoise.

Translated Description (Spanish)

La estimación precisa de la incidencia y la prevalencia es vital para prevenir y controlar la diabetes. Los datos administrativos (incluidos los datos del seguro) podrían ser una buena fuente para estimar la incidencia de diabetes. Sin embargo, la forma de determinar el período de revisión (LP) para eliminar casos con registros anteriores sigue siendo un problema para los datos administrativos. Un LP corto causará una sobreestimación de la incidencia, mientras que un LP largo limitará la utilidad de una base de datos. Por lo tanto, es necesario determinar la longitud óptima de la LP para identificar los casos de incidentes en los datos administrativos. Este estudio tiene como objetivo ofrecer diferentes métodos para identificar la LP óptima para la diabetes mediante el uso de datos de seguros médicos de la población china con referencia a otras enfermedades en los datos administrativos. Se utilizaron datos de la base de datos de seguros de la ciudad de Weifang, China, entre enero de 2016 y diciembre de 2020. Para identificar los casos incidentes en 2020, eliminamos a los pacientes prevalentes con antecedentes de diabetes entre 2016 y 2019 (es decir, un LP de 4 años). Utilizando este LP de 4 años como referencia, se calcularon los índices de examen de consistencia (CEI), incluidos los valores predictivos positivos, el coeficiente κ y la tasa de sobreestimación, para determinar el nivel de acuerdo entre diferentes LP y un LP de 4 años (el LP más largo). Además, construimos una función de supervivencia retrógrada, en la que la supervivencia (es decir, casos incidentes) significa no tener un registro anterior en el momento dado y el tiempo de supervivencia es la diferencia entre la fecha del último registro en 2020 y el registro anterior más reciente en el LP. Con base en el resultado de supervivencia y el tiempo de supervivencia, establecimos la función de supervivencia y la función de peligro de supervivencia. Cuando la probabilidad de supervivencia, S(t), se mantiene estable y el riesgo de supervivencia converge a cero, obtenemos el LP óptimo. Combinado con los resultados de estos dos métodos, determinamos el LP óptimo para los pacientes chinos con diabetes. El acuerdo κ fue excelente (0.950), con un alto valor predictivo positivo (92.2%) y una baja tasa de sobreestimación (8.4%) después de un LP de 2 años. En cuanto a la función de supervivencia retrógrada, S(t) disminuyó rápidamente durante el primer LP de 1 año (de 1.00 a 0.11). A un LP de 417 días, la función de peligro alcanzó aproximadamente cero (ht= 0,000459), S(t) se mantuvo en 0,10 y a los 480 días, la frecuencia de S(t) no aumentó. Combinando los dos métodos, encontramos que el LP óptimo es de 2 años para los pacientes chinos con diabetes. El método de supervivencia retrógrada y los CEI mostraron efectividad. Se debe considerar un LP de 2 años al identificar casos incidentes de diabetes utilizando datos de seguros en la población china.

Files

PDF.pdf

Files (293.9 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:986494d018c36a67279fead2e384b327
293.9 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
فترة الرجوع إلى الوراء المثلى لتحديد حالات الإصابة الحقيقية بمرض السكري في بيانات التأمين الطبي لدى السكان الصينيين: دراسة تحليلية بأثر رجعي
Translated title (French)
Période de rétrospective optimale pour identifier les cas d'incidents réels de diabète dans les données d'assurance médicale de la population chinoise : étude d'analyse rétrospective
Translated title (Spanish)
Período óptimo de revisión retrospectiva para identificar casos reales de diabetes en los datos del seguro médico en la población china: estudio de análisis retrospectivo

Identifiers

Other
https://openalex.org/W4388423798
DOI
10.2196/46708

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1960232380
  • https://openalex.org/W1980938356
  • https://openalex.org/W1997679653
  • https://openalex.org/W2009804188
  • https://openalex.org/W2036668944
  • https://openalex.org/W2053658037
  • https://openalex.org/W2070285512
  • https://openalex.org/W2076615464
  • https://openalex.org/W2096400843
  • https://openalex.org/W2134228527
  • https://openalex.org/W2150909323
  • https://openalex.org/W2154745671
  • https://openalex.org/W2582608184
  • https://openalex.org/W2731349674
  • https://openalex.org/W2749889369
  • https://openalex.org/W2768656124
  • https://openalex.org/W2790302128
  • https://openalex.org/W2972869264
  • https://openalex.org/W2982457453
  • https://openalex.org/W3011557132
  • https://openalex.org/W3041632859
  • https://openalex.org/W3090313491
  • https://openalex.org/W3160593224
  • https://openalex.org/W3161453263
  • https://openalex.org/W3194181645
  • https://openalex.org/W4200230313
  • https://openalex.org/W4206967868
  • https://openalex.org/W4294084419