Published May 11, 2021 | Version v1
Publication Open

Statistical features of persistence and long memory in mortality data

  • 1. Academy of Mathematics and Systems Science
  • 2. Chinese Academy of Sciences
  • 3. University of Sydney

Description

Abstract Understanding core statistical properties and data features in mortality data are fundamental to the development of machine learning methods for demographic and actuarial applications of mortality projection. The study of statistical features in such data forms the basis for classification, regression and forecasting tasks. In particular, the understanding of key statistical structure in such data can aid in improving accuracy in undertaking mortality projection and forecasting when constructing life tables. The ability to accurately forecast mortality is a critical aspect for the study of demography, life insurance product design and pricing, pension planning and insurance-based decision risk management. Though many stylised facts of mortality data have been discussed in the literature, we provide evidence for a novel statistical feature that is pervasive in mortality data at a national level that is as yet unexplored. In this regard, we demonstrate in this work a strong evidence for the existence of long memory features in mortality data, and second that such long memory structures display multifractality as a statistical feature that can act as a discriminator of mortality dynamics by age, gender and country. To achieve this, we first outline the way in which we choose to represent the persistence of long memory from an estimator perspective. We make a natural link between a class of long memory features and an attribute of stochastic processes based on fractional Brownian motion. This allows us to use well established estimators for the Hurst exponent to then robustly and accurately study the long memory features of mortality data. We then introduce to mortality analysis the notion from data science known as multifractality. This allows us to study the long memory persistence features of mortality data on different timescales. We demonstrate its accuracy for sample sizes commensurate with national-level age term structure historical mortality records. A series of synthetic studies as well a comprehensive analysis of real mortality death count data are studied in order to demonstrate the pervasiveness of long memory structures in mortality data, both mono-fractal and multifractal functional features are verified to be present as stylised facts of national-level mortality data for most countries and most age groups by gender. We conclude by demonstrating how such features can be used in kernel clustering and mortality model forecasting to improve these actuarial applications.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يعد فهم الخصائص الإحصائية الأساسية وميزات البيانات في بيانات الوفيات أمرًا أساسيًا لتطوير أساليب التعلم الآلي للتطبيقات الديموغرافية والاكتوارية لإسقاط الوفيات. تشكل دراسة السمات الإحصائية في هذه البيانات الأساس لمهام التصنيف والانحدار والتنبؤ. على وجه الخصوص، يمكن أن يساعد فهم الهيكل الإحصائي الرئيسي في مثل هذه البيانات في تحسين الدقة في إجراء إسقاطات الوفيات والتنبؤ بها عند بناء جداول الحياة. تعد القدرة على التنبؤ بدقة بالوفيات جانبًا حاسمًا لدراسة الديموغرافيا وتصميم منتجات التأمين على الحياة وتسعيرها وتخطيط المعاشات التقاعدية وإدارة مخاطر القرارات القائمة على التأمين. على الرغم من مناقشة العديد من الحقائق الأسلوبية لبيانات الوفيات في الأدبيات، إلا أننا نقدم أدلة على ميزة إحصائية جديدة منتشرة في بيانات الوفيات على المستوى الوطني والتي لم يتم استكشافها بعد. في هذا الصدد، نظهر في هذا العمل دليلًا قويًا على وجود ميزات الذاكرة الطويلة في بيانات الوفيات، وثانيًا أن هياكل الذاكرة الطويلة هذه تعرض تعدد الجاذبية كميزة إحصائية يمكن أن تعمل كعامل تمييز لديناميكيات الوفيات حسب العمر والجنس والبلد. ولتحقيق ذلك، نحدد أولاً الطريقة التي نختار بها تمثيل استمرار الذاكرة الطويلة من منظور المقدر. نحن نقيم رابطًا طبيعيًا بين فئة من ميزات الذاكرة الطويلة وسمة من سمات العمليات العشوائية القائمة على الحركة البراونية الجزئية. يسمح لنا هذا باستخدام تقديرات راسخة لأس هيرست ثم دراسة ميزات الذاكرة الطويلة لبيانات الوفيات بقوة ودقة. ثم نقدم لتحليل الوفيات مفهوم علم البيانات المعروف باسم تعدد الجاذبية. وهذا يسمح لنا بدراسة سمات استمرارية الذاكرة الطويلة لبيانات الوفيات على فترات زمنية مختلفة. نثبت دقتها لأحجام العينات بما يتناسب مع سجلات الوفيات التاريخية للهيكل العمري على المستوى الوطني. يتم دراسة سلسلة من الدراسات التركيبية بالإضافة إلى تحليل شامل لبيانات عدد الوفيات الحقيقية من أجل إظهار انتشار هياكل الذاكرة الطويلة في بيانات الوفيات، ويتم التحقق من كل من السمات الوظيفية أحادية الكسر ومتعددة الجذور لتكون موجودة كحقائق منمقة لبيانات الوفيات على المستوى الوطني لمعظم البلدان ومعظم الفئات العمرية حسب الجنس. نختتم بتوضيح كيف يمكن استخدام هذه الميزات في التنبؤ بنموذج النواة والوفيات لتحسين هذه التطبيقات الاكتوارية.

Translated Description (French)

Résumé La compréhension des propriétés statistiques de base et des caractéristiques des données de mortalité est fondamentale pour le développement de méthodes d'apprentissage automatique pour les applications démographiques et actuarielles de la projection de la mortalité. L'étude des caractéristiques statistiques de ces données constitue la base des tâches de classification, de régression et de prévision. En particulier, la compréhension de la structure statistique clé de ces données peut aider à améliorer la précision de la projection et de la prévision de la mortalité lors de la construction de tables de mortalité. La capacité de prévoir avec précision la mortalité est un aspect essentiel de l'étude de la démographie, de la conception et de la tarification des produits d'assurance-vie, de la planification des retraites et de la gestion des risques de décision basée sur l'assurance. Bien que de nombreux faits stylisés des données de mortalité aient été discutés dans la littérature, nous fournissons des preuves d'une nouvelle caractéristique statistique qui est omniprésente dans les données de mortalité à un niveau national qui est encore inexploré. À cet égard, nous démontrons dans ce travail une preuve solide de l'existence de caractéristiques de mémoire longue dans les données de mortalité, et deuxièmement que ces structures de mémoire longue présentent une multifractalité en tant que caractéristique statistique qui peut agir comme un discriminateur de la dynamique de la mortalité par âge, sexe et pays. Pour y parvenir, nous décrivons d'abord la manière dont nous choisissons de représenter la persistance de la mémoire longue du point de vue de l'estimateur. Nous établissons un lien naturel entre une classe de caractéristiques de mémoire longue et un attribut de processus stochastiques basés sur le mouvement brownien fractionnaire. Cela nous permet d'utiliser des estimateurs bien établis pour l'exposant de Hurst afin d'étudier ensuite de manière robuste et précise les caractéristiques de longue mémoire des données de mortalité. Nous introduisons ensuite dans l'analyse de la mortalité la notion de la science des données connue sous le nom de multifractalité. Cela nous permet d'étudier les caractéristiques de persistance de la mémoire longue des données de mortalité à différentes échelles de temps. Nous démontrons sa précision pour des tailles d'échantillon proportionnelles aux enregistrements historiques de mortalité par structure par âge au niveau national. Une série d'études synthétiques ainsi qu'une analyse complète des données de comptage des décès réels sont étudiées afin de démontrer l'omniprésence des structures de longue mémoire dans les données de mortalité. Il est vérifié que les caractéristiques fonctionnelles mono-fractales et multifractales sont présentes sous forme de faits stylisés des données de mortalité au niveau national pour la plupart des pays et la plupart des groupes d'âge par sexe. Nous concluons en démontrant comment de telles fonctionnalités peuvent être utilisées dans le clustering du noyau et la prévision des modèles de mortalité pour améliorer ces applications actuarielles.

Translated Description (Spanish)

Resumen La comprensión de las propiedades estadísticas básicas y las características de los datos en los datos de mortalidad son fundamentales para el desarrollo de métodos de aprendizaje automático para aplicaciones demográficas y actuariales de la proyección de la mortalidad. El estudio de las características estadísticas de dichos datos constituye la base para las tareas de clasificación, regresión y previsión. En particular, la comprensión de la estructura estadística clave en dichos datos puede ayudar a mejorar la precisión en la realización de proyecciones y pronósticos de mortalidad al construir tablas de vida. La capacidad de pronosticar con precisión la mortalidad es un aspecto crítico para el estudio de la demografía, el diseño y la fijación de precios de los productos de seguros de vida, la planificación de pensiones y la gestión del riesgo de decisión basada en seguros. Aunque en la literatura se han discutido muchos hechos estilizados de los datos de mortalidad, proporcionamos evidencia de una característica estadística novedosa que es omnipresente en los datos de mortalidad a nivel nacional y que aún no se ha explorado. En este sentido, demostramos en este trabajo una fuerte evidencia de la existencia de características de memoria larga en los datos de mortalidad, y en segundo lugar que tales estructuras de memoria larga muestran la multifractalidad como una característica estadística que puede actuar como un discriminador de la dinámica de mortalidad por edad, género y país. Para lograr esto, primero describimos la forma en que elegimos representar la persistencia de la memoria larga desde una perspectiva estimadora. Establecemos un vínculo natural entre una clase de características de memoria larga y un atributo de procesos estocásticos basados en el movimiento browniano fraccional. Esto nos permite utilizar estimadores bien establecidos para el exponente de Hurst para luego estudiar de manera sólida y precisa las características de memoria larga de los datos de mortalidad. A continuación, introducimos en el análisis de la mortalidad la noción de ciencia de datos conocida como multifractalidad. Esto nos permite estudiar las características de persistencia de larga memoria de los datos de mortalidad en diferentes escalas de tiempo. Demostramos su precisión para tamaños de muestra acordes con los registros históricos de mortalidad de la estructura de términos de edad a nivel nacional. Se estudian una serie de estudios sintéticos, así como un análisis exhaustivo de los datos reales de recuento de muertes por mortalidad, con el fin de demostrar la omnipresencia de las estructuras de memoria larga en los datos de mortalidad, se verifica que las características funcionales tanto monofractales como multifractales están presentes como hechos estilizados de datos de mortalidad a nivel nacional para la mayoría de los países y la mayoría de los grupos de edad por género. Concluimos demostrando cómo se pueden utilizar tales características en la agrupación de núcleos y la previsión de modelos de mortalidad para mejorar estas aplicaciones actuariales.

Files

div-class-title-statistical-features-of-persistence-and-long-memory-in-mortality-data-div.pdf.pdf

Files (821.8 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:262fc052d3fa5be1dd537919700cf8e3
821.8 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
السمات الإحصائية للمثابرة والذاكرة الطويلة في بيانات الوفيات
Translated title (French)
Caractéristiques statistiques de la persistance et de la longue mémoire dans les données de mortalité
Translated title (Spanish)
Características estadísticas de persistencia y memoria larga en los datos de mortalidad

Identifiers

Other
https://openalex.org/W3162365847
DOI
10.1017/s1748499521000129

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1598847143
  • https://openalex.org/W1973694910
  • https://openalex.org/W2031753087
  • https://openalex.org/W2045593113
  • https://openalex.org/W2055781590
  • https://openalex.org/W2064197159
  • https://openalex.org/W2071602085
  • https://openalex.org/W2144328044
  • https://openalex.org/W2155074104
  • https://openalex.org/W2165773639
  • https://openalex.org/W2790708350
  • https://openalex.org/W2806187618
  • https://openalex.org/W2898264579
  • https://openalex.org/W2951044827
  • https://openalex.org/W3081124633
  • https://openalex.org/W3121942314
  • https://openalex.org/W3126883404
  • https://openalex.org/W4214562929
  • https://openalex.org/W4232223522
  • https://openalex.org/W4236030294
  • https://openalex.org/W4242671632