PPlot, a webapp to partition geochemical data and isolate mixed subpopulations using probability plot modeling
- 1. Serviço Geológico do Brasil - CPRM
- 2. Universidade Federal do Paraná
- 3. Center for Effective Philanthropy
Description
Statistical methods are mostly designed to handle datasets comprising statistically single normal or log-normal populations, but geochemical and geophysical surveys usually deviate from this expectation. A reason for this is the heterogeneity in the occurrence of geological objects, so the complete dataset may correspond to multiple mixed subpopulations. Specifically, multiple mixed subpopulations can refer to differences between mineralized and barren areas, different geochemical facies of a geological unit, or contaminated and healthy areas. This implies a restriction on using classical or even robust statistical estimates, unless the underlying subpopulations can be extracted from the dataset. The probability plot can be used to assess a dataset and to infer a possible combination of subpopulations, either normal or log-normal, whose combination may generate it. The web-based app PPlot, presented in this paper, allows the plotting of the probability plot of a dataset and modeling the underlying subpopulations present in it, either automatically or manually. After modeling the dataset by the application, the user will obtain numerical results and plots of the range of values that delimit each subpopulation, as well as the mean and standard deviation for each of them. Computer-generated and real datasets were used to validate the procedure and coding, and an example of usage is presented. The app was developed using HTML5 and JavaScript and it runs in any modern browser, and is freely available in https://pplotweb.firebaseapp.com/.
Translated Descriptions
Translated Description (Arabic)
تم تصميم الأساليب الإحصائية في الغالب للتعامل مع مجموعات البيانات التي تضم مجموعات إحصائية طبيعية واحدة أو طبيعية، ولكن المسوحات الجيوكيميائية والجيوفيزيائية عادة ما تنحرف عن هذا التوقع. والسبب في ذلك هو عدم التجانس في حدوث الأجسام الجيولوجية، وبالتالي فإن مجموعة البيانات الكاملة قد تتوافق مع مجموعات فرعية مختلطة متعددة. على وجه التحديد، يمكن أن تشير المجموعات السكانية الفرعية المختلطة المتعددة إلى الاختلافات بين المناطق المعدنية والقاحلة، أو السحنات الجيوكيميائية المختلفة لوحدة جيولوجية، أو المناطق الملوثة والصحية. وهذا يعني فرض قيود على استخدام التقديرات الإحصائية الكلاسيكية أو حتى القوية، ما لم يكن من الممكن استخراج المجموعات السكانية الفرعية الأساسية من مجموعة البيانات. يمكن استخدام مخطط الاحتمالات لتقييم مجموعة البيانات واستنتاج مجموعة محتملة من المجموعات السكانية الفرعية، سواء كانت طبيعية أو لوغاريتمية طبيعية، والتي قد تولدها مجموعتها. يسمح التطبيق القائم على الويب PPlot، المقدم في هذه الورقة، بتخطيط مخطط الاحتمالات لمجموعة البيانات ونمذجة المجموعات الفرعية الأساسية الموجودة فيها، إما تلقائيًا أو يدويًا. بعد نمذجة مجموعة البيانات من خلال التطبيق، سيحصل المستخدم على نتائج رقمية ومخططات لنطاق القيم التي تحدد كل مجموعة سكانية فرعية، بالإضافة إلى المتوسط والانحراف المعياري لكل منها. تم استخدام مجموعات البيانات التي تم إنشاؤها بواسطة الكمبيوتر والحقيقية للتحقق من صحة الإجراء والترميز، ويتم تقديم مثال على الاستخدام. تم تطوير التطبيق باستخدام HTML5 وجافا سكريبت ويعمل في أي متصفح حديث، وهو متاح مجانًا على https://pplotweb.firebaseapp.com/.Translated Description (French)
Les méthodes statistiques sont principalement conçues pour traiter des ensembles de données comprenant des populations normales ou log-normales statistiquement uniques, mais les levés géochimiques et géophysiques s'écartent généralement de cette attente. Une raison à cela est l'hétérogénéité dans l'occurrence des objets géologiques, de sorte que l'ensemble de données complet peut correspondre à plusieurs sous-populations mixtes. Plus précisément, plusieurs sous-populations mixtes peuvent faire référence aux différences entre les zones minéralisées et stériles, aux différents faciès géochimiques d'une unité géologique ou aux zones contaminées et saines. Cela implique une restriction de l'utilisation d'estimations statistiques classiques ou même robustes, à moins que les sous-populations sous-jacentes puissent être extraites de l'ensemble de données. Le graphique de probabilité peut être utilisé pour évaluer un ensemble de données et pour déduire une combinaison possible de sous-populations, normales ou log-normales, dont la combinaison peut le générer. L'application Web PPlot, présentée dans cet article, permet de tracer le graphique de probabilité d'un ensemble de données et de modéliser les sous-populations sous-jacentes qui y sont présentes, automatiquement ou manuellement. Après avoir modélisé l'ensemble de données par l'application, l'utilisateur obtiendra des résultats numériques et des graphiques de la plage de valeurs qui délimitent chaque sous-population, ainsi que la moyenne et l'écart type pour chacun d'eux. Des ensembles de données générés par ordinateur et réels ont été utilisés pour valider la procédure et le codage, et un exemple d'utilisation est présenté. L'application a été développée en utilisant HTML5 et JavaScript et elle fonctionne dans n'importe quel navigateur moderne, et est disponible gratuitement sur https://pplotweb.firebaseapp.com/.Translated Description (Spanish)
Los métodos estadísticos están diseñados principalmente para manejar conjuntos de datos que comprenden poblaciones estadísticamente únicas normales o log-normales, pero los estudios geoquímicos y geofísicos generalmente se desvían de esta expectativa. Una razón para esto es la heterogeneidad en la ocurrencia de objetos geológicos, por lo que el conjunto de datos completo puede corresponder a múltiples subpoblaciones mixtas. Específicamente, múltiples subpoblaciones mixtas pueden referirse a diferencias entre áreas mineralizadas y estériles, diferentes facies geoquímicas de una unidad geológica o áreas contaminadas y sanas. Esto implica una restricción en el uso de estimaciones estadísticas clásicas o incluso robustas, a menos que las subpoblaciones subyacentes puedan extraerse del conjunto de datos. El gráfico de probabilidad se puede utilizar para evaluar un conjunto de datos e inferir una posible combinación de subpoblaciones, ya sean normales o log-normales, cuya combinación puede generarla. La aplicación web PPlot, presentada en este trabajo, permite trazar el gráfico de probabilidad de un conjunto de datos y modelar las subpoblaciones subyacentes presentes en él, ya sea de forma automática o manual. Después de modelar el conjunto de datos por la aplicación, el usuario obtendrá resultados numéricos y gráficos del rango de valores que delimitan cada subpoblación, así como la media y la desviación estándar para cada una de ellas. Se utilizaron conjuntos de datos generados por ordenador y reales para validar el procedimiento y la codificación, y se presenta un ejemplo de uso. La aplicación se desarrolló utilizando HTML5 y JavaScript y se ejecuta en cualquier navegador moderno, y está disponible gratuitamente en https://pplotweb.firebaseapp.com/.Files
3135.pdf
Files
(2.5 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:27cb424f63529d5b77b0dd7a7e30c1f5
|
2.5 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- PPlot، تطبيق ويب لتقسيم البيانات الجيوكيميائية وعزل المجموعات السكانية الفرعية المختلطة باستخدام نمذجة مخطط الاحتمالات
- Translated title (French)
- PPlot, une application Web pour partitionner les données géochimiques et isoler les sous-populations mixtes à l'aide de la modélisation des courbes de probabilité
- Translated title (Spanish)
- PPlot, una aplicación web para dividir datos geoquímicos y aislar subpoblaciones mixtas utilizando modelos de gráficos de probabilidad
Identifiers
- Other
- https://openalex.org/W4386588515
- DOI
- 10.21715/gb2358-2812.202337002