Published April 21, 2022 | Version v1
Publication

Environmental context observed during the Tara Pacific Expedition 2016-2018, simplified version at site level

Description

This dataset provide a site level-compilation of previous datasets provided at the event level (see https://zenodo.org/record/6445609#.YlP8B5NByEA). In some cases, certain parameters were not available at specific sampling sites due to technical issues or sensor availability, however, various basin scale studies and statistical tests require a complete dataset for all sampled sites. During the Tara Pacific expedition, many parameters were concurrently measured in-situ, estimated from remote sensing and/or modeled. For instance, sea surface temperature was measured on the boat using the thermosalinograph included in the underway system, but also with satellite and estimated from a model. Each of these three modes of acquisition have their caveat and accuracy, however, within a certain confidence interval, missing in-situ data can be replaced by its remotely sensed or modeled equivalent. We provide here a simplified version at the sampling site level by replacing missing in-situ data by their closest and most accurate satellite or modeled equivalent. In each case, in-situ data was considered as the most accurate source of data, with a preference to HPLC pigments analysis followed by measurements done by the ACS, while satellite and modeled data were used only if in-situ data was not available. We evaluated the accuracy of ACS and of each satellite and modeled datasets by linear regressions with their in-situ counterparts. A bias of the modeled or satellite data was identified when the slope of the regression was different to 1 and/or an intercept was different to 0. The satellite and modeled data were forced to match the in-situ data by dividing by the slope and subtracting the intercept. This is the case for SST. When large bias persisted between matchups with observations, the corrected data was not used to replace missing in-situ data. This is the case for chl. The same approach was then applied to fill missing data with modeled values (MERCATOR-Copernicus). A correction for the bias in the following variable was applied for SST, SSS, PO4, and SiOH. As previously done, if large bias persisted between observations and corrected data, they were not used to replace missing in-situ data. This is the case for chl, NO3, and Fe. The [MTE] samples were sometimes sampled in the afternoon instead of the morning alongside all the other water samples, thus were located in between two sampling stations. These [MTE] samples could not be assigned to a sampling station following the criterion presented in the section 3, therefore, the missing values of the corresponding morning stations were interpolated linearly. The same approach was used for pH measurements, with a preference from measurements provided by total carbonate system quantifications, followed by direct pH measurements and then modeled values (MERCATOR-Copernicus).

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

توفر مجموعة البيانات هذه تجميعًا على مستوى الموقع لمجموعات البيانات السابقة المقدمة على مستوى الحدث (انظر https://zenodo.org/record/6445609#.YlP8B5NByEA). في بعض الحالات، لم تكن بعض المعلمات متاحة في مواقع أخذ العينات المحددة بسبب مشاكل فنية أو توافر أجهزة الاستشعار، ومع ذلك، تتطلب الدراسات المختلفة على مستوى الحوض والاختبارات الإحصائية مجموعة بيانات كاملة لجميع مواقع أخذ العينات. خلال بعثة تارا باسيفيك، تم قياس العديد من المعلمات بشكل متزامن في الموقع، وتم تقديرها من خلال الاستشعار عن بعد و/أو النمذجة. على سبيل المثال، تم قياس درجة حرارة سطح البحر على متن القارب باستخدام التصوير الحراري الملحي المدرج في النظام الجاري، ولكن أيضًا باستخدام الأقمار الصناعية وتقديرها من نموذج. كل من هذه الأنماط الثلاثة للاكتساب لها تحذيرها ودقتها، ومع ذلك، في غضون فترة ثقة معينة، يمكن استبدال البيانات المفقودة في الموقع بمكافئها المستشعر عن بعد أو المنمذجة. نقدم هنا نسخة مبسطة على مستوى موقع أخذ العينات عن طريق استبدال البيانات المفقودة في الموقع بأقرب الأقمار الصناعية وأكثرها دقة أو ما يعادلها على غرار. في كل حالة، كانت البيانات في الموقع تعتبر المصدر الأكثر دقة للبيانات، مع تفضيل تحليل أصباغ HPLC تليها القياسات التي يقوم بها ACS، في حين تم استخدام البيانات الساتلية والبيانات المنمذجة فقط في حالة عدم توفر البيانات في الموقع. قمنا بتقييم دقة ACS وكل قمر صناعي ومجموعات البيانات المنمذجة من خلال الانحدارات الخطية مع نظيراتها في الموقع. تم تحديد تحيز البيانات المنمذجة أو الساتلية عندما كان ميل الانحدار مختلفًا عن 1 و/أو كان الاعتراض مختلفًا عن 0. تم إجبار القمر الصناعي والبيانات المنمذجة على مطابقة البيانات في الموقع عن طريق القسمة على المنحدر وطرح الاعتراض. هذا هو الحال بالنسبة لـ SST. عندما استمر التحيز الكبير بين المطابقات والملاحظات، لم يتم استخدام البيانات المصححة لاستبدال البيانات المفقودة في الموقع. هذا هو الحال بالنسبة لـ chl. ثم تم تطبيق نفس النهج لملء البيانات المفقودة بقيم نموذجية (MERCATOR - COPERNICUS). تم تطبيق تصحيح للتحيز في المتغير التالي لـ SST و SSS و PO4 و SiOH. كما حدث سابقًا، إذا استمر التحيز الكبير بين الملاحظات والبيانات المصححة، فلن يتم استخدامها لاستبدال البيانات المفقودة في الموقع. هذا هو الحال بالنسبة لـ chl و NO3 و Fe. تم أخذ عينات [MTE] في بعض الأحيان في فترة ما بعد الظهر بدلاً من الصباح جنبًا إلى جنب مع جميع عينات المياه الأخرى، وبالتالي تم وضعها بين محطتي أخذ العينات. لا يمكن تعيين عينات [MTE] هذه إلى محطة أخذ العينات باتباع المعيار المعروض في القسم 3، وبالتالي، تم استكمال القيم المفقودة للمحطات الصباحية المقابلة خطيًا. تم استخدام نفس النهج لقياسات الأس الهيدروجيني، مع تفضيل من القياسات التي توفرها الكميات الإجمالية لنظام الكربونات، تليها قياسات الأس الهيدروجيني المباشرة ثم القيم المنمذجة (ميركاتور- كوبرنيكوس).

Translated Description (French)

Cet ensemble de données fournit une compilation au niveau du site des ensembles de données précédents fournis au niveau de l'événement (voir https://zenodo.org/record/6445609#.YlP8B5NByEA). Dans certains cas, certains paramètres n'étaient pas disponibles sur des sites d'échantillonnage spécifiques en raison de problèmes techniques ou de la disponibilité des capteurs. Cependant, diverses études à l'échelle du bassin et tests statistiques nécessitent un ensemble de données complet pour tous les sites échantillonnés. Au cours de l'expédition Tara Pacific, de nombreux paramètres ont été mesurés simultanément in situ, estimés par télédétection et/ou modélisés. Par exemple, la température de surface de la mer a été mesurée sur le bateau à l'aide du thermosalinographe inclus dans le système en cours, mais aussi par satellite et estimée à partir d'un modèle. Chacun de ces trois modes d'acquisition a sa mise en garde et sa précision, cependant, dans un certain intervalle de confiance, les données manquantes in situ peuvent être remplacées par son équivalent détecté ou modélisé à distance. Nous fournissons ici une version simplifiée au niveau du site d'échantillonnage en remplaçant les données manquantes in situ par leur satellite ou équivalent modélisé le plus proche et le plus précis. Dans chaque cas, les données in situ ont été considérées comme la source de données la plus précise, avec une préférence pour l'analyse des pigments HPLC suivie de mesures effectuées par l'ACS, tandis que les données satellitaires et modélisées n'ont été utilisées que si les données in situ n'étaient pas disponibles. Nous avons évalué la précision de l'ACS et de chaque satellite et modélisé les ensembles de données par régressions linéaires avec leurs homologues in situ. Un biais des données modélisées ou satellitaires a été identifié lorsque la pente de la régression était différente de 1 et/ou qu'une interception était différente de 0. Le satellite et les données modélisées ont été forcés de correspondre aux données in situ en divisant par la pente et en soustrayant l'interception. C'est le cas pour SST. Lorsqu'un biais important persistait entre les correspondances avec les observations, les données corrigées n'étaient pas utilisées pour remplacer les données manquantes in situ. C'est le cas de chl. La même approche a ensuite été appliquée pour remplir les données manquantes avec des valeurs modélisées (MERCATOR-Copernicus). Une correction du biais dans la variable suivante a été appliquée pour SST, SSS, PO4 et SiOH. Comme précédemment, si un biais important persistait entre les observations et les données corrigées, elles n'étaient pas utilisées pour remplacer les données manquantes in situ. C'est le cas pour chl, NO3 et Fe. Les échantillons [MTE] étaient parfois prélevés l'après-midi au lieu du matin aux côtés de tous les autres échantillons d'eau, se situant ainsi entre deux stations de prélèvement. Ces échantillons [MTE] n'ont pas pu être attribués à une station d'échantillonnage selon le critère présenté dans la section 3, par conséquent, les valeurs manquantes des stations matinales correspondantes ont été interpolées linéairement. La même approche a été utilisée pour les mesures de pH, avec une préférence pour les mesures fournies par les quantifications du système carbonate total, suivies de mesures de pH directes puis de valeurs modélisées (MERCATOR-Copernicus).

Translated Description (Spanish)

Este conjunto de datos proporciona una compilación a nivel de sitio de conjuntos de datos anteriores proporcionados a nivel de evento (consulte https://zenodo.org/record/6445609#.YlP8B5NByEA). En algunos casos, ciertos parámetros no estaban disponibles en sitios de muestreo específicos debido a problemas técnicos o disponibilidad de sensores, sin embargo, varios estudios de escala de cuenca y pruebas estadísticas requieren un conjunto de datos completo para todos los sitios muestreados. Durante la expedición de Tara al Pacífico, muchos parámetros se midieron simultáneamente in situ, se estimaron a partir de teledetección y/o se modelaron. Por ejemplo, la temperatura de la superficie del mar se midió en el barco utilizando el termosalinógrafo incluido en el sistema en curso, pero también con satélite y se estimó a partir de un modelo. Cada uno de estos tres modos de adquisición tiene su advertencia y precisión, sin embargo, dentro de un cierto intervalo de confianza, los datos in situ que faltan pueden ser reemplazados por su equivalente de detección remota o modelado. Proporcionamos aquí una versión simplificada a nivel del sitio de muestreo al reemplazar los datos in situ faltantes por su equivalente satelital o modelado más cercano y preciso. En cada caso, los datos in situ se consideraron la fuente de datos más precisa, con preferencia al análisis de pigmentos por HPLC seguido de mediciones realizadas por la ACS, mientras que los datos satelitales y modelados se utilizaron solo si no se disponía de datos in situ. Evaluamos la precisión de ACS y de cada conjunto de datos satelitales y modelados mediante regresiones lineales con sus contrapartes in situ. Se identificó un sesgo de los datos modelados o satelitales cuando la pendiente de la regresión era diferente a 1 y/o una intersección era diferente a 0. Los datos satelitales y modelados se vieron obligados a coincidir con los datos in situ dividiendo por la pendiente y restando la intersección. Este es el caso de SST. Cuando persistió un gran sesgo entre los emparejamientos con las observaciones, los datos corregidos no se utilizaron para reemplazar los datos in situ faltantes. Este es el caso de chl. Luego se aplicó el mismo enfoque para completar los datos faltantes con valores modelados (MERCATOR-Copernicus). Se aplicó una corrección para el sesgo en la siguiente variable para SST, SSS, PO4 y SiOH. Como se hizo anteriormente, si persistía un gran sesgo entre los datos observados y los datos corregidos, no se utilizaban para reemplazar los datos in situ que faltaban. Este es el caso de chl, NO3 y Fe. Las muestras [mTe] a veces se muestrearon por la tarde en lugar de por la mañana junto con todas las demás muestras de agua, por lo que se ubicaron entre dos estaciones de muestreo. Estas muestras [mTe] no se pudieron asignar a una estación de muestreo siguiendo el criterio presentado en la sección 3, por lo tanto, los valores faltantes de las estaciones matutinas correspondientes se interpolaron linealmente. Se utilizó el mismo enfoque para las mediciones de pH, con una preferencia de las mediciones proporcionadas por las cuantificaciones del sistema de carbonato total, seguidas de mediciones directas de pH y luego valores modelados (MERCATOR-Copernicus).

Additional details

Additional titles

Translated title (Arabic)
تمت ملاحظة السياق البيئي خلال بعثة تارا للمحيط الهادئ 2016-2018، نسخة مبسطة على مستوى الموقع
Translated title (French)
Contexte environnemental observé lors de l'expédition Tara Pacific 2016-2018, version simplifiée au niveau du site
Translated title (Spanish)
Contexto ambiental observado durante la Expedición Tara Pacific 2016-2018, versión simplificada a nivel de sitio

Identifiers

Other
https://openalex.org/W4393565987
DOI
10.5281/zenodo.6474973

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Argentina