Published June 23, 2023 | Version v1
Publication Open

A collaborative and near-comprehensive North Pacific humpback whale photo-ID dataset

  • 1. Southern Cross University
  • 2. NOAA National Marine Fisheries Service Southwest Fisheries Science Center
  • 3. University of Hawaiʻi at Mānoa
  • 4. The Arctic Eider Society
  • 5. NOAA National Marine Fisheries Service Pacific Islands Fisheries Science Center
  • 6. NOAA National Marine Fisheries Service
  • 7. Asia Pacific Foundation of Canada
  • 8. Cascadia Research Collective
  • 9. University of Alaska Southeast
  • 10. Grenoble Association of Respiratory Insufficiency
  • 11. Fisheries and Oceans Canada
  • 12. University of Southern Denmark
  • 13. Centro de Estudios Universitarios Arkos
  • 14. Center for Whale Research
  • 15. Oregon State University
  • 16. University of Hawaii System
  • 17. Whale Museum
  • 18. Okinawa Churashima Foundation
  • 19. Universidad Autónoma de Baja California Sur
  • 20. NOAA National Marine Fisheries Service Alaska Fisheries Science Center
  • 21. University of Hawaii at Hilo
  • 22. Oregon Department of Fish and Wildlife
  • 23. Emmanuel College - Massachusetts
  • 24. Murdoch University
  • 25. Severtsov Institute of Ecology and Evolution
  • 26. University of Alaska Fairbanks
  • 27. Vashon Partners (United States)

Description

We present an ocean-basin-scale dataset that includes tail fluke photographic identification (photo-ID) and encounter data for most living individual humpback whales (Megaptera novaeangliae) in the North Pacific Ocean. The dataset was built through a broad collaboration combining 39 separate curated photo-ID catalogs, supplemented with community science data. Data from throughout the North Pacific were aggregated into 13 regions, including six breeding regions, six feeding regions, and one migratory corridor. All images were compared with minimal pre-processing using a recently developed image recognition algorithm based on machine learning through artificial intelligence; this system is capable of rapidly detecting matches between individuals with an estimated 97-99% accuracy. For the 2001-2021 study period, a total of 27,956 unique individuals were documented in 157,350 encounters. Each individual was encountered, on average, in 5.6 sampling periods (i.e., breeding and feeding seasons), with an annual average of 87% of whales encountered in more than one season. The combined dataset and image recognition tool represents a living and accessible resource for collaborative, basin-wide studies of a keystone marine mammal in a time of rapid ecological change.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

نقدم مجموعة بيانات على نطاق حوض المحيط تتضمن هوية فوتوغرافية بالصدفة الذيلية (photo - ID) وبيانات مصادفة لمعظم الحيتان الحدباء الفردية الحية (Megaptera novaeangliae) في شمال المحيط الهادئ. تم بناء مجموعة البيانات من خلال تعاون واسع يجمع بين 39 كتالوجًا منفصلاً لهوية الصورة، مع استكمالها ببيانات علوم المجتمع. تم تجميع البيانات من جميع أنحاء شمال المحيط الهادئ في 13 منطقة، بما في ذلك ست مناطق تكاثر وست مناطق تغذية وممر هجرة واحد. تمت مقارنة جميع الصور مع الحد الأدنى من المعالجة المسبقة باستخدام خوارزمية التعرف على الصور التي تم تطويرها مؤخرًا بناءً على التعلم الآلي من خلال الذكاء الاصطناعي ؛ هذا النظام قادر على الكشف السريع عن التطابقات بين الأفراد بدقة تقدر بـ 97-99 ٪. بالنسبة لفترة الدراسة 2001-2021، تم توثيق ما مجموعه 27,956 فردًا فريدًا في 157,350 لقاء. تمت مصادفة كل فرد، في المتوسط، في 5.6 فترات أخذ العينات (أي مواسم التكاثر والتغذية)، بمتوسط سنوي قدره 87 ٪ من الحيتان التي تمت مواجهتها في أكثر من موسم واحد. تمثل مجموعة البيانات المدمجة وأداة التعرف على الصور موردًا حيًا ويمكن الوصول إليه لإجراء دراسات تعاونية على مستوى الحوض لحيوان ثديي بحري رئيسي في وقت يشهد تغيرًا إيكولوجيًا سريعًا.

Translated Description (French)

Nous présentons un ensemble de données à l'échelle du bassin océanique qui comprend l'identification photographique de la douve de la queue (photo-ID) et des données de rencontre pour la plupart des baleines à bosse individuelles vivantes (Megaptera novaeangliae) dans l'océan Pacifique Nord. L'ensemble de données a été construit grâce à une vaste collaboration combinant 39 catalogues de photo-identification distincts, complétés par des données scientifiques communautaires. Les données de tout le Pacifique Nord ont été agrégées en 13 régions, dont six régions de reproduction, six régions d'alimentation et un corridor migratoire. Toutes les images ont été comparées à un prétraitement minimal à l'aide d'un algorithme de reconnaissance d'images récemment développé basé sur l'apprentissage automatique par intelligence artificielle ; ce système est capable de détecter rapidement les correspondances entre les individus avec une précision estimée de 97 à 99 %. Pour la période d'étude 2001-2021, un total de 27 956 individus uniques ont été documentés lors de 157 350 rencontres. Chaque individu a été rencontré, en moyenne, au cours de 5,6 périodes d'échantillonnage (c.-à-d. saisons de reproduction et d'alimentation), avec une moyenne annuelle de 87 % des baleines rencontrées au cours de plus d'une saison. L'ensemble de données et l'outil de reconnaissance d'images combinés représentent une ressource vivante et accessible pour les études collaboratives à l'échelle du bassin d'un mammifère marin clé à une époque de changement écologique rapide.

Translated Description (Spanish)

Presentamos un conjunto de datos a escala de cuenca oceánica que incluye la identificación fotográfica de la aleta caudal (foto-ID) y los datos de encuentro de la mayoría de las ballenas jorobadas individuales vivas (Megaptera novaeangliae) en el Océano Pacífico Norte. El conjunto de datos se construyó a través de una amplia colaboración que combina 39 catálogos de identificación con foto seleccionados por separado, complementados con datos científicos de la comunidad. Los datos de todo el Pacífico Norte se agruparon en 13 regiones, incluidas seis regiones de reproducción, seis regiones de alimentación y un corredor migratorio. Todas las imágenes se compararon con un preprocesamiento mínimo utilizando un algoritmo de reconocimiento de imágenes recientemente desarrollado basado en el aprendizaje automático a través de inteligencia artificial; este sistema es capaz de detectar rápidamente coincidencias entre individuos con una precisión estimada del 97-99%. Para el período de estudio 2001-2021, se documentó un total de 27.956 individuos únicos en 157.350 encuentros. Cada individuo se encontró, en promedio, en 5.6 períodos de muestreo (es decir, temporadas de reproducción y alimentación), con una media anual del 87% de las ballenas encontradas en más de una temporada. El conjunto de datos y la herramienta de reconocimiento de imágenes combinados representan un recurso vivo y accesible para estudios colaborativos en toda la cuenca de un mamífero marino clave en un momento de rápido cambio ecológico.

Files

s41598-023-36928-1.pdf.pdf

Files (2.7 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:cfe143aab8b55927a9155031e309b31f
2.7 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مجموعة بيانات هوية الحوت الأحدب التعاوني والشامل في شمال المحيط الهادئ
Translated title (French)
Un ensemble de données collaboratives et presque complètes sur les photos d'identité des baleines à bosse du Pacifique Nord
Translated title (Spanish)
Un conjunto de datos colaborativo y casi completo de identificación fotográfica de ballenas jorobadas del Pacífico Norte

Identifiers

Other
https://openalex.org/W4381805114
DOI
10.1038/s41598-023-36928-1

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Philippines

References

  • https://openalex.org/W1977533901
  • https://openalex.org/W1979825662
  • https://openalex.org/W1983728669
  • https://openalex.org/W2006950412
  • https://openalex.org/W2012540452
  • https://openalex.org/W2028369552
  • https://openalex.org/W2029084939
  • https://openalex.org/W2044560884
  • https://openalex.org/W2050706974
  • https://openalex.org/W2061582739
  • https://openalex.org/W2062380924
  • https://openalex.org/W2064989161
  • https://openalex.org/W2117542660
  • https://openalex.org/W2121284876
  • https://openalex.org/W2123892517
  • https://openalex.org/W2127773215
  • https://openalex.org/W2133149336
  • https://openalex.org/W2144432207
  • https://openalex.org/W2145680098
  • https://openalex.org/W2159327312
  • https://openalex.org/W2171362875
  • https://openalex.org/W2229672661
  • https://openalex.org/W2302501749
  • https://openalex.org/W2318675239
  • https://openalex.org/W2331183246
  • https://openalex.org/W2462377765
  • https://openalex.org/W2538802555
  • https://openalex.org/W2578619041
  • https://openalex.org/W2644012878
  • https://openalex.org/W2739663224
  • https://openalex.org/W2759325467
  • https://openalex.org/W2770227684
  • https://openalex.org/W2791155414
  • https://openalex.org/W2796410914
  • https://openalex.org/W2806458049
  • https://openalex.org/W2892221621
  • https://openalex.org/W2922176752
  • https://openalex.org/W2923931630
  • https://openalex.org/W2924520409
  • https://openalex.org/W2962461021
  • https://openalex.org/W2990970977
  • https://openalex.org/W2996181439
  • https://openalex.org/W3003114600
  • https://openalex.org/W3024722698
  • https://openalex.org/W3035990271
  • https://openalex.org/W3111349686
  • https://openalex.org/W3127700238
  • https://openalex.org/W3138125591
  • https://openalex.org/W3193169754
  • https://openalex.org/W3199864820
  • https://openalex.org/W3209760303
  • https://openalex.org/W3214705264
  • https://openalex.org/W3214758078
  • https://openalex.org/W3215795608
  • https://openalex.org/W4200259552
  • https://openalex.org/W4200261453
  • https://openalex.org/W4205137778
  • https://openalex.org/W4206929389
  • https://openalex.org/W4210287071
  • https://openalex.org/W4213012863
  • https://openalex.org/W4213130109
  • https://openalex.org/W4220751795
  • https://openalex.org/W4220918407
  • https://openalex.org/W4225564586
  • https://openalex.org/W4309633985
  • https://openalex.org/W4318053806
  • https://openalex.org/W4327955006