Published March 2, 2022 | Version v1
Publication

DCASE 2022 Task 5: Few-shot Bioacoustic Event Detection Development Set

  • 1. Queen Mary University of London
  • 2. Max Planck Institute of Animal Behavior
  • 3. University of Konstanz
  • 4. Bayer (Germany)
  • 5. AGH University of Krakow
  • 6. University of Oxford
  • 7. Syracuse University
  • 8. University of Salford
  • 9. University of Surrey
  • 10. Universitat Ramon Llull
  • 11. Centre National pour la Recherche Scientifique et Technique (CNRST)
  • 12. Naturalis Biodiversity Center
  • 13. Tilburg University

Description

General Description: The development set for task 5 of DCASE 2022 "Few-shot Bioacoustic Event Detection" consists of 192 audio files acquired from different bioacoustic sources. The dataset is split into training and validation sets. Multi-class annotations are provided for the training set with positive (POS), negative (NEG) and unkwown (UNK) values for each class. UNK indicates uncertainty about a class. Single-class (class of interest) annotations are provided for the validation set, with events marked as positive (POS) or unkwown (UNK) provided for the class of interest. this version (2):
* fixes issues with unsorted events in the annotation files - all events from the validation set are sorted by Starttime;
* Removes the ML subset from the validation set.
Folder Structure: Development_Set.zip |_Development_Set/ |__Training_Set/ |___JD/ |____*.wav |____*.csv |___HT/ |____*.wav |____*.csv |___BV/ |____*.wav |____*.csv |___MT/ |____*.wav |____*.csv |___WMW/ |____*.wav |____*.csv |__Validation_Set/ |___HB/ |____*.wav |____*.csv |___PB/ |____*.wav |____*.csv |___ME/ |____*.wav |____*.csv Development_Set_Annotations.zip has the same structure but contains only the *.csv files ## Dataset statistics Some statistics on this dataset are as follows, split between training and validation set and their sub-folders: -----------------------------------------------------
TRAINING SET
-----------------------------------------------------
Number of audio recordings | 174
Total duration | 21 hours
Total classes | 47
Total events | 14229
-----------------------------------------------------
TRAINING SET/BV
-----------------------------------------------------
Number of audio recordings | 5
Total duration | 10 hours
Total classes | 11
Total events | 9026
Ratio event/duration | 0.04
Sampling rate | 24000 Hz
-----------------------------------------------------
TRAINING SET/HT
-----------------------------------------------------
Number of audio recordings | 5
Total duration | 5 hours
Total classes | 5
Total events | 611
Ratio event/duration | 0.05
Sampling rate | 6000 Hz
-----------------------------------------------------
TRAINING SET/JD
-----------------------------------------------------
Number of audio recordings | 1
Total duration | 10 mins
Total classes | 1
Total events | 357
Ratio event/duration | 0.06
Sampling rate | 22050 Hz
-----------------------------------------------------
TRAINING SET/MT
-----------------------------------------------------
Number of audio recordings | 2
Total duration | 1 hour and 10 mins
Total classes | 4
Total events | 1294
Ratio event/duration | 0.04
Sampling rate | 8000 Hz
-----------------------------------------------------
TRAINING SET/WMW
-----------------------------------------------------
Number of audio recordings | 161
Total duration | 4 hours and 40 mins
Total classes | 26
Total events | 2941
Ratio event/duration | 0.24
Sampling rate | various sampling rates
----------------------------------------------------- -----------------------------------------------------
VALIDATION SET
-----------------------------------------------------
Number of audio recordings | 18
Total duration | 5 hours and 57 minutes
Total classes | 5
Total events | 972
-----------------------------------------------------
VALIDATION SET/HB
-----------------------------------------------------
Number of audio recordings | 10
Total duration | 2 hours and 38 minutes
Total classes | 1
Total events | 607
Ratio event/duration | 0.7
Sampling rate | 44100 Hz
-----------------------------------------------------
VALIDATION SET/PB
-----------------------------------------------------
Number of audio recordings | 6
Total duration | 3 hours
Total classes | 2
Total events | 292
Ratio event/duration | 0.003
Sampling rate | 44100 Hz
-----------------------------------------------------
VALIDATION SET/ME
-----------------------------------------------------
Number of audio recordings | 2
Total duration | 20 minutes
Total classes | 2
Total events | 73
Ratio event/duration | 0.01
Sampling rate | 48000 Hz
----------------------------------------------------- Annotation structure Each line of the annotation csv represents an event in the audio file. The column descriptions are as follows: TRAINING SET
---------------------
Audiofilename, Starttime, Endtime, CLASS_1, CLASS_2, ...CLASS_N VALIDATION SET
---------------------
Audiofilename, Starttime, Endtime, Q Classes DCASE2022_task5_training_set_classes.csv and DCASE2022_task5_validation_set_classes.csv provide a table with class code correspondence to class name for all classes in the Development set. DCASE2022_task5_training_set_classes.csv
---------------------
dataset, class_code, class_name DCASE2022_task5_validation_set_classes.csv
---------------------
dataset, recording, class_code, class_name Evaluation Set The Evaluation set for this task will be released on the 1st of June 2022 Open Access: This dataset is available under a Creative Commons Attribution 4.0 International (CC BY 4.0) license.
Contact info: Please send any feedback or questions to: Ines Nolasco - i.dealmeidanolasco@qmul.ac.uk

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

الوصف العام: تتكون مجموعة التطوير للمهمة 5 من DCASE 2022 "Few - shot Bioacoustic Event Detection" من 192 ملفًا صوتيًا تم الحصول عليها من مصادر صوتية حيوية مختلفة. يتم تقسيم مجموعة البيانات إلى مجموعات التدريب والتحقق من الصحة. يتم توفير تعليقات توضيحية متعددة الفئات لمجموعة التدريب بقيم موجبة (POS) وسالبة (NEG) وغير معلنة (UNK) لكل فصل. تشير المملكة المتحدة إلى عدم اليقين بشأن الفصل الدراسي. يتم توفير تعليقات توضيحية من فئة واحدة (فئة الاهتمام) لمجموعة التحقق من الصحة، مع وضع علامة على الأحداث على أنها إيجابية (POS) أو غير معروفة (UNK) لفئة الاهتمام. هذا الإصدار (2):
* إصلاح المشكلات المتعلقة بالأحداث التي لم يتم فرزها في ملفات التعليقات التوضيحية - يتم فرز جميع الأحداث من مجموعة التحقق حسب وقت البدء ؛
* إزالة مجموعة غسل الأموال الفرعية من مجموعة التحقق.
هيكل المجلد: Development_Set.zip |_Development_Set/ |__Training_Set/ |___JD/ |____*.wav |____*.csv |___HT/ |____*.wav |____*.csv |___BV/ |____*.wav |____*.csv | ___MT/| ____ .wav |____*.csv |___WMW/ |____*.wav |____*.csv |__Validation_Set/ |___HB/|____*.wav | ____*.csv | ___ BB/|____*.wav | ____*.csv | ___ME/____*.wav |____*.csv | ____ *.csv Development_Set_Annotations.zip له نفس الهيكل ولكنه يحتوي فقط على *.csv files # Dataset إحصائيات حول هذه البيانات على النحو التالي، التدريب المنقسم والصلاحية والمجلدات الفرعية:
----------------------------------------------------- مجموعة التدريب
-----------------------------------------------------
عدد التسجيلات الصوتية | 174
المدة الإجمالية | 21 ساعة
إجمالي الفصول | 47
إجمالي الأحداث | 14229
مجموعة -----------------------------------------------------التدريب/BV

-----------------------------------------------------
عدد التسجيلات الصوتية | 5
المدة الإجمالية | 10 ساعات
إجمالي الفصول | 11
إجمالي الأحداث | 9026
نسبة الحدث/المدة | 0.04
معدل أخذ العينات | 24000 هرتز
مجموعة -----------------------------------------------------التدريب/HT

-----------------------------------------------------
عدد التسجيلات الصوتية | 5
المدة الإجمالية | 5 ساعات
إجمالي الفصول | 5
إجمالي الأحداث | 611
نسبة الحدث/المدة | 0.05
معدل أخذ العينات | 6000 هرتز
مجموعة -----------------------------------------------------التدريب/JD

-----------------------------------------------------
عدد التسجيلات الصوتية | 1
المدة الإجمالية | 10 دقائق
إجمالي الفصول | 1
إجمالي الأحداث | 357
نسبة الحدث/المدة | 0.06
معدل أخذ العينات | 22050 هرتز
مجموعة -----------------------------------------------------التدريب/الترجمة الآلية

-----------------------------------------------------
عدد التسجيلات الصوتية | 2
المدة الإجمالية | ساعة و 10 دقائق
إجمالي الفصول | 4
إجمالي الأحداث | 1294
نسبة الحدث/المدة | 0.04
معدل أخذ العينات | 8000 هرتز
مجموعة -----------------------------------------------------التدريب/WMW

-----------------------------------------------------
عدد التسجيلات الصوتية | 161
المدة الإجمالية | 4 ساعات و 40 دقيقة
إجمالي الفصول | 26
إجمالي الأحداث | 2941
نسبة الحدث/المدة | 0.24
معدل أخذ العينات | معدلات أخذ العينات المختلفة
مجموعة ----------------------------------------------------- -----------------------------------------------------التحقق

-----------------------------------------------------
عدد التسجيلات الصوتية | 18
المدة الإجمالية | 5 ساعات و57 دقيقة
إجمالي الفصول | 5
إجمالي الأحداث | 972
مجموعة -----------------------------------------------------التحقق/HB

-----------------------------------------------------
عدد التسجيلات الصوتية | 10
المدة الإجمالية | ساعتان و 38 دقيقة
إجمالي الفصول | 1
إجمالي الأحداث | 607
نسبة الحدث/المدة | 0.7
معدل أخذ العينات | 44100 هرتز
مجموعة -----------------------------------------------------التحقق/PB

-----------------------------------------------------
عدد التسجيلات الصوتية | 6
المدة الإجمالية | 3 ساعات
إجمالي الفصول | 2
إجمالي الأحداث | 292
نسبة الحدث/المدة | 0.003
معدل أخذ العينات | 44100 هرتز
مجموعة -----------------------------------------------------التحقق/ME

-----------------------------------------------------
عدد التسجيلات الصوتية | 2
المدة الإجمالية | 20 دقيقة
إجمالي الفصول | 2
إجمالي الأحداث | 73
نسبة الحدث/المدة | 0.01
معدل أخذ العينات | 48000 هرتز
هيكل التعليق التوضيحي ----------------------------------------------------- يمثل كل سطر من التعليق التوضيحي CSV حدثًا في الملف الصوتي. أوصاف الأعمدة هي كما يلي: مجموعة التدريب
---------------------
اسم الملف الصوتي، وقت البدء، وقت الانتهاء، CLASS _1، CLASS _2، ...CLASS_N مجموعة التحقق من الصحة
---------------------
يوفر Audiofilename و Starttime و Endtime و Q Classes DCASE2022_task5_training_set_classes.csv و DCASE2022_task5_validation_set_classes.csv جدولًا بمراسلات رمز الفئة مع اسم الفئة لجميع الفئات في مجموعة التطوير. DCASE2022_task5_training_set_classes.csv
---------------------
مجموعة البيانات، CLASS_CODE، CLASS_NAME DCASE2022_task5_validation_set_classes.csv
---------------------
مجموعة البيانات، التسجيل، class_code، class_name مجموعة التقييم سيتم إصدار مجموعة التقييم لهذه المهمة في 1 يونيو 2022 الوصول المفتوح: تتوفر مجموعة البيانات هذه بموجب ترخيص Creative Commons Attribution 4.0 International (CC BY 4.0).
معلومات الاتصال: يرجى إرسال أي ملاحظات أو أسئلة إلى: إينيس نولاسكو - i.dealmeidanolasco@qmul.ac.uk

Translated Description (French)

Description générale : L'ensemble de développement pour la tâche 5 de DCASE 2022 « Few-shot Bioacoustic Event Detection » se compose de 192 fichiers audio acquis à partir de différentes sources bioacoustiques. L'ensemble de données est divisé en ensembles de formation et de validation. Des annotations multi-classes sont fournies pour l'ensemble de formation avec des valeurs positives (pos), négatives (NEG) et inconnues (UNK) pour chaque classe. UNK indique une incertitude au sujet d'une classe. Des annotations de classe unique (classe d'intérêt) sont fournies pour l'ensemble de validation, avec des événements marqués comme positifs (pos) ou inconnus (UNK) fournis pour la classe d'intérêt. cette version (2) :
* résout les problèmes avec les événements non triés dans les fichiers d'annotation - tous les événements du jeu de validation sont triés par Starttime ;
* Supprime le sous-ensemble ML de l'ensemble de validation.
Structure des dossiers : Development_Set.zip |_Development_Set/ |__Training_Set/ |___JD/ |____*.wav |____*.csv |___HT/ |____*.wav |____*.csv |___BV/| ____*.wav |____*.csv | ___MT/| ____*.wav |____*.csv | ___WMW/| ____*.wav |____*.csv | __Validation_Set/| ___HB/ | ____*.wav |____* .csv | ___PB/| ____* .wav |____* .csv | ___ME/|____* .wav |____* .csv Development_Set_Annotations.zip a la même structure mais ne contient que les fichiers *.csv ## Statistiques de l'ensemble de données Certaines statistiques sur cet ensemble de données sont les suivantes, réparties entre l'ensemble de formation et la validation et leurs sous-dossiers :
----------------------------------------------------- ENSEMBLE DE FORMATION
-----------------------------------------------------
Nombre d'enregistrements audio | 174
Durée totale | 21 heures
Total des classes | 47
Total des événements | 14229
ENSEMBLE DE----------------------------------------------------- FORMATION/BV

-----------------------------------------------------
Nombre d'enregistrements audio | 5
Durée totale | 10 heures
Total des classes | 11
Total des événements | 9026
Ratio événement/durée | 0,04
Fréquence d'échantillonnage | 24000 Hz
ENSEMBLE DE----------------------------------------------------- FORMATION/HT

-----------------------------------------------------
Nombre d'enregistrements audio | 5
Durée totale | 5 heures
Total des classes | 5
Total des événements | 611
Ratio événement/durée | 0,05
Fréquence d'échantillonnage | 6000 Hz
ENSEMBLE DE----------------------------------------------------- FORMATION/JD

-----------------------------------------------------
Nombre d'enregistrements audio | 1
Durée totale | 10 minutes
Nombre total de cours | 1
Nombre total d'événements | 357
Ratio événement/durée | 0,06
Fréquence d'échantillonnage | 22050 Hz
ENSEMBLE DE----------------------------------------------------- FORMATION/MT

-----------------------------------------------------
Nombre d'enregistrements audio | 2
Durée totale | 1 heure et 10 minutes
Total des classes | 4
Total des événements | 1294
Ratio événement/durée | 0,04
Fréquence d'échantillonnage | 8000 Hz
ENSEMBLE DE----------------------------------------------------- FORMATION/WMW

-----------------------------------------------------
Nombre d'enregistrements audio | 161
Durée totale | 4 heures et 40 minutes
Total des cours | 26
Total des événements | 2941
Ratio événement/durée | 0,24
Fréquence d'échantillonnage | différentes fréquences d'échantillonnage
ENSEMBLE ----------------------------------------------------- -----------------------------------------------------DE VALIDATION

-----------------------------------------------------
Nombre d'enregistrements audio | 18
Durée totale | 5 heures et 57 minutes
Total des cours | 5
Total des événements | 972
ENSEMBLE -----------------------------------------------------DE VALIDATION/HB

-----------------------------------------------------
Nombre d'enregistrements audio | 10
Durée totale | 2 heures et 38 minutes
Nombre total de cours | 1
Nombre total d'événements | 607
Ratio événement/durée | 0,7
Fréquence d'échantillonnage | 44100 Hz
ENSEMBLE -----------------------------------------------------DE VALIDATION/PB

-----------------------------------------------------
Nombre d'enregistrements audio | 6
Durée totale | 3 heures
Total des classes | 2
Total des événements | 292
Ratio événement/durée | 0,003
Fréquence d'échantillonnage | 44100 Hz
ENSEMBLE -----------------------------------------------------DE VALIDATION/ME

-----------------------------------------------------
Nombre d'enregistrements audio | 2
Durée totale | 20 minutes
Total des classes | 2
Total des événements | 73
Ratio événement/durée | 0,01
Fréquence d'échantillonnage | 48000 Hz
Structure d'annotation ----------------------------------------------------- Chaque ligne du csv d'annotation représente un événement dans le fichier audio. Les descriptions des colonnes sont les suivantes : KIT DE FORMATION
---------------------
Audiofilename, Starttime, Endtime, CLASS_1, CLASS_2, ...CLASS_N JEU DE VALIDATION
---------------------
Audiofilename, Starttime, Endtime, Q Classes DCASE2022_task5_training_set_classes.csv et DCASE2022_task5_validation_set_classes.csv fournissent un tableau avec le code de classe correspondant au nom de classe pour toutes les classes de l'ensemble de développement. DCASE2022_task5_training_set_classes.csv
---------------------
dataset, class_code, class_name DCASE2022_task5_validation_set_classes.csv
jeu de--------------------- données, enregistrement, class_code, jeu d'évaluation class_name Le jeu d'évaluation pour cette tâche sera publié le 1er juin 2022 Open Access : Ce jeu de données est disponible sous une licence Creative Commons Attribution 4.0 International (CC BY 4.0).

Coordonnées : Veuillez envoyer vos commentaires ou questions à : Ines Nolasco - i.dealmeidanolasco@qmul.ac.uk

Translated Description (Spanish)

Descripción general: El conjunto de desarrollo para la tarea 5 de DCASE 2022 "Detección de eventos bioacústicos de pocos disparos" consta de 192 archivos de audio adquiridos de diferentes fuentes bioacústicas. El conjunto de datos se divide en conjuntos de capacitación y validación. Se proporcionan anotaciones multiclase para el conjunto de entrenamiento con valores positivos (pos), negativos (neg) y no reconocidos (UNK) para cada clase. UNK indica incertidumbre sobre una clase. Se proporcionan anotaciones de clase única (clase de interés) para el conjunto de validación, con eventos marcados como positivos (pos) o no conocidos (UNK) proporcionados para la clase de interés. esta versión (2):
* corrige problemas con eventos sin ordenar en los archivos de anotación: todos los eventos del conjunto de validación se ordenan por hora de inicio;
* Elimina el subconjunto ML del conjunto de validación.
Estructura de la carpeta: Development_Set.zip |_Development_Set/ |__Training_Set/ |___JD/ |____*.wav |____*.csv |___HT/ |____*.wav |____*.csv |___BV/ |____*.wav |____*.csv | ____ * .csv |____*.csv | ___WMW/| ____*.wav |____*.csv |__Validation_Set/ |___HB/ | ____*.wav |____*.csv | ___PB/| ____*.wav |____*.csv | ___ME/| ____*.wav |____*.csv Development_Set_Annotations.zip tiene la misma estructura pero solo contiene los *.csv archivos ## Estadísticas del dataset Algunas estadísticas sobre este dataset son las siguientes, divididas entre el conjunto de formación y validación y sus subpletornos:
----------------------------------------------------- CONJUNTO DE ENTRENAMIENTO
-----------------------------------------------------
Número de grabaciones de audio | 174
Duración total | 21 horas
Total clases | 47
Total eventos | 14229
CONJUNTO -----------------------------------------------------DE ENTRENAMIENTO/BV

-----------------------------------------------------
Número de grabaciones de audio | 5
Duración total | 10 horas
Total clases | 11
Total eventos | 9026
Relación evento/duración | 0.04
Frecuencia de muestreo | 24000 Hz
CONJUNTO -----------------------------------------------------DE ENTRENAMIENTO/HT

-----------------------------------------------------
Número de grabaciones de audio | 5
Duración total | 5 horas
Total clases | 5
Total eventos | 611
Relación evento/duración | 0,05
Frecuencia de muestreo | 6000 Hz
CONJUNTO -----------------------------------------------------DE ENTRENAMIENTO/JD

-----------------------------------------------------
Número de grabaciones de audio | 1
Duración total | 10 minutos
Total clases | 1
Total eventos | 357
Relación evento/duración | 0.06
Frecuencia de muestreo | 22050 Hz
CONJUNTO -----------------------------------------------------DE ENTRENAMIENTO/MT

-----------------------------------------------------
Número de grabaciones de audio | 2
Duración total | 1 hora y 10 minutos
Total clases | 4
Total eventos | 1294
Relación evento/duración | 0.04
Frecuencia de muestreo | 8000 Hz
CONJUNTO -----------------------------------------------------DE ENTRENAMIENTO/WMW

-----------------------------------------------------
Número de grabaciones de audio | 161
Duración total | 4 horas y 40 minutos
Total clases | 26
Total eventos | 2941
Relación evento/duración | 0.24
Tasa de muestreo | varias tasas de muestreo
CONJUNTO ----------------------------------------------------- -----------------------------------------------------DE VALIDACIÓN

-----------------------------------------------------
Número de grabaciones de audio | 18
Duración total | 5 horas y 57 minutos
Total clases | 5
Total eventos | 972
CONJUNTO -----------------------------------------------------DE VALIDACIÓN/HB

-----------------------------------------------------
Número de grabaciones de audio | 10
Duración total | 2 horas y 38 minutos
Total clases | 1
Total eventos | 607
Relación evento/duración | 0,7
Frecuencia de muestreo | 44100 Hz
CONJUNTO -----------------------------------------------------DE VALIDACIÓN/PB

-----------------------------------------------------
Número de grabaciones de audio | 6
Duración total | 3 horas
Total clases | 2
Total eventos | 292
Relación evento/duración | 0.003
Frecuencia de muestreo | 44100 Hz
CONJUNTO -----------------------------------------------------DE VALIDACIÓN/ME

-----------------------------------------------------
Número de grabaciones de audio | 2
Duración total | 20 minutos
Total clases | 2
Total eventos | 73
Relación evento/duración | 0,01
Frecuencia de muestreo | 48000 Hz
Estructura de anotación ----------------------------------------------------- Cada línea del csv de anotación representa un evento en el archivo de audio. Las descripciones de las columnas son las siguientes: CONJUNTO DE ENTRENAMIENTO
---------------------
Nombre de archivo de audio, Hora de inicio, Hora de finalización, CLASS_1, CLASS_2, ... CONJUNTO DE VALIDACIÓN CLASS_N
---------------------
Audiofilename, Starttime, Endtime, Q Classes DCASE2022_task5_training_set_classes.csv y DCASE2022_task5_validation_set_classes.csv proporcionan una tabla con la correspondencia del código de clase con el nombre de clase para todas las clases del conjunto de desarrollo. DCASE2022_task5_training_set_classes.csv
---------------------
conjunto de datos, class_code, class_name DCASE2022_task5_validation_set_classes.csv
---------------------
conjunto de datos, grabación, class_code, class_name Conjunto de evaluación El conjunto de evaluación para esta tarea se publicará el 1 de junio de 2022 Acceso abierto: este conjunto de datos está disponible bajo una licencia Creative Commons Attribution 4.0 International (CC BY 4.0).
Información de contacto: Envíe cualquier comentario o pregunta a: Ines Nolasco - i.dealmeidanolasco@qmul.ac.uk

Additional details

Additional titles

Translated title (Arabic)
DCASE 2022 المهمة 5: مجموعة تطوير الكشف عن الأحداث الصوتية الحيوية قليلة اللقطات
Translated title (French)
DCASE 2022 Tâche 5 : Ensemble de développement de détection d'événements bioacoustiques à quelques coups
Translated title (Spanish)
DCASE 2022 Tarea 5: Conjunto de desarrollo de detección de eventos bioacústicos de pocas tomas

Identifiers

Other
https://openalex.org/W4393811860
DOI
10.5281/zenodo.6477512

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Morocco