Desafios da gestão de dados linguísticos e a Ciência Aberta
Creators
- 1. Universidade Federal de Sergipe
- 2. Universidade Federal de Santa Catarina
- 3. Universidade Federal do Ceará
- 4. Universidade Federal do Rio Grande do Sul
- 5. Instituto Federal do Amazonas
- 6. Instituto Federal do Acre
- 7. Universidade Estadual de Campinas (UNICAMP)
Description
O simpósio Descrição linguística: gestão de dados linguísticos teve como proposta retomar questões específicas ao gerenciamento de dados linguísticos, quer de fala quer de textos escritos, da atualidade ou históricos, em função das demandas latentes, especialmente face a exigências como as da Ciência Aberta: i) Como atender aos princípios de ciência aberta quanto ao armazenamento, reuso e autoria de conjuntos de dados linguísticos? ii) Como lidar com a tensão entre a transparência e o sigilo de dados de fala? iii) Quais os formatos e as ferramentas mais adequados para a vitalidade dos conjuntos de dados linguísticos? iv) Quais ferramentas permitem o melhor armazenamento e sistemas de interface para consulta e pesquisa? Neste artigo, respondemos a estas a questões com o objetivo de motivar a discussão e o compartilhamento de boas práticas com a comunidade científica e sinalizamos as ações propositivas de natureza coletiva: i) a criação de políticas específicas da área para a replicabilidade dos estudos; ii) a adoção dessas políticas por programas de pós-graduação e periódicos; e iii) a criação e manutenção de repositórios de dados.
Translated Descriptions
Translated Description (Arabic)
الوصف اللغوي للندوة: كان لدى إدارة البيانات اللغوية اقتراح بالعودة إلى القضايا الخاصة بإدارة البيانات اللغوية، سواء كانت نصوصًا لغوية أو مكتوبة، حالية أو تاريخية، اعتمادًا على المطالب الكامنة، خاصة في مواجهة متطلبات مثل متطلبات العلوم المفتوحة: 1) كيفية تلبية مبادئ العلوم المفتوحة فيما يتعلق بتخزين مجموعات البيانات اللغوية وإعادة استخدامها وتأليفها ؟ 2) كيفية التعامل مع التوتر بين شفافية وسرية بيانات الكلام ؟ 3) ما هي التنسيقات والأدوات الأكثر ملاءمة لحيوية مجموعات البيانات اللغوية ؟ 4) ما هي الأدوات التي تسمح بأفضل أنظمة التخزين والواجهة للتشاور والبحث ؟ في هذه المقالة، نجيب على هذه الأسئلة من أجل تحفيز المناقشة وتبادل الممارسات الجيدة مع المجتمع العلمي والإشارة إلى الإجراءات المقترحة ذات الطبيعة الجماعية: 1) إنشاء سياسات محددة في مجال تكرار الدراسات ؛ 2) اعتماد هذه السياسات من قبل برامج الدراسات العليا والمجلات ؛ 3) إنشاء وصيانة مستودعات البيانات.Translated Description (English)
The symposium Linguistic description: linguistic data management had the proposal to return to issues specific to the management of linguistic data, whether of speech or written texts, current or historical, depending on latent demands, especially in the face of requirements such as those of Open Science: i) How to meet the principles of open science regarding the storage, reuse and authorship of linguistic data sets? ii) How to deal with the tension between transparency and secrecy of speech data? iii) What formats and tools are most suitable for the vitality of linguistic data sets? iv) What tools allow the best storage and interface systems for consultation and research? In this article, we answer these questions in order to motivate the discussion and sharing of good practices with the scientific community and signal the propositional actions of a collective nature: i) the creation of specific policies in the area for the replicability of studies; ii) the adoption of these policies by graduate programs and journals; and iii) the creation and maintenance of data repositories.Translated Description (French)
Le colloque Description linguistique : la gestion des données linguistiques avait pour proposition de revenir sur des problématiques spécifiques à la gestion des données linguistiques, qu'il s'agisse de discours ou de textes écrits, actuels ou historiques, en fonction de demandes latentes, notamment face à des exigences telles que celles de la Science Ouverte : i) Comment répondre aux principes de la science ouverte concernant le stockage, la réutilisation et la paternité des ensembles de données linguistiques ? ii) Comment faire face à la tension entre transparence et secret des données vocales ? iii) Quels formats et outils sont les plus adaptés à la vitalité des ensembles de données linguistiques ? iv) Quels outils permettent les meilleurs systèmes de stockage et d'interface pour la consultation et la recherche ? Dans cet article, nous répondons à ces questions afin de motiver la discussion et le partage de bonnes pratiques avec la communauté scientifique et de signaler les actions proposées de nature collective : i) la création de politiques spécifiques dans le domaine pour la reproductibilité des études ; ii) l'adoption de ces politiques par les programmes d'études supérieures et les revues ; et iii) la création et la maintenance de référentiels de données.Translated Description (Spanish)
El simposio Descripción lingüística: la gestión de datos lingüísticos tuvo la propuesta de volver a las cuestiones específicas de la gestión de datos lingüísticos, ya sea de textos orales o escritos, actuales o históricos, dependiendo de las demandas latentes, especialmente frente a requisitos como los de Open Science: i) ¿Cómo cumplir con los principios de la ciencia abierta con respecto al almacenamiento, la reutilización y la autoría de los conjuntos de datos lingüísticos? ii) ¿Cómo lidiar con la tensión entre la transparencia y el secreto de los datos del habla? iii) ¿Qué formatos y herramientas son los más adecuados para la vitalidad de los conjuntos de datos lingüísticos? iv) ¿Qué herramientas permiten los mejores sistemas de almacenamiento e interfaz para la consulta y la investigación? En este artículo, respondemos a estas preguntas con el fin de motivar la discusión y el intercambio de buenas prácticas con la comunidad científica y señalar las acciones propositivas de carácter colectivo: i) la creación de políticas específicas en el área para la replicabilidad de estudios; ii) la adopción de estas políticas por parte de programas de posgrado y revistas; y iii) la creación y mantenimiento de repositorios de datos.Files
427.pdf
Files
(421.6 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:d108faefd4beaa30893d56f40ee1fbd3
|
421.6 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- تحديات إدارة بيانات اللغة والعلوم المفتوحة
- Translated title (English)
- Challenges of language data management and Open Science
- Translated title (French)
- Défis de la gestion des données linguistiques et de la science ouverte
- Translated title (Spanish)
- Desafíos de la gestión de datos lingüísticos y la ciencia abierta
Identifiers
- Other
- https://openalex.org/W3158828396
- DOI
- 10.25189/2675-4916.2021.v2.n1.id307
References
- https://openalex.org/W1789444036
- https://openalex.org/W1913261780
- https://openalex.org/W1931716702
- https://openalex.org/W2054828870
- https://openalex.org/W2060190264
- https://openalex.org/W2097050150
- https://openalex.org/W2098410026
- https://openalex.org/W2149766458
- https://openalex.org/W2165935007
- https://openalex.org/W2244626821
- https://openalex.org/W2302501749
- https://openalex.org/W2327588828
- https://openalex.org/W2345136230
- https://openalex.org/W2487863315
- https://openalex.org/W2499894900
- https://openalex.org/W2501268591
- https://openalex.org/W2559519262
- https://openalex.org/W2599574558
- https://openalex.org/W2805160371
- https://openalex.org/W2898577041
- https://openalex.org/W2944539396
- https://openalex.org/W2963200450
- https://openalex.org/W2976886962
- https://openalex.org/W2996244831
- https://openalex.org/W3034287509
- https://openalex.org/W3049757572
- https://openalex.org/W3080853248
- https://openalex.org/W3082770115
- https://openalex.org/W3093367314
- https://openalex.org/W3111613269
- https://openalex.org/W4230181320
- https://openalex.org/W4231331303
- https://openalex.org/W4235921469
- https://openalex.org/W4255056246
- https://openalex.org/W604487678