SILA: a system for scientific image analysis
Creators
- 1. Loyola University Chicago
- 2. Universidade Estadual de Campinas (UNICAMP)
- 3. Purdue University West Lafayette
- 4. University of Naples Federico II
- 5. University of Salerno
- 6. University of Southern California
- 7. Politecnico di Milano
- 8. University of Notre Dame
Description
A great deal of the images found in scientific publications are retouched, reused, or composed to enhance the quality of the presentation. In most instances, these edits are benign and help the reader better understand the material in a paper. However, some edits are instances of scientific misconduct and undermine the integrity of the presented research. Determining the legitimacy of edits made to scientific images is an open problem that no current technology can perform satisfactorily in a fully automated fashion. It thus remains up to human experts to inspect images as part of the peer-review process. Nonetheless, image analysis technologies promise to become helpful to experts to perform such an essential yet arduous task. Therefore, we introduce SILA, a system that makes image analysis tools available to reviewers and editors in a principled way. Further, SILA is the first human-in-the-loop end-to-end system that starts by processing article PDF files, performs image manipulation detection on the automatically extracted figures, and ends with image provenance graphs expressing the relationships between the images in question, to explain potential problems. To assess its efficacy, we introduce a dataset of scientific papers from around the globe containing annotated image manipulations and inadvertent reuse, which can serve as a benchmark for the problem at hand. Qualitative and quantitative results of the system are described using this dataset.
Translated Descriptions
Translated Description (Arabic)
يتم تنقيح الكثير من الصور الموجودة في المنشورات العلمية أو إعادة استخدامها أو تأليفها لتحسين جودة العرض التقديمي. في معظم الحالات، تكون هذه التعديلات حميدة وتساعد القارئ على فهم المادة الموجودة في الورقة بشكل أفضل. ومع ذلك، فإن بعض التعديلات هي حالات من سوء السلوك العلمي وتقوض سلامة البحث المقدم. يعد تحديد شرعية التعديلات التي يتم إجراؤها على الصور العلمية مشكلة مفتوحة لا يمكن لأي تقنية حالية أن تؤديها بشكل مرضٍ بطريقة مؤتمتة بالكامل. وبالتالي، يبقى الأمر متروكًا للخبراء البشريين لفحص الصور كجزء من عملية مراجعة الأقران. ومع ذلك، تعد تقنيات تحليل الصور بأن تصبح مفيدة للخبراء لأداء مثل هذه المهمة الأساسية والشاقة. لذلك، نقدم SILA، وهو نظام يجعل أدوات تحليل الصور متاحة للمراجعين والمحررين بطريقة مبدئية. علاوة على ذلك، فإن SILA هو أول نظام شامل للإنسان يبدأ بمعالجة ملفات PDF للمقالات، ويقوم بالكشف عن التلاعب بالصور على الأشكال المستخرجة تلقائيًا، وينتهي برسوم بيانية لمصدر الصورة تعبر عن العلاقات بين الصور المعنية، لشرح المشاكل المحتملة. لتقييم فعاليتها، نقدم مجموعة بيانات من الأوراق العلمية من جميع أنحاء العالم تحتوي على التلاعب بالصور المشروحة وإعادة الاستخدام غير المقصود، والتي يمكن أن تكون بمثابة معيار للمشكلة المطروحة. يتم وصف النتائج النوعية والكمية للنظام باستخدام مجموعة البيانات هذه.Translated Description (French)
Une grande partie des images trouvées dans les publications scientifiques sont retouchées, réutilisées ou composées pour améliorer la qualité de la présentation. Dans la plupart des cas, ces modifications sont bénignes et aident le lecteur à mieux comprendre le contenu d'un article. Cependant, certaines modifications sont des cas d'inconduite scientifique et compromettent l'intégrité de la recherche présentée. Déterminer la légitimité des modifications apportées aux images scientifiques est un problème ouvert qu'aucune technologie actuelle ne peut exécuter de manière satisfaisante de manière entièrement automatisée. Il reste donc aux experts humains d'inspecter les images dans le cadre du processus d'évaluation par les pairs. Néanmoins, les technologies d'analyse d'images promettent de devenir utiles aux experts pour effectuer une tâche aussi essentielle mais ardue. Par conséquent, nous présentons SILA, un système qui met des outils d'analyse d'image à la disposition des réviseurs et des éditeurs d'une manière fondée sur des principes. En outre, SILA est le premier système de bout en bout humain dans la boucle qui commence par traiter des fichiers PDF d'article, effectue une détection de manipulation d'image sur les figures extraites automatiquement et se termine par des graphiques de provenance d'image exprimant les relations entre les images en question, pour expliquer les problèmes potentiels. Pour évaluer son efficacité, nous introduisons un ensemble de données d'articles scientifiques du monde entier contenant des manipulations d'images annotées et une réutilisation par inadvertance, qui peuvent servir de référence pour le problème en question. Les résultats qualitatifs et quantitatifs du système sont décrits à l'aide de cet ensemble de données.Translated Description (Spanish)
Gran parte de las imágenes que se encuentran en las publicaciones científicas son retocadas, reutilizadas o compuestas para mejorar la calidad de la presentación. En la mayoría de los casos, estas ediciones son benignas y ayudan al lector a comprender mejor el material en un documento. Sin embargo, algunas ediciones son casos de mala conducta científica y socavan la integridad de la investigación presentada. Determinar la legitimidad de las ediciones realizadas a imágenes científicas es un problema abierto que ninguna tecnología actual puede realizar satisfactoriamente de manera totalmente automatizada. Por lo tanto, corresponde a los expertos humanos inspeccionar las imágenes como parte del proceso de revisión por pares. Sin embargo, las tecnologías de análisis de imágenes prometen ser útiles para que los expertos realicen una tarea tan esencial como ardua. Por lo tanto, presentamos SILA, un sistema que pone a disposición de los revisores y editores herramientas de análisis de imágenes de una manera basada en principios. Además, SILA es el primer sistema humano de extremo a extremo que comienza procesando archivos PDF de artículos, realiza la detección de manipulación de imágenes en las figuras extraídas automáticamente y termina con gráficos de procedencia de imágenes que expresan las relaciones entre las imágenes en cuestión, para explicar los posibles problemas. Para evaluar su eficacia, presentamos un conjunto de datos de artículos científicos de todo el mundo que contienen manipulaciones de imágenes anotadas y reutilización inadvertida, que pueden servir como punto de referencia para el problema en cuestión. Los resultados cualitativos y cuantitativos del sistema se describen utilizando este conjunto de datos.Files
      
        s41598-022-21535-3.pdf.pdf
        
      
    
    
      
        Files
         (2.9 MB)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| md5:58a34a04142db536f1d4dca5de42fa84 | 2.9 MB | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
- سيلا: نظام لتحليل الصور العلمية
- Translated title (French)
- SILA : un système d'analyse d'images scientifiques
- Translated title (Spanish)
- SILA: un sistema para el análisis científico de imágenes
Identifiers
- Other
- https://openalex.org/W4307687537
- DOI
- 10.1038/s41598-022-21535-3
            
              References
            
          
        - https://openalex.org/W1570958768
- https://openalex.org/W1677409904
- https://openalex.org/W1965680834
- https://openalex.org/W1979931042
- https://openalex.org/W1989319638
- https://openalex.org/W1993120651
- https://openalex.org/W2033570189
- https://openalex.org/W2053893870
- https://openalex.org/W2104042038
- https://openalex.org/W2138833446
- https://openalex.org/W2151103935
- https://openalex.org/W2418392267
- https://openalex.org/W2570343428
- https://openalex.org/W2574852830
- https://openalex.org/W2602628042
- https://openalex.org/W2790895550
- https://openalex.org/W2791382476
- https://openalex.org/W2841457574
- https://openalex.org/W2963348221
- https://openalex.org/W2963627878
- https://openalex.org/W3000942725
- https://openalex.org/W3033686203
- https://openalex.org/W3034530968
- https://openalex.org/W3043882661
- https://openalex.org/W3160795532
- https://openalex.org/W4285176942
- https://openalex.org/W627146406