XML-REG: Transforming XML Into Relational Using Hybrid-Based Mapping Approach
Description
eXtensible Markup Language (XML) is one of the most used standards for information sharing between applications and devices, both on the internet and local network. However, relational database (RDB) has been used by many enterprises as their data management system and will require an amount of cost to change the system completely, if they are to change to XML technology solely. Thus, a mapping scheme is required to provide seamless integration on bridging XML technologies and RDBs. In this paper, an efficient model-based mapping scheme named XML-REG is proposed. The XML document will first be read and parsed into the parser, namely Streaming API for XML (StAX) parser. Then, each node will then be assigned with unique identification label to show the exact position of nodes in the document. Subsequently, by employing the proposed algorithm, data will then be transformed into tables in the RDB storage. As the result, two tables, namely (i) value table to store information carried by text node of the document, and (ii) path table to store the hierarchy structure of the document will be created. Experimental evaluations demonstrated that XML-REG outperformed some existing approaches, such as Mini-XML, XAncestor, XMap and XRecursive in terms of data storage size, mapping time and query retrieval time. In addition, the scalability test has also been conducted to show the capability of these approaches in supporting huge datasets, by scaling the DBLP dataset by times 5, times 10 and times 15. The results showed that XML-REG has the closest to linear graph compared to other existing approaches. On average, XML-REG showed the best performance in terms of query retrieval time and database storage size.
Translated Descriptions
Translated Description (Arabic)
تعد لغة الترميز الموسعة (XML) واحدة من أكثر المعايير استخدامًا لمشاركة المعلومات بين التطبيقات والأجهزة، سواء على الإنترنت أو الشبكة المحلية. ومع ذلك، تم استخدام قاعدة البيانات العلائقية (RDB) من قبل العديد من الشركات كنظام لإدارة البيانات وستتطلب مبلغًا من التكلفة لتغيير النظام بالكامل، إذا أرادوا التغيير إلى تقنية XML فقط. وبالتالي، هناك حاجة إلى مخطط رسم الخرائط لتوفير تكامل سلس على سد تقنيات XML و RDBs. في هذه الورقة، يُقترح مخطط تخطيط فعال قائم على النماذج يسمى XML - REG. ستتم قراءة مستند XML أولاً وتحليله في المحلل، أي واجهة برمجة تطبيقات التدفق لمحلل XML (StAX). بعد ذلك، سيتم تعيين كل عقدة بتسمية تعريف فريدة لإظهار الموضع الدقيق للعقد في المستند. بعد ذلك، من خلال استخدام الخوارزمية المقترحة، سيتم بعد ذلك تحويل البيانات إلى جداول في وحدة تخزين RDB. ونتيجة لذلك، سيتم إنشاء جدولين، وهما (1) جدول القيم لتخزين المعلومات التي تحملها عقدة النص في المستند، و (2) جدول المسار لتخزين بنية التسلسل الهرمي للمستند. أظهرت التقييمات التجريبية أن XML - REG تفوق على بعض الأساليب الحالية، مثل Mini XML و XAncestor و XMap و XRecursive من حيث حجم تخزين البيانات ووقت التعيين ووقت استرجاع الاستعلام. بالإضافة إلى ذلك، تم إجراء اختبار قابلية التوسع لإظهار قدرة هذه الأساليب في دعم مجموعات البيانات الضخمة، من خلال قياس مجموعة بيانات dblp بضرب 5 وضرب 10 وضرب 15. أظهرت النتائج أن XML - REG لديه أقرب إلى الرسم البياني الخطي مقارنة بالنهج الحالية الأخرى. في المتوسط، أظهر XML - REG أفضل أداء من حيث وقت استرداد الاستعلام وحجم تخزين قاعدة البيانات.Translated Description (French)
le langage de balisage extensible (XML) est l'une des normes les plus utilisées pour le partage d'informations entre les applications et les appareils, à la fois sur Internet et sur le réseau local. Cependant, la base de données relationnelle (RDB) a été utilisée par de nombreuses entreprises comme système de gestion de données et nécessitera un certain coût pour changer complètement le système, si elles doivent passer à la technologie XML uniquement. Ainsi, un schéma de mappage est nécessaire pour fournir une intégration transparente sur les technologies XML de pontage et les RDB. Dans cet article, un schéma de mappage efficace basé sur un modèle nommé XML-REG est proposé. Le document XML sera d'abord lu et analysé dans l'analyseur, à savoir l'analyseur Streaming API for XML (StAX). Ensuite, chaque nœud se verra ensuite attribuer une étiquette d'identification unique pour afficher la position exacte des nœuds dans le document. Par la suite, en utilisant l'algorithme proposé, les données seront ensuite transformées en tables dans le stockage RDB. En conséquence, deux tables, à savoir (i) une table de valeurs pour stocker les informations portées par le nœud de texte du document, et (ii) une table de chemins pour stocker la structure hiérarchique du document seront créées. Les évaluations expérimentales ont démontré que XML-REG surpassait certaines approches existantes, telles que Mini-XML, XAncestor, XMap et XRecursive en termes de taille de stockage des données, de temps de mappage et de temps de récupération des requêtes. En outre, le test d'évolutivité a également été mené pour montrer la capacité de ces approches à prendre en charge d'énormes ensembles de données, en mettant à l'échelle l'ensemble de données DBLP par fois 5, par fois 10 et par fois 15. Les résultats ont montré que XML-REG a le graphique linéaire le plus proche par rapport aux autres approches existantes. En moyenne, XML-REG a montré les meilleures performances en termes de temps de récupération des requêtes et de taille de stockage de la base de données.Translated Description (Spanish)
eXtensible Markup Language (XML) es uno de los estándares más utilizados para el intercambio de información entre aplicaciones y dispositivos, tanto en Internet como en la red local. Sin embargo, la base de datos relacional (RDB) ha sido utilizada por muchas empresas como su sistema de gestión de datos y requerirá una cantidad de costo para cambiar el sistema por completo, si van a cambiar a la tecnología XML únicamente. Por lo tanto, se requiere un esquema de mapeo para proporcionar una integración perfecta en las tecnologías XML de puente y las RDB. En este documento, se propone un esquema de mapeo eficiente basado en modelos llamado XML-REG. El documento XML primero se leerá y analizará en el analizador, es decir, el analizador Streaming API for XML (StAX). Luego, a cada nodo se le asignará una etiqueta de identificación única para mostrar la posición exacta de los nodos en el documento. Posteriormente, al emplear el algoritmo propuesto, los datos se transformarán en tablas en el almacenamiento RDB. Como resultado, se crearán dos tablas, a saber (i) tabla de valores para almacenar información transportada por el nodo de texto del documento, y (ii) tabla de rutas para almacenar la estructura jerárquica del documento. Las evaluaciones experimentales demostraron que XML-REG superó a algunos enfoques existentes, como Mini-XML, XAncestor, XMap y XRecursive en términos de tamaño de almacenamiento de datos, tiempo de mapeo y tiempo de recuperación de consultas. Además, la prueba de escalabilidad también se ha realizado para mostrar la capacidad de estos enfoques para admitir grandes conjuntos de datos, escalando el conjunto de datos DBLP por 5, por 10 y por 15. Los resultados mostraron que XML-REG tiene el gráfico más cercano a lineal en comparación con otros enfoques existentes. En promedio, XML-REG mostró el mejor rendimiento en términos de tiempo de recuperación de consultas y tamaño de almacenamiento de la base de datos.Files
      
        09204703.pdf.pdf
        
      
    
    
      
        Files
         (245 Bytes)
        
      
    
    | Name | Size | Download all | 
|---|---|---|
| md5:369a48fcdc529a686c5f3cf705c4e29b | 245 Bytes | Preview Download | 
Additional details
Additional titles
- Translated title (Arabic)
- XML - REG: تحويل XML إلى علائقية باستخدام نهج رسم الخرائط الهجين
- Translated title (French)
- XML-REG : Transforming XML Into Relational Using Hybrid-Based Mapping Approach
- Translated title (Spanish)
- XML-REG: Transformación de XML en relacional mediante el enfoque de mapeo basado en híbridos
Identifiers
- Other
- https://openalex.org/W3088917556
- DOI
- 10.1109/access.2020.3026006
            
              References
            
          
        - https://openalex.org/W1507976212
- https://openalex.org/W1574467322
- https://openalex.org/W1579323613
- https://openalex.org/W1598660478
- https://openalex.org/W161557684
- https://openalex.org/W1899101461
- https://openalex.org/W1994649087
- https://openalex.org/W2062451233
- https://openalex.org/W2068266200
- https://openalex.org/W2078392118
- https://openalex.org/W2093608958
- https://openalex.org/W2109464129
- https://openalex.org/W2111087864
- https://openalex.org/W2144621469
- https://openalex.org/W2188212329
- https://openalex.org/W2401139123
- https://openalex.org/W2468935899
- https://openalex.org/W2529935843
- https://openalex.org/W2551870884
- https://openalex.org/W2732595496
- https://openalex.org/W2903946806
- https://openalex.org/W4243649771