Published January 1, 2020
| Version v1
Publication
Open
ASGOP: An aggregated similarity-based greedy-oriented approach for relational DDBSs design
Description
Abstract
In the literature of distributed database system (DDBS), several methods sought to meet the satisfactory reduction on transmission cost (TC) and were seen substantially effective. Data Fragmentation, site clustering, and data distribution have been considered the major leading TC-mitigating influencers. Sites clustering, on one hand, aims at grouping sites appropriately according to certain similarity metrics. On the other hand, data distribution seeks to allocate the fragmented data into clusters/sites properly. The combination of these methods, however, has been shown fruitful concerning TC reduction along with network overheads. In this work, hence, a heuristic clustering-based approach for vertical fragmentation and data allocation is meticulously designed. The focus is directed on proposing an influential solution for improving relational DDBS throughputs across an aggregated similarity-based fragmentation procedure, an effective site clustering and a greedy algorithm-driven data allocation model. Moreover, the data replication is also considered so TC is further minimized. Through the delineated-below evaluation, the findings of experimental implementation have been observed to be promising.Translated Descriptions
⚠️
This is an automatic machine translation with an accuracy of 90-95%
Translated Description (Arabic)
الملخص
في أدبيات نظام قاعدة البيانات الموزعة (DDBS)، سعت عدة طرق إلى تلبية التخفيض المرضي في تكلفة الإرسال (TC) وشوهدت فعالة إلى حد كبير. تم اعتبار تجزئة البيانات وتجميع المواقع وتوزيع البيانات المؤثرين الرئيسيين الرائدين في التخفيف من آثار TC. يهدف تجميع المواقع، من ناحية، إلى تجميع المواقع بشكل مناسب وفقًا لمقاييس تشابه معينة. من ناحية أخرى، يسعى توزيع البيانات إلى تخصيص البيانات المجزأة في مجموعات/مواقع بشكل صحيح. ومع ذلك، فقد ثبت أن الجمع بين هذه الأساليب مثمر فيما يتعلق بتخفيض التعاون التقني إلى جانب النفقات العامة للشبكة. في هذا العمل، تم تصميم نهج قائم على التجميع الاستكشافي للتجزئة الرأسية وتخصيص البيانات بدقة. ينصب التركيز على اقتراح حل مؤثر لتحسين إنتاجية DDBS العلائقية عبر إجراء تجزئة قائم على التشابه التجميعي، وتجميع الموقع الفعال ونموذج تخصيص البيانات القائم على الخوارزمية الجشعة. علاوة على ذلك، يتم اعتبار نسخ البيانات أيضًا بحيث يتم تقليل TC إلى الحد الأدنى. من خلال التقييم المحدد أدناه، لوحظ أن نتائج التنفيذ التجريبي واعدة.Translated Description (French)
Résumé
Dans la littérature du système de base de données distribuée (DDBS), plusieurs méthodes ont cherché à répondre à la réduction satisfaisante du coût de transmission (TC) et ont été considérées comme substantiellement efficaces. La fragmentation des données, le regroupement de sites et la distribution des données ont été considérés comme les principaux influenceurs atténuant les TC. Le regroupement de sites, d'une part, vise à regrouper les sites de manière appropriée en fonction de certaines métriques de similarité. D'autre part, la distribution des données cherche à répartir correctement les données fragmentées en clusters/sites. La combinaison de ces méthodes, cependant, s'est révélée fructueuse en ce qui concerne la réduction des TC ainsi que les frais généraux du réseau. Dans ce travail, une approche heuristique basée sur le regroupement pour la fragmentation verticale et l'allocation des données est donc méticuleusement conçue. L'accent est mis sur la proposition d'une solution influente pour améliorer les débits DDBS relationnels à travers une procédure de fragmentation basée sur la similarité agrégée, un clustering de sites efficace et un modèle d'allocation de données gourmand piloté par un algorithme. En outre, la réplication des données est également prise en compte, de sorte que la CT est davantage minimisée. Grâce à l'évaluation délimitée ci-dessous, les résultats de la mise en œuvre expérimentale se sont révélés prometteurs.Translated Description (Spanish)
Resumen
En la literatura del sistema de base de datos distribuida (DDBS), varios métodos buscaron cumplir con la reducción satisfactoria del costo de transmisión (TC) y se vieron sustancialmente efectivos. La fragmentación de datos, la agrupación de sitios y la distribución de datos se han considerado los principales factores de influencia que mitigan la CT. La agrupación de sitios, por un lado, tiene como objetivo agrupar los sitios de manera adecuada de acuerdo con ciertas métricas de similitud. Por otro lado, la distribución de datos busca asignar los datos fragmentados en clústeres/sitios de manera adecuada. Sin embargo, la combinación de estos métodos ha demostrado ser fructífera con respecto a la reducción de TC junto con los gastos generales de la red. En este trabajo, por lo tanto, se diseña meticulosamente un enfoque heurístico basado en la agrupación para la fragmentación vertical y la asignación de datos. El enfoque se dirige a proponer una solución influyente para mejorar los rendimientos de DDBS relacionales a través de un procedimiento de fragmentación agregado basado en la similitud, un agrupamiento de sitios efectivo y un modelo de asignación de datos codicioso basado en algoritmos. Además, también se considera la replicación de datos, por lo que la CT se minimiza aún más. A través de la evaluación delineada a continuación, se ha observado que los hallazgos de la implementación experimental son prometedores.Files
pdf.pdf
Files
(16.1 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:368c424bddb5a401954c660776a512e5
|
16.1 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- ASGOP: نهج تجميعي قائم على التشابه موجه نحو الجشع لتصميم DDBSs العلائقي
- Translated title (French)
- ASGOP : Une approche agrégée basée sur la similarité et orientée vers la cupidité pour la conception de DDBS relationnels
- Translated title (Spanish)
- ASGOP: Un enfoque agregado basado en la similitud y orientado a la codicia para el diseño de DDBS relacionales
Identifiers
- Other
- https://openalex.org/W2999302483
- DOI
- 10.1016/j.heliyon.2020.e03172
References
- https://openalex.org/W2073606110
- https://openalex.org/W2093583339
- https://openalex.org/W2107483781
- https://openalex.org/W2492493479
- https://openalex.org/W2582624916
- https://openalex.org/W2770682400
- https://openalex.org/W2772327093
- https://openalex.org/W2781604288
- https://openalex.org/W2921706489