Published December 31, 2022 | Version v1
Publication Open

A Review of Data and Document Clustering pertaining to various Distance Measures

  • 1. Vellore Institute of Technology University

Description

Data is being generated at an increasing rate in a variety of fields as science and technology advance. The generated data are being saved for future decision-making. Data mining is the process of extracting patterns and useful information from massive amounts of data. The distance measure, which is used to calculate how different two objects are from one another, is one such instrument. We have conducted a comprehensive survey of how the distance measures behave when employed with different algorithms. Furthermore, the effectiveness and performance of some novel similarity measures proposed by other authors are investigated.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

يتم إنشاء البيانات بمعدل متزايد في مجموعة متنوعة من المجالات مع تقدم العلوم والتكنولوجيا. يتم حفظ البيانات التي تم إنشاؤها لاتخاذ القرارات في المستقبل. استخراج البيانات هو عملية استخراج الأنماط والمعلومات المفيدة من كميات هائلة من البيانات. مقياس المسافة، الذي يستخدم لحساب مدى اختلاف جسمين عن بعضهما البعض، هو أحد هذه الأدوات. لقد أجرينا مسحًا شاملاً لكيفية تصرف مقاييس المسافة عند استخدامها مع خوارزميات مختلفة. علاوة على ذلك، يتم التحقيق في فعالية وأداء بعض مقاييس التشابه الجديدة التي اقترحها مؤلفون آخرون.

Translated Description (French)

Les données sont générées à un rythme croissant dans divers domaines à mesure que la science et la technologie progressent. Les données générées sont sauvegardées pour une prise de décision future. L'exploration de données est le processus d'extraction de modèles et d'informations utiles à partir de quantités massives de données. La mesure de distance, qui est utilisée pour calculer à quel point deux objets sont différents l'un de l'autre, est un tel instrument. Nous avons mené une enquête complète sur le comportement des mesures de distance lorsqu'elles sont utilisées avec différents algorithmes. De plus, l'efficacité et la performance de certaines nouvelles mesures de similarité proposées par d'autres auteurs sont étudiées.

Translated Description (Spanish)

Los datos se están generando a un ritmo creciente en una variedad de campos a medida que avanza la ciencia y la tecnología. Los datos generados se están guardando para la toma de decisiones futuras. La minería de datos es el proceso de extracción de patrones e información útil a partir de cantidades masivas de datos. La medida de distancia, que se utiliza para calcular qué tan diferentes son dos objetos entre sí, es uno de esos instrumentos. Hemos realizado una encuesta exhaustiva sobre cómo se comportan las medidas de distancia cuando se emplean con diferentes algoritmos. Además, se investiga la efectividad y el rendimiento de algunas medidas de similitud novedosas propuestas por otros autores.

Files

454.pdf

Files (225.2 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:c5b356530e9f6f431142d3e28746badf
225.2 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
مراجعة لتجميع البيانات والمستندات المتعلقة بمختلف مقاييس المسافة
Translated title (French)
A Review of Data and Document Clustering relating to various Distance Measures
Translated title (Spanish)
Una revisión de la agrupación de datos y documentos relacionados con varias medidas de distancia

Identifiers

Other
https://openalex.org/W4319991001
DOI
10.56294/saludcyt2022194

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
India

References

  • https://openalex.org/W1079970269
  • https://openalex.org/W1523794535
  • https://openalex.org/W1884731728
  • https://openalex.org/W1974209792
  • https://openalex.org/W1976772058
  • https://openalex.org/W1982024311
  • https://openalex.org/W1988183367
  • https://openalex.org/W1997853560
  • https://openalex.org/W2002717340
  • https://openalex.org/W2007508006
  • https://openalex.org/W2011430131
  • https://openalex.org/W2024635814
  • https://openalex.org/W2045997397
  • https://openalex.org/W2052684427
  • https://openalex.org/W2071092279
  • https://openalex.org/W2077004428
  • https://openalex.org/W2096364584
  • https://openalex.org/W2097922870
  • https://openalex.org/W2117594971
  • https://openalex.org/W2118364625
  • https://openalex.org/W2145252566
  • https://openalex.org/W2164136210
  • https://openalex.org/W2270192120
  • https://openalex.org/W2296349981
  • https://openalex.org/W2324238275
  • https://openalex.org/W2399932691
  • https://openalex.org/W2509387365
  • https://openalex.org/W2577472518
  • https://openalex.org/W2736451061
  • https://openalex.org/W2787207090
  • https://openalex.org/W2807052877
  • https://openalex.org/W2807927369
  • https://openalex.org/W2907753072
  • https://openalex.org/W2914190968
  • https://openalex.org/W2970480979
  • https://openalex.org/W2975391911
  • https://openalex.org/W2999157599
  • https://openalex.org/W3102462016
  • https://openalex.org/W3151633797
  • https://openalex.org/W896919041