Published January 1, 2014 | Version v1
Publication Open

SemIndex: Semantic-Aware Inverted Index

  • 1. Université de Pau et des Pays de l'Adour
  • 2. University of Burgundy
  • 3. Lebanese American University
  • 4. Peruvian University of Applied Sciences
  • 5. Universidade de São Paulo

Description

This paper focuses on the important problem of semantic-aware search in textual (structured, semi-structured, NoSQL) databases. This problem has emerged as a required extension of the standard containment keyword based query to meet user needs in textual databases and IR applications. We provide here a new approach, called SemIndex, that extends the standard inverted index by constructing a tight coupling inverted index graph that combines two main resources: a general purpose semantic network, and a standard inverted index on a collection of textual data. We also provide an extended query model and related processing algorithms with the help of SemIndex. To investigate its effectiveness, we set up experiments to test the performance of SemIndex. Preliminary results have demonstrated the effectiveness, scalability and optimality of our approach.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

تركز هذه الورقة على المشكلة المهمة المتمثلة في البحث الواعي الدلالي في قواعد البيانات النصية (المنظمة، شبه المنظمة، NoSQL). ظهرت هذه المشكلة كامتداد مطلوب للاستعلام القياسي القائم على الكلمات الرئيسية للاحتواء لتلبية احتياجات المستخدم في قواعد البيانات النصية وتطبيقات الأشعة تحت الحمراء. نقدم هنا نهجًا جديدًا، يسمى SemIndex، يوسع الفهرس المقلوب القياسي من خلال إنشاء رسم بياني مقلوب محكم الاقتران يجمع بين مصدرين رئيسيين: شبكة دلالية للأغراض العامة، وفهرس مقلوب قياسي على مجموعة من البيانات النصية. كما نقدم نموذج استعلام موسع وخوارزميات معالجة ذات صلة بمساعدة SemIndex. للتحقق من فعاليتها، قمنا بإعداد تجارب لاختبار أداء SemIndex. أظهرت النتائج الأولية فعالية نهجنا وقابليته للتطوير وأمثلته.

Translated Description (French)

Cet article se concentre sur l'important problème de la recherche sémantique dans les bases de données textuelles (structurées, semi-structurées, NoSQL). Ce problème est apparu comme une extension nécessaire de la requête standard basée sur des mots-clés de confinement pour répondre aux besoins des utilisateurs dans les bases de données textuelles et les applications IR. Nous fournissons ici une nouvelle approche, appelée SemIndex, qui étend l'index inversé standard en construisant un graphe d'index inversé à couplage serré qui combine deux ressources principales : un réseau sémantique à usage général et un index inversé standard sur une collection de données textuelles. Nous fournissons également un modèle de requête étendu et des algorithmes de traitement associés à l'aide de SemIndex. Pour étudier son efficacité, nous avons mis en place des expériences pour tester la performance de SemIndex. Les résultats préliminaires ont démontré l'efficacité, l'évolutivité et l'optimalité de notre approche.

Translated Description (Spanish)

Este documento se centra en el importante problema de la búsqueda semántica en bases de datos textuales (estructuradas, semiestructuradas, NoSQL). Este problema ha surgido como una extensión necesaria de la consulta basada en palabras clave de contención estándar para satisfacer las necesidades del usuario en bases de datos textuales y aplicaciones de IR. Proporcionamos aquí un nuevo enfoque, llamado SemIndex, que amplía el índice invertido estándar mediante la construcción de un gráfico de índice invertido de acoplamiento estrecho que combina dos recursos principales: una red semántica de propósito general y un índice invertido estándar en una colección de datos textuales. También proporcionamos un modelo de consulta extendido y algoritmos de procesamiento relacionados con la ayuda de SemIndex. Para investigar su efectividad, configuramos experimentos para probar el rendimiento de SemIndex. Los resultados preliminares han demostrado la eficacia, escalabilidad y optimización de nuestro enfoque.

Files

PreviouspaperSemIndex.pdf.pdf

Files (922.7 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:1136c15f2c80df592a17d718a36951b7
922.7 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
SemIndex: الفهرس المعكوس للوعي الدلالي
Translated title (French)
SemIndex : Semantic-Aware Inverted Index
Translated title (Spanish)
SemIndex: Semantic-Aware Inverted Index

Identifiers

Other
https://openalex.org/W1815867320
DOI
10.1007/978-3-319-10933-6_22

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Brazil

References

  • https://openalex.org/W170118813
  • https://openalex.org/W1801985905
  • https://openalex.org/W1966907789
  • https://openalex.org/W1974782086
  • https://openalex.org/W2005048938
  • https://openalex.org/W2007269563
  • https://openalex.org/W2017879678
  • https://openalex.org/W2029344051
  • https://openalex.org/W2056105869
  • https://openalex.org/W2074863013
  • https://openalex.org/W2075204839
  • https://openalex.org/W2101244331
  • https://openalex.org/W2112885079
  • https://openalex.org/W2138341108
  • https://openalex.org/W2163780445
  • https://openalex.org/W2163953154
  • https://openalex.org/W2436001372
  • https://openalex.org/W4235505822
  • https://openalex.org/W4236329806