Algorithm for Information Retrieval optimization
- 1. Elizade University
- 2. University of Bradford
Description
When using Information Retrieval (IR) systems, users often present search queries made of ad-hoc keywords. It is then up to the information retrieval systems (IRS) to obtain a precise representation of the user's information need and the context (preferences) of the information. To address this problem, we investigate optimization of IRS to individual information needs in order of relevance. The goal of this article is to develop algorithms that optimize the ranking of documents retrieved from IRS according to user search context. In particular, the ranking task that led the user to engage in information-seeking behaviour during search tasks. This article discusses and describes a Document Ranking Optimization (DROPT) algorithm for IR in an Internet-based or designated databases environment. Conversely, as the volume of information available online and in designated databases is growing continuously, ranking algorithms can play a major role in the context of search results. In this article, a DROPT technique for documents retrieved from a corpus is developed with respect to document index keywords and the query vectors. This is based on calculating the weight (w ij ) of keywords in the document index vector, calculated as a function of the frequency of a keyword k j across a document. The purpose of the DROPT technique is to reflect how human users can judge the context changes in IR result rankings according to information relevance. This article shows that it is possible for the DROPT technique to overcome some of the limitations of existing traditional (tf × idf) algorithms via adaptation. The empirical evaluation using metrics measures on the DROPT technique carried out through human user interaction shows improvement over the traditional relevance feedback technique to demonstrate improving IR effectiveness.
Translated Descriptions
Translated Description (Arabic)
عند استخدام أنظمة استرجاع المعلومات، غالبًا ما يقدم المستخدمون استعلامات بحث مصنوعة من كلمات رئيسية مخصصة. ثم يعود الأمر إلى أنظمة استرجاع المعلومات (IRS) للحصول على تمثيل دقيق لاحتياجات المستخدم من المعلومات وسياق (تفضيلات) المعلومات. لمعالجة هذه المشكلة، نقوم بالتحقيق في تحسين مصلحة الضرائب لاحتياجات المعلومات الفردية حسب الصلة. الهدف من هذه المقالة هو تطوير خوارزميات تعمل على تحسين ترتيب المستندات المستردة من مصلحة الضرائب وفقًا لسياق بحث المستخدم. على وجه الخصوص، مهمة الترتيب التي دفعت المستخدم إلى الانخراط في سلوك البحث عن المعلومات أثناء مهام البحث. تناقش هذه المقالة وتصف خوارزمية تحسين تصنيف المستندات (DROPT) للأشعة تحت الحمراء في بيئة قواعد بيانات قائمة على الإنترنت أو مخصصة. على العكس من ذلك، نظرًا لأن حجم المعلومات المتاحة عبر الإنترنت وفي قواعد البيانات المعينة يتزايد باستمرار، يمكن أن تلعب خوارزميات الترتيب دورًا رئيسيًا في سياق نتائج البحث. في هذه المقالة، تم تطوير تقنية DROPT للمستندات التي تم استردادها من مجموعة النصوص فيما يتعلق بالكلمات الرئيسية لفهرس المستندات ومتجهات الاستعلام. يعتمد هذا على حساب وزن (wij) الكلمات الرئيسية في متجه فهرس المستند، محسوبة كدالة لتكرار الكلمة الرئيسية kj عبر المستند. الغرض من تقنية DROPT هو عكس كيف يمكن للمستخدمين البشريين الحكم على تغييرات السياق في تصنيفات نتائج الأشعة تحت الحمراء وفقًا لأهمية المعلومات. توضح هذه المقالة أنه من الممكن لتقنية DROPT التغلب على بعض قيود الخوارزميات التقليدية الحالية (tf × idf) عن طريق التكيف. يُظهر التقييم التجريبي باستخدام مقاييس تقنية DROPT التي تم إجراؤها من خلال تفاعل المستخدم البشري تحسنًا على تقنية التغذية الراجعة ذات الصلة التقليدية لإثبات تحسين فعالية الأشعة تحت الحمراء.Translated Description (French)
Lors de l'utilisation des systèmes de récupération d'informations (RI), les utilisateurs présentent souvent des requêtes de recherche composées de mots-clés ad hoc. Il appartient ensuite aux systèmes de récupération d'informations (IRS) d'obtenir une représentation précise du besoin d'information de l'utilisateur et du contexte (préférences) de l'information. Pour résoudre ce problème, nous étudions l'optimisation des SII en fonction des besoins d'information individuels par ordre de pertinence. Le but de cet article est de développer des algorithmes qui optimisent le classement des documents récupérés de l'IRS en fonction du contexte de recherche de l'utilisateur. En particulier, la tâche de classement qui a conduit l'utilisateur à adopter un comportement de recherche d'informations lors des tâches de recherche. Cet article traite et décrit un algorithme d'optimisation du classement des documents (DROPT) pour les RI dans un environnement de bases de données basées sur Internet ou désignées. Inversement, comme le volume d'informations disponibles en ligne et dans les bases de données désignées ne cesse de croître, les algorithmes de classement peuvent jouer un rôle majeur dans le contexte des résultats de recherche. Dans cet article, une technique DROPT pour les documents extraits d'un corpus est développée en ce qui concerne les mots-clés d'index de documents et les vecteurs de requête. Ceci est basé sur le calcul du poids (w ij) des mots-clés dans le vecteur d'index de document, calculé en fonction de la fréquence d'un mot-clé k j à travers un document. Le but de la technique DROPT est de refléter comment les utilisateurs humains peuvent juger les changements de contexte dans le classement des résultats IR en fonction de la pertinence des informations. Cet article montre qu'il est possible pour la technique DROPT de surmonter certaines des limitations des algorithmes traditionnels existants (tf × idf) via l'adaptation. L'évaluation empirique utilisant des mesures métriques sur la technique DROPT réalisée par interaction humaine avec l'utilisateur montre une amélioration par rapport à la technique traditionnelle de retour de pertinence pour démontrer l'amélioration de l'efficacité de l'IR.Translated Description (Spanish)
Cuando se utilizan sistemas de recuperación de información (IR), los usuarios a menudo presentan consultas de búsqueda hechas de palabras clave ad-hoc. Corresponde entonces a los sistemas de recuperación de información (IRS) obtener una representación precisa de la necesidad de información del usuario y el contexto (preferencias) de la información. Para abordar este problema, investigamos la optimización del IRS a las necesidades de información individuales en orden de relevancia. El objetivo de este artículo es desarrollar algoritmos que optimicen la clasificación de los documentos recuperados del IRS según el contexto de búsqueda del usuario. En particular, la tarea de clasificación que llevó al usuario a participar en el comportamiento de búsqueda de información durante las tareas de búsqueda. Este artículo analiza y describe un algoritmo de optimización de clasificación de documentos (DROPT) para IR en un entorno de bases de datos designado o basado en Internet. Por el contrario, a medida que el volumen de información disponible en línea y en las bases de datos designadas crece continuamente, los algoritmos de clasificación pueden desempeñar un papel importante en el contexto de los resultados de búsqueda. En este artículo, se desarrolla una técnica DROPT para documentos recuperados de un corpus con respecto a las palabras clave del índice de documentos y los vectores de consulta. Esto se basa en el cálculo del peso (w ij) de las palabras clave en el vector de índice del documento, calculado en función de la frecuencia de una palabra clave k j en un documento. El propósito de la técnica DROPT es reflejar cómo los usuarios humanos pueden juzgar los cambios de contexto en las clasificaciones de resultados de IR de acuerdo con la relevancia de la información. Este artículo muestra que es posible que la técnica DROPT supere algunas de las limitaciones de los algoritmos tradicionales existentes (tf × idf) a través de la adaptación. La evaluación empírica utilizando medidas métricas en la técnica DROPT llevada a cabo a través de la interacción del usuario humano muestra una mejora sobre la técnica tradicional de retroalimentación de relevancia para demostrar la mejora de la efectividad de las RI.Files
10005402.pdf.pdf
Files
(352.1 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:376373c0fc875d8ae6006de8ecb95c7c
|
352.1 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- خوارزمية لتحسين استرجاع المعلومات
- Translated title (French)
- Algorithme pour l'optimisation de la récupération d'informations
- Translated title (Spanish)
- Algoritmo para la optimización de la recuperación de información
Identifiers
- Other
- https://openalex.org/W2980335925
- DOI
- 10.1109/iemcon.2016.7746242
References
- https://openalex.org/W1483313504
- https://openalex.org/W1502285767
- https://openalex.org/W1971880772
- https://openalex.org/W1978394996
- https://openalex.org/W1985554184
- https://openalex.org/W1993968481
- https://openalex.org/W2031459112
- https://openalex.org/W2039310103
- https://openalex.org/W2048987619
- https://openalex.org/W2096876410
- https://openalex.org/W2108843240
- https://openalex.org/W2125771191
- https://openalex.org/W2131970106
- https://openalex.org/W2134837986
- https://openalex.org/W2154724067
- https://openalex.org/W2165062189
- https://openalex.org/W2169223373
- https://openalex.org/W2284575292
- https://openalex.org/W2319223103
- https://openalex.org/W2951838859
- https://openalex.org/W4213009331
- https://openalex.org/W4254168416