Published April 5, 2023 | Version v1
Publication

Automatic detection of semantic primitives using optimization based on genetic algorithm

  • 1. Instituto Politécnico Nacional
  • 2. State University of New York
  • 3. Stony Brook University

Description

In this article, we propose a method for the automatic retrieval of a set of semantic primitive words from an explanatory dictionary and a novel evaluation procedure for the obtained set of primitives. The approach is based on the representation of the dictionary as a directed graph with a single-objective constrained optimization problem via a genetic algorithm with the PageRank scoring model. The problem is defined as a subset selection. The algorithm is fit to search for the sets of words that should fulfil several requirements: the cardinality of the set should not exceed empirically selected limits and the PageRank word importance score is minimized with cycle prevention thresholding. In the experiments, we used the WordNet dictionary for English. The proposed method is an improvement over the previous state-of-the-art solutions.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

في هذه المقالة، نقترح طريقة للاسترجاع التلقائي لمجموعة من الكلمات البدائية الدلالية من قاموس تفسيري وإجراء تقييم جديد لمجموعة من البدائية التي تم الحصول عليها. يعتمد النهج على تمثيل القاموس كرسم بياني موجه مع مشكلة تحسين مقيدة ذات هدف واحد عبر خوارزمية وراثية مع نموذج تصنيف الصفحات. يتم تعريف المشكلة على أنها اختيار مجموعة فرعية. الخوارزمية مناسبة للبحث عن مجموعات الكلمات التي يجب أن تفي بعدة متطلبات: يجب ألا تتجاوز جوهرية المجموعة الحدود المحددة تجريبيًا ويتم تقليل درجة أهمية كلمة PageRank مع عتبة منع الدورة. في التجارب، استخدمنا قاموس WordNet للغة الإنجليزية. الطريقة المقترحة هي تحسين للحلول الحديثة السابقة.

Translated Description (French)

Dans cet article, nous proposons une méthode pour la récupération automatique d'un ensemble de mots primitifs sémantiques à partir d'un dictionnaire explicatif et une nouvelle procédure d'évaluation de l'ensemble de primitives obtenu. L'approche est basée sur la représentation du dictionnaire comme un graphique dirigé avec un problème d'optimisation contraint à un seul objectif via un algorithme génétique avec le modèle de notation PageRank. Le problème est défini comme une sélection de sous-ensemble. L'algorithme est apte à rechercher les ensembles de mots qui devraient répondre à plusieurs exigences : la cardinalité de l'ensemble ne doit pas dépasser les limites sélectionnées empiriquement et le score d'importance des mots PageRank est minimisé avec le seuillage de prévention du cycle. Dans les expériences, nous avons utilisé le dictionnaire WordNet pour l'anglais. La méthode proposée est une amélioration par rapport aux solutions de pointe précédentes.

Translated Description (Spanish)

En este artículo, proponemos un método para la recuperación automática de un conjunto de palabras semánticas primitivas de un diccionario explicativo y un procedimiento de evaluación novedoso para el conjunto de primitivas obtenido. El enfoque se basa en la representación del diccionario como un gráfico dirigido con un problema de optimización restringido de un solo objetivo a través de un algoritmo genético con el modelo de puntuación PageRank. El problema se define como una selección de subconjuntos. El algoritmo es apto para buscar los conjuntos de palabras que deben cumplir varios requisitos: la cardinalidad del conjunto no debe exceder los límites seleccionados empíricamente y la puntuación de importancia de la palabra PageRank se minimiza con el umbral de prevención de ciclos. En los experimentos, utilizamos el diccionario WordNet para el inglés. El método propuesto es una mejora con respecto a las soluciones de última generación anteriores.

Additional details

Additional titles

Translated title (Arabic)
الكشف التلقائي عن البدائيات الدلالية باستخدام التحسين القائم على الخوارزمية الجينية
Translated title (French)
Détection automatique des primitives sémantiques à l'aide d'une optimisation basée sur un algorithme génétique
Translated title (Spanish)
Detección automática de primitivas semánticas mediante optimización basada en algoritmo genético

Identifiers

Other
https://openalex.org/W4362614581
DOI
10.7717/peerj-cs.1282

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Mexico

References

  • https://openalex.org/W1561908597
  • https://openalex.org/W1614298861
  • https://openalex.org/W1854214752
  • https://openalex.org/W2054207136
  • https://openalex.org/W2088284390
  • https://openalex.org/W2110529160
  • https://openalex.org/W2146644361
  • https://openalex.org/W2222512263
  • https://openalex.org/W2250539671
  • https://openalex.org/W243163111
  • https://openalex.org/W2946479819
  • https://openalex.org/W2962784628
  • https://openalex.org/W2963341956
  • https://openalex.org/W2973937881
  • https://openalex.org/W2980282514
  • https://openalex.org/W3021613070
  • https://openalex.org/W3037109418
  • https://openalex.org/W3086706245
  • https://openalex.org/W4235743066
  • https://openalex.org/W4247452586
  • https://openalex.org/W4285719527
  • https://openalex.org/W4289731297
  • https://openalex.org/W4294367149
  • https://openalex.org/W4385245566
  • https://openalex.org/W4388243213