Published March 25, 2024 | Version v1
Publication Open

Association analysis using the mining of positive and negative association rules

  • 1. Duy Tan University
  • 2. Thuongmai University

Description

Abstract Association analysis using the mining of positive and negative association rules (PNARs) has so far been mainly based on mining rules of forms A⇒B, A⇒ℸB, ℸA⇒B, and ℸA⇒ℸB. These are called narrow PNARs (NPNARs). Most existing algorithms for mining NPNARs usually exploit the upward closure property of negative itemsets, while few exploit the downward closure property. NPNARs mined by algorithms built under the first approach are inconsistent with human thinking and unsuitable for explaining association analysis. NPNARs mined by algorithms under the second approach are consistent with human thinking, but generally, they are just positive association rules or negative dependency relationships and are not intuitively described as the NPNARs above. Thus, they are confusing and difficult to interpret. So far, no algorithm built under both approaches has found all valid NPNARs. This work proposes an algorithm based solely on (positive) items in transaction databases under the second approach to mine NPNARs. The algorithm is developed based on equivalence classes and the support-confidence framework. Two phases of the association rule mining process are executed concurrently. The algorithm is sound and complete. Its computational complexity is also estimated. The experiment shows the application prospect of the proposed algorithm in the association analysis of co-occurrence and non-co-occurrence events.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

استند تحليل الجمعية التجريدية باستخدام تعدين قواعد الارتباط الإيجابية والسلبية (PNARs) حتى الآن بشكل أساسي إلى قواعد التعدين للنماذج A⇒B و A B و A⇒ B و A⇒ B و A⇒B. وتسمى هذه التقارير PNARs الضيقة (NPNARs). عادةً ما تستغل معظم الخوارزميات الحالية لتعدين NPNARs خاصية الإغلاق الصاعد لمجموعات العناصر السلبية، بينما يستغل القليل منها خاصية الإغلاق الهبوطي. NPNARs المستخرجة من الخوارزميات التي بنيت في إطار النهج الأول لا تتفق مع التفكير البشري وغير مناسبة لشرح تحليل الارتباط. تتوافق NPNARs المستخرجة بواسطة الخوارزميات في إطار النهج الثاني مع التفكير البشري، ولكن بشكل عام، فهي مجرد قواعد ارتباط إيجابية أو علاقات تبعية سلبية ولا يتم وصفها بشكل حدسي على أنها NPNARs أعلاه. وبالتالي، فهي مربكة ويصعب تفسيرها. حتى الآن، لم تجد أي خوارزمية مبنية في إطار كلا النهجين جميع NPNARs الصالحة. يقترح هذا العمل خوارزمية تستند فقط إلى العناصر (الإيجابية) في قواعد بيانات المعاملات في إطار النهج الثاني تجاه NPNARs المتعلقة بالألغام. يتم تطوير الخوارزمية بناءً على فئات التكافؤ وإطار دعم الثقة. يتم تنفيذ مرحلتين من عملية تعدين قواعد الارتباط في وقت واحد. الخوارزمية سليمة وكاملة. كما يتم تقدير تعقيدها الحسابي. تُظهر التجربة احتمال تطبيق الخوارزمية المقترحة في تحليل الارتباط للأحداث المتزامنة وغير المتزامنة.

Translated Description (French)

L'analyse d'association abstraite utilisant le minage de règles d'association positives et négatives (PNAR) a jusqu'à présent été principalement basée sur les règles de minage des formes⇒ A,⇒⇒ B, A, B et⇒A. Ceux-ci sont appelés PNAR étroits (NPNAR). La plupart des algorithmes existants pour l'exploitation minière des NPNAR exploitent généralement la propriété de fermeture vers le haut des éléments négatifs, tandis que peu exploitent la propriété de fermeture vers le bas. Les NPNAR exploités par des algorithmes construits dans le cadre de la première approche sont incompatibles avec la pensée humaine et inadaptés pour expliquer l'analyse d'association. Les NPNAR extraits par des algorithmes dans le cadre de la deuxième approche sont cohérents avec la pensée humaine, mais généralement, ils ne sont que des règles d'association positives ou des relations de dépendance négatives et ne sont pas intuitivement décrits comme les NPNAR ci-dessus. Ainsi, ils sont déroutants et difficiles à interpréter. Jusqu'à présent, aucun algorithme construit dans le cadre des deux approches n'a trouvé tous les NPNAR valides. Ce travail propose un algorithme basé uniquement sur les éléments (positifs) dans les bases de données de transactions dans le cadre de la deuxième approche pour exploiter les NPNAR. L'algorithme est développé sur la base des classes d'équivalence et du cadre support-confiance. Deux phases du processus d'extraction de règles d'association sont exécutées simultanément. L'algorithme est solide et complet. Sa complexité computationnelle est également estimée. L'expérience montre la perspective d'application de l'algorithme proposé dans l'analyse d'association des événements de co-occurrence et de non-cooccurrence.

Translated Description (Spanish)

El análisis de asociación abstracta que utiliza la minería de reglas de asociación positivas y negativas (PNAR) hasta ahora se ha basado principalmente en las reglas de minería de las formas⇒ A⇒B, A⇒ B, A B⇒y A. Estos se denominan PNAR estrechos (NPNAR). La mayoría de los algoritmos existentes para extraer NPNAR generalmente explotan la propiedad de cierre ascendente de los conjuntos de elementos negativos, mientras que pocos explotan la propiedad de cierre descendente. Los NPNAR extraídos por algoritmos construidos bajo el primer enfoque son inconsistentes con el pensamiento humano e inadecuados para explicar el análisis de asociación. Los NPNAR extraídos por algoritmos bajo el segundo enfoque son consistentes con el pensamiento humano, pero en general, son solo reglas de asociación positivas o relaciones de dependencia negativas y no se describen intuitivamente como los NPNAR anteriores. Por lo tanto, son confusos y difíciles de interpretar. Hasta ahora, ningún algoritmo construido bajo ambos enfoques ha encontrado todos los NPNAR válidos. Este trabajo propone un algoritmo basado únicamente en elementos (positivos) en bases de datos de transacciones bajo el segundo enfoque para extraer NPNAR. El algoritmo se desarrolla en base a clases de equivalencia y al marco de soporte-confianza. Dos fases del proceso de minería de reglas de asociación se ejecutan simultáneamente. El algoritmo es sólido y completo. También se estima su complejidad computacional. El experimento muestra la perspectiva de aplicación del algoritmo propuesto en el análisis de asociación de eventos de co-ocurrencia y no co-ocurrencia.

Files

latest.pdf.pdf

Files (527.7 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:a634e79964a782d3b389f9d613035c36
527.7 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
تحليل الجمعيات باستخدام استخراج قواعد الجمعيات الإيجابية والسلبية
Translated title (French)
Analyse d'association utilisant le minage des règles d'association positives et négatives
Translated title (Spanish)
Análisis de asociación utilizando la extracción de reglas de asociación positivas y negativas

Identifiers

Other
https://openalex.org/W4393157319
DOI
10.21203/rs.3.rs-4138411/v1

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Vietnam