Open-CyKG: An Open Cyber Threat Intelligence Knowledge Graph
Creators
- 1. Arab Academy for Science, Technology, and Maritime Transport
- 2. Utrecht University
- 3. Leiden University
- 4. Leiden University Medical Center
Description
Instant analysis of cybersecurity reports is a fundamental challenge for security experts as an immeasurable amount of cyber information is generated on a daily basis, which necessitates automated information extraction tools to facilitate querying and retrieval of data. Hence, we present Open-CyKG: an Open Cyber Threat Intelligence (CTI) Knowledge Graph (KG) framework that is constructed using an attention-based neural Open Information Extraction (OIE) model to extract valuable cyber threat information from unstructured Advanced Persistent Threat (APT) reports. More specifically, we first identify relevant entities by developing a neural cybersecurity Named Entity Recognizer (NER) that aids in labeling relation triples generated by the OIE model. Afterwards, the extracted structured data is canonicalized to build the KG by employing fusion techniques using word embeddings. As a result, security professionals can execute queries to retrieve valuable information from the Open-CyKG framework. Experimental results demonstrate that our proposed components that build up Open-CyKG outperform state-of-the-art models.1
Translated Descriptions
Translated Description (Arabic)
يمثل التحليل الفوري لتقارير الأمن السيبراني تحديًا أساسيًا لخبراء الأمن حيث يتم إنشاء كمية لا حصر لها من المعلومات السيبرانية على أساس يومي، مما يتطلب أدوات استخراج المعلومات الآلية لتسهيل الاستعلام عن البيانات واسترجاعها. وبالتالي، نقدم Open - CyKG: إطار عمل الرسم البياني المعرفي لذكاء التهديد السيبراني المفتوح (CTI) الذي تم إنشاؤه باستخدام نموذج استخراج المعلومات المفتوحة العصبية القائم على الانتباه (OIE) لاستخراج معلومات قيمة عن التهديد السيبراني من تقارير التهديد المستمر المتقدم غير المهيكلة (APT). وبشكل أكثر تحديدًا، نحدد أولاً الكيانات ذات الصلة من خلال تطوير أداة التعرف على الكيانات المسماة بالأمن السيبراني العصبي (NER) التي تساعد في وضع العلامات على العلاقات الثلاثية الناتجة عن نموذج OIE. بعد ذلك، يتم تعميم البيانات المهيكلة المستخرجة لبناء رياض الأطفال من خلال استخدام تقنيات الاندماج باستخدام تضمين الكلمات. ونتيجة لذلك، يمكن لمحترفي الأمن تنفيذ الاستعلامات لاسترداد المعلومات القيمة من إطار عمل Open - CyKG. تُظهر النتائج التجريبية أن مكوناتنا المقترحة التي تبني Open - CyKG تتفوق على أحدث النماذج .1Translated Description (French)
L'analyse instantanée des rapports de cybersécurité est un défi fondamental pour les experts en sécurité, car une quantité incommensurable d'informations cybernétiques est générée quotidiennement, ce qui nécessite des outils d'extraction d'informations automatisés pour faciliter l'interrogation et la récupération des données. Par conséquent, nous présentons Open-CyKG : un cadre Open Cyber Threat Intelligence (CTI) Knowledge Graph (KG) qui est construit à l'aide d'un modèle Open Information Extraction (OIE) neuronal basé sur l'attention pour extraire des informations précieuses sur les cybermenaces à partir de rapports non structurés Advanced Persistent Threat (APT). Plus précisément, nous identifions d'abord les entités pertinentes en développant un Ner (Named Entity Recognizer) de cybersécurité neuronale qui aide à étiqueter les triplets de relation générés par le modèle de l'OIE. Ensuite, les données structurées extraites sont canonisées pour construire le KG en employant des techniques de fusion utilisant des incrustations de mots. En conséquence, les professionnels de la sécurité peuvent exécuter des requêtes pour récupérer des informations précieuses à partir du framework Open-CyKG. Les résultats expérimentaux démontrent que nos composants proposés qui construisent Open-CyKG surpassent les modèles de pointe.1Translated Description (Spanish)
El análisis instantáneo de los informes de ciberseguridad es un desafío fundamental para los expertos en seguridad, ya que diariamente se genera una cantidad inconmensurable de información cibernética, lo que requiere herramientas automatizadas de extracción de información para facilitar la consulta y recuperación de datos. Por lo tanto, presentamos Open-CyKG: un marco de Knowledge Graph (KG) de Open Cyber Threat Intelligence (CTI) que se construye utilizando un modelo de Open Information Extraction (OIE) neuronal basado en la atención para extraer información valiosa sobre amenazas cibernéticas de informes no estructurados de Advanced Persistent Threat (APT). Más específicamente, primero identificamos las entidades relevantes mediante el desarrollo de un Named Entity Recognizer (Ner) de ciberseguridad neuronal que ayuda a etiquetar los triples de relación generados por el modelo de la OIE. Posteriormente, los datos estructurados extraídos se canonicalizan para construir el KG mediante el empleo de técnicas de fusión utilizando incrustaciones de palabras. Como resultado, los profesionales de seguridad pueden ejecutar consultas para recuperar información valiosa del marco Open-CyKG. Los resultados experimentales demuestran que los componentes propuestos que construyen Open-CyKG superan a los modelos de última generación.1Files
view.pdf
Files
(1.6 MB)
| Name | Size | Download all |
|---|---|---|
|
md5:90506c7e387811b21362d5b5cffb3f1b
|
1.6 MB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- Open - CyKG: مخطط معرفي مفتوح لمعلومات التهديد السيبراني
- Translated title (French)
- Open-CyKG : Un graphe de connaissances Open Cyber Threat Intelligence
- Translated title (Spanish)
- Open-CyKG: un gráfico de conocimiento abierto de inteligencia sobre amenazas cibernéticas
Identifiers
- Other
- https://openalex.org/W3198980504
- DOI
- 10.1016/j.knosys.2021.107524
References
- https://openalex.org/W1552847225
- https://openalex.org/W1894439495
- https://openalex.org/W1993784358
- https://openalex.org/W2001773889
- https://openalex.org/W2019484125
- https://openalex.org/W2020278455
- https://openalex.org/W2064675550
- https://openalex.org/W2083935441
- https://openalex.org/W2094728533
- https://openalex.org/W2096765155
- https://openalex.org/W2117130368
- https://openalex.org/W2135451108
- https://openalex.org/W2250539671
- https://openalex.org/W2250807343
- https://openalex.org/W2308486447
- https://openalex.org/W2309189658
- https://openalex.org/W2563163303
- https://openalex.org/W2612690371
- https://openalex.org/W2741608233
- https://openalex.org/W2768377508
- https://openalex.org/W2779457220
- https://openalex.org/W2799059383
- https://openalex.org/W2804778516
- https://openalex.org/W2804784869
- https://openalex.org/W2811243953
- https://openalex.org/W2897509371
- https://openalex.org/W2903963001
- https://openalex.org/W2912918068
- https://openalex.org/W2948226814
- https://openalex.org/W2963940534
- https://openalex.org/W2970597249
- https://openalex.org/W2974159469
- https://openalex.org/W2997634552
- https://openalex.org/W2997827534
- https://openalex.org/W3013071247
- https://openalex.org/W3023882301
- https://openalex.org/W3035390927
- https://openalex.org/W3035451444
- https://openalex.org/W3037979089
- https://openalex.org/W3081459453
- https://openalex.org/W3099149841
- https://openalex.org/W3100338574
- https://openalex.org/W3100754494
- https://openalex.org/W3106439716
- https://openalex.org/W3123673616
- https://openalex.org/W3157910026
- https://openalex.org/W4213009331
- https://openalex.org/W4240574680
- https://openalex.org/W4246941842
- https://openalex.org/W4248887260
- https://openalex.org/W4250438661
- https://openalex.org/W4251372957
- https://openalex.org/W4297734170
- https://openalex.org/W4297954654
- https://openalex.org/W4321447765
- https://openalex.org/W822806878