AI Meta-Learners and Extra-Trees Algorithm for the Detection of Phishing Websites
- 1. Northern Border University
- 2. Leeds Beckett University
- 3. University of Ilorin
- 4. Universiti Teknologi Petronas
Description
Phishing is a type of social web-engineering attack in cyberspace where criminals steal valuable data or information from insensitive or uninformed users of the internet. Existing countermeasures in the form of anti-phishing software and computational methods for detecting phishing activities have proven to be effective. However, new methods are deployed by hackers to thwart these countermeasures. Due to the evolving nature of phishing attacks, the need for novel and efficient countermeasures becomes crucial as the effect of phishing attacks are often fatal and disastrous. Artificial Intelligence (AI) schemes have been the cornerstone of modern countermeasures used for mitigating phishing attacks. AI-based phishing countermeasures or methods possess their shortcomings particularly the high false alarm rate and the inability to interpret how most phishing methods perform their function. This study proposed four (4) meta-learner models (AdaBoost-Extra Tree (ABET), Bagging - Extra tree (BET), Rotation Forest - Extra Tree (RoFBET) and LogitBoost-Extra Tree (LBET)) developed using the extra-tree base classifier. The proposed AI-based meta-learners were fitted on phishing website datasets (currently with the newest features) and their performances were evaluated. The models achieved a detection accuracy not lower than 97% with a drastically low false-positive rate of not more 0.028. In addition, the proposed models outperform existing ML-based models in phishing attack detection. Hence, we recommend the adoption of meta-learners when building phishing attack detection models.
Translated Descriptions
Translated Description (Arabic)
التصيد الاحتيالي هو نوع من هجمات هندسة الويب الاجتماعية في الفضاء الإلكتروني حيث يسرق المجرمون بيانات أو معلومات قيمة من مستخدمي الإنترنت غير الحساسين أو غير المطلعين. أثبتت التدابير المضادة الحالية في شكل برامج مكافحة التصيد الاحتيالي والأساليب الحسابية للكشف عن أنشطة التصيد الاحتيالي فعاليتها. ومع ذلك، يتم نشر أساليب جديدة من قبل المتسللين لإحباط هذه التدابير المضادة. نظرًا للطبيعة المتطورة لهجمات التصيد الاحتيالي، تصبح الحاجة إلى تدابير مضادة جديدة وفعالة أمرًا بالغ الأهمية لأن تأثير هجمات التصيد الاحتيالي غالبًا ما يكون مميتًا وكارثيًا. كانت مخططات الذكاء الاصطناعي حجر الزاوية في التدابير المضادة الحديثة المستخدمة للتخفيف من هجمات التصيد الاحتيالي. تمتلك تدابير أو أساليب التصيد الاحتيالي القائمة على الذكاء الاصطناعي أوجه قصور خاصة معدل الإنذار الكاذب المرتفع وعدم القدرة على تفسير كيفية أداء معظم أساليب التصيد الاحتيالي لوظيفتها. اقترحت هذه الدراسة أربعة (4) نماذج للمتعلم التلوي (AdaBoost - Extra Tree (ABET)، التعبئة - Extra Tree (BET)، Rotation Forest - Extra Tree (RoFBET) و LogitBoost - Extra Tree (LBET)) تم تطويرها باستخدام مصنف قاعدة الشجرة الإضافية. تم تزويد المتعلمين الفائقين المقترحين المعتمدين على الذكاء الاصطناعي بمجموعات بيانات موقع التصيد الاحتيالي (التي تحتوي حاليًا على أحدث الميزات) وتم تقييم أدائهم. حققت النماذج دقة اكتشاف لا تقل عن 97 ٪ مع معدل إيجابي كاذب منخفض بشكل كبير لا يزيد عن 0.028. بالإضافة إلى ذلك، تتفوق النماذج المقترحة على النماذج القائمة على غسل الأموال في الكشف عن هجمات التصيد الاحتيالي. وبالتالي، نوصي باعتماد المتعلمين الفوقية عند بناء نماذج الكشف عن هجمات التصيد الاحتيالي.Translated Description (French)
L'hameçonnage est un type d'attaque d'ingénierie Web sociale dans le cyberespace où les criminels volent des données ou des informations précieuses à des utilisateurs d'Internet insensibles ou mal informés. Les contre-mesures existantes sous la forme de logiciels anti-phishing et de méthodes de calcul pour détecter les activités de phishing se sont révélées efficaces. Cependant, de nouvelles méthodes sont déployées par les pirates pour contrecarrer ces contre-mesures. En raison de la nature évolutive des attaques d'hameçonnage, la nécessité de contre-mesures nouvelles et efficaces devient cruciale, car les effets des attaques d'hameçonnage sont souvent mortels et désastreux. Les systèmes d'intelligence artificielle (IA) ont été la pierre angulaire des contre-mesures modernes utilisées pour atténuer les attaques de phishing. Les contre-mesures ou méthodes d'hameçonnage basées sur l'IA présentent leurs lacunes, en particulier le taux élevé de fausses alarmes et l'incapacité d'interpréter la façon dont la plupart des méthodes d'hameçonnage remplissent leur fonction. Cette étude a proposé quatre (4) modèles de méta-apprenants (AdaBoost-Extra Tree (ABET), Bagging - Extra tree (BET), Rotation Forest - Extra Tree (RoFBET) et LogitBoost-Extra Tree (LBET)) développés à l'aide du classificateur de base extra-arbre. Les méta-apprenants basés sur l'IA proposés ont été installés sur des ensembles de données de sites Web d'hameçonnage (actuellement dotés des fonctionnalités les plus récentes) et leurs performances ont été évaluées. Les modèles ont atteint une précision de détection non inférieure à 97 % avec un taux de faux positifs considérablement bas de pas plus de 0,028. En outre, les modèles proposés surpassent les modèles existants basés sur le ML dans la détection des attaques d'hameçonnage. Par conséquent, nous recommandons l'adoption de méta-apprenants lors de la création de modèles de détection des attaques d'hameçonnage.Translated Description (Spanish)
El phishing es un tipo de ataque de ingeniería web social en el ciberespacio en el que los delincuentes roban datos o información valiosos de usuarios insensibles o desinformados de Internet. Las contramedidas existentes en forma de software antiphishing y métodos computacionales para detectar actividades de phishing han demostrado ser efectivas. Sin embargo, los hackers implementan nuevos métodos para frustrar estas contramedidas. Debido a la naturaleza cambiante de los ataques de phishing, la necesidad de contramedidas novedosas y eficientes se vuelve crucial, ya que el efecto de los ataques de phishing a menudo es fatal y desastroso. Los esquemas de Inteligencia Artificial (IA) han sido la piedra angular de las contramedidas modernas utilizadas para mitigar los ataques de phishing. Las contramedidas o métodos de phishing basados en IA tienen sus deficiencias, en particular la alta tasa de falsas alarmas y la incapacidad de interpretar cómo la mayoría de los métodos de phishing realizan su función. Este estudio propuso cuatro (4) modelos de metaaprendizaje (AdaBoost-Extra Tree (ABET), Bagging - Extra tree (BET), Rotation Forest - Extra Tree (RoFBET) y LogitBoost-Extra Tree (LBET)) desarrollados utilizando el clasificador de base de árbol extra. Los metaalumnos basados en IA propuestos se instalaron en conjuntos de datos de sitios web de phishing (actualmente con las funciones más nuevas) y se evaluaron sus rendimientos. Los modelos lograron una precisión de detección no inferior al 97% con una tasa de falsos positivos drásticamente baja de no más de 0.028. Además, los modelos propuestos superan a los modelos existentes basados en ML en la detección de ataques de phishing. Por lo tanto, recomendamos la adopción de meta-learners a la hora de construir modelos de detección de ataques de phishing.Files
09154378.pdf.pdf
Files
(245 Bytes)
| Name | Size | Download all |
|---|---|---|
|
md5:e2a7cbbd915cfc17a8eb62aeac1a4688
|
245 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- خوارزمية الذكاء الاصطناعي للمتعلمين الفائقين والأشجار الإضافية للكشف عن مواقع التصيد الاحتيالي
- Translated title (French)
- Algorithme AI Meta-Learners et Extra-Trees pour la détection des sites Web d'hameçonnage
- Translated title (Spanish)
- Algoritmo AI Meta-Learners y Extra-Trees para la detección de sitios web de phishing
Identifiers
- Other
- https://openalex.org/W3047536849
- DOI
- 10.1109/access.2020.3013699
References
- https://openalex.org/W1570448133
- https://openalex.org/W1864224110
- https://openalex.org/W1930835045
- https://openalex.org/W2028223155
- https://openalex.org/W2029470356
- https://openalex.org/W2056132907
- https://openalex.org/W2318752590
- https://openalex.org/W2547985817
- https://openalex.org/W2602216144
- https://openalex.org/W2753047523
- https://openalex.org/W2766196489
- https://openalex.org/W2768045609
- https://openalex.org/W2782609208
- https://openalex.org/W2793000302
- https://openalex.org/W2800469522
- https://openalex.org/W2899221877
- https://openalex.org/W2899992227
- https://openalex.org/W2909737018
- https://openalex.org/W2923998471
- https://openalex.org/W2945488546
- https://openalex.org/W2946356375
- https://openalex.org/W2964104998
- https://openalex.org/W2972249514
- https://openalex.org/W2975388328
- https://openalex.org/W2978522609
- https://openalex.org/W2978751771
- https://openalex.org/W2979313622
- https://openalex.org/W2999300566
- https://openalex.org/W4285719527