Digital banking fortification: a real-time isolation forest architecture for detecting online transaction fraud
Description
Abstract Since the use of the Internet has increased exponentially, numerous organizations, including the financial industry, offer services online. As a result, financial scams are expanding in quantity and complexity worldwide, resulting in massive revenue losses and making digital fraudulent transactions a severe issue. Abnormal attempts and illegal access are instances of these dangers that fraudulent activity detection systems must identify. Machine learning and data mining approaches have been extensively used to address this issue in recent years. However, these approaches must be enhanced regarding real-time detection speed, tackling enormous amounts of data, and finding undiscovered attack patterns. Consequently, the present study provides a real-time architecture for averting and identifying digital transaction fraud, which relies on the Isolation Forest (IForest) approach and big data analytic tools, including Spark Streaming, sparkling water, Kafka, and PostgreSQL. This architecture seeks to improve present detection strategies by increasing accuracy for detection when considering enormous amounts of data. Two real datasets of online transactional fraud are used to assess the proposed architecture, and the findings are compared to relevant studies. The investigation results showed that IForest performed flawlessly, achieving an accuracy of 0.99 in two datasets.
Translated Descriptions
Translated Description (Arabic)
الملخص نظرًا لأن استخدام الإنترنت قد زاد بشكل كبير، فإن العديد من المنظمات، بما في ذلك الصناعة المالية، تقدم خدمات عبر الإنترنت. ونتيجة لذلك، تتوسع عمليات الاحتيال المالي من حيث الكم والتعقيد في جميع أنحاء العالم، مما يؤدي إلى خسائر فادحة في الإيرادات ويجعل المعاملات الاحتيالية الرقمية مشكلة خطيرة. المحاولات غير الطبيعية والوصول غير القانوني هي أمثلة على هذه المخاطر التي يجب أن تحددها أنظمة الكشف عن الأنشطة الاحتيالية. تم استخدام مناهج التعلم الآلي واستخراج البيانات على نطاق واسع لمعالجة هذه المشكلة في السنوات الأخيرة. ومع ذلك، يجب تعزيز هذه الأساليب فيما يتعلق بسرعة الكشف في الوقت الفعلي، ومعالجة كميات هائلة من البيانات، وإيجاد أنماط هجوم غير مكتشفة. وبالتالي، توفر هذه الدراسة بنية في الوقت الفعلي لتجنب وتحديد الاحتيال في المعاملات الرقمية، والتي تعتمد على نهج غابة العزل (IForest) وأدوات تحليل البيانات الضخمة، بما في ذلك Spark Streaming و Sparkling water و Kafka و PostgreSQL. تسعى هذه البنية إلى تحسين استراتيجيات الكشف الحالية من خلال زيادة دقة الكشف عند النظر في كميات هائلة من البيانات. يتم استخدام مجموعتي بيانات حقيقيتين من الاحتيال في المعاملات عبر الإنترنت لتقييم البنية المقترحة، وتتم مقارنة النتائج بالدراسات ذات الصلة. أظهرت نتائج التحقيق أن IForest كان أداؤها لا تشوبه شائبة، حيث حققت دقة 0.99 في مجموعتي بيانات.Translated Description (French)
Résumé Depuis que l'utilisation d'Internet a augmenté de façon exponentielle, de nombreuses organisations, y compris le secteur financier, offrent des services en ligne. En conséquence, les escroqueries financières se développent en quantité et en complexité dans le monde entier, entraînant des pertes de revenus massives et faisant des transactions frauduleuses numériques un problème grave. Les tentatives anormales et les accès illégaux sont des exemples de ces dangers que les systèmes de détection d'activités frauduleuses doivent identifier. Les approches d'apprentissage automatique et d'exploration de données ont été largement utilisées pour résoudre ce problème ces dernières années. Cependant, ces approches doivent être améliorées en ce qui concerne la vitesse de détection en temps réel, la lutte contre d'énormes quantités de données et la recherche de modèles d'attaque non découverts. Par conséquent, la présente étude fournit une architecture en temps réel pour prévenir et identifier la fraude aux transactions numériques, qui repose sur l'approche Isolation Forest (IForest) et des outils d'analyse de mégadonnées, notamment Spark Streaming, Spark Water, Kafka et PostgreSQL. Cette architecture vise à améliorer les stratégies de détection actuelles en augmentant la précision de la détection lors de la prise en compte d'énormes quantités de données. Deux ensembles de données réels sur la fraude transactionnelle en ligne sont utilisés pour évaluer l'architecture proposée, et les résultats sont comparés à des études pertinentes. Les résultats de l'enquête ont montré qu'IForest fonctionnait parfaitement, atteignant une précision de 0,99 dans deux ensembles de données.Translated Description (Spanish)
Resumen Dado que el uso de Internet ha aumentado exponencialmente, numerosas organizaciones, incluida la industria financiera, ofrecen servicios en línea. Como resultado, las estafas financieras se están expandiendo en cantidad y complejidad en todo el mundo, lo que resulta en pérdidas masivas de ingresos y hace que las transacciones fraudulentas digitales sean un problema grave. Los intentos anormales y el acceso ilegal son ejemplos de estos peligros que los sistemas de detección de actividades fraudulentas deben identificar. Los enfoques de aprendizaje automático y minería de datos se han utilizado ampliamente para abordar este problema en los últimos años. Sin embargo, estos enfoques deben mejorarse con respecto a la velocidad de detección en tiempo real, el abordaje de enormes cantidades de datos y la búsqueda de patrones de ataque no descubiertos. En consecuencia, el presente estudio proporciona una arquitectura en tiempo real para evitar e identificar el fraude de transacciones digitales, que se basa en el enfoque del Bosque de Aislamiento (IForest) y en herramientas analíticas de big data, como Spark Streaming, Sparkling Water, Kafka y PostgreSQL. Esta arquitectura busca mejorar las estrategias de detección actuales al aumentar la precisión de la detección al considerar enormes cantidades de datos. Se utilizan dos conjuntos de datos reales de fraude transaccional en línea para evaluar la arquitectura propuesta, y los hallazgos se comparan con estudios relevantes. Los resultados de la investigación mostraron que IForest tuvo un rendimiento impecable, logrando una precisión de 0,99 en dos conjuntos de datos.Files
pdf.pdf
Files
(11.9 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:c9782d2fa8ba16ea95d99ffe6a9283bb
|
11.9 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- التحصين المصرفي الرقمي: بنية حرجية معزولة في الوقت الفعلي للكشف عن الاحتيال في المعاملات عبر الإنترنت
- Translated title (French)
- Fortification de la banque numérique : une architecture forestière d'isolation en temps réel pour détecter la fraude aux transactions en ligne
- Translated title (Spanish)
- Fortificación de la banca digital: una arquitectura forestal de aislamiento en tiempo real para detectar el fraude de transacciones en línea
Identifiers
- Other
- https://openalex.org/W4396768953
- DOI
- 10.1088/2631-8695/ad4958
References
- https://openalex.org/W2954006418
- https://openalex.org/W2966531722
- https://openalex.org/W3006910127
- https://openalex.org/W3045409122
- https://openalex.org/W3086380653
- https://openalex.org/W3116069721
- https://openalex.org/W3118602810
- https://openalex.org/W3122007073
- https://openalex.org/W3123859009
- https://openalex.org/W3133885182
- https://openalex.org/W3150250798
- https://openalex.org/W3157532648
- https://openalex.org/W3194361575
- https://openalex.org/W3194471330
- https://openalex.org/W3194970640
- https://openalex.org/W4200490145
- https://openalex.org/W4206107981
- https://openalex.org/W4206769554
- https://openalex.org/W4220662529
- https://openalex.org/W4224713475
- https://openalex.org/W4226126314
- https://openalex.org/W4226183209
- https://openalex.org/W4226380481
- https://openalex.org/W4281878156
- https://openalex.org/W4283211166
- https://openalex.org/W4303648761
- https://openalex.org/W4306149608
- https://openalex.org/W4313307661
- https://openalex.org/W4315977370
- https://openalex.org/W4317233797
- https://openalex.org/W4362669616
- https://openalex.org/W4367594786
- https://openalex.org/W4367625629