Published March 15, 2023 | Version v1
Publication

Improved angelization technique against background knowledge attack for 1:M microdata

  • 1. COMSATS University Islamabad
  • 2. University of Engineering and Technology Lahore
  • 3. Quaid-i-Azam University
  • 4. University of Derby
  • 5. TU Wien

Description

With the advent of modern information systems, sharing Electronic Health Records (EHRs) with different organizations for better medical treatment, and analysis is beneficial for both academic as well as for business development. However, an individual's personal privacy is a big concern because of the trust issue across organizations. At the same time, the utility of the shared data that is required for its favorable use is also important. Studies show that plenty of conventional work is available where an individual has only one record in a dataset (1:1 dataset), which is not the case in many applications. In a more realistic form, an individual may have more than one record in a dataset (1:M). In this article, we highlight the high utility loss and inapplicability for the 1:M dataset of the θ-Sensitive k-Anonymity privacy model. The high utility loss and low data privacy of (p, l)-angelization, and (k, l)-diversity for the 1:M dataset. As a mitigation solution, we propose an improved (θ∗, k)-utility algorithm to preserve enhanced privacy and utility of the anonymized 1:M dataset. Experiments on the real-world dataset reveal that the proposed approach outperforms its counterpart, in terms of utility and privacy for the 1:M dataset.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

مع ظهور أنظمة المعلومات الحديثة، فإن مشاركة السجلات الصحية الإلكترونية (EHRs) مع منظمات مختلفة للحصول على علاج طبي أفضل، والتحليل مفيد لكل من التطوير الأكاديمي وكذلك لتطوير الأعمال. ومع ذلك، فإن الخصوصية الشخصية للفرد تشكل مصدر قلق كبير بسبب مشكلة الثقة عبر المؤسسات. في الوقت نفسه، تعد فائدة البيانات المشتركة المطلوبة لاستخدامها المواتي مهمة أيضًا. تشير الدراسات إلى أن الكثير من العمل التقليدي متاح حيث يكون لدى الفرد سجل واحد فقط في مجموعة البيانات (مجموعة بيانات 1:1)، وهذا ليس هو الحال في العديد من التطبيقات. في شكل أكثر واقعية، قد يكون لدى الفرد أكثر من سجل واحد في مجموعة البيانات (1:M). في هذه المقالة، نسلط الضوء على خسارة المرافق العالية وعدم قابلية التطبيق لمجموعة بيانات 1:M لنموذج خصوصية θ - Sensitive k - Anonymity. ارتفاع خسارة المرافق وانخفاض خصوصية البيانات لـ (p, l) - angelization، و (k, l)- diversity لمجموعة بيانات 1:M. كحل للتخفيف، نقترح خوارزمية فائدة محسنة (θ∗، k) للحفاظ على الخصوصية المحسنة وفائدة مجموعة بيانات 1:M مجهولة المصدر. تكشف التجارب على مجموعة البيانات في العالم الحقيقي أن النهج المقترح يتفوق على نظيره، من حيث المنفعة والخصوصية لمجموعة البيانات 1:M.

Translated Description (French)

Avec l'avènement des systèmes d'information modernes, le partage des dossiers de santé électroniques (DSE) avec différentes organisations pour un meilleur traitement médical et une meilleure analyse est bénéfique à la fois pour le développement académique et commercial. Cependant, la vie privée d'un individu est une grande préoccupation en raison du problème de confiance dans les organisations. Dans le même temps, l'utilité des données partagées nécessaires à leur utilisation favorable est également importante. Des études montrent que de nombreux travaux conventionnels sont disponibles lorsqu'un individu n'a qu'un seul enregistrement dans un ensemble de données (ensemble de données 1:1), ce qui n'est pas le cas dans de nombreuses applications. Dans une forme plus réaliste, un individu peut avoir plus d'un enregistrement dans un ensemble de données (1 :M). Dans cet article, nous soulignons la perte d'utilité élevée et l'inapplicabilité de l'ensemble de données 1 :M du modèle de confidentialité θ-Sensitive k-Anonymity. La perte élevée de services publics et la faible confidentialité des données de (p, l) -angélisation et (k, l)-diversité pour l'ensemble de données 1 :M. Comme solution d'atténuation, nous proposons un algorithme d'utilité (θ∗, k) amélioré pour préserver la confidentialité et l'utilité améliorées de l'ensemble de données 1 :M anonymisé. Les expériences sur l'ensemble de données du monde réel révèlent que l'approche proposée surpasse son homologue, en termes d'utilité et de confidentialité pour l'ensemble de données 1 :M.

Translated Description (Spanish)

Con el advenimiento de los sistemas de información modernos, compartir registros electrónicos de salud (EHR) con diferentes organizaciones para un mejor tratamiento médico y análisis es beneficioso tanto para el desarrollo académico como para el empresarial. Sin embargo, la privacidad personal de una persona es una gran preocupación debido al problema de confianza en todas las organizaciones. Al mismo tiempo, también es importante la utilidad de los datos compartidos que se requieren para su uso favorable. Los estudios muestran que hay mucho trabajo convencional disponible cuando un individuo tiene solo un registro en un conjunto de datos (conjunto de datos 1:1), lo que no es el caso en muchas aplicaciones. En una forma más realista, un individuo puede tener más de un registro en un conjunto de datos (1:M). En este artículo, destacamos la alta pérdida de utilidad y la inaplicabilidad para el conjunto de datos 1:M del modelo de privacidad θ-Sensitive k-Anonymity. La alta pérdida de utilidad y la baja privacidad de los datos de (p, l) -angelización y (k, l)-diversidad para el conjunto de datos 1:M. Como solución de mitigación, proponemos un algoritmo de utilidad (θ∗, k) mejorado para preservar la privacidad y la utilidad mejoradas del conjunto de datos 1:M anonimizado. Los experimentos sobre el conjunto de datos del mundo real revelan que el enfoque propuesto supera a su contraparte, en términos de utilidad y privacidad para el conjunto de datos 1:M.

Additional details

Additional titles

Translated title (Arabic)
تقنية تحسين الملائكة ضد هجوم المعرفة الخلفية للبيانات الجزئية 1:M
Translated title (French)
Technique d'angélisation améliorée contre l'attaque des connaissances de base pour les microdonnées 1 :M
Translated title (Spanish)
Técnica de angelización mejorada contra el ataque de conocimiento de fondo para microdatos 1:M

Identifiers

Other
https://openalex.org/W4324380501
DOI
10.7717/peerj-cs.1255

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Pakistan

References

  • https://openalex.org/W1841317170
  • https://openalex.org/W2064483023
  • https://openalex.org/W2107927452
  • https://openalex.org/W2534045157
  • https://openalex.org/W2558161036
  • https://openalex.org/W2600375446
  • https://openalex.org/W2612364690
  • https://openalex.org/W2759979881
  • https://openalex.org/W2762560599
  • https://openalex.org/W2794918741
  • https://openalex.org/W2801103464
  • https://openalex.org/W2803918988
  • https://openalex.org/W2809875315
  • https://openalex.org/W2898288652
  • https://openalex.org/W2902377290
  • https://openalex.org/W2905538404
  • https://openalex.org/W2913066864
  • https://openalex.org/W2921455460
  • https://openalex.org/W2935711763
  • https://openalex.org/W2946984295
  • https://openalex.org/W2949150939
  • https://openalex.org/W2956571997
  • https://openalex.org/W2978648093
  • https://openalex.org/W2997890878
  • https://openalex.org/W3020527512
  • https://openalex.org/W3028537074
  • https://openalex.org/W3080460547
  • https://openalex.org/W3094042882
  • https://openalex.org/W3095364169
  • https://openalex.org/W3109247823
  • https://openalex.org/W3129268705
  • https://openalex.org/W3159905602
  • https://openalex.org/W3180608480
  • https://openalex.org/W4206285147
  • https://openalex.org/W4206439955
  • https://openalex.org/W4224010661
  • https://openalex.org/W4226373905
  • https://openalex.org/W4283791169
  • https://openalex.org/W4285230897
  • https://openalex.org/W4285592345