IoMT-Based Association Rule Mining for the Prediction of Human Protein Complexes
- 1. University of Haripur
- 2. Information Technology University
- 3. COMSATS University Islamabad
- 4. King Saud University
- 5. Purdue University West Lafayette
Description
The inspiring increase in the Internet-enabling devices has influenced health industry due to the nature of these devices where they offer health related information swiftly. One of the prominent characteristics of these devices is to provide physicians with effective diagnosis of sensitive diseases. Internet of Medical Things (IoMT) is a means of connecting medical devices to computing nodes with the help of Internet for affording real-time communications between patients and clinicians to understand the interaction of human protein complexes. A secure and correct protein complex prediction plays an important job in perceiving the principal method of various cellular determinations and to elucidate the functionality of different un-annotated proteins. Different experimental schemes have been evolved to accomplish this task, however, these schemes have high error rates and are not efficient in terms of time, cost, privacy, and security. To tackle these limitations, numerous computational models have been developed that consider a protein complex as a dense sub-graph and utilize some basic topological properties such as density and degree statistics as a feature set for protein complex prediction. Different kinds of sub-graph structures, e.g., ring, star, linear, and hybrid have also been found in Protein-Protein Interaction Network (PPIN), therefore, more advance topological properties may be helpful to predict these structures. Moreover, the amino acid sequence of protein determines its formation, thus, the sequence information is important for predicting the interacting property among proteins in a secure way. In this study, we have computed basic as well as advance topological features by considering the interaction network of human protein complexes in the IoMT environment. In addition, biological features, i.e., discrete wavelet coefficients, length, and entropy from amino acid sequences of proteins have been computed. The supervised learning method based on association rules such as Partial Tree (PART) and Non-Nested Generalized Exemplars (NNGE) are trained to identify human protein complexes on the basis of integrated topological and biological properties. The 10-fold cross validation is exercised to measure the proposed methods. Experimental results show that association rule learners with integrated features outperform other complex mining algorithms, i.e., probabilistic Bayesian Network (BN), and Random Forest, in terms of accuracy and efficiency in addition to provide privacy.
Translated Descriptions
Translated Description (Arabic)
أثرت الزيادة الملهمة في أجهزة تمكين الإنترنت على الصناعة الصحية بسبب طبيعة هذه الأجهزة حيث تقدم المعلومات المتعلقة بالصحة بسرعة. وتتمثل إحدى الخصائص البارزة لهذه الأجهزة في تزويد الأطباء بتشخيص فعال للأمراض الحساسة. إنترنت الأشياء الطبية (IoMT) هي وسيلة لتوصيل الأجهزة الطبية بعقد الحوسبة بمساعدة الإنترنت لتوفير الاتصالات في الوقت الفعلي بين المرضى والأطباء لفهم تفاعل مجمعات البروتين البشري. يلعب التنبؤ الآمن والصحيح بمركب البروتين وظيفة مهمة في إدراك الطريقة الرئيسية لمختلف التحديدات الخلوية وتوضيح وظائف البروتينات المختلفة غير المشروحة. تم تطوير مخططات تجريبية مختلفة لإنجاز هذه المهمة، ومع ذلك، فإن هذه المخططات بها معدلات أخطاء عالية وليست فعالة من حيث الوقت والتكلفة والخصوصية والأمان. لمعالجة هذه القيود، تم تطوير العديد من النماذج الحسابية التي تعتبر مجمع البروتين بمثابة رسم بياني فرعي كثيف وتستخدم بعض الخصائص الطوبولوجية الأساسية مثل إحصائيات الكثافة والدرجة كمجموعة ميزة للتنبؤ بمجمع البروتين. كما تم العثور على أنواع مختلفة من الهياكل الفرعية، على سبيل المثال، الحلقة والنجمة والخطية والهجينة في شبكة تفاعل البروتين والبروتين (PPIN)، وبالتالي، قد تكون الخصائص الطوبولوجية الأكثر تقدمًا مفيدة للتنبؤ بهذه الهياكل. علاوة على ذلك، يحدد تسلسل الأحماض الأمينية للبروتين تكوينه، وبالتالي، فإن معلومات التسلسل مهمة للتنبؤ بخاصية التفاعل بين البروتينات بطريقة آمنة. في هذه الدراسة، قمنا بحساب السمات الطوبولوجية الأساسية والمتقدمة من خلال النظر في شبكة تفاعل مجمعات البروتين البشري في بيئة IoMT. بالإضافة إلى ذلك، تم حساب السمات البيولوجية، أي معاملات المويجات المنفصلة والطول والإنتروبيا من متواليات الأحماض الأمينية للبروتينات. يتم تدريب طريقة التعلم الخاضعة للإشراف بناءً على قواعد الارتباط مثل الشجرة الجزئية (PART) والنماذج المعممة غير المتداخلة (NNGE) على تحديد مجمعات البروتين البشري على أساس الخصائص الطوبولوجية والبيولوجية المتكاملة. يتم ممارسة التحقق المتبادل المكون من 10 أضعاف لقياس الطرق المقترحة. تظهر النتائج التجريبية أن متعلمي قواعد الارتباط مع الميزات المتكاملة يتفوقون على خوارزميات التعدين المعقدة الأخرى، أي شبكة Bayesian الاحتمالية (BN)، والغابة العشوائية، من حيث الدقة والكفاءة بالإضافة إلى توفير الخصوصية.Translated Description (French)
L'augmentation inspirante du nombre d'appareils compatibles avec Internet a influencé l'industrie de la santé en raison de la nature de ces appareils, qui offrent rapidement des informations liées à la santé. L'une des principales caractéristiques de ces dispositifs est de fournir aux médecins un diagnostic efficace des maladies sensibles. L'Internet des objets médicaux (IoMT) est un moyen de connecter des dispositifs médicaux à des nœuds informatiques à l'aide d'Internet pour permettre des communications en temps réel entre les patients et les cliniciens afin de comprendre l'interaction des complexes protéiques humains. Une prédiction sûre et correcte du complexe protéique joue un rôle important dans la perception de la principale méthode de diverses déterminations cellulaires et pour élucider la fonctionnalité de différentes protéines non annotées. Différents schémas expérimentaux ont été développés pour accomplir cette tâche, cependant, ces schémas ont des taux d'erreur élevés et ne sont pas efficaces en termes de temps, de coût, de confidentialité et de sécurité. Pour s'attaquer à ces limitations, de nombreux modèles informatiques ont été développés qui considèrent un complexe protéique comme un sous-graphe dense et utilisent certaines propriétés topologiques de base telles que les statistiques de densité et de degré comme un ensemble de caractéristiques pour la prédiction du complexe protéique. Différents types de structures sous-graphiques, par exemple, anneau, étoile, linéaire et hybride ont également été trouvés dans le réseau d'interaction protéine-protéine (PPIN), par conséquent, des propriétés topologiques plus avancées peuvent être utiles pour prédire ces structures. De plus, la séquence d'acides aminés de la protéine détermine sa formation, de sorte que l'information de séquence est importante pour prédire la propriété d'interaction entre les protéines de manière sécurisée. Dans cette étude, nous avons calculé les caractéristiques topologiques de base et avancées en considérant le réseau d'interaction des complexes protéiques humains dans l'environnement IoMT. En outre, les caractéristiques biologiques, c'est-à-dire les coefficients d'ondelettes discrets, la longueur et l'entropie des séquences d'acides aminés des protéines ont été calculées. La méthode d'apprentissage supervisé basée sur des règles d'association telles que l'arbre partiel (PART) et les exemples généralisés non imbriqués (NNGE) est formée pour identifier les complexes protéiques humains sur la base de propriétés topologiques et biologiques intégrées. La validation croisée 10 fois est exercée pour mesurer les méthodes proposées. Les résultats expérimentaux montrent que les apprenants de règles d'association dotés de fonctionnalités intégrées surpassent les autres algorithmes d'exploitation minière complexes, à savoir le réseau bayésien probabiliste (BN) et la forêt aléatoire, en termes de précision et d'efficacité, en plus de garantir la confidentialité.Translated Description (Spanish)
El aumento inspirador en los dispositivos habilitadores de Internet ha influido en la industria de la salud debido a la naturaleza de estos dispositivos, donde ofrecen rápidamente información relacionada con la salud. Una de las características destacadas de estos dispositivos es proporcionar a los médicos un diagnóstico eficaz de enfermedades sensibles. Internet of Medical Things (IoMT) es un medio para conectar dispositivos médicos a nodos informáticos con la ayuda de Internet para permitir comunicaciones en tiempo real entre pacientes y médicos para comprender la interacción de los complejos de proteínas humanas. Una predicción segura y correcta del complejo proteico juega un papel importante en la percepción del método principal de varias determinaciones celulares y para dilucidar la funcionalidad de diferentes proteínas no anotadas. Se han desarrollado diferentes esquemas experimentales para realizar esta tarea, sin embargo, estos esquemas tienen altas tasas de error y no son eficientes en términos de tiempo, costo, privacidad y seguridad. Para abordar estas limitaciones, se han desarrollado numerosos modelos computacionales que consideran un complejo proteico como un subgráfico denso y utilizan algunas propiedades topológicas básicas, como las estadísticas de densidad y grado, como un conjunto de características para la predicción de complejos proteicos. También se han encontrado diferentes tipos de estructuras subgráficas, por ejemplo, anillos, estrellas, lineales e híbridas en la Red de Interacción Proteína-Proteína (PPIN), por lo tanto, propiedades topológicas más avanzadas pueden ser útiles para predecir estas estructuras. Además, la secuencia de aminoácidos de la proteína determina su formación, por lo tanto, la información de la secuencia es importante para predecir la propiedad de interacción entre las proteínas de una manera segura. En este estudio, hemos calculado las características topológicas básicas y avanzadas al considerar la red de interacción de los complejos de proteínas humanas en el entorno IoMT. Además, se han calculado las características biológicas, es decir, los coeficientes de wavelet discretos, la longitud y la entropía de las secuencias de aminoácidos de las proteínas. El método de aprendizaje supervisado basado en reglas de asociación como árbol PARCIAL (PART) y ejemplos generalizados no anidados (NNGE) está capacitado para identificar complejos de proteínas humanas sobre la base de propiedades topológicas y biológicas integradas. La validación cruzada de 10 veces se ejerce para medir los métodos propuestos. Los resultados experimentales muestran que los estudiantes de reglas de asociación con características integradas superan a otros algoritmos de minería complejos, es decir, la red bayesiana probabilística (BN) y el bosque aleatorio, en términos de precisión y eficiencia, además de proporcionar privacidad.Files
08949468.pdf.pdf
Files
(245 Bytes)
Name | Size | Download all |
---|---|---|
md5:97a520bad35ef1c701f21deb60f8aac7
|
245 Bytes | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- قاعدة الجمعية القائمة على IoMT للتعدين للتنبؤ بمجمعات البروتين البشري
- Translated title (French)
- Association basée sur IoMT Règle d'exploitation minière pour la prédiction des complexes protéiques humains
- Translated title (Spanish)
- Minería de reglas de asociación basada en IoMT para la predicción de complejos de proteínas humanas
Identifiers
- Other
- https://openalex.org/W2997698360
- DOI
- 10.1109/access.2019.2963797
References
- https://openalex.org/W113156574
- https://openalex.org/W1186776093
- https://openalex.org/W1485582261
- https://openalex.org/W1528113134
- https://openalex.org/W1575542444
- https://openalex.org/W1670263352
- https://openalex.org/W1968842724
- https://openalex.org/W1986214964
- https://openalex.org/W1987363726
- https://openalex.org/W1990969682
- https://openalex.org/W1995868085
- https://openalex.org/W2006124679
- https://openalex.org/W2020314029
- https://openalex.org/W2034070267
- https://openalex.org/W2053979203
- https://openalex.org/W2076640061
- https://openalex.org/W2079195815
- https://openalex.org/W2082565035
- https://openalex.org/W2089367555
- https://openalex.org/W2100585269
- https://openalex.org/W2122964432
- https://openalex.org/W2136850043
- https://openalex.org/W2140280811
- https://openalex.org/W2155968618
- https://openalex.org/W2165533101
- https://openalex.org/W2191274703
- https://openalex.org/W2340970647
- https://openalex.org/W2417453071
- https://openalex.org/W2737592062
- https://openalex.org/W2765928069
- https://openalex.org/W2789538492
- https://openalex.org/W2901618220
- https://openalex.org/W2906578628
- https://openalex.org/W2925935760
- https://openalex.org/W2928842276
- https://openalex.org/W2940914837
- https://openalex.org/W2941608808
- https://openalex.org/W2946190791
- https://openalex.org/W2946466583
- https://openalex.org/W2953682518