Published January 1, 2022 | Version v1
Publication Open

High-Throughput Discovery of Chemical Structure-Polarity Relationships Combining Automation and Machine Learning Techniques

  • 1. King University
  • 2. Materials Science & Engineering
  • 3. Peking University
  • 4. Eastern Institute of Technology
  • 5. University of California, Santa Barbara
  • 6. University of Toledo
  • 7. WuXi AppTec (China)
  • 8. Southern University of Science and Technology

Description

As an essential attribute of organic compounds, polarity has a profound influence on many molecular properties such as solubility and phase transition temperature. Thin layer chromatography (TLC) represents a commonly used technique for polarity measurement. However, current TLC analysis presents several problems, including the need for a large number of attempts to obtain suitable conditions, as well as irreproducibility due to non-standardization. Herein, we describe an automated experiment system for TLC analysis. This system is designed to conduct TLC analysis automatically, facilitating high-throughput experimentation by collecting large experimental datasets under standardized conditions. Using these datasets, machine learning (ML) methods are employed to construct surrogate models correlating organic compounds' structures and their polarity using retardation factor (Rf). The trained ML models are

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

كخاصية أساسية للمركبات العضوية، يكون للقطبية تأثير عميق على العديد من الخصائص الجزيئية مثل الذوبان ودرجة حرارة انتقال الطور. يمثل استشراب الطبقة الرقيقة تقنية شائعة الاستخدام لقياس القطبية. ومع ذلك، فإن التحليل الحالي لدائرة تعليم المعلم يطرح العديد من المشاكل، بما في ذلك الحاجة إلى عدد كبير من المحاولات للحصول على ظروف مناسبة، وكذلك عدم القدرة على الإنتاج بسبب عدم التوحيد القياسي. هنا، نصف نظامًا تجريبيًا آليًا لتحليل دائرة تعلم المعلم. تم تصميم هذا النظام لإجراء تحليل دائرة تعلم المعلم تلقائيًا، مما يسهل إجراء التجارب عالية الإنتاجية من خلال جمع مجموعات بيانات تجريبية كبيرة في ظل ظروف موحدة. باستخدام مجموعات البيانات هذه، يتم استخدام طرق التعلم الآلي (ML) لبناء نماذج بديلة تربط بين هياكل المركبات العضوية وقطبيتها باستخدام عامل التخلف (Rf). نماذج تعلم الآلة المدربة هي

Translated Description (French)

En tant qu'attribut essentiel des composés organiques, la polarité a une influence profonde sur de nombreuses propriétés moléculaires telles que la solubilité et la température de transition de phase. La chromatographie sur couche mince (CCM) représente une technique couramment utilisée pour la mesure de la polarité. Cependant, l'analyse TLC actuelle présente plusieurs problèmes, notamment la nécessité d'un grand nombre de tentatives pour obtenir des conditions appropriées, ainsi que l'irréprochabilité due à la non-standardisation. Ici, nous décrivons un système d'expérience automatisé pour l'analyse TLC. Ce système est conçu pour effectuer une analyse TLC automatiquement, facilitant l'expérimentation à haut débit en collectant de grands ensembles de données expérimentales dans des conditions standardisées. À l'aide de ces ensembles de données, des méthodes d'apprentissage automatique (ML) sont utilisées pour construire des modèles de substitution corrélant les structures des composés organiques et leur polarité à l'aide du facteur de retard (Rf). Les modèles ML formés sont

Translated Description (Spanish)

Como atributo esencial de los compuestos orgánicos, la polaridad tiene una profunda influencia en muchas propiedades moleculares, como la solubilidad y la temperatura de transición de fase. La cromatografía en capa fina (TLC) representa una técnica comúnmente utilizada para la medición de la polaridad. Sin embargo, el análisis actual de TLC presenta varios problemas, incluida la necesidad de un gran número de intentos para obtener condiciones adecuadas, así como la irreproducibilidad debido a la no estandarización. En este documento, describimos un sistema de experimento automatizado para el análisis de TLC. Este sistema está diseñado para realizar análisis de TLC automáticamente, facilitando la experimentación de alto rendimiento mediante la recopilación de grandes conjuntos de datos experimentales en condiciones estandarizadas. Utilizando estos conjuntos de datos, se emplean métodos de aprendizaje automático (ML) para construir modelos sustitutos que correlacionan las estructuras de los compuestos orgánicos y su polaridad utilizando el factor de retardo (Rf). Los modelos de ML entrenados son

Files

latest.pdf.pdf

Files (2.3 MB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:f0a5351c66d24c9d3ca8a387bcc25286
2.3 MB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
اكتشاف عالي الإنتاجية لعلاقات التركيب الكيميائي والقطبية التي تجمع بين الأتمتة وتقنيات التعلم الآلي
Translated title (French)
Découverte à haut débit des relations structure chimique-polarité combinant des techniques d'automatisation et d'apprentissage automatique
Translated title (Spanish)
Descubrimiento de alto rendimiento de las relaciones estructura química-polaridad que combinan técnicas de automatización y aprendizaje automático

Identifiers

Other
https://openalex.org/W4285269375
DOI
10.2139/ssrn.4117929

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
China

References

  • https://openalex.org/W1498722223
  • https://openalex.org/W1975147762
  • https://openalex.org/W2200017991
  • https://openalex.org/W2785942661
  • https://openalex.org/W2830440988
  • https://openalex.org/W2902762889
  • https://openalex.org/W3010185406
  • https://openalex.org/W3042021489
  • https://openalex.org/W3128474010
  • https://openalex.org/W3206212437
  • https://openalex.org/W4200371263
  • https://openalex.org/W4239450530
  • https://openalex.org/W4246447715
  • https://openalex.org/W4251667818
  • https://openalex.org/W4298074858