Published February 28, 2024 | Version v1
Publication Open

Online reinforcement learning control via discontinuous gradient

  • 1. Center for Research and Advanced Studies of the National Polytechnic Institute
  • 2. University of Guadalajara
  • 3. University of L'Aquila

Description

Summary This work proposes a reinforcement learning control scheme for systems affected by persistent external perturbations. This scheme relies on and high‐order sliding mode control techniques combined to estimate the parameters with a certain degree of precision and simultaneously attenuate persistent and state‐dependent perturbations. The proposed solution is a novel design technique based on the minimization method via Discontinuous Gradient. The stability of the proposed scheme is proved via the Lyapunov approach.

⚠️ This is an automatic machine translation with an accuracy of 90-95%

Translated Description (Arabic)

ملخص يقترح هذا العمل مخططًا للتحكم في التعلم المعزز للأنظمة المتأثرة بالاضطرابات الخارجية المستمرة. يعتمد هذا المخطط على تقنيات التحكم في الوضع الانزلاقي عاليةالترتيب مجتمعة لتقدير المعلمات بدرجة معينة من الدقة وتخفيف الاضطرابات المستمرة والتي تعتمد على الحالة في نفس الوقت. الحل المقترح هو تقنية تصميم جديدة تعتمد على طريقة التقليل عبر التدرج المتقطع. تم إثبات استقرار المخطط المقترح من خلال نهج ليابونوف.

Translated Description (French)

Résumé Ce travail propose un schéma de contrôle de l'apprentissage par renforcement pour les systèmes affectés par des perturbations externes persistantes. Ce schéma repose sur des techniques de contrôle de mode glissant d'ordre élevé combinées pour estimer les paramètres avec un certain degré de précision et atténuer simultanément les perturbations persistantes et dépendantes de l'état. La solution proposée est une nouvelle technique de conception basée sur la méthode de minimisation via le gradient discontinu. La stabilité du schéma proposé est prouvée via l'approche Lyapunov.

Translated Description (Spanish)

Resumen Este trabajo propone un esquema de control de aprendizaje de refuerzo para sistemas afectados por perturbaciones externas persistentes. Este esquema se basa en técnicas de control de modo deslizante de alto orden combinadas para estimar los parámetros con un cierto grado de precisión y atenuar simultáneamente las perturbaciones persistentes y dependientesdel estado. La solución propuesta es una novedosa técnica de diseño basada en el método de minimización vía Gradiente Discontinuo. La estabilidad del esquema propuesto se demuestra a través del enfoque de Lyapunov.

Files

acs.3776.pdf

Files (15.9 kB)

⚠️ Please wait a few minutes before your translated files are ready ⚠️ Note: Some files might be protected thus translations might not work.
Name Size Download all
md5:02566b240e9c5742e15380c4a16526ae
15.9 kB
Preview Download

Additional details

Additional titles

Translated title (Arabic)
التحكم في تعلم التعزيز عبر الإنترنت عبر التدرج المتقطع
Translated title (French)
Contrôle de l'apprentissage du renforcement en ligne via un gradient discontinu
Translated title (Spanish)
Control de aprendizaje de refuerzo en línea a través de gradiente discontinuo

Identifiers

Other
https://openalex.org/W4392238339
DOI
10.1002/acs.3776

GreSIS Basics Section

Is Global South Knowledge
Yes
Country
Mexico

References

  • https://openalex.org/W1491077795
  • https://openalex.org/W1513689897
  • https://openalex.org/W2045689494
  • https://openalex.org/W2047135059
  • https://openalex.org/W2070438142
  • https://openalex.org/W2090167557
  • https://openalex.org/W2096981291
  • https://openalex.org/W2111433907
  • https://openalex.org/W2113766349
  • https://openalex.org/W2147509894
  • https://openalex.org/W2154892481
  • https://openalex.org/W2208608249
  • https://openalex.org/W2550998531
  • https://openalex.org/W2800330509
  • https://openalex.org/W2803165867
  • https://openalex.org/W2888569956
  • https://openalex.org/W2897371651
  • https://openalex.org/W2897661175
  • https://openalex.org/W2922264785
  • https://openalex.org/W2924713772
  • https://openalex.org/W2981856456
  • https://openalex.org/W2986411846
  • https://openalex.org/W3120162682
  • https://openalex.org/W3124444594
  • https://openalex.org/W3171884604
  • https://openalex.org/W3210234741
  • https://openalex.org/W4206299066
  • https://openalex.org/W4281550209
  • https://openalex.org/W4292872153
  • https://openalex.org/W4313657014
  • https://openalex.org/W4383224381
  • https://openalex.org/W4383370918
  • https://openalex.org/W4386225111