Published February 28, 2024
| Version v1
Publication
Open
Online reinforcement learning control via discontinuous gradient
- 1. Center for Research and Advanced Studies of the National Polytechnic Institute
- 2. University of Guadalajara
- 3. University of L'Aquila
Description
Summary This work proposes a reinforcement learning control scheme for systems affected by persistent external perturbations. This scheme relies on and high‐order sliding mode control techniques combined to estimate the parameters with a certain degree of precision and simultaneously attenuate persistent and state‐dependent perturbations. The proposed solution is a novel design technique based on the minimization method via Discontinuous Gradient. The stability of the proposed scheme is proved via the Lyapunov approach.
Translated Descriptions
⚠️
This is an automatic machine translation with an accuracy of 90-95%
Translated Description (Arabic)
ملخص يقترح هذا العمل مخططًا للتحكم في التعلم المعزز للأنظمة المتأثرة بالاضطرابات الخارجية المستمرة. يعتمد هذا المخطط على تقنيات التحكم في الوضع الانزلاقي عاليةالترتيب مجتمعة لتقدير المعلمات بدرجة معينة من الدقة وتخفيف الاضطرابات المستمرة والتي تعتمد على الحالة في نفس الوقت. الحل المقترح هو تقنية تصميم جديدة تعتمد على طريقة التقليل عبر التدرج المتقطع. تم إثبات استقرار المخطط المقترح من خلال نهج ليابونوف.Translated Description (French)
Résumé Ce travail propose un schéma de contrôle de l'apprentissage par renforcement pour les systèmes affectés par des perturbations externes persistantes. Ce schéma repose sur des techniques de contrôle de mode glissant d'ordre élevé combinées pour estimer les paramètres avec un certain degré de précision et atténuer simultanément les perturbations persistantes et dépendantes de l'état. La solution proposée est une nouvelle technique de conception basée sur la méthode de minimisation via le gradient discontinu. La stabilité du schéma proposé est prouvée via l'approche Lyapunov.Translated Description (Spanish)
Resumen Este trabajo propone un esquema de control de aprendizaje de refuerzo para sistemas afectados por perturbaciones externas persistentes. Este esquema se basa en técnicas de control de modo deslizante de alto orden combinadas para estimar los parámetros con un cierto grado de precisión y atenuar simultáneamente las perturbaciones persistentes y dependientesdel estado. La solución propuesta es una novedosa técnica de diseño basada en el método de minimización vía Gradiente Discontinuo. La estabilidad del esquema propuesto se demuestra a través del enfoque de Lyapunov.Files
acs.3776.pdf
Files
(15.9 kB)
| Name | Size | Download all |
|---|---|---|
|
md5:02566b240e9c5742e15380c4a16526ae
|
15.9 kB | Preview Download |
Additional details
Additional titles
- Translated title (Arabic)
- التحكم في تعلم التعزيز عبر الإنترنت عبر التدرج المتقطع
- Translated title (French)
- Contrôle de l'apprentissage du renforcement en ligne via un gradient discontinu
- Translated title (Spanish)
- Control de aprendizaje de refuerzo en línea a través de gradiente discontinuo
Identifiers
- Other
- https://openalex.org/W4392238339
- DOI
- 10.1002/acs.3776
References
- https://openalex.org/W1491077795
- https://openalex.org/W1513689897
- https://openalex.org/W2045689494
- https://openalex.org/W2047135059
- https://openalex.org/W2070438142
- https://openalex.org/W2090167557
- https://openalex.org/W2096981291
- https://openalex.org/W2111433907
- https://openalex.org/W2113766349
- https://openalex.org/W2147509894
- https://openalex.org/W2154892481
- https://openalex.org/W2208608249
- https://openalex.org/W2550998531
- https://openalex.org/W2800330509
- https://openalex.org/W2803165867
- https://openalex.org/W2888569956
- https://openalex.org/W2897371651
- https://openalex.org/W2897661175
- https://openalex.org/W2922264785
- https://openalex.org/W2924713772
- https://openalex.org/W2981856456
- https://openalex.org/W2986411846
- https://openalex.org/W3120162682
- https://openalex.org/W3124444594
- https://openalex.org/W3171884604
- https://openalex.org/W3210234741
- https://openalex.org/W4206299066
- https://openalex.org/W4281550209
- https://openalex.org/W4292872153
- https://openalex.org/W4313657014
- https://openalex.org/W4383224381
- https://openalex.org/W4383370918
- https://openalex.org/W4386225111