Gestión segura de la batería de EVs utilizando aprendizaje por refuerzo
- 1. Centro Científico Tecnológico - San Luis
- 2. Consejo Nacional de Investigaciones Científicas y Técnicas
- 3. Universidad Nacional del Centro de la Provincia de Buenos Aires
Description
Las baterías de iones de litio son el dispositivo de alimentación estándar de los vehículos eléctricos (EVs) como alternativa de elección para reducir las emisiones de CO2. Pero antes de convertirse en una tecnología fiable, las baterías de iones de litio deben hacer frente a dos grandes retos: las reacciones electroquímicas indeseables debidas a tasas de carga excesivas y el tiempo considerable que tarda un EV en cargarse. Por tanto, es necesario emplear perfiles de corriente equilibrados que eviten tanto los graves efectos de degradación de la batería como las molestias a los usuarios finales. En este trabajo, los autores proponen un enfoque de aprendizaje profundo por refuerzo de exploración segura (SDRL) para determinar los perfiles de carga óptimos en condiciones de funcionamiento variables. Una de las principales ventajas de las técnicas de RL es que pueden aprender de la interacción con el sistema simulado o real incorporando la no linealidad y la incertidumbre derivadas de las condiciones ambientales fluctuantes. Sin embargo, como las técnicas RL tienen que explorar estados indeseables antes de obtener una política óptima, no ofrecen garantías de seguridad. El enfoque propuesto pretende mantener cero violaciones de las restricciones a lo largo de todo el proceso de aprendizaje incorporando una capa de seguridad que corrige la acción si es probable que se viole una restricción. El método propuesto se prueba en el circuito equivalente de una batería de iones de litio considerando condiciones de variabilidad. Los primeros resultados muestran que SDRL es capaz de encontrar políticas de carga optimizadas y seguras teniendo en cuenta un compromiso entre la velocidad de carga y la vida útil de la batería.
Translated Descriptions
Translated Description (Arabic)
بطاريات الليثيوم أيون هي جهاز إمداد الطاقة القياسي للمركبات الكهربائية (EVs) كبديل مفضل لتقليل انبعاثات ثاني أكسيد الكربون. ولكن قبل أن تصبح تقنية موثوقة، يجب أن تواجه بطاريات الليثيوم أيون تحديين رئيسيين: التفاعلات الكهروكيميائية غير المرغوب فيها بسبب معدلات الشحن المفرطة والوقت الطويل الذي تستغرقه السيارة الكهربائية للشحن. لذلك، من الضروري استخدام ملفات تعريف التيار المتوازن التي تتجنب الآثار الخطيرة لتدهور البطارية وعدم الراحة للمستخدمين النهائيين. في هذه الورقة، يقترح المؤلفون نهجًا للتعلم العميق لتعزيز المسح الآمن (SDRL) لتحديد ملفات التحميل المثلى في ظل ظروف تشغيل مختلفة. تتمثل إحدى المزايا الرئيسية لتقنيات RL في أنها يمكن أن تتعلم من التفاعل مع النظام المحاكي أو الحقيقي من خلال دمج عدم الخطية وعدم اليقين المستمدين من الظروف البيئية المتقلبة. ومع ذلك، نظرًا لأن تقنيات RL يجب أن تستكشف الحالات غير المرغوب فيها قبل الحصول على سياسة مثالية، فإنها لا تقدم ضمانات أمنية. يهدف النهج المقترح إلى الحفاظ على عدم حدوث انتهاكات للقيود طوال عملية التعلم من خلال دمج طبقة من الأمان تصحح الإجراء إذا كان من المحتمل انتهاك التقييد. يتم اختبار الطريقة المقترحة في الدائرة المكافئة لبطارية ليثيوم أيون مع مراعاة ظروف التباين. تظهر النتائج المبكرة أن SDRL قادرة على العثور على سياسات شحن محسنة وآمنة مع الأخذ في الاعتبار حل وسط بين سرعة الشحن وعمر البطارية.Translated Description (English)
Lithium-ion batteries are the standard power device of electric vehicles (EVs) as an alternative of choice to reduce CO2 emissions. But before becoming a reliable technology, lithium-ion batteries must face two major challenges: undesirable electrochemical reactions due to excessive charging rates and the considerable time it takes for an EV to charge. Therefore, it is necessary to use balanced current profiles that avoid both the serious effects of battery degradation and discomfort to end users. In this paper, the authors propose a safe scan reinforcement deep learning (SDRL) approach to determine optimal load profiles under varying operating conditions. One of the main advantages of RL techniques is that they can learn from the interaction with the simulated or real system by incorporating the non-linearity and uncertainty derived from fluctuating environmental conditions. However, as RL techniques have to explore undesirable states before obtaining an optimal policy, they do not offer security guarantees. The proposed approach aims to maintain zero violations of restrictions throughout the learning process by incorporating a layer of security that corrects the action if a restriction is likely to be violated. The proposed method is tested in the equivalent circuit of a lithium-ion battery considering variability conditions. Early results show that SDRL is able to find optimized and safe charging policies considering a compromise between charging speed and battery life.Translated Description (French)
Les batteries lithium-ion sont le dispositif d'alimentation standard des véhicules électriques (EV) comme alternative de choix pour réduire les émissions de CO2. Mais avant de devenir une technologie fiable, les batteries lithium-ion doivent faire face à deux grands défis : les réactions électrochimiques indésirables dues à des taux de charge excessifs et le temps considérable qu'il faut à un véhicule électrique pour se charger. Par conséquent, il est nécessaire d'utiliser des profils de courant équilibrés qui évitent à la fois les effets graves de dégradation de la batterie et les inconvénients pour les utilisateurs finaux. Dans ce travail, les auteurs proposent une approche d'apprentissage profond par renforcement de balayage sécurisé (SDRL) pour déterminer les profils de charge optimaux dans des conditions de fonctionnement variables. L'un des principaux avantages des techniques de RL est qu'elles peuvent apprendre de l'interaction avec le système simulé ou réel en incorporant la non-linéarité et l'incertitude dérivées des conditions environnementales fluctuantes. Cependant, comme les techniques RL doivent explorer des états indésirables avant d'obtenir une politique optimale, elles n'offrent aucune garantie de sécurité. L'approche proposée vise à maintenir zéro violation des restrictions tout au long du processus d'apprentissage en intégrant une couche de sécurité qui corrige l'action si une restriction est susceptible d'être violée. La méthode proposée est testée dans le circuit équivalent d'une batterie lithium-ion en tenant compte des conditions de variabilité. Les premiers résultats montrent que SDRL est capable de trouver des politiques de charge optimisées et sécurisées en tenant compte d'un compromis entre la vitesse de charge et la durée de vie de la batterie.Additional details
Additional titles
- Translated title (Arabic)
- إدارة آمنة لبطارية السيارة الكهربائية باستخدام التعلم المعزز
- Translated title (English)
- Safe EV battery management using reinforcement learning
- Translated title (French)
- Gestion sécurisée de la batterie des EV à l'aide de l'apprentissage par renforcement
Identifiers
- Other
- https://openalex.org/W4391133579
- DOI
- 10.30973/progmat/2024.16.1/4
References
- https://openalex.org/W2000018540
- https://openalex.org/W2074242433
- https://openalex.org/W2092070368
- https://openalex.org/W2095027161
- https://openalex.org/W2112461322
- https://openalex.org/W2593630474
- https://openalex.org/W2610930014
- https://openalex.org/W2784465508
- https://openalex.org/W2918157085
- https://openalex.org/W2966735560
- https://openalex.org/W3005355833
- https://openalex.org/W3024782198
- https://openalex.org/W3033203158
- https://openalex.org/W3090539002
- https://openalex.org/W3103182070