Automatic control for unmanned ground vehicles

llistat de metadades

Autor/a

Yang, Ruicong

Director/a

Puig Cayuela, Vicenç

Codirector/a

Bernat Masó, Ernest

Fecha de defensa

2025-04-22

Páginas

147 p.



Departamento/Instituto

Universitat Politècnica de Catalunya. Institut d'Organització i Control de Sistemes Industrials

Programa de doctorado

DOCTORAT EN AUTOMÀTICA, ROBÒTICA I VISIÓ (Pla 2013)

Resumen

(English) This thesis explores advanced control strategies for trajectory tracking, state feedback, disturbance mitigation, and autonomous vehicle guidance across a range of dynamic systems. The research is divided into distinct methodologies and applications, including Takagi-Sugeno-Lipschitz (TSL) systems, linear parameter-varying (LPV) systems, and linear time-invariant (LTI) systems, as well as an unmanned ground vehicle (UGV) with limited sensor input for path-following. The techniques developed provide insight into improving performance, robustness, and control adaptability under varying system conditions and constraints. Firstly, a trajectory tracking technique for TSL systems is developed. To address cases where the full state vector is unavailable, a proportional observer is integrated into the control design, enabling estimate-feedback control instead of state-feedback. Both the observer and controller gains are derived using a Lyapunov-based quadratic boundedness criterion to enhance robustness against unknown external disturbances. This design ensures convergence within ellipsoidal error bounds through linear matrix inequality (LMI) formulations. Simulation results validate the robustness and tracking capabilities of the approach. Secondly, a state-feedback controller for LPV systems is introduced, focusing on pole clustering within multiple DR-regions. Utilizing partial pole placement, the design is formulated as LMIs, enabling efficient solution via standard solvers. Additionally, this method supports a shifting approach, allowing real-time modification of closed-loop pole locations based on parameter variations. This adaptability enhances system performance across different operating conditions. Simulations highlight the effectiveness of this approach in achieving desired pole placements. Furthermore, a state-feedback controller design is presented for LTI systems with disturbances, aiming for partial pole clustering within specific DR-regions using an H-infinity control strategy. The proposed approach leverages LMIs derived from a partial pole clustering theorem to ensure robust performance. The H-infinity technique further mitigates disturbances, enhancing system stability. Simulation results on a benchmark model demonstrate the controller's effectiveness in maintaining performance amidst uncertainties. Finally, a fuzzy logic controller is designed for guiding an autonomous UGV equipped with three magnetic sensors for detecting ground markers. The fuzzy controller, based on linguistic rules derived from sensor data, provides smoother vehicle guidance with reduced oscillations compared to a rule-based baseline. Simulation results show the fuzzy controller achieving a lower mean square error (MSE) versus the rule-based controller, demonstrating improved accuracy and stability. On the other hand, the reinforcement learning (RL) methods for the same three-sensor vehicle system are designed. These RL-based controllers are developed to interpret sensor data and make steering decisions for autonomous navigation. The discrete nature of sensor signals provides a unique challenge, with SARSA handling discrete actions and DDPG utilizing continuous actions. Comparative analysis with rule-based and fuzzy controllers highlights the advantages and limitations of each approach. Notably, the DDPG agent, trained to handle continuous actions, outperforms SARSA and rule-based strategies but shows a performance gap compared to the fuzzy controller in certain scenarios. Experimental validation demonstrates the potential of RL techniques for autonomous navigation in sensor-limited systems, establishing a foundation for further exploration in this field.


(Català) Aquesta tesi explora estratègies de control avançades per al seguiment de trajectòries, el control d'estat, la mitigació de pertorbacions i la guia de vehicles autònoms en una àmplia varietat de sistemes dinàmics. La recerca es divideix en metodologies i aplicacions distintes, incloent-hi sistemes Takagi-Sugeno-Lipschitz (TSL), sistemes lineals amb paràmetres variables (LPV), i sistemes lineals invariants en el temps (LTI), així com un vehicle terrestre no tripulat (UGV) amb una entrada de sensors limitada per al seguiment de trajectòries. Les tècniques desenvolupades proporcionen informació valuosa per millorar el rendiment, la robustesa i l'adaptabilitat del control sota diverses condicions del sistema i restriccions. Respecte al seguiment de trajectòries per a sistemes TSL, s’aborden els casos en què el vector d'estat complet no està disponible integrant un observador proporcional en el disseny de control. Això permet la retroalimentació d'estimació enlloc de la retroalimentació d'estat. Els guanys tant de l'observador com del controlador s'obtenen mitjançant un criteri de cota quadràtica basat en Lyapunov per millorar la robustesa davant pertorbacions externes desconegudes. Així, s’assegura la convergència dins de límits el·lipsoïdals d'error mitjançant formulacions de desigualtats matricials lineals (LMI). Els resultats de simulació validen la robustesa i les capacitats de seguiment de l'enfocament. En segon lloc, s'introdueix un nou controlador de retroalimentació d'estat per a sistemes LPV, enfocat a l'aglomeració de pols dins de múltiples DR-regions. Utilitzant teoremes de col·locació parcial de pols, el disseny es formula com a LMI, la qual cosa permet una solució eficient. A més, es permet la modifcació en temps real de les ubicacions dels pols de llaç tancat en funció de les variacions dels paràmetres, millorant el rendiment del sistema en diverses condicions d'operació. Les simulacions mostren l'efectivitat d'aquest enfocament per aconseguir les col·locacions de pols desitjades. A més, es presenta un disseny de controlador de retroalimentació d'estat per a sistemes LTI amb pertorbacions, amb l'objectiu d'aconseguir una aglomeració parcial de pols dins de regions DR específiques utilitzant una estratègia de control H∞. La tècnica H∞ mitiga addicionalment les pertorbacions, millorant i els resultats de simulació demostren la capacitat per mantenir el rendiment davant d'incerteses. Finalment, es dissenya un controlador de lògica difusa per guiar un UGV autònom equipat únicament amb sensors limitats. El controlador difús, basat en regles lingüístiques derivades de les dades dels sensors, proporciona una guia amb menys oscil·lacions i un error quadràtic mitjà (MSE) més baix que el controlador de referència basat en regles, demostrant una major precisió i estabilitat. D'altra banda, s’estudia l’aprenentatge per reforç (RL), específicament agents SARSA i DDPG, per al mateix sistema de vehicle i sensors. La naturalesa discreta dels senyals dels sensors representa una novetat, amb SARSA gestionant accions discretes i DDPG utilitzant accions contínues. Comparant els controladors basats en regles i els controladors difusos, es destaquen els avantatges i limitacions de cada enfocament: l'agent DDPG, entrenat per manejar accions contínues, supera les estratègies SARSA i basades en regles però mostra un menor rendiment respecte al controlador difús en determinats escenaris. La validació experimental demostra el potencial de les tècniques de RL per a la navegació autònoma en sistemes amb sensors limitats, establint una base per a futures exploracions en aquest camp. En conjunt, aquesta tesi avança en la comprensió de diverses metodologies de control per a sistemes dinàmics complexos, especialment en la guia de vehicles autònoms. Els coneixements adquirits ofereixen orientació valuosa per al desenvolupament de sistemes de control robustos i adaptables, obrint el camí a futures innovacions en estratègies de control autònom.


(Español) Esta tesis explora estrategias de control avanzadas para el seguimiento de trayectorias,el control de estado, la mitigación de perturbaciones y la guía de vehículos autónomos en una amplia variedad de sistemas dinámicos. La investigación se divide en metodologías y aplicaciones distintas, incluyendo sistemas Takagi-Sugeno-Lipschitz (TSL), sistemas lineales conparámetros variables (LPV), y sistemas lineales invariantes en el tiempo (LTI), así como unvehículo terrestre no tripulado (UGV) con una entrada de sensores limitada para el seguimiento de trayectorias. Las técnicas desarrolladas proporcionan información valiosa para mejorar el rendimiento, la robustez y la adaptabilidad del control bajo diversas condiciones del sistema y restricciones. Respecto al seguimiento de trayectorias para sistemas TSL, se abordan los casos en los que el vector de estado completo no está disponible integrando un observador proporcional en el diseño de control. Esto permite la retroalimentación de estimación en lugar de la retroalimentación de estado. Las ganancias tanto del observador como del controlador se obtienen mediante un criterio de cota cuadrática basado en Lyapunov para mejorar la robustez frente a perturbaciones externas desconocidas. Así, se asegura la convergencia dentro de límites elipsoidales de error mediante formulaciones de desigualdades matriciales lineales (LMI). Los resultados de simulación validan la robustez y capacidades de seguimiento del enfoque. En segundo lugar, se introduce un nuevo controlador de retroalimentación de estado para sistemas LPV, enfocado a la aglomeración de pulso dentro de múltiples DR-regiones. Utilizando teoremas de colocación parcial de polvo, el diseño se formula como LMI, lo que permite una solución eficiente. Además, se permite la modificación en tiempo real de las ubicaciones de los polos de lazo cerrado en función de las variaciones de los parámetros, mejorando el rendimiento del sistema en diversas condiciones de operación. Las simulaciones muestran la efectividad de este enfoque para conseguir las colocaciones de polvo deseadas. Además, se presenta un diseño de controlador de retroalimentación de estado para sistemas LTI con perturbaciones, con el objetivo de conseguir una colocación parcial de polos dentro de regiones DR específicas utilizando una estrategia de control H∞. La técnica H∞ mitiga adicionalmente las perturbaciones, mejorando y los resultados de simulación demuestran la capacidad para mantener el rendimiento frente a incertidumbres. Por último, se diseña un controlador de lógica difusa para guiar a un UGV autónomo equipado únicamente con sensores limitados. El controlador difuso, basado en reglas lingüísticas derivadas de los datos de los sensores, proporciona una guía con menos oscilaciones y un error cuadrático medio (MSE) menor que el controlador de referencia basado en reglas, demostrando una mayor precisión y estabilidad. Por otra parte, se estudia el aprendizaje por refuerzo (RL), específicamente agentes SARSA y DDPG, para el propio sistema de vehículo y sensores. La naturaleza discreta de las señales de los sensores representa una novedad, con SARSA gestionando acciones discretas y DDPG utilizando acciones continuas. Comparando los controladores basados ​​en reglas y los controladores difusos, se destacan las ventajas y limitaciones de cada enfoque: el agente DDPG,entrenado para manejar acciones continuas, supera las estrategias SARSA y basadas en reglas pero muestra un menor rendimiento respecto al controlador difuso en determinados escenarios. La validación experimental demuestra el potencial de las técnicas de RL para la navegación autónoma en sistemas con sensores limitados, estableciendo una base para futuras exploraciones en ese campo.

Materias

004 - Informàtica; 68 - Industrias, oficios y comercio de artículos acabados. Tecnología cibernética y automática; 629 - Enginyeria dels vehicles de transport

Citación recomendada

Documentos

Llistat documents

Este documento contiene ficheros embargados hasta el dia 01-02-2026

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)