Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. 81 Control Basado en Pasividad para un quadrotor UAV M. E. Guerrero ∗,∗∗ R. Lozano ∗∗ C. D. Garcı́a ∗ ∗ Centro Nacional de Investigación y Desarrollo Tecnológico, CENIDET, Internado Palmira s/n, Col. Palmira, CP 62490, Cuernavaca, Mor., México.(e-mail: maria-eusebia.guerrero-sanchez@hds.utc.fr) ∗∗ Sorbonne universités, Université de technologie de Compiègne, CNRS, Heudiasyc UMR 7253, CS 60 319, 60 203 Compiègne cedex. Resumén: En este trabajo se presentan los resultados de un modelo matemático y de una estrategia de control para una clase especial de sistemas subactuados, un Vehı́culo Aéreo no Tripulado (UAV). El modelo matemático se basa en la formulación de Euler-Lagrange, donde las ecuaciones de movimiento se expresan en el formalismo Hamiltoniano. Se diseña un Control Basado en Pasividad por Asignación de Interconexión y de Amortiguamiento (IDA-PBC) para un UAV. El objetivo de control es estabilizar al quadrotor en posición y orientación. Se llevan a cabo simulaciones numéricas para validar el enfoque general de la estrategia de control. 1. INTRODUCCIÓN Los vehı́culos aéreos no tripulados son cada vez más comunes, han sido el tema de estudio de varias investigaciones y trabajos académicos, debido a su amplia aplicabilidad y al reto que se ofrece en el área de control. Existen varias configuraciones de UAV’s, pero entre ellas destaca el quadrotor, debido a su capacidad de despegar y de aterrizar verticalmente, alta maniobrabilidad, bajo costo y mantenimiento fácil [Erginer y Altug (2007)]. Aunque se han propuesto muchas leyes de control en la literatura para un quadrotor UAV, la propiedad de pasividad que tienen estos vehı́culos no ha sido explorada ampliamente. El objetivo de este trabajo consiste en explorar la aplicación de una técnica de control no lineal, que aproveche la propiedad de pasividad de un sistema quadrotor, para resolver el problema de seguimiento de trayectoria. La técnica de control que se utiliza es IDAPBC. La Asignación de Interconexión y de Amortiguamiento es una metodologı́a de Control Basada en Pasividad aplicada a una clase especial de sistemas mecánicos subactuados, la cual se basa en sistemas descritos por un modelo Hamiltoniano Controlado por Puerto (PCH). Esta metodologı́a consiste en asignar un modelo PCH Reserva de Derechos No. EN TRÁMITE, ISSN. EN TRÁMITE nuevo en lazo cerrado con la asignación de interconexión y de amortiguamiento [Ortega et al. (2002)]. En el presente trabajo, la metodologı́a IDA-PBC se utiliza para incorporar información sobre la estructura del sistema subactuado y para tratar con el concepto de energı́a total en la estrategia de control. La principal ventaja de la estrategia IDA-PBC es su robustez inherente con respecto a la dinámica no modelada y a las incertidumbres paramétricas. Hay varias investigaciones recientes donde se aplica el IDA-PBC a vehı́culos aéreos no tripulados. Por ejemplo, en [Acosta et al. (2014)] se desarrolla un control robusto para un manipulador aéreo subactuado utilizando IDAPBC. Además, en ([Souza et al. (2014)] se desarrolla una aplicación de una técnica de control no lineal basado en pasividad, para resolver el problema de seguimiento de trayectoria para un quadrotor. En [Yuksel et al. (2013)] se presenta un control basado en pasividad para un quadrotor UAV, en este trabajo solo se moldea la energı́a potencial. En [Yuksel et al. (2013)] se propone un controlador basado en una extensión del IDA-PBC para un quadrotor UAV, en este trabajo se moldea tanto la energı́a cinética como la energı́a potencial. El control desarrollado es capaz de cambiar los parámetros dinámicos aparentes del sistema. Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. En [Muñoz et al. (2013)] se presenta un control por retroalimentación para estabilizar un quadrotor; el enfoque hace uso de la propiedad de pasividad y de la teorı́a de programación dinámica. El diseño de control se basa en la propuesta de una función de Lyapunov que ha sido definida como la función de la energı́a. En [Souza et al. (2012)] se desarrolla un diseño de control de un avión VTOL por medio de la metodologı́a de PBC. En este trabajo, el problema de seguimiento de trayectoria se resuelve para un modelo de un quadrotor real. Por otra parte, una acción de control integral se añade a la estrategia de control para el rechazo de perturbaciones. En [Guerrero et al. (2015)] se aplica la metodologı́a de IDA-PBC a un sistema de un quadrotor con una carga suspendida por un cable, en este trabajo se aprovechan las ventajas de la estrategia de control para minimizar el ángulo de oscilación de la carga. En la mayorı́a de los trabajos anteriores sólo se moldea la energı́a potencial. En este trabajo, el objetivo principal es moldear la energı́a total (cinética y potencial) del sistema subactuado de un quadrotor. Este artı́culo está organizado de la siguiente manera: en la sección II, se describe el modelo matemático basado en la formulación de Euler-Lagrange para un quadrotor UAV. En la sección III, se desarrolla la estrategia de control de Asignación de Interconexión y de Amortiguamiento para el sistema en estudio. En la sección IV, se presentan las simulaciones y resultados numéricos. Finalmente, en la sección V, se dan las conclusiones y las perspectivas. 2. MODELO DINÁMICO En esta sección, se presenta una breve descripción del modelo matemático. La Figura 1 muestra un quadrotor UAV. El sistema en cuestión tiene seis grados de libertad y sólo cuatro grados están actuados. Se usa la siguiente notación de acuerdo a la Figura 1, se considera una referencia inercial de coordenadas O = {ex , ey , ez }, fija a la tierra y una referencia de coordenadas fija al cuerpo B = {e1 , e2 , e3 }, la cual coincide con el centro de masa del quadrotor. La con[ ]T figuración de variables son q = ξ η ∈ R6 , donde [ ]T ξ = x y z ∈ R3 denota la posición del centro de masa del UAV relativo a la referencia inercial fija O, [ ]T η = ψ θ ϕ ∈ R3 son los ángulos de Euler yaw, pitch y roll, respectivamente. d es la distancia entre los motores. Finalmente, f1 , f2 , f3 y f4 son las fuerzas de empuje proporcionadas por cada uno de los rotores. 82 Fig. 1. Diagrama esquemático de un Quadrotor UAV [ ]T La entrada de control se define como u = f τ ∈ R4 , donde f = f1 + f2 + f3 + f4 es la magnitud de la fuerza [ ]T de empuje total, τ = τψ τθ τϕ , τψ = Σ4i=1 τMi , τθ = (f2 − f4 )d y τϕ = (f3 − f1 )d son las entradas de torque, ası́ como τMi es el momento producido por el motor Mi , i = 1, ..., 4, alrededor del centro gravitacional del quadrotor. R es la matriz de rotación de la referencia del cuerpo a la inercial. Usando la notación corta sθ = sin(θ) y cθ = cos(θ) se expresa como cψ cθ −sψ cϕ + cψ sθ sϕ sψ sϕ + cψ sθ cϕ R = sψ cθ cψ cϕ + sψ sθ sϕ −cψ sϕ + sψ sθ cϕ −sθ cθ sϕ cθ cϕ 2.1 Ecuaciones Euler-Lagrange El modelo matemático se obtiene via la formulación Euler-Lagrange. Las expresiones para las energı́as cinética y potencial se presentan con el propósito de obtener el lagrangiano del sistema. La función de la energı́a cinética total K(q, q̇) del sistema del quadrotor UAV, resultante de los movimientos de traslación y de rotación se expresa como KU AV = 1 ˙T ˙ 1 T M ξ ξ + η̇ J η̇ 2 2 (1) donde la matriz J = J(η) actua como la matriz de inercia para la energı́a cinética rotacional completa del quadrotor, se expresa en términos de las coordenadas generalizadas η (detalles en [Castillo et al. (2005)] y, se define como Iψ s2θ + Iθ c2θ s2ϕ + Iϕ c2θ c2ϕ cθ cϕ sϕ (Iθ − Iϕ ) −Iψ sθ J = cθ cϕ sϕ (Iθ − Iϕ ) Iθ c2ϕ + Iϕ s2ϕ 0 −Iψ sθ 0 Iψ Octubre 14-16, 2015. Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. [ ]T G = 0 0 Mg 0 0 0 En la expresión anterior, Iψ , Iθ e Iϕ son los momentos de inercia del quadrotor, mientras M representa la masa del quadrotor. La función de energı́a potencial total V (q) del sistema es V (q) = M gz (2) Usando (1) y (2), el lagrangiano se puede escribir como 1 1 L = M (ẋ2 + ẏ 2 + ż 2 ) + (Iψ s2θ + Iθ c2θ s2ϕ + Iϕ c2θ c2θ )ψ̇ 2 2 2 1 2 2 2 + (Iθ cϕ + Iϕ sϕ )θ̇ + (Iθ cθ cϕ sϕ − Iϕ cθ cϕ sϕ )ψ̇ 2 θ̇2 2 1 + Iψ ϕ̇2 − Iψ sθ ψ̇ 2 ϕ̇2 − M gz (3) 2 2.2 Ecuaciones de movimiento Aplicando la formulación de Euler-Lagrange, se obtienen las ecuaciones que modelan el movimiento total del sistema, en forma matricial se expresan como M(q)q̈ + C(q, q̇)q̇ + G = b(q)u sϕ sψ + cϕ cψ sθ cϕ sθ sψ − cψ sϕ cθ cϕ 0 0 0 b= 0 0 0 0 0 0 Mq̈ + G = b(q)u donde 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 c44 c54 c64 0 0 0 c45 c55 c65 0 0 0 c46 c56 0 T 0 0 0 1 (5) M 0 0 M(q) = 0 M 0 0 0 Iθ sin θ 0 0 G(q) = M g , b(q) = cos θ 0 0 1 0 3. ESTRATEGIA DE CONTROL 0 0 0 C(q) = 0 0 0 0 0 1 0 Con el objetivo de simplificar el diseño de la estrategia de control, se considera al sistema dentro del plano longitudinal (i.e., y = ψ = ϕ). Entonces se tiene la siguiente representación donde M(q) ∈ R6×6 es la matriz de inercia, la cual es simétrica y definida positiva, C(q, q̇) ∈ R6×6 es la matriz de Coriolis, G(q) ∈ R6 es el vector gravitacional y la matriz b(q) ∈ R6×4 se determina a partir de la entrada del sistema u ∈ R4 , no es invertible, ya que el sistema no es completamente actuado. Estas matrices se definen por: 0 1 0 0 2.3 Modelo dinámico simplificado para el plano longitudinal (4) M 0 0 0 0 0 0 M 0 0 0 0 0 0 0 0 0 M M(q) = 0 0 0 m44 m45 −Iψ sθ 0 0 0 m54 m55 0 0 0 0 −Iψ sθ 0 Iψ 2 2 2 2 donde m44 = Iψ sθ + cθ (Iθ sϕ + Iϕ cϕ ), m45 = m54 = (Iθ − Iϕ )(cθ sϕ cϕ ) y m55 = Iθ c2ϕ + Iϕ s2ϕ . 83 Se aplica el enfoque IDA-PBC al modelo (5) con energı́a total 1 (6) H(q, p) = pT M−1 (q)p + V (q) 2 donde q ∈ R3 , p ∈ R3 , son la posición y el momento generalizado, respectivamente y H(q, p) es el Hamiltoniano. Las ecuaciones de movimiento se pueden escribir como ] ] [ ][ [ ] [ 0 ∇q H 0 In q̇ u (7) + = b(q) ∇p H −In 0 ṗ donde In ∈ R3×3 es una matriz identidad, ∇q H = ∂H/∂q y ∇p H = ∂H/∂p. donde c44 = Iψ θ̇sθ cθ − (Iθ + Iϕ )(θ̇sθ cθ s2ϕ ) + (Iθ − Iϕ )ϕ̇c2θ sϕ cϕ , c45 = Iψ ψ̇sθ cθ −(Iθ −Iϕ )(θ̇sθ cϕ cϕ + ϕ̇cθ s2ϕ )− (Iθ + Iϕ )(ψ̇sθ cθ c2ϕ − ϕ̇cθ c2ϕ ), c46 = −(Iψ θ̇cθ − (Iθ − Iϕ )(ψ̇c2θ sϕ cϕ )), c56 = ψ̇sθ cθ (−Iψ + Iθ s2ϕ + Iϕ c2ϕ ), c55 = −(Iθ − Iϕ )(ϕ̇sϕ cϕ ), c56 = Iψ ψ̇cθ + (Iθ − Iϕ )(−θ̇sθ cϕ + ψ̇cθ c2ϕ − ψ̇cθ s2ϕ ), c64 = −(Iθ − Iϕ )(ψ̇c2θ sϕ cϕ ) y c65 = −Iψ ψ̇cθ + (Iθ − Iϕ )(θ̇sϕ cϕ + ψ̇cθ s2ϕ − ψ̇cθ c2ϕ ). Se propone la siguiente forma para la función de energı́a deseada: 1 Hd (q, p) = pT Md −1 (q)p + Vd (q) (8) 2 donde Md = MTd > 0 y Vd representan la matriz de inercia de lazo cerrado y la función de energı́a potencial, respectivamente. Se requiere que la función Vd tenga un mı́nimo en q∗ , esto es Octubre 14-16, 2015. q∗ = arg min Vd (q) (9) Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. 84 a1 0 a3 Md = 0 a4 0 , a3 0 a6 En PBC, la entrada de control es naturalmente descompuesta en dos términos u = ues (q, p) + udi (q, p) (10) donde el primer término representa el moldeo de energı́a y el segundo término la inyección de amortiguamiento. La dinámica deseada del hamiltoniano controlado por puertos tiene la siguiente forma [Ortega et al. (2002)] ] [ [ ] ∇q Hd q̇ = [Jd (q, p) − Rd (q, p)] ∇p Hd ṗ donde [ Jd = −JdT = M−1 Md −M−1 Md J2 (q, p) 0 [ Rd = RdT = 0 0 0 bKv bT (11) cos θ ] ≥0 donde J2 es una matriz antisimétrica y Kv = KvT > 0. El término de inyección de amortiguamiento se expresa por udi (q, p) = −Kv bT ∇p Hd (12) Para obtener el término del moldeo de energı́a, ues del controlador, se remplaza (10) y (12) en (7) y se iguala con (11), resultando [ (13) El primer renglón de las ecuaciones se satisface claramente. En el segundo, el conjunto de las PDE (Ecuaciones Diferenciales Parciales) dan el término del moldeo de la energı́a dado por ( )−1 T ( ues = bT b b ∇q H − Md M−1 ∇q Hd ) +J2 M−1 d p Entonces, el controlador (14) se reduce a ) ( )−1 T ( (17) ues = bT b b ∇q H − Md M−1 ∇q Hd [ ] Con b⊥ = cos θ − sin θ 0 , la PDE de la energı́a potencial (16) toma la forma: [ ] ] ] [ ][ 0 ∇q H 0 In ues + b(q) ∇p H −In 0 ] ][ [ ∇q Hd 0 M−1 Md = ∇p Hd −M−1 Md J2 (q, p) donde a1 a6 > a23 . (14) Las PDEs (13) se pueden separar en las ecuaciones { b⊥ ∇q (pT M−1 p) − Md M−1 ∇q (pT M−1 d p) } (15) +2J2 M−1 d p =0 } { −1 ⊥ (16) b ∇q V − Md M ∇q Vd = 0 la cual se resuelve y la energı́a potencial deseada se obtiene como: M gIp Vd = ln cos θ + Φ(•) a3 donde Φ es una función diferenciable arbitraria de θ − Ip a1 M a3 que la selección de Ip( a1 x y z − M a3 ln cos θ. Note ) I a a3 p 1 Φ θ− M Ip a1 x, z − M a3 ln cos θ depende de la condición dada en (9). Para esto, la condición necesaria ∇q Vd (q∗ ) = 0 y la condición suficiente ∇2q Vd (q∗ ) > 0 se mantendrán si el de Hessiano de Φ(x, z, θ) en q∗ es positivo [Ortega et al. (2002)]. En este caso, se elige Φ(x, z, θ) como una función cuadrática ( )2 M gIp M a3 1 Vd = ln cos θ + kpx θ − (x − xD ) a3 2 Ip a 1 ( )2 Ip a1 1 ln cos θ + kpz z − zD − 2 M a3 donde (xD , zD , 0) denota la configuración de equilibrio y kpx , kpz son las ganancias proporcionales y se usan como parámetros de sintonización. Para obtener la ley de control final, primero se determina el término de moldeo de la energı́a ues de (17), en este se considera a1 = a4 = M y a6 = Ip , tomando la forma: ( ) M gsθ sθ dsθ − kpz β − kpz cθ β + M gcθ dcθ dcθ ues = M gsθ sθ a3 d α+ − kpz β − kpx α kpx M dcθ dcθ donde ( ) a3 α(x, θ) = θ − (x − xD ) Ip ) ( Ip ln cos θ β(z, θ) = z − zD − a3 a3 d= , Ip donde b⊥ es un aniquilador izquierdo de rango completo de b(q). En el moldeo de energı́a, se nota que la matriz M es independiente de q, entonces podemos tomar J2 = 0 y Md como una matriz constante, la cual denotamos por ] [ ] a3 ∂Vd M 2g a4 ∂Vd ∂Vd + − − sin θ =0 ∂x Ip a1 ∂θ a1 ∂z a1 (18) y después se determina el término de inyección de amortiguamiento udi de (12) Octubre 14-16, 2015. Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. sθ e(θ̇(+ sẋ) + cθ ż ) θ̇ = t ẋ − d 85 udi 3.5 3 2.5 e=− a 3 Ip a3 M M ,s = − , t = − M Ip − a23 a3 M Ip − a23 posición z (m) donde 2 1.5 1 0.5 4. RESULTADOS Y SIMULACIONES 0 5 10 tiempo (seg) 15 16 20 θ θD 14 12 Tabla 1. Parámetros Parámetros M Iθ g 0 Fig. 3. Resultados de simulación de la evolución del estado y. Ángulo pitch (grados) El objetivo de la simulación es mover el quadrotor de alguna posición inicial a una posición deseada. En la simulación se usaron los parámetros del modelo cerca de los que tienen las plataformas aéreas reales. Tales parámetros se muestran en la Tabla I. Para las simulaciones, los parámetros de control fueron seleccionados a prueba y error. Las ganancias para el término del moldeo de energı́a ue s fueron elegidas como kpx = 4 y kpz = 5. z zD Valor[unidades] 0.4[Kg] 0.177[kgm2 ] 9.8[m/s2 ] 10 8 6 4 2 0 En las Figuras 2 a 4 se muestra la evolución de los estados con las condiciones de equilibrio deseadas como xD = 5, zD = 3 y θD = 0, donde se aprecia que el comportamiento del esquema de control propuesto es bastante satisfactorio y que el objetivo de control se logra en menos de 10 segundos. −2 −4 0 5 10 tiempo (seg) 15 20 Fig. 4. Resultados de simulación de la evolución del estado θ. Concerniente a las entradas de control, en las Figuras 5 y 6 se puede observar la evolución de f y τ , respectivamente. 70 60 50 Fuerza total (N) 6 5 posición x (m) 4 40 30 20 3 10 2 0 −10 1 0 −1 x xD 0 5 10 tiempo (seg) 15 0 5 10 tiempo (seg) 15 20 Fig. 5. Resultados de simulación del control f . 20 5. CONCLUSIÓN Fig. 2. Resultados de simulación de la evolución del estado x. Este artı́culo presenta el modelo matemático bajo la formulación Euler-Lagrange de un vehı́culo aéreo no Octubre 14-16, 2015. Congreso Nacional de Control Automático, AMCA 2015, Cuernavaca, Morelos, México. 7 6 Momento (N−m) 5 4 3 2 1 0 −1 0 5 10 tiempo (seg) 15 20 Fig. 6. Resultados de simulación del control τ . tripulado. Las ecuaciones de movimiento se expresaron en el formalismo Hamiltoniano. Se presentó la estrategia de control IDA-PBC para un quadrotor UAV. La ley de control desarrollada presenta un buen desempeño, considerando el objetivo de control. 86 L. Muñoz, O. Santos, P. Castillo e I. Fantoni, Energybased nonlinear control for a quadrotor rotorcraft, American Control Conference, pp. 1177-1182, 2013. C. Souza, G. Vianna Raffo, R. L. Milhomem, L. F. Silva, E. B. Castelan y U. F. Moreno, Passivity Based Control of a Quadrotor, XIX Congress Automatic Brazilian, pp. 2303-2313, 2012. M. E. Guerrero, D. A. Mercado, R. Lozano y C. D. Garcı́a, IDA-PBC Methodology for a Quadrotor UAV Transporting a Cable-Suspended Payload, IEEE International Conference on Unmanned Aircraft Systems, pp. 470-476, 2015. P. Castillo, R. Lozano y A. Dzul, Linear Functional Observers for Systems with Delays in State Variables, IEEE Control Systems Magazine, vol. 46(3), pp. 4555, 2005. R. Ortega, M. W. Spong, F. Gomez, y G. Blankenstein Stabilization of a Class of Underactuated Mechanical Systems Via Interconnection and Damping Assignment. Transactions on Automatic Control, vol. 47, no. 9, 2002. Como trabajo futuro se tienen realizar experimentos en tiempo real. REFERENCIAS B. Erginer y E. Altug, Modeling and PD control of a quadrotor vtol vehicle, Automatica, vol. 38, no. 4, pp. 894-899, 2007. R. Ortega, A. van der Schaft, B. Maschke y G. Escobar, Interconnection and damping assignment passivitybased control of port-controlled hamiltonian systems, Automatica, vol. 38, no. 4, pp. 585-596, 2002. J.A. Acosta, M.I. Sanchez y A. Ollero, Robust Control of Underactuated Aerial Manipulators via IDA-PBC, 19th Conference on Decision and Control, 673-678, 2014. C. Souza, G. V. Raffo y E. B. Castelan, Passivity Based Control of a Quadrotor, 19th World Congress The International Federation of Automatic Control Cape Town, South Africa, 24-29, 2014. A. Y. Mersha, R. Carloni y S. Stramigioli, Port-based Modeling and Control of Underactuated Aerial Vehicles, IEEE International Conference on Robotics and Automation, 14-19, 2011. B. Yuksel, C. Secchi, H. Bulthoff y Antonio Franchi, Reshaping the Physical Properties of a Quadrotor through IDA-PBC and its Application to Aerial Physical Interaction, IEEE International Conference on Robotics and Automation, 6258-6265, 2014. Octubre 14-16, 2015.