Suscríbete a DeepL Pro para poder traducir archivos de mayor tamaño. Más información disponible en www.DeepL.com/pro. Capítulo 5 Sistemas lineales Pocos elementos físicos presentan características verdaderamente lineales. Por ejemplo, la relación entre la fuerza en un muelle y el desplazamiento del muelle es siempre no lineal en cierto grado. La relación entre la corriente que pasa por una resistencia y la caída de tensión a través de ella también se desvía de una relación lineal. Sin embargo, si en cada caso la relación es razonablemente lineal, se encontrará que el comportamiento del sistema será muy cercano al que se obtiene suponiendo un elemento físico ideal y lineal, y la simplificación analítica es tan enorme que hacemos suposiciones lineales siempre que podemos hacerlo en conciencia. R. Cannon, Dynamics of Physical Systems, 1967 [Can03]. En los capítulos 2-4 hemos considerado la construcción y el análisis de modelos de ecuaciones diferenciales para sistemas dinámicos. En este capítulo especializamos nuestros resultados al caso de sistemas lineales, invariantes en el tiempo y de entrada/salida. Dos conceptos centrales son el exponencial matricial y la ecuación de convolución, mediante los cuales podemos caracterizar completamente el comportamiento de un sistema lineal. También describimos algunas propiedades de la respuesta de entrada/salida y mostramos cómo aproximar un sistema no lineal por uno lineal. 5.1 DEFINICIONES BÁSICAS Hemos visto varios casos de ecuaciones diferenciales lineales en los ejemplos de los capítulos anteriores, incluyendo el sistema muelle-masa (oscilador amortiguado) y el amplificador operacional en presencia de pequeñas señales de entrada (no saturadas). En general, muchos sistemas dinámicos pueden modelarse con precisión mediante ecuaciones diferenciales lineales. Los circuitos eléctricos son un ejemplo de una amplia clase de sistemas para los que se pueden utilizar eficazmente modelos lineales. Los modelos lineales también son ampliamente aplicables en la ingeniería mecánica, por ejemplo como modelos de pequeñas desviaciones de los equilibrios en la mecánica de sólidos y fluidos. Los sistemas de procesamiento de señales, incluidos los filtros digitales del tipo utilizado en los reproductores de CD y MP3, son otra fuente de buenos ejemplos, aunque a menudo se modelan mejor en tiempo discreto (como se describe con más detalle en los ejercicios). En muchos casos, creamos sistemas con respuesta lineal de entrada/salida mediante el uso de la retroalimentación. De hecho, fue el deseo de un comportamiento lineal lo que llevó a Harold S. Black a la invención del amplificador de retroalimentación negativa. Casi todos los sistemas modernos de procesamiento único, ya sean analógicos o digitales, utilizan la retroalimentación para producir características de entrada/salida lineales o casi lineales. Para estos sistemas, a menudo es útil representar las características de entrada/salida como lineales, ignorando los detalles internos necesarios para obtener esa respuesta lineal. 138 CAPÍTULO 5. SISTEMAS LINEALES Para otros sistemas, las no linealidades no pueden ignorarse, especialmente si uno se preocupa por el comportamiento global del sistema. El problema depredador-presa es un ejemplo de ello: para captar el comportamiento oscilante de las poblaciones interdependientes debemos incluir los términos de acoplamiento no lineal. Otros ejemplos son el comportamiento cambiante y la generación de movimientos periódicos para la locomoción. Sin embargo, si nos preocupamos por lo que ocurre cerca de un punto de equilibrio, a menudo basta con aproximar la dinámica no lineal mediante su linealización local, como ya exploramos brevemente en la sección 4.3. La linealización es esencialmente una aproximación de la dinámica no lineal alrededor del punto de funcionamiento deseado. Linealidad A continuación, procedemos a definir la linealidad de los sistemas de entrada/salida de manera más formal. Consideremos un sistema de espacio de estados de la forma dx dt = f (x, u), y = h(x, u), (5.1) donde x ∈∈∈ Rn , u Rp e y Rq . Al igual que en los capítulos anteriores, normalmente nos limitaremos al caso de una sola entrada y una sola salida tomando p = q = 1. También asumimos que todas las funciones son suaves y que para una clase razonable de entradas (por ejemplo, funciones continuas a trozos del tiempo) que las soluciones de la ecuación (5.1) existen para todo el tiempo. Será conveniente suponer que el origen x = 0, u = 0 es un punto de equilibrio para este sistema (x˙ = 0) y que h(0, 0) = 0. De hecho, podemos hacerlo sin pérdida de generalidad. Para ver esto, supongamos que (xe , ue ) = (0, 0) es un punto de equilibrio del sistema con salida ye = h(xe , ue ). Entonces podemos definir un nuevo conjunto de estados, entradas y salidas x˜ = x - xe u˜ = u - ue y˜ = y - ye y reescribir las ecuaciones de movimiento en términos de estas variables: d x̃= f (x̃+xe , ũ+ ue ) dt ỹ= h(x̃+xe , ũ+ ue ) - ye =: f˜(x̃, ũ) =: h̃(x̃, ũ). En el nuevo conjunto de variables, el origen es un punto de equilibrio con salida 0, y por lo tanto podemos realizar nuestro análisis en este conjunto de variables. Una vez que hemos obtenido nuestras respuestas en este nuevo conjunto de variables, simplemente las "traducimos" de nuevo a las coordenadas originales utilizando x = xe + x˜, u = ue + u˜ e y = ye + y˜. Volviendo a las ecuaciones originales (5.1), suponiendo ahora sin pérdida de genSi el origen es el punto de equilibrio de interés, escribimos la salida y(t) correspondiente a la condición inicial x(0) = x0 y la entrada u(t) como y(t; x0 , u). Utilizando esta notación, se dice que un sistema es un sistema lineal de entrada/salida si 139 5.1. DEFINICIONES BÁSICAS se cumplen las condiciones: (i) y(t; x1 + x2 , 0) = y(t; x1 , 0) + y(t; x2 , 0) (ii) y(t; x0 , u) = y(t; x0 , 0) + y(t; 0, u) (5.2) (iii) y(t; 0, u1 + u2 ) = y(t; 0, u1 ) + y(t; 0, u2 ). Así, definimos que un sistema es lineal si las salidas son conjuntamente lineales en la respuesta de la condición inicial y la respuesta forzada. La propiedad (ii) es la descomposición habitual de la respuesta de un sistema en la respuesta homogénea (u = 0) y la particular respuesta (x0 = 0). La propiedad (iii) es la definición formal del principio de super posición. La forma general de un sistema de espacio de estados lineal es dx dt = Ax + Bu, y = Cx + Du, (5.3) donde A Rn×n , B Rn×p , C Rq×n , D Rq×p . En el caso especial de un sistema de una sola entrada y una sola salida, B es un vector columna, C es un vector fila y D es escalar. La ecuación (5.3) es un sistema de ecuaciones diferenciales lineales de primer orden con entrada u, estado x y salida y. Es fácil demostrar que dadas las soluciones x1 (t) y x2 (t) para este conjunto de ecuaciones, éstas satisfacen las condiciones de linealidad (Ejercicio 5.1). Definimos la solución xh (t) con entrada cero como la solución homogénea y la solución xp (t) con condición inicial cero como la solución particular. La figura 5.1 ilustra cómo las soluciones homogénea y particular pueden superponerse para forman la solución completa. También es posible demostrar que si un sistema dinámico de dimensión finita es lineal de entrada/salida en el sentido que hemos descrito, siempre puede ser representado por una ecuación del espacio de estados de la forma (5.3) mediante la elección adecuada de las variables de estado. En la sección 5.2 daremos una solución explícita de la ecuación (5.3), pero ilustramos la forma básica mediante un ejemplo sencillo. Ejemplo 5.1 Sistema escalar Consideremos la ecuación diferencial de primer orden dx dt = ax + u, y=x con x(0) = x0 . Sea u1 = A σιν1 t y u2 = B χοσ2 t. La solución homogénea es xh (t) = eat x0 , y las dos soluciones particulares son en +1 χοσ1 t + a σιν1 t a2 , +2 1 at ae a χοσ2 t +2 σιν2 t xp2 (t) = . B a2 + 2 2 xp1 (t) = -A -1e Supongamos que ahora elegimos x(0) = x0 y u = u1 + u2 . Entonces la resultante 140 CAPÍTULO 5. SISTEMAS LINEALES Estado (x , x ) Entrada (u) 2 12 2 H 1 o m 0 og én -1 eo 2 1 -2 0204060 Salida (y) 1 0 0 -1 -1 -2 0204060 -2 0204060 222 111 P ar tic ul ar es -2 000 -1-1-1 0204060 -2 0204060 -2 0204060 222 111 C o m pl et a -2 000 -1-1-1 0204060 tiempo (seg) -2 0204060 tiempo (seg) -2 tiempo (seg) 0204060 Figura 5.1: Superposición de soluciones homogéneas y particulares. La primera fila muestra la entrada, el estado y la salida correspondientes a la respuesta de la condición inicial. La segunda fila muestra las mismas variables correspondientes a una condición inicial nula, pero una entrada distinta de cero. La tercera fila es la solución completa, que es la suma de las dos soluciones particulares. solución es x(t) = eat ( x0 + Α1 2+ ) Ba 2 a2 + 1a2 + 2 -a χοσ2 t +2 σιν2 t 1 χοσ1 t + a σιν1 t -A +B . (5.4) 2a2 a2 + 1 +2 2 Para ver esto, sustituya la ecuación (5.4) en la ecuación diferencial. Así, se satisfacen la s propiedades de un sistema lineal. Invarianza temporal La invariancia temporal es un concepto importante que se utiliza para describir un sistema cuyas propiedades no cambian con el tiempo. Más concretamente, para un sistema invariante en el tiempo, si la entrada u(t) da la salida y(t), entonces si desplazamos el momento en que la entrada se aplica una cantidad constante a, u(t + a) da la salida y(t + a). Sistemas que son lineales e invariables en el tiempo, a menudo llamados sistemas LTI, tienen la interesante propiedad de que su respuesta a una entrada arbitraria está completamente caracterizada por su respuesta a entradas escalonadas o su respuesta a "impulsos" cortos. Para explorar las consecuencias de la invariabilidad temporal, primero calculamos la respuesta 141 5.1. DEFINICIONES BÁSICAS 1 1.2 1 0.8 E 0.6 nt ra 0.4 da (u ) 0.2 0.8 u(t ) 1 S ali da (y ) u(t ) - u(t ) 0 1 u(t ) 0 0.6 0.4 0.2 0 0 0246810 -0.2 Tiempo (s) 0246810 Tiempo (s) (a) (b) Figura 5.2: Respuesta a entradas constantes a trozos. Una señal constante a trozos puede representarse como una suma de señales escalonadas (a) y la salida resultante es la suma de las salidas individuales (b). a una entrada constante a trozos. Supongamos que el sistema está inicialmente en reposo y consideremos la entrada constante a trozos mostrada en la Figura 5.2a. La entrada tiene saltos en tiempos tk y sus valores después de los saltos son u(tk ). La entrada puede verse como una combinación de pasos: el primer paso en el tiempo t0 tiene una amplitud u(t0 ), el segundo paso - en el tiempo t1 tiene una amplitud u(t1 ) u(t0 ), etc. Suponiendo que el sistema se encuentra inicialmente en un punto de equilibrio (por lo que el es cero), la respuesta a la entrada puede obtenerse superponiendo las respuestas a una combinación de entradas escalonadas. Sea H(t) la respuesta a un escalón unitario aplicado en el tiempo 0. La respuesta al primer escalón) es entonces H(t - t0 )u(t0 ), la respuesta al segundo paso es H( tt1 u(t1 ) - u(t0 ) y encontramos que el ) la respuesta completa viene dada por ) y(t) = H(t - t0 )u(t0 ) + H(t - t1 ) u(t1 ) - u(t0 ) + - - )) = H(t) - H(t - t1 ) u(t0 ) H(t - t1 ) - H(t - t2 ) u(t1 ) + - - ) + = H(t - tn ) - H(t - tn+1 ) u(tn ) n=0 ) H(t - tn ) - H(t - t )n+1 u(t ) t t t n n+1 n . = tn+1n n=0 En la figura 5.2 se muestra un ejemplo de este cálculo. La respuesta a una señal de entrada continua se obtiene tomando el límite como tn+1 - tn → 0, lo que da − y(t) = 0 H′ (t - )u()d, (5.5) donde H′ es la derivada de la respuesta al escalón, también llamada respuesta al impulso. La respuesta de un sistema lineal invariable en el tiempo a cualquier entrada puede calcularse a partir de la respuesta al escalón. Obsérvese que la salida sólo depende de la entrada, ya que 142 CAPÍTULO 5. SISTEMAS LINEALES Suponiendo que el sistema estaba inicialmente en reposo, x(0) = 0. Derivaremos la ecuación (5.5) de una manera ligeramente diferente en la siguiente sección. 5.2 LA MATRIZ EXPONENCIAL La ecuación (5.5) muestra que la salida de un sistema lineal puede escribirse como una integral sobre las entradas u(t). En esta sección y en la siguiente derivamos una versión más general de esta fórmula, que incluye condiciones iniciales no nulas. Comenzamos explorando la respuesta de la condición inicial utilizando la matriz exponencial. Condición inicial Respuesta Aunque hemos demostrado que la solución de un conjunto lineal de ecuaciones diferenciales define un sistema lineal de entrada/salida, no hemos calculado completamente la solución del sistema. Comenzamos considerando la respuesta homogénea correspondiente al sistema dx = Ax. (5.6) dt Para la ecuación diferencial escalar x˙ = axx ∈ R, a ∈ R la solución viene dada por la exponencial x(t) = eat x(0). Queremos generalizar esto al caso vectorial, donde A se convierte en una matriz. Definimos la exponencial matricial como la serie infinita 213 X1 ¡e = I + X + 2 X+ k 1 X+ ---= κ X 3! ¡ ! k=0 ,(5.7) donde XR n×n es una matriz cuadrada e I es la matriz de identidad nn . ∈×la notación Utilizamos IX2 = XXX n = Xn−1 X , X0 = que define lo que entendemos por "potencia" de una matriz. La ecuación (5.7) es fácil de recordar ya que no es más que la serie de Taylor para la exponencial escalar, aplicada a la matriz X . Se puede demostrar que la serie en la ecuación (5.7) converge para cualquier matriz X ∈ Rn×n de la misma manera que la exponencial normal se define para cualquier escalar a ∈ R. Sustituyendo X en la ecuación (5.7) por At donde t ∈ R encontramos que 3 At1 2 21 3 kk 1 ¡e= I + At + A t + At+ ---= κ At, 2 3! ¡ ! k=0 143 5.2. LA MATRIZ EXPONENCIAL y diferenciando esta expresión con respecto a t se obtiene d En 21 3 2 k e = A + A t + A + - - - = ¡A κ1 A t = Ae dt ! 2 k=0 t kAt . (5.8) Multiplicando por x(0) desde la derecha encontramos que x(t) = eAt x(0) es la solución de la ecuación diferencial (5.6) con condición inicial x(0). Resumimos este importante resultado como una proposición. Proposición 5.1. La solución del sistema homogéneo de ecuaciones diferenciales (5.6) viene dada por x(t) = eAt x(0). Obsérvese que la forma de la solución es exactamente la misma que para las ecuaciones escalares, pero debemos poner el vector x(0) a la derecha de la matriz eAt . La forma de la solución nos permite ver inmediatamente que la solución es lineal en la condición inicial. En particular, si xh1 (t) es la solución de la ecuación (5.6) con condición inicial x(0) = x01 y xh2 (t) con condición inicial x(0) = x02 , entonces la solución con condición inicial x(0) = x01 + x02 viene dada por x(t) = eAt x 0 + x02 ) = eAt x 0 + eAt x02 ) = xh1 (t) + xh2 (t). 1 1 Del mismo modo, vemos que la salida correspondiente viene dada por y(t) = Cx(t) = yh1 (t) + yh2 (t), donde yh1 (t) e yh2 (t) son las salidas correspondientes a xh1 (t) y xh2 (t). Ilustramos el cálculo de la matriz exponencial con dos ejemplos. Ejemplo 5.2 Integrador doble Un sistema lineal muy sencillo que resulta útil para entender los conceptos básicos es el sistema de segundo orden dado por q¨ = u y = q. Este sistema se llama integrador doble porque la entrada u se integra dos veces para determinar la salida y. En forma de espacio de estados, escribimos x = (q, q˙) y dx 0 1 = x + 0 u. 01 dt0 La matriz dinámica de un integrador doble es A= 01 0 0 y encontramos por cálculo directo que A2 = 0 y por lo tanto 1t eAt = 1 0 . 144 CAPÍTULO 5. SISTEMAS LINEALES Así, la solución homogénea (u = 0) para el integrador doble viene dada por 1t x1 (0) x (0) + tx2 (0) x(t) = = 1 ) ) 0 1x2 (0 x2 (0 y(t) = x1 (0) + tx2 (0). Ejemplo 5.3 Oscilador no amortiguado Un modelo sencillo para un oscilador, como el sistema muelle-masa con amortiguación cero, es q¨ +2 0q = u. Poniendo el sistema en forma de espacio de estados, la matriz dinámica de este sistema puede escribirse como χοσ0 tsin0 t A= 0 0 yeAt = . t -0 -sin tcos 0 0 0 Esta expresión para eAt puede verificarse por diferenciación: d − σιν0 τ0 χοσ0 t eAt = 0 dt0000 − χοσ tσιν t = 00 χοσ0 tsin0 t = Ax(t). -sin0 tcos -0 0 0 t La solución viene dada entonces por χοσ0 tsin0 t x1 (0) x(t) = eAtx(0) = . -sin0 tcos 0 tx2 (0) Si = 0 entonces la solución es más complicada, pero se puede demostrar que la matriz exponencial es eidt e idt -eidte-idt+ eidt + e-idt 21 2 - 12 2 2 t −0 , -idtidt -idtidt idt-idt e e+ e- e e e−e +2 2 22 − 12 - 1 2 - 1 puede ser real o complejo, 2 - 1. Obsérvese que y donded =0 d pero las combinaciones de términos siempre arrojarán un valor real para las entradas del matriz exponencial. Una clase importante de sistemas lineales son los que pueden convertirse en forma diagonal. Supongamos que nos dan un sistema dx = Ax dt tal que todos los valores propios de A son distintos. Se puede demostrar (Ejercicio 4.14) que podemos encontrar una matriz invertible T tal que TAT−1 sea diagonal. Si elegimos 145 5.2. LA MATRIZ EXPONENCIAL un conjunto de coordenadas z = Tx, entonces en las nuevas coordenadas la dinámica se convierte en dz dx = T = TAx = TAT−1 z. dtdt Por construcción de T , este sistema será diagonal. Consideremos ahora una matriz diagonal A y la correspondiente potencia k de At, que también es diagonal: 0 10 ktk A= 0 2 .. 1 ktk 2 k (En) = . 0 n .. . , kt k n De la expansión de la serie se deduce que la exponencial de la matriz viene dada por 1t eAt e = 0e 0 ε2τ .. . . λ nt Se puede hacer una expansión similar en el caso de que los valores propios sean complejos, utilizando una matriz diagonal de bloques, de forma similar a lo que se hizo en la sección 4.3. Formulario de Jordania Algunas matrices con valores propios iguales no pueden transformarse a la forma diagonal. Sin embargo, pueden transformarse a una forma estrechamente relacionada, denominada forma de Jordan, en la que la matriz dinámica tiene los valores propios a lo largo de la diagonal. Cuando hay valores propios iguales pueden aparecer 1s en la superdiagonal que indican que hay acoplamiento entre los estados. Más concretamente, definimos que una matriz está en forma de Jordan si se puede escribir como 0 10 . . . 0 ... 0i J1 10 0i 0 0J 2 .. . . = J .. . dondeJ i = . . (5.9) . . . .. . 0 . .0 0 0 ... i 1 0 ... Jk 00. . . 0 i Cada matriz Ji se llama bloque de Jordan yi para ese bloque corresponde a un Un bloque de Jordan de primer orden puede representarse como un sistema formado por un integrador con la retroalimentación . Los bloques de Jordan de orden superior pueden representarse como conexiones en serie de tales sistemas, como se ilustra en la figura 5.3. Teorema 5.2 (descomposición de Jordan). Cualquier ∈ matriz A Rn×n puede transformarse en forma de Jordan con los valores propios de A determinandoi en la forma de Jordan. 146 1 x CAPÍTULO 5. SISTEMAS LINEALES x1 2 x 1 x 2 x 2 x Figura 5.3: Representación de un sistema lineal donde la matriz dinámica es un bloque de Jordan. Un bloque de Jordan de primer orden puede representarse como un integrador con retroalimentación, como se muestra a la izquierda. Los bloques de Jordan de segundo y tercer orden pueden representarse como conexiones en serie de integradores con retroalimentación, como se muestra a la derecha. Prueba. Véase cualquier texto estándar sobre álgebra lineal, como el de Strang [Str88]. El caso especial en el que los valores propios son distintos se examina en el ejercicio 4.14. Convertir una matriz en forma de Jordan puede ser complicado, aunque MATLAB puede realizar esta conversión para matrices numéricas utilizando la función jordan. La estructura de la forma de Jordan resultante es especialmente interesante, ya que no es necesario que losi individuales sean únicos y, por lo tanto, para un valor propio dado podemos tener uno o más bloques de Jordan de diferente tamaño. Una vez que una matriz está en forma de Jordan, la exponencial de la matriz puede calcularse en términos de los bloques de Jordan: J1 0 0J2 . . . e 0e 0 . (5.10) .. J = e 0 0 ... . .k ... eJ 0 Esto se deduce de la forma diagonal de los bloques de J. Los exponenciales de los bloques de Jordan pueden escribirse a su vez como t it i tn-1 it itt2 . . ¡(n-1)!e e te ¡2! e . tn-2 ειt it λ 0e te . . ¡(n- 2)!. Jit it . . . . (5.11) e= ειτ. . . .. t ειτ 0 eλ it Cuando hay múltiples valores propios, los subespacios invariantes asociados a cada valor propio corresponden a los bloques de Jordan de la matriz A. Nótese que puede ser compleja, en cuyo caso la transformación T que convierte una matriz en forma de Jordan también será compleja. Cuando tiene una componente imaginaria no nula, las soluciones tendrán componentes oscilantes ya que eσ+iωt = eσt (coste + i sint). Ahora podemos utilizar estos resultados para demostrar el Teorema 4.1, que establece que el punto de equilibrio xe = 0 de un sistema lineal es asintóticamente estable si y sólo si Ρεi < 0. 147 5.2. LA MATRIZ EXPONENCIAL Prueba del teorema 4.1. Sea ∈T Cn×n una matriz invertible que transforma A en la forma de Jordan, J = TAT−1 . Usando las coordenadas z = Tx, podemos escribir la solución z(t) como z(t) = eJt z(0). Dado que cualquier solución x(t) puede escribirse en términos de una solución z(t) con z(0) = Tx(0), se deduce que es suficiente demostrar el teorema en las coordenadas transformadas. La solución z(t) puede escribirse como una combinación de los elementos de la matriz exponencial y a partir de la ecuación (5.11) estos elementos decaen todos a cero para z(0) arbitrario si y sólo si Ρεi < 0. Además, si cualquieri tiene parte real positiva, entonces existe una condición inicial z(0) tal que la solución correspondiente aumenta sin límite. Dado que podemos escalar esta condición inicial para que sea arbitrariamente pequeña, ésta se deduce que el punto de equilibrio es inestable si cualquier valor propio tiene parte real positiva. La existencia de una forma canónica nos permite demostrar muchas propiedades de los sistemas lineales cambiando a un conjunto de coordenadas en el que la matriz A está en forma Jordan. Esto se utilizará en los capítulos 6 y 7 para diseñar controladores. Lo ilustramos en la siguiente proposición, que sigue la misma línea que la prueba del teorema 4.1. Proposición 5.3. Supongamos que el sistema x˙ = Ax no tiene valores propios con parte real estrictamente positiva y uno o más valores propios con parte real cero. Entonces el sistema es estable si y sólo si los bloques de Jordan correspondientes a cada valor propio con parte real cero son bloques escalares (1 × 1). Prueba. Ejercicio 5.2. El siguiente ejemplo ilustra el uso del formulario Jordan. Ejemplo 5.4 Modelo lineal de un avión con vector de empuje. Consideremos la dinámica de una aeronave de empuje vectorial como la descrita en el examen 2.9. Supongamos que elegimos u1 = u2 = 0, de modo que la dinámica del sistema converti z4 rse en z5 z d z6 ,(5.12) = t -g sin z3 - cz˙1 d -g(cos z3 - 1) - cz˙ 2 0 donde z = (x, y, , x˙, y˙, ˙). Los puntos de equilibrio del sistema vienen dados por la fijación de las velocidades ẋe , ẏe y ˙e a cero y la elección de las restantes variables a satisfacer -g sin z3,e = 0 =⇒z = 0. 3,e =e -g(cos z3,e - 1) = 0 148 CAPÍTULO 5. SISTEMAS LINEALES Figura 5.4: Modos de vibración de un sistema formado por dos masas conectadas por muelles. En (a) las masas se mueven a la izquierda y a la derecha de forma sincronizada en (b) se mueven hacia o contra la otra. Esto corresponde a la orientación vertical de la aeronave. Obsérvese que xe e ye no están especificados. Esto se debe a que podemos trasladar el sistema a una nueva posición (vertical) y seguimos obteniendo un punto de equilibrio. Para calcular la estabilidad del punto de equilibrio, calculamos la linealización mediante la ecuación (4.11): 0 0 0 0 ∂F =0 0 xA =z 0 0 e 0 0 0 0 0 -g 0 1 0 0 -c 0 0 0 10 01 . 00 -c 0 Los valores propios del sistema pueden calcularse como (A) = {0, 0, 0, 0, -c, -c}. Vemos que el sistema linealizado no es asintóticamente estable ya que no todos los valores propios tienen parte real estrictamente negativa. Para determinar si el sistema es estable en el sentido de Lyapunov, debemos hacer uso de la forma de Jordan. Se puede demostrar que la forma de Jordan de A viene dada por = 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 J1 0 0 0 0 0 0 0 -c 0 0 0 0 0 0 -c Como el segundo bloque de Jordan tiene el valor propio 0 y no es un valor propio simple, la linealización es inestable. Valores propios y modos Los valores y vectores propios de un sistema proporcionan una descripción de los tipos de comportamiento que puede presentar el sistema. En el caso de los sistemas oscilantes, el término modo se utiliza a menudo para describir los patrones de vibración que pueden producirse. La figura 5.4 ilustra los modos de un sistema formado por dos masas conectadas por muelles. Uno de los patrones se produce cuando 149 5.2. LA MATRIZ EXPONENCIAL ambas masas oscilan al unísono a la izquierda y a la derecha, otra es cuando las masas se acercan y se alejan la una de la otra. La respuesta en condiciones iniciales de un sistema lineal puede escribirse en términos de una matriz exponencial que involucra a la matriz dinámica A. Por tanto, las propiedades de la matriz A determinan el comportamiento resultante del ∈ sistema. Dada una matriz A Rn×n , recordemos que v es un vector propio de A con valor propio si Av = ϖ. En general y v pueden ser de valor complejo, aunque si A es de valor real entonces para cualquier valor propio , su conjugado complejo ∗ también será un valor propio (con v∗ como el correspondiente vector propio). Supongamos en primer lugar que y v son un par de valores propios/vectores propios de A. Si observamos la solución de la ecuación diferencial para x(0) = v, se deduce de la definición de la matriz exponencial que ) 1 22 2t2 eAtv t = I + At + A t + - - - v = v + tv + v + - - - = e v. 2 2 La solución se encuentra, pues, en el subespacio abarcado por el vector propio. El valor propio describe cómo varía la solución en el tiempo y esta solución suele llamarse modo del sistema. (En la literatura, el término modo también se utiliza a menudo para referirse al valor propio, en lugar de la solución). Si observamos los elementos individuales de los vectores x y v, resulta que ε tvi xi (t) , = xj (t) ε tv j y, por tanto, las relaciones de los componentes del estado x son constantes para un modo (real). El vector propio da, pues, la "forma" de la solución y también se denomina forma del modo del sistema. La figura 5.5 ilustra los modos de un sistema de segundo orden compuesto por un modo rápido y un modo lento. Obsérvese que las variables de estado tienen el mismo signo para el modo lento y signos diferentes para el modo rápido. La situación es más complicada cuando los valores propios de A son complejos. Dado que A tiene elementos reales, los valores propios y los vectores propios son complejos con- jugados = ± ι y v = u ± iw, lo que implica que v + v∗ v - v∗ w= . 2i 2 Haciendo uso de la exponencial matricial, tenemos u= ) eAt v = eλt (u + iw) = e σt (u coste - w sint) + i(u sint + w coste ,) lo que implica 1 En eAt = e v + eAtv∗ = ueσt coste — nosotrosσt sint 2 u 1 En eAtw = e v — eAtv∗ = ueσt sint + nosotrosσt costo. 2i 150 CAPÍTULO 5. SISTEMAS LINEALES 1 1 0.5 x1 0.5 , x2 Lento de 0 x2 01020304050 0 1 -0.5 -1 51 -1-0.500. Rápido de mo x1 0.5 , x2 0 x1 t 01020304050 (b) (a) Figura 5.5: Ilustración de la noción de modos para un sistema de segundo orden con valores propios reales. La figura de la izquierda (a) muestra el plano de fase y los modos corresponden a las soluciones que parten de los vectores propios (líneas en negrita). Las funciones temporales correspondientes se muestran en (b). Una solución con condiciones iniciales en el subespacio abarcado por la parte real u y la parte imaginaria w del vector propio permanecerá por tanto en ese subespacio. La solución será una espiral logarítmica caracterizada por y . Volvemos a llamar a la solución correspondiente a un modo del sistema y v a la forma del modo. Si una matriz A tiene n valores propios distintos1 , . . . ,n , entonces la respuesta de la condición inicial puede escribirse como una combinación lineal de los modos. Para ver esto, supongamos para simplificar que tenemos todos los valores propios reales con los correspondientes valores propios unitarios v1 , . . . , vn . A partir del álgebra lineal, estos vectores propios son linealmente independientes y podemos escribir la condición inicial x(0) como x(0) =1 v1 +2 v2 + - - +n vn . Utilizando la linealidad, la respuesta de la condición inicial puede escribirse como x(t) =1 eλ 1tv1 +2 eλ 2tv2 + - - +n eλ ntvn . Por lo tanto, la respuesta es una combinación lineal de los modos del sistema, con la magnitud de los modos individuales creciendo o decayendo como eλ it . El caso de los valores propios complejos distintos es similar (el caso de los valores propios no distintos es más sutil y requiere el uso de la forma de Jordan discutida en la sección anterior). Ejemplo 5.5 Sistema acoplado muelle-masa Consideremos el sistema muelle-masa de la figura 5.4. Las ecuaciones de movimiento del sistema son m1 q¨1 = -2kq1 - cq˙1 + kq2 m2 q¨2 = kq1 - 2kq2 - cq˙2 En forma de espacio de estados, definimos el estado como x = (q1 , q2 , q˙1 , q˙2 ) y podemos reescribir 151 5.3. RESPUESTA DE ENTRADA/SALIDA las ecuaciones como 0010 0001 dx 2kkc = x.0 m m m k 2k c 0 - m m- m Ahora definimos una transformación z = Tx que pone este sistema en una forma más simple. 1 Sea z1 = (q1 + q2 ), z2 = z˙1 , z3 =1 (q1 - q2 ) y z4 = z˙3 , de modo que -dt 22 1 z = Tx 1100 0011 =x. 2 1 -1 00 001-1 En las nuevas coordenadas, la dinámica se convierte en 0100 k c 00 dz-- mm =x 0001 dt 3kc m 00my vemos que el sistema está en forma de bloque diagonal (o modal). En los coor√dinatos z, los estados z1 y z2 parametrizan un modo con eigenvalores ≈ c/(2 km) ± ik/m, y los estados z3 y z4 otro modo con ≈ c/(2√3km) ± 3k/m. Por la forma de la transformación T vemos que estos i corresponden exactamente a los modos de la figura 5.4, en los que q1 y q2 se mueven eitivamente hacia o contra el otro. Las partes real e imaginaria de los valores propios dan las tasas de decaimiento y las frecuencias de cada modo. 5.3 RESPUESTA DE ENTRADA/SALIDA En la sección anterior vimos cómo calcular la respuesta de la condición inicial utilizando la matriz exponencial. En esta sección derivamos la ecuación de convolución, que incluye también las entradas y salidas. La ecuación de convolución Volvemos al caso general de entrada/salida en la ecuación (5.3), que se repite aquí: dx = Ax + Bu dt y = Cx + Du. (5.13) 152 CAPÍTULO 5. SISTEMAS LINEALES Utilizando la matriz exponencial, la solución de la ecuación (5.13) puede escribirse como sigue. Teorema 5.4. La solución de la ecuación diferencial lineal (5.13) viene dada por x(t) = eAt x(0) + -t 0 eA(t−τ) Bu()d. (5.14) Prueba. Para demostrarlo, diferenciamos ambos lados y utilizamos la propiedad (5.8) de la exponencial matricial. Esto da dxAt -t Aτ Ae (− ) Bu()δ + Bu(t) = Ax + Bu, = Ae x(0) dt 0 + que demuestra el resultado. Obsérvese que el cálculo es esencialmente el mismo que para demostrar el resultado de una ecuación de primer orden. De las ecuaciones (5.13) y (5.14) se deduce que la relación entrada/salida de un sistema lineal viene dada por y(t) = CeAt x(0) + -t 0 CeA(t−τ) Bu()δ + Du(t). (5.15) Es fácil ver en esta ecuación que la salida es conjuntamente lineal tanto en las condiciones iniciales como en el estado, lo que se deduce de la linealidad de la multiplicación de matrices/vectores y de la integración. La ecuación (5.15) se llama ecuación de convolución y representa la forma general de la solución de un sistema de ecuaciones diferenciales lineales acopladas. Vemos inmediatamente que la dinámica del sistema, caracterizada por la matriz A, juega un papel crítico tanto en la estabilidad como en el rendimiento del sistema. De hecho, la matriz exponencial describe tanto lo que ocurre cuando perturbamos la condición inicial como la forma en que el sistema responde a las entradas. Otra interpretación de la ecuación de convolución puede darse utilizando el concepto de respuesta al impulso de un sistema. Consideremos la aplicación de una señal de entrada u(t) dada por la siguiente ecuación: 0 t<0 1/0 ≤ t < u(t) = pε (t) = (5.16) 0t ≥. Esta señal es un "impulso" de duración y amplitud 1/, como se ilustra en la Fig. 5.6a. Definimos un impulso, (t), como el límite de esta señal como → 0: (t) = lim pε (t). →0 (5.17) Esta señal, a veces llamada función delta, no es físicamente realizable pero proporciona una abstracción conveniente para entender la respuesta de un sistema. Nota: 153 5.3. RESPUESTA DE ENTRADA/SALIDA 1.2 1 1 0.8 0.8 u 0.6 0.6 y 0.4 0.4 0.2 0.2 0 0 02040 t t (a) 010203040 (b) Figura 5.6: Respuesta al pulso y respuesta al impulso. La figura de la izquierda muestra pulsos de anchura 5, 2 y 1, cada uno de ellos con un área total igual a 1. Las respuestas a los pulsos correspondientes para un sistema {--} lineal con valores propios = 0,08, 0,62 se muestran a la derecha como líneas sólidas. La línea discontinua es la verdadera respuesta al impulso, que está bien aproximada por un pulso de duración 1. que la integral de un impulso es uno: - t- t () δ = lim pε (t) δ = lim 000 → − = lim →0 0 1/ δ = 1t -t →0 0 pε (t) δ > 0. En particular, la integral de un impulso sobre un periodo de tiempo arbitrariamente corto es idéntica a 1. Definimos la respuesta al impulso de un sistema, h(t), como la salida correspondiente a tener un impulso como entrada: h(t) = -t 0 CeA(t−τ) B() δ = CeAt B, (5.18) donde la segunda igualdad se deriva del hecho de que (t) es cero en todas partes excepto en el origen y su integral es idéntica a uno. Ahora podemos escribir la ecuación de convolución en términos de la respuesta de la condición inicial, la convolución del impulso y la señal de entrada, y el término directo: -t y(t) = CeAt x(0) +h (t - )u() δ + Du(t). 0 (5.19) Una interpretación de esta ecuación, explorada en el Ejercicio 5.5, es que la respuesta del sistema lineal es la superposición de la respuesta a un conjunto infinito de impulsos desplazados cuya magnitud está dada por la entrada, u(t). Este es esencialmente el argumento utilizado en el análisis de la Figura 5.2 y la derivación de la ecuación (5.5). Obsérvese que el segundo término de la ecuación (5.19) es idéntico al de la ecuación (5.5) y puede demostrarse que la respuesta al impulso es formalmente equivalente a la derivada de la respuesta al escalón. 154 CAPÍTULO 5. SISTEMAS LINEALES El uso de pulsos como aproximación de la respuesta al impulso también proporciona un mecanismo para identificar la dinámica de un sistema a partir de los datos. La figura 5.6b muestra las respuestas de los pulsos de un sistema para diferentes anchos de pulso. Obsérvese que las respuestas de los pulsos se aproximan a la respuesta al impulso a medida que la anchura del pulso -llega a cero. Comoregla general, si el valor propio más rápido de un sistema estable tiene parte realmax , entonces un pulso de longitud proporcionará una buena estimación de la respuesta al impulso si que para la figura 5.6, una anchura de pulso de = 1 s damax = ≪ max 1. Obsérvese 0,62 y la respuesta al pulso ya se acerca a la respuesta al impulso. Invarianza de coordenadas Los componentes del vector de entrada u y del vector de salida y vienen dados por las entradas y salidas elegidas de un modelo, pero las variables de estado dependen del marco de coordenadas elegido para representar el estado. Esta elección de coordenadas afecta a los valores de las matrices A, B y C que se utilizan en el modelo. (El término directo D no se ve afectado, ya que asigna las entradas a las salidas.) Ahora investigamos algunas de las consecuencias de cambiar los sistemas de coordenadas. Introducir nuevas coordenadas z mediante la transformación z = Tx, donde T es una matriz in- vertible. De la ecuación (5.3) se deduce que dz = T (Ax + Bu) = TAT −1 z + TBu = Ã+ z B̃udt 1 − y = Cx + DU = CT z + Du = C̃z+ Du. El sistema transformado tiene la misma forma que la ecuación (5.3) pero las matrices A, B y C son diferentes: A˜ NO = TAT −1 B˜ = TB C˜ = CT−1 . (5.20) A menudo hay elecciones especiales de sistemas de coordenadas que nos permiten ver una propiedad particular del sistema, por lo que las transformaciones de coordenadas pueden utilizarse para obtener una nueva visión de la dinámica. También podemos comparar la solución del sistema en coordenadas transformadas con la de las coordenadas del estado original. Hacemos uso de una importante propiedad del mapa exponencial, -1 eTST = TeST -1, lo que se puede comprobar por sustitución en la definición del mapa exponencial. Utilizando esta propiedad, es fácil demostrar que x(t) = T−1 z(t) = T−1 eÃt Tx(0) + T−1 -t 0 eÃ(t −τ ) B̃u() d. A partir de esta forma de la ecuación, vemos que si es posible transformar A en una forma A˜ para la cual la exponencial de la matriz es fácil de calcular, podemos utilizar ese cálculo para resolver la ecuación de convolución general para el estado no transformado x mediante simples multiplicaciones matriciales. Esta técnica se ilustra en los siguientes ejemplos. 155 5.3. RESPUESTA DE ENTRADA/SALIDA q1q2 cc mm ku (t) = sint kk Figura 5.7: Sistema de masa con muelles acoplados. Cada masa está conectada a dos muelles con rigidez k y a un amortiguador viscoso con coeficiente de amortiguación c. La masa de la derecha se impulsa a través de un muelle conectado a un accesorio que varía sinusoidalmente. Ejemplo 5.6 Sistema acoplado muelle-masa Consideremos el sistema acoplado de muelle-masa que se muestra en la figura 5.7. La entrada a este sistema es el movimiento sinusoidal del extremo del muelle de la derecha y la salida es la posición de cada masa, q1 y q2 . Las ecuaciones de movimiento vienen dadas por m1 q¨1 = -2kq1 - cq˙1 + kq2 m2 q¨2 = kq1 - 2kq2 - cq˙2 + ku. En forma de espacio de estados, definimos el estado como x = (q1 , q2 , q˙1 , q˙2 ) y podemos reescribir las ecuaciones como 0010 0 0001 0 dx 2kkc = x + 0 u. --0 dtmmm km 2k c k 0m- m m Se trata de un conjunto acoplado de cuatro ecuaciones diferenciales y bastante complicado de resolver en forma analítica. La matriz de la dinámica es la misma que en el ejemplo 5.5 y podemos utilizar la transformación coordinativa definida allí para poner el sistema en forma modal: 0 0100 00 dz mm =x+ dt -- kc 3kc k m k 2m 0001 0 u. - 2m mObsérvese que las ecuaciones matriciales resultantes son diagonales de bloque y, por tanto, están desacopladas. Así, podemos resolver las soluciones calculando las soluciones de dos conjuntos de sistemas de segundo orden representados por los estados (z1 , z2 ) y (z3 , z4 ). En efecto, la forma funcional de cada conjunto de ecuaciones es idéntica a la de un único sistema muelle-masa. Una vez que hayamos resuelto los dos conjuntos de ecuaciones de segundo orden independientes, tenemos 00- 156 CAPÍTULO 5. SISTEMAS LINEALES 10.1 0. de en 00 tr ad -0.5-0 a, u( -1 t) tiempo (seg) de 50.05 sal id a, y(t .05 ) -0.1 020406080 Transitori o Estado estable 020406080 tiempo (seg) (a) Entrada (b) Salida Figura 5.8: Respuesta transitoria frente al estado estacionario. El gráfico de la izquierda muestra la entrada de un sistema lineal y el de la derecha la salida correspondiente. La señal de salida experimenta inicialmente un transitorio antes de estabilizarse en su comportamiento de estado estacionario. podemos recuperar la dinámica en las coordenadas originales invirtiendo la trans- formación de estado y escribiendo x = T−1 z. También podemos determinar la estabilidad del sistema observando la estabilidad de los sistemas independientes de segundo orden (Ejercicio 5.6). Respuesta en estado estacionario Dado un sistema lineal de entrada/salida dx = Ax + Bu dt y = Cx + Du, (5.21) la forma general de la solución de la ecuación (5.21) viene dada por la ecuación de convolución: y(t) = CeAt x(0) + -t 0 CeA(t−τ) Bu()δ + Du(t). De la forma de esta ecuación se desprende que la solución consiste en una respuesta de la condición inicial y una respuesta de entrada. La respuesta de entrada, que corresponde a los dos últimos términos de la ecuación anterior, consta de dos componentes: la respuesta transitoria y la respuesta en estado estacionario. La respuesta transitoria se produce en el primer periodo de tiempo tras la aplicación de la entrada y refleja el desajuste entre la condición inicial y la solución de estado estacionario. La respuesta en estado estacionario es la parte de la respuesta de salida que refleja el comportamiento a largo plazo del sistema bajo las entradas dadas. Para las entradas que son periódicas, la respuesta de estado estacionario será a menudo periódica y para las entradas constantes la respuesta será a menudo constante. En la figura 5.8 se muestra un ejemplo de respuesta transitoria y de estado estable para una entrada periódica. Una forma particularmente común de entrada es la entrada escalonada, que representa un cambio abrupto en la entrada de un valor a otro. Un paso unitario (a veces llamado 157 5.3. RESPUESTA DE ENTRADA/SALIDA 2 1.5 S ali da Sobregiro, M p 1 Tiempo de subida, T 0.5 r Tiempo de asentamiento, T Valor de estado estable, y ss s 0 051015202530 tiempo (seg) Figura 5.9: Muestra de la respuesta al escalón. El tiempo de subida, el rebasamiento, el tiempo de estabilización y el valor del estado estacionario proporcionan las principales propiedades de rendimiento de la señal. Función escalonada de Heaviside) se define como u = S(t) = J 0t = 0 1t > 0. La respuesta escalonada del sistema (5.21) se define como la salida y(t) partiendo de una condición inicial cero (o del punto de equilibrio apropiado) y dada una entrada escalonada. Observamos que la entrada escalonada es discontinua y, por lo tanto, no se puede aplicar en la práctica. mentable. Sin embargo, es una abstracción conveniente que se utiliza ampliamente en el estudio de los sistemas de entrada/salida. Podemos calcular la respuesta escalonada de un sistema lineal utilizando la ecuación de convolución. Fijando x(0) = 0 y utilizando la definición de la entrada escalonada anterior, tenemos tiene - t n y(t) = CeA(t−τ) Bu()δ + Du(t) 0 = - t 0 CeA(t−τ) Bd + Dt > 0. Si A tiene valores propios con parte real negativa (lo que implica que el origen es un punto de equilibrio estable en ausencia de cualquier entrada), entonces podemos reescribir la solución como −1 At −1 y(t) = C t > 0. (5.22) .- A e B+ D - CA B ...,. -. ...,. estado estacionario transitorio El primer término es la respuesta transitoria y decae a cero como → t . El segundo término es la respuesta en estado estacionario y representa el valor de la salida para un tiempo grande. En la figura 5.9 se muestra un ejemplo de respuesta escalonada. Se utilizan varios términos para referirse a una respuesta escalonada. El valor de estado estable, yss , de una respuesta escalonada es el nivel final de la salida, suponiendo que converge. El tiempo de subida, Tr , es el tiempo necesario para que la señal pase del 10% de su valor final al 90% de su valor final. También es posible definir otros límites, pero en este libro utilizaremos estos porcentajes a menos que se indique lo contrario. El rebasamiento, Mp , es el porcentaje de 158 CAPÍTULO 5. SISTEMAS LINEALES 22 Co nc ent rac ión, C 1.51.5 11 2 0.50.5 0 0 01020304050 01020304050 0.40.4 Falta (a) D os is de en tr ad a 0.30.3 0.20.2 0.10.1 0 0 01020304050 Tiempo (min) (b) Dividir 01020304050 Tiempo (min) (c) Figura 5.10: Respuesta de un modelo de compartimento a una infusión constante de fármaco. En (a) se muestra un diagrama simple del sistema. La respuesta escalonada (b) muestra la velocidad de aumento de la concentración en el compartimento 2. En (c) se utiliza un pulso de concentración inicial para acelerar la respuesta. el valor final por el que la señal se eleva inicialmente por encima del valor final. Esto suele suponer que los valores futuros de la señal no sobrepasan el valor final en más de este transitorio inicial, pues de lo contrario el término puede ser ambiguo. Por último, el tiempo de estabilización, Ts , es la cantidad de tiempo necesaria para que la señal se mantenga dentro del 5% de su valor final para todos los tiempos futuros. El tiempo de estabilización también se define a veces como el tiempo necesario para alcanzar el 1% o el 2% del valor final (véase el ejercicio 5.8). En general, estas medidas de rendimiento pueden depender de la amplitud del escalón de entrada, pero para los sistemas lineales puede demostrarse que las tres últimas cantidades definidas anteriormente son independientes del tamaño del escalón. Ejemplo 5.7 Modelo de compartimentos Consideremos el modelo de compartimentos ilustrado en la figura 5.10 y descrito con más detalle en el apartado 3.6. Supongamos que se administra un fármaco por infusión constante en el compartimento V1 y que el fármaco tiene su efecto en el compartimento V2 . Para evaluar la rapidez con la que la concentración en el compartimento alcanza el estado estacionario, calculamos la respuesta al escalón que se muestra en la Figura 5.10b. La respuesta escalonada es bastante lenta, con un tiempo de estabilización de 39 minutos. Es posible obtener la concentración en estado estacionario mucho más rápido teniendo una tasa de inyección más rápida inicialmente, como se muestra en la Figura 5.10c. La respuesta del sistema en este caso puede calcularse combinando dos respuestas escalonadas (Ejercicio ?? ). Otra señal de entrada común a un sistema lineal es una sinusoide (o una combinación de sinusoides). La respuesta en frecuencia de un sistema de entrada/salida mide la forma en que el sistema responde a una excitación sinusoidal en una de sus entradas. Como ya hemos visto para los sistemas escalares, la solución particular asociada a una excitación sinusoidal es en sí misma una sinusoide a la misma frecuencia. Por tanto, podemos comparar la magnitud y la fase de la sinusoide de salida con la de entrada. Más generalmente, si un sistema tiene una respuesta de salida sinusoidal a la misma frecuencia que el forzamiento de entrada, 159 5.3. RESPUESTA DE ENTRADA/SALIDA podemos hablar de la respuesta en frecuencia del sistema. Para ver esto con más detalle, debemos evaluar la ecuación de convolución (5.15) para u = coste. Esto resulta ser un cálculo muy complicado, pero podemos aprovechar el hecho de que el sistema es lineal para simplificar la derivación. En particular, observamos que 1 coste = 2 eit + e-it . Dado que el sistema es lineal, basta con calcular la respuesta del sistema a la entrada compleja u(t) = est y podemos reconstruir la entrada a una sinusoide promediando las respuestas correspondientes a s = it y s =- it. Aplicando la ecuación de convolución a la entrada u = est con x(0) = 0, tenemos y(t) = = -t 0 CeA(t-)Βεσ δ + - t 0 Dest CeA(t-)+sI Bd + Dest = eAt - t 0 Ce(sI-A) Bd + Dest . Si suponemos que ninguno de los valores propios de A es igual a s = ±i, entonces la matriz sI - A es invertible y podemos escribir (tras un poco de álgebra) y(t) = CeAt x(0) - (sI - A)−1 B -....,. + C(sI - A)−1 B + D transitorio est . -....,. estado estable Obsérvese que, una vez más, la solución consta de un componente transitorio y un componente de estado estacionario. El componente transitorio decae a cero si el sistema es asintóticamente estable y el componente de estado estacionario es proporcional a la entrada (compleja) u = est . Podemos simplificar un poco más la forma de la solución reescribiendo la constante respuesta del estado como yss(t) = Mei est = Me(st+i) donde Mejθ = C(sI - A)−1 B + D (5.23) y M y representan la magnitud y la fase del número complejo C(sI A)−1 B+D. Cuando s = i, decimos que M es la ganancia y es la fase del sistema a una frecuencia de forzamiento dada . Utilizando la linealidad y combinando las soluciones para s = - +i y s =i , podemos demostrar que si tenemos una entrada u = Au sin(t + ) y una salida y = Ay sin(t + ), entonces gain() = Ay = Mphase () = - =. Au La solución en estado estacionario para una sinusoide u = coste viene dada ahora por yss (t) = M cos(t + ). Si la fase es positiva, decimos que la salida "adelanta" a la entrada, en caso contrario decimos que "retrasa" a la entrada. 160 CAPÍTULO 5. SISTEMAS LINEALES 2 entr ada 1 E ntr ad 0 a, sa lid -1 a 100 salida Ay Au 102 10-1100101 0 -50 -100 -2 tiempo (seg) -150 05101520 10-1100101 Figura 5.11: Respuesta en frecuencia, mostrando la ganancia y la fase. La ganancia viene dada por la relación entre la amplitud de salida y la amplitud de entrada, M = Ay/Au. El desfase viene dado por = -2(t1 - t2 )/T ; es negativo para el caso mostrado porque la salida se retrasa respecto a la entrada. En la Figura 5.11 se ilustra una muestra de la respuesta en frecuencia. La línea continua muestra la sinusoide de entrada, que tiene una amplitud de 1. La sinusoide de salida se muestra como una línea discontinua, y tiene una amplitud diferente más una fase desplazada. La ganancia es la relación de las amplitudes de las sinusoides, que puede determinarse midiendo la altura de los picos. La fase se determina comparando la relación del tiempo entre los cruces por cero de la entrada y la salida con el periodo global de la sinusoide: T =2- - . T Otra forma de ver la respuesta en frecuencia es representar cómo la ganancia y la fase en la ecuación (5.23) dependen de (a través de s = i). La figura 5.11 muestra un ejemplo de este tipo de representación. Ejemplo 5.8 Filtro pasabanda activo Considere el circuito de amplificadores operacionales mostrado en la Figura 5.12a. Podemos derivar la dinámica del sistema escribiendo las "ecuaciones nodales", que establecen que la suma de las- corrientes en cualquier nodo debe ser cero. Suponiendo que v = v+ = 0, como hicimos en la sección 3.3, tenemos 0= v1 - v2 R1 dt - C1 dv2 , 0 = C1 dv2 + dt v3 + C2 dtR2 dv3 , 0 = C2 dv3 + v3 dv2 - C1 . dtR2 dt Si elegimos v2 y v3 como nuestros estados y utilizamos las ecuaciones primera y última, obtenemos dv2 v1 - v2 = , dtR1 C1 dv3 -v3 v1 - v2 = . dtR 2 C2 R 1 C2 161 5.3. RESPUESTA DE ENTRADA/SALIDA 100 C2 R1 C1 v1 G an ar R2 -+ 10-2 100102 v2 300 Fa se 200 (d eg 100 ) 0 100102 Frecuencia (rad/seg) (a) (b) Figura 5.12: Filtro pasabanda activo. El diagrama del circuito muestra un amplificador óptico con dos filtros RC dispuestos para proporcionar un filtro pasa banda. El gráfico de la derecha muestra la ganancia y la fase del filtro en función de la frecuencia. Reescribiendo esto en forma de espacio de estado lineal obtenemos 1 1 -0 x R1 d R1 C 1 C1 =x+ dt1 -1 u - 1 R 1 C2 R2 R 1 C2 C2 y=01 x (5.24) donde x = (v2 , v3 ), u = v1 e y = v3 . La respuesta en frecuencia del sistema puede calcularse mediante la ecuación (5.23): Mejθ = C( sIA)−1 B + D =R2R1C1s s = i. -R1 (1 + R1 C1 s)(1 + R2 C2 s) La magnitud y la fase se representan en la Figura 5.12b para R1 = 100 , R2 = 5 κ y C1 = C2 = 100 µF. Vemos que el circuito pasa por señales con frecuencias alrededor de 10 rad/s, pero atenúa las frecuencias por debajo de 5 rad/s y por encima de 50 rad/s. A 0,1 rad/s la señal de entrada se atenúa 20 veces (0,05). Este tipo de circuito se denomina filtro de paso de banda, ya que deja pasar las señales en la banda de frecuencias entre 5 y 50 rad/s. Como en el caso de la respuesta escalonada, se definen una serie de propiedades estándar para las respuestas en frecuencia. La ganancia del sistema a = 0 se denomina ganancia de frecuencia cero y corresponde a la relación entre una entrada constante y la salida estable: M0 = -CA−1 B + D. 162 CAPÍTULO 5. SISTEMAS LINEALES La ganancia de frecuencia cero sólo está bien definida si A es invertible (y, en particular, si no tiene valores propios en 0). También es importante señalar que la ganancia de frecuencia cero sólo es una cantidad relevante cuando un sistema es estable en torno al punto de equilibrio correspondiente. Así, si aplicamos una entrada constante u = r- entonces la correspondiente punto de equilibrio xe = A−1 Br debe ser estable para poder hablar de la freganancia de frecuencia. (En ingeniería eléctrica, la ganancia de frecuencia cero suele llamarse "Ganancia de CC". DC significa "direct current" (corriente continua) y refleja la separación habitual de las señales en ingeniería eléctrica en un término de corriente continua (frecuencia cero) y otro de corriente alterna (AC)). El ancho de banda√b de un sistema es la frecuencia en la que la ganancia ha disminuido por un factor de 1/ 2 de su ganancia de frecuencia cero. Esta definición supone que tenemos una ganancia de frecuencia cero no nula y finita. Para los sistemas que atenúan las frecuencias bajas pero pasan por las altas, la ganancia de referencia se toma como la alta ganancia de frecuencia. Para un sistema como el filtro pasa banda del ejemplo 5.8, √bandase define como el rango de frecuencias donde la ganancia es mayor que 1/ 2 de la ganancia en el centro de la banda. (Para el ejemplo 5.8 esto daría un ancho de banda de aproximadamente 50 rad/s). Otra propiedad importante de la respuesta en frecuencia es el pico de resonancia Mr , el mayor valor de la respuesta en frecuencia, y la frecuencia de picomr , la frecuencia en la que se produce el máximo. Estas dos propiedades describen la frecuencia de la entrada sinusoidal que produce la mayor salida posible y la ganancia en la frecuencia. Ejemplo 5.9 Dinámica del AFM Consideremos el modelo para la dinámica vertical del microscopio de fuerza atómica en modo de contacto, discutido en la sección 3.5. La dinámica básica está dada por la ecuación (3.22). La pila piezoeléctrica puede ser modelada por un sistema de segundo orden con frecuencia natural no amortiguada3 y amortiguamiento relativo3 . La dinámica se describe entonces mediante el sistema lineal 0 0100 dx-k/ (m1 + m2 ) -c/(m1 + m2 ) 1/m2 d= t 00-2 0001 3 1 0 x, −2 33 0x0 + 0u 2 3 m1 c m2 m1 k m1 + m2 m1 + m1 + m2 m2 donde la señal de entrada es la señal de accionamiento del amplificador que acciona la pila piezoeléctrica y la salida es la elongación del piezo. La respuesta en frecuencia del sistema se muestra en la figura 5.13. La ganancia de frecuencia cero del sistema es M0 = 1. Hay dos polos resonantes con picos Mr1 = 2,12 amr1 =238 krad/s y Mr2 = 4,29 enmr2 =746 krad/s. Elancho de banda del sistema, definido como la frecuencia más baja. quencia donde la ganancia es2menor que la ganancia de frecuencia cero, esb =292 krad/s. También hay una caída en la ganancia Md = 0,556 paramd =268 krad/s. Esta caída (a veces llamada antirresonancia) está asociada a una caída de fase y limitará el rendimiento cuando el sistema sea controlado por controladores y= 5.3.simples, RESPUESTA DEveremos como ENTRADA/SALIDA 163 164 CAPÍTULO 5. SISTEMAS LINEALES 101 100 G an ar 10-1 10-2104 105106107 0 Fa se -90 -180 Imagen de AFM 104105 106107 w Figura 5.13: Respuesta en frecuencia del AFM. El gráfico de la derecha muestra la ganancia y la fase de la pila piezoeléctrica de un microscopio de fuerza atómica. La respuesta contiene dos picos de frecuencia en las resonancias del sistema, junto con una antiresonancia a = 268 krad/s. La combinación de un pico de resonancia seguido de una antirresonancia es común en los sistemas con múltiples frecuencias ligeras. modos amortiguados. en el capítulo 10 . Muestreo A menudo es conveniente utilizar tanto las ecuaciones diferenciales como las de diferencias en la modelización y el control. Para los sistemas lineales es sencillo transformar de una a otra. Consideremos el sistema lineal general descrito por la ecuación (5.13) y supongamos que la señal de control es constante a lo largo del intervalo de muestreo de longitud constante h. De la ecuación (5.14) del Teorema 5.4 se deduce que - t+h x(t + h) = e x(t) + Ah t et+h−τ Bu(k) δ = x(t) + u(t), (5.25) donde hemos supuesto que la señal de control discontinua es continua por la derecha. El comportamiento del sistema en los tiempos de muestreo t = kh se describe mediante la ecuación en diferencias x[k + 1] = x[k] + u[k], y [ k] = Cx[k] + Du[k]. (5.26) Nótese que la ecuación de diferencia (5.26) es una representación exacta del comportamiento del sistema en los instantes de muestreo. También se pueden obtener expresiones similares si la señal de control es lineal en el intervalo de muestreo. La transformación de (5.25) a (5.26) se llama muestreo. Las relaciones entre las matrices del sistema en las representaciones continua y muestreada son -h 1 -h -1 A = log, B= eA dt eAs ds B; = eAh , = . (5.27) t h 0 0 Obsérvese que si A es invertible tenemos ) = A−1 eAh - I . 165 5.3. RESPUESTA DE ENTRADA/SALIDA Todos los sistemas de tiempo continuo tienen una versión de tiempo discreto, pero hay sistemas de tiempo discreto que no tienen un equivalente de tiempo continuo. La condición precisa es que la matriz no puede tener valores propios reales en el eje real negativo. Ejemplo 5.10 Ecuación diferencial para el servidor IBM Lotus En el ejemplo 2.4 describimos cómo se obtenía la dinámica de un servidor IBM Lotus como sistema de tiempo discreto y[k + 1] = ay[k] + bu[k] donde a = 0,43, b = 0,47 y el periodo de muestreo es h = 60 s. Se necesita un modelo de ecuaciones diferenciales si queremos diseñar sistemas de control basados en la teoría del tiempo continuo. Dicho modelo se obtiene aplicando la ecuación (5.27), -h por lo -1 log a que A= = -0.0141, B = 0 eAt dt b = 0.0141. h y encontramos que la ecuación en diferencia puede interpretarse como una versión muestreada de la ecuación diferencial ordinaria dx = -0,141x + 0,141u dt