Universidad Politécnica de Valencia Doble Grado en Matemáticas 31 de enero de 2023 Trabajo Académico Resolución Numérica I Grupo 10: Xuan Liu Joan López Aparicio Luis Ramón Pérez Sarrión Índice 1. Introducción 2 2. Cuestiones 2.1. Cuestión 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Cuestión 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Cuestión 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Cuestión 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. Apartado a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2. Apartado b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3. Apartado c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5. Cuestión 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Apartado a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2. Apartado b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3. Apartado c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6. Cuestión 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1. Apartado a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.2. Apartado b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7. Cuestión 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Cuestión 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.1. Apartado a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.2. Apartado b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8.3. Apartado c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9. Cuestión 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.1. Apartado a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.2. Apartado b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9.3. Apartado c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10. Cuestión 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 9 11 11 12 20 24 24 25 25 26 26 27 48 50 60 61 62 63 63 64 68 69 3. Final 3.1. Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Fe de erratas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Referencias y bibliografı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 70 70 70 1 1. Introducción En este trabajo aplicaremos lo aprendido en los temas 5, 6 y 7 a la familia de métodos iterativos que nos ha sido asignada. Dada una estimación inicial x0 , la expresión iterativa es yk = xk − xk+1 = yk − f (xk ) , k = 0, 1, ... f ′ (xk ) uk + 2u2k f (xk ) , k = 0, 1, ... 1 − βu3k f ′ (xk ) (yk ) donde β es un parámetro libre (real o complejo) y uk = ff (x . k) Procederemos a resolver las 10 cuestiones planteadas para el caso de la familia que se nos asignó, la número diez. Se detallan todas las cuestiones apartado a apartado, tratando de resolverlos en páginas separadas, ilustrando y detallando las respuestas mediante imágenes de planos dinámicos y paramétricos. Además, al documento se adjuntan múltiples archivos ((.mlx)) que permiten realizar cálculos para nuestra familia, como es el caso del apartado 3; y documentos ((.nb)) de Mathematica, como es el caso del análisis dinámico de la sección 5, o el desarrollo de las cuestiones 6 y 7. También se añadirán una conclusión y una bibliografı́a, ası́ como una fe de erratas respecto a lo hecho en la presentación, explicando las correcciones que se han hecho respecto a lo expuesto entonces. 2 2. Cuestiones 2.1. Cuestión 1 Analiza la expresión iterativa de la familia de métodos asignada: ¿es el método asignado directamente extensible a sistemas de ecuaciones? Si lo es, reescrı́belo de forma que tenga sentido matemáticamente y utilizando la notación adecuada. Si no es directamente extensible, lleva a cabo la transformación adecuada para tratar de transformarlo (como sabes, no siempre es posible). Vamos desarrollando ambos términos, para preparar la transformación de sistemas. En primer lugar, el término yk no presenta ninguna dificultad para su conversión. yk = xk − f (xk ) −1 → yk = xk − F ′ (xk ) F (xk ) f ′ (xk ) Ahora pasamos a xk+1 , que sı́ que puede complicarse. 2 2 f (yk ) f [xk ,yk ] f (yk ) f [xk ,yk ] + 2 + 2 1 − 1 − f (xk ) f (xk ) f ′ (xk ) f ′ (xk ) f (xk ) f (xk ) · ′ xk+1 = yk − = yk − = 3 · ′ 3 f (x ) f (xk ) (yk ) f [xk ,yk ] k 1 − β ff (x 1 − β 1 − ′ f (xk ) k) 2 k ,yk ] k ,yk ] k ,yk ] + 1 − 2 ff[x′ (x + ff[x′ (x 1 − ff[x′ (x k) k) k) f (xk ) = yk − 2 3 · f ′ (x ) = f [x y ] k k ,yk ] 1 − β 1 − 3 ff[x′ (x − f ′ (x, kk) k) 2 = yk − f ′ (xk )(f ′ (xk )−f [xk ,yk ])+2·(f ′ (xk )−f [xk ,yk ]) f ′ (xk )2 f ′ (xk )3 −β(f ′ (xk )−f [xk ,yk ])3 f ′ (xk )3 · f (xk ) = f ′ (xk ) 2 = yk − ′ = yk − f ′ (xk )(f ′ (xk ) − f [xk , yk ]) + 2 (f ′ (xk ) − f [xk , yk ]) 3 f ′ (xk )3 − β (f ′ (xk ) − f [xk , yk ]) · f ′ (xk ) f (xk ) = f ′ (xk ) f (xk ) − f (xk ) · f [xk , yk ] + 2f ′ (xk )2 + 2f [xk , yk ]2 − 4f ′ (xk )f [xk , yk ] · f (xk ) = f ′ (xk )3 − β(f ′ (xk )3 − 3f ′ (xk )2 f [xk , yk ] + 3f ′ (xk )f [xk , yk ]2 − f [xk , yk ]3 ) 2 ′ 3f ′ (xk )2 − 5f ′ (xk )f [xk , yk ] + 2f [xk , yk ]2 · f (xk ) 3 f ′ (xk )3 − β (f ′ (xk ) − f [xk , yk ]) En el cuarto paso se desarrolla el denominador con un binomio de Newton de tercer grado, pero con esto no se obtiene nada que permita cancelar términos. Ası́, volvemos a la expresión más compacta en el quinto paso. Terminamos ahora con la conversión a sistemas de xk+1 = yk − xk+1 = yk − 3f ′ (xk )2 − 5f ′ (xk )f [xk , yk ] + 2f [xk , yk ]2 · f (xk ) → 3 f ′ (xk )3 − β (f ′ (xk ) − f [xk , yk ]) h i h i 3 −1 2 → yk − F ′ (xk )3 − β (F ′ (xk ) − A) F ′ (xk ) (F ′ (xk ) − A) + 2 (F ′ (xk ) − A) F (x) donde A = [xk , yk , F ], para poder escribir la operación en una sola lı́nea. De esta manera, la expresión iterativa para sistemas queda como −1 yk = xk − F ′ (xk ) F (xk ), k = 0, 1, 2... h i−1 h i 3 2 xk+1 = yk − F ′ (xk )3 − β (B) F ′ (xk ) (B) + 2 (B) F (x), k = 0, 1, 2... con B = F ′ (xk ) − [xk , yk , F ] 3 2.2. Cuestión 2 Modifica el fichero ((.nb)) de Mathematica en el que se demuestra el orden del método escalar de Newton, de forma que se adapte a la familia de métodos asignada. Añade el fichero resultante a la carpeta comprimida. ¿Cuál es la ecuación del error de la familia? ¿Cuál es su orden de convergencia? Desarrolla, a mano, la demostración de la clase de métodos iterativos vectorial, teniendo en cuenta la no conmutatividad de los operadores. ¿Se mantiene el orden de convergencia? ¿Es el mismo para todos los miembros de la familia? Hemos realizado la modificación del fichero ((.nb)) de Mathematica, que se ha adjuntado a la carpeta. El desarrollo que queda es el siguiente. Y para sistemas, tenemos que Tenemos las ecuaciones del error tanto con vectores como con sistemas, y su orden de convergencia es 4. 4 Ahora hacemos el desarrollo a mano de la demostración, pues Mathematica no tiene en cuenta la no conmutatividad de operadores. [x(k) , y (k) , F ] = 1 1 1 = F ′ (x(k) )+ F ′′ (x(k) )(y (k) −x(k) )+ F ′′′ (x(k) )(y (k) −x(k) )2 + F IV (x(k) )(y (k) −x(k) )3 +... = 2 6 24 1 1 = F ′ (x(k) ) + F ′′ (x(k) )(F ′ (x(k) )−1 F (x(k) )) + F ′′′ (x(k) )(F ′ (x(k) )−1 F (x(k) ))2 + 2 6 1 IV (k) + F (x )(F ′ (x(k) )−1 F (x(k) ))3 + ... 24 Obtenemos las derivadas de F F (x(k) ) = F ′ (x̄) · ek + C2 e2k + C3 e3k + C4 e4k + O(e5k ) F ′ (x(k) ) = F ′ (x̄) · I + 2C2 ek + 3C3 e2k + 4C4 e3k + O(e4k ) F ′′ (x(k) ) = F ′ (x̄) · 2C2 + 6C3 ek + 12C4 e2k + O(e3k ) F ′′′ (x(k) ) = F ′ (x̄) · [6C3 + 24C4 ek ] + O(e2k ) F IV (x(k) ) = F ′ (x̄) · [24C4 ] + O(ek ) Y ahora la inversa de F ′ (xk ) [F ′ (xk )]−1 = I + X2 ek + X3 e2k + X4 e3k · [F ′ (x̄)]−1 + O(e4k ) Hallamos los valores de X2 , X3 y X4 I = [F ′ (xk )]−1 · F ′ (xk ) = I + X2 ek + X3 e2k + X4 e3k · I + 2C2 ek + 3C3 e2k + 4C4 e3k = = I +2C2 ek +3C3 e2k +4C4 e3k +X2 ek +2C2 X2 e2k +3C3 X2 e3k +X3 e2k +2C2 X3 e3k +X4 e3k +O e4k Ahora se saca factor común en todos los órdenes, y buscamos el valor de las Xi 2C2 + X2 = 0 → X2 = −2C2 3C3 + 2C2 X2 + X3 = 0 → X3 = 4C22 − 3C3 4C4 + 3C3 X2 + 2C2 X3 + X4 = 0 → 4C4 + 3C3 (−2)C2 + 2C2 4C22 − 3C3 + X4 = 0 → → X4 = −4C4 + 6C3 C2 − 8C23 + 6C2 C3 Ahora vamos a calcular F ′ (xk )−1 F (xk ) −1 F ′ (xk )−1 F (xk ) = I + X2 ek + X3 e2k + X4 e3k ·[F ′ (x̄)] F ′ (x)· ek + C2 e2k + C3 e3k + C4 e4k = = I + X2 ek + X3 e2k + X4 e3k ek + C2 e2k + C3 e3k + C4 e4k = = ek + C2 e2k + C3 e3k + C4 e4k + X2 e2k + X2 C2 e3k + X2 C3 e4k + X3 e3k + X3 C2 e4k + X4 e4k + O(e5k ) = = ek − C2 e2k + (C3 + X2 C2 + X3 )e3k + (X2 C3 + X3 C2 + X4 + C4 )e4k + O(e5k ) = = ek − C2 e2k + (2C22 − 2C3 )e3k + (10C2 C3 − 4C23 − 3C3 C2 − 3C4 )e4k + O(e5k ) Para los cálculos que realicemos a partir de ahora, abreviaremos esta expresión como a, es decir a := ek − C2 e2k + (2C22 − 2C3 )e3k + (10C2 C3 − 4C23 − 3C3 C2 − 3C4 )e4k + O(e5k ) 5 Y desarrollamos su cuadrado y cubo, que utilizaremos más tarde. a2 = e2k −C2 ek +(2C22 −2C3 )e4k −C2 e3k +C2 e3k +C22 e4k +(2C22 −2C3 )e4k = e2k −2C2 e3k +(5C22 −4C3 )e4k a3 = a2 · a = e3k − C2 e4k − C2 e4k = e3k − 2C2 e4k Ahora volvemos atrás con estos nuevos cálculos y detallamos las diferencias divididas. 1 [x(k) , y (k) , F ] = F ′ (x̄) I + 2C2 ek + 3C3 e2k + 4C4 e3k + F ′ (x̄) 2C2 + 6C3 ek + 12C4 e2k · a 2 1 1 + F ′ (x̄) [6C3 + 24C4 ek ] · a2 + F ′ (x̄)[24C4 ] · a3 + O(e4k ) ≈ 6 24 ′ 2 3 ≈ F (x̄) I + 2C2 ek + 3C3 ek + 4C4 ek + C2 + 3C3 ek + 6C4 e2k a + [C3 + 4C4 ek ] a2 + C4 a3 = = F ′ (x̄)[I + 2C2 ek + 3C3 e2k + 4C4 e3k + C2 ek + 3C3 e2k + 6C4 e3k − C22 e2k − 3C3 C2 e3k −6C4 C2 e4k +C2 2C22 − 2C3 e3k +3C3 (2C2 − 2C3 ) e4k +C2 10C2 C3 − 4C23 − 3C3 C2 − 3C4 e4k +C3 e2k − 2C3 C2 e3k + C3 5C22 − 4C3 e4k + 4C4 e3k − 8C4 C2 e4k + C4 e3k − 2C4 C2 e4k ] = = F ′ (x̄) · [I + 3C2 ek + 3C3 + 3C3 − C22 + C3 e2k + + 4C4 + 6C4 − 3C3 C2 + 2C23 − 2C2 C3 − 2C3 C2 + 4C4 + C4 e3k + (−6C4 C2 + 6C3 C22 − 6C32 +10C22 C3 − 4C24 − 3C2 C3 C2 − 3C2 C4 + 5C3 C22 − 4C32 − 8C4 C2 − 2C4 C2 )e4k = = F ′ (x̄) · [I + 3C2 ek + 7C3 − C22 e2k + 15C4 − 5C3 C2 + 2C23 − 2C2 C3 e3k + −16C4 C2 + 11C3 C22 − 10C32 + 10C22 C3 − 4C24 − 3C2 C3 C2 − 3C2 C4 e4k Por otro lado, la ecuación de yk se puede expresar como yk = xk −F ′ (xk )−1 F (xk ) = xk −ek +C2 e2k −(2C2 −2C3 )e3k −(10C2 C3 −4C23 −3C3 C2 −3C4 )e4k Ahora, preparando el cálculo final, desarrollamos lo que llamaremos M . M := F ′ (xk )−1 [xk , yk , F ] Veamos que −1 M = I − 2C2 ek + (4C22 − 3C3 )e2k + (−8C23 + 12C2 C3 − 4C4 )e3k · [F ′ (x̄)] · F ′ (x̄)· ·[I + 3C2 ek + (7C3 − C22 )e2k + (15C4 − 5C3 C2 + 2C23 − 2C2 C3 )e3k +(−16C4 C2 + 11C3 C22 − 10C32 + 10C22 C3 − 4C24 − 3C2 C3 C2 − 3C2 C4 )e4k ] = Ahora, abreviamos todo los escalares que acompañan a los errores a1 = 3C2 a2 = 7C3 − C22 a3 = 15C4 − 5C3 C2 + 2C23 − 2C2 C3 a4 := −16C4 C2 + 11C3 C22 − 10C32 + 10C22 C3 − 4C24 − 3C2 C3 C2 − 3C2 C4 Continuamos operando M M = I + a2 ek + a2 e2k + a3 e3k + a4 e4k − 2C2 ek − 6C22 e2k − 2C2 a2 e3k − 2C2 a3 e4k + (4C22 − 3C2 )e2k + +(4C22 −3C3 )a1 e3k +(4C22 −3C3 )a2 e4k +(−8C23 +12C2 C3 −4C4 )e3K +(−8C23 +12C2 C3 −4C4 )a1 e4k = 6 = I+C2 ek + −3C22 + 7C3 − 3C2 e2k +(a3 −2C2 a2 + 4C22 − 3C3 )a1 − 8C23 + 12C2 C3 − 4C4 e3k + a4 − 2C3 a3 + 4C22 − 3C3 a2 + −8C23 + 12C2 C3 − 21C2 a1 e4k Volvemos a almacenar en variables las constantes que acompañan a los errores b1 = C2 ek b2 = −3C22 + 7C3 − 3C2 b3 = a3 − 2C2 a2 + 4C22 − 3C3 a1 − 8C23 + 12C2 C3 − 4C4 b4 = a4 − 2C3 a3 + 4C22 − 3C3 a2 + −8C23 + 12C2 C3 − 21C2 a1 Calculamos ahora el cuadrado y el cubo de M M 2 = M · M = I + b1 ek + b2 e2k + b3 e3k + b4 e4k · I + b1 ek + b2 e2k + b3 e3k + b4 e4k = = I + b1 ek + b2 e2k + b3 e3k + b4 e4k + b1 ek + b1 b1 e2k + b1 b2 e3k +b1 b3 e4k + b2 e2k + b2 b1 e3k + b22 e4k + b3 e3k + b3 b1 e4k = = I + 2b1 ek + (2b2 + b21 )e2k + (b3 + b1 b2 + b2 b1 + b3 )e3k + (b4 + b1 b3 + b22 + b3 b1 )e4k M3 = M2 · M = = I + 2b1 ek + (2b2 + b21 )e2k + (b3 + b1 b2 + b2 b1 + b3 )e3k + (b4 + b1 b3 + b22 + b3 b1 )e4k · · I + b1 ek + b2 e2k + b3 e3k + b4 e4k = = I + 2b1 eK + (2b2 + b21 )e2k + (b3 + b1 b2 + b2 b1 + b3 )e3k + (b4 + b1 b3 + b22 + b3 b1 )e4k +2b1 ek + 2b21 e2k + 2b1 b2 e3k + 2b1 b3 e4k + (2b2 + b21 )e2k + (2b2 + b21 )b1 e3k + (2b2 + b21 )b2 e4k +(b3 + b1 b2 + b2 b1 + b3 )e3k + (b3 + b1 b2 + b2 b1 + b3 )b1 e4k = = I +4b1 ek +(4b2 +4b21 )e2k +(b3 +b1 b2 +b2 b1 +b3 +2b1 b2 +2b2 b1 +b31 +b3 +b1 b2 +b2 b1 +b3 )e3k + + b4 + b1 b3 + b22 + b3 b1 + 2b1 b3 + 2b2 b21 + (b3 + b1 b2 + b2 b1 + b3 )b1 e4k Aprovechamos esta expresión para sustituir en la ecuación −1 xk+1 = yk − I − β I − 3M + 3M 2 − M 3 I − M + 2I − 4M + 2M 2 F ′ (xk )−1 F (xk ) = −1 = I − β I − 3M + 3M 2 − M 3 3I − 5M + 2M 2 F ′ (xk )−1 F (xk ) A continuación, separamos el numerador y el denominador y los calculamos. El numerador queda 3I − 5M + 2M 2 = 3I − 5I + 5b1 ek + 5b2 e2k + 5b3 e3k + 5b4 e4k + 2I + 4b1 ek + (4b2 + 2b21 )e2k ) +(2b3 + 2b1 b2 + 2b2 b1 + 2b3 )e3k + (2b4 + 2b1 b3 + 2b22 + 2b3 b1 )e4k = = 10I + 9b1 ek + (9b2 + 2b1 )e2k + (2b3 + 2b1 b2 + 2b2 b1 + 7b3 )e3k + (7b4 + 2b1 b3 + 2b22 + 2b3 b1 )e4k Ahora el denominador I − 3M + 3M 2 − M 3 = 2 − 3I − 3b1 ek − 3b2 e2k − 3b3 e3k − 3b4 e4k +3 I + 2b1 ek + (2b2 + b21 )e2k + (b3 + b1 b2 + b2 b1 + b3 )e3k + (b4 + b1 b3 + b22 + b3 b1 )e4k −[I + 4b1 ek + (4b2 + 4b21 )e2k + (4b3 + 4b1 b2 + 4b2 b1 + b31 + b3 )e3k + b4 + 3b1 b3 + b22 + 3b3 b1 + 3b2 b21 + b1 b22 e4k ] = 7 = (−3b1 + 6b1 − 4b1 )ek + −3b2 + 6b2 + 3b21 − 4b2 − 4b21 e2k + −3b3 + 3b3 + 3b1 b2 + 3b2 b1 + 3b3 − 4b3 − 4b1 b2 − 4b2 b1 − b31 − b3 e3k + −3b4 + 3b4 + 3b1 b3 + 3b22 + 3b3 b1 − b4 − 3b1 b3 − b22 − 3b3 b1 − 3b2 b21 − b1 b22 e4k = = −b1 ek + −b2 − b21 e2k + −2b3 − b1 b2 − b2 b1 − b31 e3k + −b4 + 2b22 − 3b2 b21 − b1 b22 e4k Ahora realizamos el inverso del denominador por sı́ mismo, que tiene que dar la identidad, y obtenemos los coeficientes Hi −1 I − β I − 3M + 3M 3 − M 3 I − β I − 3M + 3M 3 − M 3 = I → → I = I + H1 ek + H2 e2k + H3 e3k + H4 e4k I − β I − 3M + 3M 3 − M 3 = = I−βb1 ek +β (−b2 − b1 ) e2k +β −2b3 − b1 b2 − b2 b1 − b31 e3k +β −b4 + 2b22 − 3b2 b21 − b1 b22 e4k +H1 ek − βb1 H1 e2k + H1 β (−b2 − b1 ) e3k + H1 β −2b2 − b1 b2 − b2 b1 − b31 e4k + H2 e2k + βb1 H2 e3k +H2 β −b2 − b21 e4k + H3 e3k − βb1 H3 e4k + H4 e4k = = (−βb1 + H1 ) ek + −βb2 − βb21 − βb1 H1 + H2 e2k + β −2b3 − b1 b2 − b2 b1 − b31 + H1 β −b2 − b21 − βb1 H2 + H3 e3k +[β −b4 + 2b22 − 3b2 b21 − b1 b22 + H1 β −2b2 − b1 b2 − b2 b1 − b31 +H2 β −b2 − b21 − βb1 H3 + H4 ]e4k Ahora obtenemos el valor de las constantes Hi −βb1 + H1 = 0 → H1 = −βb1 −βb2 − βb21 − βb1 H1 + H2 = 0 → H2 = βb2 + βb21 − β 2 b21 β −2b3 − b1 b2 − b2 b1 − b31 + H1 β −b2 − b21 − βb1 H2 + H3 = 0 → → H3 = β 2b3 + b1 b2 + b2 b1 + b31 − β 2 b1 b2 + b21 + βb1 βb2 + βb21 − β 2 b21 H4 = βb1 H3 − H2 β −b2 − b21 + H1 β 2b2 + b1 b2 + b2 b1 + b31 + β b4 − 2b22 + 3b2 b21 + b1 b2 En este punto solo queda despejar las variables hasta llegar a las constantes Ci y operar hasta que se cancelen los eik , sin tener en cuenta aquellos términos de orden mayor a cuatro. PREGUNTAR A ALICIA CÓMO CONTINUAR (LO DIJO EN LA PRESENTACIÓN) 8 2.3. Cuestión 3 Utiliza el ı́ndice de eficiencia de Ostrowski y el computacional para analizar la eficiencia de la familia de métodos asignada en su versión vectorial. ¿Cuál es su eficiencia? ¿Y su eficiencia computacional? Compara sus ı́ndices de eficiencia con los del método de Newton para sistemas, tanto numérica como gráficamente. Veamos ahora el ı́ndice de eficiencia computacional de nuestra familia. Este ı́ndice se formula como 1 IC = p d+op con d el número de evaluaciones funcionales por iteración, y op el número de productos/cocientes por iteración. Ahora bien, sabemos el orden de convergencia de nuestro método, p = 3, y podemos averiguar los otros dos valores. En primer lugar, comprobaremos el número de evaluaciones funcionales con la expresión para sistemas de la cuestión 1 yk = xk − F ′ (xk ) −1 F (xk ), k = 0, 1, 2... h i−1 h i 3 2 xk+1 = yk − F ′ (xk )3 − β (B) F ′ (xk ) (B) + 2 (B) F (xk ), k = 0, 1, 2... con B = F ′ (xk ) − [xk , yk , F ]. El número de evaluaciones en el primer paso es n2 + n, ya que hay un vector (de ahı́ la n) y una matriz (que nos da n2 ). En el segundo paso, tenemos n(n − 1) = n2 − n. De donde la expresión del tenemos el número de evaluaciones en B, pues las diferencias divididas son n(n − 1). Ası́, el número de evaluaciones totales es d = n2 + n + n2 − n = 2n2 Veamos ahora las operaciones de cada paso. En el primero, tenemos 31 n3 + n2 − 13 n, pues es la resolución de un sistema. Para el segundo, veamos el término B = F ′ (xk ) − [xk , yk , F ]. Podemos darnos cuenta de que no supone ningún incremento de op más que el número de n2 en las diferencias divididas, que sumaremos al final. Veamos ahora el resto. En el primer corchete β(B)3 : Matriz por matriz por matriz, es decir, 2n3 F ′ (xk )3 : Matriz por matriz por matriz, es decir 2n3 En el segundo corchete F ′ (xk ) ∗ B: Producto de matrices, esto es, n3 2(B)2 : Cuadrado de matrices, o sea, n3 h i 2 Ahora tenemos F ′ (xk ) (B) + 2 (B) · F (xk ), un producto de matriz por vector, lo que añade n2 . Acabamos con la resolución de un sistema lineal, que suma 13 n3 + n2 − 13 n. Ası́, en total nos queda que el od del segundo paso es 1 3 1 19 3 1 n2 + 2n3 + 2n3 + n3 + n3 + n2 + n + n2 − n = n + 3n2 − n 3 3 3 3 Y la op de los dos pasos será 1 3 1 19 3 1 20 3 2 n + n2 − n + n + 3n2 − n = n + 4n2 − n 3 3 3 3 3 3 9 Obtengamos ahora el ı́ndice de Ostrowski, que es más sencillo que el computacional. Se formula como 1 I = pd 1 1 En nuestro caso, sustituimos y obtenemos que I10 = p d = 4 2n2 . El ı́ndice de Newton es 1 IN = 2 n2 +n Comparando con Newton, ahora tenemos que el ı́ndice de Ostrowski en cada caso es Donde el azul es Newton, y el rojo la familia 10. La tendencia de la gráfica podrı́a llevarnos a pensar que nuestro método es más eficiente que Newton, pero esto no es cierto: no hemos tenido en cuenta los operaciones. Para ello necesitamos IC1 0, que sı́ incluirá op. 3 2 2 2 Ahora, con op = 20 3 n +4n − 3 n, d = 2n y p = 3, podemos decir que el ı́ndice computacional de nuestra familia es 1 2 20 1 3 1 2 2 20 3 2 2 IC10 = p d+op = 4 2n + 3 n +4n − 3 n = 4 3 n +6n − 3 n Mientras que para Newton es 1 1 3 2 2 ICN = 2 3 n +2n + 3 n La comparación con el de Newton queda como Donde Newton es el azul y nuestro método es el rojo. Ahora sı́ vemos que nuestra familia es claramente peor que Newton. 10 2.4. Cuestión 4 Utilizando el fichero ((Sistemas.pdf)) seleccionad dos sistemas de ecuaciones no lineales, a vuestra elección. Sobre ellos: 2.4.1. Apartado a Programad (añadiendo el fichero .m a la carpeta comprimida) y ejecutad vuestra clase de métodos iterativos asignada (extendido a sistemas). Proporciona como salida: la aproximación computacional del orden de convergencia ACOC, las estimaciones del error ||x(k+1) − x(k) ||, y ||F (x(k+1) )||, el número de iteraciones y la solución aproximada. Utiliza, para encontrar la solución del sistema no lineal, dos valores diferentes del parámetro, a vuestra elección, una estimación inicial próxima a la solución conocida y otra más lejana, una tolerancia de 10−8 y el criterio de parada ||x(k+1) − x(k) || + ||F (x(k+1) )||. El programa devolverá lo pedido en el apartado, y se define como sigue Se incluye el operador de nuestra familia en el código Tomaremos como valores de β, arbitrariamente, β1 = 5 y β2 = 50: Para el primer sistema (c)), se empleará como aproximación cercano (2, 2) y como lejana (20, 40). En el segundo sistema, g), (2, −2, 0,5) será la estimación cercana, y (20, −20, 10) la lejana. En el siguiente apartado se compararán tanto los resultados obtenidos para cada una de las β y estimaciones, ası́ como las gráficas. 11 2.4.2. Apartado b Representa gráficamente la evolución de los iterados (una curva para cada componente del vector x(k) ) y, en otra gráfica, compara la evolución de las estimaciones del error. ¿Cómo se comporta el ACOC? ¿Y las tasas de convergencia? En primer lugar, resoveremos el sistema c) Lo implementamos en MatLab. En primer lugar, β = 5 y la aproximación cercana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bc_5.png Podemos ver una evolución hacia la solución, aunque el ACOC converge a dos (algo común en el resto de ejemplos, dada su poca aplicabilidad a sistema). 12 Seguimos con β = 5, pero con una aproximación lejana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bc_8.png 13 Cambiamos el valor de la constante a β = 50 y la aproximación será cercana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bc_11.png 14 Continuamos con β = 50 y la aproximación lejana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bc_14.png 15 Continuamos resolviendo el sistema g) Lo implementamos en MatLab. En primer lugar, β = 5 y la aproximación cercana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bg_5.png De manera similar al sistema anterior, tenemos un caso en que converge rápidamente, pero el ACOC va a dos. 16 Seguimos con β = 5, pero con una aproximación lejana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bg_8.png 17 Cambiamos el valor de la constante a β = 50 y la aproximación será cercana. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bg_11.png 18 En primer lugar, β = 50 y la aproximación lejana. Y este no es todo lo que devuelve el comando, pues el ACOC llega a agotar las 1000 iteraciones que le hemos dado. La comparación de las tasas, ACOC, errores, tasas de convergencia y evolución de las estimaciones es la que sigue. E4bg_15.png Aunque alrededor de la iteración 850 se alcanza un valor de iterado del orden de 1047 , lo que supone un error de aproximadamente 2×10117 , podemos ver como el método se corrige desde ese punto y vuelve a aproximarse rápidamente a la solución. Sin embargo, 1000 iteraciones no son suficientes para alcanzar la solución con la tolerancia permitida, y devuelve ”Necesito más iteraciones”. 19 2.4.3. Apartado c Compara los resultados anteriores con los del método de Newton. ¿Existe diferencia en los resultados si trabajamos con aritmética de precisión variable sin cambiar el número de dı́gitos? Compararemos la evolución de los iterados y errores, además de los ACOC, para cada sistema y estimación. En cada una se mostrarán los obtenidos con nuestra familia para los distintos valores de β y Newton. Veamos el sistema c) con estimación cercana (la misma estimación del apartado anterior para los tres casos). Para los β = 5 y β = 50 tenemos, respectivamente Y para Newton, obtenemos 20 Ahora, el sistema c) con estimación lejana. Para los β = 5 y β = 50 tenemos, respectivamente Con Newton, obtenemos 21 Veamos el sistema g) con estimación cercana (como en el resto de casos, es la misma estimación del apartado anterior para los tres casos). Para los β = 5 y β = 50 tenemos, respectivamente Y para Newton, obtenemos Como se ve, en este caso los tres son rápidos y obtienen la solución en pocas iteraciones. Sin embargo, cabe destacar que en este caso el ACOC del método de Newton va a cero. 22 Veamos el sistema g) con estimación cercana (como en el resto de casos, es la misma estimación del apartado anterior para los tres casos). Para los β = 5 y β = 50 tenemos, respectivamente Y para Newton, obtenemos Los resultados para β = 50 llegan a errores muy grandes, mientras que Newton lo calcula sin problemas en pocas iteraciones. En cuanto al uso de aritmética de precisión variable (vpa), no afectará a los resultados, aunque si podrı́a disminuir de manera mı́nima el número de iteraciones empleadas (un efecto que no notaremos para nada en la magnitud de las iteraciones con que estamso trabajando). 23 2.5. Cuestión 5 Modifica el fichero ((DinamicaNewton.nb)) de Mathematica en el que se analiza la estabilidad del método de Newton y adaptadlo para que estudie la estabilidad de vuestra familia parámetrica de métodos iterativos. En él, debéis estudiar la existencia y estabilidad de los puntos fijos del operador de punto fijo asociado a la familia, ası́ como de la existencia de puntos crı́ticos. Añadid el fichero resultante a la carpeta comprimida. 2.5.1. Apartado a ¿Cuál es la función racional asociada a tu método resultante de aplicarlo sobre p(x) = (x − a) ∗ (x − b)? Podemos realizar este apartado con lo que se ha ido haciendo en el fichero de Mathematica adjunto. Introducimos el polinomio Desarrollamos para nuestra familia Y obtenemos Que es la función racional que buscábamos. 24 2.5.2. Apartado b ¿Y tras la aplicación de la transformación de Möbius? Denotaremos por R a esta función racional. Ahora aplicamos la transformación de Möbius, denotando la función por R. Y obtenemos la función racional 2.5.3. Apartado c ¿Puedes deducir algo sobre el orden del método a partir de la función racional? Como la función racional tiene x4 como factor común que multiplica a toda la fracción, el orden de convergencia de nuestro método es 4. Además es claro que no existe valor alguno de β que pueda cambiar esto, por lo que el orden será siempre cuatro independientemente de la constante que tomemos. 25 2.6. Cuestión 6 Calcula los puntos fijos de la función racional R. 2.6.1. Apartado a ¿Todos los puntos fijos están directamente relacionados con las raı́ces del polinomio? ¿hay puntos fijos extraños? En caso afirmativo, ¿cuáles son? Para buscarlos, ejecutamos un comando Solve con la ecuación R del apartado anterior. Pues que hemos obtenido todos estos puntos fijos, falta ver si el infinito también lo es. Y se comprueba que también. Por tanto, 0 e infinito (raı́ces del polinomio) son puntos fijos, pero no son todos. Los siete puntos fijos extraños son el 1 y los obtenidos en forma de Root. 26 2.6.2. Apartado b Analiza la estabilidad de todos los puntos fijos, indicando con claridad las razones por las que se afirma que son atractores, repulsores, parabólicos,... Comenzamos por definir el operador derivada, que usaremos a menudo en el desarrollo del apartado. Vamos con los puntos fijos. Para z ∗ = 0, tenemos que es superatractor. Y para z ∗ = ∞, también es superatractor. Ahora continuamos con los puntos fijos extraños. Para z ∗ = 1 27 Al depender de β, debemos mirar su región de estabilidad en el plano complejo. Para hallar el disco, calculemos los valores de β reales que hacen |R′ (1)| = 1 A partir de este disco, hallamos su radio y centro, sabiendo que su parte imaginaria es simétrica luego saldrá como 0. Este punto fijo extraño es atractor dentro del disco, superatractor en β = 64, neutro o parabólico en el borde del disco y repulsor en el resto de valores. 28 Ahora comenzamos con los puntos fijos extraños que hemos obtenido en forma de root, el primero z2∗ . Obtenemos Puesto que depende de β, veamos cómo se comporta en el plano complejo. 29 Continuamos Buscamos el radio y el centro, sabiendo que la parte imaginaria es simétrica luego será nula, como antes. Este punto fijo extraño es atractor dentro del disco, superatractor en β = 113,946, neutro o parabólico en el borde del disco y repulsor en todo lo demás. 30 Continuamos con el tercer punto fijo extraño, z3∗ Y la raı́z es Como también depende de β, veamos su comportamiento en el plano complejo. Y estos plots devuelven 31 Trataremos de hallar los discos igualando numerador y denominador de R′ (pf e[[3]]) y comparando las gráficas Pero sale vacı́o. Probemos ahora con un Solve. Probemos con otro comando. 32 El 0 es solución trivial, por lo que estudiaremos las demás. Veamos qué ocurre en la zona. Ahora seguimos analizando. 33 Probamos con un rango de −1 para ver qué ocurre en −8, pero no obtenemos nada. Continuamos para cada caso Para acabar 34 Ahora el cuarto punto fijo extraño, z4∗ Cuyo valor es También depende de β, luego debemos observar su comportamiento en el plano complejo. Hacemos un plot de la zona. 35 Que nos devuelve dos ((capilares)) simétricos entre sı́. Tratamos de obtener el valor de β Ahora el otro plot 36 Volvemos a mostrar ambos. Continuamos 37 Mostramos a la vez A1 y A2. Volvemos a representar la zona Por lo que es repulsor para cualquier valor de β. 38 Ahora vamos con z5∗ , en forma también de root. Y su forma es Como se está haciendo habitual, depende de β, y debemos ver su comportamiento en el plano complejo. Como antes, tratamos de hallar valores de β. 39 Y el plot devuelve Mostramos los tres juntos en un mismo plot. Vamos con A3. 40 Junto A1 y A2, nos queda Para acabar, representamos la zona Tenemos que es superatractor en β = −0,602638 − 0,822773i y β = −0,602638 + 0,822773i, atractor dentro del disco, neutro o parabólico en el borde del disco y repulsor en lo demás. 41 Vamos con el sexto y penúltimo punto, z6∗ Que devuelve Al depender de β, analizamos su comportamiento en el plano complejo. 42 Continuamos El estudio de esta gráfica atractora, aunque sale para este punto fijo, está hecho en el punto fijo 2, ya que Mathematica los intercambia. Mostramos A1, A2, A3 y A4. 43 Obtenemos B4. Mostramos B1, B2, B3 y B4. 44 Finalizamos con el último punto fijo extraño, z7∗ Que por supuesto también es un root. Como depende de β, analizamos su comportamiento en el plano complejo. El estudio de esta gráfica atractora, aunque sale para este punto fijo, está hecho en el punto fijo 3, ya que analı́ticamente Mathematica lo saca para ese. Ası́ que el punto siempre es repulsor. 45 En resumen, destacamos los dos pares de conjugados. También está el entorno del valor 114. 46 Comparando las cuencas de atracción del punto fijo 1 y el punto fijo 7, se tocan en el 88. Desde arriba se ve más claramente. 47 2.7. Cuestión 7 Calcula los puntos crı́ticos del operador R. ¿Están todos los puntos crı́ticos directamente relacionados con las raı́ces del polinomio p(z) o existen puntos crı́ticos libres? Primero vamos a hallar los puntos crı́ticos. Introducimos el comando Obtenemos también soluciones en forma de Root. A los que hemos de añadir el infinito, como se ha visto antes. Los puntos crı́ticos libres son todos los obtenidos antes salvo los ceros. 48 Tratamos de hallar relaciones entre ellos, y ninguna da resultados salvo la siguiente. Lo que supone que 1, raı́z del polinomio es expresable con esos valores de β para los puntos crı́ticos 2 y 3. 49 2.8. Cuestión 8 Modifica el fichero de Matlab ((planodinam.m)) para adaptarlo a la función racional R de tu método. Utiliza este programa y valores de los parámetros distintos para generar sus respectivos planos dinámicos en los que se vean las cuencas de atracción de los puntos fijos atractores de R. Representa con un cı́rculo blanco los puntos fijos, con una estrella los atractores y con un cuadrado los puntos crı́ticos (libres o no) Incluimos primero el operador de nuestra función racional en el código de ((planodinam.m)), que se adjunta en la carpeta. Configuramos también los puntos que aparecen en el plot. El bucle nos permitirá ir calculando todos los puntos 50 Comprobaremos ahora lo que ocurre para distintos valores del parámetro de β. Primero, obtengamos varios con componente imaginaria nula. Para β = 1, el comando Nos devuelve el plano dinámico siguiente. 51 Continuamos con β = 56 Obtenemos 52 Seguimos con β = 64 Que devuelve 53 Para β = 88 Obtenemos 54 Para β = 90 Tenemos el plano dinámico 55 Para β = 114 Obtenemos 56 Y para un último valor real, β = 144 Obtenemos 57 Ahora probaremos con algún valor complejo. Veamos que para β = −0,60 − 0,82i Se obtiene 58 Y para su conjugado, β = −0,60 + 0,82i Se obtiene Que es claramente el simétrico del anterior respecto de la recta Im(z) = 0. 59 2.8.1. Apartado a ¿Hay alguna región negra en tus planos dinámicos? ¿sabrı́as decir a qué corresponde? Sı́ que hay regiones negras en nuestros planos, que corresponden a órbitas periódicas (de cualquier periodo) o puntos fijos extraños. Como ejemplo, para β = 90 nos habı́a salido Podemos ver la convergencia a un punto fijo extraño en la cuenca negra de la derecha. 60 2.8.2. Apartado b ¿En qué cuencas de atracción están los puntos crı́ticos? Por teorema visto en clase, toda cuenca de atracción contiene al menos un punto crı́tico. Para β = 64 tenı́amos el plano siguiente Como se puede ver en la figura, cada cuenca tiene un punto crı́tico. 61 2.8.3. Apartado c Si hubiese alguna región negra en el plano dinámico, ¿contiene a algún punto crı́tico? ¿Qué querrı́a decir que lo hubiese, en cuanto a la estabilidad del método? Como se ha dicho previamente, por teorema visto en clase, cada cuenca de atracción ha de contener al menos un punto crı́tico. La presencia de regiones negras en el plano afectarı́a mucho a la estabilidad, pues eso provocarı́a que al caer en esa zona tuviésemos una órbita iterativa o una convergencia a un punto fijo extraño. Por tanto, lo preferible serı́a que las áreas negras sean lo más pequeñas posible. En la imagen se puede ver la órbita de periodo 2 alrededor del punto fijo. 62 2.9. Cuestión 9 Partiendo de cada crı́tico libre independiente de tu método, genera un plano de parámetros asociado a la familia de métodos asignada. Utiliza para ello el programa ’planoparam.m’. 2.9.1. Apartado a ¿Qué significa, para la familia de métodos y su estabilidad la existencia de regiones rojas y su amplitud? ¿Y las zonas negras? Las zonas rojas son aquellas en las que β tiende a cero o infinito, raı́ces del polinomio; mientras que las negras son las de convergencia a punto fijo atractor u órbita periódica. Para una mayor estabilidad, queremos que haya más zonas rojas, pues eso indica que el método es más estable. Tenemos aquı́ el plano paramétrico de las raı́ces segunda y séptima (que son conjugadas, como se verá más adelante). Como se ha dicho, las zonas negras convergen a 0 o ∞, y las rojas convergen o entran en órbitas. En este plano hay bastante zona roja, luego podemos decir que será aceptablemente estable en la mayorı́a de la región. 63 2.9.2. Apartado b Identifica las regiones del plano de parámetros que se corresponden con la estabilidad de los puntos fijos extraños. Analizaremos lo que obtenemos para cada uno de los puntos crı́ticos libres, donde tenı́amos los roots. Para cada caso, se mostrará un plano el plano de parámetros generado por el punto y un detalle del mismo. Veamos que ocurre con el primer punto. Vamos con el segundo 64 Cabe destacar, por la propia naturaleza de los roots, como ((encajan)) los dos últimos planos. Como es notorio, la ”mariposa”del segundo punto encaja en la ”media luna”que nos queda en el primero, siendo continuas las zonas engras y rojas correspondientes. Para el tercer punto Mientras que con el cuarto 65 Ahora el quinto Continuamos con el sexto El séptimo 66 Si comparamos los planos obtenidos con los puntos segundo y séptimo, respectivamente Que son, aun con rangos distintos, claramente iguales. Esto se debe a que las raı́ces son conjugadas entre sı́, por lo que los planos coinciden. Por último, veamos lo que ocurre en el octavo punto. Al igual que ocurrı́a con los puntos segundo y séptimo, los planos de parámetros para el primero y el octavo también coinciden. Ya que estos puntos también son conjugados entre sı́. 67 2.9.3. Apartado c Localiza una región del plano de parámetros (mediante ensayo y error) en la que los miembros de la familia de esquemas iterativos correspondientes tengan órbitas de periodo 3. ¿Qué significa eso para estabilidad de la familia? La existencia de una órbita de periodo 3 determina que deben existir órbitas de cualquier otro periodo, por teorema visto en clase. La órbita siguiente se obtuvo con β = −0,26, para el operador caracterı́stico de nuestra familia. Además también se han podido obtener órbitas de periodos 2 y 4, para β = −7,5 y β = respectivamente. 68 2.10. Cuestión 10 Selecciona del plano anterior tres valores del parámetro de la zona roja y otros tres de la zona negra. Repite las pruebas numéricas del apartado 4 utilizando esos elementos de la familia paramétrica. ¿Puedes sacar alguna conclusión? 69 3. Final 3.1. Conclusión En este trabajo hemos podido utilizar los conocimientos de la segunda mitad de la asignatura al caso de la familia 10, y todo los detalles que implicaban estas dos fórmulas aparentemente sencillas. Ası́, hemos permitido afianzar conocimientos y aplicarlos a lo que podrı́a considerarse un trabajo de investigación matemática: aunque la conclusión final sobre esta familia haya sido que carece de utilidad, las investigaciones infructuosas son algo común en la ciencia y más aún en las matemáticas. Solo mediante muchas de estas búsquedas, abundante trabajo y un poco de suerte se puede encontrar algo novedoso y útil. 3.2. Fe de erratas Como se ha explicado en la introducción, se explicarán aquı́ los cambios hechos en el desarrollo del trabajo respecto a lo explicado la presentación. Ası́, se han corregido los siguientes elementos Se ha completado el desarrollo de la ecuación del error en la cuestión 2, ası́ como un pequeño fallo (con mı́nimas implicaciones) en las cuentas para obtener X4 , por haber sumado 6C2 C3 y 6C3 C2 como si fueran conmutativos. En la cuestión 3, se ha modificado el cálculo del número de evaluaciones, d, en ambos ı́ndices. Anteriormente, se contaban como múltiples las evaluaciones de F ′ (xk ) y F (xk ), cuando no serı́a necesario calcularlas más que una vez. El punto b) de la cuestión 4 ha sido ampliado con las tasas de convergencia para mostrar en más detalle lo que ocurre con los ACOC. En el apartado c) de la cuestión 9, se ha encontrado una órbita de periodo 3. De igual manera, se exponen las órbitas de orden 2 y 4 de las que se habló en la presentación. 3.3. Referencias y bibliografı́a Para la elaboración de este trabajo se han usado las transparencias de la asignatura Resolución Numérica de Sistemas Lineales y No Lineales, de Alicia Cordero y Juan Ramón Torregrosa; ası́ como Computer Systems: an introduction to computers for engineering curricula, escrito por J.A. Vila Carbó. 70