I Fundamentos de Matemáticas para Ciencias e Ingeniería César Emilio Villarreal Rodríguez Profesor de la Facultad de Ingeniería Mecánica y Eléctrica de la Universidad Autónoma de Nuevo León Sara Verónica Rodríguez Sánchez Profesora de la Facultad de Ingeniería Mecánica y Eléctrica de la Universidad Autónoma de Nuevo León II Prólogo Prólogo «῎Εδοξε καμοὶ παρηκολουθηκότι ἄνωθεν πᾶσιν ἀκριβῶς καθεξῆς σοι γράψαι, κράτιστε Θεόφιλε, ἵνα ἐπιγνῷς περὶ ὧν κατηχήθης λόγων τὴν ἀσφάλειαν.» «También yo he resuelto escribírtelos por su orden, ilustre Teófilo, después de investigarlo todo diligentemente desde el principio, para que conozcas la solidez de las enseñanzas que has recibido» (Evangelio según San Lucas 1.34). El presente libro está dirigido a las personas interesadas en aprender a leer y escribir de manera clara y con actitud crítica, en cualquier tema de matemáticas que sea de su preferencia. Para lograr lo anterior, se trata de construir el «edificio de las Matemáticas» desde sus cimientos, después poco a poco ir avanzando en profundidad y amplitud de conocimientos. Se abordan los temas con rigor y siguiendo un orden lógico, de manera que en la medida de lo posible evitemos ambigüedades tanto conceptuales como de notación. Se pretende que este libro sirva además como fuente de consulta sobre teoremas, fórmulas y definiciones de manera que el lector al consultarlo no solamente encuentre en éste una fórmula o resultado sino también una demostración rigurosa del mismo. En la mayoría de los libros de matemáticas, cuando encontramos resultados cuya demostración parece difícil o es laboriosa, comúnmente nos topamos con frases como «la demostración no está dentro de los objetivos del curso», «la demostración va más allá de los alcances del libro, el lector interesado puede leer un libro con tales o cuales características», «el resultado es intuitivamente claro, por lo que omitimos su demostración» o simplemente «omitimos su demostración». En nuestro caso, los pocos teoremas que no se demuestren no será por causa de que sea de un alto grado de dificultad, sino por que consideramos que el lector que es capaz de comprender el tema en cuestión también es capaz de demostrarlo por sí mismo, ya sea por ser un caso particular o consecuencia inmediata de otro teorema, o bien por que la metodología que pudiese ser utilizada para la demostración ya ha sido empleada anteriormente. Lo anterior es con la intención de hacer del presente un libro completo y autocontenido. Se recomienda para una buena comprensión del libro, que cuando se le consulte o lea no sea por medio de frases aisladas, sino en el contexto de al menos toda la sección. También se recomienda al lector que antes de leer la demostración de algún teorema o resultado intente demostrarlo por sí mismo, tomando en cuenta que muchas veces un mismo resultado puede ser demostrado de varias formas distintas. No hay un requisito previo para la lectura de este libro, aunque es recomendable, que haya llevado cursos de matemáticas a nivel medio y tenga una cultura general de al menos ese nivel. El primer capítulo comienza con una breve descripción del razonamiento lógico y deductivo. En el capítulo 2 se establecen los axiomas que describen el concepto de función y de conjunto, los cuales son fundamentales en todas las matemáticas de la actualidad. Tales axiomas se escogieron tratando de que fueran claros a la intuición y que fueran resultados aceptados y usados por la comunidad matemática, ya sea en forma explícita o implícita. El capítulo 3 trata sobre los principales resultados de los números naturales basándose en los llamados axiomas de Peano. En él se introduce además el concepto de pareja ordenada, operación, conjunto infinito, factorial y se establecen técnicas de conteo, entre otras cosas. En el capítulo 4 se estudia las propiedades de los números reales, exceptuando el axioma del supremo, el cual se ve hasta el capítulo 7. Al final del capítulo 4 se abordan algunos temas de teoría de números. III Los capítulos 5 y 6 abarcan los temas que tradicionalmente se ven en los cursos de álgebra, aunque algunos temas como lo son los de progresiones aritméticas y geométricas se ven en el capítulo 8, en el cual se introducen los conceptos de sucesiones y series. En el capítulo 9 se definen las funciones logarítmicas y las exponenciales, aunque no de la forma tradicional que es a través de integrales definidas, sino de una forma más natural basada en aproximaciones. El capítulo 10 cubre un poco más de los temas que generalmente se ven en un curso cálculo diferencial, a excepción de los temas relacionados con las funciones trigonométricas, los cuales pueden ser estudiados en el capítulo 15. En los cursos de cálculo generalmente se estudian primero los temas del capítulo 10, después lo concerniente a integrales y después la mayor parte de los temas que aparecen en los capítulos 7 y 9. Creemos que el orden seguido en este libro es el más adecuado lógica e intuitivamente, aunque no necesariamente sigue el orden en que históricamente se han desarrollado los temas. El capítulo 11 aborda la geometría elemental sin definir conceptos elementales como el de distancia, punto recta plano y espacio, pero estableciendo sus propiedades y relaciones entre ellos en base a postulados que los describen. En el capítulo 12 se definen con precisión los conceptos de determinante y matriz, además de establecer sus principales propiedades y proveer de métodos para resolver sistemas de ecuaciones lineales. El capítulo 13 es una breve introducción a las estructuras algebraicas. El capítulo 14 aborda los temas y resultados topológicos más importantes. El capítulo 15 trata de la geometría analítica en Rn y estudia como casos particulares la geometría analítica plana y la trigonometría. El capítulo 16 desarrolla parte de la teoría de homotopías, y haciendo uso de algunos resultados se demuestra el teorema de la curva de Jordan y se introduce el concepto de índice de un camino cerrado simple en el plano. El capítulo 17 aborda temas relacionados con la integral definida e indefinida. En el capítulo 18 se estudia el cálculo en varias variables, donde se demuestran teoremas importantes como son el de los multiplicadores de Lagrange, el de Green y el de Fubini para funciones Riemann-integrables, así como el teorema de cambio de variables. En el capítulo 19 se estudian los números complejos y sus principales propiedades. El capítulo 20 da una breve introducción a la teoría de conjunto de Zermelo-Fraenkel y, basándose en dicha teoría, se demuestran los axiomas dados en los capítulos anteriores. Al final del libro hay unos apéndices. En el apéndice A se da una lista de símbolos usados en el texto con su significado. En el apéndice B se enlistan las letras del alfabeto helénico con sus nombres en español. En el apéndice C se da una bibliografía complementaria al texto. En el apéndice D se da un índice alfabético, donde se indica en qué sección se define o introduce cada concepto. «Τὸ σὲ σύντομον τῆς λέξεως μεταδιώκειν κα`ı τὸ ἐξεργαστικὸν τῆς πραγματε΄ıας παραιτεῖσθαι τῷ τὴν μετάφρασιν ποιουμένῳ συγχωρητέον. ἐντεῦθεν οὖν ἀρξώμεθα τῆς διηγήσεως τοῖς προειρημένοις τοσοῦτον ἐπιζεύξαντες· εὔηθες γὰρ τὸ μὲν πρὸ τῆς ἱστορίας πλεονάζειν, τὴν δὲ ἱστορίαν ἐπιτεμεῖν.» «Al divulgador le compete una exposición concisa, renunciando al tratamiento exhaustivo. Comencemos, pues, desde ahora el relato, tras abundar tanto en los preliminares; pues sería absurdo alargar el prólogo y abreviar la historia» (Segundo Libro de los Macabeos 2.31-32). IV Contenido Contenido Prólogo Contenido II IV 1. Razonamiento lógico y deductivo 1 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1 3 4 5 6 7 8 Introducción Proposiciones Negación Conjunción y disyunción Implicación Proposiciones equivalentes Razonamientos válidos y falacias 2. Conjuntos y funciones 13 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. Introducción Conjuntos Funciones Predicados Los cuantificadores universal y existencial El recorrido de una función Uniones e intersecciones arbitrarias Notaciones de uso común 13 15 16 19 26 28 30 32 3. Elementos de matemáticas discretas 33 3.1. Axiomas de Peano 3.2. Parejas ordenadas 3.3. Relaciones 3.4. Definiciones recursivas 3.5. Multiplicación de números naturales 3.6. Operaciones 3.7. Conjuntos finitos y conjuntos infinitos 3.8. Técnicas de conteo 3.9. Segundo método de inducción matemática 3.10. Conjuntos infinito numerables 3.11. Diagramas 33 35 39 45 50 54 57 61 74 75 77 Contenido V 4. El conjunto de los números reales 83 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 83 86 90 93 94 97 99 Introducción Operaciones en el conjunto de números reales Desigualdades Subconjuntos de números reales Exponentes enteros El valor absoluto Aritmética 5. Álgebra de números reales 109 5.1. Radicales 5.2. Exponentes racionales 5.3. Expresiones algebraicas 5.4. Notación científica 5.5. Polinomios 5.6. Productos notables 5.7. Factorización 5.8. Factorización de expresiones especiales 5.9. Simplificación de expresiones fraccionarias por factorización 5.10. Teorema del binomio 109 111 113 114 115 116 117 118 119 120 6. Ecuaciones y desigualdades 123 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. 6.7. 6.8. 123 124 125 128 130 137 138 143 Introducción Ecuaciones lineales Ecuaciones cuadráticas Otras ecuaciones Resolución de desigualdades Desigualdades con valor absoluto División de polinomios Sistemas de ecuaciones lineales 7. Axioma del supremo 145 7.1. Conjuntos acotados 7.2. Raíces cuadradas 7.3. Exponentes racionales 145 150 152 VI Contenido 8. Sucesiones y series 155 8.1. 8.2. 8.3. 8.4. 8.5. 8.6. 8.7. 8.8. 8.9. 155 157 159 162 166 170 174 189 191 Introducción Progresiones aritméticas Progresiones geométricas Convergencia de sucesiones Tipos de divergencia Series Criterios de convergencia La constante de Napier Sistema decimal 9. Funciones exponenciales y logarítmicas 195 9.1. 9.2. 9.3. 9.4. 9.5. 9.6. 195 196 198 201 203 205 Introducción Definición de potencias con exponentes reales Propiedades de los exponentes Funciones exponenciales Aplicaciones de la función exponencial Funciones logarítmicas 10. Funciones y sus gráficas 209 10.1. Introducción 10.2. Asíntotas horizontales 10.3. Asíntotas verticales 10.4. Límites finitos 10.5. Continuidad 10.6. Sucesiones y límites de funciones de variable real 10.7. La función exponencial natural 10.8. Algunos tipos de discontinuidades 10.9. Velocidad y aceleración 10.10. La recta tangente 10.11. Definición de derivada 10.12. Teoremas sobre derivadas 10.13. Máximos y mínimos relativos 10.14. Formas indeterminadas 209 213 217 221 224 232 234 237 238 240 242 244 249 255 Contenido VII 11. Elementos de geometría 261 11.1. Introducción 11.2. Segmentos y rayos 11.3. Planos 11.4. Conjuntos convexos 11.5. Ángulos y triángulos 11.6. Circunferencias 11.7. Longitud de arco 11.8. Medidas de ángulos 11.9. Congruencia de triángulos 11.10. Postulados y teoremas de congruencia de triángulos 11.11. Perpendicularidad 11.12. Desigualdades geométricas 11.13. Rectas paralelas 11.14. Cuadriláteros 11.15. Semejanza y proporcionalidad 11.16. Áreas 11.17. Área del círculo y sectores circulares 11.18. Sistemas de coordenadas 11.19. Volúmenes 261 263 267 269 271 272 273 276 280 282 285 289 293 300 303 309 313 315 320 12. Matrices y determinantes 327 12.1. 12.2. 12.3. 12.4. 12.5. 12.6. 12.7. 12.8. 12.9. 327 329 330 331 334 335 338 343 345 Introducción Suma y resta de matrices Multiplicación por escalar Multiplicación de matrices La transpuesta de una matriz Permutaciones Determinantes Matrices y sistemas de ecuaciones lineales Operaciones elementales por renglón 13. Conjuntos y estructuras 353 13.1. 13.2. 13.3. 13.4. 13.5. 13.6. 353 354 363 366 370 379 Introducción Grupos Homomorfismos Anillos Espacios vectoriales Transformaciones lineales VIII Contenido 14. Topología 389 14.1. 14.2. 14.3. 14.4. 14.5. 14.6. 389 390 399 411 424 432 Introducción Espacios métricos Funciones en espacios métricos Espacios topológicos Topología producto Topología cociente 15. Análisis geométrico 435 15.1. Distancia entre dos puntos 15.2. Álgebra en Rn 15.3. Trayectorias y sus longitudes 15.4. Ortogonalidad 15.5. Isometrías entre planos 15.6. Medidas de ángulos 15.7. Conceptos generales 15.8. Funciones trigonométricas 15.9. Gráficas de las funciones trigonométricas y sus inversas 15.10. Ecuaciones de la recta 15.11. Ecuaciones de la circunferencia 15.12. Ecuaciones de la parábola 15.13. Ecuaciones de la elipse 15.14. Ecuaciones de la hipérbola 15.15. Funciones hiperbólicas 15.16. Rotaciones y reflexiones en R2 15.17. La ecuación general de segundo grado 15.18. El cilindro en R3 15.19. Rotaciones y reflexiones en Rn 15.20. El cono circular recto en R3 15.21. El elipsoide en R3 15.22. El hiperboloide elíptico en R3 15.23. El paraboloide elíptico en R3 15.24. El paraboloide hiperbólico en R3 15.25. Coordenadas polares 15.26. Coordenadas cilíndricas y esféricas 15.27. Conjuntos abiertos y conjuntos cerrados en Rn 15.28. Áreas y volúmenes 15.29. La medida de Lebesgue en Rn 435 438 448 455 460 467 475 478 487 497 502 504 507 514 520 523 525 528 530 532 534 535 537 538 539 542 543 548 568 Contenido IX 16. Homotopías 579 16.1. 16.2. 16.3. 16.4. 16.5. 16.6. 16.7. 16.8. 16.9. 579 582 584 585 589 592 601 603 612 Caminos homotópicos Clases de homotopía El grupo fundamental Funciones cubrientes y levantamientos El índice de un camino cerrado El teorema de la curva de Jordan Separación de conjuntos Grafos lineales Aproximación por poligonales 17. Integración 623 17.1. 17.2. 17.3. 17.4. 17.5. 17.6. 17.7. Antiderivadas La integral de Riemann Cálculo de la longitud de un arco La integral de Riemann-Stieltjes Desarrollo de Taylor Integrales impropias La función gamma 623 629 644 650 664 668 672 18. Funciones de varias variables 675 18.1. 18.2. 18.3. 18.4. 18.5. 675 681 697 701 711 Integración sobre caminos Derivadas de funciones de varias variables El teorema de los multiplicadores de Lagrange Integración de funciones de varias variables Cambio de variables 19. Los números complejos 729 19.1. 19.2. 19.3. 19.4. 19.5. 19.6. 19.7. 19.8. 729 735 738 751 753 759 765 789 Introducción El plano complejo extendido Sucesiones y series de números complejos Funciones complejas de variable compleja Polinomios complejos Funciones holomorfas Integración compleja Ceros y singularidades aisladas 20. Teoría de conjuntos 805 20.1. 20.2. 20.3. 20.4. 20.5. 805 811 814 819 827 Axiomas de Zermelo-Fraenkel y de elección Construcción de los números naturales y enteros Cardinalidad y conjuntos bien ordenados Proposiciones equivalentes al axioma de elección Construcción de los números racionales X Contenido 20.6. Construcción de los números reales 20.7. Construcción de los números complejos 829 835 Epílogo 836 Apéndice A. Lista de símbolos 838 Apéndice B. Alfabeto helénico 861 Apéndice C. Bibliografía 863 Apéndice D. Índice alfabético 865 XI Dedicado a Efraín, Rosaura, Oralia, Beatriz y Salvador -1 0 Capítulo 1 RAZONAMIENTO LÓGICO Y DEDUCTIVO 1.1. Introducción En las matemáticas para que una afirmación nueva tenga aceptación universal es necesario que se haya demostrado lógicamente basándose en conocimientos previamente aceptados. Tal demostración debe tener un rigor lógico de tal manera que la veracidad de la afirmación no tenga lugar a dudas. Un ejemplo no es aceptado como demostración lógica debido a que sólo muestra el cumplimiento de la afirmación en un caso particular y es posible que en otros casos la afirmación sea falsa. Por ejemplo, si tomamos la afirmación «todos los mamíferos son rumiantes» y tomamos como ejemplo a una cebra, no podemos concluir que debido a que la cebra es rumiante, entonces todos los mamíferos son rumiantes. En las ciencias naturales cuando se quiere probar el cumplimiento de una hipótesis se realiza una serie de experimentos. Una vez hechos los experimentos, si en todos ellos se verificó la hipótesis, ésta es aceptada (los principios de Arquímedes y la ley de la gravitación universal, por ejemplo, no se pueden demostrar matemáticamente sino que son aceptados en base a observaciones, aunque sí son descritos por fórmulas matemáticas). En las matemáticas y en la lógica esta forma de proceder no es aceptada. Es decir, no es suficiente con verificar varios ejemplos, aunque sean muchos, para aceptar una suposición. Analicemos, por ejemplo, la afirmación «si n es un número natural, entonces n2 ´n`11 es un número primo» (un número primo es un número natural mayor que 1 que sólo es divisible por 1 y por sí mismo). Si tomamos n “ 1, tenemos n2 ´ n ` 11 “ 12 ´ 1 ` 11 “ 11; si tomamos n “ 2, tenemos n2 ´ n ` 11 “ 22 ´ 2 ` 11 “ 13; si tomamos n “ 3, tenemos n2 ´ n ` 11 “ 32 ´ 3 ` 11 “ 17; si tomamos n “ 4, tenemos n2 ´ n ` 11 “ 42 ´ 4 ` 11 “ 23; si tomamos n “ 5, tenemos n2 ´ n ` 11 “ 52 ´ 5 ` 11 “ 31; si tomamos n “ 6, tenemos n2 ´ n ` 11 “ 62 ´ 6 ` 11 “ 41. 1 2 1.1. Introducción Los números 11, 13, 17, 23, 31 y 41 son primos. En los 6 ejemplos anteriores el resultado de n2 ´n`11 fue un número primo pero no es suficiente para concluir que n2 ´n`11 es primo para todo número natural n, de hecho lo único que demuestra es que n2 ´n`11 es primo cuando n es 1, 2, 3, 4, 5 ó 6. Podemos observar que si n “ 11, entonces n2 ´n`11 “ p11q2 ´11`11 “ p11q2 el cual no es un número primo. Vale la pena aclarar que aún y cuando la conclusión de un razonamiento sea algo verdadero, este razonamiento no se considera una demostración si el razonamiento no fue correcto. Parte del razonamiento lógico involucra la expresión por medio de símbolos. Supondremos que el lector distinguirá con sus sentidos cuando dos símbolos sean iguales o diferentes y no habrá polémica alguna en ese sentido, por ejemplo, distinguirá la escritura de las letras α, β, γ, etc. En las secciones siguientes de este capítulo se abordarán los conceptos básicos referentes al razonamiento lógico. 1.2. Proposiciones 1.2. 3 Proposiciones «Le grand fondement des Mathématiques est le principe de contradiction ou de l’identité, c’est-à-dire qu’une énonciation ne saurait être vraie et fausse en même temps; et qu’ainsi A est A et ne saurait être non A. Et ce seul principe suffit pour démontrer toute l’Arithmétique et toute la Géométrie, c’est-à-dire tous les principes Mathématiques.» «El gran fundamento de las matemáticas es el principio de contradicción o identidad, esto es, que una proposición no puede ser verdadera y falsa al mismo tiempo, y que, en consecuencia, A es A y no puede ser no A. Y ese único principio es suficiente para demostrar cualquier parte de la aritmética y de la geometría, es decir, todos los principios matemáticos» (fragmento de la Segunda carta de Leibniz a Clarke 1). En lógica una proposición es una oración, frase o cualquier afirmación que tiene asignado un único valor de verdad, donde los valores de verdad pueden ser solamente verdadero o falso. Es decir toda proposición es verdadera o falsa pero no puede ser verdadera y falsa a la vez. Tenemos los siguientes ejemplos de proposiciones: 1. El caballo es un mamífero. 2. Todos los reptiles pueden volar. 3. 2 ` 5 “ 7. 4. 3 ´ 1 ą 7. 5. El agua es necesaria para la vida humana. El sentido común nos dice que las proposiciones 1, 3 y 5 son verdaderas, mientras que las proposiciones 2 y 4 son falsas. No son aceptadas como proposiciones las afirmaciones que emitan un juicio o digan algo sobre sí mismas. Por ejemplo, si la oración «estoy diciendo una mentira» se refiere a que la oración misma es falsa, entonces no se le puede asignar un valor de verdad puesto que si fuera falsa, entonces estaría diciendo una mentira, lo cual confirmaría la oración y sería verdadera. Por otro lado, si la oración fuese verdadera, entonces estaría diciendo una mentira, lo cual haría falsa a la oración. Es decir tal afirmación sería falsa y verdadera a la vez. En el lenguaje usual, cuando alguien dice «estoy diciendo una mentira» generalmente se refiere a que otra expresión que se dijo con anterioridad es mentira. Cuando una proposición es expresada por medio de símbolos matemáticos (no en forma gramatical) a la expresión le llamamos fórmula. A veces a las proposiciones se les representa por letras como p, q, r, s, t, etc. 4 1.3. Negación 1.3. Negación «Les vérités de Raisonnement sont nécessaires et leur opposé est impossible, et celles de Fait sont contingentes et leur opposé est possible. Quand une vérité est nécessaire, on en peut trouver la raison par l’analyse, la résolvant en idées et en vérités plus simples, jusqu’à ce qu’on vienne aux primitives.» «Las verdades de razonamiento son necesarias, y su opuesto es imposible, y las de hecho son contingentes y su opuesto es posible. Cuando una verdad es necesaria, se puede hallar su razón por medio de análisis, resolviéndola en ideas y verdades más simples, hasta que se llega a las primitivas» (Gottfried Leibniz, La Monadología 33, 1714). Si p es una proposición, a la proposición que afirma que p es falsa se le llama la negación de p y se le representa por el símbolo p, el cual se lee «no p». Se tienen las siguientes reglas lógicas: Si p es verdadera, entonces Si p es falsa, entonces p es falsa. p es verdadera. Lo anterior se ilustra en la tabla siguiente, donde V significa que la proposición es verdadera y F que es falsa. p V F p F V Para los cinco ejemplos de proposiciones dadas en la sección anterior sus negaciones se pueden expresar respectivamente como: 1. El caballo no es un mamífero. 2. Algunos reptiles no pueden volar. 3. 2 ` 5 ‰ 7. 4. 3 ´ 1 ĺ 7. 5. El agua no es necesaria para la vida humana. 1.4. Conjunción y disyunción 1.4. 5 Conjunción y disyunción Si p y q son dos proposiciones, la conjunción de p y q, representada por p ^ q ó por p &q es una proposición cuyo valor de verdad es verdadero si tanto p como q son verdaderos y de falso si al menos una de las proposiciones es falsa. La proposición p ^ q se lee «p y q» y afirma que ambas proposiciones p y q son verdaderas. Por otra parte, la disyunción de p y q, representada por p _ q, es una proposición cuyo valor de verdad es de verdadero cuando al menos una de las dos proposiciones ya sea p ó q es verdadera y de falso cuando tanto p como q son falsas. La proposición p _ q se lee «p ó q» y afirma que al menos una de las proposiciones p ó q es verdadera. Lo anterior se ilustra en las tablas siguientes, donde V significa que la proposición es verdadera y F que es falsa. p V V F F q V F V F p^q V F F F p V V F F q V F V F p_q V V V F 6 1.5. 1.5. Implicación Implicación Al símbolo ùñ se le conoce como símbolo de implicación. Si p y q son dos proposiciones, la expresión p ùñ q es de nuevo una proposición cuyo valor de verdad es de falso si p es verdadero y q es falso, y en todos los otros casos el valor de verdad es de verdadero. La proposición p ùñ q se lee «p implica q» o bien «q ó no p (es decir q _ p)» o bien «si p, entonces q» y afirma que la proposición q es verdadera cuando lo es la proposición p. Observemos que si p es verdadera, entonces p ùñ q es verdadera solamente si q es también verdadera, lo que indica que a partir de una proposición verdadera se debe concluir una proposición verdadera. Pero si p es falsa, entonces p ùñ q es verdadera, independientemente de si q es verdadera o falsa, lo que indica que a partir de una proposición falsa se puede concluir cualquier proposición, ya sea verdadera o falsa. Otra forma de leer e interpretar el significado de la expresión p ùñ q es diciendo «p es suficiente para que se cumpla q» o bien «q es necesario para que se cumpla p». Cuando tengamos una proposición de la forma p ùñ q, a la proposición p se le llama hipótesis, premisa, condición o antecedente y a la proposición q se le llama conclusión o consecuente. Lo anterior se ilustra en la tabla siguiente, donde V significa que la proposición es verdadera y F que es falsa. p V V F F q V F V F p F F V V q_ p V F V V es decir, p V V F F q V F V F p ùñ q V F V V La recíproca de una proposición de la forma p ùñ q, se define como la proposición q ùñ p. 1.6. Proposiciones equivalentes 1.6. 7 Proposiciones equivalentes Decimos que dos proposiciones p y q son equivalentes, denotándose p ðñ q, cuando p ùñ q y q ùñ p. Es decir p ðñ q es verdadera cuando la proposición pp ùñ qq ^ pq ùñ pq es verdadera. Podemos observar que p ðñ q es verdadera cuando p y q tienen el mismo valor de verdad. En efecto, si ambas proposiciones p y q tienen el mismo valor de verdad, entonces las proposiciones p ùñ q y q ùñ p son verdaderas, por lo que pp ùñ qq ^ pq ùñ pq es verdadera. Ahora bien, si las proposiciones p y q tienen diferente valor de verdad, entonces alguna de las proposiciones p ùñ q ó q ùñ p es falsa por lo que pp ùñ qq ^ pq ùñ pq es falsa, es decir si las proposiciones p y q tienen diferente valor de verdad, entonces p ðñ q es falsa (a saber p ùñ q es falsa si q es falsa y p verdadera, y q ùñ p es falsa si p es falsa y q verdadera). La expresión p ðñ q a veces se lee como «p si y sólo si q» o como «p es necesario y suficiente para q». Lo anterior se resume en la tabla siguiente, donde V significa que la proposición es verdadera y F que es falsa. p V V F F q V F V F p ðñ q V F F V Observemos lo importante que es el uso adecuado de paréntesis o símbolos de agrupación, por ejemplo la proposición pp ùñ pq ^ pqq ùñ p no es equivalente a la proposición pp ùñ qq^pq ùñ pq cuando p es verdadera y q es falsa, puesto que en dicho caso pp ùñ pq^pqq ùñ p sería verdadera y pp ùñ qq ^ pq ùñ pq sería falsa (como lo podrá verificar el lector). 8 1.7. Razonamientos válidos y falacias 1.7. Razonamientos válidos y falacias Una tautología es una expresión que es siempre verdadera, independientemente del valor de verdad de las proposiciones que la forman, por ejemplo: a) «Si Ramiro está loco, entonces Ramiro está loco.» Esta proposición es del tipo p ùñ p, la cual es siempre verdadera independientemente del valor de verdad de p. b) «La rosa es una flor o no es una flor.» Esta proposición es del tipo p _ p, la cual también es siempre verdadera, independientemente del valor de verdad de p. c) «Si x es un zorro, y el hecho de que x sea zorro implica que x es canino, y el hecho de que x sea canino implica que x es carnívoro, entonces x es carnívoro.» La afirmación anterior es del tipo pp ^ pp ùñ qq ^ pq ùñ rqq ùñ r, la cual es siempre verdadera, independientemente de los valores de verdad de p, q y r. Una contradicción es una expresión que es siempre falsa, independientemente de los valores de verdad de las proposiciones que la forman, por ejemplo: a) «Alejo está loco y si Alejo está loco, entonces no está loco.» Esta proposición es del tipo p ^ pp ùñ pq, la cual es siempre falsa, independientemente del valor de verdad de p. b) «La margarita es una flor y no es una flor.» Esta proposición es del tipo p ^ p, la cual es siempre falsa, independientemente del valor de verdad de p. Observemos que la negación de una tautología es una contradicción, mientras que la negación de una contradicción es una tautología. Una contingencia es una expresión formal cuyo valor de verdad depende de los valores de verdad que tengan las proposiciones que la forman, donde para algunos valores de verdad de tales proposiciones la expresión es verdadera, mientras que para otros la proposición formada es falsa. Como ejemplos de contingencias tenemos: a) «Está haciendo frío y está lloviendo.» Esta expresión es del tipo p ^ q. b) «Si conduces correctamente, entonces no tendrás accidentes.» Esta proposición es del tipo p ùñ q. c) «Los alacranes no pican dos veces a la misma persona.» Esta proposición es del tipo p. d) «O juegas futbol o juegas beisbol.» Esta proposición es del tipo p _ q. Veremos a continuación algunos tipos de argumentos válidos en lógica que sirven para obtener conclusiones: Un tipo de razonamiento válido es el llamado modus ponens, que consiste en que si tenemos dos proposiciones p y q, y suponemos que son verdaderas las proposiciones p y p ùñ q, entonces podemos concluir que la proposición q también es verdadera. Dicho razonamiento se basa en el hecho de que la proposición pp ^ pp ùñ qqq ùñ q es una tautología, en efecto, veamos la siguiente tabla de verdad que muestra dicha tautología. 1.7. Razonamientos válidos y falacias p V V F F q V F V F p ùñ q V F V V 9 p ^ pp ùñ qq V F F F pp ^ pp ùñ qqq ùñ q V V V V Ejemplos de razonamientos mudus ponens son: a) Los perros tienen pelo; pero si los perros tienen pelo, entonces son mamíferos. Por lo tanto, los perros son mamíferos. b) Tito es de Piriápolis y si Tito es de Piriápolis, entonces es uruguayo. Por lo tanto Tito es uruguayo. Otro tipo de razonamiento válido es el llamado modus tollens, que consiste en que si tenemos dos proposiciones p y q, donde q es falsa, pero p ùñ q es verdadera, entonces podemos concluir que la proposición p es falsa. Dicho razonamiento se basa en el hecho de que pp qq ^ pp ùñ qqq ùñ p es una tautología. En efecto, veamos la tabla siguiente que muestra dicha tautología. p V V F F q V F V F q F V F V p ùñ q V F V V p qq ^ pp ùñ qq F F F V p F F V V pp qq ^ pp ùñ qqq ùñ V V V V p Ejemplos de razonamientos mudus tollens son: a) Si las garzas tienen pelo, entonces son mamíferos; pero las garzas no son mamíferos. Por lo tanto, las garzas no tienen pelo. b) Fidel no es uruguayo, pero si Fidel fuera de Piriápolis, entonces sería uruguayo. Como Fidel no es uruguayo, podemos concluir que no es de Piriápolis. Otro tipo de razonamientos son los del tipo reductio ad absurdum o reducción a lo absurdo que consiste en concluir una proposición al demostrar que la negación de ella conduce a una contradicción. Tenemos también que p ùñ q equivale a q ùñ p, de manera que el demostrar que p ùñ q puede hacerse demostrando que q ùñ p. Este métodos de hacer demostraciones se llama método indirecto. Los razonamientos no válidos de hacer conclusiones se llaman falacias. Ejemplos de falacias son: a) Deducir la veracidad de p a partir de la veracidad de q y de la veracidad de p ùñ q. Por ejemplo: «Si un animal es lobo, entonces es un canino, pero como los zorros son caninos, entonces los zorros son lobos.» 10 1.7. Razonamientos válidos y falacias b) Deducir la falsedad de q a partir de la falsedad de p y de la veracidad de p ùñ q. Por ejemplo: «Si Manuel fuera de Piriápolis, entonces sería uruguayo, pero sabemos que Manuel no es de Piriápolis, por lo que no es uruguayo.» Con la información que se tiene, a saber que los de Piriápolis son uruguayos y que Manuel no es de Piriápolis, no se puede concluir que Manuel no sea uruguayo, aunque tampoco se puede concluir que lo sea. c) Otro tipo de falacias son los argumentos ad hominem, el cual intenta negar una proposición p basándose en desacreditar a la persona o personas que afirman p, o bien en el desprestigio que pudiera tener dicha persona, por ejemplo: «Has nacido todo entero en pecado, de manera que tus enseñanzas no son buenas.» Ejercicios. 1. Supongamos que p, q y r son proposiciones. Verificar que las siguientes parejas de proposiciones son equivalentes independientemente de los valores de verdad de p, q y r. aq p pq, p. bq p^pq_rq, pp^qq_pp^rq. cq p _ pq ^ rq, pp _ qq ^ pp _ rq. dq p _ q, q _ p. eq p ^ q, q ^ p. fq p ðñ q, q ðñ p. gq pp _ qq, p pq ^ q. hq pp ^ qq, p pq _ q. iq p ùñ q, p qq ùñ p. jq pp _ qq _ r, p _ pq _ rq. kq pp ^ qq ^ r, p ^ pq ^ rq. lq p _ q, p pq ùñ q. mq q ùñ p, p qq _ p. nq pp ùñ qq, q ^ p. 2. Si p, q y r representan respectivamente las proposiciones «el caballo es un mamífero», «todos los reptiles pueden volar» y «2 + 5 = 7» expresar las siguientes proposiciones con palabras y sin usar los símbolos p, q, r, , ^, _, ùñ ni ðñ. Además, dar su valor de verdad. aq p ùñ q. dq p _ q. bq q ùñ r. eq p _ q. cq p ^ q. fq p pq ^ r. 3. Supongamos que p, q y r son proposiciones. Verificar que las siguientes parejas de proposiciones no son equivalentes para valores de verdad adecuados de p, q y r. aq p ^ pq _ rq, pp ^ qq _ r. bq pp _ qq, p pq _ p qq. cq p ùñ q, q ùñ p. dq pp ùñ qq _ pq ùñ rq, p ùñ q. eq pp ùñ qq _ pq ùñ rq, p ùñ r. fq p ùñ q, p pq ùñ q. 4. Cuando una persona dice «si tú eres músico, yo soy Supermán» ¿qué está tratando de decir? ¿Por qué? (usar modus tollens). 5. A continuación en cada inciso se darán dos proposiciones, las cuales, aunque parezca absurdo en algunos casos, supondremos que son verdaderas. Posteriormente se dará una serie de proposiciones. El lector deberá marcar con una V las que se puedan concluir 1.7. Razonamientos válidos y falacias 11 que son verdaderas a partir de las dos proposiciones dadas al inicio y con una F las que se puedan concluir que son falsas (las que no se pueda concluir su valor de verdad con las dos proposiciones dadas se dejarán sin marcar). a) Los miembros de la tribu Tarahumara tienen el pelo lacio. En África hay personas con el pelo rizado. I) II) III) IV) V) Los miembros de la tribu Tarahumara no son africanos. Algunos habitantes de África no pertenecen a la tribu Tarahumara. Solamente algunos africanos pertenecen a la tribu Tarahumara. Algunos africanos tienen el pelo lacio y otros no. Ningún africano con pelo rizado pertenece a la tribu Tarahumara. b) Perro que ladra no muerde. Los perros negros muerden. I) II) III) IV) V) Un perro me mordió sin ladrar. Los perros que no ladran son negros. Los perros negros no ladran. Los perros blancos ladran. Los perros pintos ladran y muerden. c) Con la lluvia se riegan las plantas. Es necesario regar las plantas para que sobrevivan. I) II) III) IV) V) Si no llueve, las plantas no sobreviven. Si llueve, las plantas sobreviven. Es necesario que llueva para que se rieguen las plantas. Cuando llueve feo, las plantas no sobreviven. Perro que ladra no muerde. d) El que nace para maceta no sale del corredor. Juan salió del corredor. I) II) III) IV) V) Juan no nació para maceta. A Juan no le gustan las macetas. Juan entra y sale del corredor sin macetas. Los que no salen del corredor nacieron para maceta. Si alguien no nació para maceta, ese es precisamente Juan. e) Al que madruga Dios lo ayuda. Al que no se ayuda Dios no lo ayuda. I) II) III) IV) V) El que no madruga no se ayuda. El que madruga se ayuda. El que no se ayuda no madruga. Perro que ladra, muerde y madruga, con seguridad se ayuda. Perro que no se ayuda, ni ladra ni muerde ni madruga. f) Todos los saltillenses son coahuilenses. Los venezolanos no son coahuilenses. I) Los venezolanos no son coahuilenses ni saltillenses. 12 1.7. Razonamientos válidos y falacias II) III) IV) V) Los argentinos no son venezolanos ni coahuilenses. Algunos coahuilenses son venezolanos. Ningún coahuilense es venezolano. Los saltillenses no son venezolanos. g) Mi abuelita no tiene ruedas. Mi abuelita no es bicicleta. I) II) III) IV) V) Si mi abuelita tuviera ruedas, sería bicicleta. Si mi abuelita no tuviera ruedas, no sería bicicleta. Si mi abuelita tuviera ruedas, no sería bicicleta. Si mi abuelita no tuviera ruedas, sería bicicleta. Mi abuelita tiene ruedas y aún así no es bicicleta. h) Si Luis no arregla su cuarto, no tendrá permiso de ir a la fiesta. Luis arregló su cuarto. I) II) III) IV) V) Luis tendrá permiso de ir a la fiesta debido a que arregló su cuarto. Si Luis va a la fiesta con permiso, entonces arregló su cuarto. Luis no tiene permiso de ir a la fiesta aunque haya arreglado su cuarto. Como Luis arregló su cuarto, entonces irá a la fiesta aunque no tenga permiso. Luis no irá a la fiesta aunque tenga permiso. i) Los santos no se bañan con agua caliente. Los santos ayunan. I) II) III) IV) V) Los Los Los Los Los santos no se bañan. santos ayunan y se bañan con agua fría. que no ayunan ni se bañan no son santos. que ayunan y se bañan con agua fría son santos. glotones son santos. j) Mikal no tuvo hijos hasta el día de su muerte. Mikal es hija de Saúl. I) II) III) IV) V) Las hijas de Saúl no tienen hijos. Mikal tuvo hijos después de muerta. Algunas hijas de Saúl no tienen hijos. Alguna hija de Saúl murió sin tener hijos. Todos los hijos de Mikal nacieron después de que ella ya había muerto. Capítulo 2 CONJUNTOS Y FUNCIONES 2.1. Introducción Los conceptos matemáticos están definidos en términos de los conceptos de conjuntos y funciones, así como su relación entre ellos. Consideraremos a los conjuntos y funciones como conceptos básicos no definidos. En las matemáticas hay conceptos básicos que no es posible definir ya que para hacerlo sería necesario tener otros conceptos que a su vez para estar definidos se necesitarían otros, y así sucesivamente, de tal suerte que para definirlos necesitaríamos hacerlo en base en ellos mismos, lo cual sería un círculo vicioso, o bien tener una infinidad de términos, lo cual sería imposible de definir. Así, hay conceptos básicos que no están definidos, se supone que se entiende su significado por sentido común, aunque tienen propiedades básicas que pueden clarificar su significado. De los términos no definidos y sus propiedades básicas se definen nuevos conceptos y se demuestran otras propiedades usando el razonamiento lógico. En el capítulo anterior, los conceptos de proposición, verdadero y falso no fueron definidos; sin embargo se establecieron propiedades básicas y en base en ellas se definieron conceptos y símbolos tales como conjunción, implicación, ðñ, , etc. y así se dedujeron algunas propiedades (no básicas) y se le pidió al lector que dedujera otras. En este libro a las propiedades básicas que no se demuestran y se supondrá que son verdaderas las llamaremos axiomas, aunque en algunas ocaciones, principalmente en la geometría, se les llama postulados. Las propiedades que se concluyen directa o indirectamente de las definiciones o de los axiomas se llaman teoremas. A algunos teorema se les suele llamar lemas y a otros corolarios. Generalmente un lema es un teorema cuyo objetivo principal es el de demostrar un teorema más importante y un corolario es un teorema que se deduce directamente o casi directamente de otro, aunque técnicamente hablando los términos teorema, lema y corolario son lo mismo. Una condición necesaria y suficiente para que un objeto forme parte de un concepto definido es que debe satisfacer todas las propiedades de la definición. Por ejemplo para definir el concepto de ave veamos de las siguientes proposiciones cuál es la definición correcta. a) Un ave es un animal que vuela. b) Un ave es un vertebrado de sangre caliente y que es ovíparo. 13 14 2.1. Introducción c) Un ave es un vertebrado de sangre caliente, ovíparo que tiene plumas y que tiene pico. d) Un ave es un vertebrado de sangre caliente, ovíparo, que tiene plumas, alas, pico, dos patas y además vuela. e) Un ave es un vertebrado de sangre caliente que tiene alas y vuela. f) Un ave es un animal que tiene plumas. La proposición a) no corresponde a una correcta definición para ave pues por ejemplo las moscas vuelan y no son aves. La proposición b) tampoco lo es, pues por ejemplo el ornitorrinco es un vertebrado de sangre caliente y ovíparo pero no es ave. La proposición c) parece ser una buena definición para ave pues las aves son vertebradas, de sangre caliente, ovíparos, tienen plumas y pico, además cualquier animal con estas características es un ave. La proposición d) tiene el defecto de que hay aves que no vuelan, por ejemplo los avestruces. La proposición e) no es una buena definición para ave puesto que los murciélagos satisfacen esas características y no son aves. La proposición f) también sería una buena definición de ave puesto que todas las aves son animales con plumas y todos los animales con plumas son aves. «Εί δέ τις λέγοι τὴν ἐπιστήμην ἀποδεικτικὴν εἶναι μετὰ λόγου, ἀκουσάτω ὅτι καὶ αἱ ἀρχαὶ ἀναπόδεικτοι· οὔτε γὰρ τέχνῃ οὔτε μὴν φρονήσει γνωσταί.» «Si alguien dijera que el conocimiento se basa en la demostración mediante la razón, que sepa que sus principios son indemostrables» (San Clemente de Alejandría, fragmento de Stromata 2.4.13). 2.2. Conjuntos 2.2. 15 Conjuntos En este capítulo uno de los términos no definidos es el de objeto. En matemáticas un objeto será cualquier cosa de la cual podamos hablar o decir algo. Otro término muy importante no definido es el de conjunto. Para darnos una idea de su significado podemos considerar «sinónimos» de conjunto como colección, familia, clase, agrupación de objetos, etc. El concepto de pertenecer es también un término no definido. Cuando decimos que un objeto a pertenece a un conjunto A queremos decir que a es un miembro de los objetos que forman al conjunto A. Usaremos el símbolo P para formar expresiones como a P A la cual se lee «a pertenece a A». Otro concepto que no se definirá será el de existencia. Comencemos por establecer los primeros axiomas. 2.2.1. Axioma de existencia de conjuntos. Existe al menos un conjunto. 2.2.2. Axioma. Si a es un objeto y A un conjunto, entonces a P A es una proposición. 2.2.3. Definición. Si A es un conjunto y a P A, es decir si a pertenece al conjunto A; decimos también que a es elemento de A, que a es miembro de A o que a está en A. A la negación de a P A se le representa como a R A y se lee «a no pertenece a A». En matemáticas la igualdad es otro término no definido. La idea de que dos objetos sean iguales es que son exactamente lo mismo aunque pueden estar representados por diferentes símbolos. A la proposición que afirma que dos objetos a y b son iguales se le representa así a “ b y se lee «a es igual a b». A la negación de a “ b se le representa como a ‰ b y se lee a es diferente de b». 2.2.4. Axioma de equivalencia para la igualdad. Si a, b y c son objetos, entonces se satisfacen las siguientes propiedades: I) a “ a II) a “ b ùñ b “ a III) (a “ b y b “ c) ùñ a “ c (propiedad reflexiva de la igualdad). (propiedad simétrica de la igualdad). (propiedad transitiva de la igualdad). 16 2.3. 2.3. Funciones Funciones El concepto de función de A en B, donde A y B son conjuntos, será otro término no definido. Una función de A en B se puede ver como una regla que hace corresponder a cada elemento de un conjunto A un único elemento de un conjunto B. Si a P A, entonces denotaremos por f paq al único elemento en B tal que la función f le asigna o le hace corresponder a a. Si f es una función, la expresión f paq se lee «f de a». Al objeto f paq se le llama también la imagen de a bajo f ó el valor de f en a. Como sinónimos del término función tenemos también el de aplicación y el de transformación. Si f es una función, a la proposición que afirma que a cada elemento del conjunto A, la función f le asigna un único elemento en el conjunto B se le denota así f : A ÝÑ B. f A j u XXX u B : u XXX X u XX X XXX XXX u X XXX XX XXX Xz u u u X XXX X z u X u u El diagrama anterior representa la forma en que la función f asigna a cada elemento del conjunto A un solo elemento del conjunto B. Podemos observar que de cada elemento del conjunto A sale solamente una flecha, mientras que a los elementos del conjunto B pueden llegar una, varias o ninguna flecha. 2.3.1. Ejemplo. Si A es el conjunto de habitantes de Guadalajara, R el conjunto de números reales y f : A ÝÑ R es la función que a cada habitante de Guadalajara le asigna su edad en años, entonces si a es un habitante de Guadalajara, f paq es la edad en años de a. Todo habitante de Guadalajara tiene una edad y esa edad es única, es decir ningún habitante de Guadalajara tiene más de una edad. 2.3. Funciones 17 2.3.2. Ejemplo. Si R es el conjunto de números reales y g : R ÝÑ R es tal que a cada número real le asigna su cuadrado, entonces si x P R, tenemos que gpxq “ x2 , por ejemplo gp1q “ 1, gp2q “ 4, gp´ 34 q “ 9 . Observemos que tiene sentido que g sea función 16 puesto que cada número real tiene exactamente un cuadrado. 20 18 16 14 12 10 8 6 4 gHxL=x2 2 -4 -2 2 4 6 8 2.3.3. Ejemplo. Tomemos un conjunto P H cuyos elementos son los pacientes de un cierto hospital. Cada paciente x tiene asignado un factor sanguíneo Rhpxq en el conjunto t`, ´u. Así la función Rh es la que a cada paciente x del hospital le asigna su factor sanguíneo Rhpxq. Tenemos así que Rh : P H ÝÑ t`, ´u. 2.3.4. Notaciones. Si A y B son dos conjuntos y f es una función, entonces la proposición f : A ÝÑ B aÞÑb significa que f : A ÝÑ B y además que f paq “ b, es decir significa que la función f asigna a cada elemento de A un único elemento en B y además a a le asigna b. La función g dada en el ejemplo 2.3.2 podría escribirse g : R ÝÑ2 R. xÞÑx Al hecho de que f paq “ b también se le denota por f : a ÞÑ b. La expresión x ÞÑ f pxq representa a una función tal que a cada valor de x le asigna f pxq, pero si se quiere ser específico se puede escribir px P Aq ÞÑ f pxq, lo cual representará a la función que a cada elemento x del conjunto A le asigna f pxq, en esta última notación se está especificando que A es el dominio de la función. Con esta última notación, la función g dada en el ejemplo 2.3.2 puede representarse como px P Rq ÞÑ x2 . 2.3.5. Definición. Si f : A ÝÑ B, decimos que A es el dominio de la función f . Al dominio de f se le denota por Dompf q. En el primero de los ejemplos anteriores el dominio de f es el conjunto de habitantes de Guadalajara y en el segundo ejemplo el dominio de g es R. La expresión que dice que una proposición p se vale o es verdadera para algún objeto x significa que existe un objeto x tal que p es verdadera. El término de «algún» es también un concepto no definido que se utiliza en el siguiente axioma y en otros. 2.3.6. Axioma. Si Ψ es un objeto, entonces Ψ pertenece a algún conjunto. 18 2.3. Funciones Debido a que los conjuntos y las funciones son objetos, el axioma anterior nos permite hablar de conjuntos de funciones y de conjuntos. 2.3.7. Axioma de sustitución de iguales. Si f : A ÝÑ B, s P A y s “ t, entonces t P A y f ptq “ f psq. 2.3.8. Axioma de igualdad de funciones. Las funciones f y g son iguales (f “ g) si y sólo si tienen el mismo dominio A y además si a P A, entonces f paq “ gpaq. 2.4. Predicados 2.4. 19 Predicados Cuando se hable acerca de un objeto y no se especifique en qué conjunto está se sobreentenderá que está en un conjunto U llamado conjunto universo. Por ejemplo cuando se habla acerca de personas, el conjunto universo al cual pertenecen las personas es el conjunto de todos los seres humanos. Si las personas en cuestión habitan en una cierta ciudad, entonces el conjunto universo puede tomarse como el conjunto de habitantes de dicha ciudad. Cuando se habla de números puede considerarse como universo al conjunto de números reales. Si se habla de países se puede considerar como universo al conjunto de países del mundo. 2.4.1. Definición. Diremos que un símbolo p es un predicado, si es tal que si x es un objeto, entonces la expresión denotada por ppxq será una proposición. Cuando p sea un predicado y tengamos una expresión ppxq, donde se sobreentienda que x está en algún conjunto U , al conjunto U lo llamamos universo del discurso o conjunto universo del predicado p. Cuando x no sea un elemento del universo del discurso de p, supondremos que ppxq es una proposición falsa. Cabe aclarar que es posible que algunos predicados no tengan conjunto universo debido a no estar especificado ni sobreentendido cuál es el conjunto universo. Es decir si p es un predicado cuyo conjunto universo es U y x P U , entonces ppxq es una proposición. Recordemos que si ppxq es una proposición, entonces tiene un único valor de verdad, ya sea verdadero o falso. Se puede interpretar como predicado p a una afirmación que diga algo sobre un objeto desconocido en el universo. Generalmente si no sabemos de qué objeto x se trata, tampoco sabremos si ppxq es verdadera o falsa. Con la restricción ppxq ‰ x evitamos construir proposiciones que hablen de sí mismas. 2.4.2. Ejemplo. Sea U el conjunto de mexicanos y ppxq la proposición «x es un médico mexicano». Tal proposición ppxq tiene un valor de verdad, pero tal valor de verdad depende de quién sea x. Si x es médico, entonces ppxq es verdadera; si x no es médico, entonces ppxq es falsa. Gramaticalmente hablando, el predicado sería «es un médico mexicano». Si x fuera «Juan Sánchez Gutiérrez», entonces ppxq se expresaría diciendo «Juan Sánchez Gutiérrez es un médico mexicano». 2.4.3. Ejemplo. Sea U “ R (conjunto de números reales) y qpxq la proposición expresada mediante la fórmula «3x ` 2 “ 0». En el caso en que x “ ´ 23 la proposición es verdadera y en cualquier otro caso la proposición es falsa. 2.4.4. Ejemplo. Veamos un ejemplo donde se puede ver el por qué es necesario pedir para un predicado p que ppxq ‰ x. Si ppxq es la afirmación «x es una proposición falsa», entonces no podemos tener que ppxq “ x ya que si x fuera una proposición verdadera, entonces ppxq sería falsa, pero como ppxq “ x, concluimos que x es verdadera y falsa a la vez, contradiciendo el hecho de que toda proposición tiene un único valor de verdad. Ahora bien, si x fuera una proposición falsa, entonces ppxq sería verdadera, y de nuevo como ppxq “ x, tendríamos que x es verdadera y falsa a la vez, contradiciendo nuevamente el hecho de que toda proposición tiene un único valor de verdad. 2.4.5. Definición. Se dice que x es el único objeto que satisface ppxq, si ppxq es verdadera y ppaq ùñ a “ x, para cualquier objeto a. 2.4.6. Axioma de especificación de conjuntos. Sea p un predicado cuyo conjunto 20 2.4. Predicados universo es U . Existe un único conjunto A cuyos elementos son todos los objetos x en U tales que la proposición ppxq es verdadera. 2.4.7. Definición. Al conjunto A dado en el axioma de especificación de conjuntos se le llama conjunto solución de p y se le denota por tx : ppxqu o por tx P U : ppxqu, si se quiere hacer énfasis en el conjunto universo U del predicado p. A veces se utiliza la notación tx|ppxqu en lugar de tx : ppxqu. En general, si A es un conjunto cualquiera y p es un predicado, la expresión tx P A : ppxqu representará al conjunto tx : x P A y ppxqu. Cuando tengamos un símbolo no definido x, y p sea un predicado, en la expresión ppxq, al símbolo x se le llama variable o variable libre y a la expresión ppxq se le llama fórmula o proposición abierta. En tal caso llamaremos conjunto solución de la fórmula o proposición ppxq al conjunto solución del predicado p. El dominio de la variable x será por definición el universo del discurso de p. Observemos que cualquier conjunto es el conjunto solución de algún predicado, pues si A es un conjunto, entonces A “ tx : x P Au (donde se está tomando como dominio de la variable x en la proposición x P A a un conjunto U tal que todo elemento de A sea también un elemento de U ). 2.4.8. Notación. A los conjuntos tx : x “ au, tx : x “ a ó x “ bu, tx : x “ a, x “ b ó x “ cu, etc. se les denotará respectivamente como tau, ta, bu, ta, b, cu, etc. Se dice que esta última notación describe al conjunto por listado de sus elementos. Es decir se ponen entre llaves todos los elementos del conjunto separados por comas. Esto es posible hacerlo solamente cuando los conjuntos tienen un número finito de elementos. En algunas proposiciones aparecen dos variables y el valor de verdad de tales proposiciones depende del valor que tomen cada una de las variables. Por ejemplo, en la proposición «x ă y» su valor de verdad no solamente depende del valor de x, sino también del de y; el valor de verdad de la proposición «los zapatos del modelo x son para practicar el deporte y» depende tanto del modelo como del deporte. Estableceremos así el concepto de predicado de dos variables. 2.4.9. Definición. Diremos que un símbolo q es un predicado de dos variables, si es tal que cuando x e y sean objetos, la expresión denotada por qpx, yq será una proposición. 2.4.10. Definición. Sean A y B dos conjuntos. Decimos que A está incluido en B si para cualquier objeto x se tiene que x P A ùñ x P B. Al hecho de que A esté incluido en B se le denota por AĂB 2.4. Predicados 21 o por BĄA aunque la segunda notación se acostumbra leer como «B incluye a A» o «B contiene a A». La notación A Ă B significa que todos los elementos de A son también elementos de B. Cuando A Ă B también se dice que A es subconjunto de B o que A está contenido en B. Para evitar confusiones trataremos de evitar usar el término «contenido en» debido a que a veces se toma como sinónimo de «pertenece a» y no de «incluido en». U B A AĂB 2.4.11. Ejemplo. Si A es el conjunto de patos y B el conjunto de aves, entonces A Ă B debido a que todos los patos son aves. Es decir, si x es pato, entonces x es ave. 2.4.12. Ejemplo. tx : 3x ` 2 “ 0u Ă tx : x2 “ 94 u. Observemos que tx : 3x ` 2 “ 0u “ t´ 23 u mientras que tx : x2 “ 94 u “ t´ 23 , 23 u. 2.4.13. Notación. A la negación de A Ă B se le denotará A Ă { B. Así mismo, cuando tengamos que A Ă B pero A ‰ B, diremos que A está incluido propiamente en B. Cualquiera de las expresiones A Ł B ó B Ń A denotarán el hecho de que A está incluido propiamente en B. 2.4.14. Axioma de igualdad de conjuntos. Dos conjuntos A y B son iguales si y sólo si A Ă B y B Ă A. Es decir, A “ B ðñ pA Ă B y B Ă Aq. 2.4.15. Axioma de existencia del conjunto potencia. Si A es un conjunto, entonces existe un conjunto cuyos elementos son todos los subconjuntos de A. Dicho de otra manera; si A es un conjunto, entonces existe un conjunto B tal que x P B si y sólo si x Ă A. 2.4.16. Definición. Sea A un conjunto. Al conjunto cuyos elementos son todos los subconjuntos de A se le llama el conjunto potencia de A y se le denota por ppAq ó por 2A . La notación 2A se deberá usar solamente cuando el contexto no permita confusión. 2.4.17. Ejemplo. Si A “ ta, b, cu, entonces ppAq “ ttu, tau, tbu, tcu, ta, bu, ta, cu, tb, cu, ta, b, cuu. 22 2.4. Predicados El siguiente axioma expresa que dados dos conjuntos cualesquiera siempre hay un conjunto «más grande» que los dos, es decir un conjunto del cual los conjuntos dados son subconjuntos. 2.4.18. Axioma. Si A y B son conjuntos, entonces existe un conjunto U tal que A Ă U y B Ă U. 2.4.19. Definición. Sean A y B dos conjuntos. Definimos la unión de A y B como el conjunto tx P U : x P A ó x P Bu, donde U es un conjunto tal que A Ă U y B Ă U . La definición anterior tiene sentido debido al axioma 2.4.18. Se puede demostrar que la definición anterior no depende de cuál sea el conjunto U siempre que cumpla con las propiedades. A la unión de A y B se le denota por AYB y es el conjunto de todos los objetos que pertenecen a A ó a B. 2.4.20. Definición. Sean A y B dos conjuntos. Definimos la intersección de A y B como el conjunto tx P A Y B : x P A y x P Bu el cual se denota por AXB y es el conjunto de todos los objetos que son elementos tanto de A como de B. Definamos ahora la resta de dos conjuntos. 2.4.21. Definiciones y notaciones. Sean A y B dos conjunto. Definimos la resta de A con B, denotada AzB, como AzB :“ tx P A : x R Bu. El anterior es el conjunto de todos los elementos de A que no están en B. Así mismo, definimos la diferencia simétrica de A y B como el conjunto A4B :“ pAzBq Y pBzAq. El anterior es el conjunto de todos los elementos de A Y B que no están en A X B. 2.4.22. Axioma. Supongamos que p y q son predicados. Si ppxq es verdadera para algún x y además ppxq ùñ qpxq, entonces qpxq es verdadera para algún x. 2.4.23. Definición. Decimos que un conjunto A no tiene elementos si dado cualquier objeto a, se tiene que a R A. A continuación enunciaremos nuestro primer teorema el cual afirma la existencia de conjuntos sin elementos. 2.4.24. Teorema. Existe un conjunto que no tiene elementos. Demostración. Haremos la demostración detallada y en varios pasos. Pondremos entre paréntesis la justificación de cada paso. 2.4. Predicados 23 a) Sea B un conjunto. (Axioma de existencia de conjuntos 2.4.15). b) Sea a un objeto. (Como los conjuntos son objetos, entonces por a) y por el axioma 2.4.22, podemos hablar de la existencia de objetos). c) a R BzB. (Si a P BzB, entonces a P B y a R B; pero alguna de las proposiciones a P B ó a R B es falsa puesto que una es la negación de la otra, por lo tanto se concluye a R BzB por reducción a lo absurdo). d) BzB no tiene elementos. (Paso c) y significado o definición de no tener elementos). ‚ 2.4.25. Teorema. Existe solamente un conjunto que no tiene elementos. Demostración. Por el teorema 2.4.24 existe al menos un conjunto que no tiene elementos. Sean A y B conjuntos que no tienen elementos. Como A y B no tienen elementos, entonces las proposiciones x P A y x P B son falsas, por lo cual x P A ùñ x P B y además x P B ùñ x P A, es decir A Ă B y B Ă A, y de acuerdo al axioma de igualdad de conjuntos 2.4.14 concluimos que A “ B. ‚ 2.4.26. Definiciones. Al único conjunto que no tiene elementos se le llama conjunto vacío. Al conjunto vacío se le denota por ∅ ó por tu. Se dice que los conjuntos A y B son disjuntos o ajenos si su intersección es el conjunto vacío, es decir si no tienen elementos en común. Cuando la intersección de A y B no es el conjunto vacío, decimos que estos conjuntos se intersecan. Podríamos preguntarnos sobre la existencia de un «superconjunto» S, es decir un conjunBernard Russell 1872-1970 to S al cual pertenezcan todos los objetos, en particular todos los conjuntos. Tal pregunta se puede responder por medio del planteamiento siguiente conocido como paradoja de Russell, en honor del matemático británico Bernard Russell quien lo planteo por primera vez en 1901: «Suponiendo la existencia de tal conjunto S. Sea A “ tx P S : x R xu y preguntémonos ¿A P A? Si la respuesta es sí, entonces A R A, lo cual es una contradicción (estamos suponiendo que S es un superconjunto, por lo que A debe pertenecer a S). Si la respuesta es no, entonces A R A, por lo que A es elemento de A, es decir A P A, teniendo de nuevo una contradicción». La paradoja de Russell es similar a la del barbero que dice: «En un pueblo hay un barbero (hombre) que afeita solamente a todos los hombres del pueblo que no se afeitan ellos mismos. ¿Quién afeita al barbero?» El razonamiento anterior nos lleva a que no es posible la existencia de un conjunto S al cual pertenezcan absolutamente todos los conjuntos y menos al cual pertenezcan todos los 24 2.4. Predicados objetos pues el suponer la existencia de tal conjunto nos lleva a contradicciones. El axioma siguiente evita la existencia de un conjunto S en el cual S P S. 2.4.27. Axioma. Si A es un conjunto y B Ă A, entonces A R B. En particular A R A. El axioma 2.4.27 afirma que ningún conjunto es elemento de sí mismo. Por ejemplo, si A es el conjunto de caballos en la Tierra, entonces cualquier elemento de A es un caballo, pero el conjunto de todos los caballos no es un caballo, por lo que A R A. Tomemos otro ejemplo. Si N es el conjunto de los números naturales, entonces N R N pues N no es un número natural, N no es el 1, ni el 2, ni el 3, ni ningún otro número natural. La naturaleza del axioma 2.4.27 no es de lo que está permitido hacer con los conjuntos, sino de lo que no está permitido hacer con los conjuntos. 2.4.28. Teorema. Si A es un conjunto, existe un conjunto B tal que A está incluido propiamente en B. Demostración. Supongamos que A es un conjunto y definamos al conjunto B como B “ A Y tAu. Tenemos que A P B y A Ă B, pero por el axioma 2.4.27 tenemos que A R A, de manera que A ‰ B, por lo tanto A está incluido propiamente en B. ‚ Ejercicios. 1. De las siguientes proposiciones decir cuales son falsas y cuales son verdaderas (justificar las respuestas). a) 5 P t5, 6u. b) 5 “ t5u. c) t5u Ă t5, 6u. d) t5u P t5, 6u. e) t5u P t5, 6, t5, 6uu. f) t5u P t5, 6, t5uu. g) t5u Ă t5, 6, t5uu. h) t5u Ă t5, 6, t5, 6uu. i) t5, 6u P t5, 6, t5uu. j) t5, 6u P t5, 6, t5, 6uu. k) ∅ Ă ∅. l) t5, 6u “ t6, 5, 6, 6u. m) tu “ ttuu. n) ∅ P t5, 6u. ñ) ∅ Ă t5, 6u. o) t4, 5, 6u X t5, 6, 7, 8u “ t5, 6, 6, 5, 5u. p) t4, 5, 6u Y t5, 6, 7, 8u “ t5, 6, 7, 8u. q) ∅ P ∅. 2. Expresar los siguientes conjuntos por listado de sus elementos. a) t4, 5, 6, 7u X t5, 6, t5, 6uu. b) t4, 5, 6, 7u Y t5, 6, t5, 6uu. c) t4, 5, 6, 7u X tt5, 6uu. d) tx : x es un número entero tal que 2x “ 8 ó x2 “ 49u. e) tx : x es un número entero tal que 2x “ 8 ó x2 “ 15u. f) tx : x es un número real tal que 2x “ 8 ó 5x “ 18u. g) tx : x es un número entero tal que 2x “ 8 ó 5x “ 18u. 2.4. Predicados 25 h) tx : x es un número real tal que 2x “ 8 y 5x “ 18u. i) {Pedro, Rodrigo, Ramón, Silvia, Poncio, Rosa, Pamela}XA, donde A es el conjunto de todas las personas cuyo nombre comienza con la letra «P». 26 2.5. Los cuantificadores universal y existencial 2.5. Los cuantificadores universal y existencial «Et remarquant que cette vérité: je pense, donc je suis, était si ferme et si assurée, que toutes les plus extravagantes suppositions des sceptiques n’étaient pas capables de l’ébranler, je jugeai que je pouvais la recevoir sans scrupule pour le premier principe de la philosophie que je cherchais.» «Y notando que esta verdad: “yo pienso, por lo tanto soy” era tan firme y cierta, que no podían quebrantarla ni las más extravagantes suposiciones de los escépticos, juzgué que podía admitirla, sin escrúpulo alguno, como el primer principio de la filosofía que estaba buscando» (Renato Cartesio, fragmento de Discurso del Método, 1637). 2.5.1. Notación. Sea p un predicado, la expresión @x, ppxq es la proposición que dice que para cualquier x la proposición ppxq es verdadera y se lee «para todo x, ppxq». Como ejemplo de un predicado p que haga que la proposición @x, ppxq sea siempre verdadera tenemos al predicado p en el cual ppxq significa x “ x. En este caso la expresión «@x, x “ x» es una proposición verdadera. Si se quiere ser más específico en cuanto al dominio de la variable x se escribe @x P A, ppxq lo cual significa @x, x P A ùñ ppxq. Interpretamos el significado de @x P A, ppxq como la proposición que indica que para cualquier x perteneciente a A la proposición ppxq es verdadera y se lee «para todo x en A, ppxq». Ahora, la expresión Dx, ppxq es la proposición que dice que existe al menos un x tal que ppxq es verdadera y se lee «existe un x tal que ppxq». En este caso la expresión existe un x se refiere a que existe un x en algún conjunto dado. Si se quiere ser más específico se escribe Dx P A, ppxq lo cual significa Dx, x P A y ppxq y es la proposición que indica que existe al menos un x perteneciente al conjunto A tal que ppxq es verdadera y se lee «existe un x en A tal que ppxq». 2.5.2. Definición. Al símbolo @ se le llama cuantificador universal y al símbolo D se le llama cuantificador existencial. 2.5.3. Axioma. Si para todo x, las proposiciones ppxq y qpxq son proposiciones equivalentes; entonces Dx, ppxq ðñ Dx, qpxq 2.5. Los cuantificadores universal y existencial 27 y @x, ppxq ðñ @x, qpxq. 2.5.4. Axioma (leyes de de Morgan). Si p es un predicado, entonces p @x, ppxqq ðñ Dx, ppxq p Dx, ppxqq ðñ @x, ppxq. y El axioma anterior expresa que el hecho de negar que una proposición ppxq sea válida para todo x es equivalente a decir que hay al menos un x para el cual la proposición ppxq no se cumple. También expresa que el hecho de que no exista un x para el cual la proposición ppxq sea verdadera, equivale a decir que todo x hace la proposición ppxq falsa o que ningún x hace que se cumpla ppxq (decir que ppxq no se cumple significa lo mismo que decir que ppxq es verdadera). Siempre que tengamos una fórmula de la forma ppxq (donde p es un predicado y x una variable) querremos decir @x, ppxq. Los axiomas anteriores se pueden utilizar cuando tengamos cuantificadores múltiples, por ejemplo una proposición de la forma @x, Dy, ppxq ùñ qpyq es equivalente a Dx, @y, (ppxq y qpyq), pues negar que ppxq implica qpyq equivale a afirmar que se cumple ppxq y no se cumple qpyq. 2.5.5. Ejemplo. Negar que para todo número real positivo x existe un número natural N tal que N ą x equivale a decir que existe algún número real positivo x tal que para todo número natural N se cumpla que N ĺ x. Aunque pueda no gustarnos, en español la frase «no existe ningún x» significa «no existe algún x», «ningún x» o simplemente «no existe x», es decir la expresión «no existe ningún» no es una doble negación, sino más bien una confirmación de una negación. Algo similar sucede con expresiones como «no tienes nada» que significa «no tienes algo». 2.5.6. Ejemplo. Una forma de negar la frase «todos los peruanos tienen un hermano que es médico» es con la frase «algún peruano no tiene un hermano que es médico» o con la frase «existe algún peruano tal que ninguno de sus hermanos sea médico». 28 2.6. El recorrido de una función 2.6. El recorrido de una función 2.6.1. Definición. Sea f : A ÝÑ B. Definimos el recorrido de f como ty P B : Dx P A, y “ f pxqu . Al recorrido de f lo denotaremos por Rpf q. Observemos que el recorrido de f es un subconjunto del conjunto B. 2.6.2. Ejemplo. El recorrido de la función f : x ÞÑ x2 ` 1 es Rpf q “ ty : y ľ 1u. 2.6.3. Ejemplo. El recorrido de la función g : t1, 2, 3, 4, 5u ÝÑ t1, 2, 3, 4, 5, 6, 7, 8, 9u nÞÑ2n´1 es Rpgq “ t2 ¨ 1 ´ 1, 2 ¨ 2 ´ 1, 2 ¨ 3 ´ 1, 2 ¨ 4 ´ 1, 2 ¨ 5 ´ 1u “ t1, 3, 5, 7, 9u. 2.6.4. Axioma. Si f es una función, entonces f no pertenece ni al dominio ni al recorrido de f . El axioma anterior es de la misma naturaleza del que afirma que un conjunto no pertenece a sí mismo y del hecho de que una proposición no hable de sí misma. 2.6.5. Axioma. Sea Λ un conjunto tal que para todo elemento λ de Λ existe un único objeto denotado por aλ (es decir para todo λ P Λ existe un único y tal que y “ aλ ). Existe una única función τ cuyo dominio es Λ tal que τ : λ ÞÑ aλ . Para evitar confusiones siempre será sano que un mismo símbolo no represente más de un objeto aunque muy frecuentemente un mismo objeto se representará con diferentes símbolos. 2.6.6. Notación. Si tenemos que el dominio de una función τ : λ ÞÑ aλ es Λ, entonces la expresión taλ : λ P Au representará al conjunto tx P Rpτ q : existe un λ P Λ X A tal que x “ aλ u. Cuando por alguna razón se sobreentienda cual es el conjunto A al cual pertenecen los λ, entonces podremos escribir simplemente taλ u en lugar de taλ : λ P Au. 2.6.7. Teorema de funciones seccionadas. Sean f : D ÝÑ B y g : C ÝÑ B funciones tales que si e P D X C, entonces f peq “ gpeq. Existe una única función h : D Y C ÝÑ B tal que si d P D, entonces hpdq “ f pdq y si c P C, entonces hpcq “ gpcq. Demostración. Sea Λ “ D Y C, aλ “ f pλq para λ P D y aλ “ gpλq para λ P ΛzD “ CzD. Por el axioma 2.6.5 existe una única función h : Λ ÝÑ B tal que hpλq “ aλ . Ahora, si d P D, entonces hpdq “ ad “ f pdq. Si c P C, tenemos que c P CzD ó c P C X D; en el primer caso hpcq “ ac “ gpcq; en el segundo caso hpcq “ ac “ f pcq “ gpcq. Por lo tanto la función h satisface las condiciones del teorema. Para ver que h es la única función que satisface las condiciones del teorema tomemos una función k : D Y C ÝÑ B tal que si d P D, entonces kpdq “ f pdq y si c P C, entonces kpcq “ gpcq. Si d P D, entonces kpdq “ f pdq “ hpdq y si c P C, entonces kpcq “ gpcq “ hpcq, por lo que k “ h, es decir h es la única función que satisface las condiciones del teorema. ‚ 2.6.8. Ejemplo. Sean f : tx : x ľ 0u ÝÑ R y g : tx : x ĺ 0u ÝÑ R tales que f pxq “ x y gpxq “ ´x. La intersección de Dompf q “ tx : x ľ 0u con Dompgq “ tx : x ĺ 0u es {0} 2.6. El recorrido de una función 29 y f p0q “ gp0q, por lo que de acuerdo al axioma anterior existe una función h : R ÝÑ R tal que si x ľ 0, entonces hpxq “ x y si x ĺ 0, entonces hpxq “ ´x. El lector que tenga conocimientos básicos de matemáticas podrá darse cuenta que hpxq “ |x|, el valor absoluto de x. 2.6.9. Notación. Sean f , g y h como las dadas en el teorema de funciones seccionadas, y además p y q predicados cuyos conjuntos solución son A y B respectivamente. Denotaremos hpxq como: $ ppxq & f pxq, si hpxq “ % gpxq, si qpxq o bien $ & f pxq, si xPA gpxq, si x P B. hpxq “ % En la descripción anterior, se acostumbra decir que la función h es una función seccionada. 2.6.10. Ejemplo. La función h del ejemplo 2.6.8 está dada por $ si xľ0 & x, hpxq “ |x| “ % ´x, si x ĺ 0. 2.6.11. Definición. Si f : A ÝÑ C y B Ă A, definimos la restricción de f al conjunto B como la función denotada por f |B y definida por f |B : B ÝÑ C. xÞÑf pxq 30 2.7. Uniones e intersecciones arbitrarias 2.7. Uniones e intersecciones arbitrarias En esta sección se usará frecuentemente el concepto de familia de conjuntos. 2.7.1. Definición. Se acostumbra llamar familia o colección a los conjuntos cuyos elementos son conjuntos. Decimos que una familia de conjuntos es disjunta o que sus elementos son conjuntos disjuntos si dos conjuntos diferentes cualesquiera de la familia son disjuntos. Es decir, los elementos de una familia de conjuntos F son disjuntos si A P F, B P F y A ‰ B implica que A X B “ ∅. El siguiente axioma es una generalización del axioma 2.4.18. 2.7.2. Axioma. Sea F una familia de conjuntos. Existe un conjunto U tal que si A P F y a P A, entonces a P U . 2.7.3. Definición. Sea F una familia de conjuntos y U como en el axioma anterior. Definimos la unión de todos los conjuntos de F como ta P U : DA P F, a P Au ; este conjunto se denota como ď A o como ď F. APF Ť Es decir, APF A es el conjunto de todos los objetos que pertenecen al menos a un elemento de la familia F. 2.7.4. Definición. Sea F una familia de conjuntos. Definimos la intersección de todos los conjuntos de F como el conjunto ta : @A P F, a P Au ; este conjunto se denota como č A o como č F. APF Veamos otras notaciones para uniones e intersecciones arbitrarias. Supongamos que Λ es un conjunto, F una familia de conjuntos y ϕ : Λ ÝÑ F, tomaremos las siguientes notaciones: λÞÑAλ ď Aλ :“ λPΛ y č λPΛ ď A APRpϕq Aλ :“ č A, APRpϕq donde Rpϕq es el recorrido de ϕ. En la notación anterior a los elementos λ de Λ se les llama índices y al conjunto Λ se le llama conjunto de índices. Observemos que 2.7. Uniones e intersecciones arbitrarias ď 31 Aλ “ tx : Dλ P Λ, x P Aλ u λPΛ y č Aλ “ tx : @λ P Λ, x P Aλ u . λPΛ Cuando q es un predicado cuyo conjunto universo es Λ, acordaremos las siguientes notaciones: ď Aλ :“ tx : Dλ P Λ, x P Aλ y qpxqu qpλq y č Aλ :“ tx : @λ P Λ, x P Aλ y qpxqu . qpλq 2.7.5. Axioma de elección. Sea F una familia de conjuntos no vacíos. Existe una función ď A ψ : F ÝÑ APF tal que @A P F, se tiene que ψpAq P A. La función ψ dada en el axioma de elección asigna a cada conjunto de la clase F un «representante» a “ ψpAq en A. Por ejemplo, si nuestra familia de conjuntos está formada por los grupos de alumnos de una escuela, de cada grupo se puede escoger un alumno de tal manera que cada grupo tenga un único representante. Si algún alumno pertenece a varios grupos es posible que sea representante de uno, varios o ningún grupo. Una forma alternativa de interpretar las leyes de de Morgan es a través del siguiente teorema cuya demostración se sigue precisamente de las leyes de de Morgan, de la notación establecida en esta sección y de la definición que hemos dado para la unión e intersección de una familia de conjuntos. 2.7.6. Teorema. Si tAλ : λ P Λu es una colección de conjuntos incluidos en un conjunto U , entonces ď č č ď Uz Aλ “ pU zAλ q y Uz Aλ “ pU zAλ q. λPΛ λPΛ λPΛ λPΛ 2.7.7. Definición. A los axiomas que se han enunciado hasta este momento, es decir a los 18 axiomas de este capítulo, los llamaremos axiomas básicos. 32 2.8. 2.8. Notaciones de uso común Notaciones de uso común En esta breve sección daremos algunos símbolos y notaciones que generalmente son usadas para abreviar la escritura, algunos de ellos son más usados en los apuntes de libreta y en la escritura de pizarrón, otras en cambio llegan a usarse en textos. El uso de esta terminología se suele usar según el estilo y criterio de quien escribe. El símbolo ðù significa «es necesario para», por ejemplo p ðù q se lee «p es necesario para q», es decir p ðù q significa q ùñ p. El símbolo 6 representa la frase «por lo tanto». El símbolo « significa aproximadamente igual, por ejemplo a « b se lee «a es aproximadamente igual a b». El símbolo # significa la palabra «número». El símbolo ąą significa muy grande, por ejemplo a ąą b se lee «a es muy grande comparado con b». El símbolo % se lee «por ciento» y significa 1 . 100 El símbolo 7 representa la frase «puesto que» o «como». Este símbolo es poco usado. La abreviación de origen latín i.e. significa «es decir». La abreviación de origen latín cf. significa «comparar». El símbolo :“ significa «igual por definición» y se emplea para definir algo mediante una igualdad, por ejemplo a :“ b significa que se está definiendo a de tal manera que a “ b. El símbolo ‚ lo usaremos y de hecho lo hemos usado para indicar el fin de una demostración. Para indicar que a P A ^ b P A se puede escribir simplemente a, b P A. Cuando no se especifique, ppaq ùñ qpbq significará @a, @b, ppaq ùñ qpbq. Los símbolos N, Z, Q, R, P y C representan los conjuntos de los números naturales, enteros, racionales, reales, positivos y complejos respectivamente; los cuales se establecerán posteriormente; aunque a veces se les representa por N, Z, Q, R, P y C. Capítulo 3 ELEMENTOS DE MATEMÁTICAS DISCRETAS 3.1. Axiomas de Peano Al conjunto N que se describirá en esta sección se le llama conjunto de números naturales. Los axiomas dados en esta sección se conocen como axiomas de Peano y describen al conjunto N de los números naturales. Los 5 axiomas de Peano se enuncian a continuación. 3.1.1. Axiomas de Peano. Existe un conjunto N que satisface las siguientes proposiciones: a) Existe un objeto, denotado por 1, tal que 1 P N. b) Existe una función que a cada número natural n le asigna otro número natural, denotado n ` 1; es decir la función es tal que n ÞÑ n ` 1. c) Si n P N, entonces n ` 1 ‰ 1. d) Si n P N, m P N y n ` 1 “ m ` 1, entonces n “ m. e) Si M es un subconjunto de N que cumple con las siguientes propiedades: I) 1 P M ; II) n P M ùñ n ` 1 P M , para todo n P N; entonces N “ M . 3.1.2. Definiciones. Al número 1 dado en el axioma 3.1.1 a) se le llama uno. Al número n ` 1 dado en el axioma 3.1.1 b) se le llama sucesor o siguiente de n. El axioma 3.1.1 c) establece que 1 no es sucesor de ningún número natural. Decimos que un número natural n es el antecesor o anterior de n ` 1. Observemos que el axioma 3.1.1 d) establece que el antecesor de un número natural, si existe, es único, o equivalentemente, que dos números naturales diferentes tienen diferente sucesor. Al axioma 3.1.1 e) se le conoce como principio de inducción matemática o como principio de recurrencia. Tratemos, no de demostrar, pero sí de hacer plausible el principio de inducción matemática. Supongamos que M es un conjunto que satisface I) y II). Debido 33 34 3.1. Axiomas de Peano a I) tenemos que 1 P M ; debido a II) y a que 1 P M , tenemos que 2 :“ 1 ` 1 P M ; debido de nuevo a II) y a que 2 P M , tenemos que 3 :“ 2 ` 1 P M . Siguiendo el mismo razonamiento se llegará a que 4 :“ 3 ` 1 P M , 5 :“ 4 ` 1 P M , 6 :“ 5 ` 1 P M , etc., etc. Así, si n P N después de un número finito de pasos (a saber, después de n pasos) habremos concluido que n P M . Es decir que si n P N, entonces n P M ; lo cual significa que N Ă M , pero como M Ă N, entonces N “ M . El principio de inducción matemática nos da un método, llamado método de inducción matemática, para deducir que algunas proposiciones ppnq se cumplen, para todo n P N. El método consiste en demostrar que pp1q es verdadera y en demostrar que @n P N, ppnq ùñ ppn ` 1q. La validez del método se deduce del principio de inducción matemática tomando M como conjunto solución de p, es decir tomando M “ tn P N : ppnqu y observando que pp1q equivale a decir 1 P M , ppnq ùñ ppn ` 1q equivale a decir n P M ùñ n ` 1 P M y ppnq equivale a decir n P M . El siguiente es un teorema que se demostrará usando el método de inducción matemática. 3.1.3. Teorema. Si n es un número natural, entonces n ` 1 ‰ n. Demostración. Debido al axioma 3.1.1 c) tenemos que 1 ` 1 ‰ 1, es decir el resultado es válido para n “ 1. Veamos que si el resultado es verdadero para n, también lo es para n ` 1. Supongamos que n ` 1 ‰ n, por el axioma 3.1.1 d) tenemos que pn ` 1q ` 1 ‰ n ` 1 (de otro modo n ` 1 sería igual a n) con lo que por inducción matemática se tiene que n ` 1 ‰ n para todo n P N. ‚ 3.2. Parejas ordenadas 3.2. 35 Parejas ordenadas 3.2.1. Definición. La pareja ordenada pa, bq es la función f : t1, 2u ÝÑ ta, bu tal que f p1q “ a y f p2q “ b. Al objeto a se le llama primera componente y al objeto b se le llama segunda componente de la pareja ordenada pa, bq. Observemos que por el axioma de igualdad de funciones, dos parejas ordenadas pa, bq y pc, dq son iguales si y sólo si a “ c y b “ d. Así mismo, por el mismo axioma, podemos observar que si a ‰ b, entonces pa, bq ‰ pb, aq; es decir, tiene importancia el orden en que aparece cada componente de la pareja. Enunciemos esto que acabamos de demostrar en el siguiente teorema. 3.2.2. Teorema de caracterización de parejas ordenadas. I) pa, bq “ pc, dq ðñ pa “ c y b “ dq. II) a ‰ b ùñ pa, bq ‰ pb, aq. 3.2.3. Definición. Sean A y B dos conjuntos. Se define el producto cartesiano de A con B, denotado A ˆ B, como el conjunto A ˆ B :“ tpa, bq : a P A y b P Bu. 3.2.4. Ejemplo. t1, 2, 3, 4u ˆ t1, 2u “ tp1, 1q, p1, 2q, p2, 1q, p2, 2q, p3, 1q, p3, 2q, p4, 1q, p4, 2qu. 2 1 1 2 3 4 Tomemos ahora otro ejemplo. 3.2.5. Ejemplo. Si R es el conjunto de números reales, entonces R ˆ R es el conjunto de parejas ordenadas de números reales, las cuales son coordenadas de algún punto en el plano. 3.2.6. Definición. La terna pa, b, cq se define como la función f : t1, 2, 3u ÝÑ ta, b, cu tal que f p1q “ a, f p2q “ b y f p3q “ c. Observemos que dos ternas pa, b, cq y px, y, zq son iguales si y sólo si a “ x, b “ y y c “ z. Ahora, si A, B y C son tres conjuntos, definimos A ˆ B ˆ C como el conjunto de ternas pa, b, cq tales que a P A, b P B y c P C. En el caso del conjunto R ˆ R ˆ R, podemos observar 36 3.2. Parejas ordenadas que es el conjunto de ternas de números reales o el conjunto de coordenadas en el espacio de tres dimensiones. 3.2.7. Definición. Una función f : A ˆ B ÝÑ C es una función que a cada pareja pa, bq P A ˆ B le asigna un único elemento c P C. A menudo a una función como la anterior se le llama función de dos variables puesto que el valor de f ppa, bqq depende tanto de la variable a P A como de la variable b P B, aunque estrictamente hablando f depende de la pareja pa, bq P A ˆ B. Para simplificar la notación, a la expresión f ppa, bqq se le representará simplemente por f pa, bq. Veamos algunos ejemplos. 3.2.8. Ejemplo. Sea f : R ˆ N ÝÑ R la función dada por f px, nq “ xn , es decir la función f le asigna a cada pareja px, nq P R ˆ N el número x multiplicado por sí mismo n veces. 3.2.9. Ejemplo. La fuerza de atracción que la Tierra ejerce sobre un cuerpo de masa m que está a una distancia d del centro de la Tierra está dada por una función F : P ˆ P ÝÑ P de la forma F pm, dq “ G ¨ m{d2 , 100 80 4 donde G es un número llamado constante F 60 40 gravitacional y P es el conjunto de los nú3 20 0 meros positivos. La fórmula anterior expre0 2 d 1 sa el hecho de que la fuerza de atracción es 2 proporcional a la masa e inversamente pro1 m 3 porcional al cuadrado de la distancia. La si4 guiente figura muestra el comportamiento de la función F en base a los valores de m y d. 3.2.10. Ejemplo. Supongamos que un fabricante produce dos tipos de artículos, A y B; tiene una cuota mínima de producción de dos artículos del tipo A y tres del tipo B, y tiene una capacidad máxima de producción de cuatro artículos del tipo A y de cuatro del tipo B. El costo de producción de cada artículo del tipo A es de $1000 y del tipo B es de $2000. Supongamos que f pa, bq representa el costo total de producir a artículos del tipo A y b del tipo B. La función f está determinada por la siguiente correspondencia: p2, 3q ÞÑ $8000, p3, 3q ÞÑ $9000, p4, 3q ÞÑ $10000, p2, 4q ÞÑ $10000, p3, 4q ÞÑ $11000, p4, 4q ÞÑ $12000. El dominio de la función f es Dompf q “ tp2, 3q, p3, 3q, p4, 3q, p2, 4q, p3, 4q, p4, 4qu y el recorrido es Rpf q “ t$8000, $9000, $10000, $11000, $12000u. Observemos que el dominio tiene 6 elementos mientras que el recorrido tiene 5. La función de costo de producción también puede ser representada mediante una tabla de la siguiente forma. 3.2. Parejas ordenadas a = número de artículos del tipo A 2 2 3 3 4 4 37 b = número de artículos del tipo B 3 4 3 4 3 4 f pa, bq = costo de producción $ 08 000 $ 10 000 $ 09 000 $ 11 000 $ 10 000 $ 12 000 38 3.2.11. Ejemplo. El volumen de un cilindro de base circular de radio r y de altura h está descrito por la función V de dos variables de la siguiente forma V ph, rq “ πr2 h, donde π es un número fijo. 3.2. Parejas ordenadas 100 75 50 25 0 0 2 V 1.5 1 h 1 0.5 2 r 3 40 3.2.12. Ejemplo. Sea A el conjunto aspirantes para ser contratados como actores en una película. Sea c el color de piel y h la altura del aspirante. Un aspirante será contratado solamente si el color de piel y su estatura satisfacen una condición requerida. Tal condición puede ser expresada mediante una función f : C ˆ H ÝÑ taceptado, rechazadou, donde C es el conjunto de colores y H el conjunto de alturas posibles de personas. Es decir, la función f asigna a cada pareja ordenada pc, hq el valor f pc, hq que puede ser «aceptado» o «rechazado». La función f depende del criterio que se tome para la elección de los actores. 3.3. Relaciones 3.3. 39 Relaciones 3.3.1. Definición. Una relación binaria o simplemente relación „ de un conjunto A en un conjunto B es un predicado cuyo conjunto universo es A ˆ B, es decir el conjunto universo es A ˆ B “ tpa, bq : a P A y b P Bu. 3.3.2. Notación. Si „ es una relación de A en B, a P A y b P B; entonces a la proposición „ pa, bq también se le denotará como a „ b. Como ejemplos de relaciones de R en R tenemos “, ą, ă, ľ, ĺ, etc., siempre que el universo del discurso quede sobreentendido que es RˆR. Si A es cualquier conjunto, entonces P es una relación de A en ppAq (donde ppAq es el conjunto de todos los subconjuntos de A), cuando el universo del discurso de P es A ˆ ppAq. El símbolo Ă nos da una relación de ppAq en ppAq si consideramos al universo del discurso de Ă como ppAq ˆ ppAq. Decimos que a está relacionada con b mediante la relación „ cuando a „ b es una proposición verdadera. 3.3.3. Definición. Sea „ una relación de A en B. Al conjunto Grp„q :“ tpa, bq : a „ bu se le llama la gráfica de „. Es decir, la gráfica de „ es el conjunto solución de „. Observemos que la gráfica de „ dada en la definición anterior es un subconjunto de AˆB. 3.3.4. Notación. Cuando A y B sean dos conjuntos y R Ă AˆB, la expresión aRb significará que pa, bq P R, de esta forma el conjunto R «se convierte» en una relación de A en B cuya gráfica es el mismo conjunto R. De esta manera, por abuso si se quiere ver así, se emplea indistintamente el significado de relación y de gráfica de una relación. 3.3.5. Definición. Sea f : A ÝÑ B una función. Al conjunto Grpf q :“ tpa, bq P A ˆ B : b “ f paqu se le llama la gráfica de f . Observemos que dos funciones son iguales si y sólo si tienen la misma gráfica. Es decir, una función está determinada por su gráfica. 3.3.6. Definición. Si una relación „ es tal que su gráfica es la gráfica de una función f , decimos que f está determinada por „ o que „ determina a la función f . También decimos que la gráfica de f determina a f . Observemos que toda función está determinada por alguna relación. (¡Verificarlo!) 3.3.7. Teorema. Si „ es una relación de A en B tal que para cualesquiera tres objetos a, b, c, con a P A y b, c P B se cumple que pa „ b y a „ cq ùñ b “ c; 40 3.3. Relaciones entonces „ determina alguna función. Demostración. Sea A1 “ ta P A : existe un b P B tal que a „ bu y para cada a P A1 sea ba el único elemento de B tal que a „ ba . Afirmamos que la función f : A1 ÝÑ B tal que f paq “ ba está determinada por „. En efecto, pa, bq P Grpf q ðñ pa P A1 y b “ f paqq ðñ pa P A1 y b “ ba q ðñ a „ b ðñ pa, bq P Grp„q. ‚ 3.3.8. Teorema. Sean A y B dos conjuntos y G Ă A ˆ B tal que para todo x se cumple que si px, b1 q y px, b2 q pertenecen a G, entonces b1 “ b2 . El conjunto G es la gráfica de alguna función. Demostración. Sea „ la relación tal que a „ b significa pa, bq P G. Como px, b1 q, px, b2 q P G ùñ b1 “ b2 , entonces px „ b1 y x „ b2 q ùñ b1 “ b2 por lo que, debido al teorema 3.3.7, la relación „ determina una función y como la gráfica de „ es G, entonces la gráfica de la función determinada es G. ‚ 3.3.9. Definición. A la función cuya gráfica es el conjunto vacío se le llama la función vacía. 3.3.10. Definición. Sea „ una relación binaria de A en B. Definimos la relación inversa de „ o la inversa de la relación „ (denotada por „´1 ) como la relación de B en A tal que b „´1 a significa a „ b. 3.3.11. Ejemplo. Las relaciones ĺ y ľ son inversas. Las relaciones ą y ă son inversas. Las relaciones Ă y Ą son relaciones inversas. La igualdad “ es una relación cuya inversa es la misma igualdad “. 3.3.12. Definición. Decimos que f : A ÝÑ B es una función sobre B si B “ Rpf q, es decir si para todo b P B existe un a P A tal que f paq “ b. Decimos que f : A ÝÑ B es inyectiva si para cada x1 , x2 P A con x1 ‰ x2 , se tiene que f px1 q ‰ f px2 q. Decimos que f : A ÝÑ B es una biyección de A en B si es inyectiva y es sobre B. A las biyecciones de A en B también se les llama correspondencias biunívocas de A en B. Observemos que si f : A ÝÑ B es una biyección de A en B, entonces existe una única función f ´1 : B ÝÑ A tal que 3.3.13. f paq “ b ðñ f ´1 pbq “ a. 3.3.14. Definición. Sea f : A ÝÑ B una biyección de A en B. A la función f ´1 : B ÝÑ A descrita en la fórmula 3.3.13 se le llama la inversa de f . 3.3.15. Definición. Si f : A ÝÑ B y g : C ÝÑ D, definimos la composición de g con f como la función denotada por g ˝ f que es tal que g ˝ f : E ÝÑ D con E “ tx P A : f pxq P Cu y está definida por g ˝ f peq “ gpf peqq para todo e P E. 3.3. Relaciones 41 f g j B A “ Dompf q j D E C “ Dompgq Notemos que para que tenga sentido la expresión gpf pxqq es necesario que x pertenezca al dominio de f , el cual es A, y que f pxq pertenezca al dominio de g, el cual es C. Observemos también que si f es una biyección de A en B, entonces para a P A se tiene que f ´1 ˝ f paq “ a y para todo b P B se tiene que f ˝ f ´1 pbq “ b. Cuando „ sea una relación de A en A diremos simplemente que es una relación en A. 3.3.16. Definición. Sea „ una relación en A. Decimos que „ es: reflexiva cuando a „ a (para todo a en A); simétrica cuando a „ b ùñ b „ a; transitiva cuando pa „ b y b „ cq ùñ a „ c. Una relación que sea reflexiva, simétrica y transitiva se dice que es una relación de equivalencia. La igualdad es el ejemplo típico de relación de equivalencia. En geometría la relación de congruencia de ángulos es una relación de equivalencia. También en geometría la semejanza entre triángulos es una relación de equivalencia. Si A es el conjunto de personas de la República Mexicana y para a, b P A escribimos a ˛ b cuando el primer apellido de a y de b son iguales, entonces ˛ es una relación de equivalencia. 3.3.17. Definición. Si tenemos que A es un conjunto y F es una colección de subconjuntos disjuntos no vacíos de A cuya unión es A, decimos que F es una partición en clases de A. Cuando „ es una relación de equivalencia en un conjunto A y x P A, decimos que el conjunto x„ :“ ta P A : a „ xu es una clase de equivalencia de la relación „. Más específicamente, decimos que x„ es la clase de x (con respecto a la relación „). 3.3.18. Teorema. Si „ es una relación de equivalencia en un conjunto A, entonces el conjunto de todas las clases de equivalencia de „ es una partición en clases de A. Demostración. Sea F el conjunto de todas las clases de equivalencia de „. Por la propiedad Ť „ reflexiva, todo a P a , por lo que A Ă B, pero como para todo x P a„ se tiene que x P A, BPF Ť Ť entonces A Ą B, por lo que A “ B. Ahora, si B1 y B2 son dos elementos de F, tenemos BPF BPF „ que existe un x1 P B1 y un x2 P B2 tales que B1 “ x„ 1 y x2 “ B2 . Mostremos que B1 y B2 son disjuntos o iguales. Si no fueran disjuntos, existiría un x P B1 X B2 . Ahora, para todo b1 P B1 se tiene que x „ x2 , x „ x1 y b1 „ x1 , de modo que aplicando el hecho de que „ es 42 3.3. Relaciones una relación de equivalencia tenemos que b1 „ x2 , es decir b1 P B2 . Análogamente podemos concluir que todo elemento de B2 es elemento de B1 , teniendo así que B1 “ B2 . Por lo tanto, si B1 y B2 no son disjuntos entonces son iguales, de manera que F es una partición en clases de A. ‚ El teorema 3.3.18 tiene un recíproco. 3.3.19. Teorema. Si A es un conjunto y F es una partición en clases de A, entonces existe una relación de equivalencia „ en A tal que a „ b ðñ a y b pertenecen a un mismo elemento de F. Demostración. Definamos la expresión a „ b como la proposición que afirma que a y b están en el mismo elemento de F y veamos que „ es una relación de equivalencia. Si x P A, entonces x pertenece a un elemento de la partición en clases F, por lo que x „ x y se cumple la propiedad reflexiva. Si x „ y, entonces existe un B P F tal que x, y P B, lo cual también significa que y „ x, cumpliéndose la propiedad simétrica. Si tenemos que x „ y y también y „ z, el elemento de partición en clases al cual pertenece y es el mismo al cual pertenece x y al cual pertenece z, por lo tanto x „ z, cumpliéndose así la propiedad transitiva, de manera que la relación „ es de equivalencia. ‚ Observemos que los elementos de la partición F, dada en el teorema 3.3.19, son las clases de equivalencia de la relación de equivalencia „ dada en el mismo teorema. 3.3.20. Definición. Decimos que una relación ĺ en A es antisimétrica si se tiene que (a ĺ b y b ĺ a) ùñ a “ b. Una relación que sea reflexiva, antisimétrica y transitiva se dice que es una relación de orden parcial (o simplemente que es un orden parcial). Por ejemplo, si A es un conjunto, en el conjunto potencia de A la relación de inclusión Ă es una relación de orden parcial. Cuando ĺ es un orden parcial en un conjunto A en el que existen a, b P A tales que a ĺ b ó b ĺ a, diremos que los elementos a y b son comparables (con respecto a ĺ). Un orden parcial ĺ en un conjunto A, en el cual se cumple que para cualesquiera dos elementos x, y P A se tiene siempre que x ĺ y o bien y ĺ x, se llama orden total u orden lineal, es decir un orden total es un orden parcial en un conjunto tal que cualesquiera dos elementos del conjunto son comparables, en tal caso se dice que A es una cadena con respecto a ĺ. Como ejemplo de orden total tenemos la relación ĺ (menor o igual) definida en el conjunto R de los números reales. Una relación ă en un conjunto A se dice que es un orden estricto cuando existe un orden total ĺ en A tal que para cualesquiera dos elementos x e y de A, se tiene que x ă y ðñ px ĺ y y x ‰ y). 3.3.21. Definición. Sea B Ă A y ĺ es un orden parcial en A. Decimos que un elemento a de A es el ínfimo de B (con respecto al orden parcial ĺ) si para todo b P B se tiene que a ĺ b y además si c ĺ b para todo b P B, entonces c ĺ a. De manera similar, decimos que un elemento a de A es el supremo de B si para todo b P B se tiene que b ĺ a y además si b ĺ c para todo b P B, entonces a ĺ c. Al supremo de B (si existe) lo denotaremos por sup B mientras que al ínfimo de B por ínf B. De la propiedad antisimétrica para los órdenes parciales, podemos deducir que si el ínfimo (o el supremo) de B existe, éste debe ser único. 3.3.22. Definición. Sea ĺ un orden parcial definido en un conjunto A. Si B Ă A y existe un a P A tal que para todo b P B se tiene que b ĺ a, decimos que a es una cota superior del conjunto B (con respecto al orden ĺ) y que el conjunto B está acotado superiormente 3.3. Relaciones 43 por a. De manera similar, si C Ă A y existe un a P A tal que a ĺ c para todo c P C, decimos que a es una cota inferior de C y que C es un conjunto acotado inferiormente por a. Un conjunto acotado es un conjunto que es acotado inferiormente y acotado superiormente (con respecto al orden dado). 3.3.23. Definición. Sea A un conjunto parcialmente ordenado por ĺ. Decimos que la pareja pA, ĺq es un retículo o latis, o que A forma un retículo con ĺ, si para cualesquiera dos elementos a, b P A se tiene que tanto ínf ta, bu como supta, bu existen. Observemos que todo conjunto A totalmente ordenado forma un retículo con el orden, donde ínf ta, bu, supta, bu P ta, bu para todo a, b P A. Como ejemplos de retículos tenemos a pN, ĺq y a pppAq, Ăq, para cualquier conjunto A. Sin embargo, el conjunto tt1, 2u, t1u, t1, 3uu no forma un retículo con el orden parcial Ă. 3.3.24. Notación. También se denotará a supta, bu como a _ b y a ínf ta, bu como a ^ b, pero cuando se utilice esta notación no debemos confundirnos con los conectivos lógicos «o» e «y» (a menos que el conjunto sea un conjunto de proposiciones con el orden parcial ùñ) y será mejor representar los conectivos lógicos con las palabras «o» e «y». En lo sucesivo los conectivos lógicos serán representados con las palabras «o» e «y». 3.3.25. Definición. Un retículo pL, ĺq se dice que es completo si todo subconjunto no vacío de L tiene un supremo y un ínfimo. 3.3.26. Aclaración. Tenemos que desde el punto de vista estrictamente lógico pudiera no tener sentido la expresión pL, ĺq debido a que ésta es una pareja ordenada de un objeto con una relación, que de acuerdo a nuestra definición una relación es un predicado y un predicado no ha quedado establecido como objeto. Si esto pudiera crear algún problema, tal problema se resuelve estableciendo que cuando tengamos que una de las componente sea una relación, en realidad nos estaremos refiriendo a la gráfica de la relación, por ejemplo, estableceremos que pL, ĺq significa pL, Grpĺqq. Ejercicios. 1. Decir cuáles de las siguientes relaciones entre a y b son reflexivas, simétricas o transitivas, cuáles son de equivalencia, de orden total o de orden lineal. Dar un conjunto en el cual puede estar definida la relación. a) a Ă b. b) a ` 1 “ b. c) a ą b. d) a P b. e) a tiene el mismo tipo de sangre que b. f) a ĺ b. g) 2a ľ b. h) a2 “ b2 . i) a k b (a es paralela a b). j) a K b. k) a ‰ b. l) a ¨ b “ 1. 2. Decir cuáles de las siguientes relaciones entre a y b determinan funciones y decir si la relación inversa determina una función. En caso de que determine función, dar su dominio y su recorrido, además decir si es inyectiva. 44 3.3. Relaciones a) a es el tipo de sangre de la persona b. b) La persona a tiene tipo de sangre b. c) a2 “ b2 . d) a ¨ b “ 1. e) a es hermano de b. f) b es el grupo étnico al cual pertenece a. g) b “ 5 ¨ a. h) ab “ 1, donde a, b P N. 3. Demostrar que toda función está determinada por alguna relación. 4. Dada la proposición «a es madre de b». ¿Cuál es la relación inversa de la relación «ser madre de»? 5. Demostrar que la composición de dos funciones inyectivas es una función inyectiva. 6. Demostrar que si f : A ÝÑ B es sobre B y g : B ÝÑ C es sobre C, entonces g ˝ f es sobre C. 7. En los siguientes incisos, dadas las funciones f y g, determinar g ˝ f y f ˝ g cuando tenga sentido, así como sus dominios y recorridos de cada una de ellas. a) f pxq “ 2 ¨ x ` 1; gpsq “ s2 . b) f paq “ # de artículos producidos por la fábrica a; gpnq “ costo de producir n artículos. c) El volumen en metros cúbicos de un cilindro de 3 metros de alto y base de área a metros cuadrados está dado por gpaq “ 3 ¨ a, donde el área (en metros cuadrados) de la base circular de radio r metros es de f prq “ π ¨ r2 . 8. Sean A y B dos conjuntos y C “ tttau, ta, buu : a P A y b P Bu. Demostrar que la función f : A ˆ B ÝÑ C definida como f px, yq “ ttxu, tx, yuu es una biyección de A ˆ B en C. 9. Supongamos que un conjunto L forma un retículo con un orden parcial ĺ. Demostrar que a _ b “ b _ a, a _ pb _ cq “ pa _ bq _ c, a _ pb ^ aq “ pa _ bq ^ a “ a y a _ a “ a. 3.4. Definiciones recursivas 3.4. 45 Definiciones recursivas 3.4.1. Teorema. Sea M un conjunto, f : N ˆ M ÝÑ M y a P M . Existe una única función ϕ : N ÝÑ M tal que ϕp1q “ a y ϕpn ` 1q “ f pn, ϕpnqq para todo n P N. Antes de demostrar el teorema haremos algunos comentarios. Una función ϕ como la anterior se dice que está definida de manera recursiva. La razón por la cual se le da ese nombre es que para saber cuál es el valor de ϕpn ` 1q es suficiente con conocer n y ϕpnq. Por ejemplo, tenemos ϕp1q “ a, ϕp2q “ f p1, aq, ϕp3q “ f p2, ϕp2qq, ϕp4q “ f p3, ϕp3qq, etc. Las definiciones recursivas son muy usadas en la elaboración de algoritmos computacionales. Procedamos a demostrar el teorema 3.4.1. Demostración del teorema 3.4.1. Afirmamos que para todo n P N existe un único λn tal que λ1 “ a y λn`1 “ f pn, λn q. En efecto, si n “ 1, la única posibilidad es que λ1 “ a. Supongamos que para un número natural n, λn es el único elemento de M que satisface las condiciones anteriores, entonces λn`1 es el único elemento de M que satisface la condición λn`1 “ f pn, λn q por lo que la afirmación está confirmada. Ahora la única función ϕ : N ÝÑ M que satisface las condiciones del teorema es la dada por ϕpnq “ λn . ‚ Utilizaremos las formas recursivas para definir la suma de dos números naturales cualesquiera. Los axiomas de Peano definen para todo número natural n al número n ` 1. 3.4.2. Definición. Teniendo definido n ` m, definamos n ` pm ` 1q como pn ` mq ` 1. A la expresión a ` b donde a y b son números naturales se le llama adición o suma de los números naturales a y b. Al símbolo ` se le conoce como símbolo de adición o suma y la expresión a ` b se lee «a más b» o «la suma de a y b». Veamos algunas propiedades de la adición de números naturales. 3.4.3. Teorema. Sean a, b, c P N, entonces: I) a`b“b`a II) pa ` bq ` c “ a ` pb ` cq (propiedad asociativa). (propiedad conmutativa). Demostración. Demostremos primero la propiedad asociativa por inducción matemática sobre el tercer sumando c. Por definición de suma la propiedad es válida cuando c “ 1. Si para algún número natural c se tiene la igualdad pa ` bq ` c “ a ` pb ` cq, entonces ppa ` bq ` cq ` 1 “ pa ` pb ` cqq ` 1, pero por una parte ppa ` bq ` cq ` 1 “ pa ` bq ` pc ` 1q y por otra parte pa ` pb ` cqq ` 1 “ a ` ppb ` cq ` 1q “ a ` pb ` pc ` 1qq, por lo tanto pa ` bq ` pc ` 1q “ a ` pb ` pc ` 1qq. 46 3.4. Definiciones recursivas Así la propiedad asociativa se cumple, es decir si a, b y c son números naturales, entonces pa ` bq ` c “ a ` pb ` cq. Demostremos ahora la propiedad conmutativa. En la demostración haremos uso frecuente de la propiedad asociativa. Veamos primero por inducción matemática que es válida en el caso en que b “ 1. Es decir, demostremos primero que a ` 1 “ 1 ` a para cualquier número natural a. La igualdad anterior es obvia si a “ 1. Ahora si para algún número natural a se cumple que a ` 1 “ 1 ` a, entonces pa ` 1q ` 1 “ p1 ` aq ` 1, pero p1 ` aq ` 1 “ 1 ` pa ` 1q, por lo tanto pa ` 1q ` 1 “ 1 ` pa ` 1q. De donde a ` 1 “ 1 ` a para todo número natural a. Es decir la propiedad conmutativa a ` b “ b ` a es valida cuando b “ 1. Demostremos ahora por inducción matemática sobre b que la igualdad es válida. Supongamos que la igualdad se cumple para algún número natural b, es decir a ` b “ b ` a, sumando 1 en ambos lados de la igualdad obtenemos pa ` bq ` 1 “ pb ` aq ` 1, pero por una parte pa ` bq ` 1 “ a ` pb ` 1q y por otra parte pb ` aq ` 1 “ 1 ` pb ` aq “ p1 ` bq ` a “ pb ` 1q ` a, por lo tanto a ` pb ` 1q “ pb ` 1q ` a. Es decir a ` b “ b ` a para cualesquier número natural a y cualesquier número natural b. ‚ En lo sucesivo para agilizar las demostraciones se usarán las propiedades de los números naturales que se vallan demostrando sin necesidad de hacer la mención explícita correspondiente. 3.4.4. Teorema (propiedad de la cancelación para la suma). Dados tres números naturales a, b y c se tiene que a ` c “ b ` c ðñ a “ b. Esta propiedad se demostrará a continuación por inducción matemática sobre c aunque se recomienda al lector que antes de ver la demostración trate de demostrarla por sí mismo. 3.4. Definiciones recursivas 47 Demostración. Por el axioma de sustitución de iguales se tiene que si a “ b, entonces a ` c “ b ` c. Es decir se tiene que a “ b ùñ a ` c “ b ` c. Demostraremos por inducción la implicación recíproca. Por el axioma de Peano 3.4.1 d) tenemos que para c “ 1 a ` 1 “ b ` 1 ùñ a “ b. Suponiendo que la propiedad es válida para algún número natural c. De nuevo por el axioma de Peano 1 d) y por la proposición anterior se tienen las siguientes implicaciones a ` pc ` 1q “ b ` pc ` 1q ùñ pa ` cq ` 1 “ pb ` cq ` 1 ùñ a ` c “ b ` c ùñ a “ b. Es decir, si se puede cancelar c, también se puede cancelar c ` 1, por lo que la propiedad de la cancelación queda demostrada. ‚ Definiremos a continuación una relación que ordena al conjunto de los números naturales. 3.4.5. Definición. Decimos que un número natural a es mayor que un número natural b si existe un número natural c tal que a “ b ` c. La proposición «a es mayor que b» se representa por a ą b. Decimos que un número natural a es mayor o igual que un número natural b si a ą b ó a “ b. A la proposición «a en mayor o igual que b» se le denota por a ľ b. Como ejemplos tenemos que 5 ą 3 pues 5 “ 3 ` 2; 23 ą 15 pues 23 “ 15 ` 8; 13 ľ 5 pues 13 ą 5 ya que 13 “ 5 ` 8; 4 ľ 4 pues 4 “ 4. 3.4.6. Definición. Diremos que a es menor que b cuando b ą a y lo denotaremos por a ă b. De manera similar diremos que a es menor o igual que b cuando b ľ a y lo denotamos por a ĺ b. A las proposiciones que contengan uno o varios de los símbolos ĺ, ľ, ă ó ą se les llama desigualdades. Veamos algunas propiedades de los números naturales con respecto a las desigualdades. 3.4.7. Teorema. Sean a, b, c P N. I) aľa (propiedad reflexiva). II) pa ľ b y b ľ aq ùñ a “ b (propiedad antisimétrica). III) pa ľ b y b ľ cq ùñ a ľ c (propiedad transitiva). IV) a ą b ðñ a ` c ą b ` c (propiedad de cancelación). V) aľb ó bĺa (propiedad de comparación). VI) a ą b ùñ a ‰ b. 48 3.4. Definiciones recursivas Demostración. I) La propiedad reflexiva es directa de la definición de ľ. III) Demostremos la propiedad transitiva para el caso en que a ą b y b ą c. Para los demás casos se deja como ejercicio al lector. Si a ą b y b ą c, entonces existen números t, s P N tales que a “ b ` t y b “ c ` s, por lo que a “ pc ` sq ` t “ c ` ps ` tq, de lo que concluimos que a ą c, por lo tanto a ľ c. IV) Para demostrar la propiedad de la cancelación veamos primero que a ľ b ùñ a ` c ùñ b ` c. Si a “ b, entonces a ` c “ b ` c, por lo que a ` c ľ b ` c. Si a ą b, existe un número natural t, tal que a “ b ` t 6 a ` c “ pb ` tq ` c “ pb ` cq ` t, es decir a ` c ą b ` c, por lo que a ` c ľ b ` c. Por lo tanto a ľ b ùñ a ` c ľ b ` c. Veamos ahora que a ` c ľ b ` c ùñ a ľ b. Si a + c = b + c, entonces por el teorema 3.4.4, tenemos que a “ b 6 a ľ b. Si a ` c ą b ` c, entonces existe un número natural t tal que a ` c “ pb ` cq ` t, es decir a ` c “ pb ` tq ` c y por el teorema 3.4.4 tenemos que a “ b ` t, por lo que a ą b 6 a ľ b. Así tenemos que a ` c ľ b ` c ùñ a ľ b y como además a ľ b ùñ a ` c ľ b ` c, concluimos que a ľ b ðñ a ` c ľ b ` c. VI) Demostremos ahora que si a y b son números naturales, entonces a ą b ùñ a ‰ b. Si a ą b, existe un número natural t tal que a “ b ` t. Veamos pues que b ` t ‰ b. Procedamos por inducción matemática sobre b. Si b “ 1, entonces por el axioma de Peano 3.4.1 c) tenemos que 1 ` t “ t ` 1 ‰ t. Supongamos que para algún número natural b se tiene que b ` t ‰ b. Por el teorema 3.4.4 pb ` tq ` 1 ‰ b ` 1, de donde pb ` 1q ` t ‰ b ` 1. Por lo tanto b ` t ‰ b para todo b, t P N. Así, si a “ b ` t, entonces a ‰ b. V) Demostremos ahora que si a y b son números naturales, entonces aľb ó b ľ a. Esto lo haremos demostrando la proposición equivalente pa ľ bq ùñ b ľ a. Veamos primero por inducción matemática que todo número natural es mayor o igual que 1. Si n “ 1, entonces n ľ 1. Si n ľ 1, entonces por las propiedad de cancelación tenemos que n ` 1 ľ 1 ` 1 ą 1, por lo que debido a la propiedad transitiva n ` 1 ľ 1. Así todo número natural es mayor o igual que 1. Demostremos ahora por inducción matemática sobre b que pa ľ bq ùñ b ľ a. Para b “ 1 tenemos que a ľ b es falsa, por lo cual la implicación se cumple. Supongamos ahora que para un número natural b se tiene que pa ľ bq ùñ b ľ a y en base a ello demostremos que pa ľ b ` 1q ùñ b ` 1 ľ a. 3.4. Definiciones recursivas 49 Tenemos los siguientes casos: a) a “ b, b) a ą b y c) pa ľ bq. Para el caso a) tenemos que a ` 1 ą a, pero como a “ b, entonces b ` 1 ą a, por lo tanto pa ľ b ` 1q ùñ b ` 1 ľ a es verdadera si a “ b. Para el caso b) tenemos que existe un c P N tal que a “ b ` c, donde c ľ 1. Ahora, hay dos posibilidades, c “ 1 ó c ą 1. Si c “ 1, se tiene que b ` 1 “ a y así b ` 1 ľ a. Si c ą 1, entonces existe un t P N tal que c “ 1 ` t, por lo que a “ b ` p1 ` tq “ pb ` 1q ` t, es decir pa ľ b ` 1q es una proposición falsa, por lo que pa ľ b ` 1q ùñ b ` 1 ľ a es verdadera. Veamos ahora el caso c) en que pa ľ bq. En este caso, por hipótesis de inducción y por ser a ‰ b, tenemos que b ą a, pero como b ` 1 ą b, entonces, por la propiedad transitiva, tenemos que b ` 1 ľ a. Con lo cual demostramos que pa ľ b ` 1q ùñ b`1ľa o equivalentemente a ľ b ó b ľ a. II) Finalmente, demostremos la propiedad antisimétrica pa ľ b y b ľ aq ùñ a “ b. Si a fuera diferente de b, tendríamos que si a ľ b y b ľ a, entonces a ą b y b ą a, es decir existirían números naturales t y s tales que a “ b ` t y b “ a ` s, por lo que a “ pa ` sq ` t “ a ` ps ` tq, es decir tendríamos que a ą a, lo cual contradice la propiedad VI). Por lo tanto es imposible que se cumplan simultáneamente las proposiciones pa ľ b y b ľ aq y a ‰ b, de donde tenemos que si pa ľ b y b ľ aq, entonces a “ b. ‚ La demostración del siguiente corolario es parte de la demostración de la propiedad V) del teorema 3.4.7. 3.4.8. Corolario. Si n P N, entonces n ľ 1. 3.4.9. Corolario. Si n es un número natural diferente de 1, entonces n ą 1. Demostración. Este corolario se sigue del corolario 3.4.8 y de la definición de ľ. ‚ 50 3.5. Multiplicación de números naturales 3.5. Multiplicación de números naturales 3.5.1. Definición. Definamos de manera recursiva la multiplicación o producto de dos números naturales cualesquiera a y b como el número denotado a ¨ b tal que a ¨ 1 “ a y a ¨ pb ` 1q “ a ¨ b ` a. Seguramente el lector ya sabe que a ¨ b representa la suma de a con sigo mismo b veces. En ausencia de paréntesis cuando una expresión tenga multiplicaciones y sumas se efectuarán primero las multiplicaciones y luego las sumas. Verifiquemos en el siguiente teorema algunas propiedades para la multiplicación de números naturales. 3.5.2. Teorema. Sean a, b, c P N. I) a ¨ b “ b ¨ a II) III) (propiedad conmutativa). a ¨ pb ¨ cq “ pa ¨ bq ¨ c (propiedad asociativa). a ¨ pb ` cq “ a ¨ b ` a ¨ c (propiedad distributiva). IV) a ¨ c “ b ¨ c ðñ a “ b (propiedad de la cancelación en la igualdad). V) a ¨ c ą b ¨ c ðñ a ą b (propiedad de la cancelación en la desigualdad). Demostración. III) Demostraremos primero la propiedad distributiva. Si c “ 1, entonces a ¨ pb ` 1q “ a ¨ b ` a “ a ¨ b ` a ¨ 1 (definición de producto). Si la propiedad es verdadera para un número natural c, es decir si a ¨ pb ` cq “ a ¨ b ` a ¨ c, entonces a ¨ pb ` pc ` 1qq “ a ¨ ppb ` cq ` 1q “ a ¨ pb ` cq ` a “ pa ¨ b ` a ¨ cq ` a “ a ¨ b ` pa ¨ c ` aq “ a ¨ b ` a ¨ pc ` 1q. Por lo tanto se vale la propiedad distributiva. II) Demostremos ahora la propiedad asociativa por inducción matemática sobre c. Si c “ 1, entonces a ¨ pb ¨ 1q “ a ¨ b “ pa ¨ bq ¨ 1 (definición de multiplicación). Si la propiedad es verdadera para algún número natural c, entonces a ¨ pb ¨ pc ` 1qq “ a ¨ pb ¨ c ` bq “ a ¨ pb ¨ cq ` a ¨ b “ pa ¨ bq ¨ c ` a ¨ b “ pa ¨ bq ¨ pc ` 1q. Por lo tanto es válida la propiedad asociativa. I) Antes de demostrar la propiedad conmutativa, demostremos la propiedad distributiva por la izquierda, es decir demostremos que pa ` bq ¨ c “ a ¨ c ` b ¨ c. 3.5. Multiplicación de números naturales 51 Para c “ 1 tenemos que pa ` bq ¨ 1 “ a ` b “ a ¨ 1 ` b ¨ 1. Si para un número natural c se cumple que pa ` bq ¨ c “ a ¨ c ` b ¨ c, entonces pa ` bq ¨ pc ` 1q “ pa ` bq ¨ c ` pa ` bq “ pa ¨ c ` b ¨ cq ` pa ` bq “ a ¨ c ` pb ¨ c ` pa ` bqq “ a ¨ c ` ppb ¨ c ` aq ` bq “ a ¨ c ` ppa ` b ¨ cq ` bq “ a ¨ c ` pa ` pb ¨ c ` bqq “ pa ¨ c ` aq ` pb ¨ c ` bqq “ a ¨ pc ` 1q ` b ¨ pc ` 1q, por lo que también es válida la propiedad distributiva por la izquierda. Procedamos ahora a demostrar la propiedad conmutativa. Demostremos primero que 1 ¨ a “ a ¨ 1. Si a “ 1, claramente es válido que 1 ¨ a “ a ¨ 1. Si para algún número natural a se cumple que a ¨ 1 “ 1 ¨ a, entonces 1 ¨ pa ` 1q “ 1 ¨ a ` 1 “ a ¨ 1 ` 1 ¨ 1 “ pa ` 1q ¨ 1, por lo que a ¨ 1 “ 1 ¨ a para todo número natural a. Así tenemos que a ¨ b “ b ¨ a cuando b “ 1 y a es cualquier número natural. Supongamos que a ¨ b “ b ¨ a para algún número natural b. Por una parte a ¨ pb ` 1q “ a ¨ b ` a, por otro lado pb ` 1q ¨ a “ b ¨ a ` a “ a ¨ b ` a, de donde obtenemos que a ¨ pb ` 1q “ pb ` 1q ¨ a, quedando demostrada la propiedad conmutativa. IV) Demostremos ahora la propiedad de la cancelación en la igualdad. Es claro que a “ b ùñ a ¨ c “ b ¨ c. Demostremos entonces que a ¨ c “ b ¨ c ùñ a “ b. Si a ‰ b, hay dos posibilidades, a saber a ą b ó b ą a. Sin pérdida de generalidad supongamos que a ą b. En tal caso existe un número natural t, tal que a “ b ` t, luego a ¨ c “ pb ` tq ¨ c, de donde a ¨ c “ b ¨ c ` t ¨ c, por lo cual a ¨ c ą b ¨ c. De manera similar se demuestra que si b ą a, entonces b ¨ c ą a ¨ c. En general a ‰ b ùñ a ¨ c ‰ b ¨ c lo cual equivale a que a ¨ c “ b ¨ c ùñ a “ b. V) Para demostrar la propiedad de la cancelación en la desigualdad, observemos que ya se demostró que a ą b ùñ a ¨ c ą b ¨ c, por lo que es suficiente demostrar que a ¨ c ą b ¨ c ùñ a ą b. Si no fuera cierto que a ą b, entonces tendríamos dos posibilidades a“b ó a ă b. En el primer caso concluiríamos que a¨c “ b¨c y en el segundo caso que b¨c ą a¨c. Es decir, en caso de ser falso que a ą b, también será falso que a ¨ c ą b ¨ c, por lo que a ¨ c ą b ¨ c ùñ a ą b. ‚ 3.5.3. Definición. Tomemos un objeto 0 diferente de cualquier número natural al cual llamaremos el número cero. Al conjunto N Y t0u lo llamaremos conjunto de los números enteros no negativos. Si n es un entero no negativo definimos: 52 3.5. Multiplicación de números naturales n ` 0 “ 0 ` n “ n; n ¨ 0 “ 0 ¨ n “ 0; nľ0 y n ą 0 ðñ n ‰ 0. 3.5.4. Definición. Si a “ b ` c decimos que c es la diferencia entre a y b ó que c es a menos b y se denota así c “ a ´ b. Si a “ b ¨ c decimos que c es la división de a y b ó que c es a entre b y se denota c “ a{b, c“a˜b ó a c“ . b Ejercicios. 1. Demostrar que a ´ a “ 0 para todo entero no negativo a. 2. Demostrar que a ´ 0 “ a para todo entero no negativo a. 3. Si a1 , a2 , a3 , ..., an´2 , an´1 , an son números y n es un número natural, el símbolo n ÿ ak k“1 representa la expresión a1 ` a2 ` a3 ` ¨ ¨ ¨ ` an´2 ` an´1 ` an . Usar el método recursivo para definir con precisión tal símbolo. 4. Demostrar que si x es un número, entonces n ÿ x “ n ¨ x. k“1 5. Si a es un número y n es un número natural, entonces el símbolo an representa la expresión a ¨ a ¨ a ¨ ¨ ¨ ¨ ¨ a (a multiplicado por sí mismo n veces). Usar el método recursivo para definir con precisión an . 6. De acuerdo a la definición hecha en el ejercicio anterior, demostrar que si a y b son números y n es un número natural, entonces pa ¨ bqn “ an ¨ bn . 7. Sean f y g biyecciones de A en B y de B en C respectivamente. Demostrar que pg ˝f q´1 es una biyección de C en A y que además pg ˝ f q´1 “ f ´1 ˝ g ´1 . (Nótese la importancia del orden de aparición de las funciones en la composición). 3.5. Multiplicación de números naturales 53 8. Demostrar las fórmulas siguientes: a) n ÿ k“ k“1 d) 1 ` n ÿ k“1 npn ` 1q ; 2 b) n ÿ k2 “ k“1 npn ` 1qp2n ` 1q ; 6 c) n ÿ k“1 k3 “ n2 pn ` 1q2 ; 4 n`1 xk “ 1´x , para x ‰ 1. 1´x 9. Supongamos que definimos a1 “ 1, a2 “ 1, y cuando k es un número natural mayor que 2 definimos ak “ ak´1 ` ak´2 . Demostrar que para todo número natural n se tiene que a3n es par. (Un número natural b es par si existe un número natural a tal que b “ 2 ¨ a). 54 3.6. Operaciones 3.6. Operaciones 3.6.1. Definición. Sea A un conjunto. Una operación en A es una función ˚ : AˆA ÝÑ C. Cuando A y B sean dos conjuntos, no necesariamente iguales, una operación entre A y B será una función ˚ : A ˆ B ÝÑ C. Generalmente cuando ˚ es una operación se toma la notación x ˚ y en lugar de ˚px, yq. 3.6.2. Definición. Sea ˚ una operación en A. Decimos que la operación ˚ es: si a ˚ b P A (para todo a, b P A); conmutativa si a ˚ b “ b ˚ a (para todo a, b P A); asociativa si pa ˚ bq ˚ c “ a ˚ pb ˚ cq (para todo a, b, c P A). I) cerrada II) III) En el caso en que la operación ˚ sea asociativa, la expresión a ˚ pb ˚ cq se denota simplemente como a ˚ b ˚ c. Como ejemplos de operaciones tenemos la suma «`» y la multiplicación «¨» en el conjunto N de los números naturales; cuando A es un conjunto, tenemos que la intersección X y la unión Y son operaciones en el conjunto ppAq, es decir son operaciones en el conjunto de todos los subconjuntos de A; cuando la pareja ordenada pA, ĺq es un retículo, entonces ^ y _ (ínfimo y supremo) son operaciones en A. Los anteriores son ejemplos de operaciones que son cerradas, conmutativas y asociativas. 3.6.3. Definición. Supongamos que ˚ es una operación cerrada en un conjunto A, decimos que un elemento e P A es un elemento identidad para la operación ˚ si para todo a P A se tiene que a ˚ e “ e ˚ a “ a. En los ejemplos anteriores, el número 1 es un elemento identidad para la multiplicación ¨; la suma no tiene elemento identidad en los números naturales, pero sí lo tiene en el conjunto N Y t0u; la unión Y tiene como elemento identidad al conjunto vacío ∅ y la intersección X tiene como elemento identidad al conjunto A; cuando A forma un retículo con un orden parcial ĺ y además existe en A el ínfimo y el supremo de A, tenemos que ínf A es un elemento identidad para la operación _, mientras que sup A es un elemento identidad para la operación ^. 3.6.4. Teorema. Supongamos que en un conjunto L están definidas dos operaciones " y ! que son cerradas, conmutativas, asociativas y además se tiene que para cualesquiera dos elementos a, b P L se cumple que a ! pa " bq “ pa ! bq " a “ a. Si definimos la relación ĺ de tal manera que la expresión a ĺ b signifique que a ! b “ b y a " b “ a, entonces el conjunto L forma un retículo con la relación ĺ. Demostración. Veamos primero que la relación ĺ es un orden parcial, es decir que satisface las propiedades reflexiva, antisimétrica y transitiva. Si a P L, entonces a ! a “ a ! ppa ! aq " aq “ a ! pa " pa ! aqq “ a, y también a " a “ a " pa ! pa " aqq “ pa ! pa " aqq " a “ a, por lo tanto a ĺ a, es decir ĺ es una relación reflexiva. Para ver que la relación es simétrica supongamos que a ĺ b y que b ĺ a, es decir a ! b “ b y a " b “ a, y también b ! a “ a y b " a “ b. Del hecho de que las operaciones " y ! son conmutativas concluimos que a “ b, es decir la relación ĺ es antisimétrica. 3.6. Operaciones 55 Veamos finalmente que ĺ es transitiva. Supongamos que a ĺ b y que b ĺ c, es decir a ! b “ b, a " b “ a, b ! c “ c y b " c “ b. Tenemos que a ! c “ pa " bq ! pb ! cq “ ppa " bq ! bq ! c “ b ! c “ c y también tenemos que a " c “ pa " bq " pb ! cq “ a " pb " pb ! cqq “ a " b “ a, por lo tanto a ĺ c, es decir la relación ĺ es transitiva. Hemos pues demostrado que ĺ es una relación de orden parcial. Si a, b P L, entonces a " pa ! bq “ a y a ! pa ! bq “ pa ! aq ! b “ a ! b, por lo que a ĺ a ! b y análogamente podemos ver que a " b ĺ a, b ĺ a ! b y a " b ĺ b, de tal manera que a " b es una cota inferior de ta, bu y a ! b es una cota superior de ta, bu. Ahora, si c es también una cota inferior de ta, bu entonces c " a “ c, c ! a “ a, c " b “ c y c ! b “ b, por lo cual c " pa " bq “ pc " aq " b “ c " b “ c y c " pa " bq “ pc " bq ! pa " bq “ ppc " aq " bq ! pa " bq “ pc " pa " bqq ! pa " bq “ a " b, por lo tanto c ĺ a " b y así a " b “ ínf ta, bu. Análogamente se demuestra que a ! b “ supta, bu, teniendo así que pL, ĺq es un retículo. ‚ 3.6.5. Definición. Cuando en un conjunto A tenemos definidas dos operaciones ! y ", decimos que dichas operaciones cumplen la propiedad de absorción cuando para cualquier a, b P A se tiene que pa ! bq " a “ pa " bq ! a “ a. 3.6.6. Definición. Sea A un conjunto en el cual están definidas dos operaciones ! y ". Decimos que la terna pA, !, "q es un álgebra de Boole o un álgebra booleana cuando las operaciones son cerradas, conmutativas, asociativas, tienen elementos identidad ω y φ para ! y " respectivamente, cumplen la propiedad de absorción, cumplen con las propiedades distributivas a ! pb " cq “ pa ! bq " pa ! cq y a " pb ! cq “ pa " bq ! pa " cq para todo a, b, c P A, y además para todo a P A existe un a1 P A tal que a ! a1 “ ω y a " a1 “ φ (al elemento a1 se le llama complemento de a). Cuando pA, !, "q es un álgebra booleana, también decimos que el conjunto A forma un álgebra booleana con las operaciones ! y ". Como ejemplo típico de álgebra booleana tenemos a pppAq, Y, Xq, donde A es un conjunto, el elemento identidad para Y es A, el elemento identidad para X es ∅ y el complemento de cualquier B Ă A es AzB. 3.6.7. Definición. Cuando Σ sea una colección de conjuntos tal que pΣ, Y, Xq es un álgebra booleana, diremos que Σ es un álgebra o un álgebra de conjuntos. Ejercicios. 1. En cada uno de los siguientes casos se define una operación en el conjunto N Y t0u de los enteros no negativos. En cada caso determinar si la operación es conmutativa, asociativa o tiene elemento identidad. En caso de que tenga elemento identidad, decir cual es. a) m ˚ n “ m ` n ` 1. b) m ˚ n “ 2mn. c) m ˚ n “ mn . d) m ˚ n “ 4. 2. Cada una de las tablas siguientes describe una operación ˚ en el conjunto t1, 2, 3u, donde a ˚ b es el número que está en el renglón que tiene a la izquierda a a y la columna que tiene arriba a b. Determinar en cada caso si la operación ˚ es conmutativa, asociativa o tiene elemento identidad. En caso de que tenga elemento identidad, decir cual es. 56 3.6. Operaciones ˚ 1 2 3 1 1 2 3 2 2 1 3 3 3 3 3 ˚ 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 ˚ 1 2 3 1 3 3 1 2 2 1 2 3 1 1 3 3.7. Conjuntos finitos y conjuntos infinitos 3.7. 57 Conjuntos finitos y conjuntos infinitos La idea de que un conjunto A es finito es que podemos contar sus elementos y terminar de contarlos todos en algún momento, comenzando desde el 1 y terminando en algún número natural n, sin que ningún elemento de A sea contado varias veces y todos sean contados al menos una vez. Observemos que el proceso de contar los elementos del conjunto A (con n elementos) define una biyección ϕ de t1, 2, 3, . . . , nu en A, donde ϕp1q es el primer elemento que se cuenta, ϕp2q el segundo, . . . , ϕpkq el k-ésimo y ϕpnq el último elemento contado con el cual se termina el conteo. Tratemos el asunto de contar con más precisión. 3.7.1. Notación. Si n P N, denotemos por Jn :“ tk P N : k ĺ nu. Es decir Jn es el conjunto de los primeros n números naturales. Por razones técnicas denotemos J0 “ ∅. Cuando no se preste a confusión se denotará Jn como t1, 2, 3, . . . , nu. 3.7.2. Definición. Decimos que A es un conjunto con n elementos si existe una biyección de Jn en A. J6 1XX : e -d 2 XXXX XXX 3XX X XXXX 4 XX -c X XXX XXX XXX XXX 5 za XXX -f 6 XXX XXX zb A El conjunto A tiene 6 elementos 3.7.3. Definición. Un conjunto A es finito si existe un entero no negativo n, tal que A tiene n elementos. Si un conjunto no es finito diremos que es infinito. Si A es un conjunto finito, al número de elementos de A lo denotaremos como #A y a veces se le llama la cardinalidad de A. 3.7.4. Teorema. Sean A y B dos conjuntos con n elementos. Existe una biyección de A en B. Demostración. Por definición, existen biyecciones ϕ de Jn en A y ψ de Jn en B. Demostraremos que la función γ : A ÝÑ´1B aÞÑψ ˝ ϕ paq es una biyección de A en B. Veamos primero que γ es inyectiva. Sean a1 , a2 P A tales que a1 ‰ a2 . Como ϕ es inyectiva, entonces ϕ´1 es inyectiva, por lo cual ϕ´1 pa1 q ‰ ϕ´1 pa2 q. Ahora, como ψ es inyectiva, entonces ψ ˝ ϕ´1 pa1 q “ ψpϕ´1 pa1 qq ‰ ψpϕ´1 pa2 qq “ ψ ˝ ϕ´1 pa2 q, es decir γpa1 q ‰ γpa2 q, por lo que γ es inyectiva. Ahora ϕ´1 es una función de A sobre Jn y 58 3.7. Conjuntos finitos y conjuntos infinitos ψ de Jn sobre B, por lo que ψ ˝ ϕ´1 es una función de A sobre B (ver ejercicio 6 de la sección 3). De esta forma se ve que γ es una biyección de A en B. ‚ 3.7.5. Teorema. Si k P Jn`1 , entonces tm P Jn`1 : m ‰ ku tiene n elementos. Demostración. Tómese la función ϕ : Jn ÝÑ tm P Jn`1 : m ‰ ku de la siguiente forma, ϕplq “ l si l ă k y ϕplq “ l ` 1 si l ľ k la cual el lector podrá verificar que es una biyección de Jn en tm P Jn`1 : m ‰ ku. ‚ 3.7.6. Teorema. Sean m, n P N tales que m ą n. No existe ninguna biyección de Jn en Jm . Demostración. Procedamos por inducción sobre n. Si m ą 1, entonces, si ϕ fuera una función de t1u en Jm , tendríamos que ϕp1q ‰ 1 ó ϕp1q ‰ m, por lo que alguno de los elementos 1 ó m no serían elementos del recorrido de ϕ, de tal suerte que ϕ no sería sobre Jm , de donde no existe ninguna biyección de J1 en Jm . Supongamos ahora que n es un número natural tal que si m ą n, entonces no existe ninguna biyección de Jn en Jm . Sea l ą n ` 1 y t tal que t ` 1 “ l. En estas condiciones tenemos que t ą n. Si existiera una biyección ϕ de Jn`1 en Jl , entonces la función ψ :Jn ÝÑ ts P Jl : s ‰ ϕpn ` 1qu xÞÑϕpxq sería una biyección de Jn sobre Jl ztϕpn ` 1qu, pero por el teorema 3.7.5 el conjunto Jl ztϕpn ` 1qu tiene t elementos y existiría una biyección γ de Jl ztϕpn ` 1qu en Jt , por lo que γ ˝ ψ será una biyección de Jn en Jt , lo que debido a la hipótesis de inducción es imposible ya que t ą n. Por lo que si l ą n ` 1, entonces no existe ninguna biyección ϕ de Jn`1 en Jl , con lo cual el teorema queda demostrado ‚ La demostración del siguiente corolario se deja como ejercicio al lector. 3.7.7. Corolario. Si m y n son dos números naturales diferentes, entonces no existen conjuntos con n elementos y con m elementos a la vez. 3.7.8. Teorema. El conjunto N de los números naturales es infinito. Demostración. Suponiendo que N fuera finito. Sea n el número de elementos de N y ϕ : t1, 2, . . . , nu ÝÑ N una biyección de t1, 2, . . . , nu en N. Tomemos γ : t1, 2, . . . , n, n`1u ÝÑ N tal que # ϕpkq ` 1, si 1 ĺ k ĺ n γpkq “ 1, si k “ n ` 1. Afirmamos que γ es una biyección de t1, 2, . . . , n ` 1u en N. En efecto, si m “ 1, entonces γpn ` 1q “ m, además, por el tercer axioma de Peano, no existe ningún k ‰ n ` 1, en el dominio de γ, tal que γpkq “ m. Si m es un número natural diferente de 1, entonces sea k P t1, 2, . . . , nu el único número tal que ϕpkq “ m ´ 1. Así, por el axioma de Peano 3.7.1 d), tenemos que k es el único número tal que γpkq “ m, por lo que γ es una biyección de t1, 2, . . . , n ` 1u en N, contradiciendo el corolario 3.7.6 debido a que N tendría n elementos y n ` 1 elementos a la vez. Por lo tanto N es infinito. ‚ 3.7.9. Definición. Cualquier conjunto que se pueda poner en correspondencia biunívoca con 3.7. Conjuntos finitos y conjuntos infinitos 59 algún subconjunto de N se dice que es numerable o contable. 3.7.10. Observación. Claramente todos los conjuntos finitos son numerables. 3.7.11. Teorema. Si B es un conjunto finito y A Ă B, entonces el conjunto A también es finito. Demostración. Demostremos primero el resultado para el caso en que B “ Jn para algún entero no negativo n. Procederemos por inducción matemática. Si B “ J0 “ ∅, entonces el único subconjunto de B es B, el cual es finito. Si B “ J1 , entonces los únicos subconjuntos de B son B y ∅, los cuales son finitos. En efecto, si A Ă J1 , tenemos que 1 P A ó 1 R A. En cualquier caso se tiene que b P J1 ùñ b “ 1 (corolario 3.4.9 y propiedad de tricotomía). Si 1 P A, entonces J1 Ă A, y como A Ă J1 , entonces A “ J1 . Si 1 R A, entonces ningún b P J1 está en A, en cuyo caso A “ ∅. Sea n P N tal que cualquier subconjunto de Jn es finito. Veamos que si A Ă Jn`1 , entonces A es finito. Si A “ Jn`1 , entonces, por definición, A es finito. Si A es un subconjunto de Jn`1 diferente de Jn`1 , entonces existe un b P Jn`1 tal que b R A. Ahora, por el teorema 3.7.4, el conjunto Jn`1 ztbu tiene n elementos, por lo que existe una biyección ϕ : Jn ÝÑ Jn`1 ztbu de Jn en Jn`1 ztbu. Ahora la restricción ϕ|ϕ´1 rAs de ϕ al conjunto ϕ´1 rAs es una biyección de A1 en A, donde A1 es un subconjunto de Jn , por lo tanto A1 es finito. Como A1 es finito, existe una biyección ψ de Jk en A1 , para algún entero no negativo k. Vemos así que ϕ ˝ ψ es una biyección de Jk en A, es decir A es finito. Veamos ahora el caso general en que B es un conjunto finito con n elementos y A Ă B. Existe una biyección γ de Jn en B y γ ´1 rAs es un subconjunto de Jn , por lo que tiene k elementos, para algún entero no negativo k, por lo que existe una biyección η de Jk en γ ´1 rAs, y la composición γ ˝ η es una biyección de Jk en A. Por lo tanto, A es finito. ‚ 3.7.12. Teorema. Sea n P N. Si A y B dos conjuntos tales que existe una biyección de A en B y el conjunto A tiene n elementos, entonces el conjunto B tiene también n elementos. Demostración. Sea ϕ : Jn ÝÑ A una biyección de Jn en A y ψ : A ÝÑ B una biyección de A en B. El teorema se sigue del hecho de que la función ψ ˝ ϕ es una biyección de Jn en B. ‚ Ejercicios. 1. Demostrar que si A Ă N y A es infinito, entonces existe una biyección entre A y N. 2. Sea pL, ĺq un retículo y S “ ta1 , a2 , . . . , an u Ă L un conjunto con n elementos. Demostrar que existen en L el supremo y el ínfimo de S. 3. Hallar el error en el argumento que daremos de la afirmación «Todas las pelotas del mundo son del mismo color». Si tenemos un conjunto con una sola pelota, entonces todas las pelotas de ese conjunto tienen el mismo color, es decir tienen el color de la única pelota del conjunto. Supongamos que para todo conjunto con n pelotas, las pelotas de ese conjunto tienen el mismo color y sea A “ tP1 , P2 , . . . , Pn , Pn`1 u un conjunto con n ` 1 pelotas diferentes. Como el conjunto B “ AztPn`1 u tiene n elementos, entonces todas las pelotas de B son del mismo color, en particular tienen el color de la pelota Pn . Ahora, el conjunto C “ AztP1 u “ tP2 , P3 , . . . , Pn , Pn`1 u también tiene n elementos, 60 3.7. Conjuntos finitos y conjuntos infinitos por lo que todas las pelotas de C tienen el mismo color, es decir tienen el color de la pelota Pn , por lo tanto todas las pelotas del conjunto A tienen el color de la pelota Pn . Así hemos demostrado por inducción matemática que todas las pelotas pertenecientes a cualquier conjunto finito tienen el mismo color, pero como el conjunto de todas las pelotas del mundo es finito, entonces todas las pelotas del mundo son del mismo color. 3.8. Técnicas de conteo 3.8. 61 Técnicas de conteo En esta sección deduciremos métodos para determinar el número de elementos de algunos tipos de conjuntos finitos. Tales métodos tienen muchas aplicaciones en la teoría de probabilidades y en la combinatoria. Definamos para empezar el importante concepto de sucesión finita. 3.8.1. Definición. Sea n un número natural. Una sucesión finita (de n componentes) en un conjunto A es una función f : t1, . . . , nu ÝÑ A. Si denotamos por ak “ f pkq, entonces a la sucesión la podemos denotar como pak qnk“1 , ó como pa1 , a2 , . . . , an q cuando no se preste a confusión. A ak se le llama la k-ésima componente de la sucesión. Observemos que una sucesión de dos componentes es una pareja ordenada, una sucesión de tres componentes es una terna, etc. A las sucesiones de n componentes también se les llama n-adas ó n-uplas. 3.8.2. Ejemplo. Se lanza una moneda cinco veces y se observa después de cada lanzamiento si el resultado es a “ águila ó s “ sol, obteniéndose una sucesión finita pr1 , r2 , r3 , r4 , r5 q de águilas y soles, donde rk “ a si en el k-ésimo lanzamiento se obtuvo águila y rk “ s si se obtuvo sol. 3.8.3. Ejemplo. En la ciudad de Monterrey se quiere estudiar el comportamiento de la temperatura al amanecer durante el mes de enero. Así cada día del mes se toma la temperatura ambiental a las 7:00 a.m., obteniendo una sucesión de 31 componentes pT1 , T2 , T3 , . . . , T29 , T30 , T31 q, donde en general la k-ésima componente Tk es la temperatura del k-ésimo día del mes de enero a las 7:00 a.m. 3.8.4. Notación. Si para todo número natural k se tiene que ak es un número, entonces se denota ¸ ˜ 1 n`1 n ÿ ÿ ÿ ak :“ a1 y ak :“ ak ` an`1 ; k“1 1 ź k“1 ak :“ a1 y k“1 n`1 ź k“1 ˜ ak :“ k“1 n ź ¸ ak ¨ an`1 ; k“1 para todo número natural n. Si para todo número natural k se tiene que Ak es un conjunto, entonces se denota n n ď ď č č Ak :“ Ak y Ak :“ Ak k“1 kPJn k“1 kPJn para todo número natural n. El siguiente teorema tal vez resulte evidente pero lo demostraremos para seguir con el rigor matemático y adquirir más experiencia para hacer demostraciones. 3.8.5. Teorema. Si A y B son dos conjuntos disjuntos finitos, entonces #pA Y Bq “ p#Aq ` p#Bq. 62 3.8. Técnicas de conteo Demostración. Sean n “ #A y m “ #B. Existen dos biyecciones ϕ y ψ de t1, . . . , nu en A y de t1, . . . , mu en B respectivamente. Sea η : t1, 2, . . . , n ` mu ÝÑ A Y B definida de la siguiente manera: # ϕpkq, si k ĺ n ηpkq “ ψpk ´ nq, si n ă k ĺ n ` m. (Observemos que la función η lo que hace es contar primero los elementos de A y luego continúa contando los de B). Veamos que en efecto η es una biyección de t1, 2, . . . , n ` mu en A Y B demostrando primero que es sobre A Y B y luego que es inyectiva. Sea y P A Y B. Si y P A, entonces existe un k en t1, . . . , nu tal que ϕpkq “ y, pero ηpkq “ ϕpkq, por lo que y “ ηpkq. Ahora, si y P B, entonces existe un j en t1, . . . , mu tal que ψpjq “ y, por lo que si tomamos k “ n ` j obtenemos que ηpkq “ ψpk ´ nq “ ψpjq “ y. Por lo tanto η es una función de t1, 2, . . . , n ` mu sobre A Y B. Supongamos ahora que x y y son elementos diferentes de t1, 2, . . . , n`mu. Si ambos están en t1, 2, . . . , nu, entonces ηpxq “ ϕpxq ‰ ϕpyq “ ηpyq, es decir ηpxq ‰ ηpyq. Si ambos están en tn ` 1, n ` 2, . . . , n ` mu, entonces como x ´ n ‰ y ´ n tenemos que ηpxq “ ψpx ´ nq ‰ ψpy ´ nq “ ηpyq. Ahora si una de las variables x ó y está en t1, 2, . . . , nu y la otra en tn ` 1, n ` 2, . . . , n ` mu, entonces uno de los valores ηpxq ó ηpyq está en A y el otro en B, de modo que por ser A y B disjuntos, también se tiene que ηpxq ‰ ηpyq. De esta forma concluimos que η es inyectiva, por lo que es una biyección de t1, 2, . . . , n ` mu en A Y B, lo cual implica que A Y B tiene n ` m elementos. ‚ 3.8.6. Corolario. Si B es un conjunto finito y A Ă B, entonces #A ĺ #B. Demostración. Como los conjuntos A y BzA son disjuntos y B “ A Y pBzAq, entonces por el teorema 3.8.5 tenemos que #B “ #A ` #pBzAq. Así, si #pBzAq “ 0, se tiene que #A “ #B, y cuando #pBzAq ‰ 0, se tiene que #A ă #B. ‚ Una generalización del teorema 3.8.5 es el siguiente teorema. 3.8.7. Teorema. Si pA1 , A2 , . . . , An q es una sucesión finita de conjuntos finitos que son disjuntos entre sí, entonces n n ď ÿ # Ak “ #Ak . k“1 k“1 Demostración. Procedamos por inducción sobre n. Si n “ 1, entonces los lados izquierdo y derecho de la igualdad de arriba son ambos iguales a #Ak . Supongamos que la igualdad es válida para algún número natural n. ˜˜ ¸ ¸ ˜ ¸ n`1 n n ď ď ď # Ak “ # Ak Y An`1 “ # Ak ` #An`1 k“1 k“1 ˜ n ÿ “ k“1 k“1 ¸ #Ak ` #An`1 “ n`1 ÿ k“1 #Ak . 3.8. Técnicas de conteo 63 Por lo que la igualdad es válida para todo número natural n. ‚ 3.8.8. Corolario. Si ψ : B ÝÑ B es una función inyectiva y B es un conjunto finito, entonces ψ es una biyección de B en B. Demostración. Si Rpψq (el recorrido de ψ) no fuera B, entonces Bz Rpψq sería no vacío y por el teorema 3.7.11 también sería finito, por lo que #pBz Rpψqq ą 0 y además #B “ # Rpψq ` #pBz Rpψqq “ #B ` #pBz Rpψqq ą #B, lo cual es falso, por lo que la función ψ debe ser biyectiva. ‚ 3.8.9. Corolario. Si ψ : B ÝÑ B es una función sobre B y B es finito, entonces ψ es una biyección de B en B. Demostración. Si ψ no fuera una biyección de B en B, entonces sea A “ ta P B : existen b, c P B, b ‰ c y ψpbq “ ψpcq “ au. Sea n el número de elementos de A “ ta1 , a2 , . . . , an u. Para cada a P A sea Ba “ tb P B : ψpbq “ au. Sea a1 el primer elemento de Ba y A1 “ ta1 : a P Au. Como #B “ #A`#pBzAq “ n`#pBzAq ă #Ba1 `#Ba2 `¨ ¨ ¨`#Ban `#ψ ´1 rBzAs “ #B, lo cual es absurdo, concluyendo así el teorema. ‚ Dejamos al lector el demostrar detalladamente los siguientes dos corolarios. 3.8.10. Corolario. Si ψ : B ÝÑ A es una función sobre A, donde A y B son conjuntos finitos con la misma cardinalidad, entonces ψ es una biyección de B en A. 3.8.11. Corolario. Si ψ : B ÝÑ A es una función inyectiva, donde A y B son conjuntos finitos con la misma cardinalidad, entonces ψ es una biyección de B en A. 3.8.12. Definición. Si A es un conjunto, una biyección de A en A se llama permutación en A. El conjunto de permutaciones en Jn “ t1, . . . , nu lo denotaremos por Sn y a sus elementos los llamaremos permutaciones de orden n. 3.8.13. Ejemplo. Supongamos que tenemos 5 cajas diferentes numeradas del 1 al 5, tenemos además 5 bolas diferentes numeradas del 1 al 5 y colocamos una bola en cada caja. La forma como fueron colocadas las bolas en las cajas se 5 1 4 2 1 2 3 3 4 5 puede representar mediante una permutación. La permutación que corresponde al esquema de la figura sería la sucesión de 5 componentes p5, 1, 4, 2, 3q. Podríamos preguntarnos ¿de cuántas maneras diferentes podemos colocar las 5 bolas en las 5 cajas, una en cada caja? Una pregunta similar y con la misma respuesta es la siguiente ¿De cuántas formas diferentes 64 3.8. Técnicas de conteo se pueden formar palabras con 5 caracteres diferentes (sin repetir caracteres) si disponemos solamente de 5 caracteres? Ambas respuestas serán el número total de permutaciones de orden 5, es decir #S5 . Veremos un método no sólo para calcular #S5 sino en general para calcular #Sn , para cualquier número natural n. Definamos primero lo que es el factorial de un entero no negativo. 3.8.14. Definición. El factorial de un número natural n, denotado n!, es el producto de los primeros n números naturales. Es decir 1! “ 1; 2! “ 1 ¨ 2; 3! “ 1 ¨ 2 ¨ 3; · · · n! “ 1 ¨ 2 ¨ 3 ¨ ¨ ¨ ¨ ¨ n; pn ` 1q! “ 1 ¨ 2 ¨ 3 ¨ ¨ ¨ ¨ ¨ n ¨ pn ` 1q “ n! ¨ pn ` 1q. Observemos que aún no hemos definido 0! (el factorial de cero), pero para cualquier número natural n diferente de 1 se tiene que n! “ pn ´ 1q! ¨ n. Así para que la última igualdad se cumpla también para n “ 1 es necesario que 1 “ 1! “ p1 ´ 1q! ¨ 1 “ 0! ¨ 1 “ 0!. Ésta es una de las razones por las cuales es conveniente definir 0! :“ 1, lo cual siempre se toma y tomaremos como su definición. De esta forma queda definido el factorial de n (denotado n!) para cualquier entero no negativo n. Demostraremos ahora que #Sn (el número de permutaciones de orden n) es igual a n! pero antes veremos un lema técnico. 3.8.15. Lema. Sea n un número natural y A, B conjuntos con n elementos. El número de biyecciones de A en B es #Sn . Demostración. Sean f : t1, . . . , nu ÝÑ A y g : t1, . . . , nu ÝÑ B biyecciones de t1, . . . , nu en A y de t1, . . . , nu en B respectivamente, además sean ak “ f pkq y bk “ gpkq; es decir los elementos diferentes de A son a1 , a2 , . . . , an y los de B son b1 , b2 , . . . , bn . Demostremos que toda biyección ϕ de A en B es de la forma ϕ : ak ÞÑ bσpkq para algún σ P Sn . Sea ϕ una biyección de A en B y σ “ g ´1 ˝ ϕ ˝ f . Como f , ϕ y g ´1 son biyecciones, entonces σ P Sn . Pero ϕpak q “ g ˝ σ ˝ f ´1 pak q “ g ˝ σpkq “ gpσpkqq “ bσpkq . Ahora, si σ, σ ˚ P Sn son tales que bσpjq “ bσ˚ pjq para todo j P t1, . . . , nu, entonces (por definición de bk ) tenemos que σpjq “ σ ˚ pjq, por lo tanto, a cada biyección ϕ de A en B le corresponde una única permutación σ de orden n tal que ϕ : ak ÞÑ bσpkq . Recíprocamente, si σ P Sn , entonces ϕ “ g˝σ˝f ´1 es una biyección de A en B y ϕpak q “ g˝σ˝f ´1 pak q “ g˝σpkq “ gpσpkqq “ bσpk ). Así tenemos que Ψ : σ ÞÑ g ˝ σ ˝ f ´1 es una biyección de Sn al conjunto de biyecciones de A en B. ‚ 3.8.16. Teorema. El número de permutaciones en Jn es n!. Es decir #Sn “ n!. Demostración. Procedamos por inducción matemática. Si n “ 1, entonces hay una única permutación σ : t1u ÝÑ t1u. Supongamos que para algún n P N hay n! permuta- 3.8. Técnicas de conteo 65 ciones diferentes en Jn . Sea k P t1, 2, . . . , n, n ` 1u. Ahora, hay una correspondencia biunívoca entre el conjunto de permutaciones σ P Sn`1 con σp1q “ k y el de biyecciones σ 1 : t2, 3, . . . , n, n ` 1u ÝÑ t1, 2, . . . , n, n ` 1uztku por lo cual, debido al lema 3.8.15, hay n! diferentes permutaciones σ P Sn`1 tales que σp1q “ k. Para cada k P t1, 2, . . . , n, n ` 1u sea Vk “ tσ P Sn`1 : σp1q “ ku. Observemos que si i ‰ j, entonces Vi X Vj “ ∅ y que Sn`1 “ n`1 ď Vk , k“1 por lo que debido al teorema 3.8.7 tenemos que #Sn`1 “ n`1 ÿ k“1 #Vk “ n`1 ÿ n! “ pn ` 1q ¨ n! “ pn ` 1q!, k“1 con lo que el teorema queda demostrado. ‚ Una consecuencia inmediata del teorema 3.8.16 y del lema 3.8.15 es el corolario siguiente. 3.8.17. Corolario. Si A y B son conjuntos con n elementos, entonces el número de biyecciones de A en B es n!. Con este corolario podemos responder ya a la pregunta ¿de cuantas formas diferentes podemos colocar 5 bolas en 5 cajas, una bola en cada caja? La respuesta es de 5! “ 120 formas diferentes, donde cada forma diferente la identificamos con una biyección del conjunto de 5 bolas en el conjunto de 5 cajas. Planteemos ahora el siguiente problema: ¿Cuántos subconjuntos de 6 elementos tiene un conjunto de 8 elementos? Resolveremos el problema en forma más general, pero es conveniente dar antes algunas definiciones. 3.8.18. Definición. Sean m y n enteros tales que 0 ĺ n ĺ m. Definimos el número de combinaciones de n en m como ˆ ˙ m! m . :“ n! ¨ pm ´ nq! n ` ˘ Para el caso en que m y n son enteros, pero no se cumple que 0 ĺ n ĺ m, definimos m :“ 0. n Veamos algunos ejemplos: `5˘ 3 `6˘ 0 “ 5! 3!¨p5´3q! “ 5¨4¨3! 3!¨2! “ 6! 0!¨p6´0q! “ 6! 1¨6! “ 20 2 “ 10, “ 1. El teorema siguiente nos provee de algunas identidades importantes. 3.8.19. Teorema. Sean m y n enteros no negativos tales que n ĺ m. ˆ ˙ ˆ ˙ n n I) “ “ 1; 0 n 66 3.8. Técnicas de conteo ˆ ˙ n II) “ n; 1 ˆ ˙ ˆ ˙ m m III) “ ; n m´n ˆ IV) ˙ ˆ ˙ ˆ ˙ m`1 m m “ ` . n`1 n n`1 Se dejan al lector la demostración de las identidades I), II) y III). Demostraremos nosotros solamente la identidad IV). ` ˘ `m˘ ` ˘ Demostración de IV). Para el caso en que m “ n tenemos m ` n`1 “ 1`0 “ 1 “ m`1 . n n`1 Para el caso en que n ă m tenemos ˆ ˙ ˆ ˙ m! m m m! ` ` “ n! ¨ pm ´ nq! pn ` 1q! ¨ pm ´ pn ` 1qq! n n`1 “ m! ¨ pn ` 1q m! ¨ pm ´ nq ` pn ` 1q ¨ n! ¨ pm ´ nq! pn ` 1q! ¨ pm ´ nq ¨ pm ´ n ´ 1q! m! ¨ pm ´ nq m! ¨ pn ` 1q ` m! ¨ pm ´ nq m! ¨ pn ` 1q ` “ pn ` 1q! ¨ pm ´ nq! pn ` 1q! ¨ pm ´ nq! pn ` 1q! ¨ pm ´ nq! ˙ ˆ m! ¨ pm ` 1q pm ` 1q! m`1 . “ “ “ n`1 pn ` 1q! ¨ pm ´ nq! pn ` 1q! ¨ ppm ` 1q ´ pn ` 1qq! “ ‚ 3.8.20. Teorema. Sea A un conjunto finito `m˘con m elementos y n un entero no negativo menor o igual que m. El conjunto A tiene n subconjuntos diferentes con n elementos, es decir ˆ ˙ m #tB : B Ă A y #B “ nu “ . n Demostración. Veamos primero que el resultado es válido para algunos casos particulares. Si n “ 0, entonces el único subconjunto con cero de A es ∅, por lo que A tiene `m˘ elementos `m˘ solamente un subconjunto con cero elementos y n “ 0 “ 1. Si n “ m, entonces el único subconjunto de A con n elementos es el mismo A, por lo que solamente un subconjunto con m elementos y por el teorema 3.8.19 III) tenemos que `Amtiene ˘ `m ˘ “ m “ 1. n De lo anterior se concluye que el resultado es válido para m “ 0 y para m “ 1. Supongamos que el resultado es válido para m “ M , donde M P N, y demostremos en base a ello que también es válido para m “ M ` 1. Si n “ 0 ó n “ M ` 1, el resultado ya está demostrado. Tomemos pues n de tal manera que 0 ă n ă M ` 1. Sea A un conjunto con M ` 1 elementos y c un elemento de A. Los subconjuntos de A con n elementos los dividimos en dos tipos: a) los que pertenecen a F :“ tD : D Ă A, c R D y D tiene n elementos}; 3.8. Técnicas de conteo 67 b) los que pertenecen a F1 :“ tD : D Ă A, c P D y D tiene n elementos}. Los subconjuntos de A que pertenecen F son todos los subconjuntos ` ˘ de Aztcu con n elementos `M˘ y Aztcu tiene M elementos, por lo que la cardinalidad de F es M . Ahora, Aztcu tiene n´1 n subconjuntos con n ´ 1 elementos y existe una biyección del conjunto de subconjuntos de 1 Aztcu modo que F1 es un conjunto ` Mcon ˘ n ´ 1 elementos en F , a saber E ÞÑ E Y tcu, `de ˘ ` ˘ con n´1 elementos. Ahora, por el teorema 3.8.5, A tiene M ` M subconjuntos con n `M ˘ n ` M ˘n´1 `M `1˘ elementos, pero por el teorema 3.8.19 IV) tenemos que n ` n´1 “ n , con lo que el teorema queda demostrado. ‚ Respondamos ahora a la pregunta ¿cuántos subconjuntos con 6 elementos tiene un conjunto con 8 elementos? Según el teorema anterior la respuesta es ˆ ˙ 8 ¨ 7 ¨ 6! 56 8 8! “ “ “ 28. “ 6! ¨ p8 ´ 6q! 6! ¨ 2! 2 6 Veamos ahora otro tipo de problema. Tenemos 4 cajas numeradas y 7 bolas numeradas, de las 7 bolas queremos colocar una en cada caja (sobrarán 6 5 4 1 1 2 7 2 3 3 4 3 bolas). ¿De cuántas formas diferentes podemos hacer esto? Responder a esta pregunta equivale a responder ¿cuántas funciones inyectivas hay de t1, 2, 3, 4u en t1, 2, 3, 4, 5, 6, 7u? Responderemos como de costumbre a una pregunta más general, a saber ¿cuántas funciones inyectivas hay de Jn en Jm con n ĺ m? La respuesta la da el teorema siguiente. 3.8.21. Notación. Al conjunto de funciones de B en A se le denota como BA. 3.8.22. Teorema. Sean n y m enteros no negativos con n ĺ m. Hay funciones inyectivas de Jn en Jm . Es decir #tf P JnJm : f es inyectivau “ m! pm´nq! diferentes m! . pm ´ nq! Demostración. Observemos que si f es inyectiva, entonces Rpf q (el recorrido de f ) tiene n elementos, además cualquier subconjunto de Jm con n elementos `m˘es el recorrido de alguna función inyectiva de Jn en Jm . Por el teorema 3.8.20, Jm tiene n subconjuntos diferentes con n elementos, denotemos a tales subconjuntos por A1 , A2 , . . . , Apmq . Ahora, sea ∆k “ tf P n 68 3.8. Técnicas de conteo Jn Ak : f es inyectiva y Rpf q “ Ak u, por el corolario 3.8.17 tenemos que #∆k “ n!. Ahora, m m pŤ př nq nq Jn ∆k “ #∆k “ por el teorema 3.8.7, tenemos que #tf P Jm : f es inyectivau “ # k“1 k“1 `m ˘ m! m! ¨ n! “ n!¨pm´nq! ¨ n! “ pm´nq! . Con lo que terminamos la demostración. ‚ n La demostración del siguiente corolario se deja para el lector. 3.8.23. Corolario. Sea A un conjunto con n elementos y B un conjunto con m elementos, con n ĺ m. El número total de funciones inyectivas de A en B es m! . pm ´ nq! Respondiendo ahora a la pregunta ¿de cuántas formas diferentes podemos colocar una bola en cada una de las 4 cajas si tenemos 7 bolas diferentes (distinguibles)? Como una bola no puede estar en dos cajas diferentes, entonces a cada forma posible se le identifica con una función inyectiva del conjunto de las 4 cajas en el conjunto de las 7 bolas y el número total 7! “ 7¨6¨5¨4¨3! “ 7 ¨ 6 ¨ 5 ¨ 4 “ 840. de funciones inyectivas es p7´4q! 3! Supongamos ahora que tenemos una lista de 6 personas y a cada una se le pide que escoja un número entero secreto del 1 al 9. Para poder abrir una caja de seguridad cada una de las seis personas deberá teclear su número secreto, en el orden de aparición de la lista. ¿De cuántas formas diferentes se pudo formar la clave secreta? Responder a esta pregunta equivale a saber cuántas funciones hay de J6 en J9 . La respuesta la da el siguiente teorema. ˘ ` 3.8.24. Teorema. Si m y n son números naturales, entonces # JnJm “ mn . Demostración. Procedamos por inducción matemática (sobre n). Si n “ 1, hay una correspondencia biunívoca entre los elementos de Jm y las funciones f : t1u ÝÑ Jm , a saber la que hace corresponder a cada elemento k P Jm la función 1 ÞÑ k, de modo que hay m “ m1 “ mn funciones de t1u en Jm . Supongamos que para un entero positivo N se cumple `J diferentes ˘ N N que # Jm “ m . Para todo k P Jm sea ∆k “ tf P JN `1Jm : f pN ` 1q “ ku. Hay una correspondencia biunívoca entre ∆k y JNJm , a saber la que a cada f P ∆k le corresponde g : JN ÝÑ Jm , xÞÑf pxq por lo que #∆k “ # `J ∆1 , ∆2 , . . . , ∆k , . . . , ∆m m ř m ˘ Ť Jm “ mN , además tenemos que ∆k “ JN `1Jm y los conjuntos k“1 m m `J ˘ Ť ř N `1 son disjuntos, por lo cual # Jm “ # ∆k “ #∆k “ N k“1 N N m “m¨m “m N `1 , con lo que la demostración está completa. k“1 ‚ k“1 Volviendo al planteamiento del problema previo al teorema. El número de formas diferentes de formar la clave secreta es 96 “ 531441 formas diferentes, es decir más de medio millón de formas diferentes, por lo que sería muy difícil descifrar la clave secreta. El teorema 3.8.24 tiene el corolario siguiente. ` ˘ 3.8.25. Corolario. Si A es un conjunto con m elementos, entonces # JnA “ mn . En particular #pA ˆ Aq “ m2 . 3.8. Técnicas de conteo 69 Demostración. Sea ϕ una biyección de Jm en A. La demostración se sigue del hecho de que existe una correspondencia biunívoca entre JnA y JnJm , a saber g ÞÑ ϕ ˝ g, la cual el lector podrá verificar que es una biyección de JnJm en JnA. ‚ La demostración del siguiente corolario se deja como ejercicio al lector. 3.8.26. Corolario. Si A es un conjunto y B es un conjunto con n elementos, `B ˘ `B ˘con m elementos n #B entonces # A “ m . Es decir # A “ p#Aq . 3.8.27. Teorema (algoritmo multiplicativo). Si A y B son conjuntos con m y n elementos respectivamente, entonces #pA ˆ Bq “ m ¨ n. (Recordemos que A ˆ B “ tpa, bq : a P A y b P Bu). Demostración. Sea pb1 , b2 , . . . , bk , . . . , bn q una biyección de t1, 2, . . . , nu en B y Ak “ tpa, bk q : a P Au. Cada conjunto Ak tiene m elementos (verificarlo); A1 , A2 , . . . , An son disn n n n Ť Ť ř ř juntos, y A ˆ B “ Ak , por lo que #pA ˆ Bq “ # Ak “ #Ak “ m “ m ¨ n. k“1 k“1 k“1 k“1 ‚ Una generalización del algoritmo multiplicativo es el siguiente corolario. 3.8.28. Corolario. Si A1 , A2 , . . . , Am son conjuntos con n1 , n2 , . . . , nm elementos respectivamente, entonces #pA1 ˆ A2 ˆ ¨ ¨ ¨ ˆ Am q “ n1 ¨ n2 ¨ ¨ ¨ ¨ ¨ nm . La demostración del corolario anterior se puede hacer por inducción matemática y aplicando el teorema 3.8.7. Se dejan los detalles de la demostración al lector. 3.8.29. Teorema. Sea A un conjunto con N elementos, pn1 , n2 , . . . , nk q una sucesión con k componentes enteras no negativas tales que n1 ` n2 ` ¨ ¨ ¨ ` nk “ N . El conjunto de sucesiones de la forma pA1 , A2 , . . . , Ak q tales que tA1 , A2 , . . . , Ak u es una partición en clases de A y cada Aj tiene nj elementos, es un conjunto con N! n1 ! ¨ n2 ! ¨ ¨ ¨ ¨ ¨ nk ! elementos. Demostración. Demostraremos el teorema por inducción sobre k. Si k “ 1, entonces n1 “ N y A1 “ A, por lo que sólo hay una sucesión pA1 q “ pAq con una sola componente que satisfaga las hipótesis del teorema y además N !{n1 ! “ N !{N ! “ 1. Supongamos ahora que el resultado es válido para k “ m y sea pn1 , n2 , . . . , nm , nm`1 q una sucesión con m ` 1 componentes de enteros no negativos tales que n1 ` n2 ` ¨ ¨ ¨ ` nm ` nm`1 “ N . Ahora, utilizando la hipótesis de inducción, podemos observar que por cada forma diferente en que podamos es2 `¨¨¨`nm q! coger un subconjunto Am`1 de A con nm`1 elementos, hay exactamente pnn11`n formas !¨n2 !¨¨¨¨¨nm ! diferentes en que podemos escoger una sucesión de la forma pA1 , A2 , . . . , Am , Am`1 q tal que tA1 , A2 , . . . , Am , Am`1 u sea una partición en clases de A, donde cada Aj tiene nj elementos. Del teorema 3.8.20 vemos que el número de formas que podemos tomar un subconjunto Am`1 N! N! de A con nm`1 elementos es pN ´nm`1 “ pn1 `n2 `¨¨¨`n . Ahora, por el teorema 3.8.7, q!¨nm`1 ! m q!¨nm`1 ! el número de formas en que podemos tomar una sucesión de la forma pA1 , A2 , . . . , Am , Am`1 q, tal que tA1 , A2 , . . . , Am , Am`1 u sea una partición en clases de A y cada Aj tenga nj elementos, es pn1 ` n2 ` ¨ ¨ ¨ ` nm q! N! ¨ n1 ! ¨ n2 ! ¨ ¨ ¨ ¨ ¨ nm ! pn1 ` n2 ` ¨ ¨ ¨ ` nm q! ¨ nm`1 ! 70 3.8. Técnicas de conteo “ N! . n1 ! ¨ n2 ! ¨ ¨ ¨ ¨ ¨ nm ! ¨ nm`1 ! ‚ 3.8.30. Notación. Cuando N P N Y t0u y n1 , n2 , . . . , nk sean enteros no negativos tales que k ř nj “ N , entonces podremos usar la notación dada por j“1 ˆ Más aún, si k ř N n1 , n2 , . . . , nk ˙ :“ N! . n1 ! ¨ n2 ! ¨ ¨ ¨ ¨ ¨ nk ! nj ĺ N , tomaremos j“1 ˆ N n1 , n2 , . . . , nk ˙ :“ N! ˆ ˙. k ř n1 ! ¨ n2 ! ¨ ¨ ¨ ¨ ¨ nk ! N ´ nj ! j“1 3.8.31. Teorema. Sea A un conjunto. Existe una biyección entre el conjunto At0, 1u y el conjunto potencia de A. Demostración. Para cada B Ă A tomemos la función 1lB : A ÝÑ t0, 1u tal que # 1, si x P B, 1lB pxq :“ 0, si x R B. Dejamos como ejercicio para el lector el demostrar con detalle que la función F : ppAq ÝÑ BÞÑ1lB A A t0, 1u es una biyección de ppAq en t0, 1u. ‚ 3.8.32. Definición. A la función 1lB dada en la demostración del teorema 3.8.31 se le llama función indicadora del conjunto B. 3.8.33. Corolario. Si A es un conjunto finito, entonces #ppAq “ 2#A . Demostración. Por el corolario 3.8.26 tenemos que #pAt0, 1uq “ 2#A , y por el teorema 3.8.31 tenemos que At0, 1u y ppAq tienen la misma cardinalidad, por lo tanto #ppAq “ 2#A . ‚ Debido al corolario 3.8.33, al conjunto potencia de un conjunto A se le denota a veces por 2A . Ejercicios. 1. Una persona con $2 en el bolsillo apuesta de uno en uno contra lo mismo en un «volado» hasta que se termine el dinero o completar cuatro apuestas. ¿En cuántos de los casos posibles estará: a) a mano, b) exactamente $2 adelante? 3.8. Técnicas de conteo 71 2. Las cinco finalistas del concurso Señorita México son las representantes de Tlaxcala, Yucatán, Puebla, Jalisco y Veracruz. ¿En cuántas formas pueden elegir los jueces a la ganadora y a la primera suplente? 3. Hay 90 solicitantes de empleo para un departamento de noticias. Algunos de ellos son graduados universitarios y otros no; algunos de ellos tienen al menos 3 años de experiencia y otros no, donde la separación exacta está dada en la siguiente tabla: Graduados Al menos 3 años de experiencia 18 Menos de 3 años de experiencia 36 No graduados 9 27 Sea G el conjunto de los aspirantes graduados y T el conjunto de los aspirantes con más de 3 años de experiencia. a) ¿Cuántos aspirantes graduados hay? b) ¿Qué porcentaje de los que pertenecen a T no tienen experiencia de al menos 3 años? 4. En una ciudad los números telefónicos son de 8 cifras, pero las primeras dos cifras sólo pueden variar entre el 22 y el 83. ¿Para cuántos números telefónicos tiene capacidad la ciudad? 5. En un estado de la Federación las claves de las placas de los automóviles particulares tienen primero 3 letras de las 27 del alfabeto español, seguidas por 3 dígitos del 0 al 9. ¿Cuántas claves diferentes de placas puede haber? Si además se pone la restricción de que las letras no pueden estar repetidas en una misma placa ¿Cuántas claves diferentes de placas puede haber? 6. Demostrar con detalle que la función F dada en la demostración del teorema 3.8.31 es en efecto una biyección de ppAq en At0, 1u. 7. Tenemos un lote de 100 piezas de las cuales 20 son defectuosas. Se eligen 10 piezas al azar. a) ¿De cuántas maneras se pueden escoger las 10 piezas? b) ¿De cuántas maneras podemos escoger 2 piezas defectuosas y 8 buenas? 8. ¿De cuántas maneras se pueden formar 6 personas en una fila? 9. En un zoológico hay 5 tigres, 3 elefantes, 6 camellos, 4 leones, 10 cabras y 9 antílopes. ¿De cuántas maneras podemos tomar 2 animales de cada especie? 10. En una fiesta se tienen diez niños y ocho mazapanes. ¿De cuántas maneras se pueden escoger a ocho niños para darles un mazapán a cada uno de ellos? 11. En un estuche de instrumentos de óptica hay seis lentes cóncavos, cuatro convexos y tres prismas. ¿En cuántas maneras diferentes se pueden elegir uno de los lentes cóncavos, tres de los convexos y uno de los prismas? 72 3.8. Técnicas de conteo 12. ¿De cuántas maneras puede ocurrir que en un grupo de 21 personas: 5 tengan tipo de sangre A, 4 tipo de sangre B, 10 tipo de sangre O y 2 tipo de sangre AB? 13. ¿De cuántas formas puede escogerse un comité compuesto de 3 hombres y 2 mujeres, de un grupo de 7 hombres y 5 mujeres? 14. Una delegación de 4 estudiantes de una escuela se selecciona todos los años para asistir a la asamblea anual de la Asociación de Estudiantes. a) ¿De cuántas maneras puede elegirse la delegación si hay 12 estudiantes elegibles? b) ¿De cuantas maneras si dos de los estudiantes elegibles no asisten al mismo tiempo? c) ¿De cuántas maneras si dos de los estudiantes elegibles son casados y sólo asistirán si van ambos? 15. Un estudiante debe contestar 8 de 10 preguntas en un examen. a) ¿Cuántas maneras de escoger tiene? b) ¿Cuántas maneras si las primeras tres preguntas son obligatorias? c) ¿Cuántas, si tiene que contestar al menos 4 de las primeras 5 preguntas? 16. ¿De cuántas maneras puede un profesor escoger uno o más estudiantes de seis elegibles? 17. En una clase hay 12 estudiantes. ¿De cuántas maneras los 12 estudiantes pueden presentar 3 pruebas diferentes si a cada prueba le corresponden 4 estudiantes? 18. a) Hallar el número de formas en que cinco personas pueden sentarse en una fila. b) ¿Cuántas maneras hay si se sientan juntos una determinada pareja de novios? 19. Los candidatos para ocupar los puestos de presidente, secretario, tesorero, primer vocal, segundo vocal, primer suplente y segundo suplente son Antonio, Claudio, Pompeyo, Fabián, Octavio, Julio, Mario, Lépido, Tito, Constantino, Emilio, Británico, Tiberio y Germánico. ¿De cuántas maneras puede quedar la conformación de los puestos? 20. En un equipo de futbol que tiene 20 jugadores inscritos se deben escoger 11 jugadores. ¿De cuántas maneras se pueden escoger los jugadores? 21. Si un club tiene cuatro candidatos para presidente, tres para vicepresidente, dos para secretario y tres para tesorero, ¿de cuántas formas puede elegirse la mesa directiva? 22. De un comité de 11 personas se debe escoger un subcomité de cuatro, ¿de cuantas manera puede hacerse? 23. ¿Cuál es el número de formas de escoger tres cartas de la baraja? 24. ¿De cuántas maneras se puede seleccionar una mano (cinco cartas) de la baraja? 25. ¿Cuántos pókeres de ases hay? 26. 10 niños que le van a pegar a una piñata deben formarse en una fila. ¿De cuántas maneras pueden formarse? 27. El club de futbol Toluca tiene contratados 22 jugadores. En su próximo partido contra el Santos el director técnico deberá decidir sobre el cuadro titular y los suplentes. En tal partido se permite un máximo de 11 titulares y 6 suplentes. 3.8. Técnicas de conteo 73 a) Si el director técnico decide presentar el equipo que jugará con los 11 titulares, uno de los cuales deberá ser presentado como portero, y los 6 suplentes ¿de cuántas maneras puede hacer la presentación inicial del equipo? b) Si de los 22 jugadores del equipo hay sólo tres que están habilitados como porteros y el director técnico decide que uno de ellos deberá iniciar como titular en dicha posición y al menos uno de los otros dos deberá iniciar ya sea como suplente o como titular en el terreno de juego ¿de cuántas maneras puede hacer la presentación inicial del equipo? 28. Después de haber elegido a los nueve abridores del equipo de beisbol Sultanes de Monterrey en el juego contra los Saraperos de Saltillo, ¿cuántos órdenes al bate puede tener el director del equipo si el pícher batea siempre en cuarta posición? 29. Se tiene la pintura azul necesaria para pintar 3 casas, la roja para pintar 5 y la verde para pintar 6. En un barrio con 20 casas del mismo tamaño, ¿de cuántas maneras pueden ser pintadas las casas con a lo más un color de tal manera que se ocupe toda la pintura? 74 3.9. 3.9. Segundo método de inducción matemática Segundo método de inducción matemática En esta sección veremos una nueva técnica para hacer demostraciones. Tal técnica es otra versión del método de inducción matemática. El método consiste en lo siguiente: para demostrar que una proposición ppnq es verdadera para todo número natural n es suficiente demostrar que pp1q es verdadera y que si ppnq es verdadera para todo número natural n menor o igual que un número natural k, entonces la proposición ppk ` 1q es verdadera. Veamos primero algunos resultados y nociones preliminares. 3.9.1. Definición. Dado un conjunto A Ă N. Decimos que un número m P A es el primer elemento de A si para todo a P A se tiene que m ĺ a. 3.9.2. Lema. Sean k y a dos números naturales. Si k ă a, entonces k ` 1 ĺ a. Demostración. Si k ă a, entonces a “ k`t para algún t P N. Si t “ 1, se tiene que k`1 “ a. Si t ą 1, entonces existe un s P N tal que t “ s`1, por lo que a “ k`t “ k`ps`1q “ pk`1q`s, es decir a ą k ` 1, por lo tanto k ` 1 ĺ a. ‚ 3.9.3. Teorema. Sea A un subconjunto no vacío de números naturales. El conjunto A tiene un primer elemento. Demostración. Supongamos que no existe ningún m P A tal que para todo a P A se tenga que m ĺ a. Es decir supongamos que para todo m P A existe un a P A tal que a ă m. Sea B “ tn P N : n ă a para todo a P Au y demostremos bajo la suposición anterior que B “ N. El número 1 no puede pertenecer a A debido a que sería el primer elemento de A. Si n P B, entonces para todo a P A se tiene que n ă a, por lo que debido al lema anterior n ` 1 ĺ a, pero es imposible que n ` 1 P A puesto que contradice la suposición de que no existe ningún m P A tal que para todo a P A se tenga m ĺ a, por lo tanto n ` 1 R A y así concluimos que n ` 1 ă a para todo a P A, de modo que n ` 1 P B. Hemos demostrado por inducción matemática que B “ N. Ahora los conjuntos A y B son disjuntos, es decir A X B “ ∅, pero como B “ N, tenemos que A X N “ ∅, pero como A Ă N, entonces A “ A X N “ ∅, contradiciendo la hipótesis del teorema. ‚ 3.9.4. Teorema (segundo método de inducción matemática). Para cada número natural n sea ppnq una proposición. Si pp1q es verdadera y además @k P N, p@n ĺ k, ppnqq ùñ ppk ` 1q es verdadera; entonces el conjunto solución del predicado p es N, es decir ppnq es verdadera para todo número natural n. Demostración. Sea p un predicado cuyo dominio es N tal que pp1q y @k P N, p@n ĺ k, ppnqq ùñ ppk ` 1q. Tomemos A “ tn P N : ppnqu. Si A ‰ ∅, por el teorema 3.9.3, existe un m P A tal que para todo a P A se tiene que m ĺ a. Como pp1q es verdadera, entonces m es el sucesor de algún número natural s, es decir m “ s ` 1. Ahora si t ĺ s, entonces t ă m y se cumple pptq, por lo que se debe cumplir pps ` 1q, es decir se debe cumplir ppmq, contradiciendo el hecho de que m P A, por lo tanto A “ ∅. Es decir ppnq es verdadera, para todo n P N. ‚ El segundo método de inducción matemática se utilizará más adelante cuando se vean algunas propiedades de los números enteros. 3.10. Conjuntos infinito numerables 3.10. 75 Conjuntos infinito numerables En esta sección estableceremos algunas propiedades útiles de los conjuntos que son infinitos y además numerables. 3.10.1. Definición. Decimos que un conjunto es infinito numerable si es infinito y además es numerable. 3.10.2. Teorema. Si A es un conjunto infinito numerabe entonces existe una correspondencia biunívoca entre N y A. Demostración. Sea N Ă N un conjunto infinito tal que existe una correspondencia biunívoca ψ : N ÝÑ A entre N y A. Definamos recursivamente una biyección ϕ : N ÝÑ N entre N y N de la manera siguiente: ϕp1q es el primer elemento de N ; ϕpk ` 1q es el primer elemento de N ztϕprq : r P Jk u. Tenemos así que ϕ ˝ ψ es una correspondencia biunívoca entre N y A. ‚ 3.10.3. Teorema. Sea A un conjunto infinito numerable y B un conjuinto finito. El conjunto A Y B es infinito numerable. Demostración. El teorema se sigue al tomar una biyección ψ de N sobre A, una biyección γ de J#B sobre B y observar que si ζ : N ÝÑ A Y B es la función tal que ζpnq “ γpnq cuando n ĺ #B, pero ζpnq “ ψpn ´ #Bq cuando n ą #B, entonces ζ es una biyección de N sobre A Y B. ‚ 3.10.4. Teorema. Sea A un conjunto tal que existe una función ψ : N ÝÑ A sobre A. El conjunto A es numerable. Demostración. Para cada a P A sea na el primer número natural n tal que ψpnq “ a y observemos que la función ζ : A aÞÝÑ N es inyectiva, de manera que al tomar B Ă N como el Ñn a recorrido de ζ tenemos que ζ ´1 : B ÝÑ A es una biyección entre un subconjunto de N y el conjunto A, es decir A es numerable. ‚ 3.10.5. Teorema. Si A y B son conjuntos infinito numerables, entonces AYB es un conjunto infinito numerable. Demostración. Sean ϕ y ψ biyecciones de N en A y en B respectivamente. Observemos que la función χ : N ÝÑ A Y B dada por # q si n es impar ϕp n`1 2 χpnq “ ψp n2 q si n es par es una función sobre A Y B, de manera que por el teorema 3.10.4 tenemos que A Y B es numerable. Ahora, como un conjunto infinito está incluido en A Y B, entonces A Y B no puede ser finito debido al teorema 3.7.11. ‚ Usando inducción matemática se puede demostrar fácilmente el corolario siguiente. 3.10.6. Corolario. Si pAk qN k“1 es una sucesión finita de N conjuntos numerables, entonces N Ť Ak es un conjunto numerable. k“1 76 3.10. Conjuntos infinito numerables Tenemos un tipo de generalización del corolario anterior. 3.10.7. Teorema. Si para cada k P N tenemos que Ak es un conjunto infinito numerable, Ť entonces Ak es un conjunto infinito numerable. kPN Demostración. Para cada k P N sea ψk : N ÝÑ Ak una biyección de N sobre Ak . Sea Ť A “ Ak . Construiremos una función ψ : N ÝÑ A y dejaremos al lector los detalles de kPN demostrar que ψ es una función de N sobre A, y luego demostrar que A es un conjunto infinito numerable. Para cada j P N y cada i P Jj sea ai,j “ ψj piq Sea ψp1q “ ψ1 p1q; sea r ř s0 “ 0 y para cada r P N sea sr “ k y si n P N es tal que sr ă n ĺ sr`1 tomemos k“1 ψpnq “ ψn´sr p1 ` sr`1 ´ nq. ‚ 3.10.8. Corolario. Si A y B son conjunto infinito numerables, entonces AˆB es un conjunto infinito numerable. Demostración. Sean ψ y ζ biyecciones de N sobre A y de N sobre B respectivamente. observemos que cada elemento de A ˆ B es de la forma pψpmq, ζpnqq, donde m, n P N. Observemos además que para cada n P N el conjunto An :“ tpa, ζpnqq : a P Au es infinito numerable debido a que existe una biyección entre A y An , de manera que por el teorema Ť 3.10.7 y por el hecho de que A ˆ B “ An , tenemos que A ˆ B es infinito numerable. ‚ nPN 3.10.9. Teorema. Cualquier subconjunto infinito de un conjunto numerable es un conjunto numerable. Demostración. Sea A un conjunto infinito numerable y B Ă A un conjunto infinito. Tomemos una biyrcción ψ de N sobre A. La función ψ ´1 |B que es la restricción de ψ ´1 al conjunto B es una función inyectiva, de manera que pψ ´1 |Bq´1 es una biyección entre ψ ´1 rBs, el cual es un subconjunto de N, y el conjunto B, por lo que B es numerable. ‚ 3.11. Diagramas 3.11. 77 Diagramas 3.11.1. Definición. En las matemática es muy común usar diagramas, de hecho en este texto ya los hemos usado. Si bien el uso de diagramas o dibujos no se considera válido como argumento formal en las demostraciones matemáticas, esto sirve para ilustrar, hacer más comprensible o amena la explicación de algún concepto. Sin que la siguiente sea una definición rigurosa, entenderemos que un diagrama es un dibujo o figura que sirve para ilustrar o ejemplificar un concepto. Unos de los diagramas más usados en las matemáticas son los diagramas de Venn o diagramas de Euler. Los diagramas de Venn se emplean para representar conjuntos de las siguientes formas: I) Se dibuja un rectángulo que representa el conjunto universo y dentro de el se dibujan círculos u óvalos que representan conjuntos incluidos en el conjunto universo. Por ejemplo, el siguiente diagrama de Venn representa a un conjunto A que está incluido en un conjunto universo U . U A II) Al hecho de que un conjunto A sea subconjunto de un conjunto B, se le representa así. B A III) Al hecho de que dos conjuntos A y B tengan intersección no vacía se le representa así. 78 3.11. Diagramas A B IV) Al hecho de que dos conjuntos A y B tengan intersección vacía se le representa así. A B Representaciones similares se pueden hacer para el caso de 3 o más conjuntos, donde en algunos casos se usan colores para hacer más agradable la presentación. 3.11.2. Definición. Otro tipo de diagramas que se usan en matemáticas para representar relaciones definidas en algún conjunto finito son las llamadas grafos dirigidos. Un grafo dirigido o digrafo es un diagrama que representa una relación R definida en un conjunto A de la siguiente manera: I) Se determina la gráfica GrpRq “ tpx1 , y1 q, px2 , y2 q, . . . , pxn , yn qu Ă A ˆ A de la relación R. II) Los elementos de A se representan en el diagrama como pequeños círculos a los cuales les llamamos nodos. III) Si se tiene que xRy, es decir si px, yq P GrpRq, entonces esto se representa en el grafo uniendo el nodo correspondiente a x con el nodo correspondiente a y con una flecha, es decir con una línea que comienza en el nodo que representa a x y termina en el nodo que representa a y y apunta hacia el nodo que representa a y. A la flecha que comienza en el nodo correspondiente a x y termina en el correspondiente a y, y que representa el hecho de que x está relacionada con y se le llama arco dirigido. Al arco dirigido que va del nodo correspondiente a x al nodo correspondiente a y generalmente se le representa con la pareja ordenada px, yq. 3.11. Diagramas 79 Por ejemplo, el siguiente grafo representa la relación cuya gráfica es tp1, aq, p2, bq, p3, aq, p3, cq, pc, cqu. 1 e 2 3 HH H HH j ea H e HH * H HH j eb H e H HH H H j ec H Al representar una relación de orden parcial mediante su grafo suele suceder que haya muchas flechas y que éstas estén muy amontonadas, esto debido a que las relaciones de orden parcial son reflexivas y transitivas, lo que lleva a que la representación se convierta en una maraña y no sea agradable a la vista. Por ejemplo, si tenemos el conjunto A “ ttau, tbu, tcu, ta, du, tb, cu, ta, d, eu, ta, b, c, du, ta, b, c, d, f u, ta, b, c, d, f, guu y lo ordenamos mediante la relación de inclusión Ă, entonces el grafo que representa dicho orden sería de la siguiente forma. -e -e -e @ @ @ @ R @ R @ -e - e ) PP H Q PP H A Q H PP Q HH PP A Q H P A Q H R PP q j AU ? e PPP e Q H q Q Q Q Q Q Q Q Q sN ? R e - e * 6 Además, como podemos ver, casi no queda espacio para etiquetar los nodos. 3.11.3. Definición. Los diagramas de Hasse o diagramas de árbol son diagramas que sirven para representar conjuntos finitos parcialmente ordenados. La representación de un conjunto parcialmente ordenado por la relación ĺ mediante diagramas de Hasse sigue las reglas que a continuación se enlistan: I) Los elementos del conjunto se representan generalmente por puntos, aunque a veces también se representan con círculos, cuadros, rectángulos, etcétera. 80 3.11. Diagramas II) Si a ĺ b y a ‰ b, el punto que representa a a se pone en una posición más alta que el punto que representa a b. III) Si a ĺ b, a ‰ b y además no existe ningún c entre a y b, es decir no existe ningún c diferente de a y de b tal que a ĺ c y c ĺ b; entonces los puntos que representan a a y a b se unen mediante un segmento de línea (generalmente recta y sin necesidad de usar flecha) que comienza en el punto que representa a a y termina en el punto que representa a b. Pongamos nuevamente como ejemplo al conjunto A “ ttau, tbu, tcu, ta, du, tb, cu, ta, d, eu, ta, b, c, du, ta, b, c, d, f u, ta, b, c, d, f, guu con el orden parcial Ă, pero ahora representémoslo con un diagrama de Hasse. tau u @ tbu u tcu u @ @ @ @uta, du @u tb, cu @ @ @u u ta, d, eu ta, b, c, du uta, b, c, d, f u u ta, du El representar una relación de equivalencia mediante un digrafo lleva al mismo tipo de problemas que la relación de un orden parcial. Una alternativa para representar mediante diagramas una relación de equivalencia es representar por puntos a los elementos del conjunto en el cual está definida la relación de equivalencia y mediante diagramas de Venn encerrar en un mismo círculo u óvalo a los elementos que estén en la misma clase, de tal manera que los círculos u óvalos que encierran a clases distintas no se corten. 3.11.4. Definición. Cuando sabemos que una relación R es simétrica, generalmente se representa por un tipo de diagrama llamado grafo no dirigido o red no dirigida, la cual se construye del siguiente modo: I) Se determina la gráfica GrpRq “ tpx1 , y1 q, px2 , y2 q, . . . , pxn , yn qu Ă A ˆ A de la relación R. II) Los elementos de A se representan en el diagrama como pequeños círculos a los cuales les llamamos vértices. III) Si se tiene que xRy, es decir si px, yq P GrpRq, entonces esto se representa en el grafo no dirigido uniendo el vértice correspondiente a x con el vértice correspondiente a y con una sola línea. A la línea que une el punto que representa x con el que representa y, y que representa el hecho de que x está relacionada con y (y también que y está 3.11. Diagramas 81 relacionada con x, ya que la relación R es simétrica) se le llama arista o arco no dirigido. Al la arista que une x con y generalmente se le representa con el conjunto tx, yu. Por ejemplo, si R es una relación simétrica cuya gráfica es GrpRq “ tpa, aq, pa, bq, pb, aq, pc, dq, pd, cq, pc, eq, pe, cq, pe, f q, pf, equ, esta relación se puede representar por medio del siguiente grafo no dirigido. a e be d e ee e f ce 82 3.11. Diagramas Capítulo 4 EL CONJUNTO DE LOS NÚMEROS REALES 4.1. Introducción En el conjunto N de los números naturales están definidas las operaciones de suma (`), multiplicación (¨) y potencia. Es decir la suma de dos números naturales es un número natural, la multiplicación de dos números naturales es un número natural, y un número natural elevado a un número natural es un número natural. Para dos números naturales m, n no siempre está definida la resta m ´ n como un número natural, m ´ n es un número natural solamente cuando m ą n. Para lograr que la resta de dos números esté siempre definida hay que ampliar apropiadamente el conjunto N de tal manera que la resta de dos números de esté nuevo conjunto sea un número del conjunto. Primero que nada (como se hizo anteriormente en la definición 3.5.3) al conjunto N se le agrega el número cero, denotado 0. El número cero es tal que para m, n P N se define n ´ n “ 0, n ` 0 “ 0 ` n “ n, n0 “ 1, 0n “ 0, n ¨ 0 “ 0 ¨ n “ 0, n ą 0, 0 ` 0 “ 0. En el conjunto N Y t0u de los enteros no negativos no se ha logrado mucho. El logro principal es el de poder restar dos cantidades iguales «si a x le quito x no queda nada». Históricamente el cero se introdujo con la necesidad de representar «la nada». Pero en el conjunto N Y t0u no se puede restar a x un número y si y ą x. En el razonamiento humano primitivo esto puede tener sentido puesto que no se concibe la idea de quitarle a alguien o a algo lo que no tiene. Pero después, por ejemplo, cuando una persona tenía el dinero suficiente para pagar un producto, al comprarlo quedaba con la cantidad de dinero que tenía 83 84 4.1. Introducción menos el costo del producto. De no tener el dinero suficiente para pagar el producto, la persona quedaba con una deuda que consistía en el valor del producto menos la cantidad de dinero pagado o abonado. De esta forma, el hecho de restar a una cantidad x una cantidad y con y ą x adquiere sentido si a tal resta la identificamos con deudas. En la actualidad esta práctica es muy común, por ejemplo, con las tarjetas de crédito. De esta forma nace la necesidad de agregarle al conjunto N Y t0u otros elementos de tal forma que la resta de dos números x e y esté definida sin importar cual de los dos sea mayor. Para ampliar el conjunto N Y t0u, a cada número natural n le hacemos corresponder un objeto ´n que no esté en N Y t0u de tal manera que si m y n son dos números naturales diferentes, entonces ´m y ´n son diferentes. Además si m ą n, definimos n ´ m como ´pm ´ nq. Al conjunto expandido de esta forma lo denotamos por Z y lo llamamos conjunto de números enteros. Se puede definir en Z apropiadamente la suma, la resta y la multiplicación de manera tal que satisfaga las propiedades asociativa, conmutativa, distributiva, etc. Así tenemos N Ă N Y t0u Ă Z. El conjunto Z tiene la desventaja de que no siempre es posible dividir dos números enteros, es decir la división de dos números enteros no siempre es un número entero. Si m ¨ n “ k, decimos que m “ k{n. Por ejemplo 8 ¨ 5 “ 40 por lo que 5 “ 40{8. Pero no existe ningún entero tal que sea igual a 10{7. Se ve la necesidad de expandir aún más el conjunto Z a un conjunto más amplio, el llamado conjunto de los números racionales. Tal conjunto es necesario en la práctica. Por ejemplo, si tenemos 10 litros de agua y los queremos repartir entre 7 personas de tal forma que cada uno obtenga la misma cantidad de agua, entonces cada persona obtendrá 10/7 de litro. Un número será racional si es de la forma m{n, donde m y n son enteros y n ‰ 0. Observemos que m “ m{1. Dos números racionales m{n y k{l son iguales si y sólo si m ¨ l “ k ¨ n. Definiremos las operaciones de dos números racionales de la siguiente manera: ‚ pm{nq ¨ pk{lq “ pm ¨ kq{pn ¨ lq, n, l ‰ 0; ‚ pm{nq{pk{lq “ pm ¨ lq{pk ¨ nq, n, k, l ‰ 0; ‚ m{n ` k{l “ pm ¨ l ` k ¨ nq{pn ¨ lq, n, l ‰ 0; ‚ m{n ´ k{l “ m{n ` p´k{lq, n, l ‰ 0; ‚ ´ pm{nq “ p´mq{n, n ‰ 0; ‚ pm{nq1 “ m{n, pm{nqk`1 “ pm{nqk pm{nq, n ‰ 0, k P N; ‚ pm{nq´k “ 1{pm{nqk , n ‰ 0, k P N; ‚ pm{nq0 “ 1, m, n ‰ 0. Al conjunto de los números racionales se le denota por Q. La suma, resta y multiplicación de dos números racionales es un número racional. La división p{q de dos números racionales p y q está definida siempre que q ‰ 0. ¿Por qué no definir p{0? Si p ‰ 0, entonces no existe ningún número racional c tal que c ¨ 0 “ p. Si p “ 0, entonces cualquier número racional c satisface c ¨ 0 “ 0 “ p. ¿Cuál de los valores de c debemos tomar para definir 0{0? Se opta por no definir 0{0 y se ve que si p ‰ 0 es imposible definir p{0 de tal manera que pp{0q ¨ 0 “ p. 4.1. Introducción 85 Observemos que hasta ahora tenemos la siguiente serie de inclusiones t1, 2u Ă N Ă N Y t0u Ă Z Ă Q. ¿Es necesario expandir aún más el conjunto Q de números racionales? Veamos algunas razones geométricas que dan una respuesta afirmativa. Supongamos que tenemos un triángulo ? 2 1 1 ? 2, donde rectángulo cuya longitud de cada cateto es 1. La longitud de la hipotenusa es ? ? ? 2 es un número positivo tal que 2 ¨ 2 “ 2. Más adelante se demostrará que no existe ningún número racional q tal que q 2 “ 2. Se tiene entonces que los números racionales no son suficientes para medir longitudes. Otro ejemplo de un número que no es racional es π. El número π representa el área de un círculo de radio 1 ó la mitad de la longitud de una circunferencia de radio 1. Así pues, se tomará un conjunto de números más grande al que llamaremos conjunto de números reales, el cual denotaremos por R, de tal forma que Q Ă R. En R estarán definidas apropiadamente las operaciones de suma, resta, multiplicación y división (con la única excepción de que la división entre cero no está definida). Se tendrá pues que t1, 2u Ă N Ă N Y t0u Ă Z Ă Q Ă R. Existe una forma de extender el conjunto R de los números reales a un conjunto C llamado conjunto de números complejos, tal conjunto se estudiará posteriormente, por el momento cuando hablemos de números nos estaremos refiriendo a los números reales. 86 4.2. Operaciones en el conjunto de números reales 4.2. Operaciones en el conjunto de números reales Comencemos esta sección aceptando el siguiente axioma. 4.2.1. Axioma. Existe un conjunto R en el cual están definidas las operaciones ` y ¨ que son cerradas en R. Además son verdaderas las propiedades que enunciaremos a continuación: 4.2.2. Propiedad asociativa para la suma. Si a, b, c P R, entonces a ` pb ` cq “ pa ` bq ` c. En el caso de la suma de tres números a ` b ` c se entenderá que representa el valor común a ` pb ` cq y pa ` bq ` c. La propiedad anterior indica que el resultado de sumarle a a el número b ` c será el mismo que el de sumarle a a ` b el número c. Por ejemplo (5 + 8) + 3 = 13 + 3 = 16 y 5 + (8 + 3) = 5 + 11 = 16. 4.2.3. Definición. Al conjunto R se le llama conjunto de números reales. 4.2.4. Propiedad del elemento neutro para la suma. Existe un número 0, tal que para todo a P R tenemos que a ` 0 “ 0 ` a “ a. 4.2.5. Propiedad del inverso aditivo. Para todo a P R existe un único número real (denotado por) ´a tal que a ` p´aq “ p´aq ` a “ 0. 4.2.6. Definición. Al número ´a se le llama el inverso aditivo de a. Observemos que el número 0 es el único número tal que a ` 0 “ a, pues si x fuera un número tal que a ` x “ a, entonces x “ 0 ` x “ p´a ` aq ` x “ ´a ` pa ` xq “ ´a ` a “ 0. Lo que acabamos de ver es que 0 (el número cero) es el único número que cumple con la propiedad del elemento neutro para la suma. 4.2.7. Propiedad conmutativa para la suma. Si a, b P R, entonces a ` b “ b ` a. La propiedad anterior indica que no importa el orden en que se realice la suma. Veremos ahora algunas propiedades para la multiplicación. 4.2.8. Propiedad asociativa para la multiplicación. Si a, b, c P R, entonces a ¨ pb ¨ cq “ pa ¨ bq ¨ c. 4.2.9. Propiedad del elemento unitario. Existe un único número real 1, tal que 1 ‰ 0 y si a P R, entonces a ¨ 1 “ 1 ¨ a “ a. 4.2. Operaciones en el conjunto de números reales 87 4.2.10. Propiedad del inverso multiplicativo. Para todo número real a ‰ 0 existe un único número real, denotado por a1 , o por 1{a, tal que a¨ 1 1 “ ¨ a “ 1. a a 4.2.11. Definición. Si a es un número real diferente de cero, al número inverso multiplicativo de a. 1 a se le llama el 4.2.12. Propiedad conmutativa para la multiplicación. Si a, b P R, entonces a ¨ b “ b ¨ a. Debemos enfatizar en el hecho de que para que un número tenga inverso multiplicativo, tal número debe ser diferente de cero, pues como veremos más adelante 0 ¨ x “ 0 y 0 ‰ 1 como se estableció en la propiedad del elemento unitario. 4.2.13. Propiedad distributiva. Si a, b, c P R, entonces a ¨ pb ` cq “ a ¨ b ` a ¨ c. Es importante aclarar que bajo ausencia de paréntesis se efectúan primero las operaciones de multiplicación y después las de suma. Resumamos todas las propiedades anteriores en forma conjunta: a ` pb ` cq “ pa ` bq ` c. a ` 0 “ 0 ` a “ a. a ` p´aq “ p´aq ` a “ 0. a ` b “ b ` a. a ¨ pb ¨ cq “ pa ¨ bq ¨ c. a ¨ 1 “ 1 ¨ a “ a; a¨ `1˘ a “ `1˘ a ¨ a “ 1; a ¨ b “ b ¨ a. a ¨ pb ` cq “ a ¨ b ` a ¨ c. 1 ‰ 0. para a ‰ 0. 88 4.2. Operaciones en el conjunto de números reales Establezcamos algunos teoremas derivados de las propiedades anteriores. 4.2.14. Ley de la cancelación para la suma. Si a ` x “ b ` x, entonces a “ b. Demostración. a ` x “ b ` x ùñ pa ` xq ` p´xq “ pb ` xq ` p´xq ùñ a ` px ` p´xqq “ b ` px ` p´xqq ùñ a ` 0 “ b ` 0 ùñ a “ b. ‚ 4.2.15. Ley de la cancelación para la multiplicación. Si a ¨ x “ b ¨ x y x ‰ 0, entonces a “ b. La demostración de la ley 4.2.15 se puede hacer con un método similar a la de la ley 4.2.14 y se deja como ejercicio para el lector. 4.2.16. Teorema. ´0 “ 0. Demostración. Como 0 ` 0 “ 0, entonces 0 es el inverso aditivo de 0, es decir ´0 “ 0. ‚ 4.2.17. Teorema. Si a P R, entonces a ¨ 0 “ 0. Demostración. 0 ` a ¨ 0 “ a ¨ 0 “ a ¨ p0 ` 0q “ a ¨ 0 ` a ¨ 0, es decir 0 ` a ¨ 0 “ a ¨ 0 ` a ¨ 0. Cancelando a ¨ 0 en ambos lados de la igualdad anterior obtenemos que 0 “ a ¨ 0. ‚ Como 1 ‰ 0, con el teorema 4.2.17 vemos que el cero no tiene inverso multiplicativo. Definamos ahora la operación de resta. 4.2.18. Definición. A la resta de a y b se le definirá como a ` p´bq y se le denotará por a ´ b. Esta última expresión se lee «a menos b». Obsérvese que el símbolo ´ juega dos papeles. Por una parte indica la operación de resta o sustracción y por otra ´a denota el inverso aditivo de a. Definamos ahora la operación de división. 4.2.19. Definición. Sean a, b P R con b ‰ 0. Definimos la división de a y b como a ¨ la división de a y b se le denotará por a b y se lee «a entre b» ó «a partido en b». `1˘ b .A Debido a que 1{0 no está definido, tampoco está definido a{0. Observemos que 1{b denota por una parte al inverso multiplicativo de b y por otra a la división de 1 y b. Esto no constituye ningún problema debido a que 1 entre b es el inverso multiplicativo de b (si b ‰ 0). 4.2.20. Teorema. Para todo a P R, ´a “ p´1q ¨ a. Demostración. Tenemos que a ` p´1q ¨ a “ 1 ¨ a ` p´1q ¨ a “ p1 ` p´1qq ¨ a “ 0 ¨ a “ 0. Ahora, por la unicidad del inverso aditivo, tenemos que p´1q ¨ a “ ´a. ‚ 4.2.21. Corolario. Si a, b P R, entonces a ¨ p´bq “ ´pa ¨ bq “ p´aq ¨ b. 4.2. Operaciones en el conjunto de números reales 89 Demostración. Demostraremos solamente que a ¨ p´bq “ ´pa ¨ bq, la otra igualdad se puede demostrar con la misma idea y usando la propiedad conmutativa para la multiplicación. Tenemos las siguientes igualdades a ¨ p´bq “ a ¨ pp´1q ¨ bq “ pa ¨ p´1qq ¨ b “ pp´1q ¨ aq ¨ b “ p´1q ¨ pa ¨ bq “ ´pa ¨ bq, donde se usó el teorema 4.2.20 dos veces, la propiedad asociativa dos veces y la conmutativa una vez. ‚ 4.2.22. Teorema. Para todo a P R, ´p´aq “ a. Demostración. Tenemos primero que por definición de inverso aditivo p´aq ` p´p´aqq “ 0 “ p´aq ` a, de donde obtenemos por la ley de la cancelación que ´p´aq “ a. ‚ 4.2.23. Teorema. Si a, b P R, entonces p´aq ¨ p´bq “ a ¨ b. Demostración. Usando el teorema 4.2.22 y el corolario 4.2.21 obtenemos p´aq ¨ p´bq “ ´pa ¨ p´bqq “ ´p´pa ¨ bqq “ a ¨ b. ‚ 4.2.24. Teorema. Si a y b son números reales diferentes de cero, entonces 1 1 1 ¨ “ . a b a¨b ` ˘ Demostración. Tenemos que pa ¨ bq ¨ a1 ¨ 1b “ a ¨ 1 . inverso multiplicativo de a ¨ b, es decir a1 ¨ 1b “ a¨b 1 a ¨b¨ 1 b “ 1 ¨ 1 “ 1, por lo que 1 a ¨ 1 b es el ‚ 4.2.25. Teorema. Si a, b, c, d son números reales tales que c, d ‰ 0, entonces a b a¨b ¨ “ . c d c¨d Demostración. a c ¨ b d “ a ¨ 1c ¨ b ¨ 1 d “ pa ¨ bq ¨ `1 c ¨ 1 d ˘ “ pa ¨ bq ¨ ` 1 c¨b ˘ “ a¨b . c¨d ‚ 4.2.26. Teorema. Si a, b, c, d son números reales tales que c, d ‰ 0, entonces a b a¨d`b¨c ` “ . c d c¨d b¨c b¨c 1 1 Demostración. ac ` db “ ac ¨ dd ` db ¨ cc “ a¨d ` d¨c “ a¨d ` c¨d “ pa ¨ dq ¨ c¨d ` pb ¨ cq ¨ c¨d c¨d c¨d 1 “ pa ¨ d ` b ¨ cq ¨ c¨d “ a¨d`b¨c . Se deja al lector el completar los detalles de la demostración, c¨d diciendo el resultado que se utilizó en cada igualdad. ‚ 90 4.3. Desigualdades 4.3. Desigualdades 4.3.1. Axioma. Existe una relación de R en R, denotada por ą, la cual satisface las siguientes propiedades: 4.3.2. Propiedad de tricotomía. Si a, b P R, entonces solamente una de las siguientes tres proposiciones es verdadera: I) a ą b. II) a “ b. III) b ą a. 4.3.3. Propiedad transitiva. Si a ą b y b ą c, entonces a ą c. 4.3.4. Propiedad de cancelación para desigualdades. Si a, b, c P R, tenemos que a ą b ðñ a ` c ą b ` c. 4.3.5. Propiedad de preservación por multiplicación de positivo. pa ą b y c ą 0q ùñ a ¨ c ą b ¨ c. 4.3.6. Definición. A la relación ą se le llama mayor que. Decimos que a es menor que b, y lo denotamos como a ă b, cuando b ą a. Diremos que a es mayor o igual que b, denotado a ľ b, cuando a ą b ó a “ b. Diremos que a es menor o igual que b, denotado a ĺ b, cuando b ľ a. Observemos que las propiedades anteriores para la relación ą en los números reales son también válidas para la relación ă. 4.3.7. Definición. Decimos que un número real a es positivo cuando a ą 0 y decimos que es negativo cuando a ă 0. Debido a la propiedad de tricotomía podemos ver que todo número real a satisface sólo una de las siguientes tres proposiciones: a es positivo; a es negativo; a “ 0. Para hacer las demostraciones con mayor fluidez, solamente haremos mención de los axiomas y resultados de esta sección, los de las secciones anteriores los usaremos sin mencionarlos explícitamente. 4.3.8. Teorema. Si a ą b y c ą d, entonces a ` c ą b ` d. Demostración. Si a ą b, entonces, por la propiedad de cancelación para desigualdades, a ` c ą b ` c. De la misma manera si c ą d, entonces b ` c ą b ` d. Ahora por la propiedad transitiva a ` c ą b ` d. ‚ 4.3. Desigualdades 91 El teorema anterior implica que la suma de números positivos es un número positivo y que la suma de números negativos es un número negativo. De la misma forma que la propiedad de preservación por la multiplicación de positivo implica que la multiplicación de números positivos es positivo y la multiplicación de un número positivo por un negativo es un número negativo. Veamos qué propiedades podemos obtener de los siguientes teoremas. 4.3.9. Teorema. Si a ą b, entonces ´a ă ´b. Demostración. Por la propiedad de cancelación, a ą b ðñ a ` p´aq ` p´bq ą b ` p´aq ` p´bq, es decir ´b ą ´a o equivalentemente ´a ă ´b. ‚ El teorema 4.3.9 tiene como consecuencia que el inverso aditivo de un número positivo es negativo y que el inverso aditivo de un número negativo es un número positivo. 4.3.10. Teorema. Si a ą b y c ă 0, entonces a ¨ c ă b ¨ c. Demostración. Por el teorema anterior c ă 0 ùñ ´c ą 0. Por la propiedad de preservación por multiplicación de positivo y la implicación anterior tenemos a ą b y c ă 0 ùñ a ¨ p´cq ą b ¨ p´cq, pero por el teorema 4.3.9 a ¨ p´cq ą b ¨ p´cq ùñ a ¨ c ă b ¨ c. ‚ Del teorema anterior concluimos que la multiplicación de dos números negativos es un número positivo. 4.3.11. Teorema. Si a ‰ 0, entonces a2 ą 0 (donde a2 “ a ¨ a). Demostración. Si a ‰ 0, tenemos dos posibles casos, a saber aą0 ó a ă 0. En el primer caso tenemos que a ¨ a “ a2 es mayor que cero. Ahora si a ă 0, entonces el teorema anterior nos lleva a que, a2 ą 0. ‚ 4.3.12. Teorema. Si b ą a ľ 0 y d ą c ľ 0, entonces b ¨ d ą a ¨ c. Demostración. Supongamos que b ą a ľ 0 y d ą c ľ 0. En el caso en que a “ 0 ó c “ 0 tenemos que a ¨ c “ 0, pero por la propiedad transitiva b ą 0 y d ą 0, por lo que b ¨ d ą 0, es decir b ¨ d ą a ¨ c. Ahora si a ‰ 0 y c ‰ 0, entonces b ą a ą 0 y d ą c ą 0, por lo cual b ¨ d ą a ¨ d y a ¨ d ą a ¨ c, luego por la propiedad transitiva b ¨ d ą a ¨ c. ‚ 4.3.13. Definición. Decimos que dos números tienen el mismo signo si ambos son positivos o ambos son negativos y se dice que tienen signos opuestos o signos diferentes si uno es positivo y el otro negativo. 92 4.3. Desigualdades Las demostraciones de los siguientes 4 teoremas serán ejercicios para el lector. 4.3.14. Teorema. Si a y b tienen el mismo signo, entonces a ¨ b ą 0. Si a y b tienen signos opuestos, entonces a ¨ b ă 0. 4.3.15. Teorema. El número 1{a tiene el mismo signo que a (si a ‰ 0). 4.3.16. Teorema. Si a y b tienen el mismo signo y a ą b, entonces 1 1 ă . a b 4.3.17. Teorema. Si a ľ 0 y b ľ 0, entonces a2 ą b2 ðñ a ą b. Estamos en condiciones de resolver desigualdades lineales, por ejemplo 6¨x´3ą7´2¨x ðñ 6 ¨ x ` 2 ¨ x ą 7 ` 3 ðñ 8 ¨ x ą 10 ðñ x ą ðñ x ą 10 8 5 . 4 Así el conjunto solución de 6 ¨ x ´ 3 ą 7 ´ 2 ¨ x es tx P R : x ą 5{4u. El lector debe ser capaz de ver qué resultado se utilizó en cada paso. 4.4. Subconjuntos de números reales 4.4. 93 Subconjuntos de números reales 4.4.1. Axioma. El conjunto N Y t0u de números enteros no negativos es un subconjunto del conjunto R de números reales. Además las operaciones de suma «`» y multiplicación «¨», junto con la relación de orden «ą» dadas en R coinciden con las dadas en N Y t0u. 4.4.2. Teorema. Todo número natural es positivo. Demostración. Haremos la demostración por inducción matemática. Como 1 ‰ 0, entonces 12 ą 0, pero 12 “ 1, por lo que 1 ą 0, es decir 1 es positivo. Si n es un número natural positivo, entonces como 1 ą 0, tenemos que n ` 1 ą n, pero como n ą 0, entonces n ` 1 ą 0; es decir n ` 1 es positivo por lo que todos los números naturales son positivos. ‚ 4.4.3. Observación. Observemos que el elemento identidad en N es el mismo que el elemento identidad en R. En efecto, denotemos momentáneamente al elemento unitario en R como 11 . Es decir sea 11 el número real tal que para todo x P R se tiene que x ¨ 11 “ x y sea 1 el número natural tal que para todo n P N se tiene que n ¨ 1 “ n. En particular, cuando x es un número natural tenemos que x ¨ 11 “ x “ x ¨ 1, y por la ley de la cancelación tenemos que 11 “ 1. Análogamente se demuestra que el número cero dado en el conjunto de los enteros no negativos es el mismo que el dado en la propiedad del elemento neutro para la suma. 4.4.4. Definición. Al conjunto cuyos elementos son los números naturales, el cero y todos los inversos aditivos de números naturales se le llama conjunto de números enteros y se le denota por Z. Al conjunto de números naturales también se le llama conjunto de enteros positivos. , donde m y n son 4.4.5. Definición. El conjunto de todos los números reales de la forma m n enteros y n ‰ 0 se le llama conjunto de los números racionales y se le denota por Q. Todas las propiedades dadas hasta aquí sobre el conjunto R de números reales con respecto a las operaciones de suma, resta, multiplicación, división y con respecto a la relación ą se cumplen también para el conjunto Q de números racionales. ¿Qué propiedad tiene R que no tenga ya Q? La respuesta la daremos cuando se vea el axioma del supremo. Una de la propiedades que tiene el conjunto de los números racionales es que es numerable, es decir se tiene el teorema siguiente. 4.4.6. Teorema. El conjunto Q de números racionales es numerable. Demostración. Observemos primero que el conjunto Z de números enteros es numerable cuando n sea impar y tomando tomando la función ψ : N ÝÑ Z dada por ψpnq “ n´1 2 n ψpnq “ ´ 2 cuando n sea par. El que Z es numerable se sigue de que la función ψ es una biyección de N sobre Z, lo cual el lector debe poder verificar. Observemos también que todo número racional es de la forma pq , donde p P N y q P Z. Tenemos que el recorrido de la función ζ : N ˆ Z ÝÑ Q es Q. Ahora, por el corolario pp,qqÞÑ pq 3.10.8 existe una biyección ϕ de N sobre N ˆ Z, de manera que la función ζ ˝ ϕ : N ÝÑ Q es sobre Q, de manera que por el teorema 3.10.4 se concluye que Q es numerable. ‚ 94 4.5. Exponentes enteros 4.5. Exponentes enteros Tenemos las siguientes expresiones para representar la potencia de un número real x: a1 “ a, a2 “ a ¨ a, a3 “ a ¨ a ¨ a, en general an “ looooooomooooooon a ¨ a ¨ a ¨ ¨ ¨ ¨ ¨ a, donde n es un entero positivo. n veces De manera más precisa tenemos la siguiente definición. 4.5.1. Definición. Definimos a1 “ a, an`1 “ an ¨ a para cualquier entero positivo n. Al número an se le llama la potencia n-ésima de a. En la expresión an al número a se le llama la base y al número n el exponente. 4.5.2. Ejemplos. 53 “ 5¨5¨5 “ 125, p´3q2 “ p´3q¨p´3q “ 9, p´3q3 “ p´3q¨p´3q¨p´3q “ ´27, ? ? ? ? ? ? `? ˘4 ? ? ? ? `? ˘3 `? ˘2 2 “ 2 ¨ 2 “ 2, 2 “ 2 ¨ 2 ¨ 2 “ 2 ¨ 2, 2 “ 2¨ 2¨ 2¨ 2 “ `? ? ˘ `? ? ˘ 2 ¨ 2 ¨ 2 ¨ 2 “ 4. Vale la pena aclarar algo sobre la simbología. Con ausencia de paréntesis tiene prioridad en cuanto al orden de operación la potencia, luego la multiplicación y división y finalmente la suma, resta y símbolo de inverso aditivo. Mientras no se preste a confusión la expresión xy significa x ¨ y. Por ejemplo la expresión 4x2 significa 4 ¨ px2 q y no p4 ¨ xq2 ; ´2bn significa p´2q ¨ bn y no p´2 ¨ bqn ; ´64 significa ´p64 q y no p´6q4 . El lector podrá demostrar por inducción matemática las siguientes leyes de los exponentes. 4.5.3. Leyes de los exponentes. Si a, b son números reales y m, n son enteros positivos, entonces I) am an “ am`n ; II) pam qn “ amn ; III) pabqn “ an bn ; ` ˘n n (para b ‰ 0); IV) ab “ abn V) am an “ am´n VI) am an “ VII) am an “1 1 an´m (para m ą n y a ‰ 0); (para n ą m y a ‰ 0); (para n “ m y a ‰ 0). Hagamos algunos comentarios ilustrativos sobre estas leyes. En la parte izquierda de la igualdad I) tenemos que am an “ paa ¨ ¨ ¨ aqpaa ¨ ¨ ¨ aq, loomoon loomoon m veces n veces 4.5. Exponentes enteros 95 en total a se multiplica por si mismo m ` n veces. En la parte izquierda de II) tenemos m m pam qn “ a a ¨ ¨ ¨ am “ paa ¨ ¨ ¨ aqpaa ¨ ¨ ¨ aq ¨ ¨ ¨ paa ¨ ¨ ¨ aq looooomooooon loomoon loomoon loomoon n veces m veces m veces m veces loooooooooooooooooomoooooooooooooooooon n veces por lo que a se multiplica por si mismo mn veces. En la parte izquierda de III) tenemos pabqn “ loooooooomoooooooon pabqpabq ¨ ¨ ¨ pabq, n veces por lo que el número a aparece n veces y el b también, aplicando varias veces la propiedad conmutativa se obtiene que esto último es paa ¨ ¨ ¨ aqpbb ¨ ¨ ¨ b q “ an b n . loomoon loomoon n veces n veces En la parte izquierda de IV) tenemos ´ a ¯n b n veces hkkikkj aa a an aa ¨ ¨ ¨ a “ ¨¨¨ “ “ n. bb b bb ¨¨¨b b looomooon loomoon n veces n veces Las leyes V) y VI) son consecuencias de las anteriores, por ejemplo cuando n ą m tenemos que am am “ . an an´m am Surge la siguiente pregunta ¿Cómo definir a0 de tal manera que se sigan cumpliendo las leyes de los exponentes?. Si definimos a0 “ 1 para a ‰ 0, entonces las leyes de los exponentes se cumplen, por m ejemplo am`0 “ am a0 “ am , 1 “ aam “ am´m “ a0 , pero en la segunda serie de igualdades am ‰ 0, por lo que si m ‰ 0 tendríamos que a debe ser diferente de cero. 4.5.4. Definición. Si a es un número real diferente de cero, definimos a0 :“ 1. (Vale la pena m remarcar que cuando a “ 0 y m ‰ 0, no tiene sentido la expresión aam ). Definamos ahora apropiadamente ak cuando a ‰ 0 y k es un entero negativo. 4.5.5. Definición. Si a ‰ 0 y n es un entero positivo, definimos a´n “ 1 . an Observemos que la definición anterior es equivalente a decir que si k es un entero negativo, entonces 1 ak “ ´k . a Con las definiciones así dadas para los exponentes, se tienen las leyes de los exponentes en una forma menos restringida en cierto aspecto, las cuales el lector podrá verificar. 4.5.6. Leyes de los exponentes enteros. Si a, b son diferentes de cero y m, n son enteros, entonces 96 4.5. Exponentes enteros I) am an “ am`n ; II) pam qn “ amn ; III) pabqn “ an bn ; ` ˘n n IV) ab “ abn ; V) am an “ am´n “ 1 . an´m Ejercicios. En los ejercicios siguientes, la palabra «simplificar» significa sustituir la expresión dada por una en la que las literales (números representados por letras) aparezcan a lo sumo una sola vez y no tengan exponentes negativos. 1. Escribir los números dados en la forma a{b, donde a y b son enteros: ` 3 ˘3 p´2q4 , 32 ` 2 ¨ 3, p´3q2 ´ 23 , ´5 , 5´2 , 2´5 30 ` 03 , ` 4 ˘´2 ` 2 ˘3 5 5 , 32 ¨5´3 . 5¨3´1 2´4 ` p´4q2 , 2. Simplificar las siguientes expresiones: p2c2 qp3c2 q , 12c2 p4a3 qp3a5 q, p´6a3 q2 , 9a4 ´ ¯2 ´ 3p q3 ´q 2p2 ¯3 , p8t3 u5 qp2´1 tu´3 q, pa ` bq2 pa ` bq´2 , p´4x3 q2 p8x4 q´1 , ´ 8 y ´1 2x´1 ¯ ´ ¯´1 2x y . 4.6. El valor absoluto 4.6. 97 El valor absoluto Si representamos al conjunto de los números reales como las coordenadas de una recta numérica, el valor absoluto de un número x representa la distancia entre el origen O y el punto P cuya coordenada es x. Una propiedad O s 0 Ps x - de las distancias entre dos puntos es que nunca son negativas. Así, tenemos la siguiente definición. 4.6.1. Definición. Si x es un número real, el valor absoluto de x, denotado |x|, se define de la siguiente manera # x, si x ľ 0, |x| :“ ´x, si x ĺ 0. Y 5 6 @ @ @ @ 4 @ @ @ y “ |x| 3 @ @ @ 2 @ @ @ 1 @ @ ´5 ´4 ´3 ´2 -X 1 ´1 2 3 4 5 ? 4.6.2. Ejemplos. |5| “ 5, | ´ 4| “ ´p´4q “ 4, |3{8| “ 3{8, | ´ | ´ 1{2| “ ´p´1{2q “ 1{2, |0| “ 0, | ´ 3{8| “ ´p´3{8q “ 3{8. ? ? ` ? ˘ 2| “ ´ ´ 2 “ 2, 4.6.3. Teorema. Si x P R, entonces |x| “ | ´ x|. Demostración. Si x ľ 0, entonces ´x ĺ 0, por lo que |x| “ x y | ´ x| “ ´p´xq “ x. Ahora si x ă 0, entonces ´x ą 0 en cuyo caso |x| “ ´x y | ´ x| “ ´x. En ambos casos tenemos que |x| “ | ´ x|. ‚ Del teorema anterior y del hecho de que b ´ a “ ´pa ´ bq se tiene el siguiente corolario. 4.6.4. Corolario. |a ´ b| “ |b ´ a|. Volvamos de nuevo a la recta numérica para ilustrar el resultado. 98 4.6. El valor absoluto A s a B s b - Si los puntos A y B de la recta tienen coordenadas a y b respectivamente, entonces la distancia entre A y B será |a ´ b|, pero la distancia entre A y B es la misma que la distancia entre B y A, es decir |a ´ b| “ |b ´ a|. 4.6.5. Teorema. Si a, b, c P R, entonces |a ´ b| ĺ |a ´ c| ` |c ´ b|. Demostración. Veamos primero el caso en que a ´ b ľ 0, es decir en que a ľ b. Tenemos tres posibilidades, a saber b ĺ c ĺ a, c ą a y c ă b. Cuando b ĺ c ĺ a tenemos que |a ´ b| “ a ´ b “ pa ´ cq ` pc ´ bq “ |a ´ c| ` |c ´ b|, teniéndose en este caso que la conclusión es válida. Cuando c ą a tenemos que |a ´ b| “ a ´ b “ pc ´ bq ´ pc ´ aq ă c ´ b “ |c ´ b| ă |a ´ c| ` |c ´ b|, por lo que en este caso la conclusión es válida. Cuando c ă b tenemos que |a ´ b| “ a ´ b “ pa ´ cq ´ pb ´ cq ă a ´ c “ |a ´ c| ă |a ´ c| ` |c ´ b|, por lo que en este caso la conclusión también es válida. Tenemos pues que la fórmula |a ´ b| ĺ |a ´ c| ` |c ´ b| se cumple en el caso en que a ´ b ľ 0. Para el caso en que a ´ b ă 0, remontándonos al caso anterior y al corolario 4.6.4, obtenemos que |a ´ b| “ |b ´ a| ĺ |b ´ c| ` |c ´ a| “ |a ´ c| ` |c ´ b|. ‚ 4.6.6. Corolario. Si a, b, c P R, entonces ||a ´ b| ´ |b ´ c|| ĺ |a ´ c|. Demostración. Del teorema 4.6.5 y del corolario 4.6.4 se sigue que |a ´ b| ´ |b ´ c| ĺ |a ´ c| y que ´p|a ´ b| ´ |b ´ c|q “ |b ´ c| ´ |a ´ b| ĺ |a ´ c| con lo que se concluye el corolario. ‚ 4.7. Aritmética 4.7. 99 Aritmética En esta sección deduciremos las propiedades básicas de los números enteros. Comencemos con alguna terminología que será de utilidad en esta sección y posteriormente. 4.7.1. Notación. Si para todo número natural k se tiene que ak es un número real, entonces se denota ˜ ¸ 1 n`1 n ÿ ÿ ÿ ak :“ a1 y ak :“ ak ` an`1 k“1 k“1 k“1 para todo número natural n. Análogamente denotamos ˜ ¸ 1 n`1 n ź ź ź ak :“ a1 y ak :“ ak an`1 . k“1 k“1 k“1 Las siguientes propiedades que son fáciles de demostrar se tomarán como obvias. Si c es un número, entonces n ÿ cak “ c k“1 n ÿ k“1 ak , n ÿ c “ nc, k“1 n ź cak “ c k“1 n n ź ak , k“1 n ź c “ cn . k“1 4.7.2. Definición. A cada elemento ak , donde k P Jn “ t1, 2, . . . , nu, se le llama término n n ř ś de la suma ai o factor del producto ai . Cuando no se preste a confusión escribiremos a i“1 veces a1 ` a2 ` ¨ ¨ ¨ ` an en lugar de por razones técnicas a 0 ř i“1 ai “ 0 y n ř i“1 0 ś i“1 ai y a1 a2 ¨ ¨ ¨ an en lugar de n ś ai . Denotaremos además i“1 ai “ 1. Además i“1 n ř j“k aj será por definición n´k`1 ř aj`k´1 j“1 “ ak ` ak`1 ` ¨ ¨ ¨ ` an , es decir será ak más ak`1 y así sucesivamente hasta llegar a an . En lo que sigue de la sección siempre que se hable de un número entenderemos que es un número entero a menos que se especifique otra cosa. El siguiente teorema básico se le conoce con el nombre de algoritmo de Euclides o algoritmo de la división. 4.7.3. Algoritmo de Euclides. Dados dos números a, b con b ‰ 0, existen dos números m y r tales que a “ mb ` r y 0 ĺ r ă |b|. Demostración. Demostremos primero el resultado para el caso en que a ą 0 y b ą 0. Si a ă b, entonces tomamos m “ 0 y r “ a. Si a ą b, sea k el mínimo número natural para el cual kb ą a. Si tomamos m “ k ´ 1, tenemos que a ľ mb y será suficiente con demostrar que r “ a ´ mb es menor que b. Si r fuera mayor o igual que b, entonces r “ b ` t, donde t es un entero no negativo, por lo que pm ` 1qb ` t “ r ` mb “ a, es decir kb ĺ a, contradiciendo el hecho de que kb ą a (donde k “ m ` 1). 100 4.7. Aritmética Si a “ b tomamos m “ 1 y r “ 0. Por lo que el resultado es cierto cuando a ą 0 y b ą 0. Si a “ 0 el resultado se cumple tomando m “ 0 y r “ 0. Si b ă 0 y a ą 0 entonces sea k tal que a “ kp´bq ` r 0 ĺ r ă |b| con y tomando m “ ´k se obtiene el resultado. Así el resultado está demostrado de manera general cuando a ľ 0. Ahora, si a ă 0, sean a1 “ ´a y m1 y r1 tales que a1 “ m1 b ` r1 0 ĺ r1 ă |b|. con Si r1 “ 0 tomando r “ r1 y m “ ´m1 obtenemos a “ mb ` r. Si r1 ą 0, entonces a “ p´m1 qb ´ r1 “ p´m1 qb ´ |b| ` p|b| ´ r1 q, pero 0 ă r1 ă |b| ðñ 0 ą ´r1 ą ´|b| ðñ |b| ą |b| ´ r1 ą 0 ðñ 0 ă |b| ´ r1 ă |b|, tomando r “ |b| ´ r1 obtenemos a “ p´m1 qb ´ |b| ` r con 0 ă r ă |b|. Si b ą 0, tomamos m “ ´m1 ´ 1; si b ă 0, tomamos m “ ´m1 ` 1 para obtener a “ mb ` r. ‚ 4.7.4. Unicidad del algoritmo de la división. Si a, b son enteros con b ‰ 0 y tenemos cuatro números m1 , m2 , r1 , r2 tales que a “ m1 b ` r1 , 0 ĺ r1 ă |b|, a “ m2 b ` r2 , 0 ĺ r2 ă |b|; entonces m1 “ m2 y r1 “ r2 . Demostración. Si r1 “ r2 , entonces m1 b “ a ´ r1 “ a ´ r2 “ m2 b, pero como b ‰ 0, tenemos que m1 “ m2 . Veamos que es imposible que r1 ‰ r2 . Supongamos que r1 ‰ r2 , y sin pérdida de generalidad supongamos que r1 ă r2 , teniendo 0 “ m2 b ` r2 ´ pm1 b ` r1 q “ pm2 ´ m1 qb ` pr2 ´ r1 q, de manera que |b| ą r2 ľ r2 ´ r1 ą 0 y además r2 ´ r1 “ pm1 ´ m2 qb “ |m2 ´ m1 ||b|, concluyendo que r2 ´ r1 es un múltiplo positivo de |b|, teniendo así que r2 ´ r1 ľ |b|, llegando así a una contradicción. ‚ 4.7.5. Definición. Al número r dado en el algoritmo de Euclides se le llama residuo o resto de la división de a entre b. 4.7.6. Definición. Sea b ‰ 0. Decimos que b divide a a cuando a “ mb para algún entero m. Al hecho de que b divida a a lo denotaremos como b | a. Al hecho de que b no divida a a 4.7. Aritmética 101 lo denotaremos como b - a, es decir b - a significa b | a. Observemos que si a | 1, entonces a “ 1 ó a “ ´1. Observemos también que si a | b y b | a, entonces a “ b ó a “ ´b. Si b | a decimos que b es un divisor de a o que a es un múltiplo de b. Notemos también que si b | c y b | d, entonces b | mc ` nd para cualesquier enteros m y n. Si n es un entero múltiplo de 2 decimos que es un número par. 4.7.7. Definición. Decimos que un número natural c es el máximo común divisor de a y b si: I) c | a y c | b, II) (d | a y d | b) ùñ d | c. Al máximo común divisor de a y b lo denotamos como MCDpa, bq, por ejemplo MCDp4, 10q “ 2, MCDp15, ´7q “ 1, MCDp´30, 40q “ 10, MCDp60, 24q “ 12. Surge ahora el problema de saber si el máximo común divisor de dos enteros siempre existe. Si éste existe podemos observar que es en efecto «el máximo de los divisores comunes» de a y b. El siguiente teorema contesta a esta interrogante. 4.7.8. Teorema. Si a y b son enteros, no ambos cero, entonces MCDpa, bq existe; además podemos encontrar enteros m0 y n0 tales que MCDpa, bq “ m0 a ` n0 b. Demostración. Sea A “ tx P Z : x “ ma`nb, m, n P Zu. Como a ‰ 0 y b ‰ 0, entonces hay elementos diferentes de cero en A. Si x “ ma`nb P A, entonces ´x “ p´mqa`p´nqb P A, por lo que A tiene elementos positivos, luego A X N tiene un mínimo (primer elemento) c. Como c P A, entonces c “ m0 a ` n0 b para algunos enteros m0 y n0 . Veamos que c “ MCDpa, bq. Sea d un entero tal que d | a y d | b. Bajo estas condiciones tenemos que d | pm0 a ` n0 bq, es decir d | c. Falta ver que c | a y c | b. Sea x un elemento de A. Tenemos que x “ ma ` nb para algunos enteros m y n. Ahora, por el algoritmo de Euclides existen t y r, con 0 ĺ r ă c, tales que x “ tc ` r, pero como c “ m0 a ` n0 b, y x “ ma ` nb, tenemos que ma ` nb “ tpm0 a ` n0 bq ` r, por lo cual r “ pm ´ m0 tqa ` pn ´ n0 tqb, es decir r P A, pero como 0 ĺ r ă c y c es el mínimo de los positivos de A, tenemos que r “ 0, de manera tal que x “ tc, es decir c | x. Hemos demostrado que c divide a cualquier elemento de A, en particular c divide a a y a b con lo que el teorema queda demostrado. ‚ 4.7.9. Definición. Decimos que dos enteros a y b son primos relativos si MCDpa, bq “ 1. Como consecuencia de esta definición y del teorema 4.7.8 tenemos el siguiente corolario. 4.7.10. Corolario. Dos números enteros a, b son primos relativos si y sólo si podemos encontrar enteros m, n tales que ma ` nb “ 1. 102 4.7. Aritmética Demostración. Si a, b son primos relativos, entonces MCDpa, bq “ 1, y por el teorema 8 podemos encontrar enteros m, n tales que ma ` nb “ 1. Ahora, si ma ` nb “ 1, d | a y d | b, entonces d | pma ` nbq, es decir d | 1, pero como 1 | a y 1 | b, tenemos que 1 “ MCDpa, bq. ‚ 4.7.11. Definición. Un entero p se dice que es primo si es mayor que 1 y sus únicos divisores son 1, ´1, p y ´p. 4.7.12. Observación. Observemos que si p es un número primo y no es primo relativo con n, entonces p | n debido a que el máximo común divisor de p y n es p ó 1. 4.7.13. Teorema. Si a es primo relativo con b, pero a | bc; entonces a | c. Demostración. Sean a y b primos relativos y c tal que a | bc. Por el teorema 8 existen enteros m y n tales que ma ` nb “ 1, por lo que mac ` nbc “ c. Ahora, a | mac y como a | bc, entonces a | nbc, por lo tanto a | pmac ` nbcq, es decir a | c. ‚ 4.7.14. Definición. Para cualquier número natural n se define la suma de los n númen ř ros a1 , a2 , . . . , an como ai . De manera similar definimos el producto de los n números a1 , a2 , . . . , an como n ś i“1 ai . A cada número ak , donde k P Jn “ t1, 2, . . . , nu, se le llama k-ésimo i“1 término de la suma n ř ai ó k-ésimo factor del producto i“1 n ś ai . i“1 4.7.15. Corolario. Si un número primo divide al producto de ciertos enteros, entonces divide al menos a uno de los enteros. Demostración. Si el producto tiene un solo factor, entonces el resultado es directo. Sun`1 ś pongamos que el resultado es válida para n factores. Si tenemos ahora el producto ak de k“1 n ` 1 factores y un número primo p que divide a este producto, entonces, por la observación anterior, p | ak`1 ó p es primo relativo con ak`1 . En el primer caso el resultado es válido, en n ś el segundo tenemos por el teorema 4.7.13 que p | ak , pero como el resultado es válido para k“1 n tenemos que p | ak para algún ak con k P Jn . ‚ 4.7.16. Definición. Decimos que un número natural a se puede expresar como producto t ś de potencias de números primos si a “ pαi i , donde pi es primo para 1 ĺ i ĺ t, αi ą 0 i“1 y pi ă pi`1 para 1 ĺ i ĺ t ´ 1. 4.7.17. Teorema. Si dos enteros positivos u y v pueden ser expresados como producto de potencias de números primos, entonces uv pueden ser expresados como producto de potencias de números primos. Demostración. Sean u y v dos números que se pueden factorizar como producto de potencias de primos, a saber t s ź ź αi u“ pi y v“ qiβi . i“1 i“1 Procederemos por inducción sobre s. Si s “ 1, entonces v “ q1β1 . Tenemos dos posibilidades a) @1 ĺ i ĺ t, q1 ‰ pi , b) q1 “ pk para algún 1 ĺ k ĺ t. 4.7. Aritmética 103 Para el caso a) si para todo iś P t1, . . . , tu se tiene que q1 ą pi , entonces tomamos pt`1 “ q1 αi y αt`1 “ β1 para obtener uv “ t`1 i“1 pi . Si por el contrario q1 ă pi para algún i, tomemos l como el mínimo número i para el cual se vale que q1 ă pi . Así tomamos ri “ pi , ν i “ αi , si i ă l; rl “ q1 , ν l “ β1 , y ri “ pi´1 , νi “ αi´1 , si i ą l. ś νi con lo que uv “ t`1 i“1 ri . Para el caso b) tomamos ri “ pi , νi “śαi cuando pi ‰ q1 , pero cuando pk “ q1 tomamos rk “ q1 y νk “ αk ` β1 , con lo cual uv “ ti“1 riνi . śn`1 βi Ahora ´ supongamos que para s “ n el resultado es válido y tomemos v “ i“1 qi , lo cual ¯ śn βi βn`1 śn βi es igual a qn`1 . Por hipótesis de inducción u i“1 qi se puede representar como i“1 qi producto de potencias de primos y como es válido cuando el segundo factor es la ¯ ´śel resultado βn`1 n βi qn`1 también puede ser representado como potencia de un primo, entonces uv “ i“1 qi producto de potencias de primos. ‚ El siguiente teorema nos dice que todo entero se puede factorizar en forma única como producto de potencias de números primos. 4.7.18. Teorema de factorización única. Cualquier entero positivo a ą 1 puede factorizarse en forma única como a “ pα1 1 , pα2 2 ¨ ¨ ¨ pαt t , donde p1 ă p2 ă ¨ ¨ ¨ ă pt son primos y donde t ś αi ą 0, para 1 ĺ i ĺ t. Es decir a “ pαi i , donde pi ă pi`1 , los αi ą 0 y los pi son primos i“1 con 1 ĺ i ĺ t, además tales números son únicos. Demostración. Demostraremos primero la existencia de tal factorización y después demostraremos la unicidad. Utilizaremos para la demostración el segundo método de inducción matemática 3.9.4. La inducción se hará sobre a. Para a “ 1 no hay nada que hacer puesto que el teorema afirma la validez para a ą 1. Para a “ 2 se tiene la factorización con t “ 1, p1 “ 2 y α1 “ 1. Supongamos que la factorización se tiene para cualquier α con 1 ă α ĺ k y demostremos que k ` 1 puede ser factorizado de tal forma. Si k ` 1 es primo, entonces tomamos t “ 1, α1 “ 1 y p1 “ k ` 1. Si k ` 1 no es primo, entonces k “ uv, donde 1 ă u ĺ k y 1 ă v ĺ k por lo cual, por hipótesis de inducción, u y v tienen dicha factorización y por el teorema 16 tenemos que n ` 1 “ uv tienen la factorización. ś Veamos ahora que la factorización es única, es decir que si a “ ti“1 pαi i con pi ă pi`1 ś primos y a “ si“1 qiβi con qi ă qi`1 primos, entonces s “ t, αi “ βi y pi “ qi . Hagamos la demostración usando de nuevo el segundo método de inducción matemática 3.9.4. Como se exige que a ą 1, comencemos con a “ 2. Como ś21 es primo, entonces no puede ser factorizado mas que de la forma a “ 2, es decir con a “ i“1 2. Supongamos que el resultado es válido para cualquier 1 ă a ĺ k y demostremos ś a tal queś la unicidad de la factorización para k ` 1. Si k ` 1 “ ti“1 pαi t “ si“1 qiβi , donde αi , βi ą 0, pi y qi son primos, pi ă pi`1 y qi ă qi`1 ; entonces tenemos tres casos posibles: a) pt “ qs , b) pt ą qs , c) pt ă qs . 104 4.7. Aritmética Veamos primero y c) son imposibles. Supongamos que se tiene pt ą qs . śs βique los casosβb) i Ahora, pt | i“1 qi , pero pt - qi para 1 ĺ i ĺ s, lo cual contradice al corolario 4.7.14. Similarmente es imposible que pt ă qs . Tenemos entonces que pt “ qs . Veamos ahora que αt “ βs . Si αt ‰ βs , supongamos sin pérdida de generalidad que αt ą βs . Dividiendo k ` 1 entre qsβs tendríamos ˜ ¸ s´1 t´1 ź ź αt ´βs αi “ qiβi , pi pt i“1 i“1 śs´1 βi i“1 qi qiβi pero de nuevo pt | y pt para ningún i P t1, . . . , s ´ 1u, lo cual contradice al corolario 4.7.14, por lo tanto αt “ βs . Dividiendo ahora k ` 1 entre el valor común pαt t “ qsβs tenemos que t´1 s´1 ź ź αi pi “ qiβi ĺ k i“1 i“1 y por hipótesis de inducción tenemos que t ´ 1 “ s ´ 1, es decir t “ s, pi “ qi y αi “ βi , por lo que el teorema queda demostrado. ‚ Una consecuencia del teorema de factorización única es el corolario siguiente, al cual por su importancia se le conoce como teorema fundamental de la aritmética. Dejamos al lector los detalles de la demostración. 4.7.19. Teorema fundamental de la aritmética. Cualquier entero a ‰ 1 puede factorizarse en forma única como a “ upα1 1 pα2 2 ¨ ¨ ¨ pαt t , donde p1 ă p2 ă ¨ ¨ ¨ ă pt son primos, t ś u P t´1, 1u y cada αi ą 0, para 1 ĺ i ĺ t. Es decir, a “ u pαi i , donde pi ă pi`1 , los αi ą 0 i“1 y los pi son primos, para 1 ĺ i ĺ t, además tales números son únicos. 4.7.20. Corolario. Existe una infinidad de números primos, es decir el conjunto de números primos es un conjunto infinito. Demostración. Haremos la demostración por contradicción. Supongamos que el conjunto de los números primos es un conjunto finito y sea n el número de elementos del conjunto de números primos y tp1 , p2 , . . . , pn u el conjunto de números primos, donde p1 ă p2 ă ¨ ¨ ¨ ă pn . Como p1 ă p2 ă ¨ ¨ ¨ ă pn ă p1 p2 ¨ ¨ ¨ pn ` 1, entonces p1 p2 ¨ ¨ ¨ pn ` 1 no es un número primo y por el teorema de factorización única se tiene una expresión de la forma p1 p2 ¨ ¨ ¨ pn ` 1 “ pα1 1 pα2 2 ¨ ¨ ¨ pnαn , donde cada αi es un entero no negativo (en caso de que un número primo pk no sea uno de los que aparecen en el teorema de factorización única, se toma αk “ 0). Observemos que debe existir un entero positivo l, tal que 0 ĺ l ĺ n par el cual αl ą 0, por lo que pl divide tanto a p1 p2 ¨ ¨ ¨ pn como a pα1 1 pα2 2 ¨ ¨ ¨ pαnn y siendo así también debe dividir a 1 “ pα1 1 pα2 2 ¨ ¨ ¨ pαnn ´ p1 p2 ¨ ¨ ¨ pn , lo cual es imposible (en efecto, si m es un entero negativo, entonces pm ă 0 ă 1; si m “ 0, entonces pm “ 0 ă 1, y si m es un entero positivo, entonces pm ľ p ą 1). Por lo tanto, el conjunto de números primos es un conjunto infinito. ‚ 4.7.21. Definición. Sea M un conjunto de números enteros. El máximo común divisor de M es el entero positivo c tal que para todo m P M se tiene que c | m, y para todo d que divida a cualquier elemento de M se tiene que d | c. 4.7.22. Teorema. Supongamos que M es un conjunto de enteros positivos cerrado bajo la adición y que el máximo común divisor de M es 1. Al conjunto M pertenecen todos los enteros mayores que algún número n0 . 4.7. Aritmética 105 Demostración. Sea M1 el conjunto de enteros de la forma m, ´m y m´m1 con m, m1 P M . Observemos que M1 es cerrado bajo la adición y la resta. Sea d el menor elemento positivo de M1 . Si n P M1 , podemos poner n “ qd ` r, con 0 ĺ r ă d. Como r “ n ´ qd P M1 , entonces r “ 0. Así, M1 es el conjunto de los múltiplos de d, por lo cual d divide a todos los elementos de M , luego por hipótesis tenemos que d | 1 y así d “ 1. Por lo tanto M1 es el conjunto de los números enteros. Sean m, m1 P M tales que m ´ m1 “ 1 y n0 “ pm ` m1 q2 . Dado n ą n0 , pongamos n “ qpm`m1 q`r, con 0 ĺ r ă m`m1 . De lo anterior y del hecho de que n ą n0 ľ pr`1qpm`m1 q se tiene que q “ pn´rq{pm`m1 q “ pn{pm`m1 qq´pr{pm`m1 qq ą r`1´r{pm`m1 q ą r`1´1 “ r. Pero n “ qpm ` m1 q ` rpm ´ m1 q “ pq ` rqm ` pq ´ rqm1 y como q ` r ľ q ´ r ą 0, tenemos que n P M . ‚ 4.7.23. Corolario. Supongamos que M es un conjunto de enteros positivos cerrado bajo la adición y que el máximo común divisor de M es d. Entonces a M pertenecen todos los múltiplos de d mayores que algún n0 . Demostración. Sea M 1 el conjunto de todos los enteros positivos m1 de la forma m1 “ m{d, para algún m P M . Observemos que el máximo divisor común de M 1 es 1 y que la función f : M 1 ÝÑ M tal que f pm1 q “ dm1 es una biyección de M 1 en M . Sea n10 un número tal que todos los n1 ą n10 pertenecen a M 1 y sea n0 “ dn10 . Si n ą n0 es un múltiplo de d, entonces ‚ n{d ą n10 , por lo que n{d P M 1 , de donde concluimos que n P M . 4.7.24. Notación. Cuando n es un número natural y r es un entero tal que 0 ĺ r ă n, al conjunto de todos los números enteros a tales que r es el residuo de la división de a entre n lo denotaremos por rrsn , es decir rrsn :“ ta P Z : a “ nb ` r para algún b P Zu. 4.7.25. Definición. Cuando n es un número natural, a la familia tr0sn , r1sn , . . . , rn ´ 1sn u, la cual tiene n elementos, se le llama conjunto de los enteros módulo n. Al conjunto de los enteros módulo n lo denotaremos como Zn . Cuando a y b sean dos enteros, diremos que a es congruente con b módulo n (o que a es congruente módulo n con b) si existe un r P t0, 1, . . . , n ´ 1u tal que a, b P rrsn . Al hecho de que a sea congruente módulo n con b lo denotaremos así a ”n b o bien así a ” b (mód n). Cuando r P t0, 1, . . . , n ´ 1u y a ”n r, al conjunto rrsn lo denotaremos también por rasn . 4.7.26. Teorema. Sean a y b dos números enteros. Tenemos que a ”n b ðñ n | pa ´ bq. Demostración. Supongamos primero que a ”n b. Sea r P t0, 1, . . . , n ´ 1u y m1 , m2 los enteros tales que a “ nm1 ` r y b “ nm2 ` r. Como n | npm1 ´ m2 q y npm1 ´ m2 q “ a ´ b, tenemos que a ”n b ùñ n | pa ´ bq. Supongamos ahora que n | pa ´ bq. Sea r P t0, 1, . . . , n ´ 1u y m1 , m los enteros tales que a “ nm1 ` r y a ´ b “ nm. Como b “ npm1 ´ mq ` r, tenemos que a, b P rrsn , por lo que a ”n b, concluyendo así que n | pa ´ bq ùñ a ”n b. ‚ 4.7.27. Observación. Observemos que la relación ”n es una relación de equivalencia en Z, cuyas clases de equivalencia son los n elementos diferentes r0sn , r1sn , . . . , rn ´ 1sn del conjunto de los enteros módulo n. 4.7.28. Definición. Definiremos la suma módulo n en el conjunto Zn como la operación 106 4.7. Aritmética `n definida de la siguiente forma: para r1 , r2 P t0, 1, . . . , n ´ 1u definimos rr1 sn `n rr2 sn :“ rr1 ` r2 sn . Para simplificar la notación escribiremos simplemente ` en lugar de `n . 4.7.29. Teorema. La operación ` definida en Zn es asociativa. Demostración. Sean a, b, c P Zn y r1 , r2 , r3 P t0, 1, . . . , n ´ 1u tales que a “ rr1 sn , b “ rr2 sn y c “ rr3 sn . Sean ahora s, t, u P t0, 1, . . . , n ´ 1u tales que rssn “ rr1 ` r2 sn , rtsn “ rr2 ` r3 sn y rusn “ rr1 ` r2 ` r3 sn . Tenemos que existen números m1 , m2 y m3 tales que r1 ` r2 “ m1 n ` s, r2 `r3 “ m2 n`t y r1 `r2 `r3 “ m3 n`u. Ahora, s`r3 “ ´m1 n`r1 `r2 `r3 “ pm3 ´m1 qn`u y además r1 ` t “ ´m2 n ` r1 ` r2 ` r3 “ pm3 ´ m2 qn ` u, por lo tanto pa ` bq ` c “ rr1 ` r2 sn ` rr3 sn “ rssn ` rr3 sn “ rusn “ rr1 sn ` rtsn “ a ` pb ` cq. ‚ 4.7.30. Definición. Definiremos la multiplicación módulo n en el conjunto Zn como la operación ¨n definida de la siguiente forma: para r1 , r2 P t0, 1, . . . , n´1u definimos rr1 sn ¨n rr2 sn :“ rr1 r2 sn . Para simplificar la notación escribiremos simplemente ¨ en lugar de ¨n y también cuando a, b P Zn escribiremos alguna veces ab en lugar de a ¨ b. 4.7.31. Teorema. La operación ¨ definida en Zn es asociativa. Demostración. Sean a, b, c P Zn y r1 , r2 , r3 P t0, 1, . . . , n ´ 1u tales que a “ rr1 sn , b “ rr2 sn y c “ rr3 sn . Sean ahora s, t, u P t0, 1, . . . , n ´ 1u tales que rssn “ rr1 r2 sn , rtsn “ rr2 r3 sn y rusn “ rr1 r2 r3 sn . Tenemos que existen números m1 , m2 y m3 tales que r1 r2 “ m1 n ` s, r2 r3 “ m2 n ` t y r1 r2 r3 “ m3 n ` u. Ahora, sr3 “ ´m1 nr3 ` r1 r2 r3 “ pm3 ´ m1 r3 qn ` u y además r1 t “ ´m2 nr1 ` r1 r2 r3 “ pm3 ´ m2 r1 qn ` u, por lo tanto pabqc “ rr1 r2 sn rr3 sn “ rssn rr3 sn “ rusn “ rr1 sn rtsn “ apbcq. ‚ Cuando aparezcan operaciones de suma y multiplicación módulo n, la prioridad en el orden de realización de las operaciones (con ausencia de paréntesis) será, al igual que en la suma y multiplicación de números reales, primero la multiplicación y después la suma. 4.7.32. Teorema. En Zn la multiplicación es distributiva con respecto a la suma, es decir para cualesquiera tres a, b, c P Zn se tiene que apb ` cq “ ab ` ac. Demostración. Sean a, b, c P Zn y r1 , r2 , r3 P t0, 1, . . . , n ´ 1u tales que a “ rr1 sn , b “ rr2 sn y c “ rr3 sn . Sean ahora s, t, u, v P t0, 1, . . . , n ´ 1u tales que rssn “ rr1 r2 sn , rtsn “ rr1 r3 sn , rusn “ rr2 ` r3 sn y rvsn “ rs ` tsn . Tenemos que existen números m1 , m2 , m3 y m4 tales que r1 r2 “ m1 n`s, r1 r3 “ m2 n`t, r2 `r3 “ m3 n`u y s`t “ m4 n`v. Ahora, r1 u “ r1 pr2 `r3 ´ m3 nq “ r1 r2 ` r1 r3 ´ m3 r1 n “ s ` t ` pm1 ` m2 ´ m3 r1 qn “ pm4 ` m1 ` m2 ´ m3 r1 qn ` v, por lo tanto apb ` cq “ rr1 sn prr2 ` r3 sn q “ rr1 sn rusn “ rvsn “ rs ` tsn “ rr1 r2 sn ` rr1 r3 sn “ ab ` ac. ‚ El resultado siguiente se conoce como el teorema chino del residuo o como teorema chino del resto y fue utilizado en la antigüedad para hacer predicciones astronómicas. 4.7.33. Teorema chino del residuo. Supongamos que tenemos n números enteros positivos q1 , q2 , . . . , qn que son primos relativos entre si, además supongamos que tenemos enteros a1 , a2 , . . . , an . Existe un número x tal que para todo k P Jn se cumple que x ” ak pmód qk q y además, si algún otro número y satisface que y ” ak pmód qk q para todo k P Jn , entonces x ” y pmód q1 q2 ¨ ¨ ¨ qk q. Demostración. Si n “ 1, basta tomar x “ a1 . Además claramente, y ” a1 pmód q1 q ðñ x ” y pmód q1 q. 4.7. Aritmética 107 Para n “ 2 tenemos que, como q1 y q2 son primos relativos, entonces, por el corolario 10, existen enteros m0 y n0 tales que m0 q1 ` n0 q2 “ 1. Tomando m1 “ m0 pa2 ´ a1 q y n1 “ ´n0 pa2 ´ a1 q, tenemos que m1 q1 ´ n1 q2 “ a2 ´ a1 , de donde m1 q1 ` a1 “ n1 q2 ` a2 , por lo que al tomar x “ n1 q2 ` a2 , tenemos que x ” a1 pmód q1 q y x ” a2 pmód q2 q. Ahora, si y ” a1 pmód q1 q y y ” a2 pmód q2 q, entonces q1 | x ´ y y q2 | x ´ y, pero como q1 y q2 son primos relativos, entonces al dar la factorización de x ´ y, q1 y q2 , como la dada en el teorema fundamental de la aritmética, tenemos que los factores de q1 y q2 son también factores de x ´ y, y como q1 y q2 no tienen factores en común, entonces el producto de potencias de números primos de q1 q2 divide a x ´ y, es decir x ” y pmód q1 q2 q. Obsérvese además que todos los números de la forma x ` lq1 q2 son congruentes con x módulo q1 q2 , con a1 módulo q1 y con a2 módulo q2 . Supongamos ahora que para algún número natural m el resultado es válido cuando n “ m y además para todo entero l y todo k P Jn se tiene que x ` lq1 q2 ¨ ¨ ¨ qn es congruente con ak módulo qk y con x módulo q1 q2 ¨ ¨ ¨ qn . Demostremos que el resultado también es válido para n “ m ` 1. Si los números q1 , q2 , . . . , qm , qm`1 son primos relativos entre sí, también lo son los números q1 q2 ¨ ¨ ¨ qm y qm`1 , por lo que existe un número entero x tal que para todo entero l y todo k P Jm se tiene que x ` lq1 q2 ¨ ¨ ¨ qm es congruente con ak módulo qk y con x módulo q1 q2 ¨ ¨ ¨ qm , y además, usando el hecho de que el resultado es válido para n “ 2, x es congruente con am`1 módulo qm`1 . Ahora, si para todo k P t1, 2, . . . , m, m ` 1u se tiene que y ” ak pmód pk q, entonces x ” y pmód q1 q2 ¨ ¨ ¨ qm q, x ” y pmód qm`1 q, y por lo tanto también x ” y pmód q1 q2 ¨ ¨ ¨ qm qm`1 q. ‚ 108 4.7. Aritmética Capítulo 5 ÁLGEBRA DE NÚMEROS REALES 5.1. Radicales 5.1.1. Definición. Sea a un número real y n un entero positivo. Decimos que x es una raíz n-ésima de a si a “ xn . Haremos algunas observaciones usando el hecho de que si n es par, entonces n{2 es entero. Si n es un entero positivo par y x es una raíz n-ésima de a, entonces ´x también es una raíz n-ésima de a pues n p´xqn “ p´xq2p 2 q “ pp´xq2 qn{2 “ px2 qn{2 “ xn “ a. Si n es un entero positivo par y a es un número negativo, entonces no existe ningún número real que sea la raíz n-ésima de a pues xn “ px2 qn{2 , donde x2 ľ 0, por lo que px2 qn{2 ľ 0, es decir xn no es ningún número negativo a. Si n es un entero positivo impar y x es la raíz n-ésima de a ‰ 0, entonces x y a son de signos iguales, es decir ambos son positivos o ambos son negativos. Si n es un entero positivo, entonces la única raíz n-ésima de 0 es 0. 5.1.2. Notación. Si n es un entero positivo y a ľ 0, entonces a la raíz n-ésima no negativa ? ? n n se le llama radical). de a se le denotará por a. (Al símbolo ? ? Por ejemplo 2 9 “ 3, aunque ´3 también es una raíz cuadrada de 9; 3 8 “ 2. Observemos que si a ă 0 y n es un entero positivo impar, entonces la raíz n-ésima de a ? n es ´ ´a. 5.1.3. Leyes de los radicales. Si b, c ą 0 y si m, n P N, entonces ? ? ? n n I) bc “ b n c, c II) n ? n b b ? “ n , c c III) a ? ? m n b“ b. mn (Siempre que las raíces existan). ? ? ? ` ? ? ˘n ` ? ˘ n ? n Demostración. I) n b n c “ n b p n cq “ bc, por lo tanto n bc “ n b n c. ? b ´? ¯n n ? n n n bq p? b b b n b ? II) ? “ “ , por lo tanto “ n nc n c. p n cq c c 109 110 5.1. Radicales ´ a ? ¯mn ´´ a ? ¯m ¯n ` ? ˘n a ? ? m n m n m n III) b b “ n b “ b, por lo tanto mn b “ b. “ ? ? 5.1.4. Notación. El símbolo x significa 2 x. ? 5.1.5. Teorema. Si x es un número real, entonces x2 “ |x|. ‚ Demostración. El número x?2 tiene dos raíces ? cuadradas, a saber x y ´x (a menos que x “ 0, en cuyo caso |0| “ 0 “ 0). El símbolo x2 representa la raíz cuadrada no negativa de x2 , es decir # ? x, si x ľ 0 x2 “ ´x, si x ĺ 0, ? pero esta última igualdad es la definición del valor absoluto de x, por lo tanto x2 “ |x|. ‚ 5.2. Exponentes racionales 5.2. 111 Exponentes racionales 5.2.1. Definición. Si b ą 0 y n es un entero positivo, definimos ? n b1{n :“ b. En general tenemos la siguiente definición para exponentes racionales de números reales positivos. 5.2.2. Definición. Si m{n es un número racional donde n es un entero positivo, m un entero y además b ą 0, entonces definimos ´ ? ¯m n b . bm{n :“ Es posible verificar que con la definición anterior de exponentes racionales se siguen cumpliendo las leyes de los exponentes. En el capítulo 7 se demostrará que la definición anterior no depende de la forma en que se haya expresado el número racional m{n. Es decir, se de` ? ˘m ´ ?1 ¯m1 mostrará que si m, m1 ,n y n1 son enteros tales que m{n “ m1 {n1 , entonces n b “ n b . Ejercicios. En los ejercicios siguientes, la palabra «simplificar» significa sustituir la expresión dada por una en la que las literales (símbolos representados por letras) aparezcan a lo sumo una sola vez de ser posible y no tengan exponentes negativos ni radicales en los denominadores. 1. Demostrar que las leyes de los exponentes son verdaderas para los exponentes racionales, siempre que tengan sentido las expresiones dadas en las mismas, es decir ` ˘r r I) ar as “ ar`s , IV) ab “ abr , II) par qs “ ars , V) ar as “ ar´s , III) pabqr “ ar br , donde a, b P R y r, s P Q (siempre que las expresiones de ambos lados de la igualdad tengan sentido). 2. Sea x es un número real. Decir cuál es la diferencia entre las siguientes expresiones: a) x, b) |x|, ? 2 c) p xq . 3. Simplificar cada una de las expresiones siguientes (todas las positivos): ? ? ? 4 a) 49, b) b 256, c) 3 125, ? ? ? 1 1 e) ? f) , g) 5 20 ´ 45 ` 2 80, 3 , 7 2 b ? ? 2 j) 3 8a6 b´3 , k) 3 54a , i) 9x´4 y 6 , b2 b b a ? ? 3 4 5 4x m) 4 p3x5 y ´2 q4 , n) 5 8x , ñ) 6 32p4 y 5 z 3 6 2p2 yz 3 . y4 y2 letras denotan números ? 3 135, ? ? ? 4 h) 162 ` 4 32 ´ 4 2, b l) 3u13 b , d) 112 5.2. Exponentes racionales 4. Escribir las expresiones siguientes con exponentes fraccionarios y sin radicales: a ? ? a ? ? ? ? a) 4 x3 , b) 5 x6 , c) 3 a2 ` b2 , d) 3 pa ` bq2 , e) a ` b, f) x2 ` y 2 , g) 3 r3 ´ s3 . 5. Escribir las expresiones siguientes con radicales y sin exponentes fraccionarios: a) 4x3{2 , b) p4xq3{2 , c) 4 ` x3{2 , d) 8y 1{3 , e) p8yq1{3 , f) p8 ´ yq1{3 . 6. Simplificar las siguientes expresiones dadas: a) 163{2 , b) p0.027q´1{3 , e) y 1{6 p8y 1{3 q, ` 1 ˘1{2 , j) 4x f) p8w6 q2{3 , d) p2u5{2 qp6u1{2 q, ´ ´1{3 ¯6 g) p6x1{3 y 3{2 q2 , h) ww3{2 , k) a1{2 a1{3 a1{6 , l) c) p243q´2{5 , pa´1{5 b5{2 q10 , pa2{3 b´3{5 q15 m) s1{3 ps2{3 ´ s5{3 q. i) px´4 yq´1{2 , px2 y 3 q´1{3 5.3. Expresiones algebraicas 5.3. 113 Expresiones algebraicas Una expresión en donde aparezcan solamente algunas de las operaciones de suma, resta, multiplicación, división, potencia o raíces, y quizás algunas variables, se le llama expresión algebraica. Generalmente se dice que una expresión algebraica está simplificada cuando no aparecen exponentes negativos y en ningún denominador aparecen raíces o exponentes que no sean enteros. El término simplificar que significa hacer simple es muy subjetivo. Cuando se pida que se simplifique una expresión, además de las condiciones antes señaladas trataremos que aparezcan la menor cantidad posible de radicales y de operaciones en general, además de que la expresión sea lo más reducida posible. 114 5.4. 5.4. Notación científica Notación científica En las ciencias naturales es muy común expresar cantidades muy grande o muy pequeñas como múltiplos de potencias de 10. Generalmente, para no usar muchas cifras decimales o para tener una idea más clara del tamaño del número, los números o sus aproximaciones se expresan como un número mayor o igual a 1 y menor que 10, pero multiplicado por una potencia de 10, por ejemplo el número 455654643554354.3454001 se expresa como 4.556546435543543454001¨ 1014 , donde la potencia del 10 indica los espacios que se debe recorrer a la derecha el punto decimal si se quiere expresar en la notación acostumbrada. Ejercicios. 1. La masa de un átomo de hidrógeno es aproximadamente 0.000 000 000 000 000 000 000 0017 g. Exprésese este número en notación científica. 2. La masa de un electrón es aproximadamente 9.1 ¨ 10´31 kg. Exprésese este número en forma decimal. 5.5. Polinomios 5.5. 115 Polinomios 5.5.1. Definición. Sea f : R ÝÑ R, decimos que f es una función polinomial o función polinómica si existen números reales a0 , a1 , a2 , . . . , an tales que para todo x P R f pxq “ a0 ` a1 x ` a2 x2 ` ¨ ¨ ¨ ` an xn , es decir f pxq “ a0 ` n ÿ ak x k . k“1 Si f es una función polinomial, entonces a una expresión de la forma f pxq se le llama polinomio en x, es decir un polinomio en x es una expresión de la forma a0 ` a1 x ` a2 x 2 ` ¨ ¨ ¨ ` an x n . A los números a0 , a1 , a2 , ¨ ¨ ¨ , an se les llama coeficientes del polinomio. Si an ‰ 0, decimos que el polinomio es de grado n, en cuyo caso decimos que an es el coeficiente principal del polinomio. Al símbolo ak xk se le llama término de grado k del polinomio y al coeficiente ak se le llama coeficiente de grado k del polinomio f pxq. Observemos que el número cero es un polinomio que no tiene coeficiente principal, pues todos los coeficientes son cero. Convendremos en que el polinomio cero tiene grado ´8 (menos infinito). Los números constantes diferentes de cero son polinomios de grado cero. 5.5.2. Definición. A una expresión de la forma a0 ` a1 x ` a2 x2 ` ¨ ¨ ¨ ` an xn también se le llama polinomio con una variable. Cuando f : R2 ÝÑ R sea una función tal que para cada x P R la función y ÞÑ f px, yq es una función polinomial cuyos coeficientes son polinomios en x, entonces diremos que f es una función polinomial de dos variables y a la expresión f px, yq se le llama polinomio con dos variables. De manera más general, si n es un entero positivo y f : Rn`1 ÝÑ R es una función tal que para cada x1 P R la función px2 , . . . , xn`1 q ÞÑ f px1 , x2 , . . . , xn , xn`1 q es una función polinomial de grado n cuyos coeficientes son polinomios en x1 ; entonces decimos que f es una función polinomial de n ` 1 variables y a la expresión f px1 , x2 , . . . , xn , xn`1 ) se le llama polinomio con n ` 1 variables. 5.5.3. Ejemplo. La expresión 3x ` 6x2 4x5 es un polinomio con una variable. 5.5.4. Ejemplo. La expresión 6x2 ` p5x3 ` 1qy 5 ` 2xy 7 es un polinomio con dos variables. 5.5.5. Ejemplo. La expresión 7xy ` xy 2 zz 2 es un polinomio con tres variables. Ejercicios. Efectuar las operaciones indicadas y expresar el resultado en forma de polinomio: a) p4x3 ` 2x2 x ` 5q ` px3 3x2 5x ` 1q, b) px4 3x2 ` 7x ` 4q ` px3 ` 3x2 4x3 q, c) p5y 3 6y 2 ` y7qp5y 3 ` 6y 2 ` y ` 2q, d) p3u ` 1qp2u3 q ` 6upu ` 5q, e) ps ` tqps2 st ` t2 q, f) pr2 ` 2r ` 3qp3r2 2r ` 4q, g) p3x ` 1qp2x2 x ` 2qpx2 ` 4q, h) i) 3u3 v 4 w´2u5 v 2 w`pu2 v 2 q2 w2 . u3 v 2 w 8x2 y 3 ´10x3 y , 2x2 y 116 5.6. 5.6. Productos notables Productos notables Se dejará al lector el demostrar la validez de las siguientes fórmulas que son en general consecuencia de la propiedad distributiva, tales fórmulas se llaman productos notables. I) px ` yqpx ´ yq “ x2 ´ y 2 ; II) pax ` bqpcx ` dq “ acx2 ` pad ` bcqx ` bd; III) px ` yq2 “ x2 ` 2xy ` y 2 ; IV) px ´ yq2 “ x2 ´ 2xy ` y 2 ; V) px ` yq3 “ x3 ` 3x2 y ` 3xy 2 ` y 3 ; VI) px ´ yq3 “ x3 ´ 3x2 y ` 3xy 2 ´ y 3 ; VII) px ´ yqpxn ` xn´1 y ` ¨ ¨ ¨ ` xy n´1 ` y n q “ xn`1 ´ y n`1 . Ejercicios. 1. Utilizar los productos notables para escribir las expresiones siguientes en forma de polinomios: a) px ´ 3qp2x ` 1q, d) `p6t ´ 5vqp6t ` 5vq,? ˘ ? ˘ `? ? a` b a´ b , g) 2 3 j) pu ´ 3vq , m) px ` y ` zqpx ` y ´ zq, o) px2 ` y 2 ` z 2 q2 . b) p3x ` 2qp3x ´ 5q, c) p2s ´ 7tqp4s ´ 5tq, 2 e) p8u ` 3q , f) p10p2 ´ 7q 2 q2 , 3 h) p3r ` 4sq , i) px2 ` y 2 q3 , k) pa1{3 ´ b1{3 q3 , l) pa ` bq2 pa ´ bq2 , n) p2a ´ b ` 3cqp2a ´ b ´ 3cq, ñ) p3x ` 2y ` zq2 , 5.7. Factorización 5.7. 117 Factorización 5.7.1. Definición. Cuando un polinomio se escribe como producto de otros polinomios, a cada uno de los polinomios que se multiplican se le llama factor del polinomio resultante. Al hecho de expresar un polinomio como producto de sus factores se le llama factorización. Por ejemplo el expresar el polinomio 5x2 ` 11x ` 2 como p5x ` 1qpx ` 2q se le llama factorización de 5x2 ` 11x ` 2 y los polinomios 5x ` 1 y x ` 2 son los factores de 5x2 ` 11x ` 2. La factorización sirve en algunas ocasiones para simplificar algunas expresiones algebraicas, por ejemplo p5x ` 1qpx ` 2q x`2 5x2 ` 11x ` 2 “ “ 2 10x ´ 3x ´ 1 p5x ` 1qp2x ´ 1q 2x ´ 1 1 px ‰ ´ , 5 1 x ‰ q. 2 Mientras no se especifique lo contrario, entenderemos por factorizar un polinomio con coeficientes enteros el expresarlo como producto de polinomios con coeficientes enteros. Por ejemplo el polinomio 10x2 ´ 3x ´ 1 puede expresarse como p10x ` 2qpx ´ 12 q, pero uno de los polinomios, a saber px ´ 12 q no tiene todos sus coeficientes enteros por lo que la factorización correcta de acuerdo al criterio anterior será p5x ` yqp2x ´ 1q. 5.7.2. Definición. Un polinomio con coeficientes enteros P pxq se dice que es primo o irreducible si sus únicos factores son P pxq, ´P pxq, 1 y ´1. Si un polinomio tiene coeficientes racionales o reales (pero no todos enteros), entenderemos, mientras no se diga otra cosa, por factorización al expresarlo como producto de polinomios con coeficientes racionales o reales según sea el caso. 5.7.3. Definición. Un polinomio P pxq con coeficientes racionales o reales se dice que es primo o irreducible si sus únicos factores son de la forma a ó bP pxq donde a y b son números racionales o reales, según sea el caso. 5.7.4. Definición. Entenderemos por factorizar completamente un polinomio al hecho de expresarlo como producto de polinomios irreducibles. 118 5.8. Factorización de expresiones especiales 5.8. Factorización de expresiones especiales De los productos notables y de la propiedad distributiva podemos ver algunas reglas para factorizar Suma con factor común: ax ` ay “ apx ` yq. Diferencia de cuadrados: x2 ´ y 2 “ px ` yqpx ´ yq. Trinomio cuadrado perfecto: x2 ` 2xy ` y 2 “ px ` yq2 , x2 ´ 2xy ` y 2 “ px ´ yq2 . Suma y diferencia de cubos: x3 ` y 3 “ px ` yqpx2 ´ xy ` y 2 q, x3 ´ y 3 “ px ´ yqpx2 ` xy ` y 2 q. Cuando tengamos un polinomio de segundo grado con coeficientes enteros y con coeficiente principal 1 de la forma x2 ` Bx ` C para factorizarlo, si es posible, debemos hallar enteros a y b tales que ab “ C a ` b “ B, y de tal suerte que x2 ` Bx ` C “ px ` aqpx ` bq. Ahora cuando el polinomio de segundo grado con coeficientes enteros no tiene coeficiente principal 1 su factorización puede tornarse más laboriosa. Es decir si Ax2 ` Bx ` C es un polinomio en x, donde A, B y C son enteros, la factorización del polinomio cuando sea posible será de la forma Ax2 ` Bx ` C “ pax ` bqpcx ` dq, donde bd “ C, ac “ A y ad ` bc “ B. Es decir hay que encontrar enteros a, b, c y d con la propiedad anterior. Ejercicios. Factorizar cada uno de los polinomios siguientes: a) 4u2 ´ 2uv, b) 10xy ` 15xy 2 , c) ´8p4 qr2 ´ 4p3 q 3 r2 , d) 6x2 ` x ´ 5, e) 12m2 ´ 17m4 , f) 4x2 ` 12x ` 9, 2 2 2 g) 20y ´ 41y ` 20, h) 36a ´ 49b , i) 45x2 ` 38xy ` 8y 4 , j) 25p2 16v 4 , k) 64y 2 ` 113y ` 49, l) x3 ` 8y 3 , m) 8r3 ´ 27s3 , n) 216 ´ y 3 , ñ) 8r3 ´ 27s3 , 4 2 o) 18ck ` 4dk ` 9cj ` 2dj, p) 6w ` 17w ` 12, q) x8 ´ 16, r) a2 ` a ` 1, s) 16x2 ` 40x ´ 24, t) 60x2 ´ 85x ` 30, 2 2 u) 64x ´ 16, v) 18x ´ 50, w) 2x2 y ` xy ´ 2xz ´ z, x) 12x2 z ` 8y 2 z ´ 15x2 w ´ 10y 2 w, y) 8c6 ´ 19c3 ´ 27, z) pa ` bq4 ´ 1, α) 4x3 ` 4x2 ` x, β) x16 ` 1. 5.9. Simplificación de expresiones fraccionarias por factorización 5.9. 119 Simplificación de expresiones fraccionarias por factorización 5.9.1. Definición. Una expresión fraccionaria es el cociente de dos expresiones algebraicas. Observemos que una expresión fraccionaria es también una expresión algebraica. Si tenemos dos expresiones algebraicas P pxq y Qpxq con un factor común Apxq, es decir P pxq es de la forma ApxqBpxq y Qpxq es de la forma ApxqCpxq, entonces la expresión fraccionaria ApxqBpxq P pxq “ Qpxq ApxqCpxq puede simplificarse como Bpxq Cpxq pdonde Apxq ‰ 0q. Ejercicios. Simplificar cada una de las siguientes expresiones fraccionarias: 10x2 ` 29x ´ 21 a) , 5x2 ´ 23x ` 12 16x4 ` 8x3 ` x2 d) 3 , 4x ` 25x2 ` 6x g) a2 `4a`3 3a2 `a´2 ¨ 3a2 ´2a , 2a2 `13a`21 6 t ` 5 1 ´ 2t2 ` 3 ` , 3t t t4 p4 ` 3p3 ´ 8p ´ 24 m) 3 , p ´ 2p2 ´ 9p ` 18 ? x3 2x 1 ´ x2 ´ ?1´x 2 , o) 2 1´x 4x2 ´ 4x r) 2 . px ´ 1qp2x2 ` 8q j) b) e) h) k) n) p) 4z 2 ` 12z ` 9 6y ´ 5y 2 , c) , 2z 2 ` 3z 25y 2 ´ 36 3s 6 3u ` 2 4u ` 1 ´ , f) ` , 2 s ` 1 2s ´ 1 u´4 5u ` 2 x3 ´ 8 x 4 x ˜ 3 , i) p5x´2q 2 ` 5x´2 , 2 x ´4 x `8 8 3 7x 5 1 ` ` 2 , l) x2 ` x72 ` 2x´3 ` p2x´3q 2, x 2x ´ 4 x ´ 4 ` 7 ˘ px ` hq´2 ´ x´2 7 ´ 5x´2 ˜ h, ñ) , 5x`5h´2 h 3s3 ´ 18s4 ` 27s5 , s ´ 3s2 q) p3x2 `xq`p6x`2q , x`2 120 5.10. Teorema del binomio 5.10. Teorema del binomio 5.10.1. Teorema del binomio. Sean x e y números reales diferentes de cero y n un entero no negativo. n ˆ ˙ ÿ n n´k k n px ` yq “ x y . k k“0 n ` ˘ ř n Demostración. Si n “ 0, entonces px ` yqn “ px ` yq0 “ 1; por otra parte xn´k y k “ k k“0 n ` ˘ `0˘ 0´0 0 ř n n x y “ 1 ¨ 1 ¨ 1 “ 1, es decir px ` yq “ xn´k y k cuando n “ 0. Si n “ 1, entonces 0 k k“0 n ` ˘ ř n 1 ` ˘ `1˘ `1˘ ř 1 n´k k 1´k k px`yqn “ px`yq1 “ x`y y por otra parte x y “ x y “ x` 1 y “ x`y, k k 0 k“0 k“0 n ` ˘ ř n es decir px ` yqn “ xn´k y k cuando n “ 1. k k“0 Supongamos que para un entero positivo N se cumple la fórmula N ˆ ˙ ÿ N N ´k k N px ` yq “ x y . k k“0 Entonces px ` yq N `1 “ px ` yq N ˆ ˙ ÿ N xN ´k y k k k“0 ˙ ˆ N ˆ ˙ N ÿ N N `1´k k ÿ N N ´k k`1 x y ` x y “ k k k“0 k“0 N ˆ ˙ N ˆ ˙ ÿ N N `1´k k ÿ N pN `1q´pk`1q k`1 “ x y ` x y k k k“0 k“0 ˙ N ˆ ˙ `1 ˆ ÿ N N `1´k k Nÿ N “ x y ` xN `1´k y k k k ´ 1 k“0 k“1 ˆ ˙ ˆ ˙˙ ˆ ˙ N ˆˆ ˙ ÿ N N `1 0 N N N 0 N `1 N `1´k k “ x y ` ` x y ` xy 0 k k´1 N k“1 ˆ ˙ ˙ ˆ ˙ N ˆ N ` 1 N `1 0 ÿ N ` 1 N `1´k k N ` 1 0 N `1 “ x y ` x y ` xy 0 k N `1 k“1 ˙ N `1 ˆ ÿ N ` 1 N `1´k k “ x y . k k“0 ‚ `n˘ 5.10.2. Definición. Debido al teorema del binomio, al número k también se le llama coeficiente binomial de n en k y representa el coeficiente del k ` 1-ésimo término en el desarrollo binomial de px ` yqn . Debido a las identidades` para (o coeficien˘ las`combinaciones ˘ ` n ˘ n`1 n tes binomiales), principalmente debido a la identidad k`1 “ k ` k`1 , los coeficientes 5.10. Teorema del binomio 121 binomiales están dados mediante la siguiente tabla llamada triángulo de Pascal, donde todas las componentes de la primera columna, que está identificada con el 0 son iguales a 1, todas las elementos del primer renglón, que también está identificado con el 0, que no están en la primera columna son 0, además de que cada componente que no está ni en el primer renglón ni en la primera columna es igual a la componente inmediata superior de la misma columna más la componente inmediata superior de la columna de la izquierda. n 0 1 2 3 4 5 6 7 .. . `kn˘ 0 1 2 3 4 5 6 7 8 ¨¨¨ 1 1 1 1 1 1 1 1 .. . 0 1 2 3 4 5 6 7 .. . 0 0 1 3 6 10 15 21 .. . 0 0 0 1 4 10 20 35 .. . 0 0 0 0 1 5 15 35 .. . 0 0 0 0 0 1 6 21 .. . 0 0 0 0 0 0 1 7 .. . 0 0 0 0 0 0 0 1 .. . 0 0 0 0 0 0 0 0 .. . k ¨¨¨ ¨¨¨ ¨¨¨ ¨¨¨ ¨¨¨ ¨¨¨ ¨¨¨ ¨¨¨ El corolario 3.8.33 también se puede demostrar usando el teorema del binomio. A continuación lo demostraremos, pero lo identificaremos como teorema 5.10.3. 5.10.3. Teorema. Si A es un conjunto con n elementos, entonces A tiene 2n subconjuntos diferentes. Es decir #ppAq “ 2n . Demostración. Sea Ck “ tD Ă A : #D “ ku. Tenemos por el teorema 3.8.7 que #ppAq “ n n ř Ť #Ck , ahora, por el teorema del binomio y el teorema 3.8.20, tenemos que Ck “ # k“0 k“0 n n ` ˘ n ` ˘ ř ř ř n n n´k k #Ck “ “ 1 1 “ p1 ` 1qn “ 2n . ‚ k k k“0 k“0 k“0 122 5.10. Teorema del binomio Capítulo 6 ECUACIONES Y DESIGUALDADES 6.1. Introducción 6.1.1. Definición. Sea p un predicado. Si la proposición ppxq se expresa mediante una fórmula donde aparezca el símbolo «“», entonces la proposición se llama ecuación. Por ejemplo x`1 2x ` 1 “ 0, 5x2 ` 2 “ 8x, “3 x´1 son ecuaciones. Si ppxq es una ecuación, a cualquier valor x que haga que ppxq sea verdadera se le llama solución o raíz de las ecuación ppxq. Es decir si ppaq es verdadera, entonces a es solución de la ecuación ppxq, también decimos que a satisface la ecuación ppxq. Entenderemos por resolver una ecuación al hecho de hallar todas las soluciones de la ecuación. Si una ecuación ppxq es verdadera para cualquier valor de x en el dominio del predicado p, entonces decimos que ppxq es una identidad. Por ejemplo las siguientes son identidades: 1 1 “ , x2 ´ 25 px ` 5qpx ´ 5q psen xq2 ` pcos xq2 “ 1, px ` 2q2 “ x2 ` 4x ` 4. 6.1.2. Definición. Por otra parte, una desigualdad ppxq es una proposición expresada mediante una fórmula donde aparezca alguno de los símbolos «ă», «ĺ», «ą» ó «ľ». El conjunto de todos los valores de x que hagan que la desigualdad ppxq sea verdadera se llama conjunto solución de la desigualdad. Por resolver una desigualdad entenderemos hallar su conjunto solución. 123 124 6.2. Ecuaciones lineales 6.2. Ecuaciones lineales 6.2.1. Definición. Una ecuación equivalente a una de la forma ax ` b “ 0 donde a y b son números constantes y a ‰ 0 se llama ecuación lineal (con una variable). Para resolver la ecuación lineal restemos b en ambos lados y dividamos entre a (lo cual es válido pues a ‰ 0), para obtener ax ` b “ 0 ðñ ax “ ´b b ðñ x “ ´ , a lo cual indica que ´ ab es la única solución de la ecuación ax`b “ 0, es decir hemos demostrado el siguiente teorema. 6.2.2. Teorema. Si a ‰ 0, la ecuación ax ` b “ 0 tiene como única solución a b x“´ . a Ejercicios. 1. Resolver las ecuaciones siguientes: ? 3x ´ 2 “ 0, a) 3x ` 16 “ 0, b) d) 2p9z ` 2q ´ 5pz ´ 8q “ 0, e) 34 u ´ 1 “ 2 ` 15 u, g) 18´5p 3p`2 “ 73 , h) 6 5v´2 “ 9 , 7v`3 c) 8x ´ 5 “ 6x ` 4, f) 3r`2 8 “1´ r , 12 i) px ´ 1q3 “ px ` 1q3 ´ 6x2 . 2. Determinar si los pares de ecuaciones dadas en cada inciso son equivalentes. ? a) x2 “ 4, x “ 2; b) x “ 4, x “ 2; c) 2x “ 4, x “ 2. 6.3. Ecuaciones cuadráticas 6.3. 125 Ecuaciones cuadráticas 6.3.1. Definición. Una ecuación cuadrática o de segundo grado es una ecuación equivalente a una de la forma ax2 ` bx ` c “ 0, donde a, b y c son números reales y a ‰ 0. Hay varias formas para resolver una ecuación cuadrática, una es factorizar cuando sea posible el polinomio ax2 ` bx ` c, de tal manera que quede expresado como producto de dos polinomios de primer grado. Para que la ecuación sea verdadera alguno de los dos factores deben ser cero, por ejemplo para la ecuación 5x2 ´ 20x ´ 25 “ 0, al factorizar obtenemos la ecuación equivalente 5px ´ 5qpx ` 1q “ 0, pero para que se de la igualdad es necesario y suficiente que x´5“0 ó x ` 1 “ 0, es decir x“5 ó x “ ´1. Así, las únicas soluciones de la ecuación 5x2 ´ 20x ´ 25 “ 0 son 5 y ´1. El método anterior para resolver ecuaciones cuadráticas se llama método de factorización. A veces el factorizar un polinomio de segundo grado no es fácil por lo que se tiene que recurrir a otros métodos. Por ejemplo en la ecuación x2 ´ 6 “ 0, ¿cómo podemos factorizar x2 ´ 6? En lugar de responder a esta pregunta despejemos x2 para obtener x2 “ 6, ? ? es decir las soluciones de x2 ´ 6 “ 0 son las dos raíces cuadradas de 6, es decir 6 y ´ 6. En el caso anterior fue fácil despejar x2 de tal manera que quedara igual a una constante que no dependiera de x, esto no siempre sucede, por ejemplo x2 ` 4x ´ 20 “ 0. 126 6.3. Ecuaciones cuadráticas En este caso en lugar de despejar x2 haremos lo que se llama completar el trinomio cuadrado perfecto. Concentrémonos por el momento en la parte x2 `4x que no tiene términos constantes y hallemos un número c tal que x2 ` 4x ` c2 “ px ` cq2 . Ahora, como px ` cq2 “ x2 ` 2xc ` c2 , tenemos que 2xc “ 4x y el único número c que satisface la última igualdad para cualquier valor de x es c “ 2, de donde volviendo a la ecuación original vemos que es equivalente con px2 ` 4x ` 4q ´ 20 “ 4, es decir con px ` 2q2 “ 24, por lo tanto x ` 2 “ ? ? 24 ó x ` 2 “ ´ 24 lo cual equivale a ? 24 ó x “ ´2 ´ ? x “ ´2 ` 2 6 ó ? x “ ´2 ´ 2 6 x “ ´2 ` ? 24 y simplificando obtenemos El anterior método usado para resolver ecuaciones de segundo grado es el método de completar el cuadrado o completar el trinomio cuadrado perfecto. Algunas ecuaciones de segundo grado no tienen solución, por ejemplo la ecuación x2 `25 “ 0 es equivalente a x2 “ ´25, pero no existe ningún número real que al elevarlo al cuadrado obtengamos un número negativo, en particular no existe ningún número real que al elevarlo al cuadrado obtengamos ´25. Por lo tanto x2 “ ´25 no tiene solución por lo que tampoco la tiene la ecuación equivalente x2 ` 25 “ 0. Deduzcamos ahora un método general para resolver ecuaciones cuadráticas. Tal método viene dado en el siguiente teorema. 6.3.2. Fórmula general para la ecuación cuadrática. Si a ‰ 0, entonces las raíces de la ecuación ax2 ` bx ` c “ 0, si existen, son ´b ` ? b2 ´ 4ac 2a y ´b ´ ? b2 ´ 4ac . 2a Demostración. El resultado lo demostraremos poniendo una serie de proposiciones equi- 6.3. Ecuaciones cuadráticas 127 valentes a la ecuación ax2 ` bx ` c “ 0. ax2 ` bx ` c “ 0 b c ðñ x2 ` x ` “ 0 a ˜ a ˆ ˙2 ¸ ˆ ˙2 c b b b 2 ` “ ðñ x ` x ` a 2a a 2a ˆ ˙2 ˆ ˙2 b b c ðñ x ` “ ´ 2a 2a a ˆ ˙2 b b2 ´ 4ac ðñ x ` “ 2a 4a2 c c b2 ´ 4ac b2 ´ 4ac b b ðñ x ` “ ó x ` “ ´ 2a 4a2 2a 4a2 ðñ ? ? b b2 ´ 4ac b b2 ´ 4ac x` “ ó x` “ . 2a 2|a| 2a ´2|a| p1q Ahora, si a ą 0, entonces 2|a| “ 2a y ´2|a| “ ´2a, y si a ă 0, entonces 2|a| “ ´2a y ´2|a| “ 2a, en ambos casos (1) es equivalente a ? ? b b b2 ´ 4ac b2 ´ 4ac “ ó x` “ , x` 2a 2a 2a ´2a es decir ? b2 ´ 4ac x“ 2a con lo que queda demostrado el teorema. ´b ` ó x“ ´b ´ ? b2 ´ 4ac , 2a ‚ Observemos que si b2 ´ 4ac ă 0, entonces la ecuación ax2 ` bx ` c “ 0 no tiene raíces reales; si b2 ´ 4ac ą 0, entonces tiene dos raíces diferentes, y si b2 ´ 4ac “ 0, entonces tiene una única raíz. Por ese motivo al valor b2 ´4ac se le llama el discriminante de la ecuación. El discriminante de una ecuación cuadrática nos permite distinguir si la ecuación tiene dos soluciones, una o ninguna. Ejercicios. 1. Resolver las siguientes ecuaciones por el método de factorización. a) x2 ´ 3x ´ 10 “ 0. b) x2 ´ 9 “ 0. c) 6x2 ´ 5x ` 1 “ 0. d) 5x3 ` 3x2 ` 5x ` 3 “ 0. e) y 4 ´ 9 “ 0. f) 3x3 ´ 3x2 ´ 12x ` 12 “ 0. 128 6.4. 6.4. Otras ecuaciones Otras ecuaciones Algunas veces la factorización y otras manipulaciones algebraicas puede servir para resolver algunos tipos de ecuaciones diferentes de las cuadráticas, como vemos en los siguientes ejemplos. 6.4.1. Ejemplo. Resolver 2x4 ´ 2x2 “ 0. Solución. Al factorizar el lado izquierdo de la ecuación, obtenemos la ecuación equivalente 2x2 px2 ´ 1q “ 0, la cual se satisface si y sólo si x2 “ 0 ó x2 “ 1, es decir si x “ 0, x “ 1 ó x “ ´1. 6.4.2. Ejemplo. Resolver x1{2 “ x3 . Solución. x1{2 “ x3 ðñ x3 ´ x1{2 “ 0 ðñ x1{2 px5{2 ´ 1q “ 0 ðñ x1{2 “ 0 ó x5{2 “ 1 ðñ x “ 0 ó x “ 1. Por lo tanto, el conjunto solución de la ecuación x1{2 “ x3 es t1, 0u. 6.4.3. Ejemplo. Resolver x6 ` x3 ´ 1 “ 0. Solución. Hagamos un cambio de variable definiendo u “ x3 , de tal manera que la ecuación adquiera la forma u2 ` u ´ 1 “ 0. Resolviendo para u tenemos que u “ ˆ x“´ 6.4.4. Ejemplo. Resolver ? ´1´ 5 2 ? ˙1{3 1` 5 2 1 x3 “ óu“ ? ´1` 5 . 2 ˆ x“ ó Así, ´1 ` 2 ? ˙1{3 5 . 1 . x2 3 3 Solución. Observemos que x13 “ x12 ùñ xx3 “ xx2 ùñ x “ 1. Observemos que x “ 1 satisface la ecuación x13 “ x12 y además es la única solución. ? 6.4.5. Ejemplo. Resolver 7 ´ 5x “ 8. `? ˘2 ? Solución. 7 ´ 5x “ 8 ðñ 7 ´ 5x “ 82 ùñ 7 ´ 5x ? “ 64 ùñ 5x “ ´57 ùñ x “ ´57{5. Observemos que x “ ´57{5 es la única solución de 7 ´ 5x “ 8. ? ? 6.4.6. Ejemplo. Resolver 2x ` 3 “ 2x ´ 3. ? ? Solución. Tenemos que 2x ` 3 “ ? 2x ´ 3 ùñ ? 2x ` 3 “ 2x ´ 3 ùñ 3 “ ´3. Pero 3 “ ´3 es una proposición falsa, por lo tanto 2x ` 3 “ 2x ´ 3 es falso para todo valor de x, es decir, la ecuación no tiene solución. ? ? 6.4.7. Ejemplo. Resolver x ´ 3 ´ x ` 7 ` 1 “ 0. 6.4. Otras ecuaciones 129 Solución. Tenemos que ? ? x´3´ x`7`1“0 ? ? ùñ x ´ 3 “ ´1 ` x ` 7 ? ùñ x ´ 3 “ 1 ´ 2 x ` 7 ` x ` 7 ? ùñ 2 x ` 7 “ 11 121 ùñ x ` 7 “ 4 93 ùñ x “ . 4 Así tenemos que la única posible solución de la ecuación ? ? x´3´ x`7`1“0 , pero como podemos ver, 93 satisface la ecuación, por lo tanto la ecuación tiene sería x “ 93 4 4 como única solución a x “ 93 . 4 ? ? 6.4.8. Ejemplo. Resolver 2x ´ 10 “ x ´ 8. ? ? Solución. Tenemos que 2x ´ 10 “ x ´ 8 ùñ 2x ´ 10 “ x ´ 8 ùñ x “ 2. Pero 2 no es solución de la ecuación debido a que no está definida la raíz cuadrada de ´6. 130 6.5. 6.5. Resolución de desigualdades Resolución de desigualdades Conviene que antes de seguir con el estudio de resolución de desigualdades el lector recuerde sus propiedades fundamentales dadas en la sección de desigualdades 4.3. Daremos a continuación las definiciones y simbologías que usaremos de los diferentes tipos de intervalos. 6.5.1. Definición. Si a ă b, definimos el intervalo abierto acotado pa; bq como el conjunto de todos los números reales que están entre a y b, es decir pa; bq :“ tx : a ă x ă bu. Por ejemplo el intervalo p´2; 1q es el conjunto de todos los números reales que están entre ´2 y 1. El intervalo p´2; 1q se representa en la recta así. c ´6 ´5 ´4 ´3 ´2 c ´1 0 1 - 2 3 4 5 6.5.2. Definición. Si a ă b, definimos el intervalo cerrado acotado ra; bs como el conjunto cuyos elementos son a, b y todos los números reales que están entre a y b, es decir ra; bs :“ tx : a ĺ x ĺ bu. Por ejemplo el intervalo r1; 5s es el conjunto de los números reales que son mayores o iguales que 1 y menores o iguales que 5. El intervalo [1; 5] se representa en la recta así. s ´6 ´5 ´4 ´3 ´2 ´1 0 1 s 2 3 4 - 5 6.5.3. Definición. Un intervalo semiabierto o semicerrado es un intervalo de la forma pa; bs ó ra; bq, donde pa; bs :“ tx : a ă x ĺ bu y ra; bq :“ tx : a ĺ x ă bu. El intervalo pa; bs se dice también que es abierto por la izquierda y cerrado por la derecha, mientras que el intervalo ra; bq se dice que es cerrado por la izquierda y abierto por la derecha. Por ejemplo el intervalo r´5; 4q es el conjunto de números reales que son mayores o iguales que ´5 y menores que 4. el cual se representa en la recta así. ´6 s ´5 c ´4 ´3 ´2 ´1 0 1 2 3 4 - 5 Por otra parte, el intervalo p´6; ´2s abierto por la izquierda y cerrado por la derecha se representa en la recta así. 6.5. Resolución de desigualdades c 131 s ´6 ´5 ´4 ´3 ´2 - ´1 0 1 2 3 4 5 Presentaremos a continuación los intervalos no acotados. 6.5.4. Definición. Si a P R, definimos el intervalo abierto no acotado por la derecha pa; `8q y el intervalo abierto no acotado por la izquierda p´8; aq respectivamente como pa; `8q :“ tx : x ą au y p´8; aq :“ tx : x ă au. Por ejemplo el intervalo p´5; `8q “ tx : x ą ´5u se representa gráficamente en la recta numérica así, c ´6 ´5 - ´4 ´3 ´2 ´1 0 1 2 3 4 5 mientras que el intervalo p´8; 1q “ tx : x ă 1u se representa en la recta numérica así. c ´6 ´5 ´4 ´3 ´2 ´1 0 1 - 2 3 4 5 6.5.5. Definición. Si a P R, los intervalos cerrados no acotados ra; `8q y p´8; as se definen respectivamente como ra; `8q :“ tx : x ľ au y p´8; as :“ tx : x ĺ au, y se representan gráficamente como s - a y s - a respectivamente. 6.5.6. Definición. Si a ă b, los siguientes tipos de intervalos son acotados por la izquierda pa; bq, pa; bs, ra; bq, ra; bs, pa; `8q y ra; `8q 132 6.5. Resolución de desigualdades mientras que los de la forma pa; bq, pa; bs, ra; bq, ra; bs, p´8; bs y p´8; bq son acotados por la derecha. Un intervalo es acotado si es acotado por la izquierda y por la derecha. Si a P R , el símbolo ra; as denotará al conjunto tau que tiene solamente un elemento y se le considerará como un intervalo cerrado y acotado, mientras que si b ă a, los símbolo ra; bs, pa; bs, ra; bq, pa; bq, pa; as, ra; aq y pa; aq denotarán al conjunto vacío ∅, el cual también se le considera intervalo acotado. Finalmente definimos p´8; `8q como el conjunto de todos los números reales, es decir p´8; `8q :“ R, el cual es un intervalo no acotado (no es acotado ni por la izquierda ni por la derecha). Generalmente se pide, cuando sea posible, que el conjunto solución de una desigualdad se exprese como un intervalo o como la unión de intervalos disjuntos. Por ejemplo la desigualdad 8 ĺ 6x ` 5 ă 9 6.5.7. es equivalente a 3 ĺ 6x ă 4, que a su vez es equivalente a 1{2 ĺ x ă 2{3, es decir el conjunto solución de 6.5.7 es r 21 ; 32 q cuya representación en la recta está dada por 0 1 6 1 3 s 1 2 c 2 3 5 6 1 7 6 4 3 3 2 5 3 11 6 - Es muy importante recordar que si en ambos lados de una desigualdad multiplicamos o dividimos por un número negativo, para que la desigualdad resultante sea equivalente con la primera es necesario que se altere el sentido de la desigualdad, por ejemplo ´ 1 ă 8 ´ 3x ă 2 ðñ ´1 ´ 8 ă ´3x ă 2 ´ 8 ´3x ´6 ´9 ą ą ðñ ´9 ă ´3x ă ´6 ðñ ´3 ´3 ´3 ðñ 3 ą x ą 2 ðñ 2 ă x ă 3, Obsérvese que al dividir entre ´3 cambió el sentido de la desigualdad. 6.5.8. Ejemplo. Las temperaturas en las escalas Fahrenheit y centígrados están relacionadas por la ecuación 5 C “ pF ´ 32q 9 donde C es la temperatura en grados centígrados y F en grados Fahrenheit. ¿Qué temperaturas en grados Fahrenheit corresponde a las temperaturas entre ´5 y 5 grados centígrados inclusive? Solución. 5 ´ 5 ĺ C ĺ 5 ðñ ´5 ĺ pF ´ 32q ĺ 5 9 ðñ ´9 ĺ F ´ 32 ĺ 9 ðñ ´9 ` 32 ĺ F ĺ 9 ` 32 ðñ ´23 ĺ F ĺ 41, 6.5. Resolución de desigualdades 133 es decir si la temperatura en grados centígrados está entre ´5 y 5, la temperatura en grados Fahrenheit está entre ´23 y 41. 6.5.9. Ejemplo. Resolver la desigualdad 1 1 x ´ 4 ă x ´ 6. 3 4 Solución. Tratemos de despejar x. Restemos primero 14 x en ambos lados ˆ ˙ 1 1 ´ x ´ 4 ă ´6, 3 4 es decir 1 x ´ 4 ă ´6, 12 ahora sumemos 4 1 x ă ´6 ` 4, 12 es decir 1 x ă ´2, 12 multiplicando por 12 obtenemos x ă ´24. Así el conjunto solución de 31 x ´ 4 ă 14 x ´ 6 es p´8; ´24q, cuya representación gráfica está dada en la siguiente figura. c ´30 ´28 ´26 ´24 - ´22 ´20 6.5.10. Ejemplo. Para resolver la desigualdad 10 ĺ x ´ 5 ă 8, vemos que es equivalente a 15 ĺ x ă 13, pero no existe ningún número que sea mayor o igual que 15 y menor que 13, por lo que el conjunto solución de 10 ĺ x ´ 5 ă 8 es ∅. De hecho desde el principio pudimos haber observado que es imposible que 10 ĺ x ´ 5 ă 8 puesto que 10 no es menor que 8. 6.5.11. Ejemplo. Resolver 1 x`1 ĺ 1. Solución. En este tipo de desigualdades debemos tener mucho cuidado con la forma de proceder. Un error muy común es proceder de la siguiente manera 1 ĺ 1, x`1 134 6.5. Resolución de desigualdades multiplicando por x ` 1 1 ĺ x ` 1, despejando x 0 ĺ x, o equivalentemente x ľ 0, por lo que el conjunto solución sería r0; `8q. Pero por ejemplo 1 ´5 R r0; `8q y si satisface la desigualdad x`1 ĺ 1. El error estuvo al multiplicar por x ` 1. Recordemos que la desigualdad no se altera si se multiplica por números positivos, pero x ` 1 puede ser negativo o cero. Así, una forma correcta de resolver 1 ĺ1 x`1 es 1 ĺ1 x`1 ðñ p1 ĺ x ` 1 y x ` 1 ą 0q ó p1 ľ x ` 1 y x ` 1 ă 0q ðñ 1 ĺ x ` 1 ó x ` 1 ă 0 ðñ x ľ 0 ó x ă ´1, por lo que el conjunto solución de 1 x`1 ĺ 1 es r0; `8q Y p´8; ´1q, que en la recta se representa así. c s ´1 0 ´6 ´5 ´4 ´3 ´2 - 1 2 3 4 5 6.5.12. Ejemplo. Podemos tener otro tipo de desigualdades como la siguiente 3 ă 0. 4x ` 8 3 Esta desigualdad indica que el número 4x`8 es negativo, pero para que la división de dos números sea negativa, es necesario y suficiente que los números sean de signos opuestos, pero 3 como 3 es positivo, entonces 4x ` 8 es negativo. Así, la desigualdad 4x`8 ă 0 es equivalente a 4x ` 8 ă 0, la cual podemos resolver rápidamente obteniendo x ă ´2. Por lo tanto, el conjunto solución de ă 0 es p´8; ´2q. c ´6 3 4x`8 ´5 ´4 ´3 ´2 - ´1 0 1 2 3 4 5 6.5. Resolución de desigualdades 135 6.5.13. Ejemplo. Una desigualdad similar a la anterior es una de la forma p1 ´ 4xq´1 ą 0. p1´4xq´1 ą 0 si y sólo si 1´4x ą 0, que al resolverla obtenemos x ă es p´8; 41 q. 1 4 y el conjunto solución 6.5.14. Ejemplo. Modifiquemos ligeramente el ejemplo anterior y resolvamos la desigualdad p1 ´ 4xq´1 ľ 0. Las potencias enteras negativas están definidas solamente para números diferentes de cero, por lo que 1 p1 ´ 4xq´1 ľ 0 ðñ 1 ´ 4x ą 0 ðñ xă , 4 así el conjunto solución es p´8; 14 q. Observemos que hubiéramos cometido un error si «resolvemos» la desigualdad de la siguiente forma p1 ´ 4xq´1 ľ 0 ðñ 1 ´ 4x ľ 0 ðñ 1 xĺ , 4 lo cual nos daría como solución el intervalo cerrado p´8; 14 s, pero 14 no satisface la desigualdad p1 ´ 4xq´1 ľ 0. Otro posible error hubiera sido proceder de la siguiente forma p1 ´ 4xq´1 ľ 0 es equivalente a 1 ľ 0. 1 ´ 4x Multiplicando ambos lados por 1 ´ 4x, «obtenemos» 1 ľ 0p1 ´ 4xq, es decir 1 ľ 0. Pero para cualquier valor de x se tiene que 1 ľ 0, por lo que el conjunto solución sería R. El lector debe poder detectar el error en ambos procedimientos incorrectos. 6.5.15. Ejemplo. Otro tipo de desigualdades son como la siguiente p3x ` 1qpx ´ 5q ă 0, la cual se satisface si y sólo si pp3x ` 1q ą 0 y px ´ 5q ă 0q ó pp3x ` 1q ă 0 y px ´ 5q ą 0q, ó px ă ´ pero esto último equivale a px ą ´ es decir 1 y x ă 5q 3 1 ´ ăxă5 3 (puesto que es imposible que 5 ă x ă ´ 31 ). 1 y x ą 5q, 3 136 6.5. Resolución de desigualdades En la resolución del ejemplo anterior se usó el hecho de que la multiplicación de dos números es un número negativo si y sólo si los dos factores son de signos opuestos. 6.5.16. Aclaración. En la mayoría de los textos, los intervalos pa; bq, pa; bs, ra; bq y ra; bs se denotan respectivamente como pa, bq, pa, bs, ra, bq y ra, bs, pero preferimos utilizar la notación acordada (con punto y coma) para que no haya posibles confusiones con el concepto de pareja ordenada. En otros textos en cambio, sobre todo en los de estilo francés, tales intervalos se denotan respectivamente como sa, br, sa, bs, ra, br y ra, bs. Ejercicios. 1. Resolver las siguientes desigualdades y representar la respuesta en forma geométrica en la recta de los números reales. a) 4x ă ´2, b) ´4x ľ 2, c) 8s ´ 1 ă ´9, ? d) 2x ´ 3 ă 4 ` 7x, e) 8px ` 1q ă 3p2xq ` 1, f) x ` 2 ă 3 ´ x, g) ´ 21 x ą 6, h) 4x ´ 1 ľ 4px ´ 2q ` 7, i) 3p2t´2q 2 ą 6t´3 5 ` t . 10 2. Durante cada uno de los meses del año pasado, una compañía obtuvo utilidades que fueron superiores a $37 000, pero inferiores a $53 000. Si S representa las utilidades totales del año, describir S utilizando desigualdades. 3. Resolver las desigualdades siguientes: 1 2 ă x ă 34 , b) ´6 ĺ 1 ´ x ă 4, c) ´5 ă 2x ´ 4 ă 5, d) 0 ĺ 4 ´ x ă 3, e) x ´ 1 ă 3 ´ 2x ă 1 ` x, f) x ă g) x2 ľ x ´ 2 ľ 0, h) 2x ą x2 , i) x2 ă 9, j) x ĺ x2 ĺ 2, k) x2 ľ 2x ´ 3 ą 0, l) 1´2x x`3 ľ 1, ñ) u`1 2´u ľ u, q) 1 x´1 ľ t) x2 ´1 x2 `2 a) m) 1 u´1 ă o) ´1 ĺ r) 0 ă u) 2 , 1´u x`2 x 1´x 2x´3 x2 ´4x x2 ĺ ´1, ĺ 3, ą 1 ´ x. n) 1´2x x`1 p) x´1 1´x s) x2 `x´1 x´1 ă 1 ` 2x, ĺ ´2, ľ x ` 2, 4x´1 3 ă 1 ` x, 2 , 1´3x ĺ 3, 6.6. Desigualdades con valor absoluto 6.6. 137 Desigualdades con valor absoluto El siguiente teorema es muy importante en la resolución de desigualdades en que aparezcan valores absolutos 6.6.1. Teorema. Si y es un número real y b ľ 0, entonces I) |y| ă b ðñ ´b ă y ă b, II) |y| ą b ðñ y ą b ó y ă ´b, III) |y| “ b ðñ y “ b ó y “ ´b. Demostración. I) |y| ă b ðñ py ĺ 0 y ´y y ą ´bq ó py ľ 0 e y ă bq ðñ ´b ă y ĺ 0 ó II) |y| ą b ðñ py ĺ 0 y ´y ą bq ó py ľ 0 e y ą bq ðñ y ă ´b ó y ą b. III) |y| “ b ðñ py ĺ 0 y ´y “ bq ó py ľ 0 e y “ bq ðñ y “ ´b ó y “ b. ă bq ó py ľ 0 e y ă bq ðñ py ĺ 0 e 0 ĺ y ă b ðñ ´b ă y ă b. e y ą bq ðñ py ĺ 0 e y ă ´bq ó py ľ 0 e y “ bq ðñ py ĺ 0 e y “ ´bq ó py ľ 0 ‚ Observemos que I) y II) también son verdaderas si b ă 0 Veamos ahora algunos ejemplos. 6.6.2. Ejemplo. Resolver a) |x| ă 6, b) |x| ą 6 c) |x| “ 6. y Solución. a) |x| ă 6 ðñ ´6 ă x ă 6, por lo que el conjunto solución de |x| ă 6, es p´6; 6q. b) |x| ą 6 ðñ x ą 6 ó x ă ´6, por lo que el conjunto solución de |x| ą 6 es p´8; ´6q Y p6; `8q. c) |x| “ 6 ðñ x “ 6 ó x “ ´6, por lo que el conjunto solución de |x| “ 6 es t´6, 6u. 6.6.3. Ejemplo. Resolver la desigualdad |2x ´ 3| ă 1{3. ðñ Solución. |2x ´ 3| ă 31 ðñ ´ 31 ă 2x ´ 3 ă 13 ðñ 3 ´ 31 ă 2x ă 13 ` 3 ðñ 83 ă 2x ă 10 3 4 5 4 5 1 ă x ă 3 ðñ x P p 3 ; 3 q, es decir el conjunto solución de |2x ´ 3| ă 3 es el intervalo abierto 3 p 34 ; 35 q. 6.6.4. Ejemplo. Resolver |8 ´ 6x| ľ 5. Solución. |8 ´ 6x| ľ 5 ðñ 8 ´ 6x ľ 5 u 8 ´ 6x ĺ ´5 ðñ ´6x ľ 5 ´ 8 ó ´6x ĺ ´5 ´ 8 ðñ ´3 ´6x ľ ´3 ó ´6x ĺ ´13 ðñ x ĺ ´6 ó x ľ ´13 ðñ x ĺ 21 ó x ľ 13 , es decir el conjunto ´6 6 solución de |8 ´ 6x| ľ 5 es p´8; 21 s Y r 13 ; `8q, que se representa en la recta así. 6 1 3 s 1 2 2 3 5 6 1 7 6 4 3 3 2 5 3 11 6 6 3 s 13 6 - Ejercicios. Resolver las desigualdades siguientes: a) |2x ´ 3| ă 1, b) |2x ` 1| ĺ 12 , c) |x ´ 5| ĺ ´4, e) |2x ` 1| ľ x, f) |3x ´ 2| ĺ x2 , g) |2x ` 3| ă ´x. d) ´| ´ 5x2 ` 36| ă x2 , 138 6.7. 6.7. División de polinomios División de polinomios Dados dos polinomios P pxq y Qpxq de grados m y n respectivamente, el grado del polinomio P pxq`Qpxq es menor o igual al máximo entre m y n, y el grado del polinomio P pxq¨Qpxq es m ` n. Estos últimos resultados pueden ser verificados por el lector. El cociente de los polinomios P pxq P pxq puede no ser un polinomio, de modo que no tiene sentido hablar del grado de Qpxq , sin Qpxq embargo hay una versión del algoritmo de la división para polinomios. 6.7.1. Teorema (algoritmo de la división para polinomios). Dados dos polinomios P pxq y Qpxq, donde Qpxq no es el polinomio cero. Existen dos únicos polinomios M pxq y Rpxq, con el grado de Rpxq menor que el grado de Qpxq (ó Rpxq “ 0), tales que P pxq “ M pxq ¨ Qpxq ` Rpxq. 6.7.2. Definición. A los polinomios M pxq y Rpxq de la igualdad anterior se les llama cociente y residuo o resto respectivamente de la división de P pxq entre Qpxq. Demostración del teorema 6.7.1. Sean m y n los grados de P pxq y Qpxq respectivamente. Procedamos a hacer la demostración por inducción sobre m, usaremos el segundo método de inducción matemática 3.9.4. Demostremos primero la existencia de tales polinomios, comenzando con los casos sencillos. Si n “ 0, entonces Qpxq es un número constante diferente de cero y P pxq “ P pxq Qpxq ` 0, Qpxq P pxq por lo que tomando M pxq “ Qpxq y Rpxq “ 0 se tiene el resultado. Supongamos que n ą 0. Si m ă n ó P pxq “ 0, entonces tomamos M pxq “ 0 y Rpxq “ P pxq. Si m “ 1 “ n, entonces P pxq y Qpxq son de la forma P pxq “ a0 ` a1 x y Qpxq “ c0 ` c1 x, con a1 , c1 ‰ 0. De esta forma tomamos M pxq “ ac11 y Rpxq “ a0 ´ ac11c0 . Si m “ 1 ă n, entonces tomamos M pxq “ 0 y Rpxq “ P pxq. Supongamos que el resultado es válido cuando m ĺ N , donde N es un entero positivo. Nř `1 Sea P pxq “ a0 ` aj xj , con aN `1 ‰ 0. Si N ` 1 ă n, el resultado ya está demostrado, por j“1 lo que supongamos que N ` 1 ľ n. Observemos que el polinomio a0 ` N ř aj xj es de grado j“1 menor o igual que N , por lo que existen polinomios M0 pxq y R0 pxq tales que a0 ` N ř aj x j “ j“1 n ř M0 pxq¨Qpxq`R0 pxq, donde el grado de R0 pxq es menor que n. Escribamos Qpxq “ c0 ` k“1 ck x k . 6.7. División de polinomios 139 Tenemos que aN `1 xN `1 aN `1 N `1´n “ x ¨ Qpxq ´ cn ˜ ÿ cj aN `1 c0 aN `1 N `1´n n´1 x ` xN `1´n`j cn c n j“1 ¸ N `1´n ` (para el caso en que N ` 1 “ n tomamos xN `1´n “ 1). Ahora, el polinomio c0 aN `1cxn n´1 ř cj ¨aN `1 N `1´n`j x es de grado menor o igual que N , por lo que existen polinomios M1 pxq y cn j“1 R1 pxq tales que c0 aN `1 N `1´n x cn ` n´1 ř j“1 cj ¨aN `1 N `1´n`j x cn “ M1 pxqQpxq ` R1 pxq, con el grado de R1 pxq menor que n. Finalmente, P pxq “ a0 ` N ÿ aj xj ` aN `1 xN `1 j“1 aN `1 N `1´n “ M0 pxq ¨ Qpxq ` R0 pxq ` x ¨ Qpxq ´ pM1 pxq ¨ Qpxq ` R1 pxqq cn ˆ ˙ aN `1 N `1´n “ M0 pxq ` x ´ M1 pxq ¨ Qpxq ` pR0 pxq ´ R1 pxqq, cn pero como R0 pxq y R1 pxq son de grado menor que n, entonces R0 pxq ´ R1 pxq es de grado menor que n. Demostremos ahora la unicidad. Supongamos que M 1 pxq y R1 pxq son polinomios, tales que el grado de R1 pxq es menor que n ó R1 pxq “ 0 y P pxq “ M 1 pxq ¨ Qpxq ` R1 pxq. Tenemos además que P pxq “ M pxq ¨ Qpxq ` Rpxq, por lo que 6.7.3. 0 “ pM pxq ´ M 1 pxqq ¨ Qpxq ` pRpxq ´ R1 pxqq. Si M 1 pxq ‰ M pxq, entonces pM pxqM 1 pxqq ¨ Qpxq tiene grado mayor o igual que n, por lo que por 6.7.3, el grado de Rpxq´R1 pxq también sería mayor o igual que n, lo cual es imposible pues Rpxq y R1 pxq son cero o tienen grado menor que n, por lo que M 1 pxq “ M pxq. Ahora 0 “ Rpxq ´ R1 pxq, es decir R1 pxq “ Rpxq por lo que se tiene la unicidad. ‚ Descripción del Método de División de Polinomios Supongamos que tenemos dos polinomios P pxq “ am xm ` ¨ ¨ ¨ ` a1 x ` a0 y Qpxq “ bn xn ` ¨ ¨ ¨ ` b1 x ` b0 ‰ 0 140 6.7. División de polinomios de grados m y n. Si m ă n, entonces, el residuo de P pxq Qpxq es P pxq y el cociente es cero. Si P pxq m es abm Qpxq m´2 m m “ n entonces el cociente de y el residuo es el polinomio Rpxq “ pam´1 ´ abm ¨ am am am m´1 ` ¨ ¨ ¨ ` pa1 ´ bm ¨ b1 qx ` pa0 ´ bm ¨ b0 q. bm´1 qx ` pam´2 ´ bm ¨ bm´2 qx P pxq Si m ą n, entonces el cociente de Qpxq es abm ¨ xm´n más el cociente de la división del n polinomio Spxq “ pam´1 ´ abm bn´1 qxm´1 ` pam´2 ´ abm bn´2 qxm´2 ` ¨ ¨ ¨ ` pam´n ´ abm b0 qxm´n ` n n n Spxq . pam´1´n xm´1´n ` ¨ ¨ ¨ ` a1 x ` a0 q entre Qpxq y el residuo es el residuo de Qpxq Si el lector observa con detenimiento, podrá notar que el método anterior se basa en dos hechos fundamentales: a) La propiedad distributiva de la división con respecto a la suma. b) El hecho de que a “ bc ` pa ´ bcq. 6.7.4. Teorema del residuo. Si un polinomio P pxq se divide entre x ´ c, donde c es un número real, entonces P pcq es el residuo. Demostración. Como x´c es de grado 1, entonces el residuo es una constante k. Sea M pxq el cociente de P pxq entre x ´ c, tenemos P pxq “ M pxq ¨ px ´ cq ` k. Si evaluamos P en c obtenemos P pcq “ M pcq ¨ pc ´ cq ` k “ k, es decir el residuo es P pcq. ‚ 6.7.5. Teorema del factor. El polinomio x ´ c es un factor del polinomio P pxq si y sólo si P pcq “ 0. Demostración. Si x ´ c es un factor de P pxq, entonces el residuo al dividir P pxq entre px ´ cq es cero, pero por el teorema del residuo, tenemos que P pcq “ 0. Recíprocamente, si P pcq “ 0, entonces el residuo al dividir P pxq entre x ´ c es cero, por lo que P pxq “ M pxq ¨ px ´ cq ` 0 “ M pxq ¨ px ´ cq para algún polinomio M pxq, lo que significa que x ´ c es factor de P pxq. ‚ Raíces de Polinomios 6.7.6. Definición. Decimos que un número c es raíz de un polinomio P pxq si es solución de la ecuación P pxq “ 0. En general no existen métodos para encontrar las raíces de un polinomio. El teorema del factor dice que c es una raíz de un polinomio si y sólo si x ´ c es un factor del mismo, de esto se puede ver que hay un vínculo muy estrecho entre la factorización y la solución de ecuaciones. En la demostración del siguiente teorema se usará el teorema del factor. 6.7.7. Teorema. Un polinomio P pxq de grado n tiene a lo más n raíces reales diferentes. 6.7. División de polinomios 141 Demostración. Procederemos por inducción matemática sobre n. Si n “ 1, el polinomio es de la forma P pxq “ ax ` b, con a‰0 y la raíz es el número ´b{a. Supongamos la validez del resultado para n “ N y demostrémosla para n “ N ` 1. Sea P pxq un polinomio de grado N ` 1. Si P pxq no tiene raíces el resultado se cumple para P pxq. Si P pxq tiene al menos una raíz c, entonces P pxq “ Qpxq ¨ px ´ cq, donde Qpxq es un polinomio de grado N . Ahora, toda raíz de P pxq diferente de c debe ser raíz de Qpxq puesto que para que el producto de dos números reales sea cero, alguno de los números debe ser cero. Pero Qpxq tiene a lo más N raíces diferentes, por lo que P pxq tiene a lo más N ` 1 raíces diferentes, a saber c y las de Qpxq. ‚ 6.7.8. Definición. Sea P pxq un polinomio y c una de sus raíces, decimos que el entero positivo k es la multiplicidad de la raíz c si px ´ cqk es factor de P pxq pero no lo es px ´ cqk`1 . Raíces racionales de un polinomio con coeficientes enteros Aunque no existen métodos algebraicos para calcular todas las raíces de un polinomio, si existen métodos para calcular todas las raíces racionales de polinomios con coeficientes enteros. El teorema siguiente es de gran utilidad para tal fin. 6.7.9. Teorema de las raíces racionales. Sea P pxq “ an xn ` an´1 xn´1 ` ¨ ¨ ¨ ` a1 x ` a0 un polinomio de grado n con coeficientes enteros. Si c{d es una raíz del polinomio P pxq, donde c ľ 0 y d ‰ 0 son enteros sin factores comunes primos, entonces c | a0 y d | an . Demostración. Como P pc{dq “ 0, tenemos an pc{dqn ` an´1 pc{dqn´1 ` ¨ ¨ ¨ ` a1 pc{dq ` a0 “ 0. Como d ‰ 0, podemos multiplicar por dn , obteniendo an cn ` an´1 dcn´1 ` ¨ ¨ ¨ ` a1 dn´1 c ` a0 dn “ 0. De aquí se deducen dos ecuaciones cpan C n´1 ` an´1 dcn´2 ` ¨ ¨ ¨ ` a1 dn´1 q “ ´a0 dn y dpan´1 C n´1 ` ¨ ¨ ¨ ` a1 dn´2 c ` a0 dn q “ ´an cn , es decir c | a0 d n y d | an c n . 142 6.7. División de polinomios Como c y d no tienen factores comunes primos, tampoco lo tienen c y dn ni d y cn , por lo que, debido al teorema 4.7.13, c | a0 y d | an . ‚ El uso de este teorema nos permite hallar todas las raíces racionales de polinomios con coeficientes enteros. Ejercicios. 1. Sean c1 , c2 , . . . , ck raíces de un polinomio P pxq de grado n y sean m1 , m2 , . . . , mk sus respectivas multiplicidades. Demostrar que m1 ` m2 ` ¨ ¨ ¨ `mk ĺ n. 2. Dados los polinomios P pxq “ 3x6 ´ 2x4 ` 4x2 ` x ´ 1 y Qpxq “ 8x3 ` x2 ´ 2x ` 2. Hallar P pxq . el cociente y el residuo de la división Qpxq 3. Hallar todas las raíces racionales del polinomio P pxq “ 12x6 ´ 2x4 ` 4x2 , así como la multiplicidad de cada raíz encontrada. 6.8. Sistemas de ecuaciones lineales 6.8. 143 Sistemas de ecuaciones lineales 6.8.1. Definición. Cuando tenemos n variables x1 , x2 , . . . , xn y los números a1 , a2 , . . . , an y b son constantes, a una ecuación equivalente a una de la forma a1 x 1 ` a2 x 2 ` ¨ ¨ ¨ ` an x n “ b se le llama ecuación lineal con n variables o simplemente ecuación lineal. Observemos que si c ‰ 0, la ecuación anterior es equivalente a la ecuación cpa1 x1 ` a2 x2 ` ¨ ¨ ¨ ` an xn q “ cb. 6.8.2. Definición. Cuando tenemos n variables x1 , x2 , . . . , xn y para cada i P t1, 2, . . . , mu tenemos una ecuación lineal ai,1 x1 ` ai,2 x2 ` ¨ ¨ ¨ ` ai,n xn “ bi , entonces a la expresión a1,1 x1 ` a1,2 x2 ` ¨ ¨ ¨ ` a1,n xn “ b1 , a2,1 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` a2,n xn “ b2 , .. . am,1 x1 ` am,2 x2 ` ¨ ¨ ¨ ` am,n xn “ bm se le llama sistema de ecuaciones lineales o cuando se quiere ser más específico se le llama sistema de m ecuaciones lineales con n incógnitas. 6.8.3. Teorema. El sistema de 2 ecuaciones lineales a1,1 x1 ` a1,2 x2 ` ¨ ¨ ¨ ` a1,n xn “ b1 , a2,1 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` `a2,n xn “ b2 es equivalente al sistema a1,1 x1 ` a1,2 x2 ` ¨ ¨ ¨ ` a1,n xn “ b1 , pa1,1 ` a2,1 qx1 ` pa1,2 ` a2,2 qx2 ` ¨ ¨ ¨ ` pa1,n ` a2,n qxn “ b1 ` b2 . Demostración. pùñq Por sustitución de iguales tenemos que el primer sistema implica la segunda ecuación del segundo sistema, y obviamente la primera ecuación del primer sistema implica la primera ecuación del segundo sistema. pðùq Supongamos ahora que se satisface el sistema a1,1 x1 ` a1,2 x2 ` ¨ ¨ ¨ ` a1,n xn “ b1 , pa1,1 ` a2,1 qx1 ` pa1,2 ` a2,2 qx2 ` ¨ ¨ ¨ ` pa1,n ` a2,n qxn “ b1 ` b2 . Multiplicando por ´1 la primera ecuación, vemos que el sistema es equivalente a ´a1,1 x1 ` ´a1,2 x2 ` ¨ ¨ ¨ ` ´a1,n xn “ ´b1 , pa1,1 ` a2,1 qx1 ` pa1,2 ` a2,2 qx2 ` ¨ ¨ ¨ ` pa1,n ` a2,n qxn “ b1 ` b2 , 144 6.8. Sistemas de ecuaciones lineales y utilizando la primera parte de la demostración vemos que este último sistema implica el sistema ´a1,1 x1 ` ´a1,2 x2 ` ¨ ¨ ¨ ` ´a1,n xn “ ´b1 , a2,1 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` `a2,n xn “ b2 , el cual, al multiplicar por ´1 la primera ecuación, equivale a a1,1 x1 ` a1,2 x2 ` ¨ ¨ ¨ ` a1,n xn “ b1 , a2,1 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` `a2,n xn “ b2 , con lo que terminamos la demostración. ‚ El teorema anterior sirve para resolver, cuando sea posible, un sistema de ecuaciones lineales. 6.8.4. Ejemplo. Resolver el siguiente sistema de 3 ecuaciones con 3 incógnitas: 5x `2y `6z “ 1, 3x `2y ´4z “ 0, 4x `y `z “ 2. Solución. Si la segunda ecuación la multiplicamos por ´1 y la sumamos a la primera nos queda el siguiente sistema equivalente al anterior 2x `10z “ 1, 3x `2y ´4z “ 0, 4x `y `z “ 2. Multiplicando ahora la tercera ecuación del nuevo sistema por ´2 y sumándola a la segunda, obtenemos 2x `10z “ 1, ´5x ´6z “ ´4, 4x `y `z “ 2. Multipliquemos la primera ecuación por 1 2 para obtener x `5z “ 12 , ´5x ´6z “ ´4, 4x `y `z “ 2. Multiplicando ahora la primera ecuación por 5 y sumándola a la segunda obtenemos 19z “ ´ 32 , ´5x ´6z “ ´4, 4x `y `z “ 2, 3 concluyendo que z “ ´ 38 . Sustituyendo este valor de z en la segunda ecuación, tenemos que 3 17 3 ´5x ´ 6p´ 38 q “ ´4, es decir x “ 19 y finalmente tenemos que 4p 17 q ` y ´ 38 “ 2, es decir 19 3 17 3 y “ 2 ` 38 ´ 4p 19 q “ ´ 2 . Capítulo 7 AXIOMA DEL SUPREMO 7.1. Conjuntos Acotados 7.1.1. Definición. Sea A Ă R. Decimos que A es acotado superiormente si existe un x P R tal que para todo a P A, se tiene que a ĺ x. Al número x se le llama cota superior de A. Decimos que A es acotado inferiormente si existe un r P R tal que para todo a P A, se tiene que r ĺ a. Al número r se le llama cota inferior de A. Si A es acotado superiormente y acotado inferiormente se dice que es acotado. 7.1.2. Ejemplo. El conjunto N de los números naturales es un conjunto acotado inferiormente. 7.1.3. Ejemplo. El conjunto tx P R : 4{3 ă x ĺ 6u es acotado. 7.1.4. Ejemplo. El conjunto de números negativos es acotado superiormente pero no es acotado inferiormente. 7.1.5. Ejemplo. El conjunto Q de los números racionales no es acotado superiormente ni acotado inferiormente. 7.1.6. Definición. Sea A Ă R. Decimos que x es el máximo de A si x P A y es cota superior de A, es decir, si x P A y para todo a P A se tiene que a ĺ x. De la misma manera decimos que r es el mínimo de A si r P A y es cota inferior de A; es decir si r P A y para todo a P A se tiene que r ĺ a. Observemos que para que un conjunto tenga máximo es necesario que sea acotado superiormente aunque esto no es suficiente. 7.1.7. Ejemplo. El mínimo de N es el número 1 y N no tiene máximo. 7.1.8. Ejemplo. El conjunto tx P R : 4{3 ă x ĺ 6u no tiene mínimo aunque es acotado inferiormente (podría pensarse que el mínimo es 4/3, pero 4/3 no pertenece al conjunto). Tal conjunto tiene como máximo a 6. 7.1.9. Ejemplo. El conjunto de números negativo es acotado superiormente, aunque no tiene máximo (podría pensarse que 0 es el máximo, pero 0 no es negativo). 7.1.10. Ejemplo. El conjunto Q no tiene ni máximo ni mínimo por no ser acotado ni 145 146 7.1. Conjuntos Acotados superiormente ni inferiormente. 7.1.11. Notación. Si x es el máximo de A, entonces escribimos x “ máxA y si r es el mínimo de A, entonces escribimos r “ mínA. 7.1.12. Teorema. Si A Ă R, entonces A tiene a lo más un máximo. Demostración. Supongamos que x1 y x2 son máximos de A. Entonces x1 ĺ x2 y x2 ĺ x1 y por la propiedad de tricotomía x1 “ x2 . ‚ Similarmente se tiene el siguiente teorema cuya demostración es análoga a la anterior. 7.1.13. Teorema. Si A Ă R, entonces A tiene a lo más un mínimo. 7.1.14. Definición. Sea A Ă R. Decimos que el número real α es el supremo de A si: I) Para todo a P A se tiene que a ĺ α. II) Si x es una cota superior de A, entonces α ĺ x. Al supremo de A (si existe) también se le llama la mínima cota superior de A. Tenemos la siguiente definición dual a la anterior. 7.1.15. Definición. Sea A Ă R. Decimos que el número real β es el ínfimo de A si: I) Para todo a P A se tiene que β ĺ a. II) Si r es una cota inferior de A, entonces r ĺ β. Al ínfimo de A también se le llama la máxima cota inferior de A. 7.1.16. Notación. Al supremo e ínfimo de A (si existen) se les denota respectivamente como sup A e ínf A. 7.1.17. Axioma del supremo. Si A es un conjunto no vacío de números reales, acotado superiormente, entonces existe el supremo de A. El principio anterior no es válido para los números racionales en el sentido de que hay conjuntos acotados superiormente que no tienen su supremo en Q. El siguiente teorema es el dual del axioma del supremo. 7.1.18. Teorema del ínfimo. Si B es un conjunto no vacío de números reales, acotado inferiormente, entonces existe el ínfimo de B. Demostración. Supongamos que B es un conjunto acotado inferiormente. Sea A “ ta P R : ´a P Bu y r una cota inferior de B. Si a P A, entonces ´a P B, pero r ĺ ´a por lo que a ĺ ´r. Así pues vemos que A es un conjunto acotado superiormente y que el hecho de que r sea una cota inferior de B implica que ´r es una cota superior de A por lo que existe un número real α tal que α “ sup A. 7.1. Conjuntos Acotados 147 Ahora si a P A, entonces a ĺ α ĺ ´r, de donde r ĺ ´α ĺ ´a, pero observemos que a P A ðñ ´a P B, por lo que para todo b P B r ĺ ´α ĺ b, es decir ´α es el ínfimo de B. ‚ 7.1.19. Propiedad arquimediana. Si x P R, existe un n P N tal que n ą x. Demostración. Si no existiera ningún número natural n tal que n ą x, entonces x sería una cota superior de N y por el axioma del supremo existiría un α, tal que α “ sup N. Sea m P N, entonces m ` 1 P N por lo que m`1ĺα de donde m ĺ α ´ 1 ă α, por lo tanto α ´ 1 sería una cota superior de N menor que α, contradiciendo el hecho de que α es el supremo de N. Por lo tanto N no es acotado superiormente. En particular, x no es una cota superior de N, por lo cual existe un n P N tal que n ą x. ‚ 7.1.20. Corolario. Si x, y ą 0, entonces: I) Existe un n P N tal que nx ą y. II) Existe un n P N tal que 0 ă 1{n ă y. III) Existe un n P N tal que n ´ 1 ĺ y ă n. IV) Existe un ε ą 0 tal que εx ă y. Demostración. I) Como x ą 0, entonces y{x P R, por lo que existe un n, tal que n ą y{x, pero como x ą 0 la última desigualdad equivale a nx ą y. II) Como y ą 0 y 1 ą 0, entonces existe un n P N tal que ny ą 1. Ahora, esta última desigualdad equivale a que y ą 1{n y como n es positivo, entonces 1{n ą 0, por lo tanto 0 ă 1{n ă y. III) Sea Ay “ tk P N : y ă ku. Por la propiedad arquimediana tenemos que Ay ‰ ∅. Ahora, Ay tiene un mínimo n, el cual es su primer elemento (teorema 3.9.3), de donde n ´ 1 ĺ y ă n. IV) Por el inciso I) existe un número natural n tal que ny ą x, por lo que tomando ‚ cualquier número positivo ε ĺ n1 tendremos que εx ă y. 7.1.21. Teorema. Si a, b ą 1, existe un N P N tal que bn ą a para todo n ľ N . 148 7.1. Conjuntos Acotados Demostración. Por el teorema del binomio tenemos que para todo número natural n se tiene n n b “ p1 ` pb ´ 1qq “ n ˆ ˙ ÿ n k“0 k pb ´ 1qk ľ 1 ` npb ´ 1q, ahora, por el corolario a la propiedad arquimediana se tiene que existe un N P N tal que N pb ´ 1q ą a, por lo tanto si n ľ N , entonces bn ľ 1 ` npb ´ 1q ą N pb ´ 1q ą a. ‚ Como consecuencia inmediata del teorema anterior tenemos el siguiente corolario. 7.1.22. Corolario. Si a, b ą 1, existe un N P N tal que b ą a1{n para todo n ľ N . (Siempre que existan todas las raíces enteras de a, lo cual es un hecho que aún no está demostrado). 7.1.23. Teorema. Si A es un subconjunto de los números reales acotado superiormente, b ą 0 y X “ tx : x “ ba, para algún a P Au, entonces sup X “ b sup A. Demostración. Si a P A y x “ ba, entonces como a ĺ sup A y b ą 0, tenemos que x “ ba ĺ b sup A, por lo tanto sup X ĺ b sup A. Ahora, como A “ ta : a “ b´1 x para algún x P Xu, entonces sup A ĺ b´1 sup X, por lo tanto sup X ĺ b sup A ĺ bb´1 sup X “ sup X. ‚ De manera similar se demuestra el teorema siguiente. 7.1.24. Teorema. Si A es un subconjunto de los números reales acotado inferiormente, b ą 0 y X “ tx : x “ ba, para algún a P Au, entonces ínf X “ b ínf A. 7.1.25. Teorema. Si A un subconjunto de los números reales acotado superiormente y X “ tx : x “ ´a, para algún a P Au, entonces ínf X “ ´ sup A. Demostración. Tenemos que a ĺ u para todo a P A equivale a decir que ´u ĺ ´a para todo a P A. Es decir ´u es una cota inferior de X si y sólo si u es una cota superior de A. Sea s el supremo de A. Como s es una cota superior de A, entonces ´s es una cota inferior de X. Ahora, si t es una cota inferior de X, entonces ´t es una cota superior de A, de modo que s ĺ ´t, lo cual significa que t ĺ ´s, teniendo así que ´s es la máxima cota inferior de X, es decir ínf X “ ´s “ ´ sup A. ‚ 7.1. Conjuntos Acotados 149 De manera análoga a la demostración del teorema 7.1.24 se puede demostrar el teorema siguiente. 7.1.26. Teorema. Si A un subconjunto de los números reales acotado inferiormente y X “ tx : x “ ´a, para algún a P Au, entonces sup X “ ´ínf A. 7.1.27. Teorema. Sea Λ un conjunto, y sean taλ : λ P Λu y tbλ : λ P Λu subconjuntos de números reales acotados superiormente. suptaλ ` bλ : λ P Λu ĺ suptaλ : λ P Λu ` suptbλ : λ P Λu. Demostración. Si a es una cota superior de taλ : λ P Λu, b es una cota superior de tbλ : λ P Λu, aλ1 P taλ : λ P Λu y bλ2 P tbλ : λ P Λu, entonces aλ1 ` bλ2 ĺ a ` b teniendo así que el conjunto taλ ` bλ : λ P Λu es acotado superiormente. Sean γ “ suptaλ ` bλ : λ P Λu, α “ suptaλ : λ P Λu y β “ suptbλ : λ P Λu. Si c P taλ ` bλ : λ P Λu, entonces existe un λ0 P Λ tal que c “ aλ0 ` bλ0 , pero como aλ0 ĺ α y bλ0 ĺ β, entonces c ĺ α ` β. Hemos demostrado que α ` β es una cota superior de taλ ` bλ : λ P Λu, por lo tanto γ ĺ α ` β. ‚ De manera similar a como se demostró el teorema 7.1.27 se puede demostrar el teorema siguiente. 7.1.28. Teorema. Sea Λ un conjunto, y sean taλ : λ P Λu y tbλ : λ P Λu subconjuntos de números reales acotados inferiormente. ínf taλ ` bλ : λ P Λu ľ ínf taλ : λ P Λu ` ínf tbλ : λ P Λu. Ejercicios. 1. De los siguientes subconjuntos de números reales decir cuales son acotados superiormente y cuales son acotados inferiormente; de los que sean acotados superiormente decir cual es el supremo, y de los que sean acotados inferiormente decir cual es el ínfimo. En caso de existan el supremo o el ínfimo, decir si éstos pertenecen al conjunto, es decir decir si son máximos o mínimos. ˙ " * „ 2 3 ; 500 , c) r5; 8szQ, d) :nPN , a) p0; `8q, b) 2 n * „ ˙ " ? ? ? 1 7 e) n ` : n P N , f) ´ ; `8 X Z, g) Q X p 2; 3s, h) t n n : n P Nu X Z. n 4 150 7.2. 7.2. Raíces cuadradas Raíces cuadradas En esta sección se establecerá la existencia de las raíces cuadradas de cualquier número positivo. 7.2.1. Definición. Decimos que x es una raíz cuadrada de un número real a, si x2 “ a. 7.2.2. Teorema. Sea a ą 0. Existe un número positivo x tal que x2 “ a. Demostración. Dividiremos la demostración en dos casos, a saber cuando a ą 1 y cuando 0 ă a ĺ 1. Si a ą 1, sea Ba “ tb P R : b ľ 0 y b2 ĺ au. Podemos ver que Ba está acotado superiormente por a (verificarlo) por lo que debido al axioma del supremo, existe un número real x “ sup Ba . Observemos que x ľ 1 ya que 1 P Ba . Tenemos tres posibilidades para x, a saber x2 “ a, x2 ą a y x2 ă a. Veamos que las dos últimas son imposibles. ` ˘ 2q 1 2 . Con el n dado así, tenemos que x ` “ Si x2 ă a, existe un n P N tal que n1 ă pa´x 2x`1 n p2x`1q p2x`1q 2x 1 2x 1 1 a´x2 2x`1 2 2 2 2 2 x ` n ` n2 ĺ x ` n ` n “ x ` n , pero n ă 2x`1 ðñ n ă a´x ðñ x ` n ă a, por lo que ˆ 1 x` n ˙2 ă a, lo cual significa que x ` 1{n P Ba , pero esto es imposible pues x es el supremo de Ba . Si x2 ą a, sea n un número natural tal que 1{n ă px2 ´ aq{2x. Ahora, debe existir un b P Ba tal que x ´ 1{n ă b, de otra forma x ´ 1{n sería una cota superior de Ba . Pero esto nos lleva a que 2x 1 2x ă x2 ´ ` 2 “ aăx ´ n n n 2 ˆ 1 x´ n ˙2 ă b2 , es decir a ă b2 , contrario al hecho de que b P Ba . Por lo tanto, la única posibilidad es que x2 “ a. Falta demostrar que existe un x tal que x2 “ a cuando 0 ă a ĺ 1. Si a “ 1 es suficiente con tomar x “ 1. Si 0 ă a ă 1, entonces 1{a ą 1, por lo que existe un r ą 0 tal que r2 “ 1{a, pero esto es equivalente a que a “ p1{rq2 y es suficiente con tomar x “ 1{r. ‚ Observemos que si x es una raíz cuadrada de a, entonces ´x también es una raíz cuadrada de a. Observemos también que los números negativos ? no tienen raíces cuadradas en R. A la raíz cuadrada no negativa de a la denotaremos por a. ? Veamos ahora un ejemplo de un número real que no es racional, a saber 2. ? 7.2.3. Teorema. El número 2 es irracional. ? ? Demostración. Supongamos que 2 es racional. Como 2 ą 0, entonces se puede expresar ? m m como n , donde m, n P ? N. Sean m0 , n0 P N tales que n0 “ míntn P N : n “ 2 para algún 0 número natural m} y 2 “ m . La elección de m0 y n0 garantiza que no tengan factores n0 comunes, en particular que 2 no divida a m0 y a n0 a la vez. Pero m20 n20 “ 2, por lo que 7.2. Raíces cuadradas 151 m20 “ 2n20 , es decir m20 es par. El número m0 debe ser par, puesto que si no lo fuera, entonces m0 “ 2k ` 1 para algún entero k, por lo que m20 “ 4k 2 ` 4k ` 1 “ 4kpk ` 1q ` 1, el cual es impar, por lo tanto m0 es par. Así existiría un r P N tal que m0 “ 2r, pero m20 “ 4r2 y 4r2 “ 2, es decir 2r2 “ n20 , de donde n20 también es par. De manera similar podemos concluir n20 que n0 es par, de donde ? 2 divide a m0 y a n0 a la vez, contradiciendo a la elección de n0 , demostrando así que 2 es irracional. ‚ Ejercicios. ? p es irracional. ? ? 2. Demostrar que si n es un número natural tal que n no es entero, entonces n es irracional. 1. Demostrar que si p es primo, entonces 152 7.3. 7.3. Exponentes racionales Exponentes racionales 7.3.1. Lema. Si a ą 1 y n P N, entonces ? n a “ suptx ą 0 : xn ĺ au. Demostración. Sea y “ suptx ą 0 : xn ĺ au. Queremos demostrar que y n “ a. Si 0 ă ε ă 1, tenemos que n ˆ ˙ n ˆ ˙ n ˆ ˙ ÿ ÿ ÿ n k n k´1 n n p1 ` εq “ ε “1`ε ε ă1`ε “ 1 ` 2n ε, k k k k“0 k“1 k“0 es decir 7.3.2. p1 ` εqn ă 1 ` 2n ε. Ahora, si y n ă a entonces por el corolario 7.1.20 IV) existe un ε ą 0, que se puede tomar menor que 1, tal que p2yqn ε ă a ´ y n , es decir y n p1 ` 2n εq ă a, 7.3.3. de modo que por las desigualdades 7.3.2 y 7.3.3 pyp1 ` εqqn “ y n p1 ` εqn ĺ y n p1 ` 2n εq ă a, pero entonces yp1 ` εq P tx ą 0 : xn ĺ au e y ă yp1 ` εq, contradiciendo el hecho de que y “ suptx ą 0 : xn ĺ au. Ahora, si a ă y n entonces, por el corolario 7.1.20 IV), existe un ε P p0; 1q tal que 2n aε ă y n ´ a, es decir ap1 ` 2n εq ă y n , de modo que por la desigualdad 7.3.2 ap1 ` εqn ă ap1 ` 2n εq ă y n , pero entonces ˆ aă y 1`ε ˙n ă yn, ` y ˘n de donde se tiene que si u P tx ą 0 : xn ĺ au, entonces un ă 1`ε , lo cual implica que ? y n n u ă 1`ε ă y, contradiciendo la definición de y. Por lo tanto y “ a, es decir y “ a. ‚ 7.3.4. Teorema. Todo número positivo tiene una raíz n-ésima positiva. ? n Demostración. Si a ą 1, por el lema 7.3.1 n aˆ existe ˙ny es igual a suptx ą 0 : x ĺ au. Si ? ? 1 1 a “ 1, entonces n a “ 1. Si 0 ă a ă 1, entonces ? “ 11 “ a, es decir n a “ ? . ‚ n 1 n 1 a a a 7.3. Exponentes racionales 153 Recordemos que cuando r P Q y r “ m{n, donde m y n son enteros y n ą 0, se definió para a ą 0 ` ? ˘m ar “ n a . Veamos que ar está bien definida, es decir veamos que si r “ m1 {n1 , con m1 y n1 enteros y n1 ą 0, entonces `? ˘m ` ?1 ˘m1 n a “ n a . Sean p y q enteros sin factores comunes diferentes de 1 y ´1 tales que q ą 0 y p{q “ m{n. Observemos que q | n de modo que qt “ n y pt “ m, para algún entero positivo t. Por las propiedades de los radicales y los exponentes enteros tenemos que ˆ´a ¯ ˙p `? ˘m ` ? ˘pt ` ? ˘p ? t t q n qt a “ a “ a “ qa . ? p ?1 m1 Análogamente se puede ver que p n aq “ p q aq , de modo que ar está bien definido. 7.3.5. Teorema. Si r, s P Q, r ą s y a ą 1, entonces ar ą as . Demostración. Sean m, n, m1 y n1 enteros tales que n, n1 ą 0, r “ m{n y s “ m1 {n1 . Como m{n ą m1 {n1 , tenemos que mn1 ą m1 n. Ahora, ` ?1 ˘mn1 1 1 ar “ am{n “ apmn q{pnn q “ nn a ` ?1 ˘m1 n 1 1 1 1 ą nn a “ apm nq{pnn q “ am {n “ as , con lo que el teorema queda demostrado. ‚ 7.3.6. Corolario. Si r, s P Q, r ą s y 0 ă a ă 1, entonces ar ă as . Demostración. 1{a ą 1, por lo tanto p1{aqr ą p1{aqs , pero 1{ar “ p1{aqr ą p1{aqs “ 1{as , es decir 1{ar ą 1{as , por lo que as ą ar . ‚ 7.3.7. Leyes de los exponentes racionales. Si a, b ą 0 y r, s P Q, entonces se cumplen las siguientes relaciones: ` ˘r r I) ar as “ ar`s , IV) ab “ abr , II) par qs “ ars , V) ar as “ ar´s . III) pabqr “ ar br , Demostración. Sean p, q, m y n, números enteros tales que q, n ‰ 0, r “ p{q y s “ m{n. I) Usando la definición de exponentes racionales y las leyes de los exponentes enteros, tenemos que ar as “ ap{q am{n “ appnq{pqnq apmqq{pqnq “ pa1{qn qpn pa1{qn qmq “ pa1{qn qpn`mq “ appn`mqq{pqnq “ ar`s . II) Usando ahora las leyes de los exponentes enteros y las de los radicales varias veces, tenemos que par qs “ pppa1{q qp q1{n qm “ pppa1{q q1{n qp qm “ pa1{pqnq qpm “ appmq{pqnq “ ars . 154 7.3. Exponentes racionales III) pabqr “ pabqp{q “ ppabq1{q qp “ pa1{q b1{q qp “ pa1{q qp pb1{q qp “ ar br . IV) De la tercera ley concluimos que pa{bqr br “ ppa{bqbqr “ ar y dividiendo entre br se tiene la cuarta ley. V) De la primera ley tenemos que ar “ ar´s as y al dividir entre as se tiene la quinta ley. ‚ Capítulo 8 SUCESIONES Y SERIES 8.1. Introducción 8.1.1. Definición. Una sucesión infinita o simplemente sucesión de elementos de un conjunto A es una función cuyo dominio es el conjunto N de todos los números naturales y cuyo recorrido es un subconjunto de A. Una sucesión de la forma f : N ÝÑ A se denotará kÞÑak de alguna de las siguientes formas pak q8 k“1 , pak q, pa1 , a2 , . . . , ak , . . . q o simplemente como pa1 , a2 , . . . q cuando no haya peligro de confusión. En este capítulo consideraremos solamente sucesiones de números reales. Los siguientes son ejemplos de sucesiones de números reales: 8.1.2. Ejemplo. p3k ´ 1q8 k“1 “ p2, 5, 8, . . . , 3k ´ 1, . . . q. 8.1.3. Ejemplo. p4 ´ jq8 j“1 “ p3, 2, 1, 0, ´1, . . . , 4 ´ j, . . . q. 2 1 2 8.1.4. Ejemplo. p 2j q8 j“1 “ p2, 1, 3 , 2 , . . . , j , . . . q. k´1 , . . . q. 8.1.5. Ejemplo. p10k´1 q8 k“1 “ p1, 10, 100, 1000, 10000, . . . , 10 n 8 n 8.1.6. Ejemplo. p n`1 qn“1 “ p 12 , 23 , 34 , 45 , . . . , n`1 , . . . q. 8.1.7. Definición. En una sucesión pan q8 n“1 a ak se le llama la k-ésima componente de la sucesión o el k-ésimo término de la sucesión. En el ejemplo 8.1.2, el número 5 es la segunda componente de la sucesión; en el ejemplo 8.1.3, el número 3 es la primera componente de la sucesión; en el ejemplo 8.1.4, el número 2/3 es la tercera componente de la sucesión; en el ejemplo 8.1.5, el número 1000 es la cuarta componente de la sucesión, y en el ejemplo 8.1.4, el número 3/4 es la tercera componente de la sucesión. 8.1.8. Observación. Si tenemos sucesiones expresadas en formas como la siguiente p2, 4, 6, 8, 10, . . . q, podemos conocer las primeras 5 componentes de la sucesión, pero no podemos conocer la sexta ni las demás componentes. Podría suponerse que la sexta componente fuera 12, si pensáramos que la sucesión en cuestión es p2kq8 k“1 , pero hay una infinidad de sucesiones con las primeras cinco componentes iguales, por ejemplo en la sucesión definida como p2k` pk ´ 1qpk ´ 2qpk ´ 3qpk ´ 4qpk ´ 5qq8 k“1 , las primeras 5 componentes son 2, 4, 6, 8, 10, pero la sexta componente no es 12 sino 132. 155 156 8.1. Introducción Como notación, cuando j sea un entero, una expresión de la forma pak q8 k“j representará 8 la sucesión pak`j´1 qk“1 , es decir, es una sucesión que en vez de empezar en a1 empieza en aj , por ejemplo p3k ` 1q8 k“5 “ p16, 19, 22, 25, . . . , 3k ` 1, . . . q, 2 8 2 p i`2 qi“0 “ p1, 23 , 21 , 25 , 13 , 27 , 41 , . . . , i`2 , . . . q. 8.1.9. Definición. En una sucesión pak q8 k“1 , si aj es el j-ésimo término de la sucesión, entonces el término siguiente del j-ésimo es aj`1 y decimos que aj y aj`1 son términos sucesivos o consecutivos. También decimos que aj es el anterior del j ` 1-ésimo término de la sucesión. 8.2. Progresiones aritméticas 8.2. 157 Progresiones aritméticas 8.2.1. Definición. Una progresión aritmética es una sucesión pak q8 k“1 , donde existe un número d P R tal que para todo k P N, se tiene ak`1 “ ak ` d. Al número d se le llama diferencia común de la progresión aritmética. Observemos que si pak q8 k“1 es una progresión aritmética con diferencia común d, entonces tenemos que a1 “ a1 ` 0 ¨ d, a2 “ a1 ` 1 ¨ d, a3 “ a1 ` 2 ¨ d, a4 “ a1 ` 3 ¨ d, a5 “ a1 ` 4 ¨ d, etc. Siguiendo este esquema el lector podrá demostrar por inducción matemática el siguiente teorema. 8.2.2. Teorema. Si pak q8 k“1 es una progresión aritmética con diferencia común d, entonces an “ a1 ` pn ´ 1q ¨ d. 8.2.3. Ejemplo. Encontrar la dieciochava componente de la progresión aritmética con primera y segunda componente 5 y 29 respectivamente. 4 Solución. La diferencia común de la progresión aritmética es 29 ´ 5 “ 49 y la primera 4 componente es 5, por lo que de acuerdo al teorema 8.2.2 la dieciochava componente es 5 ` “ 173 . p18 ´ 1q 49 “ 5 ` 153 4 4 8.2.4. Teorema. Si pak q8 k“1 es una progresión aritmética con diferencia común d, entonces n ÿ k“1 ak “ n a1 ` an p2a1 ` pn ´ 1qdq “ n . 2 2 ř Demostración. Procedamos por inducción matemática. Si n “ 1, entonces nk“1 ak “ ř1 pa1 `an q n 1 1q “ 1 pa1 `a “ a1 . k“1 ak “ a1 , además 2 p2a1 ` pn ´ 1qdq “ 2 p2a1 ` 0dq “ a1 y n 2 2 Supongamos que la fórmula es válida para algún entero positivo n “ N . Es decir, supongamos que N ÿ N pa1 ` aN q ak “ p2a1 ` pN ´ 1qdq “ N , 2 2 k“1 entonces N `1 ÿ k“1 ak “ N N p2a1 ` pN ´ 1qdq ` aN `1 “ p2a1 ` pN ´ 1qdq ` a1 ` N d 2 2 N pN ´ 1qd ` 2N d N pN ` 1qd “ pN ` 1qa1 ` 2 2 ppN ` 1q ´ 1qpN ` 1qd pN ` 1q “ pN ` 1qa1 ` “ p2a1 ` ppN ` 1q ´ 1qdq, 2 2 por otra parte “ pN ` 1qa1 ` pN ` 1q pN ` 1q p2a1 ` ppN ` 1q ´ 1qdq “ pa1 ` pa1 ` ppN ` 1q ´ 1qdqq 2 2 N `1 “ pa1 ` aN `1 q, 2 158 8.2. Progresiones aritméticas por lo tanto N `1 ÿ k“1 ak “ pN ` 1q pa1 ` aN `1 q p2a1 ` ppN ` 1q ´ 1qdq “ pN ` 1q . 2 2 ‚ 8.2.5. Ejemplo. Hallar la suma de los primeros 1000 enteros positivos. Solución. De acuerdo al teorema 8.2.4 tenemos que tal suma es 1000p1 ` 1000q “ 500 ¨ p1001q “ 500500. 2 8.2.6. Ejemplo. Hallar la suma de los primeros 100 números pares no negativos. Solución. El primer par no negativo es el cero y el centésimo par no negativo es 198, por lo que de acuerdo al teorema 8.2.2 la suma de los primeros 100 pares no negativos es 100 ¨ p0 ` 198q “ 100 ¨ 99 “ 9900. 2 8.2.7. Ejemplo. Hallar la suma de los primeros 63 múltiplos de 3 mayores o iguales que 60. Solución. El hallar la suma de los primeros 63 múltiplos de 3 mayores o iguales que 60 es hallar la suma de los primeros 63 términos de la progresión aritmética cuyos primeros dos términos son 60 y 63, es decir cuyo primer término es 60 y la diferencia común es 3. De acuerdo al teorema 8.2.4 tal suma está dada por 63 63 306 p2p60q ` 62 ¨ 3q “ p120 ` 186q “ 63 ¨ “ 63p153q “ 9639. 2 2 2 Ejercicios. 1. Hallar la décima componente de la progresión aritmética cuyo primer término es 7 y cuya diferencia común es ´4. 2. Hallar la suma de las primeras 10 componentes de la progresión aritmética cuyo primer término es 7 y cuya diferencia común es ´4. 8.3. Progresiones geométricas 8.3. 159 Progresiones geométricas 8.3.1. Definición. Una sucesión pak q8 k“1 “ pa1 , a2 , . . . , ak , . . . q es una progresión geométrica si existe un número real r ‰ 0 tal que para todo entero positivo k se tiene que ak`1 “ r. ak Al número r se le llama razón común de la progresión geométrica. Observemos que si r es la razón común de una progresión geométrica pa1 , a2 , . . . , ak , . . . q, entonces ak`1 “ ak r. Además, a1 “ a1 r0 , a2 “ a1 r “ a1 r1 , a3 “ a2 r “ pa1 rqr “ a1 r2 , . . . , an “ a1 rn´1 , an`1 “ an r “ pa1 rn´1 qr “ a1 rpn`1q´1 . Es decir, tenemos el siguiente teorema. 8.3.2. Teorema. Si pa1 , a2 , . . . , ak , . . . q es una progresión geométrica con razón común r, entonces an “ a1 rn´1 . 8.3.3. Ejemplo. Encontrar los primeros cinco términos de la progresión geométrica (3, 6, . . . ). Solución. Observemos que no hay lugar a confusión acerca de la sucesión (3, 6, . . . ), puesto que estamos aclarando que es una progresión geométrica, así a1 “ 3, a2 “ 6 y la razón común es r “ 6{3 “ 2, de modo que an “ 3 ¨ 2n´1 , en particular a3 “ 3 ¨ 22 “ 12, a4 “ 3 ¨ 23 “ 24 y a5 “ 3 ¨ 24 “ 48. 8.3.4. Ejemplo. Un banco ofrece una tasa de interés mensual del 1 %. Si un inversionista deposita $6000 ¿cuál será el saldo a los n meses? Solución. Planteemos el problema de una forma más general. Supongamos que el depósito inicial es a0 y la tasa es de r. En el primer mes tendrá a0 ` a0 r “ a0 p1 ` rq, en el segundo mes tendrá a0 p1 ` rq ` a0 p1 ` rqr “ a0 p1 ` rqp1 ` rq “ a0 p1 ` rq2 , en general si en el késimo mes tiene a0 p1 ` rqk , entonces en el k ` 1-ésimo mes tendrá a0 p1 ` rqk ` a0 p1 ` rqk r “ a0 p1 ` rqk p1 ` rq “ a0 p1 ` rqk`1 . Es decir, se tiene una progresión geométrica cuyo primer término (el saldo al primer mes) es a0 p1`rq y cuya razón común es 1`r. En el caso particular de que la inversión inicial es de $6000 y el interés mensual es del 1 % = 1/100, se tiene que el saldo a los n meses será de $6000p1 ` 1{100qn (esto suponiendo que no se hizo retiros ni depósitos y que la tasa no varió). Por ejemplo, el saldo a los 2 años (24 meses) será de $6000p1 ` 1{100q24 « $7618.4. 8.3.5. Ejemplo. Supongamos que en una colonia de bacterias hay 25 y se duplica cada dos días ¿Cuál será la población dentro de 20 días? Solución. Llamémosle a0 “ 25 a la cantidad inicial de bacterias, a1 “ 50 a la cantidad a los 2 días y an al número de bacterias a los 2n días. El número an puede calcularse por la fórmula an “ a1 2n´1 , en particular a10 , el número de bacterias a los 20 días, es 50 ¨ 29 . 8.3.6. Ejemplo. El isótopo del polonio 210 Po tiene una vida media de 140 días, es decir, si 160 8.3. Progresiones geométricas se tiene una cierta cantidad de 210 Po, la mitad se desintegrará en 140 días. Determinemos la cantidad de 210 Po que habrá a los 840 días si actualmente hay 50 mg. Solución. Si actualmente hay 50 mg de 210 Po y medimos el tiempo en unidades de 140 días, entonces deseamos saber la cantidad de 210 Po que habrá a las 6 unidades de tiempo, es decir a los 840 días. Tomando a0 “ 50, a1 “ 25, tendremos que an “ 25 ¨ p1{2qn´1 , en particular la cantidad de 210 Po en mg que habrá a los 840 días será a6 “ 25 ¨ p1{2q5 . En el capítulo 9 se verá un método más general para calcular la cantidad at que debe haber en cualquier tiempo t, sin necesidad de que el tiempo se evalúe en cantidades enteras. Veamos ahora que sucede con expresiones de la forma a1 ` a1 r ` a1 r2 ` ¨ ¨ ¨ ` a1 rn´1 , es decir veamos cómo calcular la suma de los primeros n términos de una progresión geométrica. 8.3.7. Teorema. Sea pa1 , a2 , . . . , ak , . . . q una progresión geométrica cuya razón común es r ‰ 1. n ÿ p1 ´ rn q . ak “ a1 1´r k“1 Es decir n ÿ a1 rk´1 “ a1 k“1 p1 ´ rn q . 1´r Demostración. p1 ´ rq n ÿ k“1 a1 rk´1 “ n ÿ n ÿ a1 rk´1 ´ r k“1 a1 rk´1 “ a1 k“1 ˜ “ a1 ˜ n´1 ÿ rk ´ k“0 es decir n ÿ rk a1 r k“1 rk´1 ´ k“1 ¸ ˜ “ a1 1 ` k“1 n ÿ n ÿ n´1 ÿ ¸ rk k“1 rk ´ k“1 k´1 n ÿ n´1 ÿ ¸ rk ´ rn “ a1 p1 ´ rn q, k“1 a1 p1 ´ rn q “ . 1´r ‚ 8.3.8. Corolario. Si n P N, entonces el polinomio 1 ´ xn se factoriza como ¸ ˜ n´1 ÿ p1 ´ xq 1 ` xk . k“1 Demostración. La demostración se sigue del teorema 8.3.7 tomando a1 “ 1, r “ x y n´1 n ř k ř usando el hecho de que 1 ` x “ xk´1 . ‚ k“1 k“1 8.3.9. Ejemplo. Un hombre desea ahorrar dinero y guarda un centavo el primer día, dos centavos el segundo día, 4 centavos el tercer día y así sucesivamente duplicando la cantidad 8.3. Progresiones geométricas 161 cada día. ¿Cuánto deberá guardar el décimo día? ¿Cuál es el total del dinero ahorrado a los 20 días? ¿A los 40 días? Solución. Tenemos la progresión geométrica pa1 , a1 r, a1 r2 , . . . , a1 rk´1 , . . . q con a1 “ 1 y r “ 2. El décimo día deberá guardar a1 r10´1 , es decir 1 ¨ 29 “ 512 centavos, o lo que es 20 ř lo mismo $5 con 12 centavos. La cantidad de centavos guardados a los 20 días es de 1¨ k“1 k´1 1p1´220 q 1´2 20 “ 2 ´ 1 “ 1048575, es decir tendrá guardado a los 20 días la cantidad 2 “ de $10485 con 75 centavos. Ahora, el número de centavos guardados a los 40 días será de 40 ř 40 q 1 ¨ 2k´1 “ 1p1´2 “ 240 ´ 1 « 1.0995 ¨ 1012 , es decir es una cantidad mayor que un billón 1´2 k“1 de centavos, es decir más de diez mil millones de pesos. Ejercicios. 1. Hallar la décima componente de la progresión geométrica cuyo primer término es 7 y cuya razón común es 4. 2. Hallar la suma de las primeras 10 componentes de la progresión geométrica cuyo primer término es 7 y cuya diferencia común es 4. 3. Hallar la décima componente de la progresión geométrica cuyo primer término es 7 y cuya razón común es 32 . 4. Hallar la suma de las primeras 10 componentes de la progresión geométrica cuyo primer término es 7 y cuya diferencia común es 23 . 162 8.4. 8.4. Convergencia de sucesiones Convergencia de sucesiones Dada una sucesión pa1 , a2 , . . . , ak , . . . q, puede ocurrir que conforme el valor de k es grande, el valor de ak se aproxime a un número a, pudiendo estar el valor de ak tan o más próximo de lo que` queramos al valor de a si tomamos k suficientemente grande. Por ejemplo en la ˘ 1 8 sucesión 2 ` k k“1 “ p3, 52 , 73 , 94 , 11 , 13 , 15 , 17 , 19 , . . . , 2 ` k1 , . . . q el valor de 2 ` k1 se aproxima 5 6 7 8 9 cada vez más a 2 cuando k se hace grande. Sin embargo también puede ocurrir que en una sucesión pb1 , b2 , . . . , bk , . . . q los términos bk no se aproximen a ningún número cuando k crece indefinidamente, por ejemplo en la sucesión p4, 7, 10, 13, 16, 19, . . . , 3k ` 1, . . . q los términos 3k`1 no tienen la tendencia de aproximarse a ningún número cuando k crece indefinidamente. Establezcamos la siguiente definición para poder hablar con más precisión y con un lenguaje menos subjetivo. 8.4.1. Definición. Sea pa1 , a2 , . . . , ak , . . . q una sucesión de números reales. Decimos que la sucesión converge al número real a si para cualquier ε ą 0 existe un número natural N , tal que k ľ N ùñ |ak ´ a| ă ε. Analicemos el significado de la definición anterior. La expresión |ak ´a| ă ε significa que la distancia entre ak y a es menor que el número positivo ε. La expresión k ľ N ùñ |ak ´ a| ă ε significa que si k ľ N , entonces la distancia entre ak y a es menor que ε. Finalmente, el decir que para cualquier ε ą 0 (cualquiera sin importar qué tan pequeño sea) existe un número natural N , tal que k ľ N ùñ |ak ´ a| ă ε significa que si se desea hacer el valor de ak suficientemente cercano al valor de a (|ak ´ a| ă ε con ε «pequeño») basta con tomar k suficientemente grande (k ľ N para algún N ). 8.4.2. Definición. Si ppnq es una proposición que depende de un número n, el decir que ppnq es verdadera para n suficientemente grande significa que existe un número natural N tal que si n ľ N , entonces ppnq es verdadera. Así por ejemplo, la sucesión de números reales pa1 , a2 , . . . , ak , . . . q converge al número a si para todo ε ą 0 se tiene que |ak ´ a| ă ε para k suficientemente grande. ˘8 ` 8.4.3. Ejemplo. Demostremos que la sucesión 2 ` k1 k“1 converge a 2. Sea ε ą 0 (cualquiera sin importar qué tan grande o pequeño sea), por la propiedad arquimediana existe un número natural N tal que N ą 1ε , es decir N1 ă ε, de modo que si k ľ N , tenemos que ˇˆ ˇ ˇ ˇ ˙ ˇ ˇ ˇ1ˇ 1 1 1 |ak ´ 2| “ ˇˇ 2 ` ´ 2ˇˇ “ ˇˇ ˇˇ “ ĺ ă ε, k k k N ˘8 ` es decir la sucesión 2 ` k1 k“1 converge a 2. 8.4.4. Ejemplo. Veamos ahora que la sucesión p3k ` 1q8 k“1 no converge a ningún número. Para esto sea b un número real cualquiera y veamos que p3k ` 1q8 k“1 no converge a b. Sea N0 un número natural tal que 3N0 ą b. Tenemos que si k ľ N0 , entonces p3k ` 1q ´ b ľ 3N0 ` 1 ´ b ą b ` 1 ´ b “ 1, es decir |p3k ` 1q ´ b| ą 1 si k ľ N0 , 8.4. Convergencia de sucesiones 163 de modo que si tomamos ε “ 1 no existe ningún número natural N tal que k ľ N ùñ |p3k ` 1q ´ b| ă 1, puesto que si tomamos k mayor que N y que N0 , entonces k ľ N y |p3k ` 1q ´ b| ą 1. Por lo tanto la sucesión p3k ` 1q8 k“1 no converge a ningún número b. Veamos a continuación algo de terminología y algunas reglas para la convergencia de sucesiones. 8.4.5. Notación. Al hecho de que una sucesión pak q8 k“1 converja a un número a lo denotamos así lím ak “ a, kÑ8 la cual es una expresión que se lee «el límite cuando k tiende a infinito de ak es a». Al hecho de que la sucesión anterior converja a a también se le denota como ak ÝÑ a cuando k ÝÑ 8, lo cual se puede expresar diciendo «ak tiende a a cuando k tiende a infinito». 8.4.6. Definición. Si una sucesión no converge a ningún número decimos que diverge o que es divergente. Cuando una sucesión converge a algún número decimos que es convergente. 8.4.7. Teorema. Sea c un número. La sucesión constante pcq8 k“1 converge al número c. Demostración. En efecto, si ε ą 0, entonces |c ´ c| “ 0 ă ε, es decir por ejemplo k ľ 1 ùñ |c ´ c| ă ε. ‚ ` 1 ˘8 8.4.8. Teorema. La sucesión k k“1 converge a 0. Demostración. Sea ε ą 0. Por la propiedad arquimediana existe un número natural N ą 1ε . Tenemos que si k ľ N , entonces k1 ĺ N1 ă ε, pero k1 “ | k1 ´0|, por lo que k ľ N ùñ | k1 ´0| ă ε. ` ˘8 Por lo tanto k1 k“1 converge a 0. ‚ 8.4.9. Teorema. Sea c un número y pak q8 k“1 una sucesión que converge a un número a. La 8 sucesión pc ¨ ak qk“1 converge a c ¨ a. Demostración. Si c “ 0, entonces c ¨ ak “ 0 y c ¨ a “ 0, por lo que debido al teorema 8.4.7 c ¨ ak ÝÑ c ¨ a cuando k ÝÑ 8. Supongamos que c ‰ 0 y sea ε ą 0. Como ak ÝÑ a cuando ε k ÝÑ 8, existe un número natural N tal que si k ľ N , entonces |ak ´ a| ă |c| , pero esta última desigualdad es equivalente a |c ¨ ak ´ c ¨ a| ă ε, por lo tanto c ¨ ak ÝÑ c ¨ a cuando k ÝÑ 8. ‚ ` 5 ˘8 8.4.10. Ejemplo. La sucesión ´ n n“1 converge a p´5q ¨ 0 “ 0 debido a los teoremas 8.4.8 y 8.4.9. 8 8.4.11. Teorema. Sean pak q8 k“1 y pbk qk“1 dos sucesiones que convergen a los números a y b respectivamente. La sucesión pak ` bk q8 k“1 converge al número a ` b. Demostración. Sea ε ą 0. Existen dos números naturales N1 y N2 tales que si k ľ N1 , entonces |ak ´ a| ă 2ε y si k ľ N2 , entonces |bk ´ b| ă 2ε . Ahora, tomando k ľ N1 ` N2 y 164 8.4. Convergencia de sucesiones usando la desigualdad del triángulo, tenemos que |pak ` bk q ´ pa ` bq| “ |pak ´ aq ` pbk ´ bq| ‚ ĺ |ak ´ a| ` |bk ´ b| ă 2ε ` 2ε “ ε, por lo tanto ak ` bk ÝÑ a ` b cuando k ÝÑ 8. 8.4.12. Ejemplo. La sucesión p3 ` n5 q8 k“1 converge a 3 + 0 = 3. 8 8.4.13. Teorema. Sean pak q8 k“1 y pbk qk“1 dos sucesiones que convergen a los números a y b respectivamente. La sucesión pak ¨ bk q8 k“1 converge al número a ¨ b. Demostración. Sea ε ą 0 y ε0 “ míntε, 21 u. Tomemos dos números naturales N1 y N2 tales que ε0 k ľ N1 ùñ |ak ´ a| ă 1 ` |a| ` |b| y ε0 k ľ N2 ùñ |bk ´ b| ă . 1 ` |a| ` |b| Si k ľ N1 ` N2 , entonces k ľ N1 y k ľ N2 , por lo tanto |ak bk ´ ab| “ |pak bk ´ ak bq ` pak b ´ abq| ĺ |ak bk ´ ak b| ` |ak b ´ ab| “ |ak ||bk ´ b| ` |b||ak ´ a|. Ahora, como |ak | ´ |a| ĺ |ak ´ a| ă ε0 1`|a|`|b| ĺ ε0 tenemos que |ak | ă ε0 ` |a|, por lo tanto |ak bk ´ ab| ĺ pε0 ` |a|q|bk ´ b| ` |b||ak ´ a| ă pε0 ` |a|q ă ε0 ε0 ` |b| 1 ` |a| ` |b| 1 ` |a| ` |b| p1 ` |a|qε0 ` |b|ε0 “ ε0 ĺ ε. 1 ` |a| ` |b| Por lo tanto ak bk ÝÑ ab cuando k ÝÑ 8. ‚ 8.4.14. Corolario. Sea pak q8 k“1 una sucesión que converge a un número a, entonces si n es n un número natural, la sucesión pank q8 k“1 converge al número a . Demostración. La demostración se hace por inducción matemática y utilizando el teorema 8.4.13. ‚ 8.4.15. Teorema. Sea pak q8 k“1 una sucesión de términos diferentes de 0 que converge a un 1 número a ‰ 0. La sucesión p a1k q8 k“1 converge a a . ) ! 2 Demostración. Para ε ą 0 sea N P N tal que si k ľ N , entonces |ak ´ a| ă mín εa2 , |a| . 2 Con estas condiciones tenemos ˇ ˇ ˇ ˇ ˇ1 ˇ ˇ a ˇ |ak ´ a| 1 a k ˇ ´ ˇ“ˇ ˇ ˇ ak a ˇ ˇ ak a ´ ak a ˇ “ |ak a| , por otra parte |a| ´ |ak | ĺ |ak ´ a| ă |a|{2, por lo que |ak | ą |a|{2, y así ˇ ˇ a2 ˇ1 ˇ 1 ˇ ´ ˇ “ |ak ´ a| ă |ak ´ a| ă ε 22 “ ε, ˇ ak a ˇ |a| a |ak a| |a| 2 2 concluyendo que 1 ak ÝÑ 1 a cuando k ÝÑ 8. ‚ 8.4. Convergencia de sucesiones 165 Una consecuencia directa de los teoremas 8.4.13 y 8.4.15 es el siguiente teorema. 8 8.4.16. Teorema. Sean pak q8 k“1 y pbk qk“1 sucesiones que convergen a a y b respectivamente, ´ ¯8 ak con b ‰ 0 y los términos de la sucesión pbk q8 son diferentes de cero. La sucesión k“1 bk k“1 converge al número ab . ´ 2 ¯8 2n `3n´1 8.4.17. Ejemplo. Veamos si la sucesión converge. El n-ésimo término de la 5n2 `n sucesión es 2n2 `3n´1 5n2 `n por lo que converge a “ 1 n2 por lo que también 2n2 `3n´1 5n2 `n 2 . 5 3 2` n ´ 1 5` n 1 n2 n“1 . Ahora 3 n ÝÑ 0 cuando n ÝÑ 8; ÝÑ 0 cuando n ÝÑ 8. Por otra parte 5 ` “ 3 ´ 2` n 1 5` n 1 n2 ÝÑ 2 5 1 n 1 n ÝÑ 0 cuando n ÝÑ 8, ÝÑ 5 cuando n ÝÑ 8, ´ 2 ¯8 cuando n ÝÑ 8; es decir la sucesión 2n5n`3n´1 2 `n n“1 1 8.4.18. Teorema. Si pak q8 k“1 es una sucesión que converge a los números a y a , entonces a “ a1 . Es decir, si lím ak existe, este límite es único. kÑ8 1 Demostración. Supongamos que pak q8 k“1 converge a a y a a la vez. Para cualquier ε ą 0 1 existen N, N P N tales que ε 2 kľN ùñ |ak ´ a| ă k ľ N1 ùñ ε |ak ´ a1 | ă . 2 y Ahora, tomando k ľ N ` N 1 tenemos |a ´ a1 | “ |pa ´ ak q ` pak ´ a1 q| ĺ |a ´ ak | ` |ak ´ a1 | ă ε ε ` “ ε, 2 2 con lo que para todo ε ą 0 se tiene que |a ´ a1 | ă ε. Así, es imposible que a ‰ a1 puesto que si fueran diferentes, entonces |a ´ a1 | ą 0 y tomando ε “ |a ´ a1 |{2 tendríamos que 0 ă |a ´ a1 | ă |a ´ a1 |{2, lo cual es imposible y con esto el teorema queda demostrado. ‚ 8 8.4.19. Teorema. Una sucesión pak q8 k“1 converge a cero si y sólo si p|ak |qk“1 converge a cero. Demostración. La demostración es directa de la definición de convergencia. Supongamos que ak ÝÑ 0 cuando k ÝÑ 8. Para todo ε ą 0, existe un N P N tal que k ľ N ùñ |ak ´ 0| ă ε, pero |ak ´ 0| ă ε ðñ |ak | ă ε ðñ ||ak | ´ 0| ă ε 6 ak ÝÑ 0 cuando k ÝÑ 8 ùñ |ak | ÝÑ 0 cuando k ÝÑ 8. Supongamos ahora que |ak | ÝÑ 0 cuando k ÝÑ 8. Para todo ε ą 0, existe un N P N tal que k ľ N ùñ ||ak | ´ 0| ă ε , pero ||ak | ´ 0| ă ε ðñ |ak | ă ε ðñ |ak ´ 0| ă ε 6 |ak | ÝÑ 0 cuando k ÝÑ 8 ùñ ak ÝÑ 0 cuando k ÝÑ 8. ‚ 166 8.5. Tipos de divergencia 8.5. Tipos de divergencia Antes de seguir con el estudio de las sucesiones demos algo de terminología. 8.5.1. Definición. Al conjunto de los números reales le añadiremos dos objetos diferentes que no son números reales, uno de los cuales lo denotaremos como ´8 y le llamaremos menos infinito, y al otro lo denotaremos como `8 y le llamaremos más infinito. Al conjunto R Y t´8, `8u le llamaremos el conjunto extendido de los números reales. Extenderemos a R Y t´8, `8u la relación de orden estricto ă estableciendo que x ă `8, ´8 ă `8, y ´8 ă x para todo número real x, es decir cualquier número real será menor que `8, y ´8 será menor que cualquier número real (para el caso en que x e y sean números reales la expresión x ă y seguirá teniendo el mismo significado que ya tenía). El símbolo ą seguirá denotando la relación inversa de ă, pero ahora en el conjunto extendido de los números reales, es decir a ą b si y sólo si b ă a. Para dos elementos a y b en el conjunto extendido de los números reales la expresión a ĺ b significará que a ă b ó que a “ b, similarmente la expresión a ľ b significará que a ą b ó que a “ b. Cuando un conjunto A de números reales no está acotado superiormente por ningún número real, decimos que el supremo de tal conjunto, denotado por sup A, es `8. Cuando un conjunto B de números reales no está acotado inferiormente por ningún número real, decimos que el ínfimo de tal conjunto, denotado por ínf B, es ´8. Cuando decimos que un subconjunto de números reales no tiene supremo o que no tiene ínfimo nos referimos a que no tiene supremo o ínfimo en R, aunque siempre tendrá supremo e ínfimo en R Y t´8, `8u. 8.5.2. Definición. Decimos que una sucesión pak q8 k“1 diverge a `8 ó que converge a `8 si para todo M ą 0 existe un N P N tal que kľN ùñ ak ą M. La idea de la definición anterior es que el valor absoluto de ak puede hacerse suficientemente grande (alejado del cero y con valores positivos) si tomamos k suficientemente grande. 8.5.3. Ejemplo. La sucesión p 34 kq8 k“1 diverge a `8. En efecto, sea M ą 0, por la propiedad arquimediana, existe un entero positivo N tal que 43 N ą M , así k ľ N ùñ 34 k ľ 34 N ą M , por lo tanto p 34 kq8 k“1 diverge a `8. 8.5.4. Definición. Decimos que una sucesión pak q8 k“1 diverge a ´8 o que converge a ´8 si para todo M ă 0 existe un N P N tal que kľN ùñ ak ă M. 8.5.5. Ejemplo. La sucesión p3 ´ 5nq8 n“1 diverge a ´8. En efecto, si M ă 0 tomemos N P N tal que 5N ą ´M ` 3. Así, n ľ N ùñ 5n ľ 5N ą ´M ` 3, por lo que ´5n ă M ´ 3, es decir 3 ´ 5n ă M . El lector debe poder demostrar el siguiente teorema. 8 8.5.6. Teorema. La sucesión pak q8 k“1 diverge a `8 si y sólo si la sucesión p´ak qk“1 diverge a ´8. 8 8.5.7. Teorema. Si c ą 0 y pak q8 k“1 diverge a `8, entonces pc ¨ ak qk“1 diverge a `8. 8.5. Tipos de divergencia 167 Demostración. Sea M ą 0 y N P N tal que k ľ N ùñ ak ą M {c. La última desigualdad equivale a c ¨ ak ą M , por lo tanto la sucesión pc ¨ ak q8 ‚ k“1 diverge a `8. Al hecho de que una sucesión pak q8 k“1 diverja a `8 lo denotamos así ak ÝÑ `8 cuando k ÝÑ 8, lo cual se lee «ak tiende a más infinito cuando k tiende a infinito», o bien lím ak “ `8, kÑ8 lo cual se lee «el límite cuando k tiende a más infinito de ak es más infinito». Similarmente si la sucesión pak q8 k“1 diverge a ´8 lo denotaremos así ak ÝÑ ´8 cuando k ÝÑ 8 o bien lím ak “ ´8. kÑ8 8 8 8.5.8. Teorema. Si pak q8 k“1 y pbk qk“1 divergen a `8, entonces pak ` bk qk“1 diverge a `8. Demostración. Para M ą 0 sean N1 , N2 P N tales que k ľ N1 ùñ ak ą M y k ľ N2 ùñ bk ą M . Si k ľ N1 ` N2 , entonces ak ` bk ą 2M ą M , por lo tanto ak ` bk ÝÑ `8 cuando k ÝÑ 8. ‚ 8 8 8.5.9. Teorema. Si pak q8 k“1 y pbk qk“1 divergen a `8, entonces pak ¨ bk qk“1 diverge a `8. Demostración. Para M ą 0 sean N1 , N2 P N tales que k ľ N1 ùñ ak ą M y k ľ N2 ùñ bk ą 1. Si k ľ N1 ` N2 , entonces ak ¨ bk ą M ¨ 1 “ M , por lo tanto ak ¨ bk ÝÑ `8 cuando k ÝÑ 8. ‚ 8 8.5.10. Teorema. Si pak´q8 k“1¯es una sucesión de términos diferentes de cero, entonces pak qk“1 converge a 0 si y sólo si 1 |ak | 8 k“1 diverge a `8. Demostración. Supongamos que pak q8 k“1 converge a 0. Para M ą 0 podemos tomar un número´natural N tal que k ľ N ùñ |a k ´ 0| ă 1{M , es decir k ľ N ùñ 1{|ak | ą M , por ¯ lo que 1 |ak | 8 diverge a `8. ´ ¯8 Supongamos ahora que |a1k | k“1 natural N tal que k ľ N ùñ pak q8 k“1 converge a 0. diverge a `8. Para ε ą 0 podemos tomar un número k“1 1{|ak | ą 1{ε, es decir k ľ N ùñ |ak ´ 0| ă ε, por lo que ‚ Veamos ahora qué sucede con la suma de dos sucesiones, una de las cuales converge y la otra diverge a `8 ó con el producto de dos sucesiones, una de las cuales converge a un número positivo y la otra diverge a `8. 8 8.5.11. Teorema. Sean pak q8 k“1 y pbk qk“1 dos sucesiones tales que la primera converge a un número a y la segunda diverge a `8. La sucesión pak ` bk q8 k“1 diverge a `8. Demostración. Para M ą 0 sean N1 y N2 números naturales tales que k ľ N1 ùñ |ak ´ a| ă 1 y k ľ N2 ùñ bk ą M ` 1 ´ a. Si k ľ N1 ` N2 , entonces ´1 ă ak ´ a ă 1, lo 168 8.5. Tipos de divergencia cual implica que a ´ 1 ă ak . Pero si k ľ N1 ` N2 , tenemos también que bk ą M ` 1 ´ a, por lo que ak ` bk ą M , por lo tanto la sucesión pak ` bk q8 ‚ k“1 diverge a `8. 8 8.5.12. Teorema. Sean pak q8 k“1 y pbk qk“1 dos sucesiones tales que la primera converge a un número a ą 0 y la segunda diverge a `8. La sucesión pak ¨ bk q8 k“1 diverge a `8. Demostración. Para M ą 0 sean N1 y N2 números naturales tales que k ľ N1 ùñ |ak ´ a| ă a{2 (es decir ´a{2 ă ak ´ a ă a{2) y k ľ N2 ùñ bk ą 2M {a. Ahora, si k ľ N1 ` N2 , entonces bk ą 2M {a y ak ą a{2, por lo que ak ¨ bk ą pa{2qp2M {aq “ M , por lo ‚ tanto la sucesión pak ¨ bk q8 k“1 diverge a `8. Quisiéramos saber si sucesiones como pp1{3qn q8 n“1 convergen o divergen, y en caso de que converjan saber a dónde convergen. Inspeccionemos un poco el comportamiento de esta sucesión. pp1{3qn q8 n“1 “ p1{3, 1{9, 1{27, 1{81, 1{243, 1{729, 1{2187, 1{6561, . . . q de manera que podemos «sospechar» que la sucesión converge a cero. El teorema siguiente nos da un criterio más general. 8.5.13. Teorema. I) Si |r| ă 1, entonces rn ÝÑ 0 cuando n ÝÑ 8. II) Si |r| ą 1, entonces la sucesión prn q8 n“1 diverge. III) Si r ą 1, entonces rn ÝÑ `8 cuando n ÝÑ 8. Demostración. Demostraremos primero III), luego I) y finalmente II). III) Si r ą 1, entonces r ´ 1 ą 0, por lo que n n r “ p1 ` pr ´ 1qq “ n ˆ ˙ ÿ n k“0 k pr ´ 1qk ľ 1 ` npr ´ 1q. Para M ą 0 sea N P N tal que N pr ´ 1q ą M . Si n ľ N , entonces rn ľ 1 ` npr ´ 1q ľ 1 ` N pr ´ 1q ą M . Por lo tanto rn ÝÑ `8 cuando n ÝÑ 8. I) Si |r| ă 1, entonces 1{|r| ą 1, por lo que debido a III) 1{|rn | “ |1{r|n ÝÑ `8 cuando n ÝÑ 8 y por el teorema 8.5.10 tenemos que rn ÝÑ 0 cuando n ÝÑ 8. II) Sea |r| ą 1. Procedamos por contradicción. Suponiendo que prn q8 n“1 convergiera a algún número real x, en tal caso, para ε “ 1 existiría un número natural N1 tal que si n ľ N1 entonces |rn ´ x| ă 1, es decir ´1 ă rn ´ x ă 1. Pero por III) |r|n ÝÑ `8 cuando n ÝÑ 8, por lo que para M “ 1 ` |x| existe un número natural N2 tal que si n ľ N2 , entonces |r|n ą 1 ` |x|. Tomemos n “ 2pN1 ` N2 q. Es claro que n ľ N1 , N2 y que n es par, por lo que rn “ |r|n ą 1 ` |x| ľ 1 ` x, es decir rn ´ x ą 1, contradiciendo el hecho de que ´1 ă rn ´ x ă 1. ‚ Observemos que si |r| ą 1 pero r es negativo, entonces la sucesión prn q8 n“1 diverge pero n 8 no diverge ni a `8 ni a ´8. Si r “ 1, entonces la sucesión pr qn“1 converge a 1. Si r “ ´1, la sucesión prn q8 n“1 diverge pero el tipo de divergencia no hace que el valor absoluto de los términos crezca indefinidamente, sino que es del tipo «oscilante», es decir pp´1qn q8 n“1 “ p´1, 1, ´1, 1, ´1, 1, ´1, 1, . . . q. 8.5. Tipos de divergencia 169 Terminemos esta sección con el siguiente teorema. ? 8.5.14. Teorema. Si a ą 0, entonces n a ÝÑ 1 cuando n ÝÑ 8. Demostración. Supongamos primero que a ą ?1. Como ya sabemos (teorema 7.3.5), si ? 1{N 1{n N n nľN , entonces a ľ a ą 1, es decir a ľ ? a ą 1. Sea ε ą 0. Si existe un N P N tal ? ? ? N n N n que a ă 1 ` ε, ?entonces n ľ N ùñ 1 ´ ε ă 1 ă a ĺ a ă 1 ` ε, por lo que | a ´ 1| ă ε no existiera ningún N P N tal que y?la sucesión p n aq8 n“1 converge a 1. Si por el contrario,? N N a ă 1 ` ε, es decir si para todo N P N, tuviéramos a ľ 1 ` ε, entonces p1 ` εqN ĺ a para todo N P N, contradiciendo el hecho de que p1 ` εqn ÝÑ `8 cuando n ÝÑ 8. Por lo ? tanto n a ÝÑ 1 cuando n ÝÑ 8. b 1 n 1 ÝÑ 1 cuando Supongamos ahora que 0 ă a ă 1. En este caso a1 ą 1, por lo que ? na “ a ? n n ÝÑ 8. Así, por el teorema 8.4.15, a ÝÑ 1 cuando n ÝÑ 8. ? n Finalmente, si a “ 1, entonces a “ 1 ÝÑ 1 cuando n ÝÑ 8, con lo que terminamos la demostración del teorema. ‚ Ejercicios. 1. Decir si una progresión aritmética con diferencia común d ‰ 0 y con componente inicial a0 es una sucesión convergente. En caso de que sea convergente decir a que valor converge. 2. Decir si una progresión geométrica con razón común r ą 0 y componente inicial a0 ‰ 0 es una sucesión convergente. En caso de que sea convergente decir a que valor converge. 3. Decir si una progresión geométrica con razón común r “ 1 y componente inicial a0 es una sucesión convergente. En caso de que sea convergente decir a que valor converge. 4. Decir si una progresión geométrica con razón común r “ ´1 y componente inicial a0 ‰ 0 es una sucesión convergente. En caso de que sea convergente decir a que valor converge. 5. Decir si una progresión geométrica con razón común r mayor que ´1 y menor que 1, y componente inicial a0 es una sucesión convergente. En caso de que sea convergente decir a que valor converge. 2 2 8 qi“0 “ p1, 23 , 21 , 25 , 13 , 27 , 41 , . . . , i`2 , . . . q converge y, en caso de que 6. Decir si la sucesión p i`2 converja, decir a qué número converge. 7. Decir si la sucesión p 2i`1 q8 converge y, en caso de que converja, decir a qué número 3i`2 i“0 converge. 3 `1 8 8. Decir si la sucesión p 2i3i`2 qi“0 converge y, en caso de que converja, decir a qué número converge. ? ? 9. Demostrar que la sucesión p n ` 1 ´ nq8 n“1 converge a cero. 170 8.6. Series 8.6. Series 8.6.1. Definiciones y notaciones. Sea j un número entero, la sucesión de sumas parcian ř 8 , donde s “ ak (recordemos se define como la sucesión ps q les de una sucesión pak q8 n n n“j k“j k“j que sn “ n ř ak “ aj ` aj`1 ` ¨ ¨ ¨ ` an ). Una suma infinita o serie es una expresión de la k“j forma 8 ÿ ak “ aj ` aj`1 ` aj`2 ` ¨ ¨ ¨ ` ak ` ¨ ¨ ¨ . k“j 8 Cuando la sucesión de sumas parciales psn q8 n“1 de la sucesión pak qk“1 converge a un número 8 ř s, decimos que la serie ak es convergente o que converge a s y además representará al k“1 número s, es decir 8 ř ak “ s. Si la serie k“1 8 ř ak no converge a ningún número decimos que k“1 diverge o que la serie es divergente. Si la sucesión de sumas parciales psn q8 n“1 diverge a `8 ó a ´8, entonces decimos que la serie diverge a `8 ó a ´8 respectivamente y además 8 8 ř ř denotamos ak “ `8 ó ak “ ´8 respectivamente según sea el caso. Al número aj se k“1 k“1 le llama el j-ésimo término de la serie 8 ř ak y al número sn “ k“1 suma parcial de la serie 8 ř n ř ak se le llama la n-ésima k“1 ak . k“1 Veamos algunos ejemplos de series. n 8 ř ř 1 1 tiene como n-ésima suma parcial a sn “ . Ahora, 8.6.2. Ejemplo. La serie 2k´1 2k´1 k“1 k“1 ` 1 ˘8 como 2k´1 es una progresión geométrica, tenemos por el teorema 8.3.7 que k“1 ˆ ˆ ˙n ˙ 1 ´ p 12 qn 1 “2 1´ , sn “ 1 2 1´ 2 por lo tanto sn ÝÑ 2 cuando n tiende a 8, de manera que la serie 8 ř k“1 decir 8 ř k“1 1 2k´1 1 2k´1 converge a 2, es “ 1 ` 1{2 ` 1{4 ` 1{8 ` 1{16 ` 1{32 ` ¨ ¨ ¨ “ 2. 8.6.3. Ejemplo. Tomemos ahora la progresión aritmética p3 ` 5kq8 k“1 que se puede expresar en la forma p8 ` pk ´ 1q5q8 , donde la primera componente es 8 y la diferencia común es 5. k“1 De acuerdo al teorema 8.2.4 tenemos que n ÿ p3 ` 5kq “ k“1 de donde se puede ver que la serie n ř n p2 ¨ 8 ` pn ´ 1q ¨ 5q, 2 p3 ` 5kq diverge a `8. k“1 8.6. Series 171 La demostración del siguiente teorema se deja de ejercicio al lector. 8 8 ř ř 8.6.4. Teorema. Si ak y bk son series convergentes y c es un número, entonces k“1 8 ÿ k“1 pak ` bk q “ k“1 8 ÿ ak ` k“1 8 ÿ bk 8 ÿ y k“1 c ¨ ak “ c ¨ k“1 8 ÿ ak . k“1 8.6.5. Definición. Las series cuyos términos son las componentes de una progresión aritmética se llaman series aritméticas y las series cuyos términos son las componentes de una progresión geométrica se llaman series geométricas, es decir las series geométricas son series de la forma 8 ÿ ark´1 “ a ` ar ` ar2 ` ar3 ` ¨ ¨ ¨ ` ark´1 ` ark ` ¨ ¨ ¨ . k“1 8.6.6. Teorema. I) Si |r| ă 1, la serie 8 ř rk´1 converge a k“1 II) Si |r| ľ 1, la serie 8 ř 1 . 1´r rk´1 diverge. k“1 Demostración. Demostremos primero I) y después II). I) Por el teorema 8.3.7 la n-ésima suma parcial de la serie 8 ř k“1 rk´1 es n ř rk´1 “ k“1 1´rn , 1´r 1 pero si |r| ă 1, entonces rn ÝÑ 0 cuando n ÝÑ 8, por lo tanto la serie converge a 1´r . II) Para demostrar esta parte veamos las tres diferentes posibilidades siguientes: a) |r| ą 1, c) r “ ´1. ` 1´rn ˘8 no converge, puesto que a) Si |r| ą 1, la sucesión de sumas parciales psn q8 n“1 “ 1´r n“1 n 8 “ pr q si convergiera también lo haría la sucesión ppr ´ 1qsn ` 1q8 n“1 n“1 , la cual sabemos que no converge debido al teorema 8.5.13. n n ř ř b) Si r “ 1 entonces rk´1 “ 1 “ n ÝÑ `8 cuando n ÝÑ 8. k“1 b) r “ 1 y k“1 c) Si r “ ´1 entonces # rk´1 “ p´1qk´1 “ 1 si k es impar, ´1 si k es par, de donde se puede ver que psn q8 n“1 no converge, ¡verificarlo! ‚ 8.6.7. Ejemplo. Una pelota tiene una elasticidad tal que al soltarla de una altura h, después de rebotar con el suelo alcanza una altura de 34 h. Si la pelota se suelta de 3 m. de altura y se deja que rebote sin interrupción indefinidamente ¿cuál es la longitud total de la trayectoria recorrida? 172 8.6. Series Solución. Si se suelta de una altura h, en el primer ciclo del recorrido la pelota queda a una altura de 34 h, habiendo recorrido h ` 34 h “ 47 h. En el segundo ciclo la pelota recorrerá 3 9 h ` 34 p 34 hq “ p 21 qh quedando al final del ciclo a una altura de 16 h. En el n-ésimo ciclo la 4 16 ` 3 ˘n´1 ` ˘n´1 pelota comenzará a descender de una altura de 4 h y recorrerá 34 h ` 34 p 34 qn´1 h “ 3 3 n´1 7 3 n´1 p 4 ` 1qp 4 q h “ 4 p 4 q h, de modo que el recorrido total de la pelota será de ˆ ˙n´1 8 ˆ ˙n´1 8 ÿ 7 ÿ 3 7 1 7 3 h“ h “ h 4 4 4 n“1 4 4 1´ n“1 3 4 7 1 “ h 1 “ 7h. 4 4 Así, si la pelota se suelta a una altura de 3 m., recorrerá un total de 21 m. (En este ejemplo se supuso un movimiento perpetuo). 8 ř 8.6.8. Teorema. Si una serie ak converge a un número real, entonces la sucesión pak q8 k“1 k“1 converge a 0. 8 ř Demostración. Sea s el número al cual converge la serie ak y N un número natural tal k“1 ˇ ˇ n ˇř ˇ que si n ľ N , entonces ˇˇ ak ´ sˇˇ ă 2ε . Si tomamos n ľ N ` 1, tendremos que n, n ´ 1 ľ N , k“1 por lo cual ˇ ˇ ˇ ˇ˜ ¸ ˜ ¸ˇ ˇ n n´1 n ˇ ˇn´1 ˇ ˇ ˇÿ ˇ ÿ ÿ ˇ ˇÿ ˇ ˇ ˇ ˇ ak ´ s ˇ ak ´ s ´ ak ´ s ˇ ĺ ˇ ak ´ s ˇ ` ˇ |an | “ ˇ ˇ ˇk“1 ˇ ˇ ˇk“1 ˇ k“1 k“1 ε ε ă ` “ ε, 2 2 de donde concluimos que la sucesión pak q8 k“1 converge a 0. 8 ř 1 8.6.9. Definición. A la serie se le llama serie armónica. n ‚ n“1 8.6.10. Teorema. La serie armónica 8 ř n“1 1 n diverge a `8. N ř Demostración. Sea M ą 0 y veamos que existe un N P N tal que n“1 entonces 1 n ą M . Si r P N ˜ i`1 ¸ ˜ i`1 ¸ r´1 r´1 r´1 2r r´1 2ÿ 2ÿ ÿ ÿ ÿ ÿ 2i`1 ´ 2i ÿ1 1 1 1 ľ1` “ 1 ` “ 1 ` “1` n n 2i`1 2i`1 2 n“1 i“0 i“0 i“0 i“0 n“2i `1 n“2i `1 r r “1` ą , 2 2 de manera que si tomamos r suficientemente grande, de modo tal que N “ 2r , entonces para todo m ľ N tenemos que m 2r ÿ ÿ 1 1 r ľ ą ą M, n n“1 n 2 n“1 r 2 ą M , y tomamos 8.6. Series de manera que la serie armónica diverge a `8. 173 ‚ Ejercicios. 1. ¿Bajo qué condiciones es convergente una serie cuyos términos son las componentes de una progresión aritmética? 2. ¿Bajo qué condiciones es convergente una serie cuyos términos son las componentes de una progresión geométrica? 3. Dadas las series siguientes, decir si son convergentes y, en caso de que lo sean, decir a qué número converge. 8 ˆ ˙k 8 ˆ ˙2k 8 ˆ ˙2k 8 ˆ ˙k ÿ ÿ ÿ ÿ 2 2 3 2 , b) , c) , d) , a) 3 3 3 2 k“1 k“0 k“0 k“0 ˜c ¸3j ˆ ˙2k`3 8 8 8 8 ˆ ˙3k`2 ÿ ÿ ÿ ÿ ? k 2 1 3 2 5 2p 3q , h) , f) , g) e) , 3 4 3 j“3 k“3 k“0 k“0 n ˙ ˆ ˙ ˆ ˙ ˆ 2n 2t´3 8 8 8 8 ÿ? ÿ 1 2 ÿ 5 ÿ 5 ´1 , j) π , k) , l) . i) 3 6 4 i`2 t“1 n“0 n“1 i“3 174 8.7. 8.7. Criterios de convergencia Criterios de convergencia 8.7.1. Definición. Decimos que pak q8 k“1 es una sucesión creciente o estrictamente creciente si para todo k P N se tiene que ak ă ak`1 . Decimos que pak q8 k“1 es una sucesión decreciente o estrictamente decreciente si para todo k P N se tiene que ak ą ak`1 . Decimos que pak q8 k“1 es una sucesión no decreciente si para todo k P N se tiene que ak ĺ ak`1 . Decimos que pak q8 k“1 es una sucesión no creciente si para todo k P N se tiene que ak ľ ak`1 . 8 8.7.2. Definición. Sea pak q8 k“1 una sucesión y pnk qk“1 una sucesión creciente de números 8 naturales. Decimos que la sucesión pank qk“1 es una subsucesión de pak q8 k“1 . 8.7.3. Teorema. Si pak q8 k“1 es una sucesión que converge a un número x, entonces toda 8 subsucesión de pak qk“1 converge a x. Demostración. Como xk ÝÑ x cuando k ÝÑ 8, entonces para todo ε ą 0 existe un N P N tal que kľN ùñ |ak ´ x| ă ε. Sea pnk q8 k“1 una sucesión creciente de números naturales. Como nk ľ k ¡verificarlo! entonces k ľ N ùñ nk ľ N ùñ |ank ´ x| ă ε 6 ank ÝÑ x cuando k ÝÑ 8. ‚ ˚ 8.7.4. Definición. Una sucesión pak q8 k“1 es acotada si existe un a P R tal que para todo k P N se tiene que |ak | ĺ a˚ . En este caso al número a˚ se le llama cota de la sucesión pak q8 k“1 . Observemos que una sucesión es acotada si y sólo si su recorrido es un conjunto acotado. ˚ 8.7.5. Definición. Una sucesión pak q8 k“1 es acotada superiormente si existe un a P R tal que para todo k P N se tiene que ak ĺ a˚ . En este caso al número a˚ se le llama cota superior de la sucesión pak q8 k“1 . ˚ 8.7.6. Definición. Una sucesión pbk q8 k“1 es acotada inferiormente si existe un b P R tal que para todo k P N se tiene que b˚ ĺ bk . En este caso al número b˚ se le llama cota inferior de la sucesión pbk q8 k“1 . 8.7.7. Teorema. Toda sucesión convergente es acotada. Demostración. Sea pak q8 k“1 una sucesión que converge a un número a. Existe un N P N tal queřsi n ľ N , entonces |an ´ a| ă 1, por lo que |an | ă 1 ` |a|. Ahora, si n ă N , entonces |an | ĺ N k“1 |ak |, por lo tanto para todo n P N |an | ĺ 1 ` |a| ` N ÿ |ak |, k“1 de tal modo que pak q8 k“1 es una sucesión acotada. ˘8 ` 8.7.8. Ejemplo. La sucesión k2 ` 5 k“1 que converge a 5 tiene como cota a 7. ‚ 8.7.9. Teorema. Cualquier sucesión no decreciente y acotada superiormente es convergente. Además converge al supremo de su recorrido. Demostración. Sea pak q8 k“1 una sucesión no decreciente y acotada. Sea α el supremo del recorrido de la sucesión, es decir α :“ suptak : k P Nu. Veamos que ak ÝÑ α cuando k ÝÑ 8. 8.7. Criterios de convergencia 175 Supongamos que la sucesión pak q8 k“1 no converja a α, entonces existe un ε ą 0 tal que para todo N P N existe un k ľ N tal que |ak ´ α| ľ ε, es decir ak ´ α ľ ε ak ´ α ĺ ´ε, ó o equivalentemente ak ľ ε ` α ak ĺ α ´ ε. ó Ahora, si ak ľ ε ` α, entonces ak ą α, lo cual es imposible pues α es una cota superior de la sucesión. Ahora, sea n un número natural. Si n ĺ k, entonces, como la sucesión es no decreciente, tenemos que an ĺ ak ĺ α ´ ε, es decir an ĺ α ´ ε. Si n ľ k, entonces existe un n1 ľ n tal que an1 ĺ α ´ ε, por lo que an ĺ an1 ĺ α ´ ε. Con lo cual tenemos que para todo número natural n, an ĺ α ´ ε ă α, lo que contradice que α “ suptak : k P Nu, por lo tanto ak ÝÑ α cuando k ÝÑ 8. ‚ 8.7.10. Corolario. Cualquier sucesión no creciente y acotada inferiormente es convergente. Demostración. Sea pak q8 k“1 una sucesión no creciente y acotada inferiormente. Observemos 8 que la sucesión p´ak qk“1 es no decreciente y acotada superiormente, por lo que debido al teorema 8.7.9 converge a un número a y por el teorema 8.4.9 la sucesión pak q8 k“1 converge a ´a. ‚ 8 8 ř ř bk de términos ak y 8.7.11. Criterio de comparación de series. Dadas dos series k“1 k“1 no negativos, tales que para todo k P N se tiene que 0 ĺ ak ĺ bk . Si la serie 8 ř bk es k“1 8 ř convergente, entonces también lo es la serie ak . k“1 Demostración. Sea b “ 8 ř bk y s n “ n ř ak . Como ak ľ 0 para todo número natural k, k“1 k“1 entonces psn q8 n“1 es una sucesión no decreciente, pero como sn “ n ř ak ĺ k“1 8 ř psn q8 n“1 es una sucesión convergente, es decir n ř bk ĺ b, entonces k“1 ak es una serie convergente. ‚ k“1 8 8 8.7.12. Teorema. Sean pak q8 k“1 , pbk qk“1 y pck qk“1 tres sucesiones tales que para algún N P N, kľN ùñ ak ĺ b k ĺ c k 8 8 y además pak q8 k“1 y pck qk“1 convergen a un mismo número β, entonces la sucesión pbk qk“1 converge también a β. Demostración. Para ε ą 0 sean N1 y N2 números naturales tales que k ľ N1 ùñ |ak ´ β| ă ε k ľ N2 ùñ |ck ´ β| ă ε. y 176 8.7. Criterios de convergencia Sea k ľ N1 ` N2 ` N . Como k ľ N1 , entonces ´ε ă ak ´ β ă ε, como k ľ N2 , entonces ´ε ă ck ´ β ă ε y como además k ľ N , tenemos que ´ε ă ak ´ β ĺ bk ´ β ĺ ck ´ β ă ε, por lo que ´ε ă bk ´ β ă ε, es decir pbk q8 k“1 converge a β. ‚ 8 8.7.13. Teorema. Si pak q8 k“1 y pbk qk“1 son dos sucesiones convergentes tales que para algún número natural N se tiene que k ľ N ùñ ak ĺ bk , entonces lím ak ĺ lím bk . kÑ8 kÑ8 Demostración. Sean a y b los números a los cuales convergen las sucesiones pak q8 k“1 y 8 pbk qk“1 respectivamente. Para ε ą 0 sea N0 tal que k ľ N0 ùñ |ak ´ bk ´ pa ´ bq| ă ε. Si k ľ N ` N0 , entonces ´ε ă ak ´ bk ´ pa ´ bq ă ε y además ak ĺ bk , por lo cual 0 ĺ bk ´ ak ă b ´ a ` ε, es decir 0 ă b ´ a ` ε para todo ε ą 0, ahora si b ´ a fuera negativo, esta última desigualdad no se cumpliría para ε “ a´b . ‚ 2 8.7.14. Teorema. Toda sucesión acotada tiene una subsucesión convergente. ˚ Demostración. Sea pak q8 k“1 una sucesión acotada de números reales y aj “ suptak : k ľ ju. Tomemos k1 un entero positivo tal que |a˚1 ´ ak1 | ă 1 y definamos recursivamente kj`1 de tal manera que |a˚kj `1 ´ akj`1 | ă 1{pj ` 1q. Observemos que la sucesión pa˚j q8 j“1 es no creciente y acotada, por lo tanto es convergente. Sea x el número al cual converge pa˚j q8 j“1 y 8 veamos que pakj qj“1 también converge a x. Dado ε ą 0, sea N un número natural tal que j ľ N ùñ |a˚j ´ x| ă ε{2 y 1{j ă ε{2, de donde tenemos que j ľ N ùñ |akj ´ x| ĺ |akj ´ a˚j | ` |a˚j ´ x| ă ε{2 ` ε{2 “ ε. ‚ 8.7.15. Definición. Decimos que una sucesión pak q8 k“1 es de Cauchy si para cualquier ε ą 0 existe un número natural N , tal que m, n ľ N ùñ |am ´ an | ă ε. Observemos que la anterior definición significa que a partir de un momento todos los términos de la sucesión están suficientemente cercanos entre sí. 8.7.16. Criterio de la sucesión de Cauchy. Toda sucesión de números reales es convergente si y sólo si es de Cauchy. Demostración. Supongamos que pak q8 k“1 es una sucesión convergente y sea a el número al cual converge. Para cualquier ε ą 0 existe un número natural N , tal que k ľ N ùñ |ak ´ a| ă 2ε . Ahora, si m, n ľ N ; entonces |an ´ a| ă 2ε y |am ´ a| ă 2ε , por lo que |am ´ an | ĺ |am ´ a| ` |an ´ a| ă 2ε ` 2ε “ ε; por lo tanto toda sucesión convergente es de Cauchy. 8 Supongamos ahora que pak q8 k“1 es una sucesión de Cauchy. Por ser pak qk“1 de Cauchy, existe un número natural N 1 tal que si n ľ N 1 , entonces |aN 1 ´ an | ă 1, por lo que |an | ă N1 ř 1 1 |an |, 1 ` |aN |. Ahora, para cualquier número natural k se tiene que |ak | ă p1 ` |aN |q ` n“1 por lo que la sucesión pak q8 k“1 es acotada y por el teorema 8.7.14 ésta tiene una subsucesión 8.7. Criterios de convergencia 177 pakj q8 para cualquier ε ą 0 existe j“1 que converge a algún número a. Tenemosˇ entonces ˇ que ε ˇ ˇ un número natural K tal que si j ľ K, entonces akj ´ a ă 2 y además por ser la sucesión de Cauchy, existe un número natural N , tal que si m, n ľ N , entonces |am ´ an | ă 2ε . Con lo anterior tenemos que si n ľ N y tomamos j ľ K `N , entonces |an ´a| ĺ |an ´akj |`|akj ´a| ă ε ` 2ε “ ε, por lo que n ľ N ùñ |an ´ a| ă ε, de modo que la sucesión pak q8 k“1 es convergente. 2 ‚ A continuación veremos un teorema que nos provee de un ejemplo de una serie divergente de términos positivos cuyos términos convergen a cero. Ese ejemplo también sirve a veces para probar la divergencia de algunas series a través del criterio de comparación de series 8.7.11. 8.7.17. Ejemplo. Demostremos usando el criterio de la sucesión de Cauchy que la serie n ř 1 armónica es divergente. Sea sn “ , de manera que psn q8 n“1 es la sucesión de sumas k k“1 parciales de la serie armónica y esta sucesión diverge si y sólo si no es de Cauchy. Si la sucesión de sumas parciales fuera de Cauchy entonces para cada ε ą 0 existiría un N P N tal que para cualesquiera dos números naturales m, n ľ N se tiene que |sn ´ sm | ă ε. Ahora, si ε “ 12 tendríamos que para el supuesto correspondiente valor de N |s2N ´ sN | “ s2N ´ sN “ 2N 2N ÿ ÿ 1 1 2N ´ pN ` 1q ` 1 1 ľ “ “ “ ε, k k“N `1 2N 2N 2 k“N `1 de manera que al tomar n “ 2N y m “ N se ve que la sucesión psn q8 n“1 no es de Cauchy. A continuación veremos que cuando se cambia el orden de aparición de los términos de una serie infinita de términos no negativos la convergencia no se altera. 8 ř 8.7.18. Teorema. Sea an una serie de términos no negativos y ρ una biyección de N en n“1 N. Se tiene la siguiente igualdad 8 ř an “ n“1 8 ř aρpnq . n“1 Demostración. Demostremos primero que si N P N, entonces N ř aρpnq ĺ n“1 8 ř an . Para cada n“1 N P N sea N ˚ un número natural tal que para todo n P t1, . . . , N u se tenga N ˚ ľ ρpnq, N N ř ř˚ de modo que aρpnq ĺ an ya que todos los términos de la primera suma aparecen en n“1 n“1 la segunda al menos el mismo número de veces, por lo tanto N ř aρpnq ĺ n“1 número natural N y así tenemos 8 ř 8 ř aρpnq ĺ n“1 8 ř an para todo n“1 an . Ahora como an “ aρpρ´1 pnqq y ρ´1 es una n“1 biyección de N en N, entonces por un razonamiento análogo se tiene que 8 ř an ĺ n“1 con lo cual el teorema queda demostrado. 8.7.19. Definición. Decimos que la serie 8 ř aρpnq , n“1 ‚ 8 ř an converge absolutamente o que es abso- n“1 lutamente convergente si la serie 8 ř |an | converge a un número real. n“1 8.7.20. Teorema. Toda serie que es absolutamente convergente es convergente. 178 8.7. Criterios de convergencia Demostración. Sea 8 ř n“1 an una serie absolutamente convergente, psn q8 n“1 la sucesión de n ř sumas parciales de la serie y s˚n “ |ak |. Por el criterio de la sucesión de Cauchy 8.7.16 y k“1 por ser 8 ř n“1 an absolutamente convergente, tenemos que ps˚n q8 n“1 es una sucesión de Cauchy, por lo que para todo ε ą 0 existe un número natural N tal que si m, n ľ N , entonces ˚ ˚ |s ˇ m ´ snˇ| ă ε (supongamos sin pérdida de generalidad que m ľ n). Ahora, |sm ´ sn | “ m m ˇ ř ˇ ˇ ˇ ĺ ř |ak | “ |s˚m ´ s˚n | ă ε siempre que m ľ n ľ N , por lo que psn q8 a k n“1 es una ˇ ˇ k“n`1 k“n`1 sucesión de Cauchy y de nuevo por el criterio de la sucesión de Cauchy es convergente, por 8 ř lo que la serie an es convergente. ‚ n“1 8.7.21. Teorema. Si las series 8 ř n“0 ˜ 8 ÿ n“0 bn convergen absolutamente, entonces n“0 ¸˜ an 8 ř an y 8 ÿ n“0 ¸ bn 8 ÿ ˜ n ÿ “ n“0 ¸ an´k bk . k“0 Demostración. Denotemos por txu al mayor entero menor o igual que x. Dejaremos al lector que justifique los detalles del por qué son verdaderas las siguientes igualdades y desigualdades ˇ˜ ¸˜ ¸ ˜ ¸ˇ 8 8 N n ˇ ÿ ˇ ÿ ÿ ÿ ˇ ˇ an bn ´ an´k bk ˇ ˇ ˇ n“0 ˇ n“0 n“0 k“0 ˇ˜ ¸˜ ¸ ˜ ¸˜ ¸ ˜ ¸˜ ¸ N N N 8 8 N ˇ ÿ ÿ ÿ ÿ ÿ ÿ ˇ “ˇ an bn ` an bn ` an bn ˇ n“0 n“0 n“0 n“0 n“N `1 n“N `1 ˜ ¸˜ ¸ ˜ ¸ˇ N 8 8 n ˇ ÿ ÿ ÿ ÿ ˇ ` an bn ´ an´k bk ˇ ˇ n“0 k“0 `1 ˇ˜n“N `1 ¸ ˜ n“N ¸ ˜ ¸ˇ ˇ˜ ¸˜ ¸ˇ N N N n N 8 ˇ ÿ ˇ ˇ ÿ ˇ ÿ ÿ ÿ ÿ ˇ ˇ ˇ ˇ ĺˇ an bn ´ an´k bk ˇ ` ˇ an bn ˇ ˇ n“0 ˇ ˇ n“0 ˇ n“0 n“0 k“0 n“N `1 ˇ˜ ¸˜ ¸ˇ ˇ˜ ¸˜ ¸ˇ 8 N 8 8 ˇ ÿ ˇ ˇ ÿ ˇ ÿ ÿ ˇ ˇ ˇ ˇ `ˇ an bn ˇ ` ˇ an bn ˇ ˇ n“N `1 ˇ ˇ n“N `1 ˇ n“0 n“N `1 ˜ ¸ ˇ˜ ¸˜ ¸ˇ 2N n N 8 ˇ ÿ ˇ ÿ ÿ ÿ ˇ ˇ ĺ |an´k bk | ` ˇ an bn ˇ ˇ n“0 ˇ `1 k“0 n“N `1 ˇn“N ˜ ¸˜ ¸ˇ ˇ˜ ¸˜ ¸ˇ 8 N 8 8 ˇ ÿ ˇ ˇ ÿ ˇ ÿ ÿ ˇ ˇ ˇ ˇ `ˇ an bn ˇ ` ˇ an bn ˇ ˇ n“N `1 ˇ ˇ ˇ n“0 n“N `1 n“N `1 8.7. Criterios de convergencia 179 ¨ ˛˜ 2N ÿ ĺ˝ |an |‚ n“t N2`1 u ¨ ¸ 2N ÿ |bn | ˛˜ 2N ÿ `˝ n“0 |bn |‚ n“t N2`1 u ¸ 2N ÿ |an | n“0 ˇ˜ ¸˜ ¸ˇ ˇ˜ ¸˜ ¸ˇ N 8 8 N ˇ ÿ ˇ ˇ ÿ ˇ ÿ ÿ ˇ ˇ ˇ ˇ `ˇ an bn ˇ ` ˇ an bn ˇ ˇ n“0 ˇ ˇ n“N `1 ˇ n“0 n“N `1 ˇ˜ ¸˜ ¸ˇ 8 8 ˇ ÿ ˇ ÿ ˇ ˇ `ˇ an bn ˇ , ˇ n“N `1 ˇ n“N `1 y podemos observar que esta última expresión tiende a 0 cuando N tiende a 8. ‚ 8.7.22. Definición. Si x es un número real definimos xp`q , la parte positiva de x, como xp`q “ x si x ą 0, y como xp`q “ 0 si x ĺ 0. Si x es un número real definimos xp´q , la parte negativa de x, como xp´q “ ´x si x ă 0, y como xp´q “ 0 si x ľ 0. Observemos que tanto la parte positiva como la parte negativa de un número son números no negativos, además se tienen siempre las igualdades x “ xp`q ´ xp´q y |x| “ xp`q ` xp´q . A continuación veremos que cuando se cambia el orden de aparición de los términos de una serie absolutamente convergente la convergencia no se altera. 8 ř 8.7.23. Teorema. Sea an una serie absolutamente convergente y ρ una biyección de N n“1 en N. Se tiene la siguiente igualdad 8 ř an “ n“1 8 ř aρpnq . n“1 Demostración. Aplicando el teorema 8.7.18 tenemos que 8 ÿ an “ n“1 8 ÿ ` n“1 8 ÿ “ n“1 8 8 ÿ ˘ ÿ p´q p`q ap`q ´ a “ a ´ ap´q n n n n n“1 p`q aρpnq ´ 8 ÿ p´q aρpnq n“1 8 ´ 8 ¯ ÿ ÿ p`q p´q “ aρpnq ´ aρpnq “ aρpnq , n“1 n“1 con lo que el teorema queda demostrado. n“1 ‚ 8.7.24. Definición. Sea pak q8 k“1 una sucesión de números reales acotada superiormente y A el conjunto de todos los números que son límites de alguna subsucesión de pak q8 k“1 . Cuando A ‰ ∅, definimos el límite superior de la sucesión pak q8 como el supremo de A. Cuando k“1 8 A “ ∅, decimos que ´8 es el límite superior de pak qk“1 . Cuando la sucesión pak q8 k“1 no es acotada superiormente, decimos que `8 es el límite superior de la sucesión. Al límite superior de una sucesión pak q8 k“1 se le denota como lím sup ak kÑ8 o bien como lím ak . kÑ8 180 8.7. Criterios de convergencia 8.7.25. Definición. Sea pak q8 k“1 una sucesión de números reales acotada inferiormente y A el conjunto de todos los números que son límites de alguna subsucesión de pak q8 k“1 . Cuando A ‰ ∅, definimos el límite inferior de la sucesión pak q8 como el ínfimo de A. Cuando k“1 8 A “ ∅, decimos que `8 es el límite inferior de pak qk“1 . Cuando la sucesión pak q8 k“1 no es acotada inferiormente, decimos que ´8 es el límite inferior de la sucesión. Al límite inferior de una sucesión pak q8 k“1 se le denota como límı́nf ak kÑ8 o bien como lím ak . kÑ8 8.7.26. Observación. Para cualquier sucesión pak q8 k“1 de números reales siempre se tiene que lím ak ĺ lím ak . kÑ8 kÑ8 8.7.27. Teorema. Sea pak q8 k“1 una sucesión de números reales y L “ lím ak P R. Existe una kÑ8 8 subsucesión pank q8 k“1 de pak qk“1 que converge a L. Demostración. Sea n1 el primer número natural tal que |an1 ´ L| ă 1, n2 el primer número natural mayor que n1 tal que |an2 ´ L| ă 12 y así sucesivamente, una vez teniendo definido 1 . nk , definimos nk`1 como el primer número natural mayor que nk tal que |ank`1 ´ L| ă k`1 La construcción anterior es posible debido a que para todo ε ą 0 existe una subsucesión de 8 pak q8 k“1 que converge a un número M P pL ´ ε; Ls. Tenemos así que la subsucesión pank qk“1 8 ‚ de pak qk“1 converge a L. 8.7.28. Corolario. Sea pak q8 k“1 una sucesión de números reales y L “ lím ak P R. Para todo kÑ8 M ă L existe una infinidad de números naturales n tales que an ą M . 8 Demostración. Por el teorema 8.7.27, existe una subsucesión pank q8 k“1 de pak qk“1 que converge a L. Así, existe un N P N tal que si k ľ N , entonces ank ą M , de manera que el recorrido de la sucesión pnk`N q8 k“1 es un conjunto infinito que está incluido en el conjunto de todos los números naturales n tales que an ą M . ‚ 8.7.29. Corolario. Sea pak q8 k“1 una sucesión de números reales y L “ lím ak P R. Para todo kÑ8 M ą L existe un N P N tal que si n ľ N , entonces an ă M . Demostración. Procedamos por reducción a lo absurdo. Supongamos que existe un M ą L tal que para todo N P N existe un n ľ N tal que an ľ M . Con la suposición anterior podemos tomar una subsucesión pank q8 k“1 tal que para todo k ľ N se tenga que ank ľ M . Tenemos pues que lím ank ľ M y por el teorema 8.7.27 existiría una subsucesión de pank q8 k“1 (que kÑ8 también es una subsucesión de pak q8 k“1 ) que converge a lím ank , el cual debe ser un número kÑ8 mayor o igual que M , y por lo tanto mayor que L, contradiciendo así la definición de límite superior. ‚ 8 8.7.30. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números reales tales que lím ak kÑ8 y lím bk son números reales, entonces kÑ8 lím pak ` bk q ĺ lím ak ` lím bk . kÑ8 kÑ8 kÑ8 8.7. Criterios de convergencia 181 8 Demostración. Por el teorema 8.7.27 existen subsucesiones convergentes paαk q8 k“1 , pbβk qk“1 8 8 8 y paγk ` bγk q8 k“1 de pak qk“1 , pbk qk“1 y pak ` bk qk“1 respectivamente tales que lím aαk “ lím ak , kÑ8 kÑ8 lím bβk “ lím bk y lím paγk ` bγk q “ lím pak ` bk q. Ahora, tomando una subsucesión pηk q8 k“1 kÑ8 kÑ8 kÑ8 kÑ8 8 8 de pγk q8 k“1 para la cual tanto paηk qk“1 como pbηk qk“1 converjan (observemos que no pueden converger a `8) tenemos por definición de límite superior que lím pak ` bk q “ lím paηk ` bηk q “ lím aηk ` lím bηk ĺ lím ak ` lím bk , kÑ8 kÑ8 kÑ8 kÑ8 kÑ8 kÑ8 con lo que el corolario queda demostrado. ‚ De manera similar a como se demostró el corolario 8.7.30 se puede demostrar el siguiente corolario. 8 8.7.31. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números reales no negativos tales que lím ak y lím bk son números reales, entonces kÑ8 kÑ8 ´ lím ak bk ĺ ¯´ lím ak kÑ8 kÑ8 ¯ lím bk . kÑ8 8 8.7.32. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números reales tales que lím ak kÑ8 y lím bk son números reales, entonces kÑ8 lím ak ` lím bk ĺ lím pak ` bk q. kÑ8 kÑ8 kÑ8 Demostración. Procedamos por contradicción suponiendo que lím ak ` lím bk ą lím pak ` bk q. kÑ8 kÑ8 kÑ8 8 Sea pbβk q8 k“1 una subsucesión de pbk qk“1 que converja a lím bk . Tomemos una subsucesión kÑ8 8 8 pηk q8 k“1 de pβk qk“1 tal que la sucesión paηk qk“1 converja. Tenemos así que lím paηk ` bηk q “ lím aηk ` lím bηk “ lím aηk ` lím bk kÑ8 kÑ8 kÑ8 kÑ8 kÑ8 ľ lím ak ` lím bk ą lím pak ` bk q, kÑ8 kÑ8 kÑ8 contradiciendo la definición de límite superior. ‚ De manera similar se puede demostrar el corolario siguiente. 8 8.7.33. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números no negativos tales que lím ak y lím bk son números reales, entonces kÑ8 kÑ8 ˆ ˙´ lím ak kÑ8 ¯ lím bk ĺ lím ak bk . kÑ8 kÑ8 182 8.7. Criterios de convergencia De manera similar a la demostración del teorema 8.7.27 y sus corolarios se demuestra el siguiente teorema y sus corolarios. 8.7.34. Teorema. Sea pak q8 k“1 una sucesión de números reales y L un número real tal que L “ lím ak . kÑ8 8 I) Existe una subsucesión pank q8 k“1 de pak qk“1 que converge a L. II) Para todo M ą L existe una infinidad de números naturales n tales que an ă M . III) Para todo M ă L existe un N P N tal que si n ľ N , entonces an ą M . 8 8.7.35. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números reales tales que lím ak kÑ8 y lím bk son números reales, entonces kÑ8 lím ak ` lím bk ĺ lím pak ` bk q ĺ lím ak ` lím bk . kÑ8 kÑ8 kÑ8 kÑ8 kÑ8 8 8.7.36. Corolario. Si pak q8 k“1 y pbk qk“1 son dos sucesiones de números no negativos tales que lím ak y lím bk son números reales, entonces kÑ8 kÑ8 ˙ˆ ˆ ˙ lím ak lím bk kÑ8 kÑ8 ˆ ĺ lím ak bk ĺ kÑ8 ˙´ lím ak kÑ8 ¯ lím bk . kÑ8 8.7.37. Teorema. Una sucesión de números reales pak q8 k“1 converge (ya sea a un número real, a `8 ó a ´8) si y sólo si lím ak “ lím ak . En el caso en que la sucesión converja, se kÑ8 kÑ8 tiene que lím ak “ lím ak “ lím ak . kÑ8 kÑ8 kÑ8 Demostración. Como consecuencia de las dos definiciones anteriores (8.7.24 y 8.7.25) y del teorema 8.7.3 tenemos que si la sucesión converge a un número x, entonces x “ lím ak “ kÑ8 lím ak . Recíprocamente, si existe un número real x tal que x “ lím ak “ lím ak , tenemos kÑ8 kÑ8 kÑ8 que dado un ε ą 0, por el corolario 8.7.29, existe un N1 P N tal que si n ľ N1 , entonces an ă L ` ε. Ahora, por el teorema 8.7.34 III) existe un N2 P N tal que si n ľ N2 , entonces L ´ ε ă an . De esta manera, si n ľ N1 ` N2 , entonces |an ´ L| ă ε, es decir la sucesión pak q8 k“1 converge a L. Para los casos en que la sucesión pak q8 k“1 converja a `8 ó a ´8, por definición se deduce que lím ak “ lím ak “ lím ak . kÑ8 kÑ8 kÑ8 En el caso en que lím ak “ lím ak “ `8 demostremos que lím ak “ `8. Si la sucesión kÑ8 pak q8 k“1 kÑ8 kÑ8 no convergiera a `8, existiría un M ą 0 tal que para todo k P N habría un Nk ľ k con la propiedad de que aNk ĺ M . Así, tomando n1 “ N1 , n2 “ máxtN2 , n1 u, . . . , nk`1 “ máxtNk`1 , n1 , n2 , . . . , nk u, tenemos que pank q8 k“1 sería un subsucesión acotada superiormente 8.7. Criterios de convergencia 183 por M . Ahora, el límite inferior de la sucesión pak q8 k“1 es `8, por lo que la sucesión es acotada inferiormente y también lo es la subsucesión pank q8 k“1 , de modo que por el teorema 8.7.14 tal subsucesión tiene una subsucesión que converge a un número real, la cual a su vez es una subsucesión de pak q8 k“1 , contradiciendo el hecho de que lím ak “ `8. Por lo kÑ8 tanto lím ak “ `8. De forma análoga se demuestra que si lím ak “ lím ak “ ´8, entonces kÑ8 kÑ8 kÑ8 lím ak “ ´8. ‚ kÑ8 8.7.38. Lema de Abel en R. Sea pak q8 k“0 una sucesión de números reales. Si existen r ą 0 y M ą 0 tales que nPN 8.7.39. entonces la serie 8 ř ùñ |an |rn ĺ M, ak xk converge absolutamente para todo x P p´r; rq. k“0 Demostración. Sea x P p´r; rq. De la implicación 8.7.39 tenemos que ˆ ˙n |x| n |an x | ĺ M , r y el criterio de comparación de series 8.7.11, tenemos por el teorema 8.6.6 que la serie řusando 8 k a x converge absolutamente. ‚ k“0 k 8.7.40. Criterio de Cauchy (criterio de la raíz). Sea puk q8 k“1 una sucesión de números reales no negativos. a) Si lím kÑ8 b) Si lím kÑ8 8 ř ? k u ă 1, entonces uk ă `8. k k“1 8 ř ? k u ą 1, entonces uk “ `8. k k“1 ? Demostración. Sea L “ lím k uk . Supongamos primero que L ă 1 y sea M un número kÑ8 real tal que L ă M ă 1. Por el corolario 8.7.29, existe un N P N tal que si n ľ N , entonces ? n u ă M , por lo tanto 0 ĺ u ă M n y así tenemos, por el criterio de comparación de series n n 8 ř 8.7.11 y por el teorema 8.6.6, que la serie un converge a un número no negativo, es decir n“0 8 ř un ă `8. n“0 Supongamos ahora que L ą 1. Por el corolario 8.7.28, tenemos que para` una infinidad ? ? ˘8 de números naturales n se tiene que n un ą 1, es decir existe un subsucesión nk unk k“1 tal ? que nk unk ą 1 para todo k P N. De esta manera tenemos que si definimos an “ 1 para cada 8 ř n en el recorrido de pnk q8 ak “ `8, por k“1 y an “ 0 en otro caso, vemos claramente que k“1 lo que usando el criterio de comparación de series 8.7.11 vemos que 8 ř uk “ `8. k“1 Los siguientes dos corolarios son ligeras variante del criterio de la raíz. 8.7.41. Corolario. Sea puk q8 k“1 una sucesión de números reales. ‚ 184 8.7. Criterios de convergencia a) Si lím kÑ8 b) Si lím kÑ8 8 a ř k |uk | ă 1, entonces uk es absolutamente convergente. k“1 8 a ř k |uk | ą 1, entonces la serie uk es divergente. k“1 Demostración. El inciso a) es consecuencia inmediata del criterio de la raíz (8.7.40 a)). El a k inciso b) se sigue del teorema 8.6.8 y del hecho de que si lím |uk | ą 1, entonces la sucesión kÑ8 puk q8 k“1 no converge a cero. ‚ a una sucesión de números reales y supongamos que lím k |uk | 8.7.42. Corolario. Sea puk q8 k“1 existe. a) Si lím kÑ8 b) Si lím kÑ8 kÑ8 8 a ř k |uk | ă 1, entonces la serie uk es absolutamente convergente. k“1 8 a ř k uk diverge. |uk | ą 1, entonces la serie k“1 Demostración. El inciso a) se sigue del corolario a8.7.41 y el teorema 8.7.37. El inciso b) se sigue del teorema 8.6.8 y del hecho de que si lím k |uk | ą 1, entonces la sucesión puk q8 k“1 no kÑ8 converge a cero. ‚ 8 ř 8.7.43. Teorema. Si una serie ak de términos no negativos no es convergente, entonces k“1 diverge a `8. Demostración. Sea sn “ n ř ak y M ą 0. La sucesión psn q8 n“1 es no decreciente, por lo k“1 que debido al teorema 8.7.9 es no acotada (si fuera acotada, entonces sería convergente y contradiría nuestra hipótesis), así pues existe un N P N tal que sN ą M . Ahora, como la sucesión psn q8 n“1 es no decreciente, entonces para todo n ľ N se tiene que sn ą M , por lo 8 ř ak diverge a `8. ‚ cual la sucesión psn q8 n“1 diverge a `8, es decir la serie k“1 8.7.44. Criterio de d’Alambert (criterio de la razón). Sea puk q8 k“1 una sucesión de números reales positivos. a) Si lím uuk`1 ă 1, entonces k kÑ8 8 ř uk ă `8. k“1 b) Si existe un N P N tal que un`1 un ľ 1 para todo n ľ N , entonces 8 ř uk “ `8. k“1 Demostración. Sea L “ lím uuk`1 . a) Supongamos primero que L ă 1. Sea r P pL; 1q. Por k kÑ8 ă r, es el corolario 8.7.29 se tiene que para n P N suficientemente grande se tiene que uun`1 n un`1 decir existe un N P N tal que si n ľ N , entonces un ă r. Tenemos además que uN `k uN `1 uN `2 uN `k “ ¨¨¨ ă rk , uN uN uN `1 uN `k´1 8.7. Criterios de convergencia 185 por lo tanto uN `k ă uN rk y así 8 ÿ n“1 un “ N ÿ un ` n“1 8 ÿ uN `k ĺ N ÿ un ` n“1 k“1 8 ÿ uN rk ă `8. k“1 ľ 1 para todo n ľ N . Sea n ľ N . Para b) Supongamos que existe un N P N tal que uun`1 n que tenga sentido la expresión uun`1 ľ 1 es necesario que un`1 ľ un ľ uN ą 0, por lo que si la n 8 sucesión puk qk“1 es convergente, debe converger a un número mayor o igual que uN , es decir la sucesión puk q8 k“1 no converge a 0. Ahora, por el teorema 8.6.8, la serie no es convergente, 8 ř pero uk “ `8 debido al teorema 8.7.43. ‚ k“1 Los siguientes 2 corolarios son ligeras variantes del criterio de la razón. 8.7.45. Corolario. Sea puk q8 k“1 una sucesión de números reales. ˇ ˇ 8 ř ˇ ˇ a) Si lím ˇ uuk`1 ă 1, entonces la serie uk es absolutamente convergente. ˇ k kÑ8 k“1 ˇ ˇ 8 ř ˇ ˇ uk diverge. b) Si lím ˇ uuk`1 ą 1, entonces la serie ˇ k kÑ8 k“1 Demostración. El inciso a) es una consecuencia inmediata del criterio de la razón. Si ˇ ˇ ˇ uk`1 ˇ lím ˇ uk ˇ ą 1, entonces, por el teorema 8.7.34 III), existe un número natural N tal que si kÑ8 ˇ ˇ ˇ ˇ n ľ N , entonces ˇ uun`1 ˇ ą 1, por lo que |un | ą |uN | ą 0 y la sucesión puk q8 k“1 no converge a 0, n 8 ř luego, por el teorema 8.6.8, la serie uk diverge. ‚ k“1 ˇ ˇ ˇ uk`1 ˇ una sucesión de números reales y supongamos que lím 8.7.46. Corolario. Sea puk q8 ˇ ˇ k“1 kÑ8 uk existe. ˇ ˇ 8 ř ˇ uk`1 ˇ a) Si lím ˇ uk ˇ ă 1, entonces la serie uk es absolutamente convergente. kÑ8 k“1 ˇ ˇ 8 ř ˇ ˇ ą 1, entonces la serie uk diverge. b) Si lím ˇ uuk`1 ˇ k kÑ8 k“1 Demostración. El corolario es una consecuencia del corolario 8.7.45 y del teorema 8.7.37. ‚ 8 ř 8.7.47. Definición. Decimos que una serie uk es alternante si para todo número natural k“1 k tenemos que puk qpuk`1 q ă 0, es decir cualquier término tiene diferente signo que el siguiente. 8.7.48. Criterio de convergencia para series alternantes. Supongamos que puk q8 k“1 es una sucesión de números reales tal que: a) lím uk “ 0; kÑ8 b) |un | ľ |un`1 | para todo n P N; 186 c) la serie 8.7. Criterios de convergencia 8 ř uk es alternante. k“1 Entonces la serie 8 ř uk es convergente. k“1 Demostración. Sea ε ą 0. Por el inciso a), existe un N P N tal que si n ľ N , entonces |un | ă ε. ˇSean m, n ľ N que mˇ ľ n. Si m “ n, ˇ . Supongamos sin pérdida de generalidad ˇ m n m n ˇř ˇ ˇ ˇř ř ř uk ˇˇ “ 0 ă ε. Si m “ n ` 1, entonces ˇˇ uk ´ entonces ˇˇ uk ´ uk ˇˇ “ |un`1 | ă ε. Si k“1 k“1 k“1 k“1 m ą n ` 1, por las propiedades b) y c), tenemos que ˇ ˇ ˇ ˇ ˇ ˇ m n m ˇÿ ˇ ˇ ÿ ˇ ˇm´n ˇ ÿ ÿ ˇ ˇ ˇ ˇ ˇ ˇ uk ˇ “ ˇ uk ˇ “ ˇ p´1qk |un`k |ˇ ˇ uk ´ ˇk“1 ˇ ˇ ˇ ˇ ˇ k“1 k“n`1 k“1 ˇ ˇ m´n´1 ˇ ÿ 1 ˇˇ ˇ “ ˇ´|un`1 | ` p´1qm´n |um | ` p´1qk`1 p|un`k`1 | ´ |un`k |qˇ ˇ 2ˇ k“1 ˜ ¸ m´n´1 ÿ 1 ||un`k`1 | ´ |un`k || ` |um | ĺ |un`1 | ` 2 k“1 ˜ ¸ m´n´1 ÿ 1 p|un`k | ´ |un`k`1 |q ` |um | ĺ |un`1 | ` 2 k“1 1 p|un`1 | ` |un`1 | ´ |um | ` |um |q “ |un`1 | ă ε, 2 8 ř por lo que la sucesión de sumas parciales de la serie uk es una sucesión de Cauchy y así “ k“1 la serie converge a un número real. ‚ 8.7.49. Teorema. Sea puk q8 k“1 una sucesión no creciente de términos no negativos. La serie 8 8 ř ř un converge si y sólo si la serie 2k u2k converge. n“1 k“1 Demostración. Sea psn q8 n“1 la sucesión de sumas parciales de la serie sucesión de sumas parciales de la serie 8 ř 8 ř n“1 un y ptk q8 k“1 la k 2 u2k . Por el teorema 8.7.9 las anteriores sucesiones k“1 de sumas parciales convergen si y sólo si son acotadas. Veamos que la sucesión psn q8 n“1 es 8 acotada si y sólo si también lo es ptk q8 . Supongamos primero que ps q es acotada y sea n n“1 k“1 k s el límite de la sucesión. Para todo k P N sea nk un entero mayor que 2 . Tenemos que ˜ ¸ nk 2k k 2k ÿ ÿ ÿ ÿ s ľ snk “ un ľ un “ u1 ` um n“1 ľ u1 ` k ÿ n“1 k ÿ ľ n“1 n“1 ˜ n“1 ¸ 2k ÿ u2k “ u1 ` m“2k´1 `1 2k´1 u2k “ k ÿ 1 1 2k u2k “ tk , 2 n“1 2 m“2k´1 `1 k ÿ p2k ´ 2k´1 qu2k n“1 8.7. Criterios de convergencia 187 por lo que la sucesión ptk q8 k“1 está acotada por 2s. Supongamos ahora que la sucesión ptk q8 k“1 está acotada y sea t el límite de la sucesión. Para todo n P N sea k un número natural tal que n ă 2k . Tenemos ahora que ˜ ¸ k`1 n 2ÿ k`1 2m ÿ ÿ ÿ sn “ um ĺ um “ u1 ` ul m“1 m“1 k`1 ÿ ĺ u1 ` k`1 ÿ l“2m´1 `1 ¸ 2m ÿ m“1 ĺ u1 ` m“1 ˜ u2m´1 l“2m´1 `1 2m´1 u2m´1 “ 2u1 ` tk ĺ 2u1 ` t, m“1 por lo que la sucesión psn q8 n“1 8.7.50. Corolario. La serie está acotada por 2u1 ` t. 8 ř n“1 1 ns es convergente si s ą 1. Demostración. Sea s ą 1 y veamos que la serie 8 ř k“1 el teorema 8.6.6 la serie 8 ř k“1 2k p2k qs 8 ř 8.7.49, tenemos que la serie n“1 “ 1 ns ‚ 8 ř 2k p2k qs k p21´s q converge a k“1 es convergente. En efecto, por 21´s . 1´21´s Ahora, debido al teorema es convergente. ‚ 8.7.51. Criterio de comparación de series. Dadas dos series 8 ř 8 ř bk de términos k“1 k“1 positivos, tales que lím abkk “ 1, tenemos que 8 ř ak y 8 ř ak ă `8. ˙8 ˆ n 8 ř ř ak converak ă `8, es decir que la sucesión Demostración. Supongamos que kÑ8 bk ă `8 si y sólo si k“1 k“1 k“1 k“1 8 ř 8 ř n“1 bk “ `8, entonces tendríamos que pbk ´ ak q “ k“1 ˇ ˇ ˇ ˇ `8, pero existe un N P N tal que si k ľ N entonces ˇ abkk ´ 1ˇ ă 1, de manera que ge a un número real. Si tuviéramos que k“1 8 ÿ pbk ´ ak q “ k“1 N ´1 ÿ pbk ´ ak q ` k“1 N ´1 ÿ 8 ÿ pbk ´ ak q “ k“N 8 ÿ N ´1 ÿ pbk k“1 N ´1 ÿ ˇ ˇ ˇ bk ˇ ĺ pbk ´ ak q ` ak ˇˇ ´ 1ˇˇ ă ak k“1 k“N por lo tanto necesariamente 8 ř ´ ak q ` 8 ÿ ak k“N 8 ÿ pbk ´ ak q ` k“1 ˆ ˙ bk ´1 ak ak ă `8, k“N bk ă `8. k“1 Usando el hecho de que lím abkk “ 1 se puede demostrar de manera similar que si kÑ8 `8, entonces 8 ř ak ă `8. 8 ř bk ă k“1 ‚ k“1 8.7.52. Notación. Cuando el conjunto solución Λ de una fórmula ppxq (donde x es la variable) es un conjunto finito y para cada λ P Λ se tiene que aλ es un número, entonces la 188 8.7. Criterios de convergencia expresión ÿ aλ ppλq representa a la suma n ř aλk , donde n es el número de elementos del conjunto Λ y además k“1 Λ “ tλ1 , λ2 , . . . , λn u. Ahora, cuando Ω es el conjunto solución de una fórmula qpxq (donde x es la variable) y para cada ω P Ω se tiene que zω ľ 0, entonces la expresión ÿ zω qpωq representa al número # + n ÿ sup zλk : tλ1 , λ2 , . . . , λn u tiene n elementos y está incluido en Ω , k“1 el cual puede ser un número no negativo o bien `8. Ejercicios. 1. Dadas las siguientes sucesiones, calcular el límite superior y el límite inferior. b) pp´1qk`1 q8 k“1 , ? d) pmáxt 1j , 1 ` p´1qj uq8 e) p kq8 k“1 . j“1 , a) pp´2qk`1 q8 k“1 , c) pmáxt´50, ´juq8 j“1 , 2. Decir si son convergentes o divergentes cada una de las series siguientes. En caso de que sean convergentes decir ademas si son absolutamente convergentes. ˙k ˙ ˙k ˙2k 8 ˆ 8 ˆ 8 ˆ 8 ˆ ÿ ÿ ÿ ÿ 1 1 p´1qk`1 k ? ? a) , b) , , c) , d) 3 2 k k ` 1 k k k“1 k“1 k“1 k“0 ˜d ¸ ˆ ˙ ˙ ˆ k 2k`3 8 8 8 8 ÿ ÿ ÿ ÿ j! k k! ´1 3 e) , h) , , f) 5 , g) k 2k ` 1 4k k jj j“3 k“0 k“3 k“1 ˆ ˙2n ˙k ˆ ˙n 8 8 ˆ 8 8 ÿ ÿ ÿ ÿ 2 k 1 p´1qi 2 i) n , j) , k) n , l) . 3 k ` 1 4 i ` 2 n“1 n“0 i“3 k“0 8.8. La constante de Napier 8.8. 189 La constante de Napier 8.8.1. Definición. Hay un número muy importante tanto en la teoría como en las aplicaciones de las matemáticas llamado constante de Napier. Tal número se denota como e y es igual al siguiente valor: 8 ÿ 1 . e :“ k! k“0 Observemos que la serie anterior converge puesto que 1{k! ă p1{2qk para k ľ 4. El siguiente teorema nos da otra forma de estimar el número e. 8.8.2. Teorema. ˆ e “ lím nÑ8 1 1` n ˙n . Demostración. Demostremos primero que lím p1 ` 1{nqn ĺ e. Por el teorema del binomio nÑ8 tenemos que ˆ 1 1` n ˙n n ˆ ˙ ˆ ˙k ÿ n 1 n ÿ 1 n! n! “ ¨ k k k n pn ´ kq!k!n pn ´ kq!n k! k“0 k“0 ¸ k“0 ˜ ˆ ˙n ÿ n n n k´1 ÿ ÿ źn´j 1 1 1 1 ¨ ĺ 6 1` ĺ . “ n k! k“0 k! n k! k“0 j“0 k“0 “ n ÿ “ Tomando el límite superior cuando n tiende a 8 obtenemos ˙n ˆ 1 ĺ e. lím 1 ` nÑ8 n Demostremos ahora que lím p1 ` 1{nqn ľ e. Sea m un entero positivo y n un entero tal nÑ8 que n ľ m. ˆ 1 1` n ˙n n ˆ ˙ ˆ ˙k ÿ n 1 n ÿ n! n! ` n pn ´ kq!k!nk k“m`1 pn ´ kq!k!nk k k“0 k“0 ˜ ¸ m m k´1 ÿ ÿ źn´j 1 n! 1 ľ ¨ “ ¨ 6 k k! pn ´ kq!n n k! k“0 k“0 j“0 “ ˆ 1 1` n m ÿ “ ˙n m ÿ ľ k“0 ˜ k´1 ź n´j n j“0 ¸ ¨ 1 . k! Observando que lím n´j “ 1 y tomando el límite inferior cuando n tiende a 8 obtenemos n nÑ8 ř m n que lím p1 ` 1{nq ľ k“0 k!1 . Ahora, tomando el límite cuando m tiende a 8 obtenemos nÑ8 ˆ lím nÑ8 1 1` n ˙n ľ e, 190 8.8. La constante de Napier con lo cual tenemos que ˆ lím nÑ8 1 1` n ˙n ˆ ĺ e ĺ lím nÑ8 1 1` n ˙n , pero como lím p1`1{nqn ĺ nÑ8 lím p1`1{nqn , entonces nÑ8 lím p1`1{nqn existe y es igual al número nÑ8 e, con lo que terminamos la demostración. ‚ 8.9. Sistema decimal 8.9. 191 Sistema decimal En el sistema de numeración decimal todo número positivo se expresa como un entero no negativo (la expresión que está antes del punto decimal) más un número no negativo menor que 1 (la expresión que está después del punto decimal) en la forma aN aN ´1 aN ´2 ¨ ¨ ¨ a2 a1 .b1 b2 b3 ¨ ¨ ¨ , 8.9.1. donde pa1 , a2 , ¨ ¨ ¨ , aN , 0, 0, 0, . . . q y pb1 , b2 , b3 , . . . q son sucesiones de enteros entre cero y nueve inclusive. Por medio de series, el número dado en la expresión 8.9.1 puede ser expresado así N ÿ 8.9.2. ak ¨ 10k´1 ` k“1 8 ÿ bk ¨ 10´k . k“1 8 ř Para que la expresión anterior tenga sentido la serie bk ¨ 10´k debe converger. Para k“1 ver que esto sucede usaremos el criterio de comparación, es decir compararemos la serie 8 8 ř ř 9 ¨ 10´k en donde, como 0 ĺ bk ĺ 9, tenemos que 0 ĺ bk ¨ 10´k ĺ 9 ¨ 10´k . bk ¨ 10´k con k“1 k“1 Ahora, tenemos que 8 ÿ ´k 9 ¨ 10 k“1 ˆ ˙k´1 8 ÿ 9 1 9 1 “ ¨ ¨ “ 1 “ 1, 10 10 10 1 ´ 10 k“1 como era de esperarse puesto que 1 “ 0.999, el cual es un número que se representa por la 8 8 ř ř serie 9 ¨ 10´k . De modo que la serie bk ¨ 10´k representa un número en el intervalo r0; 1s. k“1 k“1 8.9.3. Teorema. Si un número r al ser expresado en la forma 8.9.2 (la forma decimal) es tal que existen enteros positivos M y l tales que si k ľ M , se tiene bk “ bk`l ; entonces r es un número racional. Demostración. Tenemos que N ÿ ak ¨ 10k´1 ` k“1 Es claro que 8 ÿ N ÿ bk ¨ 10´k “ k“1 N ř ak ¨10k´1 ` k“1 en el sumando Mř ´1 ak ¨ 10k´1 ` k“1 8 ř bk ¨ 10´k ` k“1 8 ÿ bk ¨ 10´k . k“M bk ¨10´k es racional, por lo que nos concentraremos únicamente k“1 8 ř bk ¨ 10´k . Tomando sn “ M `n´1 ř k“M converge a M ´1 ÿ bk ¨ 10´k , tenemos que la sucesión psn q8 n“1 k“M bk ¨ 10´k , por lo que también lo hará la subsucesión psnl q8 n“1 , pero k“M snl “ n ÿ m“1 ˜ Mÿ `l´1 k“M ¸ bk ¨ 10´k 10´pm´1ql , 192 8.9. Sistema decimal por lo que 8 ÿ bk ¨ 10´k “ 8 ÿ ˜ m“1 k“M 8 ÿ Mÿ `l´1 “ m“1 bk ¨ 10´k 10´pm´1ql k“M ˜ Mÿ `l´1 ¸ ¸ bk ¨ 10´k ˜ p10´l qm´1 “ k“M Mÿ `l´1 ¸ bk ¨ 10´k k“M 1 , 1 ´ 10´l el cual es racional. ‚ 8.9.4. Teorema. Sea β P r0; 1q y pbk q8 k“1 una sucesión cuyas componentes están en t0, 1, 2, 3, 4, 5, 6, 7, 8, 9u “ J9 Yt0u y son tales que b1 es el máximo número en J9 Yt0u tal que b1 ¨10´1 ĺ β; k ř . . . ; bk es el máximo número en J9 Yt0u tal que bj ¨10´j ĺ β. Bajo las condiciones anteriores j“1 se tiene que 8 ÿ bk ¨ 10´k “ β. k“1 Demostración. Tenemos que 0 ĺ β ´ b1 ¨ 10´1 ĺ 10´1 ya que de no ser así, entonces pb1 ` 1q10´1 ă β ó b1 ¨ 10´1 ą β, contradiciendo en ambos casos la elección de b1 (en el primer caso si b1 ‰ 9, entonces contradice la elección de b1 , pero si b1 “ 9, contradice el hecho de que n ř β P r0; 1q). Supongamos que para n P N tenemos que 0 ĺ β ´ bk ¨ 10´k ĺ 10´n . Afirmamos k“1 que 0 ĺ β ´ n`1 ř bk ¨ 10´k ĺ 10´pn`1q . En efecto, por la elección de los bk debe darse la primera k“1 desigualdad. Ahora, si n`1 ř n ř bk ¨ 10´k ą 10´pn`1q , entonces β ´ bk ¨ 10´k ą pbk`1 ` 1q10´pn`1q , k“1 k“1 lo cual, si bn`1 “ 9, contradice el hecho de que 0 ĺ β ´ n ř bk ¨ 10´k ĺ 10´n , y si bn`1 ‰ 9 k“1 contradice la elección de los bk , en particular la de bn`1 , pues β sería mayor que n ř bk ¨ 10´k k“1 `pbk`1 ` 1q10´pn`1q . Por lo tanto 0 ĺ β ´ n`1 ř bk ¨ 10´k ĺ 10´pn`1q . Ahora, para ε ą 0 sea k“1 N P N tal que 10´N ă ε. Si n ľ N , entonces 0ĺβ´ n ÿ bk ¨ 10´k ĺ 10´n ĺ 10´N ă ε, k“1 ˇ ˇ n n ˇ ˇ ř ř ´k por lo tanto ˇˇβ ´ bk ¨ 10 ˇˇ ă ε. Es decir la serie bk ¨ 10´k converge a β. k“1 ‚ k“1 Ejercicios. 1. Demostrar el recíproco del teorema 8.9.3, es decir demostrar que si r ą 0 es un número racional, entonces la expresión de r en la forma 8.9.2 es tal que existen enteros positivos M y l tales que si k ľ M , se tiene bk “ bk`l . (Sugerencia: usar el algoritmo de la división 4.7.3). 8.9. Sistema decimal 193 2. Describir formalmente la forma usual de multiplicar dos números reales positivos y justificar su funcionamiento. 3. Describir formalmente la forma usual de dividir dos enteros positivos y justificar su funcionamiento. 194 8.9. Sistema decimal Capítulo 9 FUNCIONES EXPONENCIALES Y LOGARÍTMICAS 9.1. Introducción 9.1.1. Definición. Anteriormente se definieron expresiones de la forma ar cuando a ą 0 y r P Q que representa un número real que se llama la r-ésima potencia de a. Al número a se la llama la base y al número r el exponente de la r-ésima potencia de a. Se definió ar cuando r “ m , n con m y n enteros, m ‰ 0 y n ą 0 como m ar “ a n “ `? ˘m n a . Se vio que tal definición hacía que se cumplieran las leyes de los exponentes y que tenía sentido, es decir que el valor de ar no variaba si se sustituían los enteros m y n por otros cuyo cociente fuera r. Además se demostró que siempre existen las raíces n-ésimas positivas de números positivos. Queremos generalizar más este concepto para el caso en que a ą 0. Más precisamente, queremos definir expresiones de la forma ax cuando a ą 0 y x P R. Es decir queremos que queden definidas potencias de un número positivo cuando el exponente sea cualquier número real de tal manera que se sigan cumpliendo las leyes de los exponentes y así poder definir posteriormente las funciones exponenciales y las logarítmicas que son de gran utilidad en las ciencias sociales y naturales, así como en la ingeniería. 195 196 9.2. 9.2. Definición de potencias con exponentes reales Definición de potencias con exponentes reales 9.2.1. Definición. Sean a ą 1, x P R y pr1 , r2 , . . . , rj , . . . q una sucesión no decreciente de números racionales que converge a x. Definimos el número ax como el número al cual converge r1 r2 rj la sucesión parj q8 j“1 “ pa , a , . . . , a , . . . q. En la sección 8.9 se puede ver que cuando x ą 0, existe una tal sucesión prj q8 j“1 no decreciente y de números racionales positivos que converge a x. Si x ĺ 0 , podemos tomar un número natural M ą ´x y una sucesión no decreciente psj q8 j“1 que converja a M ` x. En este último caso, al tomar rj “ sj ´ M , vemos que prj q8 es una sucesión no decreciente de j“1 números racionales que converge a x. Tenemos así que para cualquier número real x siempre existe una sucesión no decreciente de números racionales que converge a x. Nuestra primera tarea es verificar que tal definición tiene sentido, es decir que no depende de la sucesión tomada con tal de que cumpla con las condiciones y que si x es racional, coincida con el valor ya definido de ax , además, por supuesto, que la sucesión parj q8 j“1 converja. rj 8 es no decreciente pues a ą 1. Si tomamos q es no decreciente, entonces pa Como prj q8 j“1 j“1 un racional s mayor que x, entonces para todo número natural j tenemos que arj ă as , por lo tanto parj q8 j“1 converge por ser acotada superiormente y no decreciente. Veamos el caso particular en que x P Q. Sea sj “ x ´ rj , el cual es un número racional x no negativo que tiende a cero cuando j tiende a infinito y arj “ ax´sj “ aasj . Afirmamos que si psj q8 no negativos que converge a 0, entonces j“1 es una sucesión de números racionales ´ 1 ¯8 ? 8 asj ÝÑ 1 cuando j ÝÑ 8. En efecto, la sucesión a n “ p n aqn“1 converge a 1 debido n“1 ˇ ˇ ˇ ˇ 1 al teorema 8.5.14, por lo que para todo ε ą 0 existe un n P N, tal que ˇa n ´ 1ˇ ă ε, en 1 particular a n ă 1 ` ε. Ahora, como psj q8 j“1 converge a 0, existe un N P N tal que si j ľ N , 1 1 entonces 0 ĺ sj ă n , por lo que 1 ´ ε ă 1 ĺ asj ă a n ă 1 ` ε, es decir ´ε ă asj ´ 1 ă ε, por x lo que asj ÝÑ 1 cuando j ÝÑ 8. Como sj “ x ´ rj , tenemos que arj “ aasj ÝÑ ax cuando j ÝÑ 8. Por lo que el valor de ax , cuando x es racional, coincide con el valor definido con anterioridad. Verifiquemos ahora que si pr11 , r21 , r31 , . . . , rj1 , . . . q y pr1 , r2 , r3 , . . . , rj , . . . q son dos sucesiones no decrecientes de números racionales que convergen a un mismo número x, entonces para rj1 8 1 a ą 1, las sucesiones parj q8 j“1 y pa qj“1 convergen al mismo número. Sean u y u los números 1 rj 8 a los cuales convergen las sucesiones parj q8 j“1 y pa qj“1 respectivamente y demostremos que u “ u1 . Para δ ą 0, sean N0 y N01 números naturales tales que j ľ N0 ùñ |rj ´ x| ă δ{2 j ľ N01 ùñ |rj1 ´ x| ă δ{2. y Si j ľ N0 ` N01 , entonces |rj ´ rj1 | “ |prj ´ xq ´ prj1 ´ xq| ĺ |rj ´ x| ` |rj1 ´ x| ă δ{2 ` δ{2 “ δ, por lo tanto la sucesión prj ´ rj1 q8 j“1 converge a 0. 9.2. Definición de potencias con exponentes reales 197 1 1 Como a n ÝÑ 1 cuando n ÝÑ 8, entonces también a´ n “ por lo que para cualquier ε ą 0 existe un n P N, tal que 1 |a n ´ 1| ă ε es decir 1 1 ´ ε ă an ă 1 ` ε 1 1 1 an ÝÑ 1 cuando n ÝÑ 8, 1 y |a´ n ´ 1| ă ε, y 1 ´ ε ă a´ n ă 1 ` ε, 1 1 pero como a´ n ă 1 ă a n , entonces 1 1 1 ´ ε ă a´ n ă a n ă 1 ` ε. Ahora, como rj ´ rj1 ÝÑ 0 cuando j ÝÑ 8, entonces existe un número natural N tal que si j ľ N , entonces ´ n1 ă rj ´ rj1 ă n1 , por lo que 1 1 1 1 ´ ε ă a´ n ă arj ´rj ă a n ă 1 ` ε, de donde se obtiene que 1 |arj ´rj ´ 1| ă ε; es decir para todo ε ą 0 existe un N P N, tal que 1 jľN ùñ |arj ´rj ´ 1| ă ε, ´ ¯8 ´ r ¯8 ´ r ¯8 1 j j “ arj ´rj converge a 1. Por otro lado, ar1 lo cual significa que la sucesión ar1 u , u1 a 1 j j“1 j“1 parj q8 j“1 a j j“1 1 parj q8 j“1 convergen al mismo y converge a por lo tanto u “ u , así las sucesiones x número, el cual denotamos por a . Hemos pues definido ax para a ą 1 y x P R, y verificado que tal definición tiene sentido. Definamos ahora ax cuando 0 ă a ĺ 1 y x P R. 9.2.2. Definición. Si x P R definimos 1x :“ 1. Si 0 ă a ă 1, definimos ax :“ 1 x p a1 q . Con esta última definición queda determinado el valor de ax en general cuando a ą 0 y x P R. 198 9.3. Propiedades de los exponentes 9.3. Propiedades de los exponentes En esta sección veremos que las propiedades de los exponentes racionales se siguen cumpliendo para exponentes reales. 9.3.1. Teorema. Si a ą 0 y x, y P R, entonces ax`y “ ax ay . Demostración. Es claro que la igualdad se cumple para a “ 1. Si a ą 1 y x, y P R, podemos 8 tomar sucesiones prj q8 j“1 y psj qj“1 no decrecientes de números racionales que converjan a x e y respectivamente. La sucesión prj ` sj q8 j“1 es una sucesión no decreciente de números racionales que converge a x ` y, por lo que ax`y “ lím arj `sj “ lím arj ¨ asj “ lím arj ¨ lím asj “ ax ¨ ay , jÑ8 jÑ8 jÑ8 jÑ8 por lo que ax`y “ ax ay si a ą 1. Si a ă 1, entonces 1 1 1 1 ax`y “ ` 1 ˘x`y “ ` 1 ˘x ` 1 ˘y “ ` 1 ˘x ¨ ` 1 ˘y “ ax ¨ ay . ¨ a a a a a ‚ Las demostraciones de los siguientes corolarios se dejan al lector. 9.3.2. Corolario. Si a ą 0, entonces a´x “ pax q´1 “ 1{ax . 9.3.3. Corolario. Si a ą 0, entonces ax´y “ ax {ay . 9.3.4. Teorema. Si a ą 1, entonces x ă y ðñ ax ă ay . 8 Demostración. Supongamos que x ă y. Sean prj q8 j“1 y psj qj“1 sucesiones no decrecientes de números racionales que convergen a x e y respectivamente con sj ą x para todo j. Tomemos además dos números racionales t0 y t1 tales que x ă t0 ă t1 ă s1 . Con estas condiciones tenemos que arj ă at0 ă at1 ă as1 ĺ asj ĺ ay , por lo que ax ĺ at0 ă ay , por lo tanto x ă y ùñ ax ă ay . Ahora supongamos que ax ă ay . Es imposible que x “ y puesto que tendríamos que ax “ ay . También es imposible que x ą y puesto que tendríamos que ax ą ay . Por lo tanto ax ă ay ùñ x ă y. Luego x ă y ðñ ax ă ay . ‚ 9.3.5. Corolario. Si 0 ă a ă 1, entonces x ă y ðñ ax ą ay . 1 y por definición de ax y ay , tenemos que Demostración. ` 1 ˘x Como ` 1 ˘y a ą 1,1 por el 1teorema 9.3.4 x ă y ðñ a ă a ðñ 1 x ą 1 y ðñ ax ą ay . ‚ paq paq 9.3.6. Teorema. Si a, b ą 0, entonces ax bx “ pabqx . Demostración. Sea prj q8 j“1 una sucesión no decreciente de números racionales que converge a x. Si a, b ą 1, entonces ˆ ˙ˆ ˙ x x rj rj a b “ lím a lím b “ lím parj brj q “ lím pabqrj “ pabqx . jÑ8 jÑ8 jÑ8 jÑ8 9.3. Propiedades de los exponentes 199 Si alguno de los números a ó b es 1 el resultado es directo. Si 0 ă a ă 1 y 0 ă b ă 1, entonces 1 1 1 1 ax bx “ ` 1 ˘x ` 1 ˘x “ ` 1 ˘x ` 1 ˘x “ ` 1 ˘x “ pabqx . a b a b ab Si 0 ă a ă 1 y b ą 1, entonces 1 x bx ˘ ` ` a b “ 1 x b “ 1 ˘x “ x x a a lím brj br j ` 1 ˘rj “ lím ` 1 ˘rj “ lím pabqrj . jÑ8 jÑ8 lím a a jÑ8 jÑ8 Ahora, si ab ľ 1, el último límite es igual a pabqx , y si 0 ă ab ă 1, tenemos también que 1 lím pabqrj “ lím ` 1 ˘rj “ jÑ8 jÑ8 ab lím 1 1 ` 1 ˘rj “ ` 1 ˘x “ pabqx . jÑ8 ab ab Análogamente, si a ą 1 y 0 ă b ă 1, se tiene que ax bx “ pabqx . ‚ La demostración del siguiente corolario se deja al lector. ` ˘x x 9.3.7. Corolario. Si a, b ą 0, entonces abx “ ab . 9.3.8. Teorema. Si a ą 1, entonces para todo x ą 0 se tiene que ax ą 1 y para todo y ă 0 se tiene que ay ă 1. Demostración. Supongamos que x ą 0 y a ą 1. Sea r un número racional tal que 0 ă r ă x, por el teorema 9.3.4 tenemos que ar ă ax , pero como r P Q, entonces ar ą 1, por lo tanto ax ą 1. Si y ă 0, entonces por el corolario 9.3.2 tenemos que ay “ 1{a´y , pero a´y ą 1, por lo que ay “ 1{a´y ă 1. ‚ 9.3.9. Teorema. Si a, b, x ą 0, entonces a ă b ðñ ax ă bx . Demostración. Si a ă b, entonces 1 ă b{a, por lo que 1 ă pb{aqx “ bx {ax , por lo tanto ax ă bx . Ahora si ax ă bx , entonces es imposible que a ľ b puesto que tendríamos ax ľ bx , por lo tanto a ă b. ‚ 9.3.10. Lema. Sea pak q8 de números reales positivos que converge k“1 una sucesión ` ? ˘8 ? a un número c y n un número natural. Si n ak k“1 es convergente, entonces converge a n c. ? Demostración. Si p n ak q8 k“1 es convergente, sea b el número al cual converge. Observando que b ľ 0, tenemos que ´ ? ¯n ? bn “ lím n ak “ lím p n ak qn “ lím ak “ c, kÑ8 por lo que b “ ? n c. kÑ8 kÑ8 ‚ 9.3.11. Lema. Sea pak q8 k“1 una sucesión de números reales positivos que converge a un r 8 número c y r P Q. Si pak qk“1 converge, entonces converge a cr . 200 9.3. Propiedades de los exponentes Demostración. Sea r “ m{n, donde m es un entero y n es un entero positivo. b a m{n n lím am lím ark “ lím ak “ lím n am k “ k kÑ8 kÑ8 kÑ8 kÑ8 c´ ¯m ´ ¯m{n n “ lím ak “ lím ak “ cr . ‚ kÑ8 kÑ8 9.3.12. Lema. Si pxj q8 j“1 es una sucesión no decreciente de números reales que converge a un número x y a ą 1, entonces axj ÝÑ ax j ÝÑ 8. cuando Demostración. Para j P N sea rj un número racional positivo tal que prj q8 j“1 sea no decreciente y xj ´ 1j ĺ rj ĺ xj . Afirmamos que rj ÝÑ x cuando j ÝÑ 8. En efecto, por el teorema 8.7.12 tenemos que rj ÝÑ x cuando j ÝÑ 8. Ahora, arj ĺ axj ĺ ax , por lo cual, volviendo a usar el teorema 8.7.12, obtenemos que axj ÝÑ ax cuando j ÝÑ 8. ‚ 9.3.13. Teorema. Si a ą 0 y además x, y P R, entonces pax qy “ axy . 8 Demostración. Supongamos primero que a ą 1 y sean prj q8 j“1 y psj qj“1 sucesiones no decrecientes de números racionales que convergen a x e y respectivamente. ´ ¯y ´ ¯sn pax qy “ lím ark “ lím lím ark . nÑ8 kÑ8 kÑ8 ppark qsn q8 k“1 Ahora, para sn fijo, la sucesión converge por ser no decreciente y acotada, por lo que debido al lema 9.3.11 tenemos ´ ¯sn ´ ¯ ´ ¯ rk rk sn rk sn lím lím a “ lím lím pa q “ lím lím a “ lím axsn . nÑ8 nÑ8 kÑ8 kÑ8 nÑ8 kÑ8 nÑ8 Ahora, por el lema 9.3.12, nÑ8 lím axsn “ axy , por lo tanto si a ą 1, entonces axy “ pax qy . Si a “ 1 el resultado es directo. ` ˘ `` ˘x ˘y xy Ahora, si 0 ă a ă 1, se tiene que a1 “ a1 , pero de la definición de axy cuando ` 1 ˘xy `` ˘x ˘y ` ˘y 0 ă a ă 1 se obtiene que a “ a1xy y, debido al corolario 9.3.7, a1 “ a1x “ pax1qy , concluyendo así que a1xy “ pax1qy , es decir axy “ pax qy , por lo que el resultado es válido para todo a ą 0. ‚ A continuación resumiremos las propiedades fundamentales de los exponentes que se expusieron en esta sección. 9.3.14. Leyes de los exponentes. Sean a, b ą 0 y x, y P R, entonces se cumplen las siguientes relaciones: I) ax`y “ ax ay ; II) ax´y “ ax ; ay III) pabqx “ ax bx ; ` ˘x x IV) ab “ abx ; V) pax qy “ axy ; VI) si a ą 1, entonces x ă y ðñ ax ă ay ; VII) si a ă 1, entonces x ă y ðñ ax ą ay . 9.4. Funciones exponenciales 9.4. 201 Funciones exponenciales Definiremos a continuación las funciones exponenciales. 9.4.1. Definición. Sea a ą 0, definimos la función exponencial base a, la cual denotaremos expa , como Y 7 6 5 expa : R ÝÑx p0; `8q. xÞÑa 4 A la función exponencial base a también se le llama antilogaritmo base a. y= ax 3 2 a>1 1 X Cuando la base a es mayor que 1, -4 4 -2 2 la gráfica de la función exponencial base a es similar a la de la figura anterior y cuando la base a es menor que 1 (siempre mayor que cero), entonces la gráfica de la función exponencial base a es similar a la de la figura siguiente. El caso degenerado de la función exponencial se tiene Y cuando a “ 1. En este caso la gráfica es la de la ecuación 15 y “ 1, es decir la función exponencial base 1 es constante. De acuerdo a las figuras anteriores podemos sospechar 12.5 que el recorrido de la función exponencial es el conjunto de los números positivos p0; `8q. 10 9.4.2. Teorema. Si a ą 1, entonces R pexpa q “ p0; `8q. 7.5 Demostración. Sea y ą 0, queremos ver que existe un x P R tal que expa pxq`“ y, es decir tal que ax “ y. y= ax ˘ 8 Como la sucesión a1n n“1 converge a 0 (teorema 8.5.13 2.5 I)) existe un N0 P N tal que 1{aN0 ă y, es decir existe un X número real x0 tal que ax0 ă y, por ejemplo x0 “ ´N0 . -4 -2 4 2 Ahora, de nuevo por el teorema 8.5.13, existe un N1 P N N1 tal que a ą y, es decir existe un número real x1 tal que ax1 ą y. Sea ahora Ay :“ tx : ax ă yu. 5 0<a<1 Debido a lo anterior Ay es no vacío y acotado superiormente por lo que x˚ :“ sup Ay existe, así tenemos tres posibilidades: ˚ ˚ aq ax “ y, bq ax ă y y ˚ cq ax ą y. Si se cumple a) el teorema es verdadero. Veamos que b) y c) son imposibles. ˚ ˚ ˚ Como ax ă ax `1{n para n P N, entonces ax `1{n ľ y (de otro modo x˚ no sería el supremo de Ay ). Ahora, por el teorema 8.7.13 y por el lema 9.3.12 ˚ x˚ `1{n y ĺ nÑ8 lím a ax ˚ “ nÑ8 lím ´1{n “ ax , a 202 9.4. Funciones exponenciales por lo tanto b) es imposible. ˚ ˚ ˚ Como ax ą ax ´1{n , entonces ax ´1{n ă y (de otro modo tendríamos que x˚ ´ 1{n ą x para todo x P Ay y x˚ no sería el supremo de Ay ). Ahora, por el teorema 8.7.13 y por el lema 9.3.12 ˚ ˚ y ľ nÑ8 lím ax ´1{n “ ax , ˚ por lo que c) es imposible, por lo tanto ax “ y y el teorema queda demostrado. ‚ 9.4.3. Corolario. Si a ą 0 y a ‰ 1, entonces Rpexpa q “ p0; `8q. Demostración. Si a ą 1 se aplica el teorema 9.4.2. Supongamos que 0 ă a ă 1 y sea y ą 0. Por el teorema 9.4.2 existe un x P R tal que p1{aqx “ 1{y, es decir 1{ax “ 1{y, obteniendo que ax “ y. ‚ 9.5. Aplicaciones de la función exponencial 9.5. 203 Aplicaciones de la función exponencial Supongamos que un fenómeno que se mide en números reales (que puede ser por ejemplo el tamaño de un población de bacterias, el grado de radiactividad de una sustancia, la cantidad de dinero que un ahorrador tiene en un banco a una tasa fija, etc.) cambia con el tiempo, de tal manera crece o decrece en incrementos de tiempo iguales de manera proporcional a la cantidad inicial. Es decir, supongamos que el fenómeno se mide mediante una función N que depende del tiempo t y que para todo incremento de tiempo ∆ existe una constante de proporcionalidad αp∆q tal que N pt ` ∆q ´ N ptq “ αp∆qN ptq, por ejemplo, la cantidad pN pt ` 1q ´ N ptqq{N ptq “ αp1q no depende de t. Si el problema en cuestión es el dinero de un ahorrador (con interés compuesto) y el tiempo t está expresado en días, entonces αp∆q representa la tasa de interés a los ∆ días y $N ptq representa el dinero que el ahorrador tiene a los t días suponiendo que comenzó con un depósito original de $N p0q, en este caso αp∆q ą 0 cuando el incremento ∆ ą 0. Si el problema en cuestión es el de una sustancia radiactiva, el grado de radiactividad decrecerá con el tiempo, de manera que αp∆q ă 0 cuando ∆ ą 0. Veamos qué características debe tener el valor N ptq que representa el fenómeno estudiado al ser observado en el tiempo t. Sea q la tasa de crecimiento en una unidad de tiempo y N0 la cantidad inicial, es decir q “ αp1q “ pN pt ` 1q ´ N ptqq{N ptq y N0 “ N p0q. Observemos que N p1q “ p1 ` qqN0 , N p2q “ p1 ` qqN p1q “ p1 ` qq2 N0 , N p3q “ p1 ` qqN p2q “ p1 ` qq3 N0 , . . . , N pnq “ p1 ` qqN pn ´ 1q “ p1 ` qqn N0 , . . . , N pn ` 1q “ p1 ` qqN pnq “ p1 ` qqn`1 N0 , . . . , para cualquier entero n ľ 1. Ahora, si k y n son enteros positivos y qk “ αp1{kq tenemos, siguiendo un argumento similar, que N pnq “ p1 ` qk qnk N0 “ p1 ` qqn N0 , por lo tanto 1 ` qk “ p1 ` qq1{k y N pn{kq “ p1 ` qk qn N0 “ pp1 ` qq1{k qn N0 “ p1 ` qqn{k N0 , de modo que si r es un número racional, entonces N prq “ p1 ` qqr N0 . Observemos que si tomamos a “ 1 ` q, entonces para todo número racional r, tenemos que N prq “ N0 ar . En la mayoría de los casos prácticos tiene sentido suponer que si t1 « t2 , entonces también N pt1 q « N pt2 q. Ahora, recordemos que si t es un número real, podemos aproximar a t mediante una sucesión de números racionales pr1 , r2 , r3 , . . . , rk , . . . q que converja a t y además la sucesión de números reales convergerá a at , con lo que podemos establecer que para todo número real t N ptq “ N0 at . 204 9.5. Aplicaciones de la función exponencial Es decir, N es una exponencial base a multiplicada por una constante N0 . Es muy común expresar a la función N descrita anteriormente como N ptq “ N0 ekt , donde e es la constante de Napier y k es el logaritmo base e de a. En la siguiente sección hablaremos en forma más precisa de las funciones logarítmicas. 9.5.1. Ejemplo. Supóngase que se invierten $10 000 durante 6 años con una tasa anual del 5 % (supondremos además que se reinvierten los intereses y que no hay ninguna otra inversión extra). Calcular el capital neto a los 6 años. Solución. Sea t el tiempo en años y N ptq la cantidad de dinero en el tiempo t. La cantidad de dinero inicial N0 (medida en $) será igual a 10 000 y la tasa de interés anual q es de 0.05, de manera que se tiene N ptq “ N0 p1 ` qqt “ 10 000p1 ` 0.05qt . De manera que a los 6 años se tendrán $10 000p1 ` 0.05q6 « $13 400.1. 9.5.2. Ejemplo. El isótopo del polonio 210 Po tiene una vida media de 140 días, es decir, si se tiene una cierta cantidad de 210 Po, la mitad se desintegrará en 140 días. Determinemos la cantidad de 210 Po que habrá a los 35 días si actualmente hay 50 mg. Solución. El problema puede resolverse obteniendo la tasa diaria de desintegración o bien tomando 140 días como unidad de tiempo. Tomemos 140 días como unidad de tiempo, de manera que 35 días es 41 de la unidad de tiempo. Si M0 es la masa inicial y M ptq es la masa que queda de 210 Po en el tiempo t, entonces M ptq “ M0 p1 ` qqt , donde ´q “ 12 es la proporción del material que se desintegra en una unidad de tiempo (40 días), es decir 1 ` q “ 12 . De esta forma, la masa en miligramos que habrá dentro de 35 días será de ˆ ˙ ˆ ˙ 14 1 1 M “ 50 « 42. 4 2 9.6. Funciones logarítmicas 9.6. 205 Funciones logarítmicas 9.6.1. Observación. Observemos que cuando la base a de una función exponencial es diferente de 1, entonces la función será inyectiva. En efecto, si a ą 1 y x ‰ y, entonces x ă y ó x ą y, por lo que ax ă ay ó ax ą ay , es decir ax ‰ ay ; si 0 ă a ă 1 y x ‰ y, entonces x ă y ó x ą y, por lo que ax ą ay ó ax ă ay , es decir ax ‰ ay . También en ambos casos el recorrido de la función es p0; `8q (corolario 9.4.3) por lo que tienen funciones inversas. Es decir para todo a P p0; `8qzt1u existe la función R, exp´1 a : p0; `8q ÝÑ xÞÑy donde x “ expa pyq “ ay . 9.6.2. Definición. A la función exp´1 a se le llama función logaritmo base a y se le denota por loga . Así y “ loga pxq significa que ay “ x, es decir el logaritmo base a de x es el número al cual se debe elevar la base a para obtener como resultado x. El siguiente teorema describe las propiedades básicas de los logaritmos y se conoce como las leyes de los logaritmos. 9.6.3. Leyes de los logaritmos. Si a ą 0 y es diferente de 1, y además u, v y r son números reales, entonces: a) loga puvq “ loga u ` loga v. b) loga pu{vq “ loga puq ´ loga pvq. c) loga pur q “ r loga puq. Demostración. a) Hagamos t “ loga u y s “ loga v. Por definición de logaritmo base a tenemos at “ u y as “ v, de modo que at`s “ uv o equivalentemente t ` s “ loga puvq, es decir loga puvq “ loga u ` loga v, con lo que hemos demostrado a). b) Tomemos de nuevo t y s como en la demostración del inciso a). at´s “ at {as “ u{v, es decir t ´ s “ loga pu{vq o equivalentemente loga pu{vq “ loga u ´ loga v, 206 9.6. Funciones logarítmicas con lo cual hemos demostrado b). c) Haciendo de nuevo t “ loga puq, tenemos ur “ pat qr “ art , es decir r loga puq “ rt “ loga pur q, con lo que terminamos la demostración de c) y del teorema. ‚ 9.6.4. Definición. El logaritmo base e es también llamado logaritmo natural o logaritmo neperiano y lo denotaremos por ln. 9.6.5. Aclaración. En algunos textos, cuando no se especifica, el símbolo log significa log10 y el símbolo ln significa loge . En otros textos, sin embargo, sobre todo en los de matemáticas avanzadas o de variable compleja, el símbolo log significa loge . Generalmente en las calculadoras la tecla log se refiere al logaritmo base 10, mientras que la tecla ln se refiere al logaritmo base e. En la mayoría de las calculadoras y tablas de logaritmos, sólo podemos encontrar los valores de los logaritmos base 10 y base e. Haciendo uso de calculadora o de tablas ¿cómo podemos encontrar el valor de un logaritmo base a, cuando a es un número positivo diferente de e y de 10? La respuesta la da la fórmula que está en el siguiente teorema. 9.6.6. Teorema. Sean a, b y x tres números positivo, con a, b ‰ 1. Se cumple la siguiente fórmula: logb x . loga x “ logb a Demostración. Sea t “ loga x y k “ logb a. Tenemos las siguientes igualdades logb x “ logb at “ logb pbk qt “ logb bkt “ kt “ plogb aqploga xq, con lo que concluimos que loga x “ logb x . logb a ‚ Se deja como ejercicio al lector la demostración del siguiente teorema. 9.6.7. Teorema. Si a y b son dos números positivos diferentes de 1, entonces ax “ bplogb aqx , para todo número real x. En particular ax “ epln aqx . En el teorema anterior, si hacemos k “ ln a, vemos que toda expresión de la forma ax se puede expresar en una de la forma ekx . Ejercicios. 1. Evaluar o simplificar las expresiones siguientes: ? a) log10 100, b) log2 32, c) log3 81, d) log 1 p1{16q, e) eln 3 , 2 ? 5 log5 5 ´ ln 7 ln 3´ln 7 f) e , g) e , h) log7 49, i) 5 , j) 3log2 16 , k) 31log31 5 , l) 36log49 7 , m) 64log8 2 , n) 5log5 x . 9.6. Funciones logarítmicas 207 2. Poner cada expresión como un solo logaritmo. a) ln x ` ln y ´ ln z, b) 1 4 loga x ` 24 loga y ´ 21 loga z, c) `4 5 ˘ ln x ´ 25 ln y ´ 35 ln z. 3. Resolver las ecuaciones siguientes: a) log10 x ` 2 log10 4 “ 2, b) log3 x ` log3 px ´ 2q “ 1, c) 6x`2 “ 1, ´ ¯ ˇ ˇ ? 2 x d) ln ˇx ` x2 ` 12ˇ “ ln 3 ` ln 2, e) ln ex ´1 “ 8, f) 33 “ 27, ˘ ` x ˘ ` “ 1 ` log3 x´1 , g) ln x ` ln 3 “ lnpx ` 1q, h) log3 x´1 x´2 i) lnpx ´ 1q ` lnpx ` 2q “ ln 1. 4. Una colonia de bacterias crece exponencialmente a razón 3 % por minuto durante los primeros 60 minutos. Si inicialmente hay 150 000 bacterias: a) Encontrar una fórmula para calcular aproximadamente el número N de bacterias a los t minutos después del instante inicial con 0 ĺ t ĺ 60. b) Determinar cuántas bacterias habrá a los 40 minutos. c) Dar, si es posible, una función que exprese a t en términos de N , especificando el dominio y el recorrido de tal función. d) ¿Cuántas bacterias habrá a los 5 años? e) ¿En cuánto tiempo habrá 200 000 bacterias? 5. Si y “ f pxq, para cada una de las expresiones siguientes determinar f ´1 . ` 1 ˘ ? x c) y “ ln 1´4x , d) y “ ex . a) y “ lnpx ´ 4q, b) y “ 2x2`3 , 208 9.6. Funciones logarítmicas Capítulo 10 FUNCIONES Y SUS GRÁFICAS 10.1. Introducción En este capítulo estudiaremos las funciones reales con variables reales, es decir funciones de la forma f : A ÝÑ R, donde A Ă R. Veremos el comportamiento de las funciones a través de sus gráficas y veremos algunos temas relacionados con tales comportamientos. Recordemos que la gráfica de una función f : A ÝÑ R es Grpf q “ tpx, yq : y “ f pxq, x P Au. 10.1.1. Definiciones. Definiremos a continuación algunas de las gráficas más sencillas que son subconjuntos de R2 y daremos algo de terminología general. Al conjunto tpx, yq P R2 : y “ 0u lo llamaremos eje X o eje de las abscisas, al conjunto tpx, yq P R2 : x “ 0u lo llamaremos eje Y o eje de las ordenadas. A los ejes de las abscisas y de las ordenadas se les llama ejes de coordenadas. Si a es un número dado, diremos que el conjunto tpx, yq P R2 : x “ au es una recta vertical y que el conjunto tpx, yq P R2 : y “ au es una recta horizontal. En general una recta incluida en R2 es un conjunto de la forma tpx, yq P R2 : αx ` βy ` γ “ 0u para algunos números dados α, β y γ, con α ‰ 0 ó β ‰ 0 (observemos que cuando α “ 0 y β “ 0, el conjunto anterior es el vacío o es todo R2 ). Podemos ver que las rectas verticales no son la gráfica de ninguna función y que las rectas no verticales son la gráfica de alguna función f dada por f pxq “ ax ` b, tal función se dice que es una función afín y en el caso particular en que b “ 0 se llama función lineal. Observemos que una función de la forma f pxq “ b es una función afín cuya gráfica es una recta horizontal, a una función como la anterior se le llama función constante. En esta sección, a los elementos de R2 los llamaremos puntos. Al conjunto tpx, yq P R2 : x ľ 0 e y ľ 0u se le llama primer cuadrante, al conjunto tpx, yq P R2 : x ĺ 0 e y ľ 0u se le llama segundo cuadrante, al conjunto tpx, yq P R2 : x ĺ 0 e y ĺ 0u se le llama tercer cuadrante y al conjunto tpx, yq P R2 : x ľ 0 e y ĺ 0u se le llama cuarto cuadrante. 10.1.2. Teorema. Dados dos puntos diferentes px0 , y0 q y px1 , y1 q, existe una única recta a la cual pertenecen. Demostración. Si x0 “ x1 , entonces es claro que la única recta a la cual pertenecen esos dos puntos es la recta vertical con ecuación x “ x0 . Si x0 ‰ x1 , entonces los puntos no 209 210 10.1. Introducción pertenecen a ninguna recta vertical y, para que los dos puntos pertenezcan a una recta, ésta debe ser la gráfica de una función afín f de la forma f pxq “ ax ` b, y los número a y b deben satisfacer las condiciones y0 “ ax0 ` b e y1 “ ax1 ` b, es decir a “ py1 ´ y0 q{px1 ´ x0 q y b “ y0 ´ x0 py1 ´ y0 q{px1 ´ x0 q, recíprocamente podemos ver que para estos valores de a y b, los puntos px0 , y0 q y px1 , y1 q forman parte de la recta que es la gráfica de f y ésta es la única recta afín que satisface las condiciones y0 “ ax0 ` b e y1 “ ax1 ` b. ‚ 10.1.3. Definiciones. Decimos que una recta que es la gráfica de una función afín f de la forma f pxq “ ax ` b tiene pendiente a. De la demostración del teorema anterior, podemos observar que si a tal recta pertenecen dos puntos diferentes px0 , y0 q y px1 , y1 q, entonces la pendiente está dada por py1 ´ y0 q{px1 ´ x0 q. Diremos además que una recta vertical tiene pendiente infinita. Si la intersección de dos rectas incluidas en R2 es el conjunto vacío, diremos que las rectas son paralelas. 10.1.4. Ejemplo. La gráfica de la función f determinada por f pxq “ 2x ` 1 es una recta cuya ecuación es y “ 2x ` 1. Como la gráfica es una recta, basta que tomemos dos punto de ella para trazarla, por ejemplo si x “ 0, entonces y “ 1 y si x “ 2, entonces y “ 5. Un primer criterio para analizar el comportamiento de una gráfica es determinar la intersección con los ejes de coordenadas y algunos otros puntos de la gráfica. Además es importante determinar el dominio y el recorrido de la función. La función del ejemplo 10.1.4 tiene como dominio al conjunto R, el punto de intersección con el eje X es p´ 12 , 0q y el punto de intersección con el eje Y es p0, 1q. Veamos ahora un tipo de funciones un poco menos sencillas que las rectas. Y 12 10 8 6 4 y=2x+1 2 -4 -2 -2 2 4 6X -4 -6 -8 10.1.5. Definición. Supongamos que a, b y c son números dados con a ‰ 0 y sea f función cuadrática definida como f pxq “ ax2 ` bx ` c; a la gráfica de la función f se le llama parábola vertical, cuando a ą 0 decimos que la parábola se abre hacia arriba y cuando a ă 0 decimos que se abre hacia abajo. Para de una parábola vertical observemos que ax2 ` bx ` c ´ ver el `comportamiento ¯ ˘ ` ˘ 2 2 b b b 2 b2 “ a x2 ` ab x ` 2a ` c ´ 4a “ a x ` 2a ` c ´ 4a , de modo que si a ą 0, en2 b b tonces el valor mínimo de la función es c ´ 4a y lo toma cuando x “ ´ 2a , mien2 b tras que si a ă 0, entonces ´ el valor ¯máximo de la función es c ´ 4a y lo toma cuanb do x “ ´ 2a . Al punto b ´ 2a ,c ´ b2 4a se le llama vértice de la parábola vertical. 10.1. Introducción 10.1.6. Ejemplo. Analizar la forma de la gráfica de la función g determinada por y “ x2 ` x ` 1. Solución. La gráfica de la relación y “ x2 ` x ` 1 ó equivalentemente ˆ ˙2 1 3 y “ x` ` 2 4 es una parábola que se abre hacia arriba y con vértice en p´ 12 , 34 q. No tiene punto de intersección con el eje X. El único punto de intersección con el eje Y es p0, 1q. El dominio de g es R y el recorrido es el intervalo r 34 ; `8q. 211 Y 18 16 14 12 10 8 6 4 2 -4 -2 y=x2 +x+1 2 4 6 8 X Para hacer un buen trazo de la gráfica de una función f , se recomienda tomar una buena cantidad de valores de x en el dominio de la función y evaluarlos en la función f , de tal manera que la gráfica debe tener a los puntos px, f pxqq. También es conveniente saber dónde se interseca la gráfica con los ejes de coordenadas. 10.1.7. Definiciones. Cuando la función f es tal que f pxq “ f p´xq para todo valor de x en el dominio de la función f , entonces el conocer la gráfica de f en donde la primera coordenada es positiva es suficiente para conocer su gráfica cuando la primera componente es negativa, en tal caso la gráfica de f es simétrica con respecto al eje de las ordenadas, es decir es simétrica con respecto al eje Y y decimos en tal caso que f es una función par. Un ejemplo de una función par es la función f tal que f pxq “ x4 ` x2 ` 1. Cuando la función f es tal que f pxq “ ´f p´xq para todo valor de x en el dominio de la función f , entonces el conocer la gráfica de f en donde la primera coordenada es positiva es suficiente para conocer su gráfica cuando la primera componente es negativa, en tal caso la gráfica de f es simétrica con respecto al origen, es decir es simétrica con respecto al punto p0, 0q y decimos en tal caso que f es una función impar. Un ejemplo de una función impar es la función f tal que f pxq “ x3 ` x. Sea a un número positivo. Si dos funciones f y g son tales que para todo valor de x se tiene que f pxq “ gpx ´ aq, entonces decimos que f es una traslación a la derecha de g o que g es una traslación a la izquierda de f . Más específicamente, decimos que la gráfica de f es la traslación de a unidades a la derecha de la gráfica de g o que la gráfica de g es la traslación de a unidades a la izquierda de la gráfica de f . Sea a un número positivo. Si dos funciones f y g son tales que para todo valor de x se tiene que f pxq “ gpxq ` a, entonces decimos que f es una traslación hacia arriba de g o que g es una traslación hacia abajo de f . Más específicamente, decimos que la gráfica de f es la traslación de a unidades hacia arriba de la gráfica de g o que la gráfica de g es la traslación de a unidades hacia abajo de la gráfica de f . Cuando tenemos un número a ą 1, dos funciones f y g tales que para todo valor de x se tiene que f pxq “ agpxq, entonces decimos que la gráfica de f es una elongación vertical de la gráfica de g o que la gráfica de g es contracción vertical de la gráfica de f . Cuando tenemos un número a ą 1, dos funciones f y g tales que para todo valor de x se tiene que f pxq “ gpx{aq, entonces decimos que la gráfica de f es una contracción horizontal de la gráfica de g o que la gráfica de g es elongación horizontal de la gráfica de f . 212 10.1. Introducción Los conceptos anteriores sirven para trazar la gráfica de una función a partir de otra más sencilla o de otra cuya gráfica sea conocida y esté relacionada de alguna de las formas anteriores. Si f es una función tal que existe un número positivo T tal que para cualquier valor de x en el dominio de la función f se tiene que x ` T también está en el dominio de la función y además f pxq “ f px ` T q, entonces decimos que f es una función periódica y que T es un período de f . Observemos que para conocer el comportamiento y la gráfica de una función periódica basta con conocerlo en un intervalo semiabierto de longitud T , es decir en uno de la forma pa; a ` T s o de la forma ra; a ` T q. (Si a ĺ b, decimos que la longitud de cualquiera de los intervalos pa; bq, pa; bs, ra; bq ó ra; bs es b ´ a). Sea A Ă R y f : A ÝÑ R. Decimos que la función f es creciente o estrictamente creciente cuando x ă y ùñ f pxq ă f pyq, para x, y P A. Decimos que f es decreciente o estrictamente decreciente cuando x ă y ùñ f pxq ą f pyq, para x, y P A. Decimos que f es no decreciente cuando x ă y ùñ f pxq ĺ f pyq, para x, y P A. Decimos que f es no creciente cuando x ă y ùñ f pxq ľ f pyq, para x, y P A. Una función que sea no decreciente o no creciente se dice que es monótona. Sea B Ă A, decimos que la función f es creciente, decreciente, no decreciente o no creciente en B si la función f |B (la restricción de f al conjunto B) es respectivamente creciente, decreciente, no decreciente o no creciente. Ejercicios. 1. Trazar la gráfica de la función f : R ÝÑ R tal que tenga período 2 y la restricción al intervalo r´1; 1s sea la función px P r´1; 1sq ÞÑ |x|. 2. Decir cuales de las siguientes funciones son monótonas en su domino. En caso de que sean monótonas decir si son no creciente o no decrecientes: a) px P r´1; 1sq ÞÑ x2 , b) px P r0; `8sq ÞÑ x3 , c) px P r´8; 0sq ÞÑ x2 , d) px P Rq ÞÑ x2 . 10.2. Asíntotas horizontales 10.2. 213 Asíntotas horizontales Sea f una función e y “ f pxq su relación correspondiente. En esta sección veremos el comportamiento de la variable y cuando x está «lejos» del cero. 10.2.1. Definición. Sea f una función cuyo dominio incluye a un intervalo pa; `8q. Decimos que el límite cuando x tiende a `8 de f pxq es el número k si para todo ε ą 0 existe un M ą a tal que x ľ M ùñ |f pxq ´ k| ă ε. Y k Analicemos la definición anterior. La expresión |f pxq ´ k| ă ε significa que la distancia entre k y f pxq es menor que ε, o equivalentemente que f pxq está entre k ´ ε y k ` ε. La expresión x ľ M ùñ |f pxq ´ k| ă ε significa que para valores de x a partir de M (o posiblemente desde antes) la distancia entre f pxq y k es menor que ε. Finalmente, la expresión X @ε ą 0, DM ą a, x ľ M ùñ |f pxq ´ k| ă ε significa que si queremos que f pxq esté suficientemente cercano a k (|f pxq ´ k| ă ε) basta con tomar un x suficientemente grande (x ľ M ). ¿Qué tan grande debemos de tomar x? La respuesta depende de qué tan cercano a k queremos el valor de f pxq. 10.2.2. Ejemplo. Sea f pxq “ 2{x ` 3. Intuitivamente vemos que si x es grande, el valor de f pxq “ 2{x ` 3 se aproxima a 3. Si queremos que la distancia entre f pxq y 3 sea menor que 1{100, es decir que 3 ´ 1{100 ă 2{x ` 3 ă 3 ` 1{100, es suficiente con tomar x ľ 201. Si 1 1 , es decir que 3 ´ 1000000 ă queremos que la distancia entre f pxq y 3 sea menor que 1000000 1 2{x ` 3 ă 3 ` 1000000 , es suficiente con tomar x ľ 2000001. Y 10.2.3. Definición. Sea f una función cuyo dominio incluye a un intervalo p´8; aq. Decimos que el límite cuando x tiende a ´8 de f pxq es el número k si para todo ε ą 0 existe un M ă a tal que k y=fHxL x ĺ M ùñ |f pxq ´ k| ă ε. a X 214 10.2. Asíntotas horizontales Veamos algunas notaciones. Si k es el límite cuando x tiende a `8 de f pxq, entonces definimos el símbolo lím f pxq :“ k xÑ`8 y también escribimos f pxq ÝÑ k cuando x ÝÑ `8. Similarmente, si k es el límite cuando x tiende a ´8 de f pxq, entonces definimos el símbolo lím f pxq :“ k xÑ´8 y también escribimos f pxq ÝÑ k cuando x ÝÑ ´8. 10.2.4. Definición. Si f pxq ÝÑ k cuando x ÝÑ `8 ó f pxq ÝÑ k cuando x ÝÑ ´8, decimos que la recta con ecuación y “ k es una asíntota horizontal de la función f . (También se dice que es una asíntota horizontal de la gráfica de f ). 10.2.5. Ejemplo. Sea f pxq “ 2{x ` 3. Demostrar que lím f pxq “ 3 y que lím f pxq “ 3. xÑ`8 xÑ´8 Solución. Sea ε ą 0. La desigualdad |f pxq ´ 3| ă ε es equivalente con |2{x| ă ε, la cual a su vez es equivalente con |x| ą 2{ε y para que suceda esta última desigualdad es suficiente con que x ľ 2{ε ` 1 ó x ĺ ´2{ε ´ 1. Es decir, si x ľ 2{ε ` 1 entonces |f pxq ´ 3| ă ε y si x ĺ ´2{ε ´ 1 entonces |f pxq ´ 3| ă ε, por lo cual lím f pxq “ 3 y lím f pxq “ 3. Observemos que y “ 3 es una asíntota horizontal xÑ`8 xÑ´8 de la función f . 10.2.6. Definición. Sea f una función cuyo dominio incluye a un intervalo pa; `8q. Decimos que f pxq tiende a `8 cuando x tiende a `8 o que el límite de f pxq cuando x tiende a `8 es `8 si @L P R, DM ą a, x ľ M ùñ f pxq ą L. Analicemos el significado de la definición anterior. La expresión x ľ M ùñ f pxq ą L significa que a partir de valores de x mayores o iguales que M el valor de f pxq será mayor que L. La expresión completa @L P R DM ą a, x ľ M ùñ f pxq ą L significa que si queremos tomar f pxq «suficientemente grande» (más grande que cualquier valor L que demos) es suficiente con tomar x «suficientemente grande» (x mayor o igual que algún número M ). El valor de M depende de L y de la función f . 10.2.7. Ejemplo. Demostrar que `8 es el límite de 2x2 cuando x tiende a `8. Y Solución. Para L P R, sea M “ máxt1, Lu. Si L ĺ 1, entonces x ľ M ùñ x ľ 1 ùñ 2x2 ľ 2 ą 1 ľ L. Si L ą 1, entonces x ľ M ùñ x ľ L ùñ 2x2 ą L2 ą L. (También se pudo haber tomado, por ejemplo M “ |L|`1). 8 10.2.8. Notación. Al hecho de que el límite de f pxq cuando x tiende a `8 sea `8 lo denotamos por 4 6 y=2x2 2 lím f pxq “ `8 xÑ`8 o bien escribimos f pxq ÝÑ `8 cuando x ÝÑ `8. -4 Enunciemos las siguientes definiciones similares a la anterior. -2 2 4 X 10.2. Asíntotas horizontales 215 Y 10.2.9. Definición. Sea f una función cuyo dominio incluye a un intervalo pa; `8q. Decimos que f pxq tiende a ´8 cuando x tiende a `8 o que el límite de f pxq cuando x tiende a `8 es ´8 si y=fHxL X @L P R, DM ą a, x ľ M ùñ f pxq ă L. El hecho anterior se escribe lím f pxq “ ´8 xÑ`8 o bien f pxq ÝÑ ´8 cuando x ÝÑ `8. 10.2.10. Definición. Sea f una función cuyo dominio incluye a un intervalo p´8; aq. Decimos que f pxq tiende a `8 cuando x tiende a ´8 o que el límite de f pxq cuando x tiende a ´8 es `8 si @L P R, DM ă a, x ĺ M ùñ f pxq ą L. El hecho anterior se escribe lím f pxq “ `8 xÑ´8 o bien f pxq ÝÑ `8 cuando x ÝÑ ´8. 10.2.11. Definición. Sea f una función cuyo dominio incluye a un intervalo p´8; aq. Decimos que f pxq tiende a ´8 cuando x tiende a ´8 o que el límite de f pxq cuando x tiende a ´8 es ´8 si @L P R, DM ă a, x ĺ M ùñ f pxq ă L. El hecho anterior se escribe lím f pxq “ ´8 xÑ´8 o bien f pxq ÝÑ ´8 cuando x ÝÑ ´8. Tenemos ahora más herramientas para hacer un mejor trazo de la gráfica de una función. Además de determinar el dominio y el recorrido de la función, localizar algunos puntos de la gráfica e identificar los puntos de intersección de la gráfica con los ejes de coordenadas buscaremos las asíntotas horizontales (si existen) o en general determinaremos el comportamiento de la función cuando x ÝÑ ´8 y cuando x ÝÑ `8. 10.2.12. Ejemplo. Trazar la gráfica de la función f , donde f pxq “ 2x2 ´ 1. Solución. El dominio de f es R. Observemos que el valor mínimo posible de 2x2 es 0, por lo que el valor mínimo posible de 2x2 ´ 1 es ´1, de donde podemos ver que el recorrido de f es p´1; `8q. Cuando x “ 0 tenemos f pxq “ ´1, de modo que el punto de intersección con el eje Y?es ? 2 2 1 2 2 p0, ´1q. Si f pxq “ 0, entonces 2x ´ 1 “ 0, de modo que ´ ¯ x´ “ 2 , es ¯ decir x “ 2 ó x “ ´ 2 , ? así los puntos de intersección con el eje X son 2 ,0 2 y ´ ? 2 ,0 2 . 216 10.2. Asíntotas horizontales Y Observemos que la gráfica de f no tiene asíntotas horizontales pues lím f pxq “ `8 y lím f pxq “ xÑ´8 8 xÑ`8 `8. En efecto, si L P R y x ľ |L| ` 2, tenemos que f pxq “ 2x2 ´ 1 ľ 2p|L| ` 2q2 ´ 1 “ 2p|L|2 ` 4|L| ` 4q ´ 1 ą |L| ľ L 6 lím f pxq “ `8. Aho- 6 xÑ`8 ra si x ă ´|L| ´ 2, entonces f pxq “ 2x2 ´ 1 ľ 2p´|L| ´ 2q2 ´ 1 “ 2p|L|2 ` 4|L| ` 4q ´ 1 ą |L| ľ L 6 lím f pxq “ `8. xÑ´8 Estamos pues en condiciones de hacer un buen tra-4 zo de la gráfica de la función f definida por f pxq “ 2x2 ´ 1. y=2x2 -1 4 2 -2 2 4 6 8 X 10.2.13. Ejemplo. Sea gpxq “ x1 . Trazar la gráfica de la función g. Solución. El dominio de g es Dompgq “ tx P R : x ‰ 0u y el recorrido es Rpgq “ ty P R : y “ x1 para algún x ‰ 0u. Observemos que Rpgq “ ty P R : y ‰ 0u. En efecto, x1 no puede ser igual a cero y si y ‰ 0 entonces tomando x “ y1 tenemos que x1 “ 11 “ y 6 y Rpgq “ ty P R : y ‰ 0u. Como ni x ni y pueden ser cero, entonces la gráfica de g no interseca a ninguno de los ejes de coordenadas. Veamos qué sucede cuando x ÝÑ `8 y cuando x ÝÑ ´8. Podemos ver que cuando x ÝÑ `8, entonces gpxq “ x1 ÝÑ 0 y cuando x ÝÑ ´8, entonces gpxq “ x1 ÝÑ 0. Es decir 1 que lím x1 “ lím x1 “ 0. En efecto, sea ε ą 0. Si x ľ 1{ε ` 1, entonces 0 ă x1 ă 1 `1 “ 1 xÑ`8 ε “ ε`1 q p 1`ε ε xÑ´8 ă ε 6 | x1 ´ 0| ă ε, es decir lím 1 xÑ`8 x ε “ 0. De manera similar se puede ver que si x ĺ ´1{ε ´ 1, entonces | x1 ´ 0| ă ε, es decir lím 1 xÑ´8 x “ 0. Debido a lo anterior tenemos que la recta con ecuación y “ 0 (el eje X) es una asíntota horizontal de y “ x1 por dos razones diferentes, por que lím x1 “ 0 y por que lím x1 “ 0. xÑ´8 xÑ`8 Podemos ahora trazar la gráfica de y “ x1 . Y 4 3 2 y=1x 1 -4 -2 2 -1 -2 Ejercicios. 4 X En la gráfica anterior podemos observar que si x está suficientemente cerca de 0 pero con valores mayores que 0, entonces x1 estará lejos de 0 con valores mayores que 0, es decir x1 será grande; pero si x está suficientemente cerca de 0 pero con valores menores que 0, entonces x1 estará lejos de 0 pero con valores negativos. Esto nos lleva a la idea de asíntota vertical que será definida en la siguiente sección. -3 -4 1. Hallar la asíntota horizontal de la función px P Rq ÞÑ 3 ` e´x . 2. Decir si la función ps P r0; `8sq ÞÑ |s| ` 3s tiene una asíntota horizontal. 10.3. Asíntotas verticales 10.3. 217 Asíntotas verticales Y 10.3.1. Definición. Sea f una función cuyo dominio incluye un conjunto pa; bqztx0 u con x0 P pa; bq. Decimos que el límite cuando x ÝÑ x0 de f pxq es `8 si @L P R, Dδ ą 0, 0 ă |x ´ x0 | ă δ ùñ f pxq ą L. Al hecho anterior lo denotamos como y=fHxL lím f pxq “ `8. xÑx0 X Así mismo decimos que el límite cuando x ÝÑ x0 de f pxq es ´8 (denotado xÑx lím f pxq “ ´8) si x=x0 0 @L P R, Dδ ą 0, 0 ă |x ´ x0 | ă δ ùñ f pxq ă L. Analicemos la definición anterior. El hecho de que 0 ă |x ´ x0 | ă δ ùñ f pxq ă L Y significa que si x ‰ x0 pero la distancia entre x y x0 es menor que δ, entonces f pxq ă L. La expresión x=x0 Dδ ą 0, 0 ă |x ´ x0 | ă δ ùñ f pxq ă L significa que si x ‰ x0 pero x está suficientemente cerca de x0 , entonces f pxq ă L. Finalmente la expresión completa X y=fHxL @L P R, Dδ ą 0, 0 ă |x ´ x0 | ă δ ùñ f pxq ă L, es decir xÑx lím f pxq “ ´8 significa que el valor de f pxq puede hacerse menor que cualquier 0 número si x ‰ x0 pero x está suficientemente cercano x0 . 10.3.2. Ejemplo. Sea f pxq “ ´1 . px´2q2 Demostrar que lím f pxq “ ´8. xÑ2 ´1 2 Solución. Sea L P R. Para que px´2q 2 ă L es suficiente que px ´ 2q p|L| ` 1q ă 1 y x ‰ 2 ´1 (en efecto, x ‰ 2 y px ´ 2q2 p|L| ` 1q ă 1 ùñ L ą ´p|L| ` 1q ą px´2q 2 ) lo cual equivale a 1 1 ´1 0 ă |x ´ 2| ă ? , por lo tanto 0 ă |x ´ 2| ă ? ùñ px´2q2 ă L, es decir tomando |L|`1 1 |L|`1 δ“? en la definición de límite tenemos que |L|`1 lím ´1 2 xÑ2 px´2q “ ´8. 218 10.3. Asíntotas verticales Y x=2 -1 1 2 3 4 5 6 7 8 X -4 -6 y=-1Hx-2L2 -8 Definamos ahora los conceptos de límites infinitos unilaterales. 10.3.3. Definición. Sea f una función cuyo dominio incluye a un intervalo px0 ; bq, con b ą x0 . Decimos que el límite cuando x tiende a x0 por la derecha de f pxq es `8 (respectivamente ´8) si @L P R, Dδ ą 0, x0 ă x ă x0 ` δ ùñ f pxq ą L prespectivamente f pxq ă Lq. Al hecho anterior lo denotamos por lím` f pxq “ `8 ó lím f pxq “ `8 (respectivamente xÓx0 xÑx0 lím f pxq “ ´8 ó lím f pxq “ ´8). xÓx0 xÑx` 0 10.3.4. Definición. Sea f una función cuyo dominio incluye a un intervalo pa; x0 q, con a ă x0 . Decimos que el límite cuando x tiende a x0 por la izquierda de f pxq es `8 (respectivamente ´8) si @L P R, Dδ ą 0, x0 ´ δ ă x ă x0 ùñ f pxq ą L prespectivamente f pxq ă Lq. Al hecho anterior lo denotamos por lím´ f pxq “ `8 ó lím f pxq “ `8 (respectivamente xÒx0 xÑx0 lím f pxq “ ´8 ó lím f pxq “ ´8). xÒx0 xÑx´ 0 10.3.5. Ejemplo. Demostrar que lím x1 “ ´8 y que lím x1 “ `8. xÓ0 xÒ0 Solución. Sea L P R. Para que x1 ą L es suficiente con que x1 ą |L| ` 1, lo cual es 1 1 equivalente a que 0 ă x ă |L|`1 , es decir 0 ă x ă 0 ` |L|`1 ùñ x1 ą L, de modo que si en 1 tenemos que lím x1 “ `8. Por otra parte, para que x1 ă L la definición tomamos δ “ |L|`1 xÓ0 1 es suficiente con que x1 ă ´|L| ´ 1, lo cual es equivalente a que ´|L|´1 ă x ă 0, es decir 1 1 1 0 ´ |L|`1 ă x ă 0 ùñ x ă L, de modo que si en la definición tomamos nuevamente δ “ |L|`1 tenemos que lím x1 “ ´8. xÒ0 10.3.6. Definición. Sea f una función. Si se tiene una o varias de las siguientes igualdades 10.3. Asíntotas verticales lím f pxq “ `8, xÑx` 0 219 lím f pxq “ ´8, xÑx` 0 lím f pxq “ `8 ó xÑx´ 0 lím f pxq “ ´8; xÑx´ 0 entonces decimos que la recta x “ x0 es una asíntota vertical de f o de la gráfica de f . Para trazar correctamente la gráfica de una función, además de lo establecido anteriormente es conveniente determinar las asíntotas verticales. 10.3.7. Ejemplo. La gráfica de la función secante, que se muestra en la figura siguiente, tiene como asíntotas verticales a todas las rectas cuya ecuación es de la forma y “ nπ ` 12 π, donde n es algún entero. (La definición precisa de tal función se verá cuando se estudien las funciones trigonométricas). Y 6 5 4 y=secHxL 3 2 1 Π 3 Π -Π - -2 Π- 2 -1 2 -2 La siguiente definición generaliza el concepto de asíntota. Π 2 3Π 2 Π 2 Π X -3 10.3.8. Definición. Sea f una función cuyo dominio incluye a -4 un intervalo de la forma ra; `8q o a uno de la forma p´8; bs. -5 -6 Si l es una recta no vertical formada por el conjunto de puntos px, yq tales que y “ gpxq para alguna función g : R ÝÑ R y además se tiene que lím pf pxq ´ xÑ`8 gpxqq “ 0 o bien lím pf pxq ´ gpxqq “ 0, entonces decimos que l es una asíntota no vertical xÑ´8 de la función f . En general una asíntota de una función f es una asíntota vertical o una asíntota no vertical de la función. Veamos un ejemplo de una función que tiene una asíntota no vertical. 3 x 10.3.9. Ejemplo. Sea f pxq “ 1´x 2 . Afirmamos que la recta que pasa por el origen y tiene pendiente ´1 es una asíntota de f . En efecto, tenemos que f pxq ´ p´xq “ x 2 xÑ`8 1´x 2 ľ ε ` ε ` 1, y veamos que lím x 2 xÑ´8 1´x “ lím x x3 ´ p´xq “ 2 1´x 1 ´ x2 “ 0. Sea ε ą 0. Si x ľ 2 ε `ε`1 ó x ĺ ´ `2 ε ˘ `ε`1 , entonces |x| por lo tanto ε|x| ´ 1 ą 1, |x|pε|x| ´ 1q ą ε, y así 0 ă |x|pε|x| ˇ x ˇ ´ 1q ´ ε, 2 lo cual equivale a que |x| ă εpx ´ 1q, y esta última desigualdad implica que ˇ 1´x2 ˇ ă ε. Por x lo tanto lím 1´x lím x 2 “ 0 y la recta con ecuación y “ ´x es una asíntota de la 2 “ xÑ`8 xÑ´8 1´x función f . Veamos que la recta con ecuación y “ ´1 es una asíntota vertical de f , más precisamente, x3 x3 x3 veamos que lím ´ 1´x lím ` 1´x lím ´ 1´x 2 “ `8 y que 2 “ ´8. Para verificar que 2 “ `8, xÑ´1 xÑ´1 xÑ´1 3 x veamos que para cada L P R existe un δ ą 0 tal que si ´1 ´ δ ă x ă ´1, entonces 1´x 2 ą L. x3 x3 3 2 Tenemos que 1´x2 ą L ðù 1´x2 ą |L| ` 1 ðù x ă p|L| ` 1qp1 ´ x q y x ă ´1 ðù ´1 ´1 ´1 ă p|L| ` 1qp1 ´ x2 q y x ă ´1 ðù |L|`1 ă 1 ´ x2 y x ă ´1 ðù |L|`1 ´ 1 ă ´x2 y b 1 1 x ă ´1 ðù |L|`1 ` 1 ą x2 y x ă ´1 ðù ´ |L|`1 ` 1 ă x ă ´1, por lo tanto, tomando b 1 x3 δ “ ` 1 ´ 1 tenemos que si ´1 ´ δ ă x ă ´1, entonces 1´x 2 ą L. Así hemos |L|`1 3 x demostrado que lím ´ 1´x 2 “ `8. xÑ´1 3 x Veamos ahora que lím ` 1´x 2 “ ´8. Para tal efecto tomemos cualquier número real L xÑ´1 y encontremos un δ ą 0 tal que ´1 ă x ă ´1 ` δ ùñ x3 1´x2 ă L. Tenemos que x3 1´x2 ăL 220 ðù 10.3. Asíntotas verticales x3 1´x2 ă ´|L| ´ 1 ðù x3 ă ´p|L| ` 1qp1 ´ x2 q y ´1 ă x ă 0 ðù ´ 1 |L|`1 ¯3 ´1 ă 3 1 |L|`1 1 p´1` |L|`1 q 1 p|L| ` 1qpx ´ 1q y ´1 ă x ă ´1 ` ðù 1 ` ă x2 y ´1 ă x ă ´1 ` |L|`1 |L|`1 c c 3 3 1 1 p´1` |L|`1 p´1` |L|`1 q q 1 ðù 1 ` ă |x| y ´1 ă x ă ´1 ` |L|`1 ðù x ă ´ 1 ` y ´1 ă |L|`1 |L|`1 # c + 3 1 p´1` |L|`1 q 1 1 x ă ´1 ` |L|`1 ðù ´1 ă x ă mín ´ 1 ` , ´1 ` |L|`1 . Ahora si tomamos |L|`1 # c + 3 1 ´1` p |L|`1 q 1 x3 δ “ 1 ` mín ´ 1 ` , ´1 ` |L|`1 , tenemos que ´1 ă x ă ´1 ` δ ùñ 1´x 2 ă L. |L|`1 2 Y 5 Usando el hecho de que la función f es impar (simétrica con respecto al origen) podemos ver que la recta con ecuación y “ 1 es también una asíntota vertix3 cal, y más precisamente, lím` 1´x 2 “ ´8 x3 y= 1 - x2 4 3 2 xÑ1 3 1 x y lím´ 1´x 2 “ `8. para hacer un buen xÑ1 trazo de la gráfica de f podemos tomar en cuenta otros aspectos, como el hecho de que el punto p0, 0q es el único donde se intersecan la gráfica de f y la recta con ecuación y “ ´x, así como considerar que Dom pf q “ Rzt´1, 1u y R pf q “ R. -5 -4 -3 -2 -1 1 -1 -2 -3 -4 -5 2 3 4 5 X 10.4. Límites finitos 10.4. 221 Límites finitos 10.4.1. Definición. Sea f una función cuyo dominio incluye a un conjunto pa; bqztx0 u con x0 P pa; bq. Decimos que el límite cuando x ÝÑ x0 de f pxq es igual a un número y0 P R si @ε ą 0, Dδ ą 0, 0 ă |x ´ x0 | ă δ ùñ |f pxq ´ y0 | ă ε. Al hecho anterior se le denota mediante la igualdad lím f pxq “ y0 xÑx0 y significa que si queremos que f pxq esté suficientemente cercano a y0 (de tal manera que la distancia entre f pxq e y0 sea menor que ε) basta con tomar x suficientemente cercano a x0 , con x ‰ x0 (de tal manera que la distancia entre x y x0 sea menor que algún δ adecuado). 10.4.2. Ejemplo. Verificar que lím1 x2 “ 14 . xÑ 2 Solución. Dado un número positivo ε, queremos encontrar un δ ą 0 tal que ˇ ˇ ˇ ˇ ˇ ˇ 2 1ˇ 1 ˇˇ ˇ ˇx ´ ˇ ă ε si 0 ă ˇx ´ ˇ ă δ. ˇ 4ˇ 2 Ahora, |x2 ´ 41 | ă ε ðñ |x` 12 ||x´ 12 | ă ε. Pero si 0 ă x ă 34 , entonces 3 4 1 2 1 , 4 que la distancia entre y es y |x ` 21 | ă ùñ 0 ă |x ´ 12 | ă 4ε 5 4ε 5 ă ε . |x` 12 | Observando tomamos δ “ mínt 14 , 4ε u para obtener que 0 ă 5 5 1 1 ùñ |x ´ 2 ||x ` 2 | ă ε, es decir |x2 ´ 14 | ă ε. 4 |x ´ 21 | ă δ 10.4.3. Definición. Sea f una función cuyo dominio incluye a un intervalo px0 ; bq y y0 P R. Decimos que el límite cuando x tiende a x0 por la derecha de f pxq es y0 si @ε ą 0, Dδ ą 0, x0 ă x ă x0 ` δ ùñ |f pxq ´ y0 | ă ε. La definición anterior indica que si queremos que f pxq esté suficientemente cerca de y0 basta con que tomemos x ą x0 pero suficientemente cercano a x0 . Análogamente tenemos la siguiente definición. 10.4.4. Definición. Sea f una función cuyo dominio incluye a un intervalo pa; x0 q y y0 P R. Decimos que el límite cuando x tiende a x0 por la izquierda de f pxq es y0 si @ε ą 0, Dδ ą 0, x0 ´ δ ă x ă x0 ùñ |f pxq ´ y0 | ă ε. Al hecho de que y0 sea el límite cuando x ÝÑ x0 por la derecha de f pxq lo denotamos así y0 “ lím` f pxq xÑx0 ó y0 “ lím f pxq. xÓx0 Similarmente al hecho de que y0 sea el límite cuando x ÝÑ x0 por la izquierda de f pxq lo denotamos así y0 “ lím´ f pxq ó y0 “ lím f pxq. xÑx0 xÒx0 222 10.4. Límites finitos El lector podrá demostrar el siguiente teorema. 10.4.5. Teorema. Sea f una función e y0 P R. lím f pxq “ y0 xÑx0 ðñ lím f pxq “ y0 “ lím´ f pxq. xÑx` 0 xÑx0 10.4.6. Teorema. Si f es una función y L1 , L2 son dos números tales que lím f pxq “ L1 xÑx0 y lím f pxq “ L2 , xÑx0 entonces L1 “ L2 . Es decir, si el límite existe, entonces éste es único. Demostración. Para ε ą 0 sean δ1 , δ2 ą 0 tales que 0 ă |x ´ x0 | ă δ1 ùñ |f pxq ´ L1 | ă ε{2 0 ă |x ´ x0 | ă δ2 ùñ |f pxq ´ L2 | ă ε{2. y Ahora, si 0 ă |x ´ x0 | ă míntδ1 , δ2 u, entonces |L1 ´ L2 | “ |pL1 ´ f pxqq ` pf pxq ´ L2 q| ĺ |f pxq ´ L1 | ` |f pxq ´ L2 | ă ε, pero como ε puede ser cualquier número real positivo, entonces L1 “ L2 (si L1 ‰ L2 , tomando ε ĺ |L1 ´ L2 | llegamos a una contradicción). ‚ 10.4.7. Teorema del sándwich. a) Si @x P px0 ; bq, f pxq ĺ gpxq ĺ hpxq y lím` f pxq “ lím` hpxq “ L, entonces xÑx0 xÑx0 lím gpxq “ L. xÑx` 0 b) Si @x P pa; x0 q, f pxq ĺ gpxq ĺ hpxq y lím´ f pxq “ lím´ hpxq “ L, entonces xÑx0 xÑx0 lím gpxq “ L. xÑx´ 0 c) Si @x P pa; x0 q Y px0 ; bq, f pxq ĺ gpxq ĺ hpxq y lím f pxq “ lím hpxq “ L, entonces xÑx0 xÑx0 lím gpxq “ L. xÑx0 Demostración. Demostraremos solamente el inciso a) (el inciso b) se demuestra de manera análoga y el c) es consecuencia del a), del b) y del teorema 10.4.5). Dado ε ą 0 sea δ ą 0 tal que x0 ă x ă x0 ` δ ùñ |f pxq ´ L| ă ε y |hpxq ´ L| ă ε. El teorema se sigue del hecho de que |f pxq ´ L| ă ε y |hpxq ´ L| ă ε ùñ L ´ ε ă f pxq ĺ gpxq ĺ hpxq ă L ` ε ùñ |gpxq ´ L| ă ε. ‚ 10.4. Límites finitos 223 10.4.8. Teorema. a) lím` f pxq “ L ðñ lím f `1˘ b) lím´ f pxq “ L ðñ lím f `1˘ t tÑ`8 xÑ0 tÑ´8 xÑ0 t “ L, “ L. Demostración. Demostraremos solamente que lím` f pxq “ L ùñ lím f tÑ`8 xÑ0 `1˘ t “ L para el caso en que L P R. Las demás implicaciones se pueden hacer siguiendo procedimientos parecidos. lím f pxq “ L ðñ p@ε ą 0, Dδ ą 0, ˆ ðñ @ε ą 0, Dδ ą 0, ` ùñ @ε ą 0, DM ą 0, ` ˘ ðñ lím f 1t “ L. xÑ0` 0 ă x ă δ ùñ |f pxq ´ L| ă εq 1 1 ą ą 0 ùñ |f pxq ´ L| ă ε x δ ˇ ` ˘ ˇ ˘ t ą M ùñ ˇf 1t ´ Lˇ ă ε ˙ tÑ`8 (Donde se pudo tomar, por ejemplo M “ 1{δ y t “ 1{x). ‚ Ejercicios. 1. Calcular los límites siguientes: 3px ´ 2q , xÑ2 x ´ 2 a) lím b) lím ´ x3 , xÑ`8 c) lím ´ x3 , xÑ´8 d) lím` xÑ2 3 , x´2 e) lím xÑ`8 3 . x´2 2. Hallar las asíntotas horizontales y verticales de las funciones siguientes: a) px P Rzt2, ´5uq ÞÑ 2px ` 2qpx ´ 2qpx ` 5q ` 6, px ´ 2qpx ` 5q b) px P Rzt2, ´5uq ÞÑ 2px ` 2qpx ´ 2qpx ` 5q3 ` 6, px ´ 2qpx ` 5q c) px P Rzt2, ´5uq ÞÑ 2px ` 2qpx ´ 2qpx ` 5q3 ` 6. px ´ 2q2 px ` 5q7 3. Demostrar que si f es una función racional de la forma f pxq “ bn ‰ 0, entonces f tiene una asíntota con pendiente an`1 . bn an`1 xn`1 `¨¨¨`a1 x`a0 , bn xn `¨¨¨`b1 x`b0 con 224 10.5. 10.5. Continuidad Continuidad 10.5.1. Definición. Sea f una función cuyo dominio incluye a un intervalo abierto pa; bq y x0 P pa; bq. La función f es continua en x0 si lím f pxq “ f px0 q. xÑx0 Es decir, la función f es continua en x0 , si al acercar x a x0 suficientemente, el valor de f pxq estará cerca de f px0 q (tan cerca o más de lo que queramos). Establezcamos algo de terminología de álgebra de funciones. Si f y g son dos funciones, definimos la función f ` g como la función cuyo dominio es Dom pf q X Dom pgq y es tal que pf ` gqpxq “ f pxq ` gpxq. Si f y g son dos funciones, definimos la función f ¨ g como la función cuyo dominio es Dom pf q X Dom pgq y es tal que pf ¨ gqpxq “ f pxq ¨ gpxq. Si f y g son dos funciones, definimos la función f ´ g como la función cuyo dominio es Dom pf q X Dom pgq y es tal que pf ´ gqpxq “ f pxq ´ gpxq. Si f y g son dos funciones, definimos la función f {g como la función cuyo dominio es Dom pf q X Dom pgq X tx : gpxq ‰ 0u y es tal que pf {gqpxq “ f pxq{gpxq. Es decir, el dominio es el conjunto de valores de x donde se puedan evaluar las funciones f y g tales que gpxq ‰ 0. A continuación daremos una lista de teoremas básicos cuyas demostraciones se darán después de enlistarlos. Las demostraciones de los corolarios correspondientes se dejarán al lector. 10.5.2. Teorema. Si c es un número y f : R ÝÑ R, es decir f pxq “ c para todo número real xÞÑc R; entonces f es continua en cualquier número real. 10.5.3. Definición. Una función como la dada en el teorema anterior se llama función constante. 10.5.4. Teorema. Sea f : R ÝÑ R, es decir f pxq “ x; entonces f es continua en cualquier xÞÑx número real. 10.5.5. Definición. Una función como la dada en el teorema anterior se llama función identidad. 10.5.6. Teorema. Sean f y g funciones tales que lím f pxq “ L1 xÑx0 y lím gpxq “ L2 , xÑx0 donde L1 , L2 P R; entonces lím pf pxq ` gpxqq “ L1 ` L2 . xÑx0 10.5.7. Corolario. Si f1 , f2 , . . . , fn son funciones tales que xÑx lím fj pxq “ Lj , entonces 0 lím xÑx0 n ÿ j“1 fj pxq “ n ÿ j“1 Lj . 10.5. Continuidad 225 10.5.8. Corolario. Si f1 , f2 , . . . , fn son funciones continuas en x0 , entonces f1 ` f2 ` ¨ ¨ ¨ ` fn es continua en x0 . 10.5.9. Teorema. Sean f y g funciones tales que lím f pxq “ L1 xÑx0 lím gpxq “ L2 , y xÑx0 donde L1 , L2 P R; entonces lím pf pxq ¨ gpxqq “ L1 ¨ L2 . xÑx0 10.5.10. Corolario. Si f1 , f2 , . . . , fn son funciones tales que lím fj pxq “ Lj , entonces xÑx0 lím xÑx0 n ź fj pxq “ j“1 n ź Lj . j“1 10.5.11. Corolario. Si f1 , f2 , . . . , fn son funciones continuas en x0 , entonces f1 ¨ f2 ¨ ¨ ¨ ¨ ¨ fn es continua en x0 . 10.5.12. Teorema. Las funciones polinomiales son continuas en cualquier número. 10.5.13. Teorema. Sean f y g funciones tales que lím f pxq “ L1 xÑx0 lím gpxq “ L2 , y xÑx0 donde L1 , L2 P R y L2 ‰ 0; entonces ˆ lím xÑx0 f pxq gpxq ˙ “ L1 . L2 10.5.14. Corolario. Si f y g son funciones continuas en x0 y gpx0 q ‰ 0, entonces f {g es continua en x0 . 10.5.15. Corolario. Las funciones racionales son continuas en cualquier elemento de su dominio. Demostración del teorema 10.5.2. Sea ε ą 0, δ cualquier número positivo y x0 P R. Se tiene siempre la siguiente implicación 0 ă |x ´ x0 | ă δ ùñ |f pxq ´ f px0 q| “ |c ´ c| “ 0 ă ε. ‚ Demostración del teorema 10.5.4. Sea ε ą 0, δ “ ε y x0 P R. Con estas condiciones tenemos 0 ă |x ´ x0 | ă δ ùñ |f pxq ´ f px0 q| “ |x ´ x0 | ă δ “ ε. ‚ Demostración del teorema 10.5.6. Sea ε ą 0 y δ1 , δ2 ą 0 tales que 0 ă |x ´ x0 | ă δ1 ùñ |f pxq ´ L1 | ă ε{2 y 0 ă |x ´ x0 | ă δ2 ùñ |gpxq ´ L2 | ă ε{2. 226 10.5. Continuidad Tomando δ “ míntδ1 , δ2 u tenemos que 0 ă |x ´ x0 | ă δ ùñ |pf pxq ` gpxqq ´ pL1 ` L2 q| “ |pf pxq ´ L1 q ` pgpxq ´ L2 q| ĺ |f pxq ´ L1 | ` |gpxq ´ L2 | ă ε{2 ` ε{2 “ ε. ‚ Demostración del teorema 10.5.9. Sea ε ą 0 y δ1 , δ2 ą 0 tales que míntε, 12 u 0 ă |x ´ x0 | ă δ1 ùñ |f pxq ´ L1 | ă 1 ` |L1 | ` |L2 | y míntε, 12 u . 0 ă |x ´ x0 | ă δ2 ùñ |gpxq ´ L2 | ă 1 ` |L1 | ` |L2 | Tomando δ “ míntδ1 , δ2 u tenemos que 0 ă |x ´ x0 | ă δ ùñ |f pxqgpxq ´ L1 L2 | “ |pf pxqgpxq ´ f pxqL2 q ` pf pxqL2 ´ L1 L2 q| ĺ |f pxqgpxq ´ f pxqL2 | ` |f pxqL2 ´ L1 L2 | ĺ |f pxq||gpxq ´ L2 | ` |L2 ||f pxq ´ L1 |. míntε, 1 u Ahora, como |f pxq| ´ |L1 | ĺ |f pxq ´ L1 | ă 1`|L1 |`|L2 2 | ĺ míntε, 21 u, tenemos que |f pxq| ă míntε, 12 u ` |L1 |, por lo tanto 0 ă |x ´ x0 | ă δ ùñ |f pxqgpxq ´ L1 L2 | ă pmíntε, 21 u ` míntε, 1 u p1`|L1 |`|L2 |qmíntε, 21 u míntε, 1 u |L1 |q 1`|L1 |`|L2 2 | ` |L2 | 1`|L1 |`|L2 2 | ă ĺ ε. ‚ 1`|L1 |`|L2 | Demostración del teorema 10.5.12. El teorema 10.5.12 es una consecuencia de los teoremas 10.5.2 y 10.5.4 y de los corolarios 10.5.8 y 10.5.11. ‚ Demostración del teorema 10.5.13. Para demostrar el teorema 10.5.13 demostraremos 1 “ L12 y el teorema se seguirá como consecuencia del teorema 10.5.9. primero que xÑx lím gpxq 0 Sean ε ą 0 y δ ą 0 tales que * " 2 εL2 |L2 | , . 0 ă |x ´ x0 | ă δ ùñ |gpxq ´ L2 | ă mín 2 2 Supongamos que 0 ă |x ´ x0 | ă δ. Tenemos las siguientes igualdades ˇ ˇ ˇ ˇ ˇ 1 1 ˇˇ ˇˇ L2 gpxq ˇˇ |gpxq ´ L2 | ˇ ˇ gpxq ´ L2 ˇ “ ˇ gpxqL2 ´ gpxqL2 ˇ “ |gpxqL2 | , por otra parte |L2 | ´ |gpxq| ĺ |L2 ´ gpxq| ă |L22 | , por lo que |gpxq| ą ˇ ˇ ˇ 1 1 ˇˇ |gpxq ´ L2 | εL22 {2 ˇ ´ ĺ ă “ ε, ˇ gpxq L2 ˇ |L2 | L22 {2 |L2 | 2 por lo tanto xÑx lím 1 0 gpxq “ 1 . L2 |L2 | , 2 por lo tanto ‚ 10.5.16. Teorema. Sea a un número positivo. La función expa es continua en cualquier número real. 10.5. Continuidad 227 Demostración. Sea x0 P R y ε ą 0. Hagamos primero la demostración para el caso en que a ą 1. Tomemos δ “ míntx0 ´ loga pax0 ´ εq, loga pax0 ` εq ´ x0 u para obtener las siguientes implicaciones 0 ă |x ´ x0 | ă δ ùñ x0 ´ δ ă x ă x0 ` δ ùñ ax0 ´δ ă ax ă ax0 `δ ùñ expa px0 ´ px0 ´ loga pax0 ´ εqqq ă ax ă expa px0 ` loga pax0 ` εq ´ x0 q ùñ ax0 ´ ε ă ax ă ax0 ` ε ùñ |ax ´ ax0 | ă ε, por lo que el teorema está demostrado para el caso en que a ą 1. Y 7 6 5 y= ax 4 3 a>1 2 1 -4 -2 4 2 X Para el caso en que a “ 1, el teorema se sigue del teorema 10.5.2. Para el caso en que 0 ă a ă 1, aplicamos el teorema 10.5.13 y la primera parte de la demostración para obtener lím ax “ xÑx lím xÑx 0 0 1 1 ax “ xÑx lím 1 1 0 p qx a “ 1 p a1 qx0 “ ax 0 . ‚ 10.5.17. Teorema. Si xÑx lím f pxq “ y0 y yÑy lím gpyq “ gpy0 q, entonces xÑx lím gpf pxqq “ gpy0 q. 0 0 0 Demostración. Supongamos que lím f pxq “ y0 y lím gpyq “ gpy0 q. Para un ε ą 0 dado sea xÑx0 yÑy0 η ą 0 tal que |y ´ y0 | ă η ùñ |gpyq ´ gpy0 q| ă ε. Ahora, sea δ ą 0 tal que 0 ă |x ´ x0 | ă δ ùñ |f pxq ´ y0 | ă η. Por la construcción anterior tenemos que 0 ă |x ´ x0 | ă δ ùñ |f pxq ´ y0 | ă η ùñ |gpf pxqq ´ gpy0 q| ă ε, es decir xÑx lím gpf pxqq “ gpy0 q. ‚ 0 10.5.18. Corolario. Si f es continua en x0 y g es continua en f px0 q, entonces g ˝ f es continua en x0 . Demostración. Como f es continua en x0 , entonces lím f pxq “ f px0 q y como g es continua xÑx0 en f px0 q, entonces lím gpxq “ gpf px0 qq “ g ˝ f px0 q; luego, por el teorema 10.5.17 tenemos yÑf px0 q que xÑx lím g ˝ f pxq “ xÑx lím gpf pxqq “ g ˝ f px0 qq, es decir g ˝ f es continua en x0 . 0 0 ‚ 228 10.5. Continuidad Del teorema 10.5.17 y del hecho de que x0 ` t ÝÑ x0 cuando t ÝÑ 0 se deduce el siguiente corolario. 10.5.19. Corolario. Si xÑx lím f pxq “ L, entonces límf px0 ` tq “ L. 0 tÑ0 10.5.20. Definición. Decimos que una función f es continua por la derecha (respectivamente por la izquierda) en un número x0 si lím` f pxq “ f px0 q (respectivamente xÑx0 lím f pxq “ f px0 q). Además decimos que f es continua en un intervalo cerrado ra; bs si xÑx´ 0 es continua en cualquier elemento de pa; bq, es continua por la derecha en a y es continua por la izquierda en b. 10.5.21. Teorema del valor intermedio. Sea f una función continua en un intervalo cerrado ra; bs tal que f paq ‰ f pbq y sea d un número entre f paq y f pbq. Existe un número c entre a y b tal que f pcq “ d. Y d Demostración. Haremos la demostración para el caso en que f paq ă f pbq (el valor de c cuando y=fHxL f paq ą f pbq es el que corresponde en la función ´f al número ´d). Sea C “ tx P pa; bs : f ptq ă d para todo t P pa; xqu y c “ sup C (nuestro candidato). Veamos primero que C ‰ ∅. Si C fuera X a c b el conjunto vacío, entonces para todo x P pa; bs tendríamos que existiría un t entre a y x tal que f ptq ľ d, de modo que si tomamos ε “ d ´ f paq tenemos f ptq ´ f paq ľ ε, de modo que f no sería continua por la derecha en a. Si f pcq ą d, entonces para a ă h ă c existe un x P C entre h y c, de modo que f phq ă d; así, tomando ahora ε “ f pcq ´ d tendríamos f pcq ´ f phq ą ε, de tal manera que f no sería continua por la izquierda en c, por lo tanto es imposible que f pcq ą d. Si f pcq ă d, entonces por un razonamiento análogo al anterior se observa que el conjunto tx P pc; bs : f ptq ă d para todo t P pc; xqu es no vacío, pero esto contradice al hecho de que c “ sup C, de manera que también es imposible que f pcq ă d de modo que f pcq “ d. ‚ Y 10.5.22. Teorema del valor máximo. Sea f una función continua en un intervalo cerrado ra; bs. Existe un c P ra; bs tal que f pcq ľ f pxq para todo x P ra; bs. Demostración. Para cada número natural n, sea an,0 “ a y an,j “ a ` pb ´ aqj{n, para j P t1, 2, . . . , nu. Sea An “ tan,j Ť : j es un entero y 0 ĺ j ĺ nu y xn P Ťnk“1 Ak tal que f pxn q ľ f pxq para todo x P nk“1 Ak . Como la sucesión pxn q8 n“1 es acotada, entonces existe una subsucesión pxnk q8 kn“1 que converge a un número c (nuestro candidato). Ahora, la sucesión fHcL y=fHxL a c b X 10.5. Continuidad 229 8 pf pxnk qq8 k“1 es no decreciente. Demostremos que además pf pxnk qqk“1 es acotada. Si la sucesión pf pxnk qq8 k“1 no fuera acotada, entonces tendería a `8 cuando k ÝÑ 8, por lo tanto existiría un número natural N tal que si k ľ N , entonces f pxnk q ą 1 ` |f pcq|, de donde concluimos que |f pxnk q ´ f pcq| ą 1. Pero para cada δ ą 0 y k suficientemente grande tenemos que |xnk ´ c| ă δ, de manera que f no sería continua en c, lo cual contradice nuestra hipótesis. Por lo tanto la sucesión pf pxnk qq8 k“1 es acotada. 8 Como la sucesión pf pxnk qqk“1 es no decreciente y acotada, entonces converge a un número d. Demostraremos ahora que d “ máxtf pxq : x P ra; bsu y que f pcq “ d. Por ser f continua en ra; bs tenemos que para todo ε ą 0 existe un δ ą 0 tal que x P ra; bs y |x ´ c| ă δ ùñ |f pxq ´ f pcq| ă ε, ahora sea N un número natural tal que k ľ N ùñ |xnk ´ c| ă δ y |f pxnk q ´ d| ă ε, pero |xnk ´ c| ă δ ùñ |f pxnk q ´ f pcq| ă ε, por lo tanto, para k ľ N , tenemos |d ´ f pcq| “ |pf pxnk q ´ dq ´ pf pxnk q ´ f pcqq| ĺ |f pxnk q ´ d| ` |f pxnk q ´ f pcq| ă 2ε, pero como ε es arbitrario, entonces d “ f pcq. Demostremos ahora que d “ máxtf pxq : x P ra; bsu. Si d fuera diferente de máxtf pxq : x P ra; bsu entonces existiría un d1 ą d y un c1 ‰ c (con c1 P ra; bs) tales que f pc1 q “ d1 , pero por ser f continua en ra; bs tenemos que existe un δ ą 0 tal que x P ra; bs y |x ´ c1 | ă δ ùñ |f pxq ´ d1 | ă d1 ´ d. Ahora, sea k un entero positivo tal que pb ´ aq{k ă δ y observemos que si x es el elemento de Ak más próximo a c1 entonces |x ´ c1 | ă δ y además d ľ f pxq, por lo cual |f pxq ´ d1 | “ pd1 ´ dq ` pd ´ f pxqq contradiciendo el hecho de que x P ra; bs y |x ´ c1 | ă δ ùñ |f pxq ´ d1 | ă d1 ´ d, por lo tanto d “ máxtf pxq : x P ra; bsu. ‚ 10.5.23. Corolario (teorema del valor mínimo). Sea f una función continua en un intervalo cerrado ra; bs. Existe un c P ra; bs tal que f pcq ĺ f pxq para todo x P ra; bs. Demostración. Como f es continua en ra; bs entonces también lo es ´f , por lo que debido al teorema 10.5.22 existe un c P ra; bs tal que ´f pcq ľ ´f pxq para todo x P ra; bs, lo cual es equivalente a que f pcq ĺ f pxq para todo x P ra; bs. ‚ 10.5.24. Corolario. Si f : ra; bs ÝÑ R es continua y no es constante, entonces el recorrido de f es un intervalo cerrado rc; ds, donde c ă d. Demostración. El corolario se sigue del teorema del valor máximo, del teorema del valor mínimo y del teorema del valor intermedio, donde c es el valor mínimo y d el máximo que toma la función f . ‚ 10.5.25. Teorema. Sea f una función continua que además es una biyección de ra; bs en rc; ds. La función f es estrictamente creciente o estrictamente decreciente. Demostración. Veamos primero que f paq “ c ó f paq “ d. Si f paq es diferente de c y de d, entonces f paq “ y con c ă y ă d, pero como f es una biyección de ra; bs en rc; ds, entonces existen x1 , x2 P pa; bs tales que f px1 q “ c y f px2 q “ d. Ahora, por el teorema del valor intermedio existe un x0 entre x1 y x2 tal que f px0 q “ y, por lo que se tiene que x0 ‰ a y f px0 q “ f paq, contradiciendo el hecho de que f es una biyección de ra; bs en rc; ds, por lo tanto f paq “ c ó f paq “ d. Veamos ahora que si f paq “ c, entonces f es estrictamente creciente en ra; bs. De no ser así existirían dos números x1 y x2 con a ĺ x1 ă x2 ĺ b tales que f px1 q ľ f px2 q; pero si f px1 q “ f px2 q, la función no sería inyectiva y si f px1 q ą f px2 q, entonces, como f px1 q ą f px2 q ą c y a ă x1 , tenemos que debido al teorema del valor intermedio existiría un x0 entre a y x1 tal que f px0 q “ f px2 q y de nuevo la función no sería inyectiva. Por lo tanto, 230 10.5. Continuidad si f paq “ c, entonces f es estrictamente creciente y análogamente se puede demostrar que si f paq “ d, entonces f es estrictamente decreciente. ‚ 10.5.26. Teorema. Si f es una función continua y además es una biyección de ra; bs en rc; ds, entonces f ´1 es continua en cualquier y0 P pc; dq. Demostración. Por el teorema 10.5.25, f es estrictamente creciente o estrictamente decreciente. Supongamos sin pérdida de generalidad que f es estrictamente creciente y sea y0 P pc; dq y x0 “ f ´1 py0 q. Para todo ε ą 0 sea ε1 “ míntε, b ´ x0 u y ε2 “ míntε, x0 ´ au y además tomemos δ “ míntd ´ y0 , y0 ´ c, f px0 ` ε1 q ´ y0 , y0 ´ f px0 ´ ε2 qu. Si ´δ ă y ´ y0 ă δ, entonces y0 ´ δ ă y ă y0 ` δ, por lo que x0 ´ ε ĺ x0 ´ ε1 ĺ f ´1 py0 ´ δq ă f ´1 pyq ă f ´1 py0 ` δq ĺ x0 ` ε1 ĺ x0 ` ε, por lo tanto |f ´1 pyq ´ f ´1 py0 q| ă ε. ‚ Del teorema 10.5.26, restringiendo las funciones potencias y exponenciales a un intervalo adecuado, podemos concluir que los logaritmos y los radicales son funciones continuas en cualquier número positivo. 10.5.27. Corolario. Los logaritmos y los radicales son funciones continuas en cualquier número positivo. La siguiente definición es una generalización del concepto de continuidad en un intervalo cerrado. 10.5.28. Definición. Sean B Ă A Ă R y f : A ÝÑ R. Decimos que f es continua en B si para todo ε ą 0 y todo b P B existe un δ ą 0 tal que para todo x P B |x ´ b| ă δ ùñ |f pxq ´ f pbq| ă ε. Una condición más fuerte que la de continuidad en un conjunto es la de continuidad uniforme que a continuación se define. 10.5.29. Definición. Sean B Ă A Ă R y f : A ÝÑ R. Decimos que f es uniformemente continua en B si para todo ε ą 0 existe un δ ą 0 tal que para todo b P B y todo x P B se tiene que |x ´ b| ă δ ùñ |f pxq ´ f pbq| ă ε. Observemos que la diferencia entre la definición de continuidad y la definición de continuidad uniforme está en el hecho de que en la definición de continuidad uniforme el valor de δ posiblemente depende del valor de ε, pero no depende del valor de b, mientras que en la definición de continuidad uniforme el valor de δ puede depender tanto de ε como de b. Ejercicios. 1. Decir si son continuas en 2 las siguientes funciones dadas: 3px ´ 2q ; x´2 3px ´ 2q3 b) f : Rzt2u ÝÑ R, donde f pxq “ ; x´2 a) f : Rzt2u ÝÑ R, donde f pxq “ 10.5. Continuidad c) f : R ÝÑ R, donde d) f : R ÝÑ R, donde e) f : R ÝÑ R, donde f) f : R ÝÑ R, donde 231 $ & 3px ´ 2q , x´2 f pxq “ % 1, $ & 3px ´ 2q , x´2 f pxq “ % 3, $ 3 & 3px ´ 2q , x´2 f pxq “ % 3, $ 3 & 3px ´ 2q , x´2 f pxq “ % 0, si x ‰ 2 ; si x “ 2 si x ‰ 2 ; si x “ 2 si x ‰ 2 ; si x “ 2 si x ‰ 2 . si x “ 2 2. De las funciones que hayan resultado ser discontinuas en 2, en el ejercicio 1, decir cual es el tipo de discontinuidad. 3. Demostrar que los radicales son funciones continuas por la derecha en 0. 4. Dar un ejemplo de una función f : A ÝÑ B que sea continua en A pero no uniformemente continua en A. 232 10.6. Sucesiones y límites de funciones de variable real 10.6. Sucesiones y límites de funciones de variable real En esta sección daremos algunas relaciones que existen entre los límites de funciones de variables reales y ciertos límites de sucesiones. 10.6.1. Teorema. Sea f una función cuyo dominio incluye un intervalo de la forma p´8; aq. Tenemos que L “ lím f pxq si y sólo si para toda sucesión pak q8 k“1 , de términos en p´8; aq, xÑ´8 tal que ak ÝÑ ´8 cuando k ÝÑ 8 se tiene que f pak q ÝÑ L cuando k ÝÑ 8. (Donde L puede ser un número real, `8 ó ´8). Demostración. Haremos la demostración solamente para el caso en que L es un número real, los casos en que L “ `8 y L “ ´8 se pueden hacer de manera similar. Demostremos primero que L “ lím f pxq ùñ L “ lím f pak q para toda sucesión pak q8 k“1 , de términos en xÑ´8 kÑ8 p´8; aq, tal que ak ÝÑ ´8 cuando k ÝÑ 8. Supongamos que L “ lím f pxq, es decir xÑ´8 que para todo ε ą 0, existe un número M tal que si x ĺ M , entonces |f pxq ´ L| ă ε. Sea pak q8 k“1 una sucesión tal que ak ÝÑ ´8 cuando k ÝÑ 8 y N un número natural tal que si k ľ N , entonces ak ă M . Con estas condiciones tenemos que |f pak q ´ L| ă ε, por lo cual L “ lím f pak q. kÑ8 Demostremos ahora que L “ lím f pak q ùñ L “ kÑ8 lím f pxq. Supongamos que L ‰ xÑ´8 lím f pxq, es decir que existe un ε ą 0, tal que para todo número M ă a se tiene que xÑ´8 existe un x ĺ M con |f pxq ´ L| ľ ε. Para cada número natural k sea ak ĺ ´k tal que |f pak q´L| ľ ε. Es claro que la sucesión pf pak qq8 k“1 no converge a L a pesar de que ak ÝÑ ´8 cuando k ÝÑ 8. ‚ Siguiendo métodos similares a los de la demostración anterior el lector podrá demostrar los siguientes 4 teoremas. 10.6.2. Teorema. Sea f una función cuyo dominio incluye un intervalo de la forma pb; `8q. Tenemos que L “ lím f pxq si y sólo si para toda sucesión pak q8 k“1 , de términos en pb; `8q, xÑ`8 tal que ak ÝÑ `8 cuando k ÝÑ 8 se tiene que f pak q ÝÑ L cuando k ÝÑ 8. (Donde L puede ser un número real, `8 ó ´8). 10.6.3. Teorema. Sea f una función cuyo dominio incluye un intervalo de la forma pa; x0 q Y px0 ; bq. Tenemos que L “ xÑx lím f pxq si y sólo si para toda sucesión pak q8 k“1 , de términos en 0 pa; x0 q Y px0 ; bq, tal que ak ÝÑ x0 cuando k ÝÑ 8 se tiene que f pak q ÝÑ L cuando k ÝÑ 8. (Donde L puede ser un número real, `8 ó ´8). 10.6.4. Teorema. Sea f una función cuyo dominio incluye un intervalo de la forma pa; x0 q Y px0 ; bq. Tenemos que L “ lím´ f pxq si y sólo si para toda sucesión pak q8 k“1 , de términos en xÑx0 pa; x0 q, tal que ak ÝÑ x0 cuando k ÝÑ 8 se tiene que f pak q ÝÑ L cuando k ÝÑ 8. (Donde L puede ser un número real, `8 ó ´8). 10.6.5. Teorema. Sea f una función cuyo dominio incluye un intervalo de la forma px0 ; bq. Tenemos que L “ lím` f pxq si y sólo si para toda sucesión pak q8 k“1 , de términos en px0 ; bq, tal xÑx0 que ak ÝÑ x0 cuando k ÝÑ 8 se tiene que f pak q ÝÑ L cuando k ÝÑ 8. (Donde L puede ser un número real, `8 ó ´8). 10.6. Sucesiones y límites de funciones de variable real 233 Ejercicios. 1. Supongamos que pak q8 k“1 es una sucesión de números reales diferentes de 2, pero que converge a 2. Para cada una de las funciones f del ejercicio 1 de la sección 10.5 calcular lím f pak q. kÑ8 234 10.7. 10.7. La Función exponencial natural La Función exponencial natural 10.7.1. Definición. Definimos la función exponencial natural o simplemente función exponencial como la función exp : R ÝÑ R tal que para todo x P R se tiene que exp pxq :“ 1 ` 8 ÿ xk . k! k“1 A la función exponencial también se le llama antilogaritmo o antilogaritmo natural. Veamos que la serie 8 ř k“1 xk k! es absolutamente convergente Y para todo número real x. En efecto; si k ą 8x2 ` 2, entonces k! ľ p4x2 qk{2 “ 2k |x|k , por lo que |xk {k!| ĺ 1{2k para k suficientemente grande, por lo tanto, por el criterio de com8 ř xk es absolutamente paración de series 8.7.11, la serie k! 7 6 5 k“1 convergente, de modo que la función exponencial está bien definida. 8 ř 1 “ exp p1q. El objetivo prinRecordemos que e “ k! 4 y=ex 3 k“0 cipal de esta sección es demostrar que para todo número real x se tiene que ex “ exp pxq, es decir es demostrar que la función exponencial natural es precisamente la función exponencial base e. Más adelante se verán propiedades importantes y aplicaciones de la función exp. Se considera que tal función es la más importante en las matemáticas. 2 1 -1 1 2 X 10.7.2. Teorema. Si x, y ą 0, entonces exp px ` yq “ exp pxq exp pyq. Demostración. Supongamos que x, y ą 0 y observemos que se tienen las siguientes desigualdades N N 2N n ˆ ˙ 2N r 2N ÿ ÿ xk ÿ yr 1 ÿ n k n´k ÿ xk ÿ y ĺ x y ĺ k! r“0 r! n“0 n! k“0 k k! r“0 r! k“0 k“0 donde las expresiones de los extremos tienden a exp pxq exp pyq cuando N ÝÑ 8 y la expresión de en medio tiende a exp px ` yq cuando N ÝÑ 8. ‚ 10.7.3. Teorema. Para todo número real x se tiene que exp p´xq “ pexp pxqq´1 . Demostración. Como exp p0q “ 1, es obvio que el resultado es válido para x “ 0. Supongamos que x ‰ 0 y observemos que debido al teorema 8.7.21 ¸˜ ¸ ¸ ˜ ˜ 8 8 8 n k n´k k k ÿ ÿ ÿ ÿ x p´xq x p´xq exp pxq exp p´xq “ “1` k! k! k! pn ´ kq! n“1 k“0 k“0 k“0 ˜ ¸ ˆ ˙ 8 n 8 ÿ ÿ 1 ÿ n k 1 n´k “1` x p´xq “1` px ´ xqn “ 1. ‚ n! k“0 k n! n“1 n“1 10.7. La Función exponencial natural 235 10.7.4. Teorema. Si x e y son dos números reales, entonces exp px ` yq “ exp pxq exp pyq. Demostración. Si x e y son positivos el resultado es el teorema 10.7.2. Si x e y son 1 ambos negativos se tiene por los teoremas 10.7.2 y 10.7.3 que exp px ` yq “ exp p´x´yq “ 1 “ exp pxq exp pyq. Si alguno de los números x ó y es cero, el resultado es pexp p´xq exp p´yqq obvio debido a que expp0q “ 1. Si un número es positivo y el otro negativo, por ejemplo si x es positivo e y es negativo, tenemos dos posibilidades: x ` y ľ 0 ó x ` y ă 0. En px`yq , el primer caso tenemos que exp pxq “ exp px ` y ´ yq “ exp px ` yq exp p´yq “ exp exp pyq por lo tanto exp px ` yq “ exp pxq exp pyq. En el segundo caso, exp pyq “ exp px ` y ´ xq “ px`yq exp px ` yq exp p´xq “ exp por lo que también se tiene que exp px ` yq “ exp pxq exp pyq. exp pxq ‚ Por inducción matemática y usando el teorema 10.7.4 se puede demostrar fácilmente el siguiente teorema. 10.7.5. Teorema. Si n es un número natural y x es un número real, entonces exp pnxq “ pexp pxqqn . Si en el teorema 10.7.5 tomamos x “ 1 y recordamos que e “ exp p1q obtenemos el corolario siguiente. 10.7.6. Corolario. Si n es un número natural, entonces exp pnq “ en . De nuevo del teorema 10.7.5 deduciremos el siguiente corolario. 10.7.7. Corolario. Si n es un número natural, entonces exp p1{nq “ e1{n . Demostración. Por el teorema 10.7.5, tenemos pe1{n qn “ e “ exp p1q “ exp pn ¨ n1 q “ pexp p1{nqqn , de donde concluimos que e1{n “ exp p1{nq. ‚ 10.7.8. Corolario. Si m es un número entero, entonces exp pmq “ em . Demostración. Si m ą 0 el resultado es el corolario 10.7.6. Si m “ 0 se tiene que exp pmq “ 1 exp p0q “ 1 “ e0 “ em . Si m ă 0, del teorema 10.7.3 obtenemos que exp pmq “ exp p´mq “ 1 m “e . ‚ e´m Tenemos ahora que el corolario 10.7.8 se puede generalizar para el caso en que m es un número racional. 10.7.9. Corolario. Si r es un número racional, entonces exp prq “ er . Demostración. Si r es un número racional, entonces existen un número natural n y un entero m tales que r “ m{n, de modo que por el teorema 10.7.5 y por el corolario 10.7.7 tenemos que si m ą 0, entonces exp prq “ exp pm{nq “ exp pm ¨ n1 q “ pexp p1{nqqm “ pe1{n qm “ em{n “ er . Si m “ 0 tenemos que exp prq “ 1 “ er , y si m ă 0 tenemos que exp prq “ exp pm{nq “ exp pm ¨ n1 q “ exp p´m ¨ p ´1 qq “ pe´1{n q´m “ em{n “ er . ‚ n 10.7.10. Teorema. La función exp es continua. Demostración. Demostremos primero que la función exp es continua en 0. Sea N un 236 10.7. La Función exponencial natural número natural. Tenemos que ˇ ˇ 8 8 ˇˇ k ˇˇ ˇÿ kˇ ÿ h ˇ ˇ ˇh ˇ lím | exp phq ´ exp p0q| “ lím ˇ ˇ ĺ lím hÑ0 hÑ0 ˇ k! ˇ hÑ0 k“1 ˇ k! ˇ k“1 ˜ ˇ ˇ ˇ k ˇ¸ N ˇ kˇ 8 8 ÿ ÿ ÿ ˇh ˇ h 1 ˇ ˇ` ˇ ˇ ĺ “ lím , ˇ ˇ ˇ ˇ hÑ0 k! k! k! k“1 k“N `1 k“N `1 pero 8 ř k“N `1 1 k! ÝÑ 0 cuando N ÝÑ 8, por lo tanto lím | exp phq ´ exp p0q| “ 0, es decir la hÑ0 función exp es continua en 0. Demostremos ahora que la función exp es continua en cualquier número real x. Del corolario 10.5.19 tenemos que lím | exp pyq ´ exp pxq| “ lím | exp px ` hq ´ exp pxq| “ lím | exp pxqpexp phq ´ 1q| yÑx hÑ0 hÑ0 “ | exp pxq||1 ´ 1| “ 0, por lo tanto la función exp es continua en cualquier número real x. ‚ 10.7.11. Teorema. Para todo número real x tenemos que exp pxq “ ex . Es decir exp “ expe . Demostración. Sea x un número real y prn q8 n“1 una sucesión de números racionales que converge a x. Por los teoremas 10.5.16, 10.6.3 y 10.7.10 tenemos que ern ÝÑ ex y exp prn q ÝÑ exp pxq cuando n ÝÑ 8, pero debido al corolario 10.7.9 tenemos que exp prn q “ ern , de donde concluimos que exp pxq “ ex . ‚ 10.8. Algunos tipos de discontinuidades 10.8. 237 Algunos tipos de discontinuidades 10.8.1. Definición. Sea f una función y x0 un número en el cual la función f no es continua. Bajo las condiciones anteriores decimos que f es discontinua en x0 . Analizaremos varios tipos de discontinuidad. 10.8.2. Definición. Cuando lím f pxq es un número pero f px0 q no existe o bien f px0 q ‰ xÑx0 lím f pxq, diremos que f tiene una discontinuidad removible o evitable en x0 . xÑx 0 Y 2 10.8.3. Ejemplo. Si f pxq “ px´2q , tenemos que f p2q no px´2q existe, pero sí existe el límite cuando x ÝÑ 2 de f pxq, el cual es igual a 1, de modo que f tiene una discontinuidad removible en 2. 10.8.4. Definición. Cuando existen números diferentes a y b tales que a “ lím` f pxq y b “ lím´ f pxq, decimos que xÑx0 1 -1 1 2 3 X xÑx0 f tiene una discontinuidad de salto en x0 . Y 2 10.8.5. Ejemplo. Si f pxq “ txu (el mayor entero menor o igual que x, también llamado piso de x) tenemos que para cualquier entero m, el límite cuando x tiende a m por la izquierda, es m´1, mientras que el límite cuando x tiende a m por la derecha es m. 1 -1 10.8.6. Definición. Cuando la recta vertical con ecuación x “ x0 es una asíntota de f , decimos que f tiene una discontinuidad asintótica o infinita en x0 . 1 3X -1 10.8.7. Ejemplo. Si f pxq “ x1 , entonces la función f tiene una discontinuidad asintótica en 0. Y 4 Ejercicios. 2 1. De las funciones que hayan resultado ser discontinuas en 2, en el ejercicio 1 de la sección 10.5, decir cual es el tipo de discontinuidad. 2 3 y=1x 1 -4 -2 2 -1 -2 -3 -4 4 X 238 10.9. Velocidad y aceleración 10.9. Velocidad y aceleración 10.9.1. Definición. Supongamos que xptq representa la coordenada en un tiempo t de la posición de una partícula o un objeto que se mueve sobre una recta. La velocidad media de la partícula entre un tiempo t0 y un tiempo t1 está definida por la fórmula v̄ “ xpt1 q ´ xpt0 q , t1 ´ t0 donde xpt1 q ´ xpt0 q es la cantidad que avanza la posición de la partícula y t1 ´ t0 es el tiempo que transcurre en la realización de tal avance, desde que inicia en el instante t0 , hasta que termina en el instante t1 . La velocidad de una partícula puede variar con el tiempo. Queremos definir la velocidad de la partícula, no solamente en un intervalo de tiempo rt0 ; t1 s sino precisamente en un tiempo t0 , es decir queremos definir la velocidad instantánea de la partícula en el tiempo t0 . 10.9.2. Definición. Para aproximar el valor de la velocidad instantánea por medio de la velocidad media, hacemos que el tiempo t1 sea muy próximo al tiempo t0 , es decir, definimos la velocidad instantánea de la partícula en el tiempo t0 como vpt0 q “ lím t1 Ñt0 xpt1 q ´ xpt0 q . t1 ´ t0 En todos los casos prácticos del movimiento de partículas, el límite anterior existe, aunque no siempre se sabe como calcularlo. La velocidad representa la razón o tasa de cambio de la posición de la partícula con respecto al tiempo. 10.9.3. Definición. Se define también la aceleración media de la partícula entre un tiempo t0 y un tiempo t1 por medio de la fórmula ā “ vpt1 q ´ vpt0 q . t1 ´ t0 También la aceleración de la partícula puede variar con el tiempo. 10.9.4. Definición. Definimos la aceleración instantánea de la partícula en el tiempo t0 mediante la fórmula vpt1 q ´ vpt0 q apt0 q “ lím . t1 Ñt0 t1 ´ t0 La aceleración representa la razón o tasa de cambio de la velocidad de la partícula con respecto al tiempo. 10.9.5. Ejemplo. Supongamos que una partícula se mueve sobre una recta (con un sistema de coordenadas predeterminado) con una aceleración a constante, la posición inicial es x0 y la velocidad inicial es v0 . La posición xptq en un tiempo cualesquiera t está dada por la fórmula xptq “ x0 ` v0 t ` 21 at2 . 10.9. Velocidad y aceleración 239 Veremos que, como es de esperarse, la velocidad vp0q en el tiempo 0 es v0 . Calculemos primero la velocidad vptq en un tiempo arbitrario t. px0 ` v0 s ` 21 as2 q ´ px0 ` v0 t ` 21 at2 q xpsq ´ xptq “ lím sÑt sÑt s´t s´t 1 1 2 2 v0 ps ´ tq ` 2 aps ´ t q aps ` tqps ´ tq v0 ps ´ tq “ lím “ lím ` lím 2 sÑt sÑt s ´ t sÑt s´t s´t 1 1 “ v0 ` lím 2 aps ` tq “ v0 ` 2 apt ` tq “ v0 ` at. vptq “ lím sÑt En particular tenemos que vp0q “ v0 . El ejemplo 10.9.5 modela fenómenos como la caída libre de los cuerpos cuando se desprecia la resistencia del aire y las alturas no son muy grandes, de tal manera que se considera constante el coeficiente gravitacional. Los objetos en movimiento, no siempre siguen el patrón de tener una aceleración constante, por lo que no siempre es válida la fórmula xptq “ x0 ` v0 t ` 12 at2 . Por ejemplo, un carro puede ir aumentando de velocidad (tener aceleración positiva), después frenar (tener aceleración negativa) y eventualmente ir a velocidad casi constante (tener aceleración aproximada a cero). 240 10.10. 10.10. La recta tangente La recta tangente 10.10.1. Definición. Sea f : A ÝÑ R, donde A Ă R. Sean P0 y Q dos puntos diferentes en la gráfica de f , es decir P0 , Q P tpx, yq : y “ f pxqu. A la recta que pasa por P0 y Q se le llama recta secante a la gráfica de f en los puntos P0 y Q. 1.5 1 Q -2 recta secante P0 0.5 -1 1 2 4 3 -0.5 gráfica de f -1 Si P0 “ px0 , y0 q y Q “ px, yq, entonces la pendiente de la recta secante a la gráfica de f en los puntos P0 y Q es y ´ y0 , x ´ x0 es decir es f pxq ´ f px0 q . x ´ x0 Deseamos definir, cuando sea posible, la recta tangente a la gráfica de f en el punto P0 , de tal manera que cuando los puntos P0 y Q estén cercanos, la recta tangente sea «parecida» a la recta secante en P0 y Q. En este caso lo que queremos decir con que sea parecida es que tengan pendientes próximas. 2 10.10.2. Definición. Definimos la recta tangente a la gráfica de f en el punto P0 “ px0 , y0 q “ px0 , f px0 qq como la recta que pasa por el punto P0 y cuya pendiente está dada por 1.5 1 gráfica de f 0.5 -2 f pxq ´ f px0 q lím . xÑx0 x ´ x0 -1 1 2 3 4 -0.5 P0 -1 Q recta secante Observemos que la definición ante-1.5 recta tangente rior tiene sentido solamente cuando el -2 límite existe. La figura anterior muestra la gráfica de una función con su recta tangente en un punto P0 y una recta secante en los puntos P0 y Q. 10.10.3. Ejemplo. Sea f pxq “ 2x3 ` 1 y hallemos la recta tangente a la gráfica de f en el 10.10. La recta tangente 241 punto p1, 3q. La recta tangente debe pasar por p1, 3q y tener pendiente igual a f pxq ´ f p1q p2x3 ` 1q ´ 3 2px3 ´ 1q lím “ lím “ lím xÑ1 xÑ1 xÑ1 x ´ 1 x´1 x´1 2 2px ´ 1qpx ` x ` 1q “ lím “ lím 2px2 ` x ` 1q “ 6, xÑ1 xÑ1 x´1 por lo que la recta tangente a la gráfica de f en el punto p1, 3q es la recta cuya ecuación está dada por y ´ 3 “ 6px ´ 1q. Refiriéndonos a la sección anterior, podemos observar que si xptq es la posición de un objeto en movimiento sobre una recta en el tiempo t, entonces la velocidad media v̄ del objeto entre los tiempos t0 y t1 es la pendiente de la recta secante a la gráfica de x en los puntos pt0 , xpt0 qq y pt1 , xpt1 qq, mientras que la velocidad instantánea vpt0 q del objeto en el tiempo t0 es la pendiente de la recta tangente a la gráfica de x en el punto pt0 , xpt0 qq. 1. Hallar la pendiente de la recta tangente a la gráfica de y “ 3x2 ` 1 en el punto p1, 4q. 2. Hallar las ecuaciones de las rectas tangentes a la gráfica de y “ x3 que tengan pendiente 12. 242 10.11. Definición de derivada 10.11. Definición de derivada 10.11.1. Definición. Sea f : A ÝÑ R, donde A Ă R, y supongamos que existe un intervalo abierto I Ă A. Si a P I y existe el siguiente límite lím xÑa f pxq ´ f paq , x´a decimos que f es derivable en a y al límite anterior se le llama la derivada de f en a y se le denota por f 1 paq. Observemos que f 1 paq es la pendiente de la recta tangente a la gráfica de f en el punto pa, f paqq. Haciendo el cambio de variable ∆ “ x ´ a, observando que con este cambio x “ a ` ∆ y que ∆ ÝÑ 0 cuando x ÝÑ a, tenemos que otra forma equivalente de definir la derivada de f en a es f pa ` ∆q ´ f paq . lím ∆Ñ0 ∆ El valor f 1 paq es un indicador de la rapidez con la cual cambia f pxq comparada con el cambio de la variable x, cuando x “ a. Es decir, f 1 paq es la razón o tasa de cambio de f pxq con respecto al cambio de x cuando x “ a. 10.11.2. Ejemplo. Hallar la derivada de la función g dada por gpxq “ 4x ` 5. La gráfica de g es una recta con pendiente 4, por lo que es de esperarse que la recta tangente a esa recta en cualquier punto sea la misma recta, la cual tiene pendiente 4. Así, es de esperarse que la derivada de g en cualquier valor x sea 4. Veamos que en efecto sucede lo que hemos sospechado. p4px ` ∆q ` 5q ´ p4x ` 5q 4∆ gpx ` ∆q ´ gpxq “ lím “ lím “ lím 4 “ 4. ∆Ñ0 ∆Ñ0 ∆ ∆Ñ0 ∆Ñ0 ∆ ∆ g 1 pxq “ lím 10.11.3. Ejemplo. Hallar la derivada de la función h dada por hpsq “ s4 . ps ` ∆q4 ´ s4 hps ` ∆q ´ hpsq “ lím ∆Ñ0 ∆Ñ0 ∆ ∆ 3 ∆pps ` ∆q ` ps ` ∆q2 s ` ps ` ∆qs2 ` s3 q “ lím ∆Ñ0 ∆ 3 2 “ lím pps ` ∆q ` ps ` ∆q s ` ps ` ∆qs2 ` s3 q “ s3 ` s2 s ` ss2 ` s3 “ 4s3 . h1 psq “ lím ∆Ñ0 10.11.4. Definiciones. Si f : A ÝÑ R, donde A Ă R, y definimos B como el conjunto de todos los elementos de A donde f es derivable, entonces f 1 : B ÝÑ R. La función f 1 se llama la derivada de f . A la derivada de f también se le denota por D f . Cuando x es una variable a la variable f 1 pxq también se le denota como d df pxq o como ddx f pxq y cuando x establecemos que y “ f pxq, lo anterior se suele representar como dd xy . Cuando f 1 sea derivable en un valor b de su dominio, a la derivada de f 1 en b se le denota por f 2 pbq y se dice que es la segunda derivada o derivada de orden 2 de f en b. Observemos que si C es el conjunto de todos los x tales que f 2 pxq existe, entonces f 2 : C ÝÑ R. La función f 2 se llama segunda derivada o derivada de orden 2 de f . A la función f 2 también se le denota 10.11. Definición de derivada 243 como f p2q . Observemos que cuando f ptq representa la posición de una partícula en el tiempo t, entonces f 1 ptq representa la velocidad instantánea de la partícula en el tiempo t, mientras que f 2 ptq representa la aceleración en el tiempo t. En general si n es un número natural y se tiene definida f pnq , definimos f pn`1q como la derivada de f pnq . En general a f pnq se le llama la derivada de orden n de f o n-ésima derivada de f . Cuando establecemos que y “ f pxq, a la expresión f pnq pxq, que representa la derivada n-ésima de f evaluada en x, se le suele n denotar como dd xny o a veces como y pnq . Algunas veces puede suceder que el límite lím ∆Ñ0 f pa ` ∆q ´ f paq ∆ no exista, sin embargo pueden existir uno o los dos límites siguientes lím` ∆Ñ0 f pa ` ∆q ´ f paq , ∆ f pa ` ∆q ´ f paq . ∆Ñ0 ∆ En el caso de que alguno de los límites anteriores exista, se les llamará derivada por la derecha y derivada por la izquierda respectivamente de f en a y se les denotará respectivamente por D` f paq y D´ f paq. Observemos que para que D` f paq exista, es necesario que el dominio de f contenga un intervalo de la forma ra; bq, mientras que para que D´ f paq exista, es necesario que el dominio de f contenga un intervalo de la forma pc; as. Si una función f es derivable en cada elemento de un intervalo abierto I incluido en su dominio, entonces decimos que f es derivable en I. lím´ p0q “ lím` ∆ “ 10.11.5. Ejemplo. Si f pxq “ |x|, tenemos que D` f p0q “ lím` f p0`∆q´f ∆ ∆ ∆Ñ0 ∆Ñ0 p0q 1, mientras que D´ f p0q “ lím´ f p0`∆q´f “ lím´ ´∆ “ ´1. Si a ą 0 y tomamos ∆ ∆ ∆ ∆Ñ0 ∆Ñ0 suficientemente cercano a 0, por ejemplo |∆| ă a, entonces |a ` ∆| “ a ` ∆, por lo que |a`∆|´|a| “ 1, por lo que f 1 paq “ 1. Ahora, si a ă 0 y tomamos ∆ suficientemente cercano a ∆ 0, por ejemplo |∆| ă ´a, entonces |a ` ∆| “ ´pa ` ∆q, por lo que |a`∆|´|a| “ ´pa`∆q`a “ ´1, ∆ ∆ por lo que en este caso f 1 paq “ ´1. 244 10.12. 10.12. Teoremas sobre derivadas Teoremas sobre derivadas En esta sección estableceremos métodos para efectuar cálculos prácticos de las derivadas de muchas de las funciones conocidas que sean sumas, rectas, multiplicaciones, divisiones o composiciones de funciones racionales, exponenciales o logarítmicas. 10.12.1. Teorema. Si f y g son dos funciones reales derivables en un número a, entonces la derivada de la función f ` g en a es f 1 paq ` g 1 paq. Demostración. Calculemos directamente la derivada de f ` g en a. Tenemos que f pa ` ∆q ` gpa ` ∆q ´ pf paq ` gpaqq pf ` gqpa ` ∆q ´ pf ` gqpaq “ lím ∆Ñ0 ∆Ñ0 ∆ ∆ pf pa ` ∆q ´ f paqq ` pgpa ` ∆q ´ gpaqq “ lím ∆Ñ0 ∆ f pa ` ∆q ´ f paq gpa ` ∆q ´ gpaq “ lím ` lím “ f 1 paq ` g 1 paq, ∆Ñ0 ∆Ñ0 ∆ ∆ pf ` gq1 paq “ lím con lo que el teorema queda demostrado. ‚ 10.12.2. Teorema. Si f es una función derivable en a y c es un número, entonces la función g dada por gpxq “ cf pxq es derivable en a y además g 1 paq “ cf 1 paq. Demostración. De la definición de derivada tenemos cf pa ` ∆q ´ cf paq f pa ` ∆q ´ f paq gpa ` ∆q ´ gpaq “ lím “ c lím “ cf 1 paq, ∆Ñ0 ∆Ñ0 ∆Ñ0 ∆ ∆ ∆ g 1 paq “ lím con lo que el teorema queda demostrado. ‚ 10.12.3. Teorema. Si f es derivable en a, entonces f es continua en a. Demostración. Supongamos que f es derivable en a. Si f no fuera continua en a, entonces existiría un ε ą 0 tal que para todo δ ą 0 existe un número real x, con la propiedad de que |x ´ a| ă δ y |f pxq ´ f paq| ľ ε. En particular existiría un ε ą 0 y una sucesión de números reales pxn q tal que |xn ´ a| ă 1{n y |f pxn q ´ f paq| ľ ε. Observando que xn ÝÑ a cuando n ÝÑ 8, tenemos ˇ ˇ ˇ ˇ ˇ ˇ ˇ ˇ ˇ f pxq ´ f paq ˇ ˇ f pxn q ´ f paq ˇ f pxq ´ f paq ˇ “ lím ˇ ˇ “ lím ˇ ˇ |f paq| “ ˇˇxÑa lím x ´ a ˇ xÑa ˇ x ´ a ˇ nÑ8 ˇ xn ´ a ˇ ε ľ nÑ8 lím “ lím nε “ `8, 1{n nÑ8 1 con lo que llegamos a una contradicción acerca de la existencia de la derivada de f en a. De este modo tenemos que si f es derivable en a, entonces es continua en a. ‚ 10.12.4. Teorema. Si f y g son dos funciones derivables en a, entonces la derivada de f g en a existe y está dada por f paqg 1 paq ` f 1 paqgpaq. 10.12. Teoremas sobre derivadas 245 Demostración. Utilizando la definición de derivada, el teorema anterior y las propiedades de los límites tenemos que f pa ` ∆qgpa ` ∆q ´ f paqgpaq ∆Ñ0 ∆ pf pa ` ∆qgpa ` ∆q ´ f pa ` ∆qgpaqq ` pf pa ` ∆qgpaq ´ f paqgpaqq “ lím ∆Ñ0 ∆ f pa ` ∆qgpa ` ∆q ´ f pa ` ∆qgpaq f pa ` ∆qgpaq ´ f paqgpaq “ lím ` lím ∆Ñ0 ∆Ñ0 ∆ ∆ ˙ ˆ f pa ` ∆q ´ f paq gpa ` ∆q ´ gpaq ` lím gpaq “ lím f pa ` ∆q ∆Ñ0 ∆Ñ0 ∆ ∆ gpa ` ∆q ´ gpaq “ lím f pa ` ∆q lím ` f 1 paqgpaq “ f paqg 1 paq ` f 1 paqgpaq, ∆Ñ0 ∆Ñ0 ∆ D f gpaq “ lím con lo que el teorema queda demostrado. 10.12.5. Teorema. Si f pxq “ 1 x ‚ para x ‰ 0, entonces f 1 pxq “ ´1 . x2 Demostración. Utilizando la definición de derivada tenemos que 1 ´ f px ` ∆q ´ f pxq x`∆ f pxq “ lím “ lím ∆Ñ0 ∆Ñ0 ∆ ∆ 1 1 x “ lím ´∆ ´1 ´1 “ lím “ 2, ∆Ñ0 ` ∆q xpx ` ∆q x ∆Ñ0 x∆px con lo que el teorema queda demostrado. ‚ El teorema que enunciaremos a continuación, conocido como la regla de la cadena, es muy importante y es una herramienta muy fuerte en el cálculo práctico de derivadas. 10.12.6. Regla de la cadena. Si f y g son funciones tales que f es derivable en gpxq y g es derivable en x, entonces pf ˝ gq1 pxq “ f 1 pgpxqqg 1 pxq. Demostración. Analicemos primero el caso en el que existe un δ ą 0 tal que 0 ă |t| ă δ ùñ gpx ` tq ‰ gpxq. En este caso tenemos que pf ˝ gqpx ` ∆q ´ pf ˝ gqpxq f pgpx ` ∆qq ´ f pgpxqq “ lím ∆Ñ0 ∆Ñ0 ∆ ˆ ˙∆ f pgpx ` ∆qq ´ f pgpxqq gpx ` ∆q ´ gpxq “ lím ¨ ∆Ñ0 gpx ` ∆q ´ gpxq ∆ f pgpx ` ∆qq ´ f pgpxqq gpx ` ∆q ´ gpxq “ lím ¨ lím ∆Ñ0 ∆Ñ0 gpx ` ∆q ´ gpxq ∆ f psq ´ f pgpxqq 1 “ lím ¨ g pxq “ f 1 pgpxqqg 1 pxq. sÑgpxq s ´ gpxq pf ˝ gq1 pxq “ lím Analicemos ahora el caso en que para cada δ ą 0 existe un t P p´δ; δqzt0u tal que gpx`tq “ gpxq. En tal caso, existe una sucesión ptn q tal que tn P p´1{n; 1{nqzt0u y gpx ` tn q “ gpxq, tal sucesión converge obviamente a 0. Ahora, observemos que gpx ` ∆q ´ gpxq gpx ` tn q ´ gpxq 0 “ nÑ8 lím “ nÑ8 lím “ 0. ∆Ñ0 ∆ tn tn g 1 pxq “ lím 246 10.12. Teoremas sobre derivadas Por lo anterior es suficiente demostrar que en esteˇ caso pf ˝gq1 pxq “ 0. Para ε ą 0, sea δ ą 0 tal ˇ ˇ ˇ pgpxqq que 0 ă |s| ă δ ùñ ˇ pf pgpxq`sqq´f ´ f 1 pgpxqqˇ ă ε. Sea además η ą 0 tal que 0 ă |∆| ă η s ˇ ˇ ˇ ˇ ε ùñ ˇ pgpx`∆q´gpxqq y |gpx ` ∆q ´ gpxq| ă δ. Tomemos ∆ P p´η; ηqzt0u. Si ˇ ă pε`|f 1 pgpxqq|q ∆ gpx ` ∆q “ gpxq, entonces ˇ ˇ ˇ f pgpx ` ∆qq ´ f pgpxqq ˇ ˇ ă ε. ˇ ˇ ˇ ∆ Si en cambio gpx ` ∆q ‰ gpxq, entonces ˇ ˇ ˇ ˇ ˇ ˇ ˇ f pgpx ` ∆qq ´ f pgpxqq ˇ ˇ f pgpx ` ∆qq ´ f pgpxqq ˇ ˇ gpx ` ∆q ´ gpxq ˇ ˇ ˇ“ˇ ˇ¨ˇ ˇ ˇ ˇ ˇ gpx ` ∆q ´ gpxq ˇ ˇ ˇ ∆ ∆ ε “ ε. ă pε ` |f 1 pgpxqq|q ¨ 1 ε ` |f pgpxqq| Por lo que en este caso pf ˝ gq1 pxq “ 0. En general siempre se tiene que pf ˝ gq1 pxq “ f 1 pgpxqqg 1 pxq. ‚ 10.12.7. Teorema. Si f y g son dos funciones derivables en a, con gpaq ‰ 0, entonces f f 1 paqgpaq ´ f paqg 1 paq D paq “ . g pgpaqq2 Demostración. Utilizando el teorema 10.12.4, la regla de la cadena y el teorema 10.12.5, tenemos que si definimos la función h como hpxq “ x1 , entonces ˙ ˆ f 1 paq “ Dpf ¨ ph ˝ gqqpaq “ f 1 paqph ˝ gqpaq ` f paqph ˝ gq1 paq D paq “ D f ¨ g g ˙ ˆ 1 f paq f 1 paq ´1 1 1 “ g 1 paq ` f paqh pgpaqqg paq “ ` f paq 2 gpaq gpaq pgpaqq 1 1 f paqgpaq ´ f paqg paq “ , pgpaqq2 con lo cual queda demostrado el teorema. ‚ 10.12.8. Teorema. Si n es un número natural y f pxq “ xn , entonces f 1 pxq “ nxn´1 . Demostración. Usando la fórmula para factorizar una diferencia de potencias tenemos que n´1 ř xk px ` ∆qn´1´k n n px ` ∆q ´ x k“0 f 1 pxq “ lím “ lím ∆Ñ0 ∆Ñ0 ∆ ∆ n´1 n´1 n´1 ÿ ÿ ÿ “ lím xk px ` ∆qn´1´k “ xk xn´1´k “ xn´1 “ nxn´1 . ppx ` ∆q ´ xq ∆Ñ0 k“0 k“0 ‚ k“0 El siguiente teorema nos da la fórmula para calcular la derivada de la función exponencial. 10.12.9. Teorema. La derivada de la función exponencial natural es la misma función exponencial natural, es decir exp1 pxq “ exppxq. 10.12. Teoremas sobre derivadas 247 Demostración. Por definición tenemos que 8 ř ∆k k! ´1 e pe ´1q e ´1 ´e k“0 x x “ lím “ e lím “ e lím exp pxq “ lím ∆Ñ0 ∆Ñ0 ∆ ∆Ñ0 ∆ ∆ ˜ ∆ ¸ ˜ ∆Ñ0 ¸ 8 8 8 k ÿ ∆k´1 ÿ ∆k´1 ÿ ∆ “ ex lím “ ex 1 ` lím “ ex 1 ` lím ∆ , ∆Ñ0 ∆Ñ0 ∆Ñ0 k! k! pk ` 2q! k“1 k“2 k“0 1 e x`∆ x x ∆ ∆ pero si |∆| ă 1, entonces ˇ ˇ 8 8 8 ˇ ÿ ÿ ÿ |∆k | |∆|k ∆k ˇˇ ˇ ĺ |∆| “ |∆| e|∆| , 0 ĺ ˇ∆ ˇ ĺ |∆| ˇ k“0 pk ` 2q! ˇ pk ` 2q! k! k“0 k“0 ˇ 8 ˇ ř por lo que 0 ĺ lím ˇˇ∆ ∆Ñ0 k“0 ˇ ˇ ∆k ˇ pk`2q! ˇ ĺ lím |∆| e|∆| “ 0, de manera que ∆Ñ0 8 ÿ ∆k lím ∆ “0 ∆Ñ0 pk ` 2q! k“0 y así exp1 pxq “ ex “ exppxq. ‚ 10.12.10. Corolario. Si a es un número positivo y f es la función tal que f pxq “ ax , entonces f 1 paq “ pln aqax . Demostración. Como ax “ epln aqx , tenemos que el resultado se sigue de la regla de la cadena y del teorema 10.12.9. ‚ El teorema siguiente nos dice cómo calcular la derivada de una función inversa. 10.12.11. Teorema. Si f es una función inyectiva y derivable en a, f 1 paq ‰ 0 y b “ f paq, entonces D f ´1 pbq “ f 11paq , es decir pf ´1 q1 pbq “ 1 f 1 pf ´1 pbqq . Demostración. Sea I la función identidad, es decir la función tal que Ipxq “ x y observemos que I 1 pxq “ 1. Como I “ f ˝ f ´1 , obtenemos al usar la regla de la cadena que 1 f 1 pf ´1 pbqqpf ´1 q1 pbq “ 1, es decir pf ´1 q1 pbq “ f 1 pf ´1 . ‚ pbqq 10.12.12. Teorema. D lnpxq “ x1 . Demostración. De los teoremas 10.12.9 y 10.12.11 y usando el hecho de que el logaritmo 1 natural es la función inversa de la función exponencial tenemos que D lnpxq “ exp1 plnpxqq “ 1 1 “ x. ‚ expplnpxqq 10.12.13. Corolario. d ln |x| dx “ x1 . Demostración. Observemos que ln |x| sólo está definido cuando x ‰ 0. Sea f la función definida por f pxq “ |x| y observemos que si x ą 0, entonces f 1 pxq “ 1, mientras que si x ă 0, 248 10.12. Teoremas sobre derivadas entonces f 1 pxq “ ´1 (véase el ejemplo 10.11.5). Ahora, por la regla de la cadena y por el |x| 1 teorema 10.12.12 tenemos que si x ą 0, entonces d ln “ |x| 1 “ x1 , mientras que si x ă 0, dx entonces d ln |x| dx “ 1 p´1q |x| “ 1 p´1q ´x “ x1 . ‚ El siguiente teorema es en cierto sentido una generalización del teorema 10.12.8. 10.12.14. Teorema. Si r P R y f : p0; `8q ÝÑ R es la función definida como f pxq “ xr , entonces f 1 pxq “ rxr´1 . Demostración. Como xr “ er lnpxq , obtenemos al aplicar ` ˘ ` ˘ la regla de la cadena y los teoremas 10.12.9 y 10.12.12 que f 1 pxq “ er lnpxq ¨r x1 “ xr r ¨ x1 “ rxr´1 . ‚ Ejercicios. 1. Hallar la función derivada de ps P Rq ÞÑ p2s2 ´ 5q7 . 2. Hallar la función derivada de pt P Rzt´3uq ÞÑ 2t2 ` 1 . t`3 3. Hallar las derivadas por la izquierda y por la derecha de las siguientes funciones en x “ ´3. a) px P Rq ÞÑ |x ` 3|, b) px P Rq ÞÑ |x| ` 3, c) px P Rq ÞÑ px ` 3q2 |x ` 3|. 4. Si la expresión t4 ` 3t2 ` 4t representa los metros que una partícula se encuentra a la derecha de un punto inicial a los t segundos. Encontrar la velocidad y la aceleración de la partícula a los 5 segundos. 10.13. Máximos y mínimos relativos 10.13. 249 Máximos y mínimos relativos En esta sección estableceremos criterios para determinar cuando una función es creciente, decreciente así como para hallar los valores donde la función toma un máximo o un mínimo local. Veamos antes algunas definiciones. 10.13.1. Definiciones. Sea A Ă R y f : A ÝÑ R. Decimos que f toma un máximo local o máximo relativo en a P A si existe un intervalo abierto I tal que a P I y para todo x P I X A se tiene que f paq ľ f pxq. De manera similar decimos que f toma un mínimo local o mínimo relativo en b P A si existe un intervalo abierto J tal que b P J y para todo x P J X A se tiene que f pbq ĺ f pxq. Cuando la función f toma un máximo relativo o un mínimo relativo en un número c, decimos que f toma un extremo relativo o extremo local en c. Ahora, decimos que f toma un máximo absoluto en un número a P A si para todo x P A se tiene que f pxq ĺ f paq, en tal caso decimos que f paq es el máximo absoluto de f . Decimos que f toma un mínimo absoluto en un número b P A si para todo x P A se tiene que f pxq ľ f pbq, en tal caso decimos que f pbq es el mínimo absoluto de f . Se dice que un número es un extremo absoluto de una función, cuando es un máximo absoluto o un mínimo absoluto de la función. Supongamos que B Ă A. Cuando a P B y f paq ľ f pxq para todo x P B, decimos que f paq es el máximo absoluto de f en el conjunto B. Cuando b P B y f pbq ĺ f pxq para todo x P B, decimos que f pbq es el mínimo absoluto de f en el conjunto B. Se dice que un número es un extremo absoluto de una función en un conjunto B, cuando es un máximo absoluto o un mínimo absoluto de la función en el conjunto B. El teorema siguiente será muy útil como técnica para buscar máximos y mínimos relativos de una función. 10.13.2. Teorema de Rolle. Sean a y b dos números con a ă b y f una función continua en ra; bs y derivable en pa; bq tal que f paq “ f pbq. Existe un número c P pa; bq, tal que f 1 pcq “ 0. Demostración. Si no existe ningún x P pa; bq tal que f pxq ‰ f paq, entonces la función es constante en ra; bs y cualquier c P pa; bq es tal que f 1 pcq “ 0, por ejemplo f 1 ppb ` aq{2q “ 0. Si existe un x P pa; bq tal que f pxq ą a, entonces suptf ptq : t P ra; bsu ą f paq y por el teorema del valor máximo 10.5.22, existe un c P ra; bs tal que f pcq “ suptf ptq : t P ra; bsu, en este caso es obvio que c P pa; bq. Ahora, como f ptq ĺ f pcq para todo t P ra; bs, tenemos que si a ă t ă c, pcq pcq ľ 0, por lo que D´ f pcq ľ 0, pero si c ă t ă b, entonces f ptq´f ĺ 0, por entonces f ptq´f t´c t´c ` ` ´ lo que D f pcq ĺ 0. Como f es derivable en pa; bq tenemos que D f pcq “ D f pcq “ D f pcq, concluyendo que D f pcq “ 0, es decir f 1 pcq “ 0. Si existe un x P pa; bq tal que f pxq ă f paq, se demuestra de manera similar (usando el teorema del valor mínimo 10.5.23) que también en este caso existe un número c P pa; bq tal que f 1 pcq “ 0. ‚ 10.13.3. Teorema del valor medio de Lagrange (teorema del valor medio para derivadas) (teorema del incremento finito). Sea f una función continua en un intervalo cerrado ra; bs y derivable en pa; bq, (con a ă b). Existe un número c P pa; bq tal que f 1 pcq “ f pbq ´ f paq . b´a 250 10.13. Máximos y mínimos relativos Y Demostración. Sea g : ra; bs ÝÑ R la función definida por gpxq “ f pxq ´ y=fHxL a c b X f pbq ´ f paq px ´ aq b´a y observemos que gpaq “ f paq “ gpbq, de modo que por el teorema de Rolle 10.13.2 existe un c P pa; bq tal que g 1 pcq “ 0, pero paq g 1 pxq “ f 1 pxq ´ f pbq´f , de donde concluimos b´a f pbq´f paq 1 ‚ que f pcq “ b´a . 10.13.4. Teorema. Supongamos que f es una función tal que: Y fHcL a) f toma un máximo local o un mínimo local en un número c, b) el domino de f incluye a un intervalo abierto al cual pertenece c, y=fHxL c) f 1 pcq existe; a c b X entonces f 1 pcq “ 0. Demostración. Haremos la demostración para el caso en que f toma un máximo local en c. Sea pa; bq un intervalo abierto incluido en el domino de f , tal que c P pa; bq y f pxq ĺ f pcq pcq para todo x P pa; bq. Si t P pa; bq y t ă c, entonces f ptq´f ľ 0, por lo que D´ f pcq ľ 0. Si t´c pcq s P pa; bq y s ą c, entonces f psq´f ĺ 0, por lo que D` f pcq ĺ 0. Como f 1 pcq existe, entonces s´c 0 ĺ D´ f pcq “ f 1 pcq “ D` f pcq ĺ 0, es decir f 1 pcq “ 0. ‚ 10.13.5. Definición. Un número c en el dominio de una función f es un valor crítico o punto crítico de f si f 1 pcq “ 0 ó f 1 pcq no existe. Debido al teorema 10.13.4, una función sólo puede tomar máximos o mínimos relativos en sus valores críticos, es decir si queremos buscar los valores donde la función toma sus máximos o mínimos relativos, es suficiente que la búsqueda se restrinja al conjunto de valores críticos de la función. 10.13.6. Definición. Una función f es constante en un conjunto A si para cualesquiera dos valores a, b P A se tiene que f paq “ f pbq. 10.13.7. Teorema. Si f 1 pxq “ 0 para todo x en un intervalo I, entonces f es constante en I. 10.13. Máximos y mínimos relativos 251 Demostración. Sean a, b P I. Si a “ b, entonces f paq “ f pbq. Si a ă b, entonces, como f es derivable en I, también lo es en pa; bq y por el teorema 10.12.3, es continua en ra; bs. Por el teorema de Rolle 10.13.2, existe un c P pa; bq tal que f pbq ´ f paq “ f 1 pcqpb ´ aq, pero como f 1 pcq “ 0, entonces f paq “ f pbq. De manera análoga se tiene que f paq “ f pbq cuando a ą b. Así para cualesquiera dos valores a, b P I se tiene que f paq “ f pbq, es decir f es constante en el intervalo I. ‚ 10.13.8. Corolario. Si f y g son dos funciones derivables en un intervalo I y además f 1 pxq “ g 1 pxq para todo x P I, entonces existe un número k tal que f pxq “ gpxq ` k. Demostración. Sea h “ f ´g. Como para todo x P I, se tiene que h1 pxq “ f 1 pxq´g 1 pxq “ 0, entonces, por el teorema 10.13.7, se tiene que la función h es constante en I, es decir existe un número k tal que hpxq “ k para todo x P I, es decir f pxq ´ gpxq “ k, por lo tanto f pxq “ gpxq ` k. ‚ 10.13.9. Teorema. Supongamos que a ă b y que f es una función continua en ra; bs y derivable en pa; bq. a) Si f 1 pxq ą 0 para todo x P pa; bq, entonces f es estrictamente creciente en ra; bs. b) Si f 1 pxq ă 0 para todo x P pa; bq, entonces f es estrictamente decreciente en ra; bs. Demostración. Demostraremos solamente la parte a) del teorema (la parte b) se demuestra de manera similar). Sean x1 , x2 P ra; bs tales que x1 ă x2 . Como f es continua en ra; bs y derivable en pa; bq, entonces f es continua en rx1 ; x2 s y derivable en px1 ; x2 q, de modo que por el teorema de Rolle 10.13.2 se tiene que existe un c P px1 ; x2 q tal que f px2 q ´ f px1 q “ f 1 pcqpx2 ´ x1 q, pero f 1 pcqpx2 ´ x1 q ą 0, por lo que f es estrictamente creciente en ra; bs. ‚ El teorema que sigue establece condiciones para que una función tenga un máximo o un mínimo local en un número c. 10.13.10. Criterio de la primera derivada. Supongamos que a ă b, que f es una función continua en pa; bq y que c P pa; bq es un valor crítico de f . a) Si f 1 pxq ą 0 para todo x P pa; cq y f 1 pxq ă 0 para todo x P pc; bq, entonces f toma un máximo relativo en c. b) Si f 1 pxq ă 0 para todo x P pa; cq y f 1 pxq ą 0 para todo x P pc; bq, entonces f toma un mínimo relativo en c. c) Si f 1 pxq ą 0 para todo x P pa; cq y f 1 pxq ą 0 para todo x P pc; bq, o bien si f 1 pxq ă 0 para todo x P pa; cq y f 1 pxq ă 0 para todo x P pc; bq, entonces f no toma un máximo relativo ni un mínimo relativo en c. 252 10.13. Máximos y mínimos relativos Demostración. a) Si f 1 pxq ą 0 para todo x P pa; cq y f 1 pxq ă 0 para todo x P pc; bq, entonces, por el teorema 10.13.9, se tiene que f es estrictamente creciente en pa; cq y es estrictamente decreciente en pc; bq. Por lo tanto f pcq ą f pxq para todo x P pa; bq diferente de c, teniéndose así que f toma un máximo relativo en c. La demostración del inciso b) se hace de manera similar. c) Supongamos primero que f 1 pxq ą 0 para todo x P pa; cq y f 1 pxq ą 0 para todo x P pc; bq y sea I un intervalo abierto al cual pertenece c. Observemos que I X pa; bq es también un intervalo abierto al cual pertenece c. Sea x1 P I Xpa; bq un número menor que c y x2 P I Xpa; bq un número menor que c. Por el teorema 10.13.9 se tiene que f px1 q ă f pcq ă f px2 q, por lo cual f no toma un máximo relativo ni un mínimo relativo en c. De manera análoga se puede demuestra que si f 1 pxq ă 0 para todo x P pa; cq y f 1 pxq ă 0 para todo x P pc; bq, entonces f no toma un máximo relativo ni un mínimo relativo en c. ‚ 10.13.11. Criterio de la segunda derivada. Supongamos que a ă b, f es derivable en pa; bq, c P pa; bq, f 1 pcq “ 0 y f 2 pcq existe. a) Si f 2 pcq ă 0, entonces f toma un máximo local en c. b) Si f 2 pcq ą 0, entonces f toma un mínimo local en c. 1 1 cq “ Demostración. a) Supongamos que f 2 pcq ă 0 y sea k “ f 2 pcq. Como 0 ą k “ lím f ptq´f t´c 1 tÑc ptq lím ft´c , por ser f 2 continua en c, existe un δ ą 0 tal que si t P pc ´ δ; c ` δq, entonces tÑc f 1 ptq t´c ă k2 ă 0. De este modo tenemos que si t P pc ´ δ; cq, entonces f 1 ptq ą 0, mientras que si t P pc; c ` δq, entonces f 1 ptq ă 0. Ahora, por el criterio de la primera derivada, tenemos que f toma un máximo relativo en c. La demostración del inciso b) es análoga a la del inciso a). ‚ 10.13.12. Definición. Supongamos que f : A ÝÑ R, J es un intervalo abierto y J Ă A Ă R. Decimos que la gráfica de f es cóncava hacia arriba en el intervalo J si la derivada de f existe y es creciente en J. De manera similar, si la derivada de f existe y es decreciente en J, decimos que la gráfica de f es cóncava hacia abajo en el intervalo J. Los diagramas siguientes muestran posibles formas que tienen las gráficas que son cóncavas hacia arriba. 10.13. Máximos y mínimos relativos 253 Como ejemplos típicos de gráficas que son cóncavas hacia arriba tenemos las parábolas que se abren hacia arriba y las funciones exponenciales. Los diagramas siguientes muestran posibles formas que tienen las gráficas que son cóncavas hacia abajo. Como ejemplos típicos de gráficas que son cóncavas hacia abajo tenemos las de las funciones logarítmicas, la de la función raíz cuadrada positiva y las parábolas que se abren hacia abajo. El teorema siguiente da una idea de la forma que debe tener la gráfica de una función en los intervalos donde son cóncavas hacia arriba o cóncavas hacia abajo. Comparar el resultado del teorema con las figuras anteriores. 10.13.13. Teorema. Sea I un intervalo abierto incluido en el dominio de una función f , sea c P I y sea g la función cuya gráfica es la recta tangente a la gráfica de f en pc, f pcqq. a) Si la función f es cóncava hacia arriba en I, entonces para todo x P I diferente de c se tiene que f pxq ą gpxq. b) Si la función f es cóncava hacia abajo en I, entonces para todo x P I diferente de c se tiene que f pxq ă gpxq. Demostración. Demostraremos solamente a), pues la demostración de b) es análoga. Sea x P I menor que c. Por el teorema del valor medio para derivadas 10.13.3, existe un número pcq , pero real a P px; cq tal que f 1 paq “ f pxq´f x´c gpxq “ f pcq ` f 1 pcqpx ´ cq “ f 1 pcqpx ´ cq ´ f 1 paqpx ´ cq ` f pxq “ pf 1 pcq ´ f 1 paqqpx ´ cq ` f pxq ă f pxq. Sea ahora x P I mayor que c. De nuevo por el teorema del valor medio para derivadas, pcq existe un número real a P pc; xq tal que f 1 paq “ f pxq´f , pero x´c gpxq “ f pcq ` f 1 pcqpx ´ cq “ f 1 pcqpx ´ cq ´ f 1 paqpx ´ cq ` f pxq “ pf 1 pcq ´ f 1 paqqpx ´ cq ` f pxq ă f pxq, con lo que el teorema queda demostrado. ‚ 254 10.13. Máximos y mínimos relativos El siguiente teorema da una técnica para encontrar los intervalos donde una función es cóncava hacia arriba o cóncava hacia abajo. 10.13.14. Criterio de concavidad. Sea f una función cuya segunda derivada existe en un intervalo abierto I. a) Si f 2 pxq ą 0 para todo x P I, entonces la gráfica de f es cóncava hacia arriba en I. b) Si f 2 pxq ă 0 para todo x P I, entonces la gráfica de f es cóncava hacia abajo en I. Demostración. El teorema es una consecuencia inmediata de la definición de concavidad y del teorema 10.13.9. ‚ 10.13.15. Definición. Sea f : A ÝÑ R una función que es continua en c P A. Decimos que el punto pc, f pcqq es un punto de inflexión de la función f ó de la gráfica de la función f , si existe un δ ą 0 tal que se cumple alguna de las dos propiedades siguientes: I) La gráfica de f es cóncava hacia arriba en pc ´ δ; cq y cóncava hacia abajo en pc; c ` δq. II) La gráfica de f es cóncava hacia abajo en pc ´ δ; cq y cóncava hacia arriba en pc; c ` δq. Se puede decir que el punto de inflexión de una gráfica es el punto donde hay un cambio de concavidad. Los siguientes diagramas ilustran unas gráficas de funciones resaltando sus puntos de inflexión. Ejercicios. 1. Hallar el valor de x que en el intervalo r´10; 10s haga máxima la expresión x3 ´ 3x2 ` 3x ´ 1. Hallar además los extremos relativos y los puntos de inflexión. 10.14. Formas indeterminadas 10.14. 255 Formas indeterminadas Algunas veces nos vemos en la necesidad de calcular límites de cocientes en donde tanto el límite del numerador como el del denominador son iguales a cero, por ejemplo en la definición de derivada tenemos esta situación. Cuando nos hemos topado con tales límites, generalmente primero hacemos una manipulación y simplificación algebraica y después calculamos un límite conocido o relativamente fácil de calcular. Sin embargo a veces no es fácil hacer este tipo de cálculos con los métodos usados anteriormente, por lo que en esta sección veremos métodos prácticos para encontrar tales límites. 10.14.1. Definición. Diremos que un límite es de la forma indeterminada 0{0 si está pxq , donde xÑa lím f pxq “ xÑa lím gpxq “ 0. expresado en la forma xÑa lím fgpxq El siguiente teorema será de utilidad para deducir un método para calcular algunas formas indeterminadas 0{0. 10.14.2. Teorema del valor medio de Cauchy. Sean f y g funciones continuas en ra; bs y derivables en pa; bq, con a ă b. Si g 1 pxq ‰ 0 para todo x P pa; bq, entonces existe un número c P pa; bq tal que f pbq ´ f paq f 1 pcq “ . 1 g pcq gpbq ´ gpaq Demostración. Sea G la función definida por Gpxq “ pgpbq ´ gpaqqpf pxq ´ f paqq ´ pgpxq ´ gpaqqpf pbq ´ f paqq. Como Gpaq “ Gpbq “ 0, entonces por el teorema de Rolle 10.13.2, existe un c P pa; bq tal que G1 pcq “ 0, pero G1 pxq “ pgpbq ´ gpaqqf 1 pxq ´ pf pbq ´ f paqqg 1 pxq y al evaluar en x “ c tenemos que pgpbq ´ gpaqqf 1 pcq “ pf pbq ´ f paqqg 1 pcq. Ahora, como g 1 pxq ‰ 0 para todo x P pa; bq, ‰ 0, por lo que gpbq ´ gpaq ‰ 0 y así tenemos de nuevo por el teorema de Rolle que gpbq´gpaq b´a f 1 pcq f pbq´f paq “ gpbq´gpaq . ‚ g 1 pcq 10.14.3. Teorema. Sean f y g funciones derivables en pa; bq y continuas en ra; bq. Si f paq “ gpaq “ 0, entonces f 1 pxq f pxq “ lím` 1 . lím` xÑa gpxq xÑa g pxq 1 pxq Demostración. Si lím` fg1 pxq “ L (con L finito), entonces tomando x P pa; a`b q tenemos, 2 xÑa por el teorema del valor medio de Cauchy 10.14.2, que existe cx P pa; xq tal que Para ε ą 0 sea δ ą 0 tal que ˇ 1 ˇ ˇ f pxq ˇ ˇ a ă x ă a ` δ ùñ ˇ 1 ´ Lˇˇ ă ε, g pxq pero como a ă cx ă a ` δ, entonces ˇ 1 ˇ ˇ f pcx q ˇ ˇ ˇ ˇ g 1 pcx q ´ Lˇ ă ε, f pxq gpxq “ f 1 pcx q . g 1 pcx q 256 10.14. Formas indeterminadas lo cual implica que ˇ ˇ ˇ ˇ f pxq ˇ ˇ ˇ gpxq ´ Lˇ ă ε y así lím` xÑa f 1 pxq f pxq “ lím` 1 . gpxq xÑa g pxq f 1 pxq Si lím` g1 pxq “ ´8, entonces para todo N ą 0 existe un δ ą 0 tal que si 0 ă x ă a ` δ, xÑa 1 pxq entonces fg1 pxq ă ´N , por lo que f 1 pcx q g 1 pcx q ă ´N y así f pxq gpxq pxq ă ´N , por lo que lím` fgpxq “ ´8. De xÑa 1 1 pxq pxq pxq manera similar se puede demostrar que lím` fgpxq “ lím` fg1 pxq cuando lím` fg1 pxq “ `8. xÑa xÑa xÑa ‚ De manera análoga a como se demostró el teorema 10.14.3 se puede demostrar el teorema siguiente. 10.14.4. Teorema. Sean f y g funciones derivables en pa; bq y continuas en pa; bs. Si f pbq “ gpbq “ 0, entonces f 1 pxq f pxq “ lím´ 1 . lím´ xÑb g pxq xÑb gpxq Los teoremas 10.14.3 y 10.14.4 implican el teorema siguiente. 10.14.5. Teorema. Sean f y g funciones derivables en pa; bq y c P pa; bq. Si f pcq “ gpcq “ 0, entonces f pxq f 1 pxq lím “ lím 1 . xÑc gpxq xÑc g pxq 10.14.6. Teorema. Si f y g funciones derivables en pa; `8q con a ą 0, y además lím f pxq “ xÑ`8 lím gpxq “ 0, entonces xÑ`8 f pxq f 1 pxq “ lím 1 . xÑ`8 gpxq xÑ`8 g pxq lím Demostración. Definiendo las funciones r : r0; a1 q ÝÑ R y s : r0; a1 q ÝÑ R como sp0q “ rp0q “ 0 y como rpyq “ f p y1 q y spyq “ gp y1 q si y ‰ 0, tenemos del teorema 10.14.3 que f 1 p y1 q ´ y12 f 1 p y1 q f 1 pxq r1 pyq rpyq f pxq “ lím “ lím “ lím “ lím “ lím , 1 1 1 xÑ`8 g 1 pxq xÑ`8 gpxq yÑ0` g 1 p q yÑ0` ´ 2 g 1 p q yÑ0` s1 pyq yÑ0` spyq y y y lím quedando así el teorema demostrado. ‚ La demostración del siguiente teorema es similar a la anterior y se dejan los detalles al lector. 10.14.7. Teorema. Si f y g funciones derivables en p´8; aq con a ă 0, y además lím f pxq “ xÑ´8 lím gpxq “ 0, entonces xÑ´8 f pxq f 1 pxq “ lím 1 . xÑ´8 g pxq xÑ´8 gpxq lím 10.14. Formas indeterminadas 257 10.14.8. Definición. Las fórmulas dadas de los teoremas 10.14.3 al 10.14.7 para calcular formas indeterminadas 0{0 se conocen como regla de l’Hospital o regla de l’Hôpital 10.14.9. Definición. Diremos que un límite es de la forma indeterminada 8{8 si está pxq , donde xÑa lím f pxq “ `8 ó xÑa lím f pxq “ ´8, y xÑa lím gpxq “ `8 ó expresado en la forma xÑa lím fgpxq lím gpxq “ ´8. xÑa Veamos que la regla de l’Hospital también sirve para calcular formas indeterminadas 8{8. 1 pxq Si tenemos que lím` fg1 pxq “ L, donde L es un número real, ( lím` f pxq “ `8 ó lím` f pxq “ xÑa xÑa xÑa ´8) y ( lím` gpxq “ `8 ó lím` gpxq “ ´8), entonces para todo ε ą 0, existe un xε ą a tal xÑa xÑa que a ă x ă xε ùñ |f 1 pxq{g 1 pxq ´ L| ă 2ε , f pxq ‰ 0, gpxq ‰ 0 y g 1 pxq ‰ 0. Por el teorema del 1 pyq pxq´f pxε q valor medio de Cauchy existe un y P px; xε q tal que fgpxq´gpx “ fg1 pyq , por lo que si a ă x ă xε , εq entonces ˇ ˇ ˇ f pxq ´ f pxε q ˇ ε ˇ ˇă . ´ L ˇ gpxq ´ gpxε q ˇ 2 Como f pxq ‰ 0 y gpxq ‰ 0, entonces ˇ ˇ ˜ ¸ ˇ f pxq 1 ´ f pxε q ˇ ε ˇ ˇ f pxq ´ Lˇ ă . 10.14.10. ˇ gpx q ε ˇ gpxq 1 ´ ˇ 2 gpxq Ahora, para a ă x ă xε sea hε pxq “ 1´ 1´ f pxε q f pxq gpxε q gpxq y analicemos tres posibles casos, a saber L “ 0, L ą 0 y L ă 0. Si dejamos fijo ε, observamos que hε pxq ÝÑ 1 cuando x ÝÑ a` y de la desigualdad 10.14.10 se obtiene ˇ ˇ ˇ ε ˇ f pxq ˇ ˇ 10.14.11. ˇ gpxq hε pxq ´ Lˇ ă 2 . Si L “ 0, existe un δ P p0; xε ´ aq tal que a ă x ă a ` δ ùñ 1 ´ ε ă hε pxq ă 1 ` ε, por lo que al usar la desigualdad 10.14.11 y tomar ε ă 21 se tiene ˇ ˇ ε ε ε ˇ f pxq ˇ 2 2 2 ˇ ˇă ă ă 1 “ ε, ˇ gpxq ˇ |hε pxq| 1´ε 2 1 pxq pxq por lo que lím` fgpxq “ 0 “ lím` fg1 pxq . xÑa xÑa Si L ą 0, tomemos ε ă mínt L2 , 21 u, de tal manera que L ` 2ε y L ´ 2ε sean positivos. Con ε ε estas condiciones sea δ P p0; xε ´ aq tal que si a ă x ă a ` δ, entonces 1 ´ L´2 ε ă h1ε ă 1 ` L`2 ε 2 2 y al aplicar 10.14.11 tenemos ˙ ´ε ¯ˆ ε ´ 2ε ` L f pxq 2 ´ε ` L “ ´ ´L 1´ ă ă ε 2 L´ 2 hε pxq gpxq ˆ ˙ ´ ¯ ε ε `L ε ă 2 ă ` L 1 ` 2 ε “ ε ` L, hε pxq 2 L` 2 258 10.14. Formas indeterminadas ˇ ˇ 1 pxq ˇ f pxq ˇ pxq de donde se tiene que ˇ gpxq ´ Lˇ ă ε y así lím` fgpxq “ L “ lím` fg1 pxq . xÑa xÑa Si L ă 0, tomemos ε ă mínt´ L2 , 12 u, de tal manera que L ` 2ε y L ´ 2ε sean negativos. Con ε ε estas condiciones sea δ P p0; xε ´aq tal que si a ă x ă a`δ, entonces 1` L`2 ε ă hε1pxq ă 1´ L´2 ε 2 2 y al aplicar 10.14.11 tenemos ˙ ´ε ¯ˆ ε ´ 2ε ` L f pxq 2 ´ε ` L “ ´ ´L 1´ ă ă ε 2 L´ 2 hε pxq gpxq ˆ ˙ ´ ¯ ε ε `L ε ă ` L 1 ` 2 ε “ ε ` L, ă 2 hε pxq 2 L` 2 ˇ ˇ 1 pxq ˇ pxq ˇ pxq de donde se tiene que ˇ fgpxq ´ Lˇ ă ε y así lím` fgpxq “ L “ lím` fg1 pxq . xÑa xÑa Hemos visto así que la regla de l’Hospital también es válida en el caso en que f pxq ÝÑ `8 1 pxq ó f pxq ÝÑ ´8 y gpxq ÝÑ `8 ó gpxq ÝÑ ´8 cuando x ÝÑ a` y además el límite lím` fg1 pxq xÑa es finito. De manera análoga se puede ver que la regla de l’Hospital también es válida en el caso en que f pxq ÝÑ `8 ó f pxq ÝÑ ´8 y gpxq ÝÑ `8 ó gpxq ÝÑ ´8 cuando x ÝÑ a´ 1 pxq y además el límite lím` fg1 pxq es finito. Utilizando estos dos últimos hechos se demuestra xÑa también que la regla de l’Hospital es válida en el caso en que f pxq ÝÑ `8 ó f pxq ÝÑ ´8 1 pxq y gpxq ÝÑ `8 ó gpxq ÝÑ ´8 cuando x ÝÑ a y además el límite lím fg1 pxq es finito. La xÑa demostración de la regla de l’Hospital en los casos en que f pxq ÝÑ `8 ó f pxq ÝÑ ´8 y gpxq ÝÑ `8 ó gpxq ÝÑ ´8 cuando x ÝÑ `8 (o cuando x ÝÑ ´8) y además el límite 1 pxq 1 pxq es finito (o el límite lím fg1 pxq es finito) es análoga a la demostración del teorema lím fg1 pxq xÑ´8 xÑ`8 10.14.6. 1 pxq pxq Veamos qué sucede con el límite lím fgpxq , en el caso en que lím fg1 pxq “ `8, lím f pxq “ `8 xÑβ xÑβ xÑβ y lím gpxq “ `8 (donde β puede representar cualquiera de los símbolos a, a` , a´ , `8 ó ´8 xÑβ 1 1 pxq y a P R). Si lím fg1 pxq “ `8, lím f pxq “ `8 y lím gpxq “ `8, entonces lím fg 1pxq “ 0 por lo pxq xÑβ que lím gpxq xÑβ f pxq xÑβ xÑβ xÑβ pxq “ 0. Como f pxq ÝÑ `8 y gpxq ÝÑ `8 cuando x ÝÑ β, entonces lím fgpxq “ xÑβ ˇ ˇ ˇ f pxq ˇ f 1 pxq lím ˇ gpxq ˇ “ `8. Es decir, la regla de l’Hospital también es válida cuando lím g1 pxq “ `8, xÑβ xÑβ lím f pxq “ `8 y lím gpxq “ `8. De manera similar se puede ver que es válida cuando xÑβ xÑβ 1 pxq lím fg1 pxq xÑβ es `8 ó ´8, lím f pxq es `8 ó ´8 y lím gpxq es `8 ó ´8. xÑβ xÑβ En resumen, tenemos el siguiente teorema que es muy útil para calcular formas indeterminadas 0{0 e 8{8. 10.14.12. Regla de l’Hospital. Para a P R, hagamos que el símbolo β signifique alguno de los símbolos a` , a´ , a, `8 ó ´8. Si f y g son funciones reales de variable real que satisfacen una de las siguientes condiciones: a) lím f pxq “ 0 y lím gpxq “ 0; xÑβ xÑβ b) lím f pxq P t`8, ´8u y lím gpxq P t`8, ´8u; xÑβ xÑβ 10.14. Formas indeterminadas 259 1 pxq y además lím fg1 pxq existe (en el sentido de que puede ser un número real, `8 ó ´8). Entonces xÑβ f 1 pxq f pxq “ lím 1 . xÑβ g pxq xÑβ gpxq lím 10.14.13. Ejemplo. Sea f : R ÝÑ R la función dada por # ´2 e´x si x ą 0 f pxq “ . 0 si x ĺ 0 Demostrar que f es continua en 0 y además f pnq p0q “ 0 para todo n P N. Solución. Es obvio que f es continua en 0 por la izquierda y que la derivada por la izquierda de cualquier orden en 0 es 0. Para ver que f es continua en 0, veamos que f es continua por la derecha en 0, en efecto lím f pxq “ lím` e´x xÑ0` xÑ0 ´2 2 “ lím e´s “ 0. sÑ`8 Demostremos ahora por inducción matemática que para todo n P N 10.14.14. lím` xÑ0 f pxq “ 0. xn Vemos primero que debido a la regla de l’Hospital lím` f 1 pxq “ lím` 10.14.15. xÑ0 xÑ0 f pxq ´ f p0q f pxq “ lím` “ D` f p0q, xÑ0 x x siempre que dicho límite sea un número real, es decir, siempre que D` f p0q exista en R. Por otra parte, aplicando de nuevo la regla de l’Hospital varias veces, tenemos que lím` f 1 pxq “ lím` 2x´3 e´x xÑ0 10.14.16. xÑ0 “ lím 3s sÑ`8 es2 ´2 2 2s3 6s2 “ lím sÑ`8 es2 sÑ`8 2s es2 “ lím 2s3 e´s “ lím “ lím sÑ`8 3 sÑ`8 2s es2 “ 0, de manera que de 10.14.15 y 10.14.16 tenemos que D` f p0q “ 0 y además la fórmula 10.14.14 es válida para n “ 1 y para n “ 3. Aplicando de nuevo la regla de l’Hospital tenemos que lím` xÑ0 f pxq s2 2s ´s2 “ lím “ 0, 2 “ lím 2 ““ lím e 2 s s sÑ`8 2s e sÑ`8 sÑ`8 e x por lo que la fórmula 10.14.14 también es válida para n “ 2. Veamos ahora que si la fórmula 10.14.14 es válida para n igual a un entero N ľ 3 y todos los enteros positivos n ă N , entonces también es válida para n “ N ` 1, en efecto 0 “ lím` xÑ0 f pxq f 1 pxq 2x´3 f pxq 2 f pxq “ lím “ lím “ lím , xN ´1 xÑ0` pN ´ 1qxN ´2 xÑ0` pN ´ 1qxN ´2 N ´ 1 xÑ0` xN `1 260 10.14. Formas indeterminadas f pxq “ 0, terminando así con la demostración de la fórmula 10.14.14. xÑ0 xN `1 ´2 Observemos ahora que para todo n P N y x ą 0 f pnq pxq “ Pn px´1 q e´x , donde Pn es una función polinomial de grado positivo con coeficientes positivos. Sea gn el grado de Pn pzq y mn el coeficiente máximo de Pn pzq. Tenemos que para 0 ă x ă 1 por lo que lím` 0 ĺ f pnq pxq ĺ mn pgn ` 1qx´gn e´x ´2 “ mn pgn ` 1q f pxq , xg n de manera que debido a la fórmula 10.14.14 0 ĺ lím` f pnq pxq ĺ mn pgn ` 1q lím` xÑ0 xÑ0 f pxq “ 0, xg n teniendo así que lím` f pnq pxq “ 0, y si f pnq p0q “ 0, entonces la derivada por la derecha de xÑ0 f pnq evaluada en 0 es 0 pues 0 ĺ lím` xÑ0 f pnq p0 ` xq ´ f pnq p0q f pnq pxq f pxq “ lím` ĺ mn pgn ` 1q lím` gn `1 “ 0, xÑ0 xÑ0 x x x teniendo así que f pnq p0q “ 0, para todo n P N. Ejercicios. 1. Evaluar los límites siguientes: 2x2 ´ 2 , a) lím xÑ´1 x ` 1 3x2 ´ 1 , xÑ`8 2x2 ` 1 e2x ´1 . xÑ0 ex ´1 b) lím 2. Evaluar los límites siguientes: ˆ ˙ 1 1 1 a) lím ´ , b) lím p1 ` hq h , xÑ`8 hÑ0 x x`1 3. Evaluar los límites siguientes: ex ex a) lím ; b) lím n , para n P N; xÑ`8 x xÑ`8 x c) lím x c) lím p1 ` hq h , hÑ0 lnpxq ; xÑ1 1 ´ x c) lím 4. Evaluar los límites siguientes: ? a) nÑ8 lím n n; b) lím xn e´x , para n P N; xÑ0 1 d) lím p1 ` xhq h . hÑ0 d) lím tÑ`8 lnptq . t2 c) lím` xx . xÑ0 Capítulo 11 ELEMENTOS DE GEOMETRÍA 11.1. Introducción En este capítulo estudiaremos las propiedades elementales de la geometría euclidiana basándonos en un conjunto de postulados básicos que supondremos verdaderos. Introduciremos cinco conceptos básicos no definidos, a saber los de punto, recta, plano, espacio y distancia entre dos puntos, además de los conceptos de área y volumen que se establecen en las últimas secciones del capítulo. Se pretende que los postulados sean intuitivamente aceptables de acuerdo a las ideas preconcebidas que pudiera tener el lector de los conceptos básicos. Por punto entenderemos un objeto sin grosor, sin longitud ni anchura pero que está en algún lugar (aun cuando al hacer dibujos, un punto es representado con una bolita con un pequeño grosor, esto es solamente una manera de poder visualizar su localización). Una recta no tiene grosor ni anchura, pero tiene una longitud infinita, no tiene comienzo ni fin y no se interrumpe en ningún lugar, además jamás se enchueca. Un plano es algo que no tiene grosor pero tiene longitud y anchura infinita, además no se dobla ni está pando. El espacio es algo que tiene longitud, anchura y grosor infinito, y representa el universo donde se encuentran todas las cosas materiales. La distancia entre dos puntos dados es algo que nos dice qué tan separados o alejados están dos puntos. Lo anterior no constituyen definiciones, recordemos que son términos no definidos, sólo se intenta de dar una idea de lo que representan. Los postulados que veremos en este capítulo describirán con mayor precisión lo que queremos que represente, sus propiedades y relaciones entre ellos. 11.1.1. Postulado del espacio. El espacio es el conjunto de todos los puntos. Además las rectas y los planos son subconjuntos del espacio; es decir, las rectas y los planos son conjuntos cuyos elementos son puntos. En este capítulo espacio significará espacio de tres dimensiones. Al espacio lo denotaremos con el símbolo E . 11.1.2. Postulado de la distancia. Existe una única función dist : E ˆ E Ñ r0; 8q tal que si P , Q y S son tres puntos cualesquiera del espacio, entonces a) distpP, Qq “ 0 ðñ P “ Q, 261 262 11.1. Introducción b) distpP, Qq “ distpQ, P q, c) distpP, Sq ĺ distpP, Qq ` distpQ, Sq, d) distpP, Qq es la distancia entre P y Q. 11.1.3. Notación. Si A y B son dos puntos, al número distpA, Bq dado en el postulado 11.1.2 lo denotaremos generalmente como AB (aunque también se denota a veces como |AB| o como |A ´ B|). 11.1.4. Postulado de la recta. Toda recta tiene al menos dos puntos diferentes y dados dos puntos diferentes existe solamente una recta a la cual pertenecen. P i PP PP P PP B PrP P PPA r P PP P PP q 11.1.5. Notación. Dados dos puntos diferentes A y B, a la única recta a la cual pertenecen ÐÑ estos puntos se le denota como AB. ÐÑ ÐÑ 11.1.6. Postulado de la regla. Dada una recta AB, existe una única biyección de AB en R de tal manera que: ÐÑ a) Si P, Q P AB, entonces P Q “ |x ´ y|, donde x e y son los números que la biyección le asigna a P y Q respectivamente. b) La biyección le hace corresponder al punto A el cero y al punto B un número positivo. pr ą 0q Br r Pr x Ar 0 Q r y - 11.1.7. Definición. A cualquier biyección como la dada en el postulado de la regla se le ÐÑ ÐÑ llama sistema de coordenadas de AB. Si P P AB, entonces al número x que le corresponde al punto P se le llama la coordenada de P (con respecto a tal sistema de coordenadas). 11.2. Segmentos y rayos 11.2. 263 Segmentos y rayos 11.2.1. Definición. Decimos que un punto B está entre A y C cuando se cumplen las siguientes dos propiedades: a) A, B y C están en una misma recta y son diferentes, b) AB ` BC “ AC. rP PA PP PP B PrP P PPCr P PP P PP El siguiente teorema ilustra el hecho de que la definición anterior describe lo que entendemos por la palabra «entre». 11.2.2. Teorema. Sean A, B y C tres puntos en una recta y sean x, y y z sus coordenadas respectivamente (con respecto a un sistema de coordenadas). El punto B está entre A y C si y sólo si x ă y ă z ó x ą y ą z. Demostración. Si B está entre A y C, entonces AB ` BC “ AC por lo que debido al postulado de la regla 11.1.6 tenemos |x ´ y| ` |y ´ z| “ |x ´ z| “ |px ´ yq ` py ´ zq|, pero una expresión de la forma |a| ` |b| “ |a ` b| implica que a y b son del mismo signo o que alguno de los dos es cero (ver todas las posibilidades). Por lo tanto px ´ yq e py ´ zq tienen el mismo signo o alguno de los dos es cero. Ahora, si x ´ y “ 0, entonces x “ y, por lo que A “ B; similarmente si y ´ z “ 0, entonces B “ C. Pero si B está entre A y C, entonces A, B y C son diferentes por lo que deben tener diferentes coordenadas. Así tenemos que px ´ yq e py ´ zq son del mismo signo, es decir (x ´ y ą 0 e y ´ z ą 0) ó (x ´ y ă 0 e y ´ z ă 0) pero esto significa que (x ą y e y ą z) ó (x ă y e y ă z), es decir x ą y ą z ó x ă y ă z. Ahora, si x ą y ą z ó x ă y ă z, entonces los puntos A,B y C son diferentes y además x ă y ă z ñ z ´ y ą 0, y ´ x ą 0 y z ´ x ą 0 ñ AB ` BC “ CB ` BA “ |z ´ y| ` |y ´ x| “ pz ´ yq ` py ´ xq “ z ´ x “ |z ´ x| “ CA “ AC. Ahora, también tenemos que x ą y ą z ñ x ´ y ą 0, y ´ z ą 0 y x ´ z ą 0 ñ AB ` BC “ |x ´ y| ` |y ´ z| “ px ´ yq ` py ´ zq “ x ´ z “ |x ´ z| “ AC. ‚ 11.2.3. Definición. Dados dos puntos diferentes A y B, definimos el segmento AB como el conjunto de los puntos C tales que C “ A, C “ B ó C está entre A y B. Ar PP PP P PP P PP PB r 11.2.4. Definición. Si A y B son dos puntos diferentes, entonces al número AB (la distancia entre A y B) se le llama la longitud del segmento AB y a los puntos A y B se les llama extremos del segmento AB. 11.2.5. Definición. Dos segmentos son congruentes si tienen la misma longitud. 264 11.2. Segmentos y rayos PP PP PP PP P ÝÝÑ 11.2.6. Definición. Si A y B son dos puntos diferentes, entonces definimos el rayo AB como el conjunto de todos los puntos C tales que C P AB ó B está entre A y C. Ar PP PPB r P PP P PP P q P ÝÝÑ ÝÝÑ 11.2.7. Definición. Dado un rayo AB, al punto A se le llama extremo del rayo AB. ÝÝÑ ÝÝÑ 11.2.8. Definición. Si A está entre B y C, entonces a los rayos AB y AC se les llama rayos opuestos. Ar C r ) Br 1 ÝÝÑ 11.2.9. Teorema de localización de puntos. Sea AB un rayo y x ą 0. Existe solamente ÝÝÑ un punto P P AB, tal que AP “ x. Br r Pr x Ar 0 Demostración. Por el postulado de la regla 11.1.6 tenemos un sistema de coordenadas en ÐÑ AB tal que la coordenada de A es 0 y la de B es un número positivo r. Sea P el punto cuya ÝÝÑ coordenada es x. Tenemos que AP “ |0 ´ x| “ x. Veamos ahora que P P AB. Tenemos por la propiedad de tricotomía que: aq x ă r, bq x “ r ó cq x ą r. 11.2. Segmentos y rayos 265 Por el teorema 11.2.2 y por definición de segmento AB tenemos que en los casos a) y b) se tiene que P P AB y en el caso c) se tiene que B está entre A y P , por lo que en general ÝÝÑ ÝÝÑ P P AB. Si P 1 P AB es diferente de P , entonces su coordenada x1 es diferente de x y además por el teorema 11.2.2 anterior y definición de rayo, tenemos que 0 ĺ x1 ĺ r ó 0 ă r ă x1 , es decir x1 ľ 0, por lo que AP 1 “ |0 ´ x1 | “ x1 ‰ x “ AP , por lo que P es el único punto en ÝÝÑ AB tal que AP “ x. ‚ ÐÑ 11.2.10. Teorema. Sea AB una recta en la cual está definido un sistema de coordenadas ÝÝÑ tal que la coordenada de A es cero y la de B es un número positivo. El punto P P AB si y sólo si la coordenada de P es AP . ÝÝÑ Demostración. Si P P AB, por el teorema 11.2.2 la coordenada x de P es mayor o igual que 0, por lo que x “ |0 ´ x| “ AP . Ahora, si la coordenada de P es AP tenemos que P tiene ÝÝÑ coordenada no negativa por lo que por el teorema 11.2.2 y la definición de rayo AB tenemos ÝÝÑ que P P AB. ‚ 11.2.11. Definición. Sea A ‰ B. Decimos que P es el punto medio de AB, si P está entre A y B y AP “ P B. Ar Pr Br 11.2.12. Teorema del punto medio. Todo segmento tiene únicamente un punto medio. ÝÝÑ Demostración. Sea AB un segmento. Tomemos como M el punto en AB tal que AM “ AB 2 (esto es posible debido al teorema de localización de puntos). Si tomamos el sistema de coordenadas cuya coordenada de A es 0 la de B es positiva, entonces por el teorema 11.2.10 la coordenada de M es AB . Ahora, la distancia entre B y M es AB ´ AB “ AB , por lo que 2 2 2 1 AM “ M B, es decir M es un punto medio de AB. Ahora, si M es también un punto medio de AB, entonces debe cumplir las siguientes igualdades AM 1 ` M 1 B “ AB y AM 1 “ M 1 B, y de acuerdo con el teorema de localización de puntos lo que nos lleva a que AM 1 “ AB 2 1 P “ P . Es decir, P es el único punto medio de AB. ‚ 11.2.13. Definición. Si P es el punto medio de un segmento, decimos que P biseca al segmento. 11.2.14. Definición. Cuando algunos puntos están todos en una misma recta decimos que están alineados o que son colineales. ÝÝÑ 11.2.15. Definición. A un conjunto de la forma ABztAu, donde A y B son dos puntos diferentes, se le llama semirrecta, y en tal caso al punto A se le llama extremo de la semirrecta. Observemos que, a diferencia de los rayos, el extremo de una semirrecta no pertenece a la semirrecta. 266 11.2. Segmentos y rayos Ab PP PPB r P PP ÝÝÑ PP semirrecta ABztAu PP q P Ejercicios. 1. Dados dos puntos distintos P y Q, demostrar que existe al menos un punto entre P y Q. 2. Demostrar que dados tres puntos diferentes en una recta, uno y sólo uno de ellos está entre los otros dos. 3. Demostrar que si A y B son dos puntos diferentes en una recta l y A1 es un punto en una recta l1 , entonces existe un punto B 1 P l1 tal que AB “ A1 B 1 . 4. Demostrar que si A, B y C son tres puntos diferentes en una recta l tales que B está entre A y C, y si A1 , B 1 y C 1 son tres puntos diferentes en una recta l1 tales que B 1 está entre A1 y C 1 , y además AB “ A1 B 1 y BC “ B 1 C 1 , entonces AC “ A1 C 1 . 11.3. Planos 11.3. 267 Planos 11.3.1. Postulado. a) A todo plano pertenecen al menos tres puntos diferentes que no están alineados. b) Al espacio pertenecen al menos cuatro puntos diferentes que no están en un mismo plano. 11.3.2. Teorema. Si dos rectas diferentes tienen intersección no vacía, entonces la intersección tiene solamente un elemento. PP i P : PPr PPP PP PP PP 9 PP PP q PP PP P Demostración. Si la intersección no tiene sólo un elemento, entonces o es vacía (lo cual contradice nuestra hipótesis) o tiene al menos dos elementos diferentes A, B; en cuyo caso ÐÑ por el postulado de la recta, ambas rectas deben ser AB, lo cual contradice el hecho de que las rectas son diferentes. Por lo tanto la intersección tiene sólo un punto. ‚ 11.3.3. Postulado del plano. Tres puntos cualesquiera están en algún plano y tres puntos cualesquiera no alineados están solamente en un plano. 11.3.4. Postulado de la intersección de planos. Si dos planos diferentes se intersecan, entonces su intersección es una recta. @ @ : @ @ @ @ @ @ @ 9 @ @ 11.3.5. Teorema de llaneza. Si dos puntos diferentes de una recta pertenecen a un plano, entonces la recta a la que pertenecen los puntos está incluida en el plano. ÐÑ Demostración. Sean A y B dos puntos diferentes en un plano Π, y sea C P AB. Si C no estuviera en Π, entonces, por el postulado del plano 11.3.3, existiría un plano Π0 ‰ Π tal que A, B, C P Π0 , pero por el postulado de la intersección de planos 11.3.4 tendríamos que ÐÑ Π XΠ0 sería una recta, y debido al postulado de la recta 11.1.4 Π XΠ0 “ AB, contradiciendo ÐÑ el hecho de que C ‰ Π. Por lo tanto C P Π, es decir AB Ă Π. ‚ 268 11.3. Planos Los dos teoremas siguientes se deducen directamente del postulado del plano 11.3.3 del teorema de llaneza 11.3.5 y del postulado 11.1.4. Dejamos al lector los detalles de las demostraciones. 11.3.6. Teorema. Dada una recta y un punto que no está en ella, existe solamente un plano al cual pertenece el punto y en el cual la recta está incluida. 11.3.7. Teorema. Dadas dos rectas diferentes que se intersecan, existe un único plano en el cual están incluidas. Ejercicios. 1. Demostrar los teoremas 11.3.6 y 11.3.7. 11.4. Conjuntos convexos 11.4. 269 Conjuntos convexos El concepto de convexidad tiene muchas aplicaciones en diferentes disciplinas como la Economía, Programación Lineal, Investigación de Operaciones y la Teoría de Juegos por mencionar algunas. En esta sección manejaremos tal concepto restringiéndonos al espacio de 3 dimensiones. 11.4.1. Definición. Un conjunto de puntos se dice que es convexo si para cada dos puntos diferentes P y Q del conjunto se tiene que el segmento P Q está incluido en el conjunto. conjunto no convexo conjunto convexo 11.4.2. Postulado de la separación del plano. Sean l una recta y α un plano en el cual está incluida l. El conjunto de puntos del plano α que no están en la recta l son la unión de dos conjuntos Λ1 y Λ2 tales que: a) Los dos conjuntos Λ1 y Λ2 son convexos. b) Si P P Λ1 y Q P Λ2 , entonces P Q interseca a la recta. En geometría se suele usar la palabra cortar como sinónimo de intersecar. 11.4.3. Definición. En el postulado de la separación del plano los conjuntos Λ1 y Λ2 se llaman lados de la recta l. Si P P Λ1 y Q P Λ2 , decimos que P y Q están en lados opuestos de la recta l, también se dice que Λ1 y Λ2 son lados opuestos (de una recta). A la recta l se le llama arista o borde de cada uno de los conjuntos Λ1 , Λ2 , Λ1 Y l y Λ2 Y l. 11.4.4. Definición. Si Λ es un lado de una recta l, diremos que es un semiplano y que Λ Y l es un semiplano cerrado. 11.4.5. Teorema. Si Λ1 y Λ2 son lados opuestos de una recta l, entonces Λ1 X Λ2 “ ∅. ÐÝÑ Demostración. Sean P P Λ1 , Q P l y M el punto medio de P Q. La recta P M corta a l solamente en Q, por lo que P M no corta l, pero debido al postulado de la separación del plano M P Λ1 y como P M no corta l, entonces P R Λ2 . Por lo tanto Λ1 X Λ2 “ ∅. ‚ 11.4.6. Postulado de la separación del espacio. Dado un plano γ, el conjunto de puntos del espacio que no están en γ es la unión de dos conjuntos G1 y G2 tales que: a) Los dos conjuntos G1 y G2 son convexos. b) Si P P G1 y Q P G2 , entonces P Q corta al plano γ. 270 11.4. Conjuntos convexos 11.4.7. Definición. Los dos conjuntos G1 y G2 descritos en el postulado de la separación del espacio se llaman lados del plano γ. Si P P G1 y Q P G2 , decimos que P y Q están en lados opuestos del plano γ, también se dice que G1 y G2 son lados opuestos (de un plano). Al plano γ se le llama cara de cada uno de los conjuntos G1 , G2 , G1 Y l y G2 Y l. 11.4.8. Definición. Si G es un lado de un plano γ, diremos que G es un semiespacio y que G Y γ es un semiespacio cerrado. Los conceptos de convexidad se generalizan a espacios de mayor dimensión que 3, introduciendo el concepto de hiperplano, lo cual explica la gran cantidad de aplicaciones que tiene el postulado de la separación del espacio. Ejercicios. 1. Demostrar que los planos, rectas, rayos, segmentos e intersecciones de conjuntos convexos son conjuntos convexos. 2. Demostrar que cualquier semiplano cerrado es un conjunto convexo. 3. Demostrar que si A, B y C son tres puntos diferentes y no alineados, y l es una recta incluida en el plano en el cual están A, B y C, tal que la recta l interseca al segmento AB en un punto diferente de A y de B, entonces l interseca al segmento AC o al segmento BC. 4. ¿La unión de dos conjuntos convexos es siempre un conjunto convexo? 11.5. Ángulos y triángulos 11.5. 271 Ángulos y triángulos ÝÝÑ ÝÝÑ 11.5.1. Definición. A la unión de dos rayos de la forma AB y AC que no están incluidos ÝÝÑ ÝÝÑ en una misma recta se le llama ángulo. Al ángulo que es la unión de dos rayos AB y AC se le denota indistintamente por =BAC o por =CAB. Al punto A de un ángulo =BAC se le ÝÝÑ ÝÝÑ llama vértice del ángulo y a los rayos AB y AC se les llama lados del ángulo. A H Br 1 HH H HH Cr H HH j H Dado un punto A podemos observar que hay muchos ángulos cuyo vértice es A, sin embargo el símbolo =A siempre lo usaremos para que denote algún ángulo cuyo vértice es A. 11.5.2. Definición. Sean A, B y C tres puntos no alineados. A la unión de los segmentos AB, BC y AC se le llama triángulo. A tal triángulo se le denota como ŸABC. A los segmentos AB, BC y AC se les llama lados y a los puntos A, B y C se les llama vértices del triángulo ŸABC. Cr A A r A A A A Ar B 11.5.3. Definición. Sea =ABC un ángulo. Definimos el interior del =ABC como el conjunto de todos los puntos del plano en el cual está incluido el ángulo tales que estén en el ÐÑ ÐÑ mismo lado que C de la recta AB y en el mismo lado que A de la recta BC. Al conjunto de todos los puntos del plano que no están en el ángulo ni en su interior se le llama exterior del ángulo. Ahora definiremos lo que es el interior y el exterior de un triángulo. 11.5.4. Definición. Sea ŸABC un triángulo. Al conjunto de todos los puntos del plano en el cual está incluido el triángulo tales que están en los interiores de los ángulos =ABC, =BAC y =ACB se le llama interior del ŸABC. El exterior del ŸABC es el conjunto de todos los puntos del plano que no están en el triángulo ŸABC ni en su interior. 11.5.5. Definición. A la unión de un triángulo con su interior se le llama región triangular. El triángulo será el borde de la región triangular y el interior de él también será el interior de la región triangular correspondiente. 272 11.6. 11.6. Circunferencias Circunferencias 11.6.1. Definición. Sea O un punto en un plano y r un número positivo. Al conjunto de los puntos del plano que están a una distancia r de O lo llamamos circunferencia. Al punto O se le llama centro de la circunferencia y al número r se le llama el radio de la circunferencia. O r 11.6.2. Definición. Dada una circunferencia en un plano. Al conjunto de los puntos del plano cuya distancia al centro de la circunferencia es menor que el radio se le llama interior de la circunferencia. Al conjunto de puntos del plano cuya distancia al centro de la circunferencia es mayor que el radio se le llama exterior de la circunfecircunferencia con centro rencia. A la unión de una circunferencia con su en O y radio r interior se le llama región circular o círculo. El borde de la región circular es la circunferencia. El interior de la región circular es el interior de la circunferencia. Definimos el diámetro de la circunferencia (y de la región circular correspondiente) como el doble de su radio. 11.6.3. Definición. Se dice que dos circunferencias son congruentes si tienen el mismo radio. '$ '$ &% &% circunferencias congruentes 11.7. Longitud de arco 11.7. 273 Longitud de arco Comenzaremos por definir lo que es una poligonal. Lo que comúnmente se llama «línea quebrada» en este texto lo llamaremos poligonal. PP PP PP P PP ``` ``` @ ``` @ ` @ @ @ @ @ @ @ Más precisamente tenemos la siguiente definición. n`1 11.7.1. Definición. Sea n un entero positivo y pPk qk“1 una sucesión finita de puntos tales que si i ‰ j, entonces Pi P i`1 y Pj P j`1 no se intersecan más que posiblemente en un punto. A la unión de los segmentos Pk P k`1 donde k P Jn “ t1, 2, . . . , nu se le llama poligonal. Si P1 “ Pn`1 diremos que la poligonal es una poligonal cerrada. Si P1 ‰ Pn`1 , diremos que n ř los puntos P1 y Pn`1 son los extremos de la poligonal. Al número Pk Pk`1 se le llama la k“1 longitud de la poligonal. El punto Pj (con 1 ă j ă n ` 1) es un vértice de la poligonal si no es extremo y no está entre Pj´1 y Pj`1 . En el caso de que la poligonal sea cerrada, el punto P1 (que es igual a Pn`1 ) es también un vértice si no está entre Pn y P2 . Si los puntos Pj y Pj`1 son vértices o extremos de la poligonal, al segmento Pj P j`1 lo llamamos lado de la poligonal. 11.7.2. Definición. Una poligonal en la cual sus vértices son extremos solamente de dos lados y en la cual dos lados diferentes no se cortan más que posiblemente en un extremo común se llama poligonal simple. Una poligonal que es una poligonal simple y es poligonal cerrada se llama polígono. poligonal cerrada simple poligonal simple con extremos 11.7.3. Definición. Decimos que un polígono está inscrito en una circunferencia si sus vértices pertenecen a la circunferencia. Procedamos ahora a definir la longitud de un circunferencia. 11.7.4. Definición. Sea c una circunferencia. Cuando exista un número real x tal que x “ supts : s es la poligonal cerrada inscrita en una circunferencia 274 11.7. Longitud de arco longitud de algún polígono inscrito en c}, a tal número lo llamamos la longitud o perímetro de la circunferencia c. 11.7.5. Postulado. Siempre existe la longitud de cualquier circunferencia dada. El postulado anterior nos permite hablar libremente de la longitud de cualquier circunferencia sin preocuparnos de su existencia. Definamos ahora los conceptos de arcos de circunferencia y sus longitudes. B O 11.7.6. Definición. En un plano sea c una circunferencia con centro en O. Sean A y B dos puntos en la circunferencia tales que el punto medio ÐÑ de AB es el centro O de la circunferencia y Λ uno de los lados de AB en el plano. Al conjunto cuyos elementos son A, B y todos los elementos de c que están en Λ se le llama media circunferencia y los puntos A y B son los extremos de la media circunferencia. Al conjunto de puntos de una media circunferencia diferentes de sus extremos le llamaremos semicircunferencia. A 11.7.7. Definición. Sea c una circunferencia con centro en O. Sean A y B dos B B puntos en c tales que A, B y O no están O O alineados. Definimos el arco menor de A A c con extremos A y B como el conjunarco menor de arco mayor de to cuyos elementos son A, B y todos los circunferencia circunferencia elementos de c que están en el interior del =AOB. Asimismo definimos el arco mayor de c con extremos A y B como el conjunto cuyos elementos son los puntos A, B y todos los elementos de c que están en el exterior del =AOB. 11.7.8. Definición. Cualquier arco mayor, arco menor o media circunferencia se llama arco de circunferencia. El centro de un arco de una circunferencia es el centro de la circunferencia. Ŋ denotará siempre un arco de circunferencia con extremos A y B. Si se El símbolo AB Ŕ para denotar al arco de circunferencia con quiere ser más específico se usará el símbolo AXB extremos A y B donde X es un elemento del arco diferente de A y de B. Definamos ahora el concepto de longitud de arco de circunferencia. Ŋ un arco de circunferencia. Defini11.7.9. Definición. Sea AB Ŋ como mos la longitud del arco AB A B Ŋ :“ supts : s es la longitud de una poligonal simple `AB con extremos A y B, cuyos vértices están en el Ŋ arco ABu. Ŋ siempre existe Debido al axioma del supremo 7.1.17 y al postulado 11.7.5, el valor de `AB pues la longitud de cualquier poligonal simple cuyos vértices están en la circunferencia de la Ŋ es subconjunto, está acotada superiormente por la longitud de la circunferencia. cual AB 11.7.10. Teorema. Todo arco de circunferencia tiene una longitud mayor que cero. 11.7. Longitud de arco 275 Ŋ es un arco de circunferencia, entonces por definición su longitud Demostración. Si AB debe ser mayor o igual que AB. ‚ 11.7.11. Postulado de adición de arcos. Sea c una circunferencia cuya longitud es x. Ŋ es una media circunferencia incluida en a) Si AB c, entonces Ŋ “ x. `AB 2 B A D Ŋ y BD Ŋ son dos arcos diferentes incluidos b) Si AB en c cuya intersección es tBu y cuya unión es un Ŋ incluido en c, entonces arco AD Ŋ “ `AB Ŋ ` `BD. Ŋ `AD 11.7.12. Postulado. Todas las circunferencias de radio 1 tienen la misma longitud. 11.7.13. Definición. Definimos el número π (léase pi) como la mitad de la longitud de cualquier circunferencia de radio 1. Es decir, π es la longitud de una media circunferencia incluida en una circunferencia de radio 1. «Καὶ ἐποίησεν τὴν θάλασσαν χυτήν, πήχεων δέκα τὴν διαμέτρησιν, στρογγύλην κυκλόθεν, καὶ πήχεων πέντε τὸ ὕψος καὶ τὸ κύκλωμα πήχεων τριάκοντα.» «Hizo también el mar de metal fundido, que medía unos cinco metros de diámetro, era completamente redondo, de unos dos metros y medio de alto y unos quince de perímetro, medidos a cordel» (Segundo Libro de las Crónicas 4.2). 276 11.8. 11.8. Medidas de ángulos Medidas de ángulos Para definir el concepto de medida de un ángulo se utilizarán los resultados de la sección 11.7. 11.8.1. Definición. Un ángulo central de una circunferencia es un ángulo cuyo vértice es el centro de la circunferencia. ángulo central de la circunferencia 11.8.2. Definición. Decimos que un ángulo intercepta un arco si: a) los extremos del arco están en el ángulo; arco interceptado por el ángulo b) todos los otros puntos del arco están en el interior del ángulo, y c) a cada lado del ángulo pertenece un extremo del arco. Ŋ corresponde al 11.8.3. Definición. El arco menor AB ángulo =DOC si: Ŋ está incluido en una circunferencia de a) el arco AB radio 1; 1 b) el ángulo =DOC es un ángulo central de tal circunferencia, y arco correspondiente al ángulo Ŋ c) el ángulo =DOC intercepta al arco AB. 11.8. Medidas de ángulos 277 11.8.4. Definición. Dos arcos incluidos en circunferencias congruentes son congruentes si tienen la misma longitud. 11.8.5. Definición. La medida de un ángulo =DOC, denotada |=DOC| ó >DOC es la longitud de su arco correspondiente. Muchos autores llaman ángulo a lo que nosotros llamamos medida del ángulo, otros (desafortunadamente) llaman ángulo indistintamente a lo que nosotros llamamos ángulo y a lo que llamamos medida del ángulo y utilizan la notación =DOC tanto para denotar lo que para nosotros es =DOC como para denotar >DOC. Si bien es cierto que son conceptos muy relacionados, son cosas diferentes (uno es un conjunto de puntos y el otro es un número). En este libro haremos siempre la diferencia entre lo que definimos como ángulo y su medida, sin embargo el lector debe ser capaz de comprender y adaptarse a la terminología de otros textos, aunque es deseable que tales textos conserven una estructura lógica que no sea contradictoria. Observemos que así como medimos segmentos con una regla que es imitación de una recta, también medimos ángulos con un transportador que es una media circunferencia (o en algunos casos la circunferencia completa). El transportador es una imitación de una circunferencia graduada de radio 1 que mide un ángulo por medio de su arco correspondiente. Usualmente se toma la medición de los ángulos en grados. Definamos pues lo que es un grado. 11.8.6. Definición. Un grado está definido como π{6 “ π{4 es un grado, lo cual significa que 30 45 π . 180 Es decir, π 180 “ 2π 360 “ π{2 90 “ π{3 60 “ π “ 180 grados, 2π “ 360 grados, π 2 π 3 π 6 π 4 “ 90 grados, “ 60 grados, “ 30 grados y “ 45 grados. Si x P R, entonces x˝ denota x grados, así por ejemplo y “ 1˝ . π 180 π 2 “ 90˝ , π 3 “ 60˝ , π 6 “ 30˝ , π 4 “ 45˝ 11.8.7. Teorema. La medida de un ángulo es un número real mayor que 0 y menor que π. Demostración. Del teorema 11.7.10 y la definición de medida de ángulo se deduce que la medida de un ángulo es mayor que 0. Sea =ABC un ángulo. Por el teorema de localización de ÝÝÑ ÝÝÑ ÝÝÑ puntos podemos tomar A1 P BA, C 1 P BC y D en el rayo opuesto a BA tales que BA1 “ BC 1 1C 1 y C 1 D los arcos correspondientes a los ángulos =ABC y Ő Ŋ “ BD “ 1. Sean ahora A 1 1 Dq es una media circunferencia de radio 1, por Ő =CBD respectivamente. Como pA C 1 qY pCŊ el postulado de adición de arcos y la definción de π tenemos que 1 C 1 “ `ppA 1 C 1 q Y pC 1 Dqq ´ `C 1 D “ π ´ `C 1 D. Ő Ő Ŋ Ŋ Ŋ >ABC “ `A 1 D ą 0, tenemos que >ABC ă π. Pero como `CŊ ‚ ÝÝÑ 11.8.8. Postulado de construcción de ángulos. Sea AB un rayo incluido en la arista de ÝÑ un semiplano Λ. Para cada número r entre 0 y π existe únicamente un rayo AP , con P P Λ, 278 11.8. Medidas de ángulos tal que >P AB “ r. 11.8.9. Teorema de adición de ángulos. Si D está en el interior del =BAC, entonces >BAC “ >BAD ` >DAC. A X Br 1 XXX HH D rX HHXX z H r XXX HH C HH j Demostración. La demostración se sigue inmediatamente del postulado de adición de arcos 11.7.11 y de la definición de medida de ángulo. ‚ ÝÝÑ ÝÝÑ ÝÝÑ 11.8.10. Definición. Si AB y AD son rayos opuestos, y AC es otro rayo decimos que los ángulos =BAC y =CAD forman un par lineal. : D r A r @ B r @ 9 r @C @ @ R @ 11.8.11. Definición. Dos ángulos son suplementarios si la suma de sus medidas es π. Además se dice que uno es suplemento del otro. 11.8.12. Definición. Dos ángulos son complementarios si la suma de sus medidas es π2 . Además se dice que uno es complemento del otro. 11.8.13. Teorema del suplemento o del par lineal. Si dos ángulos forman un par lineal entonces son suplementarios. Demostración. Al igual que en el teorema 11.8.9 la demostración se sigue del postulado de adición de arcos 11.7.11. ‚ 11.8.14. Definición. Un ángulo recto es un ángulo cuya medida es π2 , es decir cuya medida es de 90˝ . ángulo recto C C C C CW : ÝÝÑ ÝÝÑ 11.8.15. Definición. Si =BAC es recto, entonces decimos que los rayos AB y AC son ÝÝÑ ÝÝÑ perpendiculares (en A) y a tal hecho lo denotamos como AB K AC. De manera más 11.8. Medidas de ángulos 279 ÐÑ general, si l1 es una recta, rayo o segmento tal que A P l1 Ă AB y l2 es una recta, rayo o ÐÑ segmento tal que A P l2 Ă AC, entonces decimos que l1 es perpendicular a l2 o que l1 y l2 son perpendiculares y lo denotamos como l1 K l2 . 11.8.16. Definición. Dos ángulos que tienen la misma medida se dice que son congruentes, también se dice que uno es congruente con el otro. Observemos que estrictamente hablando no es lo mismo que dos ángulos sean congruentes a que sean iguales. Podemos tener dos ángulos diferentes que tengan la misma medida (vistos éstos como la unión de dos rayos). Al igual que hacemos la distinción entre el concepto de ángulo y el de medida de ángulo, también haremos la distinción entre congruencia e igualdad de ángulos. Denotaremos al hecho de que dos ángulos =ABC y =DEF sean congruentes como =ABC – =DEF, lo cual significa >ABC “ >DEF. Podemos ver que la relación de congruencia es una relación de equivalencia, es decir es reflexiva, simétrica y transitiva. ÝÝÑ 11.8.17. Definición. Dos ángulos =ABC y =DBE son opuestos por el vértice si BD es opuesto a un lado de =ABC y el otro lado de =DBE es opuesto al otro lado de =ABC. I @ rE : @ D r @ @B r @ Ar @ 9 r @C @ @ R @ 11.8.18. Teorema de los ángulos opuestos por el vértice. Dos ángulos opuestos por el vértice son congruentes. Demostración. Sean =CBD y =ABE dos ángulos opuestos por el vértice, sin pérdida ÝÝÑ ÝÝÑ ÝÝÑ ÝÝÑ de generalidad supongamos que BA y BD son opuestos, y BC y BE son opuestos. Por el teorema del suplemento tenemos que >ABC ` >CBD “ π >ABC ` >ABE “ π, de donde >CBE “ π ´ >ABC “ >ABE, por lo que los ángulos opuestos por el vértice =CBD y =ABE son congruentes. ‚ Ejercicios. 1. Demostrar el siguiente teorema: Si la unión de dos rectas que se cortan incluye un ángulo recto, entonces incluye a cuatro ángulos rectos. 280 11.9. Congruencia de triángulos 11.9. Congruencia de triángulos Supongamos que tenemos los triángulos ŸABC y ŸDEF y asignamos las siguientes biyecciones entre los vértices de ŸABC y los de ŸDEF de la siguiente forma A ÞÑ D, B ÞÑ E y C ÞÑ F. A tal biyección la llamaremos correspondencia entre los ángulos de ambos triángulos y la denotaremos por ABC ÐÑ DEF. Similarmente ABC ÐÑ DEF define una biyección entre los lados del ŸABC y los del ŸDEF de la forma AB ÞÑ DE, BC ÞÑ EF y AC ÞÑ DF ; a la cual llamaremos correspondencia entre lados. Así decimos por ejemplo que A y D son correspondientes, los ángulos =CAB y =F DE son correspondientes y que los lados AC y DE son correspondientes de acuerdo a la correspondencia ABC ÐÑ DEF. 11.9.1. Definición. Dados dos triángulos ŸABC y ŸDEF . Decimos que la correspondencia ABC ÐÑ DEF es una congruencia si cualesquiera dos ángulos correspondientes son congruentes y cualesquiera dos lados correspondientes son congruentes. Más precisamente ABC ÐÑ DEF es una congruencia si =BAC – =EDF, AB – DE, =ABC – =DEF, BC – EF y =ACB – =DF E AC – DF . Al hecho de que ABC ÐÑ DEF sea una congruencia lo denotamos así ABC – DEF. 11.9.2. Definición. Decimos que dos triángulos t1 y t2 son congruentes (denotado t1 – t2 ) si existe una correspondencia entre los vértices del primero y del segundo que sea una congruencia. 11.9.3. Definición. Decimos que un lado de un triángulo está comprendido por los ángulos cuyos vértices son extremos del lado. Un ángulo de un triángulo está comprendido por los 11.9. Congruencia de triángulos 281 lados del triángulo que tienen como extremo común al vértice del ángulo. Por ejemplo, en un ŸABC, el ángulo =ABC está comprendido por AB y por BC, y el lado AB está comprendido por =BAC y por =ABC. 11.9.4. Definición. En un triángulo, si un ángulo dado está comprendido por dos lados, al otro lado se le llama lado opuesto al ángulo dado. Similarmente, si un lado dado está comprendido por dos ángulos, al otro ángulo se le llama ángulo opuesto al lado dado. Por ejemplo en el ŸABC, AC es el lado opuesto a =ABC y el lado AB es opuesto al ángulo =ACB. Un ángulo y un lado de un triángulo que no son opuestos se dice que son adyacentes o que uno es adyacente al otro. Se definirá a continuación el significado general de que dos subconjuntos del espacio sean congruentes. 11.9.5. Definición. Dos subconjuntos del espacio S1 y S2 son congruentes si existe una correspondencia biunívoca f : S1 ÝÑ S2 entre S1 y S2 tal que para cualesquiera dos puntos P y Q de S1 se tiene que la distancia entre P y Q es igual a la distancia entre f pP q y f pQq. A una correspondencia como la anterior se le llama isometría. Al hecho de que S1 y S2 sean congruentes se le denota así S1 – S2 . Observemos que esta definición de congruencia es una generalización de las otras definiciones de congruencia dadas anteriormente para segmentos, círculos, arcos, ángulos y triángulos. 282 11.10. Postulados y teoremas de congruencia de triángulos 11.10. Postulados y teoremas de congruencia de triángulos Tenemos a continuación los siguientes tipos de correspondencias. 11.10.1. Definición. Dada una correspondencia ABC ÐÑ DEF entre dos triángulos decimos que es una correspondencia lado-ángulo-lado o abreviadamente LAL si dos lados del ŸABC y el ángulo comprendido entre ellos son congruentes con las partes correspondientes del ŸDEF . 11.10.2. Definición. Dada una correspondencia ABC ÐÑ DEF entre dos triángulos decimos que es una correspondencia ángulo-lado-ángulo o abreviadamente ALA si dos ángulos del ŸABC y el lado comprendido entre ellos son congruentes con las partes correspondientes del ŸDEF . 11.10.3. Definición. Dada una correspondencia ABC ÐÑ DEF entre dos triángulos decimos que es una correspondencia lado-lado-lado o abreviadamente LLL si los lados correspondientes son congruentes. Con estas definiciones estamos listos para enunciar los siguientes postulados y teoremas fundamentales de la trigonometría. 11.10.4. Postulado LAL. Toda correspondencia LAL es una congruencia. 11.10.5. Teorema ALA. Toda correspondencia ALA es una congruencia. Demostración. Sea ABC ÐÑ DEF una correspondencia ALA. Por el teorema de locaÝÝÑ lización de puntos, existe un punto G P AB tal que AG “ DE. Ahora, por el postulado LAL tenemos que AGC – DEF , por lo que >ACG “ >DF E, pero >DF E “ >ACB, ÐÑ por lo que >ACB “ >ACG. Ahora, B y G están del mismo lado de AC por lo que debido ÝÝÑ al postulado de construcción de ángulos tenemos que =ACB “ =ACG, es decir G P CB, ÝÝÑ pero como también G P AB tenemos, debido a que si dos rectas diferentes se intersecan su intersección tiene solamente un elemento (teorema 11.3.2), obteniéndose así que G “ B, pero como AGC – DEF , entonces ABC – DEF , lo cual demuestra el teorema. ‚ 11.10.6. Definición. Un triángulo es escaleno si ninguno de sus lados es congruente con otro de sus lados. 11.10.7. Definición. Un triángulo es isósceles si al menos dos de sus lados son congruentes. B B XXX XXX XX X B B B B B B B 11.10.8. Definición. Un triángulo es equilátero si sus tres lados son congruentes. 11.10. Postulados y teoremas de congruencia de triángulos 283 T T T T T T T 11.10.9. Teorema del triángulo isósceles. Si dos lados de un triángulo son congruentes, entonces los ángulos opuestos a éstos son congruentes. Es decir, en un triángulo isósceles los ángulos opuestos a los lados congruentes son congruentes. Demostración. Sea ŸABC un triángulo tal que AB “ BC. La correspondencia ABC ÐÑ CBA es una correspondencia LAL por lo que es una congruencia, por lo tanto=BAC – ‚ =BCA, pero =BAC y =BCA son los ángulos opuestos a BC y AB respectivamente. Del teorema del triángulo isósceles se deduce directamente el siguiente corolario. 11.10.10. Corolario del triángulo equilátero. Todo triángulo equilátero tiene sus tres ángulos congruentes. 11.10.11. Recíproco del teorema del triángulo isósceles. Si dos ángulos de un triángulo son congruentes, entonces los lados opuestos son congruentes. Demostración. La demostración de este teorema es similar a la anterior pero usando el teorema ALA 11.10.5. ‚ Como consecuencia del teorema 11.10.11 tenemos. 11.10.12. Corolario. Todo triángulo que tiene todos sus ángulos congruentes es equilátero. 11.10.13. Teorema LLL. Toda correspondencia LLL es una congruencia. Demostración. Sea ABC ÐÑ DEF una correspondencia LLL. Por localización de puntos ÐÑ y por construcción de ángulos existe un único punto G en el lado de AC opuesto al lado en el cual está B tal que =CAB – =EDF y tal que AG “ DF . Por LAL se tiene que AGC – DEF . Ahora, como F E “ CG y F E “ CB, tenemos que CB “ CG, análogamente tenemos que AB “ AG, por lo que debido al teorema del triángulo isósceles tenemos que =ABG – =AGB y =CBG – =CGB. Ahora, por adición de ángulos tenemos que =ABC – =AGB de donde por LAL se tiene que ABC – AGC y por transitividad ABC – DEF , lo cual demuestra el teorema. ‚ Un ejemplo donde se utiliza el teorema LLL es en la demostración del teorema de la bisectriz. Definamos antes lo que es una bisectriz. 11.10.14. Definición. Si D está en el interior del =BAC y =BAD – =CAD, entonces el ÝÝÑ rayo AD biseca al =BAC y se llama la bisectriz del =BAC. A Br 1 PP PP PP D r PP C Pr P PP q P - 284 11.10. Postulados y teoremas de congruencia de triángulos 11.10.15. Teorema de la bisectriz. Todo ángulo tiene solamente una bisectriz. ÝÝÑ Demostración. Sean =BAC un ángulo, B 1 P AB tal que AB 1 “ AC y D el punto medio de B 1 C. Por el teorema LLL 11.10.13 ADC ÐÑ ADB 1 es una congruencia y los ángulos =B 1 AD y =CAD son correspondientes por lo tanto son congruentes, pero =B 1 AD “ =BAD, por lo ÝÝÑ ÝÝÑ que =BAD – =CAD, es decir AD es bisectriz de =BAC. Demostremos ahora que AD es ÝÝÑ el único rayo que biseca a =BAC. Sea AD1 un rayo que biseca a =BAC y veamos que D1 ÐÑ debe estar en el interior del =BAC. Si D1 y C están en lados opuestos de AB, entonces por ÝÝÑ el teorema de adición de ángulos >CAD1 ą >BAD1 por lo que AD1 no sería bisectriz del Ð Ñ =BAC. Análogamente D1 y B están del mismo lado de AC, por lo tanto D1 está en el interior ÝÝÑ del =BAC. Ahora, por el teorema de adición de ángulos y por ser AD1 bisectriz del =BAC, tenemos que >BAD1 “ 21 >BAC. Pero el postulado de construcción de ángulos garantiza que ÝÝÑ ÐÑ solamente hay un rayo AD1 con D1 del mismo lado que C de AB tal que >BAD1 “ 12 >BAC, por lo que la bisectriz es única. ‚ 11.10.16. Teorema. Todos los puntos de la bisectriz de un ángulo diferentes del extremo están en el interior del ángulo. ÝÝÑ Demostración. Sea =ABC un ángulo y BD su bisectriz con D en el interior de =ABC. ÝÝÑ ÐÑ Si E P BD y E ‰ B, entonces E y D están del mismo lado de AB ya que el único punto de ÐÑ ÐÑ ÐÑ ED que corta a AB es B y B R ED. Análogamente E y D están del mismo lado de BC, por lo que E está en el interior de =ABC. ‚ 11.11. Perpendicularidad 11.11. 285 Perpendicularidad En esta sección estudiaremos algunos resultados relacionados con el concepto de perpendicularidad. 11.11.1. Teorema. En un plano, dada una recta l y Q P l. Existe solamente una recta l1 tal que l K l1 y Q P l1 . Demostración. La existencia de l1 es consecuencia del postulado de construcción de ángulos y la unicidad es consecuencia del teorema del suplemento. Dejamos al lector los detalles de la demostración. ‚ 11.11.2. Lema. Dada una recta l y un punto Q R l. Existe una recta l1 perpendicular a l tal que Q P l1 . ÐÑ ÐÑ Demostración. Sea P P l. Si P Q K l, tomamos l1 “ P Q y se cumple la conclusión. ÐÑ Supongamos que P Q no es perpendicular a l. Sea S P l tal que S ‰ P . Por el postulado de construcción de ángulos 11.8.8, sea R1 un punto tal que Q y R1 están en lados opuestos de l y tal que >SP R1 “ >SP Q. Por el teorema de localización de puntos 11.2.9 podemos ÝÝÑ tomar ahora un punto R P P R1 tal que P R “ P Q. Sea finalmente T P l tal que T P RQ (esto es posible debido al postulado de la separación del plano 11.4.2). Con esta construcción tenemos que QP S ÐÑ RP S es una correspondencia LAL por lo que QS “ RS y =QSP – =RSP . Observemos que si =QT S – =RT S, entonces por el ÐÑ ÐÑ teorema del suplemento 11.8.13 tenemos QT K l y es suficiente con tomar l1 “ QT . Si S “ T , ÝÑ ÝÑ entonces =QT S – =RT S. Si SP “ ST , entonces =QST – =RST por lo que debido al ÝÑ postulado LAL 11.10.4 tenemos RST – QST , de donde =QT S – =RT S. Finalmente si ST ÝÑ y SP son rayos opuestos, entonces =QST – =RST debido a que son suplementos de ángulos congruentes y de nuevo se tiene RST – QST , de donde =QT S – =RT S. ‚ 11.11.3. Teorema. Dada una recta l y un punto Q que no está en ella. Existe solamente una recta l1 perpendicular a l tal que Q P l1 . ÐÑ Demostración. Por el lema anterior existe un punto P en l tal que P Q K l. Supongamos ÐÑ que exista una recta h a la cual pertenezca Q tal que h K l y h ‰ P Q. Sea R P h X l y S ÐÑ un punto en el rayo opuesto a P Q tal que P S “ P Q. Por el teorema del suplemento se tiene que QP R ÐÑ SP R es una correspondencia LAL, por lo que >SRP “ 90˝ . Pero debido al ÐÑ Ð Ñ teorema 11.11.1 QR “ SR, es decir Q, S P h, contradiciendo al postulado de la recta, por lo ÐÑ ÐÑ que no existe ninguna recta h a la cual pertenezca Q tal que h K l y h ‰ P Q. Luego P Q es la única recta perpendicular a l a la cual pertenece Q. ‚ 11.11.4. Corolario. Ningún triángulo tiene dos ángulos rectos diferentes. Es decir si un ángulo de un triángulo es recto, entonces los otros dos no son rectos. Demostración. Si un triángulo tuviera dos ángulos rectos diferentes, entonces el vértice del otro ángulo estaría en dos rectas diferentes, ambas perpendiculares al lado comprendido entre los ángulos rectos y por lo tanto también a la recta que incluye a tal lado, lo que contradice al teorema 11.11.3. ‚ 11.11.5. Definición. Un triángulo rectángulo es un triángulo en el cual uno de sus ángulos es recto. 286 11.11. Perpendicularidad 11.11.6. Definición. Una mediatriz de un segmento es una recta perpendicular al segmento en su punto medio. 9 : rB C C mediatriz del segmento AB C C C CrA 11.11.7. Teorema de la mediatriz. Si un segmento está incluido en un plano, entonces la mediatriz del segmento que está incluida en el plano es el conjunto de puntos del plano que están a la misma distancia de los extremos del segmento. Es decir, en un plano Π, si l es la mediatriz de un segmento AB, entonces l “ tP P Π : P A “ P Bu. Demostración. En un plano sea M el punto medio del segmento AB y l su mediatriz. Si P P l, entonces AM P ÐÑ BM P es una correspondencia LAL por lo que P A “ P B. Por otro lado si P es un punto en el plano tal que P A “ P B, entonces AM P ÐÑ BM P es una correspondencia LLL por lo que debido al teorema LLL 11.10.13 y al teorema del suplemento 11.8.13 concluimos que P P l. ‚ 11.11.8. Corolario. Dados un segmento AB y una recta l incluidos en un plano. Si dos puntos diferentes de l están a la misma distancia de los extremos A y B, entonces l es la mediatriz de AB. Demostración. Por el teorema de la mediatriz los dos puntos de l que están a la misma distancia de A y de B están en la mediatriz, pero l es la única recta a la que pertenecen estos dos puntos diferentes, por lo tanto l es la mediatriz. ‚ El siguiente corolario es un resultado muy interesante cuya demostración dejaremos como ejercicio para el lector. 11.11.9. Corolario. Las mediatrices de los lados de un triángulo se cortan en un punto común, el cual es el centro de la única circunferencia a la que pertenecen los tres vértices del triángulo. 11.11.10. Definición. La circunferencia a la cual pertenecen los vértices de un ŸABC se dice que está circunscrita en el triángulo. Al centro de tal circunferencia se le llama circuncentro del ŸABC. C A B Observemos que por el corolario anterior se concluye que el circuncentro de un triángulo es el punto de intersección de las mediatrices de los lados. 11.11.11. Definición. Sean P un punto, l una recta y l1 una recta perpendicular a l tal que P P l1 . La proyección de P en l es el punto Q, tal que Q P l X l1 . La proyección de un 11.11. Perpendicularidad 287 subconjunto A del espacio en una recta es el conjunto formado por las proyecciones en la recta de todos los elementos de A . 11.11.12. Definición. Una recta dada y un plano son perpendiculares si se intersecan y además toda recta en el plano que pasa por el punto de intersección es perpendicular a la recta dada. Cuando una recta l y un plano Π son perpendiculares escribimos l K Π. 11.11.13. Lema. Si B, C, P y Q son cuatro puntos diferentes tales que P B “ QB, P C “ QC y X es un punto entre B y C, entonces P X “ QX. Demostración. Por el teorema LLL 11.10.13 tenemos que P BC – QBC, por lo que =P BX – =QBX, de donde por el postulado LAL P BX – QBX y así P X “ QX. ‚ 11.11.14. Teorema. Si una recta l es perpendicular a dos rectas diferentes l1 y l2 que se intersecan, entonces l es perpendicular al plano que incluye a las dos rectas l1 y l2 . Demostración. Sean l1 y l2 dos rectas incluidas en un plano Π tales que l1 X l2 “ tAu, l una recta perpendicular a l1 y l2 , P, Q P l tales que A es el punto medio de P Q y l3 una recta incluida en Π a la cual pertenece A. Tomemos B P l1 y C P l2 tales que estén en lados opuestos de l3 y sea X el punto en l3 que está entre B y C. Como l1 y l2 son mediatrices de P Q, por el teorema de la mediatriz P B “ QB y P C “ QC. Ahora, por el lema 11.11.13 tenemos que P X “ QX, pero como P A “ QA, entonces debido al corolario 11.11.8 concluimos que l3 también es mediatriz de l, de donde l K l3 , por lo tanto l K Π. ‚ 11.11.15. Teorema. Sea l una recta y P P l. Existe un plano Π tal que l K Π y P P Π. Demostración. Sean Q un punto que no está en l, Λ el plano al cual pertenece Q que incluye a l, R un punto que no está en Λ y Γ el plano al cual pertenece R que incluye a l. Sabemos que Λ X Γ “ l y que existen dos únicas rectas l1 y l2 tales que l1 Ă Λ, l1 K l, l2 Ă Γ , l2 K l y P P l1 X 2 . Pero como l1 ‰ l2 tenemos que el plano Π que incluye a ambas rectas y la recta l son perpendiculares, además P P Π. ‚ 11.11.16. Teorema. Si una recta dada y un plano son perpendiculares, entonces el plano incluye a toda recta perpendicular a la recta dada en su punto de intersección. Demostración. Sean l y Π una recta y un plano perpendiculares, P P l X Π, l1 una recta perpendicular a l en P y Γ el plano que incluye a l1 y l. Demostraremos que l1 Ă Π. La recta Γ X Π es perpendicular a l en P , pero solamente existe una recta incluida en Γ que sea perpendicular a l en P , por lo que l1 “ Γ X Π Ă Π. ‚ De los teoremas 11.11.15 y 11.11.16 se concluye el siguiente teorema. 11.11.17. Teorema. Dados una recta y un punto en la recta, existe solamente un plano perpendicular a la recta al cual pertenece el punto. 11.11.18. Teorema. Sea Π un plano y P P Π. Existe una única recta l tal que P P l y l K Π. Demostración. Sea Q un punto que no esté en Π y R P Π diferente de P . Por el teorema ÐÑ 11.11.1, el plano que incluye al Ÿ P QR incluye también a una única recta l1 K P R con P P l1 ÐÑ y existe una única recta l2 incluida en Π tal que P P l2 y l2 K P R. Ahora, el plano que incluye 288 11.11. Perpendicularidad a l1 y l2 incluye a una única recta l tal que P P l y l K l2 . Como l1 y l2 son perpendiculares a ÐÑ ÐÑ ÐÑ P R, debido al teorema 11.11.14 tenemos que l K P R. Ahora, como l K l2 y l K P R tenemos por el teorema 11.11.14 que l K Π. Para ver que l es la única recta tal que P P l y l K Π, observemos que si existiera una recta l1 diferente de l tal que P P l1 y l1 K Π, entonces, por los teoremas 11.11.14 y 11.11.17, el plano Π 1 que incluye a l y l1 incluiría también a la recta l2 que pasa por P , es decir tendríamos que l, l1 , l2 Ă Π 1 , P P l X l1 X l2 , l K l2 y l1 K l2 , contradiciendo al teorema 11.11.1. ‚ Ejercicios. 1. Demostrar el corolario 11.11.9. 11.12. Desigualdades geométricas 11.12. 289 Desigualdades geométricas En esta sección se estudiarán algunos teoremas muy importantes, como son el primer teorema de la distancia mínima, el del ángulo externo y la desigualdad del triángulo. Comencemos con algunas definiciones. 11.12.1. Definición. Dados dos segmentos AB y CD, decimos que el segmento AB es mayor que el segmento CD, denotado AB ą CD, si AB ą CD. Si AB ą CD también decimos que CD es menor que AB y lo denotamos como CD ă AB. 11.12.2. Definición. Dados dos ángulos =ABC y =DEF , decimos que =ABC es mayor que =DEF , denotado =ABC ą =DEF si >ABC ą >DEF . Si =ABC ą =DEF también decimos que el ángulo =DEF es menor que el ángulo =ABC y lo denotamos así =DEF ă =ABC. ÝÝÑ ÝÝÑ 11.12.3. Definición. En un triángulo ŸABC si CA y CD son rayos opuestos, decimos que el ángulo =BCD es un ángulo externo del ŸABC. Además a los ángulos =ABC y =BAC se les llaman ángulos internos no contiguos al =BCD. Al =ACB se le llama ángulo interno contiguo al =BCD. B Q AQ A QQ Q A A C D 11.12.4. Teorema del ángulo externo. Un ángulo externo de un triángulo es mayor que cada uno de sus ángulos internos no contiguos. Demostración. Sea ŸABC un triángulo y =BCD un ángulo externo no contiguo a los ángulos =A y =B del triángulo. Llamémosle E al punto medio de BC y F al punto que está ÝÝÑ en el rayo opuesto a EA tal que EA “ EF . Ahora por el teorema de los ángulos opuestos por el vértice =BEA – =CEF y se tiene que BEA ÐÑ CEF es una correspondencia LAL, así =ECF – =EBA, es decir =BCF – =B. Ahora, por el teorema de adición de ángulos 11.8.9 y el teorema 11.8.7 tenemos que =BCD ą =BCF , por lo tanto =BCD ą =B. Ahora sea ÝÝÑ ÝÝÑ CG un rayo opuesto a CB. Por un argumento análogo al anterior tenemos que =ACG ą =A, pero =ACG – =BCD por ser opuestos por el vértice, de modo que también =BCD ą =A con lo que el teorema queda demostrado. ‚ 11.12.5. Definición. Decimos que un ángulo es agudo si mide menos de 90˝ y que es obtuso si mide más de 90˝ . Como consecuencia inmediata del teorema anterior tenemos los siguientes 3 corolarios. 11.12.6. Corolario. Si un triángulo tiene un ángulo recto, entonces los otros dos ángulos son agudos. 11.12.7. Corolario. Si un triángulo tiene un ángulo obtuso, entonces los otros dos ángulos 290 11.12. Desigualdades geométricas son agudos. 11.12.8. Corolario. En cualquier triángulo al menos dos de sus ángulos son agudos. 11.12.9. Definición. Sea ABC ÐÑ DEF una correspondencia entre dos triángulos. Si AB “ DE, =ABC – =DEF y =BCA – =EF D, entonces decimos que es una correspondencia lado-ángulo-ángulo o LAA. 11.12.10. Teorema LAA. Toda correspondencia LAA es una congruencia. Demostración. Sean ŸABC y ŸDEF dos triángulos tales que AC “ DF , =CAB – =F DE y =ABC – =DEF . Si AB “ DE, entonces ABC ÐÑ DEF es una congruencia debido al postulado LAL 11.10.4. Veamos que es imposible que AB ă DE. Supongamos que AB ă DE. Sea B 1 P ÝÝÑ AB tal que AB 1 “ DE. Con estas condiciones =ABC es un ángulo externo no contiguo al =BB 1 C en el triángulo ŸBB 1 C por lo que =ABC ą =BB 1 C, pero como =DEF – =ABC, entonces =DEF ą =BB 1 C y observando que =BB 1 C “ =AB 1 C tenemos =DEF ą =AB 1 C contradiciendo al postulado LAL 11.10.4 puesto que CAB 1 ÐÑ F DE sería una correspondencia LAL, por lo tanto es imposible que AB ă DE. Análogamente es imposible que AB ą DE, por lo tanto AB “ DE y ABC ÐÑ DEF es una congruencia. ‚ 11.12.11. Definición. En un triángulo rectángulo al lado opuesto al ángulo recto se le llama la hipotenusa y a cada lado adyacente al ángulo recto se le llama cateto. 11.12.12. Teorema de la hipotenusa y el cateto. Dada una correspondencia entre dos triángulos rectángulos tal que las hipotenusas de ambos son correspondientes. Si la hipotenusa y un cateto de un triángulo son congruentes con las partes correspondientes del segundo, entonces la correspondencia es una congruencia. Demostración. Sea ABC ÐÑ DEF una correspondencia tal que >ACB “ >DF E “ π2 , AB “ DE y BC “ EF , es decir satisface las hipótesis del teorema. Sea G un punto en el ÝÝÑ rayo opuesto a F D tal que F G “ CA. Se tiene que ABC ÐÑ GEF es una correspondencia LAL por lo que EG “ BA “ ED y =BAC – =EGF , ahora por el teorema del triángulo isósceles =EGF – =EDF de modo que =EDF – =BAC, luego ABC ÐÑ DEF es una correspondencia LAA, por lo que es una congruencia. ‚ 11.12.13. Teorema. Si dos lados de un triángulo no son congruentes, entonces los ángulos opuestos a estos lados no son congruentes y el ángulo mayor es el opuesto al lado mayor. Demostración. Si dos lados de un triángulo no son congruentes, entonces los ángulos opuestos no son congruentes puesto que si lo fueran contradiría al recíproco del teorema del triángulo isósceles. ÝÝÑ Sea ŸABC tal que AB ą AC y D P AC tal que AB “ AD. Por el teorema del triángulo isósceles =ABD – =ADB pero por el teorema de adición de ángulos y el teorema 11.8.7 tenemos =ABC ă =ABD. Ahora, =ADB ă =ACB debido al teorema del ángulo externo. Por lo tanto =ABC ă =ACB. ‚ Procediendo por contradicción se tiene que una consecuencia inmediata del teorema 11.12.13 es el siguiente teorema. 11.12.14. Teorema. Si dos ángulos de un triángulo no son congruentes, entonces los lados 11.12. Desigualdades geométricas 291 opuestos a estos ángulos no son congruentes y el lado mayor es opuesto al ángulo mayor. 11.12.15. Primer teorema de la distancia mínima. Sea l una recta, P un punto que no está en ella, Q P l tal que P Q K l y S P l tal que S ‰ Q. Tenemos que P Q ă P S. Dicho de otra manera, el segmento más corto que une un punto con una recta es el segmento perpendicular a la recta. Pr EHH HH E ( H((( (( ( E ( ( S (( Q (((( l Demostración. Este teorema es una consecuencia inmediata del teorema 11.12.14 y del corolario 11.12.6 ‚ 11.12.16. Definición. Sea l una recta y P un punto que no está en ella. Definimos la distancia entre P y l como la longitud del segmento P Q tal que Q P l y P Q K l. 11.12.17. Desigualdad del triángulo. Sea ŸABC un triángulo. AB ` BC ą AC. Demostración. Si AC no es mayor que los otros dos lados del triángulo, la conclusión es directa. Supongamos que AC es mayor que AB y que BC. Sea D P AC tal que AD “ AB. Por el teorema del triángulo isósceles =ABD – =ADB. Ahora, por el corolario 11.12.8 =ABD y =ADB son agudos. Debido al teorema del suplemento =BDC es obtuso. Ahora, por el corolario 11.12.7 y el teorema 11.12.13 , BC ą BD. Por lo anterior se tiene que AB ` BC “ AD ` BC ą AD ` DC “ AC, es decir AB ` BC ą AC. ‚ 11.12.18. Definición. Una circunferencia y una recta incluidas en un mismo plano se dice que son tangentes si su intersección tiene solamente un punto. En estas condiciones también se dice que una es tangente a la otra en el punto de intersección. También decimos que un segmento es tangente a una circunferencia cuando se intersecan y la recta que contiene al segmento es tangente a la circunferencia. 11.12.19. Teorema. Sea c una circunferencia con centro en Q y l una recta tangente a la circunferencia c en un punto P . Bajo estas condiciones se tiene que l K QP . Demostración. Procedamos por contradicción. Si l no fuera perpendicular a QP , entonces por el primer teorema de la distancia mínima la proyección A de Q en l está en el interior de ÝÝÑ c y si tomáramos P 1 en el rayo opuesto a OP tal que OP “ OP 1 , entonces por el postulado LAL el punto P 1 también estaría en la intersección de l y c, luego l y c no serían tangentes. Por lo tanto l K QP . ‚ 292 11.12. Desigualdades geométricas El teorema 11.12.19 tiene el siguiente recíproco. 11.12.20. Teorema. Sea c una circunferencia con centro en Q y l una recta que interseca a c en un punto P tal que l K QP . La recta l es tangente a la circunferencia c. Demostración. Si la recta l cortara a c en algún punto P 1 diferente de P , entonces por el teorema del triángulo isósceles =QP P 1 – =QP 1 P y tendríamos un triángulo con dos ángulos rectos, lo cual es imposible debido al corolario 11.12.6. ‚ 11.12.21. Teorema de la bisagra. Sean ŸABC y ŸABC 1 dos triángulos tales que C y C 1 ÐÑ están del mismo lado de AB, BC “ BC 1 y =ABC ă =ABC 1 . El segmento AC 1 es más largo que el segmento AC. C1 C ! !! A ! A!! !! A !!! A ! A ! ! ! A A B Demostración. Sea M el punto donde la bisectriz del ángulo =CBC 1 corta al segmento AC 1 . 6 C C1 aa !! ! A a! A!! M !! A !!! A ! A ! ! A ! A B Por el postulado LAL tenemos que M C “ M C 1 , ahora AC 1 “ AM ` M C 1 “ AM ` M C ą AC, por lo que el segmento AC 1 es más largo que el segmento AC (si C está entre A y M la última desigualdad se sigue del hecho de que AM “ AC ` CM si no se sigue de la desigualdad del triángulo). ‚ 11.13. Rectas paralelas 11.13. 293 Rectas paralelas 11.13.1. Definición. Dos rectas son paralelas si están incluidas en un mismo plano y su intersección es el conjunto vacío. Al hecho de que dos rectas l1 y l2 sean paralelas lo denotaremos así l1 k l2 . De manera más general, si m1 es una recta, rayo o segmento incluido en l1 , m2 es una recta, rayo o segmento incluido en l2 y además l1 k l2 , entonces decimos que m1 es paralelo con m2 y lo denotamos como m1 k m2 . 11.13.2. Teorema. Dos rectas paralelas están incluidas solamente en un plano. Demostración. Sean l1 y l2 dos rectas paralelas. Por definición de rectas paralelas l1 y l2 están incluidas en al menos un plano Π. Sea P P l1 , por el teorema 3.3 existe sólo un plano que incluye a l1 y tP u, por lo que tal plano debe ser Π y ningún otro plano puede incluir a l1 y l2 . ‚ 11.13.3. Teorema. Si dos rectas diferentes incluidas en un mismo plano son perpendiculares a una tercera, entonces las rectas son paralelas. Demostración. Este teorema se deduce del corolario 11.12.6. ‚ 11.13.4. Teorema. Sea l una recta y P un punto que no está en l. Existe una recta l1 tal que P P l1 y l k l1 . ÐÑ Demostración. Sea Q P l tal que P Q K l. Ahora en el plano en que está incluido l Y tP u ÐÑ tomemos la recta l1 perpendicular a P Q tal que P P l1 . Del teorema anterior concluimos que l1 k l. ‚ 11.13.5. Definición. Una secante a dos rectas en un mismo plano es una recta que las interseca a cada una en puntos diferentes. recta l1 secante a l1 y l2 ( ( (((((( ( ( l (( ((2( 11.13.6. Definición. Dadas dos rectas l1 y l2 incluidas en un plano y cortadas por una secante t en los puntos P y Q respectivamente. Sean A P l1 y B P l2 en lados opuestos de t. Bajo estas condiciones decimos que los ángulos =AP Q y =P QB son ángulos alternos internos. 294 11.13. Rectas paralelas t l1 P A ( ( (((((( l Q ( 2 ( ( (((( B 11.13.7. Definición. Dadas dos rectas l1 y l2 incluidas en un mismo plano y cortadas por una secante t en los puntos P y Q respectivamente. Sean A P l1 y C P l2 del mismo lado ÝÝÑ ÝÝÑ de t y P D un rayo opuesto a P Q. Bajo estas condiciones decimos que los ángulos =DP A y =P QC se dice que son ángulos correspondientes, y que los ángulos =AP Q y =P QC son ángulos internos del mismo lado. t D l1 P A ( ( (((((( Q ( ( (( C ((( l2 Del teorema del suplemento se deduce el siguiente teorema. 11.13.8. Teorema. Si dos rectas incluidas en un mismo plano son cortadas por una secante y si dos ángulos alternos internos son congruentes, entonces los otros dos ángulos alternos internos también son congruentes. 11.13.9. Teorema. Sean dos rectas l1 y l2 incluidas en un mismo plano y cortadas por una secante t. Si dos ángulos alternos internos son congruentes, entonces las rectas l1 y l2 son paralelas. Demostración. Si las rectas l1 y l2 se cortaran, entonces se tendría un triángulo con un ángulo externo congruente con uno de sus ángulos internos no contiguos, lo que contradice al teorema del ángulo externo. ‚ Del teorema 11.13.9 y del teorema de los ángulos opuestos por el vértice 11.8.18 se sigue el siguiente corolario. 11.13.10. Corolario. Sean dos rectas l1 y l2 incluidas en un mismo plano y cortadas por una secante t. Si dos ángulos correspondientes son congruentes, entonces las rectas l1 y l2 son paralelas. 11.13. Rectas paralelas 295 El siguiente postulado es equivalente al quinto postulado del libro «Los Elementos» de Euclides. 11.13.11. Postulado de las paralelas. Dada una recta l y un punto P R l. Existe una única recta l1 tal que P P l1 y l1 k l. 11.13.12. Teorema. Si dos rectas paralelas son cortadas por una secante, entonces los ángulos alternos internos son congruentes. Demostración. Sean l1 y l2 dos rectas paralelas y t una secante a ellas, además sean P P l1 X t y Q P l2 X t. Por el postulado de construcción de ángulos 11.8.8, existe una recta l11 tal que P P l11 y tomando t como secante forme con l2 ángulos alternos internos congruentes. Por el teorema 11.13.11 l11 k l2 , pero por el postulado de las paralelas 11.13.15 tenemos que l11 “ l1 , además los otros dos ángulos alternos internos también son congruentes debido al teorema 11.13.8. ‚ Del teorema 11.13.12 y del teorema de los ángulos opuestos por el vértice 11.8.18 se siguen los siguientes dos corolarios. 11.13.13. Corolario. Si dos rectas paralelas son cortadas por una secante y tenemos un par de ángulos correspondientes, éstos son congruentes. 11.13.14. Corolario. Si dos rectas paralelas son cortadas por una secante, entonces las medidas de ángulos internos del mismo lado suman 180˝ . ÐÑ 11.13.15. Lema. Sea ŸABC un triángulo. Si D está en el interior de =BAC, entonces AD ÐÑ corta a CB. ÐÑ ÐÑ Demostración. Sea B 1 tal que A está entre B y B 1 . Las rectas AD y CB no pueden ÐÑ ser paralelas puesto que los ángulos =B 1 AD y =ABC serían correspondientes al tomar AB como secante, de modo que si fueran paralelas tendríamos que =B 1 AD – =ABC, pero =B 1 AC ă =B 1 AD – =ABC, contradiciendo al teorema del ángulo externo. ‚ 11.13.16. Lema. Sea ŸABC un triángulo y l la recta paralela a AC con B P l. Si E P l y ÐÑ ÐÑ además E y C están del mismo lado de AB, entonces E y A están en lados opuestos de BC. ÐÑ Demostración. Supongamos que E P l y además E y C están del mismo lado de AB. Si ÐÑ E y A estuvieran del mismo lado de BC, entonces debido al lema 11.13.15 tendríamos que ÐÑ ‚ BE cortaría a AC, contradiciendo el hecho de que l k AC. 11.13.17. Teorema. Para todo triángulo la suma de las medidas de sus ángulos es 180˝ . Demostración. Sea ŸABC un triángulo cualesquiera y l la recta a la cual pertenece B y que ÐÑ ÐÑ es paralela a AC. Tomemos D, E P l en lados opuestos de AB (y por consecuencia de BC) con ÐÑ E del mismo lado que C de AB. Por el lema 11.13.16 los puntos A y E están en lados opuestos ÐÑ de BC y por el teorema 11.13.12 tenemos que =DBA – =BAC y =EBC – =BCA. Ahora por los teoremas del suplemento 11.8.13 y de adición de ángulos 11.8.9 tenemos que >P BA ` >ABC ` >EBC “ 180˝ pero debido a las congruencias anteriores tenemos >BAC ` >ABC ` >BCA “ 180˝ , 296 11.13. Rectas paralelas con lo que terminamos la demostración. ‚ Los siguientes 3 corolarios se deducen inmediatamente del teorema 11.13.17. 11.13.18. Corolario. Dada una correspondencia entre dos triángulos. Si dos pares de ángulos correspondientes son congruentes, entonces el otro par de ángulos correspondientes también son congruentes. 11.13.19. Corolario. Los ángulos agudos de cualquier triángulo rectángulo son complementarios. 11.13.20. Corolario. En todo triángulo la medida de un ángulo externo es igual a la suma de las medidas de los ángulos internos no contiguos. 11.13.21. Teorema. Dado un plano Π y un punto P que no está en Π, existe una única recta l, tal que P P l y l K Π. ÐÑ Demostración. Sea Q P Π. Si P Q K Π hemos terminado debido al teorema 11.11.18 ÐÑ y a que un triángulo no tiene dos ángulos rectos diferentes. Supongamos que P Q no es perpendicular a Π y sea l1 la única recta perpendicular a Π a la cual pertenece Q. Ahora sea l la única recta tal que P P l y l k l1 . Sean Π 1 el plano en el cual están incluidas l y l1 , y R el punto en la intersrección de las rectas Π X Π 1 y l (tal punto existe por que de otro modo habría dos paralelas diferentes a l, a saber l1 y Π X Π 1 , que pasan por Q). Por el teorema ÐÑ ÐÑ ÐÑ 13.6 l K RQ (RQ “ Π X Π 1 ). Sea ahora en Π un punto S R RQ y l2 la recta perpendicular Ð Ñ a Π tal que S P l2 . por argumentos análogos a los anteriores l K RS por lo que l K Π ya que Ð Ñ ÐÑ RS ‰ RQ. Ahora, no existe ninguna otra recta a la cual pertenezca P que sea perpendicular a Π puesto que tendríamos un triángulo con dos ángulos rectos diferentes. ‚ 11.13.22. Definición. Sea P un punto, Π un plano y l la recta perpendicular a Π tal que P P l. La proyección de P en Π es el punto Q tal que Q P l X Π. La proyección de un conjunto A del espacio en un plano es el conjunto formado por las proyecciones de los elementos de A . Veamos ahora algunos resultados concernientes a las bisectrices de los ángulos de un triángulo. 11.13.23. Lema. Dadas dos bisectrices de un triángulo, éstas no son paralelas. ÝÝÑ ÝÝÑ Demostración. Sea ŸABC un triángulo, y AD y BE las bisectrices de =CAD y =CBA ÐÑ respectivamente. Por el teorema 11.10.16, C, E y D están del mismo lado de AB. Ahora, por definición de mediatriz y por el teorema 11.13.17, la suma de las medidas de los ángulos ÐÑ ÐÑ ÐÑ =DAC y =EBA es menor que 90˝ . Si tomamos AB como secante de las rectas AD y BE tenemos que =DAC es el suplemento del correspondiente a =EBA, por lo que hay un par de ángulos correspondientes, uno de los cuales es agudo y el otro obtuso, por lo tanto, debido ÝÝÑ ÝÝÑ al corolario 11.13.13, AD y BE no son paralelos. ‚ 11.13.24. Lema. Cualquier par de bisectrices de ángulos de un triángulo se cortan en algún punto. Demostración. Siguiendo la misma idea de la demostración del lema 11.13.23, sea ŸABC ÝÝÑ ÝÝÑ un triángulo, y AD y BE las bisectrices de =CAD y =CBA respectivamente. Por el lema ÝÝÑ ÝÝÑ 13.3, las rectas que contienen a las bisectrices AD y BE se cortan. Veamos que deben cortarse, 11.13. Rectas paralelas 297 ÐÑ efectivamente, del mismo lado de AB que C. En efecto, si se cortaran en un punto F del ÐÑ lado opuesto a C de AB, entonces el triángulo ŸABF tendría dos ángulos obtusos, lo cual contradice al corolario 11.12.7. Así tenemos que el punto donde se cortan las rectas que contienen a las bisectrices pertenecen a las bisectrices. ‚ 11.13.25. Lema. Cualquier par de bisectrices de ángulos de un triángulo se cortan en el interior del triángulo. Demostración. Este lema es consecuencia del lema 11.13.24 y del hecho de que el interior de un triángulo es la intersección del interior cualesquiera dos de sus ángulos. ‚ 11.13.26. Lema. Cualquier punto de la bisectriz de un ángulo equidista de las rectas que contienen a los lados del ángulo. ÝÝÑ Demostración. Sea AD la bisectriz de un ángulo =CAB y sean B 1 y C 1 los puntos más ÐÑ ÐÑ cercanos a D de las rectas AB y AC respectivamente. Por el primer teorema de la distancia mínima 11.12.15 tenemos que >AB 1 D “ >AC 1 D “ 90˝ , por lo que debido al teorema LAA ÐÑ ÐÑ 11.12.10 tenemos que la distancia de D a AC es igual a la distancia de D a AB. ‚ 11.13.27. Teorema. Las bisectrices de los ángulos de un triángulo se cortan en un mismo punto en el interior del triángulo. Demostración. Sea ŸABC un triángulo y D el punto donde se cortan las bisectrices de los ángulos =CAB y =ABC. Por el lema 11.13.25 tenemos que D está en el interior del triángulo y por el lema 11.13.26 tenemos que D equidista de las rectas que contienen a los lados del triángulo. Así tenemos que D equidista ÐÑ ÐÑ de las rectas CB y CA, de modo que usando el primer teorema de la distancia mínima 11.12.15 y el postulado LAL 11.10.4 vemos que D está en la bisectriz del ángulo =ACB. ‚ 11.13.28. Definición. Al punto donde se cortan las bisectrices de los ángulos de un triángulo se le llama incentro del triángulo. 11.13.29. Teorema. El incentro de un triángulo está a la misma distancia r de cada recta que contiene a uno de los lados del triángulo. Además, en el plano que contiene al triángulo, la circunferencia cuyo centro es el incentro del triángulo y tiene radio r es tangente a los lados del triángulo. Demostración. Por el lema 11.13.26 tenemos que el incentro de un triángulo está a la misma distancia r de cada recta que contiene a los lados del triángulo. Ahora, por el primer teorema de la distancia mínima 11.12.5 y el teorema 11.12.20 tenemos que la circunferencia de radio r cuyo centro es el centro del triángulo es tangente a las rectas que contienen a los lados del triángulo. Para demostrar que los puntos donde se cortan tales rectas con la circunferencia están en los lados de los triángulos, supongamos que tenemos un triángulo ÐÑ ÐÑ ŸABC cuyo incentro es I y sea P P AC tal que IP K AC y veamos que P P AC. Como lo ángulos =CAI y =ACI son agudos, entonces A no puede estar entre P y C puesto que en tal caso tendríamos al ŸAIP con un ángulo recto (=IP A) y otro obtuso (=IAP ). Análogamente vemos que C no está entre A y P , por lo cual P P AC con lo cual terminamos la demostración. 298 11.13. Rectas paralelas ‚ 11.13.30. Definición. La circunferencia que es tangente a los lados de un triángulo se dice que está inscrita en el triángulo. 11.13.31. Teorema. Dado un triángulo, éste solamente tiene una circunferencia inscrita y el centro de la circunferencia es el incentro del triángulo. Demostración. Sea ŸABC un triángulo y c una circunferencia inscrita a éste con radio r y centro I. Sea P el punto donde se cortan la circunferencia y AC y Q el punto donde se cortan la circunferencia y AB. Por el teorema 11.12.19 y el teorema ÝÑ de la hipotenusa y el cateto 11.12.12 tenemos que AI es la biÝÑ sectriz de =BAC. Análogamente BI es la bisectriz de =ABC ÝÑ y CI es la bisectriz de =ACB, por lo que I es el incentro del triángulo y por el teorema 11.13.29 y el primer teorema de la distancia mínima 11.12.15, el radio r es la distancia de I a las rectas que contienen a los lados del triángulo. ‚ 11.13.32. Teorema. Si un triángulo ŸABC está inscrito en una circunferencia c y AB es el diámetro de la circunferencia, entonces el ángulo =ACB es recto. Demostración. Sean θ “ >ABC y α “ >BAC. Por el teorema del triángulo isósceles tenemos que θ “ >BCQ y α “ >ACQ. Ahora, por el teorema de adición de ángulos, tenemos que >ACB “ θ ` α, y por el teorema 11.13.17 A B 180˝ “ >ACB ` >ABC ` >BAC “ pθ ` αq ` θ ` α “ 2pθ ` αq “ 2>ACB, C es decir >ACB “ 90˝ , por lo que el ángulo =ACB es recto. ‚ 11.13.33. Teorema. Si un triángulo ŸABC está inscrito en una circunferencia c y el ángulo Ŋ entonces la medida de =ABC es la mitad de la medida =ABC intercepta al arco menor AC, Ŋ del ángulo central que intercepta al arco AC. Demostración. Sea Q el centro de c. Hagamos la demostración primero para el caso en que Q P AB. En este caso, por el teorema 11.13.32 tenemos que >ACB “ 90˝ . Sea θ “ >AQC y β “ >ABC. Por el teorema del triángulo isósceles 11.10.9 tenemos que >BCQ “ β y por los teoremas 11.13.17 y del suplemento 11.8.13 tenemos que 2β ` 180˝ ´ θ “ 180˝ , es decir β “ 2θ . Si Q P BC, la demostración es análoga a la del caso en que Q P BA. Veamos el caso en que Q está en el interior del ángulo =ABC. Sea R el punto en c tal que Q es el punto medio de BR. Debido al caso anterior y al teorema de adición de ángulos 1 1 1 1 >ABC “ >ABQ ` >QBC “ >AQR ` >RQC “ p>AQR ` >RQCq “ >AQC, 2 2 2 2 por lo que el resultado también es válido cuando Q está en el interior del ángulo =ABC. 11.13. Rectas paralelas 299 Finalmente, si Q está en el exterior de =ABC, sea de nuevo R P c tal que Q es el punto medio de BR. Por el primer caso y por el teorema de adición de ángulos 11.8.9 obtenemos 1 1 >ABC ` >CBQ “ >ABR “ >AQR “ p>AQC ` >CQRq 2 2 1 1 1 “ >AQC ` >CQR “ >AQC ` >CBQ, 2 2 2 por lo tanto >ABC “ 21 >AQC. ‚ 11.13.34. Teorema. Si un triángulo ŸABC está inscrito es una circunferencia c con centro Ŋ entonces la medida de =ABC es 180˝ ´ Q y el ángulo =ABC intercepta al arco mayor AC, >AQC . 2 Demostración. >ABC “ 180˝ ´ >ACB ´ >BAC “ 180˝ ´ >AQB ´ >BQC “ 180˝ ´ >AQC . 2 2 2 ‚ 11.13.35. Teorema. Si ŸABC es un triángulo y D un punto en su interior, entonces >ADB ą >ACB. ÐÑ Demostración. Sea E el punto donde la recta CD corta a AB. Por el teorema del ángulo externo 11.12.4, >BDE ą >BCD y >ADE ą >ACD. Ahora, por el teorema de adición de ángulos 11.8.9, >ADB “ >ADE ` >BDE ą >ACD ` >BCD “ >ACB. ‚ Ejercicios. 1. Demostrar el siguiente resultado, conocido como «el quinto postulado de Euclides»: Dadas dos rectas diferentes l1 y l2 incluidas en un mismo plano y que son cortadas por una secante t en los puntos P y Q respectivamente, y dados dos puntos A P l1 y C P l2 del mismo lado de t, tales que >AP Q ` >P QC ă 180˝ ; existe un punto B en el cual se cortan las rectas l1 y l2 , además B está del mismo lado de t que A y C. 300 11.14. Cuadriláteros 11.14. Cuadriláteros En esta sección definiremos distintos tipos de cuadriláteros y conceptos relacionados con éstos. 11.14.1. Definición. Cualquier polígono de cuatro lados incluida en un plano se llama cuadrilátero. Es decir un cuadrilátero es la unión de cuatro segmentos AB, BC, CD y DA que no se cortan más que posiblemente en sus extremos. Los ángulos =DAB, =ABC, =BCD y =CDA se llaman ángulos del cuadrilátero. A D B Z Z C cuadrilátero ˝ABCD 11.14.2. Definición. Un cuadrilátero convexo es un cuadrilátero tal que para todo vértice del cuadrilátero y todo ángulo del cuadrilátero tenemos que el vértice no está en el exterior del ángulo. En general, un polígono convexo es un polígono l que está incluido en un plano tal que si AB es uno de los lados del polígono l, entonces todos los vértices de l diferentes de ÐÑ A y de B están en un mismo lado de la recta AB. A D B B B BB B C cuadrilátero convexo ˝ABCD Se invita al lector a representar con dibujos las definiciones siguientes. 11.14.3. Definición. El interior de un cuadrilátero convexo es el conjunto de puntos que están en el interior de cada uno de sus ángulos. En general, el interior de un polígono convexo es el conjunto de puntos que están en el interior de cada uno de sus ángulos. 11.14.4. Definición. Dado un polígono convexo. Se dice que el conjunto que es la unión de el polígono y su interior está delimitado por el polígono. Observemos que un cuadrilátero convexo no es un conjunto convexo pero su interior sí lo es. 11.14.5. Definición. Dos lados de un cuadrilátero son opuestos si no se intersecan, en otro caso diremos que son consecutivos. Dos ángulos de un cuadrilátero son opuestos si no incluyen un mismo lado, en otro caso diremos que son consecutivos. Al cuadrilátero cuyos vértices son A, B, C y D, y cuyos lados son AB, BC, CD y DA se le denotará como ˝ABCD. Las diagonales de un cuadrilátero ˝ABCD son los segmentos AC y BD. 11.14. Cuadriláteros 301 Daremos a continuación las definiciones de las figuras geométricas más importantes. 11.14.6. Definición. Un trapecio es un cuadrilátero que tiene al menos dos lados paralelos. 11.14.7. Definición. Un paralelogramo es un cuadrilátero en el cual cualquier lado es paralelo a su lado opuesto. Observemos que según la definición anterior, todos los paralelogramos son trapecios. 11.14.8. Definición. Un rombo es un paralelogramo cuyos lados son congruentes entre sí. 11.14.9. Definición. Un rectángulo es un paralelogramo cuyos ángulos son rectos. 11.14.10. Definición. Un cuadrado es un rectángulo que es rombo. 11.14.11. Definición. Un romboide es un paralelogramo que no es rombo. 11.14.12. Definición. Un cuadrilongo es un rectángulo que no es cuadrado. 11.14.13. Definición. Un trapezoide es un cuadrilátero que no es trapecio, es decir que no tiene ningún par de lados paralelos. 11.14.14. Definición. La distancia entre dos rectas paralelas es la distancia de cualquier punto de una de ellas a la otra. ¿Por qué esta definición tiene sentido? 11.14.15. Definición. En un trapecio a las longitudes de los lados paralelos se les llama bases del trapecio y a la distancia entre las rectas que incluyen tales lados se le llama altura correspondiente a tales bases. 11.14.16. Definición. En un triángulo la longitud de uno de sus lados es una base y su altura correspondiente es la distancia de la recta que incluye al lado, al vértice del triángulo que no está en ese lado. 11.14.17. Definición. Una región rectangular es la unión de un rectángulo con su interior. Una región trapecial es la unión de un trapecio con su interior. Una región cuadrada es la unión de un cuadrado con su interior. 11.14.18. Definición. La base y la altura de una región trapecial o triangular R son respectivamente la base y la altura del trapecio o triángulo t tal que R es la unión de t con su interior. 11.14.19. Teorema del paralelogramo. En un paralelogramo las bases opuestas son congruentes. Demostración. Se dejará al lector el justificar cada paso de la demostración. Sea ˝ABCD ÝÝÑ ÝÝÑ ÝÝÑ un paralelogramo. Sean los puntos E, F , G, H e I en los rayos opuestos de DA, CB, DC, ÝÝÑ ÝÝÑ CD y BA respectivamente. Tenemos que =DAB – =ADG, =ADG – =EDC, =EDC – =DCB, =DCB – =CBI, =GDB – =IBD, 302 11.14. Cuadriláteros =ADB – =CBD, =CDB – =ABD, ADB – CBD, por lo tanto AB “ DC y AD “ BC. ‚ 11.14.20. Teorema. Si tres rectas paralelas m, n y l son cortadas por dos rectas diferentes r y s en los puntos A, B, C y D, E, F respectivamente y además AB “ BC, entonces DE “ EF . Demostración. Si s y r son paralelas, entonces el resultado se sigue directamente del teorema 11.14.19. Supongamos que r y s no son paralelas. Sea G P n tal que DG k r y H P l tal que EH k r. Por el postulado de las paralelas 11.13.11 tenemos que DG k EH, además por el teorema 11.14.19 y la hipótesis tenemos que DG “ AB “ BC “ EH. Ahora, por el corolario 11.13.10, =GDE – =HEF y =DEG – =EF H y del teorema LAA 11.12.10 concluimos el teorema. ‚ 11.14.21. Teorema. Un cuadrilátero convexo ˝ABCD está inscrito en alguna circunferencia si y sólo si >ABC ` >CDA “ 180˝ . Demostración. Si ˝ABCD está inscrito en alguna circunferencia, llamémosle Q al centro Ŕ es una media circunferencia, entonces también lo es ABC, Ő por de tal circunferencia. Si ADC lo que debido al teorema 11.13.32, los ángulos =ABC y =ADC son rectos, teniéndose así >ABC ` >CDA “ 180˝ . Ŕ es un arco menor, entonces ABC Ő es un arco mayor y por los teoremas 11.13.33 Si ADC ` >AQC “ 180˝ y análogamente se tiene y 11.13.34 se tiene >ABC ` >CDA “ 180˝ ´ >AQC 2 2 Ŕ es un arco mayor. De esta forma, el hecho de que ˝ABCD está el resultado cuando ADC inscrito en alguna circunferencia implica que >ABC ` >CDA “ 180˝ . Supongamos ahora que >ABC ` >CDA “ 180˝ y sea c la circunferencia en la cual está ÝÝÑ inscrito el triángulo ŸABC y D1 el punto en el rayo BD tal que D1 P c. De lo ya demostrado tenemos que >ABC ` >CD1 A “ 180˝ . Si D estuviera en el interior de c, entonces por el teorema 11.13.35 >ADC ą >AD1 C y no se cumpliría que >ABC ` >CDA “ 180˝ . Si D estuviera en el exterior de c, entonces por el teorema 11.13.35 >ADC ă >AD1 C y tampoco se cumpliría que >ABC ` >CDA “ 180˝ . Así, la única posibilidad es que D P c. ‚ Ejercicios. 1. Demostrar que si en un cuadrilátero convexo ˝ABCD se tiene que AB “ BC y CD “ ÐÑ DA, entonces la recta BD es mediatriz del segmento AC. ¿Qué ocurre si se elimina la hipótesis de que el cuadrilátero sea convexo? 11.15. Semejanza y proporcionalidad 11.15. 303 Semejanza y proporcionalidad Podemos observar que la idea de que dos figuras sean congruentes es que tengan la misma forma y el mismo tamaño (ya sea finito o infinito). La idea de que dos figuras sean semejantes es que tengan la misma forma aunque posiblemente tengan diferente tamaño. En esta sección estableceremos el concepto de semejanza y sus propiedades principales. 11.15.1. Definición. Dada una correspondencia ABC ÐÑ DEF entre dos triángulos, decimos que la correspondencia es una semejanza si los ángulos correspondientes son congruentes y además BC AC AB “ “ . DE EF DF Al hecho de que la correspondencia ABC ÐÑ DEF se una semejanza lo denotaremos así ABC „ DEF y diremos que los triángulos ŸABC y ŸDEF son semejantes, denotando este último hecho así ŸABC „ ŸDEF . Definamos ahora el concepto de proporcionalidad que nos facilitará el lenguaje. 11.15.2. Definición. Dos sucesiones finitas de números positivos pak qnk“1 y pbk qnk“1 son proporcionales si para cada k P Jn “ t1, 2, . . . , nu tenemos a2 ak an a1 “ “ ¨¨¨ “ “ ¨¨¨ “ . b1 b2 bk bn Al valor común de ak bk se le llama constante de proporcionalidad. 11.15.3. Definición. Dos sucesiones finitas de segmentos son proporcionales si sus longitudes respectivas son sucesiones de números proporcionales. En la definición de semejanza podríamos decir que la correspondencia ABC ÐÑ DEF es una semejanza si y sólo si los ángulos correspondientes son congruentes y los lados correspondientes son proporcionales. El concepto de proporcionalidad se puede generalizar a cualquier tipo de funciones con valores numéricos. 11.15.4. Definición. Dos funciones f : A Ñ R y g : A Ñ R son proporcionales si existe un α P R diferente de cero, tal que f “ αg. Al número α se le llama constante de proporcionalidad entre f y g. Para indicar que f y g son proporcionales se acostumbra escribir f 9g. 11.15.5. Teorema fundamental de la proporcionalidad. En un ŸABC, si D P AB, E P AC y DE k BC; entonces AB AC “ . AD AE Demostración. Demostremos primero la siguiente afirmación que es un caso particular del teorema: Si existe un D1 P AB y números enteros n y m tales que npAD1 q “ AB y mpAD1 q “ AD, AB AC entonces AD “ AE . 304 11.15. Semejanza y proporcionalidad ÝÝÑ En efecto, para cada número natural k, sea Dk P AB tal que ADk “ kpAD1 q. Sea ahora ÝÝÑ Ek P AC, tal que Dk Ek k BC (o bien Dk Ek “ BC). Observemos que Dk Dk`1 “ AD1 , luego, por el teorema 11.14.20 AE1 “ E1 E2 “ E2 E3 “ ¨ ¨ ¨ “ Ek Ek`1 “ Ek`1 Ek`2 “ ¨ ¨ ¨ , por lo tanto AB npAD1 q n npAE1 q AC “ “ “ “ , AD mpAD1 q m mpAE1 q AE con lo que queda demostrada la afirmación. ÝÝÑ En el caso general, para k P N sea Dk˚ P AD tal que ADk˚ “ AD y sea mk el primer entero k ÝÝÑ ˚ ˚ ˚ ˚ positivo tal que mk pADk q ą AB. Sea a la vez Ek P AE tal que Dk Ek k BC. Tomemos ahora ÝÝÑ ÝÝÑ Bk P AD tal que ABk “ mk pADk˚ q y Ck P AE tal que Bk Ck k BC (o bien Bk Ck “ BC, en cuyo caso el teorema ya está demostrado). k k “ AC , pero podemos De la afirmación demostrada anteriormente concluimos que AB AD AE AD , por lo observar que ABk “ AB ` δk y ACk “ AC ` k , donde 0 ă δk ĺ k y 0 ă k ĺ AE k cual AB ` δk AC ` k “ , AD AE por lo tanto ˇ ˇ ˇ ˇ ˇ ˇ AB AC ˇ ˇ k k δ δk 2 k ˇ ˇ ˇ ˇ ˇ AD ´ AE ˇ “ ˇ AE ´ AD ˇ ĺ AE ` AD ĺ k , AB AC es decir | AD ´ AE | ĺ k2 para todo k P N y debido a la propiedad arquimediana, lo anterior AB AC significa que el número | AD ´ AE | ľ 0 es menor que cualquier número positivo, pero el único número real no negativo menor que cualquier número positivo es el cero, por lo tanto ˇ ˇ ˇ AB AC ˇ ˇ ˇ ˇ AD ´ AE ˇ “ 0, de donde concluimos que AB AD “ AC , AE con lo cual terminamos la demostración. ‚ El siguiente corolario se deduce directamente del teorema anterior. 11.15.6. Corolario. En un ŸABC, si D P AB, E P AC y DE k BC; entonces AB AD “ . AC AE El teorema fundamental de la proporcionalidad 11.15.5 tiene el siguiente teorema recíproco. 11.15.7. Teorema. En un ŸABC, si D P AB, E P AC y además AB AC “ . AD AE Entonces DE k BC. Demostración. Sea l la recta paralela a DE a la cual pertenece B. por el postulado de las ÐÑ ÐÑ paralelas la única recta paralela a l a la cual pertenece E es DE, por lo que l corta a AC en ÝÝÑ algún punto C 1 P EC. 11.15. Semejanza y proporcionalidad 305 Usando el teorema fundamental de la proporcionalidad tenemos AB AC 1 “ , AD AE pero por hipótesis AC 1 AB “ , AD AE de donde AC “ AC 1 y por el teorema de localización de puntos obtenemos que C “ C 1 , con ÐÑ lo que l “ BC k DE. ‚ 11.15.8. Teorema de semejanza AAA. Dada una correspondencia entre dos triángulos tal que los ángulos correspondientes son congruentes, se tiene que la correspondencia es una semejanza. Demostración. Sean ŸABC y ŸDEF dos triángulos tales que en la correspondencia ABC ÐÑ ÝÝÑ ÝÝÑ DEF los ángulos correspondientes son congruentes. Sea E 1 P AB y F 1 P AC tales que AE 1 “ DE y AF 1 “ DF . Por el postulado LAL 11.10.4 tenemos que AE 1 F 1 – DEF . Ahora, por el teorema de los ángulos opuestos por el vértice y el teorema 11.13.9 tenemos que ÐÝ Ñ ÐÑ E 1 F 1 k BC y por el teorema fundamental de la proporcionalidad tenemos que AB AC “ , 1 AE AF 1 pero como AE 1 “ DE y AF 1 “ DF , se sigue que AC AB “ . DE DF Análogamente se tiene la igualdad BC AB “ EF DE con lo que el teorema queda demostrado. ‚ Del hecho de que la suma de las medidas de los ángulos de un triángulo es π “ 180˝ se tiene el siguiente corolario. 11.15.9. Corolario AA. Dada una correspondencia entre dos triángulos en la cual dos pares de ángulos sean congruentes, se tiene que la correspondencia es una semejanza. 11.15.10. Corolario. Si una recta paralela a un lado de un triángulo dado interseca a los otros dos lados en puntos diferentes, entonces determina un triángulo semejante al triángulo dado. ÐÑ ÐÑ Otra forma de enunciar el corolario 11.15.10 es: Si ŸABC es un triángulo, DE k BC tal que D está entre A y B, y E está entre A y C, entonces ABC ÐÑ ADE es una semejanza. ÐÑ ÐÑ Demostración. Como DE k BC, entonces =ADE – =ABC, por lo que debido al corolario AA ABC „ ADE. ‚ Los siguientes dos teoremas se dejan como ejercicio. En uno se usan para su demostración manipulaciones algebraicas simples y construcciones del estilo de las que se han visto en esta sección. 306 11.15. Semejanza y proporcionalidad 11.15.11. Teorema. La relación „ de semejanza entre triángulos es una relación de equivalencia. 11.15.12. Teorema de semejanza LAL. En los triángulos ŸABC y ŸDEF se tiene la AC AB “ DF y =BAC – =EDF . Con estas condiciones correspondencia ABC ÐÑ DEF donde DE ABC „ DEF . Otra forma de enunciar el teorema es la siguiente: Dada una correspondencia entre dos triángulos. Si dos pares de lados correspondientes son proporcionales y los ángulos comprendidos entre estos lados son congruentes, entonces la correspondencia es una semejanza. 11.15.13. Teorema de semejanza LLL. Dada una correspondencia entre dos triángulos. Si los lados correspondientes son proporcionales, entonces la correspondencia es una semejanza. Otra forma de enunciar el teorema es la siguiente: Dados dos triángulos ŸABC y ŸDEF , si AC BC AB “ “ , DE DF EF entonces ABC „ DEF . Demostración. En la demostración se darán solamente una serie de afirmaciones que el lector deberá justificar. ÝÝÑ ÝÝÑ 1. Sean E 1 y F 1 puntos en AB y BC respectivamente tales que AE 1 “ DE y AF 1 “ DF . 2. AB DE “ AC DF 3. AB AE 1 “ AC . AF 1 “ BC . EF 4. ABC – AE 1 F 1 . 5. E1F 1 BC “ AE 1 . AB 1 6. E 1 F 1 “ BC AE “ BC DE . AB AB 7. EF “ BC DE . AB 8. E 1 F 1 “ EF . 9. AE 1 F 1 – DEF . 10. ABC „ DEF . ‚ 11.15.14. Teorema. Sea ŸABC un triángulo rectángulo con =ACB recto. Tomando como ÐÑ base la longitud de la hipotenusa y D P AB tal que CD es la altura correspondiente. Tenemos que D está entre A y B, y además ABC „ ACD „ CBE. Demostración. Como los ángulos =CBA y =CAB son agudos, entonces D debe estar entre A y B porque de otro modo se contradiría al teorema del ángulo externo. Ahora, como los ángulos agudos de un triángulo rectángulo son complementarios, se tiene que las correspondencias ABC ÐÑ ACD y ACD ÐÑ CBD son semejanzas debido al teorema de semejanza AAA. ‚ 11.15. Semejanza y proporcionalidad 307 El siguiente teorema (teorema de Pitágoras) es uno de los más importantes de las matemáticas. Se ha creído que Pitágoras o alguno de sus discípulos fue el primero en demostrarlo, aunque la demostración más antigua de la que se tenga registro en la antigua Grecia se encuentra en «Los Elementos» de Euclides que fueron escritos alrededor de 300 años antes de Cristo, es decir casi 200 años después de la muerte de Pitágoras. Sin embargo, en China, durante la dinastía Han (206 A. C. al 220 D. C.) los astrónomos usaban el libro «Chou Pei Suan Ching» (La aritmética clásica del gnomon y las órbitas del firmamento), en el cual se encuentra una demostración del teorema de Pitágoras. No se conoce la fecha en que fue escrito el Chou Pei Suan Ching, las fechas estimadas varían desde 500 años antes de Cristo hasta 300 años antes de Cristo, aunque hay quienes dicen que es más antiguo. Se sabe que en la antigua Babilonia, mil años antes de Pitágoras ya se tenía conocimiento del teorema, pero no hay vestigios de ninguna demostración de esa época. 11.15.15. Teorema de Pitágoras. En un triángulo rectángulo la suma de los cuadrados de las longitudes de los catetos es igual al cuadrado de la longitud de la hipotenusa. Demostración. Sea ŸABC un triángulo rectángulo con =ACB recto. Sea D P AB tal AB BC AC que CD K AB. Por el teorema 11.15.14 tenemos que BC “ BD y AB “ AD , por lo tanto AC 2 2 pBCq ` pACq “ pABqpBDq ` pABqpADq “ pABqpBD ` ADq “ pABqpABq “ pABq2 , con lo que el teorema está demostrado. ‚ C A B B B B D B B B El siguiente teorema, que se puede ver como una generalización del teorema de Pitágoras, fue demostrado en el siglo II por el astrónomo griego Claudio Ptolomeo quien tenía una concepción geocéntrica del universo. 11.15.16. Teorema de Ptolomeo. Una condición necesaria y suficiente para que un cuadrilátero ˝ABCD esté inscrito en una circunferencia es que se satisfaga la siguiente fórmula pABqpCDq ` pBCqpADq “ pACqpBDq. Demostración. Supongamos primero que ˝ABCD está inscrito en una circunferencia. Sea E P AC tal que =ADB – =CDE. Por el teorema 11.13.33, =ABD – =ACD, =DAC – =DBC, =ADB – =ACB y =CDB – =CAB. Por el teorema de adición de ángulos 11.8.9 =ADE – =CDB. Ahora, por el corolario AA 11.15.9 tenemos que CDE „ BDA y AED „ BCD. Por lo tanto CD EC “ BD AB y AD AE “ , BD BC 308 11.15. Semejanza y proporcionalidad de donde obtenemos pABqpCDq ` pBCqpADq “ pECqpBDq ` pAEqpBDq “ pEC ` AEqpBDq “ pACqpBDq, es decir se satisface la fórmula. Supongamos ahora que se satisface la fórmula pABqpCDq ` pBCqpADq “ pACqpBDq. AD Tomemos E en el interior del ángulo =ADC tal que =CDE – =ADB y BD “ DE . Por el DC teorema de semejanza LAL 11.15.12 tenemos que EDC „ ADB y además BDC „ ADE, AB “ BD , =CED – =DAB, BC “ BD y =DEA – =DCB. Ahora, pAE ` por lo tanto EC CD AE AD ECqBD “ pBCqpADq ` pABqpCDq y >CED ` >DEA “ >DAB ` >DCB. Más aún, pACqpBDq “ pABqpCDq ` pBCqpADq “ pAE ` ECqpBDq, de modo que AC “ AE ` EC, lo que implica que E está entre A y C. Así tenemos que >DAB ` >DCB “ >CED ` >DEA “ 180˝ , con lo que, por el teorema 11.14.21, ˝ABCD está inscrito en una circunferencia. Ejercicios. 1. Demostrar los teoremas 11.15.11 y 11.15.12. ‚ 11.16. Áreas 11.16. 309 Áreas Otro término no definido que introduciremos a continuación es el de área. Dado cualquier plano, a algunos subconjuntos Ω del plano se les asigna un único número apΩq mayor o igual que cero que se llama el área de Ω y es tal que satisface los postulados de esta sección. 11.16.1. Definición. Una región poligonal es las unión de un número finito de regiones triangulares en un plano, tales que si dos regiones triangulares se intersecan, entonces su intersección está incluida en un segmento. 11.16.2. Postulado de la congruencia para áreas. Si dos conjuntos con área son congruentes, entonces tienen la misma área. En particular, si dos triángulos son congruentes, las regiones triangulares determinadas por ellos tienen la misma área. 11.16.3. Postulado de adición de áreas. Si Ω es la unión de dos conjuntos en un plano Ω1 y Ω2 con áreas apΩ1 q y apΩ2 q respectivamente, y Ω1 X Ω2 es la unión finita de subconjuntos de segmentos. Entonces apΩq “ apΩ1 q ` apΩ2 q. 11.16.4. Postulado. Sean Ω1 y Ω2 dos conjuntos con área. a) Si Ω1 Ă Ω2 . Entonces apΩ2 zΩ1 q “ apΩ2 q ´ apΩ1 q. b) Si Ω1 Ă Ω2 y Ω2 tiene área cero, entonces también Ω1 tiene área cero. c) Cualquier segmento tiene área cero. d) Cualquier región poligonal es un conjunto con área. 11.16.5. Postulado. El área de una región rectangular es el producto de una base y su altura correspondiente. 11.16.6. Notación. Cuando escribamos apŸABCq nos estaremos refiriendo al área de la región triangular determinada por el ŸABC. Cuando escribamos ap˝ABCDq nos estaremos refiriendo al área de la región determinada por el ˝ABCD. Por razones de brevedad a veces abusaremos del lenguaje y diremos área del triángulo, cuadrado, rectángulo, etc. cuando en realidad queremos decir área de la región cuadrada, región triangular, región rectangular, etc. 11.16.7. Teorema. El área de un triángulo rectángulo es la mitad del producto de las longitudes de sus catetos. Demostración. Sea ŸABC un triángulo cuyo ángulo =C es recto. Sea D un punto del ÐÑ mismo lado que A de BC tal que BD K BC y BD “ AC. Por el teorema de adición de ángulos 11.8.9 y el corolario 11.13.19 tenemos =DBA – =CAB, por lo que ABC ÐÑ BAD es una correspondencia LAL, de modo que AD k BC y BD k AC con lo que además DA K AC, es 310 11.16. Áreas decir ˝ACBD es un rectángulo. Pero como ABC – BAD y ŸABC X ŸBAD “ AB, se tiene que ap˝ACBDq “ apŸABCq ` apŸBADq “ 2 apŸABCq, es decir ap˝ACBDq pACqpBCq “ . ‚ 2 2 11.16.8. Teorema. El área de un triángulo es la mitad del producto de cualquier base y su altura correspondiente. apŸABCq “ Demostración. Sea ŸABC un triángulo, tomemos AB como base y sea CD la altura con ÐÑ D P AB. Tenemos tres posibilidades: a) D está entre A y B; b) D “ A ó D “ B; y c) D R AB. Cuando se tiene la posibilidad b), entonces ŸABC es un triángulo rectángulo y el resultado se sigue del teorema 11.16.7. Si se tiene la posibilidad a), entonces por el postulado de adición de áreas 11.16.3 y por el teorema 11.16.7 pADqpDCq pDBqpDCq ` , apŸABCq “ apŸADCq ` apŸCDBq “ 2 2 pero como D está entre A y B tenemos que AD ` DB “ AB, por lo cual pABqpDCq apŸABCq “ . 2 Ahora supongamos que D R AB y consideremos el caso en que A está entre D y B (el caso en que B está entre D y A se resuelve de manera análoga). Por argumentos similares a los del caso (a) tenemos que pDBqpDCq pDA ` ABqpDCq “ “ apŸCDBq “ apŸCDAq ` apŸABCq 2 2 pDAqpDCq “ ` apŸABCq, 2 por lo que apŸABCq “ pABqpDCq . 2 ‚ El lector debe estar listo para demostrar el siguiente teorema importante. 11.16.9. Teorema del área de un trapecio. El área de un trapecio es la mitad de la suma de sus bases por su altura correspondiente. Es decir, si en el trapecio ˝ABCD tenemos ÐÑ ÐÑ BC k AD y CE es la distancia entre BC y AD, entonces ap˝ABCDq “ 12 pAD ` BCqCE. B C Q Q Q Q Q Q Q Q Q Q Q A E D 11.16. Áreas 311 La demostración queda como ejercicio aunque se sugiere calcular las áreas de los triángulos ŸABC y ŸACD tomando como altura común al número CE. 11.16.10. Teorema de las áreas de triángulos semejantes. Si ŸABC y ŸDEF son dos AB “ triángulos tales que ABC „ DEF , entonces apŸABCq “ α2 apŸDEF q, donde α “ DE BC AC “ DF . EF Demostración. Cuando los triángulos son congruentes, se tiene que α “ 1 y la igualdad se cumple por el postulado de la congruencia. Supongamos, sin pérdida de generalidad que ÝÝÑ ÝÝÑ ÐÑ 1 1 1 1 α ă 1. Sean A P ED y C P EF tales que EA “ BA y EC “ BC; tomemos Q P DF tal ÐÝ 1Ñ 1 ÐÑ ÐÑ ÐÑ ÐÑ ÐÑ que EQ K DF y sea P el punto de intersección de EQ con A C . Como AC k DF , tenemos que QE DF DE “ “ α, 1 1 “ 1 AC AE PE por lo que 1 1 1 1 apŸABCq “ apŸA EC q “ 12 pA C qpP Eq “ 12 αpDF qαpEQq “ α2 apŸDEF q. ‚ 11.16.11. Fórmula de Herón. Sea ŸABC un triángulo, a “ BC, b “ AC, c “ AB y s “ a`b`c . Se tiene la fórmula siguiente: 2 apŸABCq “ a sps ´ aqps ´ bqps ´ cq. Demostración. Supongamos sin pérdida de generalidad que en el triángulo ŸABC el ángulo =C tiene medida mayor o igual que las de los otros ángulos. Sea P P AB tal que CP K AB y sean h “ CP , p “ P B y q “ P A. Observemos lo siguiente: 2s “ a ` b ` c 2ps ´ aq “ ´a ` b ` c 2ps ´ bq “ a ´ b ` c 2ps ´ cq “ a ` b ´ c y p ` q “ c. Del teorema de Pitágoras tenemos h2 ` p2 “ a2 y h2 ` q 2 “ b2 , pero como q “ c ´ p, entonces q 2 “ pc ´ pq2 “ c2 ´ 2cp ` p2 , por lo tanto b2 “ h2 ` q 2 “ h2 ` c2 ´ 2cp ` p2 “ a2 ´ 2cp ` p2 , es decir p“ a2 ` c 2 ´ b 2 . 2c 312 11.16. Áreas Por otra parte tenemos que ˆ ˙ˆ ˙ a2 ` c 2 ´ b 2 a2 ` c 2 ´ b 2 h “ a ´ p “ pa ` pqpa ´ pq “ a ` a´ 2c 2c p2ac ` a2 ` c2 ´ b2 qp2ac ´ a2 ´ c2 ` b2 q ppa ` bq ´ b2 qpb2 ´ pa ´ cq2 q “ “ 4c2 4c2 pa ` b ` cqpa ` c ´ bqpb ` a ´ cqpb ´ a ` cq “ 4c2 pa ` b ` cqp´a ` b ` cqpa ´ b ` cqpa ` b ´ cq 2s ¨ 2ps ´ aq ¨ 2ps ´ bq ¨ 2ps ´ cq “ “ 2 4c 4c2 4sps ´ aqps ´ bqps ´ cq “ , c2 2 2 2 por lo tanto, por el teorema 11.16.8 tenemos que apŸABCq “ Ejercicios. 1. Demostrar el teorema 11.16.9. ch a “ sps ´ aqps ´ bqps ´ cq. 2 ‚ 11.17. Área del círculo y sectores circulares 11.17. 313 Área del círculo y sectores circulares En esta sección introduciremos el concepto de área de un círculo, el de área de secciones de círculo y daremos algunas de sus propiedades más importantes. Ŋ un arco de circunferencia con centro Q y radio r. La unión 11.17.1. Definición. Sea AB Ŋ se llama sector circular o más de todos los segmentos de la forma QP , con P P AB Ŋ precisamente sector determinado por AB y r es el radio del sector circular o radio del Ŋ arco AB. n`1 Sea c una circunferencia con centroŤQ y radio r, y pPk qk“1 una sucesión finita de puntos en ÝÝÑ n c que son los vértices de un polígono k“1 Pk Pk`1 de n lados. Para cada rayo QPk sea Pk1 un punto tal que QPk1 “ 1. Por el teorema de semejanza LAL se deduce que cada ŸPk QPk`1 es se1 1 , por el teorema 11.15.7 Pk Pk`1 k Pk1 Pk`1 mejante con ŸPk1 QPk`1 y además la constante de pro1 1 1 q porcionalidad es r, es decir Pk Pk`1 “ rpP k P k ` 1 q, además apŸPk QPk`1 q “ r2 apŸPk1 QPk`1 1 1 puesto que las alturas correspondientes a las bases Pk Pk`1 y Pk Pk`1 son también proporcionales con la misma constante de proporcionalidad r (lo anterior es también por el teorema fundamental de la proporcionalidad). Ahora, esto nos da una correspondencia biunívoca (biyección) entre las poligonales cerradas simples inscritas en c y las inscritas en la circunferencia con centro en Q y radio 1 de tal forma que si la poligonal inscrita en la de radio 1 tiene longitud α, la inscrita en c tiene longitud rα. Como la longitud de una circunferencia de radio 1 es 2π, de la definición de longitud de circunferencia se deduce que la longitud de c es 2πr. Es decir, tenemos el teorema siguiente. 11.17.2. Teorema. La longitud de una circunferencia de radio r es 2πr. De forma similar se deduce el siguiente teorema. Ŋ un arco de circunferencia con centro en Q, radio r y que es 11.17.3. Teorema. Sea AB Ŋ “ rθ. interceptado por =AQB. Si θ “ >AQB, entonces `AB 11.17.4. Postulado. El área de un círculo es el supremo de las áreas de las regiones delimitadas por polígonos inscritos en él. Ŋ con centro en Q es el supremo 11.17.5. Postulado. El área de un sector determinado por AB de las áreas de las regiones poligonales que están delimitadas por los segmentos QA y QB y Ŋ una poligonal inscrita en AB. Ŋ es AB. 11.17.6. Definición. La cuerda de un arco AB De la definición de longitud de arco y de la desigualdad del triángulo se deduce el siguiente teorema. 11.17.7. Teorema. La longitud de un arco es mayor que la de su cuerda. 11.17.8. Lema. El área de un círculo de radio r es menor o igual que πr2 . n`1 Demostración. Sea c una circunferencia Ťn con centro Q y radio r, pPk qk“1 la sucesión de vértices de una poligonal cerrada simple k“1 Pk Pk`1 que está inscrita en c. La región delimitada ř por tal poligonal tiene un área de nk“1 Pk P2k`1 ak , donde ak es la altura correspondiente a la base Pk Pk`1 en el triángulo ŸPk QPk`1 . El lema se deduce del hecho de que n n n ÿ ÿ pPk Pk`1 q pPk Pk`1 q rÿ r ak ă r“ Pk Pk`1 ĺ 2πr “ πr2 . ‚ 2 2 2 k“1 2 k“1 k“1 314 11.17. Área del círculo y sectores circulares 11.17.9. Lema. El área de un círculo de radio r es mayor o igual que πr2 . Demostración. Sea c una circunferencia de radio r y α ă πr2 . Como α ă πr2 , entonces n ď n`1 2α ă 2πr por lo que existe una sucesión de vértices pP q en c de un polígono Pk Pk`1 k k“1 r k“1 ř . tal que nk“1 Pk Pk`1 ą 2α r Ahora, sea Pk˚ P c tal que QPk˚ K Pk Pk`1 . El área apŸPk QPk`1 q es menor que el área ap˝Pk QPk`1 Pk˚ q. Pero la región ř delimitada por el polígono cuyos vértices son los puntos Pk y Pk˚ con k P Jn tiene área nk“1 ap˝Pk QPk`1 Pk˚ q. Pero ˆ ˙ n n n ÿ ÿ rÿ r 2α pPk Pk`1 q ˚ “ Pk Pk`1 ą “ α. ap˝Pk QPk`1 Pk q “ r 2 2 k“1 2 r k“1 k“1 Es decir, el área del círculo de radio r es mayor que α para todo α ă πr2 , por lo tanto el área es mayor o igual que πr2 . ‚ Los lemas 11.17.8 y 11.17.9 nos conducen al siguiente teorema. 11.17.10. Teorema. El área de un círculo de radio r es πr2 . De manera similar a como se demostró el teorema 11.17.10 (usando lemas similares a los lemas 11.17.8 y 11.17.9 que el lector podrá enunciar y cuyas demostraciones son análogas) se demuestra el siguiente teorema. 11.17.11. Teorema. El área de un sector determinado por un arco cuyo ángulo central mide θ es 21 r2 θ. El lector que haya leído y comprendido lo que va de la sección, debe ser capaz de demostrar fácilmente el siguiente teorema. 11.17.12. Teorema. Si un sector circular está inscrito en una región poligonal, entonces el área del sector circular es menor que el área de la región poligonal. Si una región poligonal está inscrita en un sector circular, entonces el área de la región poligonal es menor que el área del sector circular. Cualquier circunferencia C de radio r está incluida en un círculo de radio r y fuera de un círculo de radio r ´ ε, para todo ε P p0; rq, de manera que, por el teorema 11.17.10 y por el postulado 11.16.4 la circunferencia C está incluida en un conjunto con área πpr2 ´ pr ´ εq2 q que tiende a 0 cuando ε tiende a 0, resultando así natural el postulado siguiente. 11.17.13. Postulado. El área de cualquier circunferencia es cero. Ejercicios. 1. Demostrar que π ą 2. ? 2. Demostrar que π ą 2 2. 3. Demostrar que π ą 3. 4. Demostrar que π ă 4. ? 5. Demostrar que π ă 2 3. 6. Demostrar el teorema 11.17.12. 11.18. Sistemas de coordenadas 11.18. 315 Sistemas de coordenadas En esta sección daremos la terminología necesaria para poder empezar a incursionar en la disciplina de la geometría analítica. 11.18.1. Definición. Sean dos rectas perpendiculares X e Y que se intersecan en un punto O. En ambas rectas tomamos un sistema de coordenadas tal que al punto O le corresponde el cero. Al plano que incluye las rectas X e Y le llamamos plano XY. 11.18.2. Definición. Dado un plano XY, haremos corresponder a cada punto P del plano XY una pareja ordenada px, yq de números reales de tal forma que x es la coordenada del punto A en la recta X tal que A está en la recta perpendicular a X que pasa por P (es decir, A es la proyección de P en X) y y es la coordenada del punto B en la recta Y tal que B está en la recta perpendicular a Y que pasa por P (es decir, B es la proyección de P en Y). A una correspondencia como la anterior se le llama sistema de coordenadas del plano XY. Cuando tenemos una correspondencia como la anterior, a la recta X se le llama eje de las abscisas y a la recta Y se le llama eje de las ordenadas. A la pareja ordenada px, yq que le corresponde a P le llamamos coordenadas de P o pareja de coordenadas de P . El número x es la primera coordenada de P o abscisa de P y el número y es la segunda coordenada de P u ordenada de P . Al conjunto de puntos A P X cuya primera coordenada sea positiva se le llama semieje X positivo o parte positiva del eje X. Al punto O cuyas coordenadas son p0, 0q se le llama origen del sistema de coordenadas. 11.18.3. Definición. En el plano XY al eje X y a todas las rectas paralelas al eje X se les llama rectas horizontales. Al eje Y y a todas las rectas paralelas al eje Y se les llama rectas verticales. Cualquier rayo o segmento incluido en una recta horizontal se llama horizontal y cualquier rayo o segmento incluido en una recta vertical se llama vertical. 11.18.4. Notación. En lo sucesivo de esta sección consideraremos un sistema de coordenadas fijo sin necesidad de especificarlo y para cada punto Q del plano XY CpQq denotará las coordenadas de Q. 11.18.5. Teorema. Si el punto con coordenadas px0 , y0 q está en una recta horizontal l, entonces l “ tQ : CpQq “ px, y0 q, con x P Ru. Demostración. Como l es horizontal, entonces es perpendicular al eje Y y lo corta en el punto con coordenadas p0, y0 q. Ahora, en el plano XY la perpendicular al eje Y en el punto con coordenadas p0, y0 q es única, de modo que si x P R, entonces el punto con coordenadas px, y0 q está en l. Recíprocamente, si un punto Q P l tiene coordenadas px, yq, entonces la segunda coordenada es y0 , pues la proyección de Q en el eje Y es el punto C ´1 p0, y0 q, es decir y “ y0 . ‚ La demostración del siguiente teorema es análoga a la del anterior. 11.18.6. Teorema. Si un punto con coordenadas px0 , y0 q está en una recta vertical l, entonces l “ tQ : CpQq “ px0 , yq, con y P Ru. 316 11.18. Sistemas de coordenadas 11.18.7. Definición. Si C ´1 px0 , y0 q está en una recta no vertical, el lado de la recta en el cual está C ´1 px0 , y0 ` 1q se llama el lado de arriba de la recta y al lado opuesto se le llama el lado de abajo de la recta. Si C ´1 px0 , y0 q está en una recta no horizontal, el lado de la recta en el cual está px0 ` 1, y0 q se llama el lado derecho de la recta y al lado opuesto se le llama el lado izquierdo de la recta. 11.18.8. Definición. En el plano XY al conjunto de puntos que están arriba del eje X y a la derecha del eje Y se le llama primer cuadrante; al conjunto de puntos que están arriba del eje X y a la izquierda del eje Y se le llama segundo cuadrante; al conjunto de puntos que están abajo del eje X y a la izquierda del eje Y se le llama tercer cuadrante, y al conjunto de puntos que están abajo del eje X y a la derecha del eje Y se le llama cuarto cuadrante. 11.18.9. Definición. Una recta que no es vertical ni horizontal se llama recta inclinada u oblicua. Del teorema de Pitágoras se sigue la fórmula para calcular la distancia entre dos puntos en el plano dadas sus coordenadas. Los detalles de la demostración se dejan al lector. 11.18.10. Fórmula para la distancia entre dos puntos en el plano. Sea P “ C ´1 px, yq y Q “ C ´1 pa, bq. a P Q “ px ´ aq2 ` py ´ bq2 . 11.18.11. Definición. Sean P y Q dos puntos tales que tienen la misma abscisa y la ordenada de P es menor que la de Q. En estas condiciones decimos que Q está arriba de P o que P está abajo de Q. 11.18.12. Definición. Sean P y Q dos puntos tales que tienen la misma ordenada y la abscisa de P es menor que la de Q. En estas condiciones decimos que Q está a la derecha de P o que P está a la izquierda de Q. Así como se definió un sistema de coordenadas en el plano XY también se puede definir un sistema de coordenadas en el espacio de tres dimensiones de la siguiente forma. 11.18.13. Definición. Supongamos que tenemos el plano XY con su sistema de coordenadas. Sea Z la recta perpendicular al plano XY en el origen O y tómese en la recta Z un sistema de coordenadas tal que la coordenada de O sea el número 0. Tomemos la biyección entre el espacio y el conjunto R3 de ternas de números reales tal que a cada punto P del espacio le hace corresponder la única terna px, y, zq con la propiedad de que px, yq son las coordenadas de la proyección del punto P en el plano XY e y es la coordenada de la proyección del punto P en la recta Z. Una biyección como la anterior se llama sistema de coordenadas del espacio; a la terna px, y, zq se le llama coordenadas del punto P (con respecto al sistema de coordenadas establecido); se dice que los números x, y, y z son las primera, segunda y tercera coordenadas respectivamente del punto P . De acuerdo al sistema de coordenadas en el espacio establecido, a las rectas X, Y y Z se les llama ejes del espacio. Deduciremos ahora la fórmula para calcular la distancia entre dos puntos del espacio dadas sus coordenadas. 11.18.14. Fórmula para la distancia entre dos puntos en el espacio. Sea P un punto 11.18. Sistemas de coordenadas 317 en el espacio con coordenadas px, y, zq y Q otro punto en el espacio con coordenadas pa, b, cq. La distancia entre P y Q está dada por a P Q “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 . Demostración. Haremos la demostración con todo detalle para todos los posibles casos. Sean P 1 y Q1 las proyecciones de P y Q al plano XY, P 2 y Q2 las proyecciones de P y Q al eje Z y V el punto con coordenadas pa, b, zq. Observemos que QV “ Q2 P 2 (en el caso en que Q, V P Z se tiene que Q “ Q2 y que V “ P 2 , y en el caso en que Q y V no están en Z se tiene un rectángulo ˝QV P 2 Q2 , por lo que los lados opuestos QV y Q2 P 2 son congruentes. Analicemos primeroael caso extremo en que px, yq “ pa, bq. En este caso P Q “ P 1 Q1 “ a |z ´ c| “ pz ´ cq2 “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 , por lo que la fórmula es válida para este caso. Supongamos ahora que px, yq ‰ pa, bq, es decir queP 1 ‰ Q1 a Si z “ 0, entonces P “ P 1 y V “ Q1 por lo que la distancia entre P y V es px ´ aq2 ` py ´ bq2 . En este caso si c “ 0, entonces Q “ V , por lo que a a P Q “ px ´ aq2 ` py ´ bq2 “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 y si c ‰ 0, entonces QV “ Q2 V 2 “ |z ´ c| y por el teorema de Pitágoras 11.15.15 y observando V es el vértice ŸP V Q tenemos P Q “ b a del ángulo recto del triángulo rectángulo a a 2 2 2 2 2 2 pP V q ` pQV q “ p px ´ aq ` py ´ bq q ` |z ´ c| “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 por lo que la fórmula es válida cuando z “ 0. Si z ‰ 0, entonces en el rectángulo ˝P V Q1 P 1 los segmentos P V y P 1 Q1 son lados opuestos, a 1 1 2 2 por lo que P V “ P Q “ a este caso, si Q “ V , entonces z “ c y a px ´ aq ` py ´ bq . En 1 1 px ´ aq2 ` py ´ bq2 “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 , y si z ‰ PQ “ PV “ P Q “ 2 2 c, entonces QV “ Q V “ |z ´ c| y por el teorema de Pitágoras y a observando V es el vértice ŸP V Q tenemos P Q “ pP V q2 ` pQV q2 “ b a del ángulo recto del triángulo rectángulo a p px ´ aq2 ` py ´ bq2 q2 ` |z ´ c|2 “ px ´ aq2 ` py ´ bq2 ` pz ´ cq2 por lo que la fórmula es válida cuando z ‰ 0, con lo que terminamos la demostración. ‚ A continuación se dará un teorema que describe los puntos de una recta que pasa por dos puntos dados. 11.18.15. Teorema. Sean Q “ C ´1 px0 , y0 q y P “ C ´1 px1 , y1 q puntos en el plano XY. Se tienen las siguientes propiedades: ÐÑ a) QP “ tS P XY : CpSq “ pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q, para algún t P Ru. b) QP “ tS P XY : CpSq “ pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q, para algún t P r0; 1su. ÐÑ c) En el sistema de coordenadas de la recta QP que le hace corresponder a Q el cero y a P un número positivo tenemos que la coordenada del punto S “ C ´1 pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q es tpQP q. 318 11.18. Sistemas de coordenadas Antes de demostrar el teorema démosle una interpretación física. Si una partícula se ÐÑ mueve a velocidad constante a lo largo de la recta QP de tal manera que en una unidad de tiempo recorre una distancia QP y en el tiempo t0 “ 0 la partícula se encuentra en la posición del punto Q avanzando hacia P , entonces en un tiempo cualquiera t ‰ 0 la partícula estará (o estuvo) en la posición Sptq con coordenadas pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q, por ejemplo en el tiempo t1 “ 1 la partícula se encontrará en la posición P con coordenadas px1 , y1 q. Procedamos ahora a hacer la demostración del teorema. Demostración. Sea Sptq “ C ´1 pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q. Observemos primero que para cualquier número real t la distancia entre Q y Sptq está dada por a distpQ, Sptqq “ ptx1 ´ tx0 q2 ` pty1 ´ ty0 q2 “ |t|QP y la distancia entre Sptq y P está dada por a distpSptq, P q “ pp1 ´ tqpx1 ´ x0 qq2 ` pp1 ´ tqpy1 ´ y0 qq2 “ |1 ´ t|QP. Si en particular 0 ĺ t ĺ 1, entonces distpQ, Sptqq ` distpSptq, P q “ tQP ` p1 ´ tqQP “ QP por lo que Sptq P QP . ÐÑ Sea ahora x un número real y R el punto en QP con coordenada x (de acuerdo al sistema x de coordenadas que le asigna 0 a Q y un número positivo a P ), afirmamos que R “ Sp QP q. En efecto, si R P QP , entonces 0 ĺ x ĺ QP y además, puesto que la distancia entre Q y ÝÝÑ x x x Sp QP q es QP QP “ x, se tiene R “ Sp QP q; así, hemos demostrado b). Si R P QP y x ą QP , x x x q “ QP ` |1 ´ QP |QP “ QP ` p QP ´ 1qQP “ es decir R R QP , entonces QP ` distpP, Sp QP x x x x “ distpQ, Sp QP qq por lo que P está entre Q y Sp QP q y la coordenada de Sp QP q es x, es |x| x x decir R “ Sp QP q. Finalmente, si x ă 0, entonces distpSp QP q, Qq ` QP “ QP QP ` QP “ x x x x q y la p1 ´ QP qQP “ |1 ´ QP |QP “ distpSp QP q, P q, por lo que Q está entre P y Sp QP x x coordenada de Sp QP q es ´distpSp QP q, Qq “ ´|x| QP QP x “ x, es decir Sp QP q “ R, por lo que ÐÑ x la afirmación de que R “ Sp QP q está demostrada, por lo tanto QP Ă tS P XY : CpSq “ pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q para algún t P Ru. Para demostrar que tS P XY : CpSq “ ÐÑ pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 q para algún t P Ru Ă QP solamente observemos que el punto q es el punto sobre la recta con coordenada tQP con lo que queda demostrado Sptq “ Sp tQP QP a) y c). ‚ Queda como ejercicio para el lector la demostración del siguiente teorema que es una generalización del anterior para el caso en que P y Q son puntos cualesquiera en el espacio de tres dimensiones. 11.18.16. Teorema. En el espacio sean Q y P puntos con coordenadas px0 , y0 , z0 q y px1 , y1 , z1 q respectivamente. Se tienen las siguientes propiedades: ÐÑ a) QP “ tS : las coordenadas de S son pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 , p1 ´ tqz0 ` tz1 q para algún t P Ru. 11.18. Sistemas de coordenadas 319 b) QP “ tS : las coordenadas de S son pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 , p1 ´ tqz0 ` tz1 q para algún t P r0; 1su. ÐÑ c) En el sistema de coordenadas de la recta QP que le hace corresponder a Q el cero y a P un número positivo tenemos que la coordenada del punto S con coordenadas en el espacio pp1 ´ tqx0 ` tx1 , p1 ´ tqy0 ` ty1 , p1 ´ tqz0 `tz1 q es tpQP q. Ejercicios. ÝÝÑ 1. Si Q “ px0 , y0 q y P “ px1 , y1 q, entonces el rayo QP “ tpx, yq : x “ p1 ´ tqx0 ` tx1 y y “ p1 ´ tqy0 ` ty1 para algún t ľ 0}. 2. Demostrar el teorema 11.18.16. 320 11.19. Volúmenes 11.19. Volúmenes En esta sección se deducirán las fórmulas para obtener los volúmenes de los principales cuerpos geométricos como son los de los prismas, pirámides, los cuerpos cónicos y esféricos. A continuación se generalizará el concepto de semejanza. 11.19.1. Definición. Dos subconjuntos del espacio S1 y S2 son semejantes si existe una correspondencia biunívoca f : S1 ÝÑ S2 entre S1 y S2 y una constante positiva α tal que para cualesquiera dos puntos P y Q de S1 se tiene que la distancia entre P y Q es α veces la distancia entre f pP q y f pQq. A una correspondencia como la anterior se le llama semejanza. Al hecho de que S1 y S2 sean semejantes se le denota así S1 „ S2 . Observemos que con la definición anterior se conserva la idea de que dos figuras son semejantes si tienen la misma forma. Definamos ahora lo que es un prisma. 11.19.2. Definición. Sea B una región poligonal en un plano Π1 y Π2 un plano paralelo a Π1 ; sea además l una recta que corta a Π1 y Π2 pero que no corta a B. A la unión de todos los segmentos paralelos a l tales que uno de sus extremos está en B y el otro en Π2 se le llama prisma. A la región poligonal B se le llama base del prisma y a la distancia entre Π1 y Π2 se le llama altura del prisma. Cuando la recta l es perpendicular a Π1 , entonces el prisma se llama prisma recto. Cuando la base del prisma es una región delimitada por un paralelogramo, entonces el prisma se llama paralelepípedo. Cuando la base de un prisma recto es una región rectangular, al prisma recto se le llama paralelepípedo rectangular. Cuando la intersección de un prisma con un plano paralelo al plano en el cual está una de las bases es no vacía, entonces a la intersección se le llama sección transversal del prisma. Definiremos ahora lo que es una pirámide. 11.19.3. Definición. Sea B una región poligonal en un plano Π y V un punto que no está en Π. A la unión de todos los segmentos tales que uno de sus extremos es V y el otro está en B se le llama pirámide. A la región poligonal B se le llama base de la pirámide, al punto V se le llama vértice de la pirámide y a la distancia entre el plano Π y el vértice V se le llama altura de la pirámide. Cuando la intersección de una pirámide con un plano paralelo al plano en el cual está la base es no vacía, entonces a la intersección se le llama sección transversal de la pirámide. 11.19.4. Definición. Sea B un conjunto en un plano Π1 y Π2 un plano paralelo a Π1 ; sea además l una recta que corta a Π1 y Π2 pero que no corta a B. A la unión de todos los segmentos paralelos a l tales que uno de sus extremos está en B y el otro en Π2 se le llama cilindro. Al conjunto B se le llama base del cilindro y a la distancia entre Π1 y Π2 se le llama altura del cilindro. Cuando la recta l es perpendicular a Π1 , entonces el cilindro se llama cilindro recto. Cuando la intersección de un cilindro con un plano paralelo al plano en el cual está una de las bases es no vacía, entonces a la intersección se le llama sección transversal del cilindro. Cuando la base de un cilindro es un círculo, decimos que el cilindro es un cilindro circular. 11.19. Volúmenes 321 Observemos que los prismas son los cilindros cuya base es una región poligonal y que todos los cilindros tienen dos bases. 11.19.5. Definición. Sea B un conjunto contenido en un plano Π y V un punto que no está en Π. A la unión de todos los segmentos tales que uno de sus extremos es V y el otro está en B se le llama cono. Al conjunto B se le llama base del cono, al punto V se le llama vértice del cono y a la distancia entre el plano Π y el vértice V se le llama altura del cono. Cuando la intersección de un cono con un plano paralelo al plano en el cual está la base es no vacía, entonces a la intersección se le llama sección transversal del cono. Cuando la base del cono es un círculo, decimos que el cono es un cono circular. Si el segmento, cuyos extremos son el vértice del cono circular y el centro del círculo B, es perpendicular al plano Π, entonces decimos que el cono circular es un cono circular recto. Observemos que cualquier pirámide es un cono cuya base es una región poligonal. 11.19.6. Definición. Sea C un punto en el espacio y r un número positivo. Al conjunto de todos los puntos del espacio que están a una distancia r del punto C se le llama esfera. Al punto C se le llama centro de la esfera y al número r se le llama el radio de la esfera. Al conjunto de todos los puntos del espacio que están a una distancia menor que r del centro C de la esfera se le llama interior de la esfera y al conjunto de todos los puntos del espacio que están a una distancia mayor que r de C se le llama exterior de la esfera. A la unión de una esfera con su interior se le llama cuerpo esférico y el centro y radio de la esfera serán el centro y radio del cuerpo esférico respectivamente. Al igual que en la circunferencia, al doble del radio se le llama diámetro (de la esfera o del cuerpo esférico). Introduzcamos ahora la idea de volumen de subconjuntos del espacio la cual es similar a la de área. El término de volumen será el último no definido en este capítulo. Aceptemos que a algunos subconjuntos Ω del espacio se les asigna un único número volpΩq mayor o igual que cero que se llama el volumen de Ω y que satisface los siguientes 6 postulados. 11.19.7. Postulado de la congruencia para volúmenes. Si dos conjuntos con volumen son congruentes, entonces tienen el mismo volumen. 11.19.8. Postulado de adición de volúmenes. Si Ω es la unión de dos conjuntos en el espacio Ω1 y Ω2 con volúmenes volpΩ1 q y volpΩ2 q respectivamente, y Ω1 X Ω2 “ ∅. Entonces volpΩq “ volpΩ1 q ` volpΩ2 q. 11.19.9. Postulado. Sean Ω1 y Ω2 son dos conjuntos con volumen: a) Si Ω1 Ă Ω2 , entonces volpΩ2 zΩ1 q “ volpΩ2 q ´ volpΩ1 q. b) Si Ω1 Ă Ω2 y volpΩ2 q “ 0, entonces volpΩ1 q “ 0. c) Si Ω1 está incluido en algún plano, entonces volpΩ1 q “ 0. d) Ω1 Y Ω2 es un conjunto con volumen. 322 11.19. Volúmenes 11.19.10. Postulado. Si la base de un cilindro recto es un conjunto con área, entonces el volumen del cilindro es el producto del área de la base y su altura. 11.19.11. Postulado de Cavalieri (principio de Cavalieri). Dados dos subconjuntos del espacio y un plano. Supongamos que los dos conjuntos tiene asignado un volumen. Si todo plano paralelo al plano dado que interseca a uno de los dos conjuntos, interseca también al otro y las secciones intersecadas de ambos conjuntos tienen áreas iguales. Entonces ambos conjuntos tienen el mismo volumen. 11.19.12. Postulado. Los cuerpos esféricos, los conos cuya base es un conjunto con área y los cilindros cuya base es un conjunto con área son conjuntos con volumen. El siguiente teorema, que se deduce directamente del postulado 11.19.10 y de la fórmula para hallar el área de un círculo, nos da la importante fórmula para calcular el volumen de un cilindro circular recto. 11.19.13. Teorema. El volumen de un cilindro circular recto con altura h y radio de la base r, es πr2 h. 11.19.14. Teorema. Toda sección transversal de un cilindro es congruente con su base. Demostración. Supongamos que las dos bases distintas de un cilindro son B1 y B2 y que l es la recta tal que el cilindro es la unión de los segmentos paralelos a l con extremos en B1 y B2 . Si B 1 es una sección transversal del cilindro, entonces existe una correspondencia biunívoca entre los conjuntos B1 y B 1 tal que a cualquier punto P P B1 le corresponde el punto P 1 P B 1 tal que, P P 1 k l. Ahora, si P y Q son dos puntos diferentes en B1 y P 1 y Q1 son los puntos correspondientes en B 1 (de acuerdo a la correspondencia anterior), podemos observar que ˝P QQ1 P 1 es un paralelogramo, por lo cual P Q “ P 1 Q1 , es decir la correspondencia es una congruencia, de donde concluímos que B1 – B 1 , con lo que hemos demostrado que toda sección transversal de un cilindro es congruente con su base. ‚ En lo sucesivo, para ahorrar tiempo y hacer el tratado más ameno, haremos uso del postulado 11.19.12 sin mencionarlo explícitamente. Una generalización del postulado 11.19.10 es el siguiente teorema. 11.19.15. Teorema. El volumen de un cilindro es el producto del área de la base y su altura. Demostración. Supongamos que tenemos un cilindro C con bases B1 y B2 en los planos Π1 y Π2 respectivamente. Debido al teorema anterior, el cilindro recto C 1 , del cual una base es B1 y la otra está contenida en Π2 , tiene al igual que el cilindro C todas sus secciones transversales congruentes con B1 . Ahora, debido al postulado de Cavalieri 11.19.11 y al postulado de la congruencia para áreas 11.16.2, ambos cilindros tienen el mismo volumen. De acuerdo al postulado 11.19.10, el volumen de C 1 , y por lo tanto también el de C, es el producto del área de la base y su altura. ‚ 11.19.16. Teorema. Dada una pirámide con base triangular y altura h. El área de la sección 11.19. Volúmenes 323 transversal de la pirámide que se encuentra a una distancia x del plano en el cual está la base q2 veces el área de la base. es p h´x h Demostración. Dada una pirámide con base triangular T y altura h; sean A, B y C los 1 vértices en la base T y sea D el vértice de la pirámide tomando a T como base. Sean A , 1 1 B y C los puntos que están en AD, BD y CD respectivamente y que además están a una distancia x del plano que contiene a la base T . Tomemos la recta l que pasa por D y es 1 perpendicular al plano que contiene a T . Sean además P, P P l tales que P está en el plano 1 1 1 1 que contiene a T y P está en el plano en el que están los puntos A , B y C . Por el teorema fundamental de la proporcionalidad tenemos que BD CD PD h AD “ 1 “ 1 “ 1 “ . 1 AD BD CD PD h´x Ahora, por el teorema de semejanza LAL 11.15.12, tenemos que AC AB BC h . 1 1 “ 1 1 “ 1 1 “ AC AB BC h´x Así, utilizando el teorema de las áreas de triángulos semejantes 11.16.10 concluímos la demostración del teorema. ‚ 11.19.17. Teorema. Si dos pirámides con bases triangulares tienen la misma altura y bases congruentes, entonces tienen el mismo volumen. Demostración. Supongamos que tenemos dos pirámides Υ1 y Υ2 con altura h, bases trian1 gulares T1 y T2 , y vértices V1 y V2 respectivamente. Sea V1 el punto del mismo lado que 1 1 V1 del plano que contiene a T1 , tal que la pirámide Υ1 con base triangular T1 y vértice V1 1 es congruente con Υ2 . (¡Verificar que es posible localizar V1 con tales propiedades!) Por el 1 teorema 11.19.16 y el principio de Cavalieri 11.19.11 tenemos que Υ1 y Υ1 tienen el mismo volumen, pero por el postulado de la congruencia para volúmenes 11.19.7 tenemos que Υ1 1 y Υ2 tienen el mismo volumen. De lo anterior concluímos que las pirámides Υ1 y Υ2 tienen el mismo volumen. ‚ 11.19.18. Teorema. El volumen de una pirámide con base triangular es un tercio del área de la base multiplicada por la altura. Demostración. Sea Υ una pirámide de altura h y base triangular T , donde A, B y C son los vértices de la base. Sea Ψ un prisma recto con base T y altura h, y l una recta perpendicular 1 1 1 1 al plano que contiene a T y que no interseca a Ψ . Sea T la otra base de Ψ , y A , B y C los 1 vértices de T tales que los segmentos AA1 , BB 1 y CC 1 son paralelos a l. Observemos ahora que debido a los postulados 11.19.8 y 11.19.9, el volumen de Ψ es la suma de los volúmenes 1 de Υ1 , Υ2 y Υ3 , donde Υ1 es la pirámide con base T y vértice A ; Υ2 es la pirámide con base 1 1 T y vértice B, y Υ3 es la pirámide cuya base es la región triangular con vértices B, C y C , 1 y el vértice correspondiente a tal base es el punto A . Afirmamos que las pirámides Υ1 , Υ2 y Υ3 tienen el mismo volumen. En efecto, las pirámides Υ1 y Υ2 tienen el mismo volumen debido al teorema 11.19.17, mientras que las pirámides Υ2 y Υ3 tienen el mismo volumen también por el teorema 11.19.17 pero tomando a la región 1 1 triangular con vértices B, B y C como base de Υ2 , en cuyo caso el vértice correspondiente 324 11.19. Volúmenes 1 es A . De esta forma, el volumen de Υ1 es un tercio del volumen del prisma Ψ . De nuevo por el teorema 11.19.17, el volumen de Υ es un tercio del volumen del prisma Ψ , pero debido al postulado 11.19.10 el volumen de la pirámide Υ es un tercio del área de su base T multiplicado por su altura h. ‚ Como consecuencia inmediata del teorema 11.19.18 y de los postulados 11.19.8 y 11.19.9 se tiene el corolario siguiente. 11.19.19. Corolario. El volumen de una pirámide es un tercio del área de la base multiplicada por la altura. Se deja al lector los detalles de la demostración. 11.19.20. Teorema. Dado un cono circular recto de altura h y radio de la base r. El radio r0 de la sección transversal cuyo centro está a una distancia x del centro de la base, está dado r. por r0 “ ph´xq h Demostración. Sea V el vértice del cono y Q el centro de la base. Tomemos la sección transversal A del cono que está a una distancia x de la base y sea P el punto de intersección de A y V Q. Observemos que A es un círculo con centro en P . En efecto, hay una correspondencia biunívoca entre los puntos P 1 de A y los puntos Q1 de la base B del cono de tal manera que P 1 es el único punto en la intersección de V Q1 y A. Ahora, por el teorema fundamental de la proporcionalidad 11.15.5 y por el teorema de semejanza LAL 11.15.12, tenemos que si P 1 h está en el plano que contiene a A, entonces P 1 P A si y sólo si P P 1 h´x “ QQ1 para algún r si y sólo si P 1 P A. Lo anterior demuestra que A es un círculo Q1 P B, es decir P P 1 ĺ ph´xq h con centro en P y radio r0 “ ph´xq r. ‚ h Una generalización del teorema anterior es el siguiente. 11.19.21. Teorema. Dado un cono circular de altura h y radio de la base r. El radio r0 de la sección transversal cuyo centro está a una distancia x del plano que contiene a la base, está dado por r0 “ ph´xq r. h Demostración. Debido al teorema 11.19.20 es suficiente suponer que el cono es un cono circular, pero no es un cono circular recto. Sean V el vértice del cono, P la proyección de V al plano que contiene a la base, Q un punto en el borde de la base, Q0 el punto en el borde de la sección transversal que está entre Q y el vértice V , C el centro de la base, C0 el centro de la sección transversal y P0 el punto donde se corta el segmento P V y el plano que contiene a la sección transversal. Por el teorema fundamental de la proporcionalidad 11.15.5 y el teorema de semejanza LAL 11.15.12, tenemos que r QV PV h “ “ “ , r0 Q0 V P0 V ph ´ xq de donde tenemos que r0 “ ph´xq r. h ‚ Del teorema anterior y de la fórmula del área de un círculo se concluye el corolario siguiente. 11.19.22. Corolario. Dado un cono circular de altura h y radio de la base r. El área de la sección transversal cuyo centro está a una distancia x del plano que contiene a la base, está 11.19. Volúmenes 325 dado por p h´x q2 πr2 . h 11.19.23. Teorema. El volumen de un cono circular de altura h y radio de la base r es 1 πr2 h. 3 Demostración. Dado un cono circular de altura h y radio de la base r, sean V su vértice y Π el plano que contiene a la base. Tomemos una región triangular T contenida en el plano Π con área πr2 y comparemos a la pirámide con base T y vértice V con el cono dado. De acuerdo al corolario 11.19.22 y al teorema 11.19.16, la sección transversal del cono y la de la pirámide, contenidas ambas en un mismo plano paralelos a Π, tienen la misma área, por lo que aplicando el principio de Cavalieri 11.19.11 tenemos que el volumen de tal pirámide es ‚ igual al volumen del cono dado. Así, el volumen del cono es igual a 31 πr2 h. A continuación deduciremos una fórmula para calcular el volumen de un cuerpo esférico. 11.19.24. Teorema. El volumen de un cuerpo esférico de radio r es 34 πr3 . Demostración. Sea S un cuerpo esférico con centro en un punto O y radio r. Tomemos un plano Π al cual pertenezca el centro de S. Sea C el cilindro circular recto de altura r cuya base es la intersección de S y Π y tal que los puntos que no están en la base están en un lado E ` de Π. Sea K el cono con vértice O cuya base es la base del cilindro C que está en E ` . Procederemos primero a calcular el volumen de la parte de S que está en E ` . Sea S ` la intersección de S y E ` . Veamos que el volumen del cono K es igual al de CzS ` . Tomemos un plano Π0 Ă E ` , paralelo a Π, tal que la distancia r0 ente Π0 y O sea menor ` que r. Por el teorema a de Pitágoras 11.15.15 podemos ver que la intersección de S y Π0 es un círculo de radio r2 ´ r02 , por lo que el área de la intersección de CzS ` y Π0 es πr2 ´ π ´a r2 ´ r02 ¯2 “ πr02 , la cual es la misma que la de la sección transversal del cono K (la intersección de K con Π0 ). De esta manera, por el principio de Cavalieri tenemos que K y CzS ` tienen el mismo volumen, el cual debido al teorema 11.19.23 es igual a 13 πr3 . Ahora, por el postulado de adición de volúmenes 11.19.8 , el volumen de S ` es el volumen del cilindro menos el de CzS ` , es decir es 1 2 πr3 ´ πr3 “ πr3 . 3 3 Análogamente se demuestra que el volumen de la intersección de la esfera S con el otro lado de Π diferente de E ` es 32 πr3 . Finalmente, por los postulados 11.19.8 y 11.19.9 se tiene que el volumen de S es 43 πr3 . ‚ 326 11.19. Volúmenes Capítulo 12 MATRICES Y DETERMINANTES 12.1. Introducción Las matrices son muy útiles en la resolución de sistemas de ecuaciones lineales, como veremos en la sección 12.8. 12.1.1. Definiciones. El concepto de matriz la forma ¨ a1,1 a1,2 ˚ a2,1 a2,2 ˚ ˚ .. .. ˝ . . am,1 am,2 se puede ver como un arreglo o expresión de ˛ ¨ ¨ ¨ a1,n ¨ ¨ ¨ a2,n ‹ ‹ .. ‹ , . ‚ ¨ ¨ ¨ am,n donde m y n son números naturales, ai,j (con 1 ĺ i ĺ m y 1 ĺ j ĺ n) son elementos de algún conjunto (supondremos en nuestro estudio de este capítulo que son números reales aunque también pueden ser números complejos o elementos de algún otro conjunto). La representación anterior es la de una matriz de m filas o renglones y n columnas o simplemente una matriz m ˆ n. Así un renglón o fila de n componentes es una sucesión finita pb1 , b2 , . . . , bn q de n componentes. A la componente bj (donde j es un entero tal que 1 ĺ j ĺ n) se le llama la componente en la columna j. Una matriz de m renglones y n columnas o simplemente matriz mˆn es una sucesión finita de m renglones de n componentes cada uno. Una matriz A de m renglones y n columnas se puede representar en la forma A “ pai,j qpi,jqPt1,...,muˆt1,...,nu , donde cada ai,j es la componente del i-ésimo renglón en la j-ésima columna, a veces por simplicidad y cuando el contexto no permita confusión la matriz A se representará como pai,j qi,j o simplemente como pai,j q. Se dice que ai,j es la componente i, j o la componente que se encuentra en el renglón i y en la columna j. Una columna o matriz columna de m componentes es simplemente una matriz de m ˆ 1 la cual se expresa en la forma ¨ ˛ c1 ˚ c2 ‹ ˚ ‹ ˚ .. ‹ . ˝ . ‚ cm Diremos que una matriz que tiene m renglones y n columnas tiene orden m ˆ n. Una matriz que tiene tantas filas como columnas se llama matriz cuadrada. 327 328 12.1. Introducción Observemos que un renglón de n componentes se puede ver como una matriz 1ˆn. Debido a lo anterior, a una matriz 1 ˆ n se le llama matriz renglón. 12.2. Suma y resta de matrices 12.2. 329 Suma y resta de matrices 12.2.1. Definición. Sean A “ pai,j q y B “ pbi,j q dos matrices m ˆ n (donde m y n son números naturales). Definimos la suma de las matrices A y B como A ` B “ pai,j ` bi,j qi,j . Es decir, la matriz A ` B es la matriz tal que cada componente i, j es la componente i, j de A más la componente i, j de B. De manera similar se define la resta de A con B como A ´ B “ pai,j ´ bi,j qi,j . Una matriz tal que cada componente es 0 se llama matriz nula. Así mismo, un renglón cuyas componentes son cero se llama renglón nulo. La demostración del siguiente teorema queda como ejercicio para el lector. 12.2.2. Teorema. Para la suma de matrices se cumplen las propiedades conmutativa y asociativa, además el elemento neutro de la suma de matrices es la matriz nula. Ejercicios. 1. Demostrar el teorema 12.2.2. ˜ 2. Hallar A ` B y A ´ B para A “ 3 2 ´2 ´ 12 5 2 1 2 ¸ ˜ yB“ ´ 32 1 2 1 2 5 2 6 ´7 ¸ . 330 12.3. 12.3. Multiplicación por escalar Multiplicación por escalar 12.3.1. Definición. Si A “ pai,j q es una matriz y α es un número, definimos el producto de α con A como la matriz αA :“ pαai,j q, es decir, αA es la matriz cuya componente i, j es el número α multiplicado por la componente i, j de A. Además, definimos la matriz ´A como p´1qA, es decir ´A es la matriz tal que cada componente i, j es el inverso aditivo de la componente i, j de A. Dejamos al lector la demostración del siguiente teorema. 12.3.2. Teorema. Si α y β son números reales, y además A y B son matrices mˆn, entonces pα ` βqA “ αA ` βA y αpA ` Bq “ αA ` αB. El teorema anterior establece la propiedad distributiva por la derecha y por la izquierda del producto de un número por una matriz. Ejercicios. 1. Demostrar el teorema 12.3.2. ˜ 3 1 5 ¸ ´7 7 7 . 2. Calcular 7 1 6 ´7 7 12.4. Multiplicación de matrices 12.4. 331 Multiplicación de matrices 12.4.1. Definición. Sea A “ pai,j q una matriz m ˆ l y B “ pbj,k q una matriz l ˆ n. Definimos la multiplicación AB de A con B como la matriz m ˆ n tal que ˜ ¸ l ÿ AB :“ ai,j ¨ bj,k . j“1 i,k Observemos que para que exista la matriz AB es necesario y suficiente que el número de columnas de A sea igual al número de renglones de B. En la multiplicación de matrices no siempre es válida la propiedad conmutativa. Demostremos que en la multiplicación de matrices se vale la propiedad asociativa siempre que tenga sentido. En efecto, sea A “ pai,j q una matriz m ˆ n, B “ pbj,k q una matriz n ˆ p y C “ pck,l q una matriz p ˆ q. ¸ ¸ ¸ ˜ p ˜ ˜ n n ÿ ÿ ÿ C“ ai,j ¨ bj,k ck,l pABqC “ ai,j ¨ bj,k j“1 ˜ p ÿ n ÿ “ k“1 ˜ n ÿ “ j“1 ¸¸ p ÿ ¸¸ bj,k ¨ ck,l k“1 n ÿ ˜ p ÿ “ j“1 i,l ˜ i,l ˜ ai,j ¨ bj,k ¨ ck,l j“1 ai,j j“1 k“1 i,k ˜ ˜ “A i,l p ÿ k“1 ¸¸ ai,j ¨ bj,k ¨ ck,l k“1 i,l ¸ bj,k ¨ ck,l “ ApBCq. j,l Hemos demostrado el siguiente teorema. 12.4.2. Teorema. Si A es una matriz m ˆ n, B es una matriz n ˆ p y C es una matriz p ˆ q; entonces pABqC “ ApBCq. 12.4.3. Definición. Las componentes j, j de una matriz cuadrada n ˆ n (donde j es un entero tal que 1 ĺ j ĺ n) se dice que están en la diagonal de la matriz. 12.4.4. Definición. La matriz identidad n ˆ n es la matriz cuadrada n ˆ n tal que las componentes en la diagonal son 1 y las componentes que no están en la diagonal son 0. ¨ ˛ 1 0 ¨¨¨ 0 ˚ 0 1 ¨¨¨ 0 ‹ ˚ ‹ In :“ ˚ .. .. . . .. ‹ . ˝ . . . . ‚ 0 0 ¨¨¨ 1 Sea A una matriz cuadrada n ˆ n e In la matriz identidad del mismo orden que A. El lector debe ser capaz de demostrar las siguientes identidades para matrices. 12.4.5. Teorema. AIn “ In A “ A. 332 12.4. Multiplicación de matrices Es decir la matriz In es en efecto la identidad con respecto a la multiplicación de matrices cuadradas de orden n ˆ n. Cuando de acuerdo al contexto se sobreentienda o quede implícito el valor del número n, escribiremos I en lugar de In . 12.4.6. Definición. Decimos que una matriz cuadrada A es invertible si existe una matriz a la cual denotaremos por A´1 tal que AA´1 “ A´1 A “ I. A la matriz A´1 se le llama la matriz inversa de A. 12.4.7. Teorema. Si una matriz tiene inversa, tal inversa es única. Demostración. Sea A una matriz y B y C inversas de A. Bajo esas condiciones tenemos que B “ BI “ BpACq “ pBAqC “ IC “ C, es decir la inversa de una matriz es única. ‚ Observemos que no todas las matrices cuadradas tienen inversa, por ejemplo ninguna matriz nula tiene inversa. Generalmente a una matriz nula la representaremos con el símbolo 0. 12.4.8. Teorema. Si A y B son matrices invertibles del mismo orden, entonces pABq´1 “ B ´1 A´1 pA´1 q´1 “ A. y además Demostración. De la definición de matriz inversa se tiene que pA´1 q´1 “ A. Ahora, pABqpB ´1 A´1 q “ ApBB ´1 qA´1 “ AIA´1 “ AA´1 “ I “ B ´1 B “ B ´1 IB “ B ´1 pA´1 AqB “ pB ´1 A´1 qpABq, de lo cual se sigue el teorema. ‚ 12.4.9. Teorema. En la multiplicación de matrices se satisfacen las propiedades distributivas por la izquierda y por la derecha. Es decir, si A y B son matrices de m ˆ r y C y D son matrices de r ˆ n, entonces pA ` BqC “ AC ` BC y ApC ` Dq “ AC ` AD. Demostración. Debido a la analogía de las dos igualdades demostraremos solamente que ApC ` Dq “ AC ` AD. Denotando A “ pai,j q, C “ pci,j q y D “ pdi,j q tenemos ˜ ¸ ˜ ¸ r r r ÿ ÿ ÿ ApC ` Dq “ ai,k pck,j ` dk,j q “ ai,k ck,j ` ai,k dk,j k“1 ˜ r ÿ “ k“1 ¸ ai,k ck,j k“1 con lo que el teorema está demostrado. ˜ r ÿ ` k“1 ¸ ai,k dk,j “ AC ` AD, k“1 ‚ Si A “ pai,j q es una matriz renglón 1 ˆ m y B “ pbj,k q es una matriz m ˆ n, tenemos que la matriz AB es una matriz renglón 1 ˆ n. En el caso en que u sea el renglón con 12.4. Multiplicación de matrices 333 m componentes de la matriz A y v sea el renglón con n componentes de la matriz AB, definimos la multiplicación de un renglón por una matriz como uB :“ v. Así, cuando multiplicamos un elemento de Rm por una matriz m ˆ n, obtenemos como resultado un elemento de Rn . Ejercicios. 1. Dar un ejemplo donde se muestre que la multiplicación de matrices n ˆ n, con n ą 1, no es conmutativa. ¨ ˛ 3 1 5 ¸ ˜ 3 ´ 1 2 2 2 ´ 12 5 ˚ 1 ‹ 2 ˚ ‹. 6 ´7 2 y B “ 2. Hallar AB, donde A “ 2 ˝ ‚ 1 ´2 2 2 3 1 4 ´2 1 2 ˜ ¸ 1 1 . 3. Hallar la inversa de la matriz ´2 2 334 12.5. La transpuesta de una matriz 12.5. La transpuesta de una matriz 12.5.1. Definición. Sea A una matriz m ˆ n. Definimos la transpuesta (o traspuesta) de la matriz A como la matriz n ˆ m denotada At tal que la componente i, j de A es la componente j, i de At . ¨ ˛t ¨ ˛ a1,1 a1,2 ¨ ¨ ¨ a1,n a1,1 a2,1 ¨ ¨ ¨ am,1 ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ‹ ˚ a1,2 a2,2 ¨ ¨ ¨ am,2 ‹ ˚ ‹ ˚ ‹ ˚ .. .. .. ‹ “ ˚ .. .. .. ‹ . ˝ . . . ‚ ˝ . . . ‚ am,1 am,2 ¨ ¨ ¨ am,n a1,n a2,n ¨ ¨ ¨ am,n Es decir, conservando el orden de las componentes, los renglones se hacen columnas y las columnas renglones. Observemos que la transpuesta de una matriz renglón es una matriz columna y la transpuesta de una matriz columna es una matriz renglón. Cuando tengan sentido las operaciones se tienen las siguientes propiedades cuyas verificaciones son fáciles y las dejamos al lector. 12.5.2. Teorema. pA ` Bqt “ At ` B t , pABqt “ B t At , pAt qt “ A y pAt q´1 “ pA´1 qt . 12.5.3. Definición. Decimos que una matriz cuadrada A es simétrica si A “ At , es decir si es de la forma ¨ ˛ a1,1 a1,2 ¨ ¨ ¨ a1,n ˚ a1,2 a2,2 ¨ ¨ ¨ a2,n ‹ ˚ ‹ A “ ˚ .. .. .. ‹ . . . ˝ . . . ‚ . a1,n a2,n ¨ ¨ ¨ an,n Cuando u P Rn es un renglón, definimos la transpuesta de u como la matriz columna ut que es la transpuesta de la matriz renglón cuyo único renglón es u. Ejercicios. 1. Demostrar el teorema 12.5.3. ˜ 2. Hallar las transpuestas de las matrices A y B para A “ 3 2 ´2 ¨ ´ 23 ˚ 1 ˚ 2 B“˚ ˚ 2 ˝ 3 1 2 5 2 ˛ ‹ 6 ´7 ‹ ‹. 5 7 ‹ ‚ 1 1 ´ 12 5 2 2 1 2 4 ¸ y 12.6. Permutaciones 12.6. 335 Permutaciones En esta sección deduciremos algunas propiedades de las permutaciones que servirán de herramientas para deducir algunas de las propiedades más importantes de los determinantes, los cuales se abordarán en la sección 12.7. Recordemos que si n es un entero no negativo, Sn denota al conjunto de permutaciones de orden n y Jn al conjunto de enteros positivos menores o iguales que n. 12.6.1. Definición. Si i y j son dos enteros positivos diferentes menores o iguales que un entero n, a la permutación τi,j P Sn tal que τi,j piq “ j, τi,j pjq “ i y τi,j pkq “ k para todo k P Jn zti, ju se le llama transposición. 12.6.2. Definición. Sea σ P Sn una permutación de orden n. Un conjunto no vacío A Ă Jn se llama ciclo de la permutación σ si para todo i P A tenemos que σ #A piq “ i, mientras que si 0 ă k ă #A, tenemos que σ k piq ‰ i y además A “ ti, σpiq, σ 2 piq, . . . , σ #A´1 piqu. 12.6.3. Teorema. Los ciclos de una permutación σ P Sn forman una partición en clases de equivalencia de Jn . Demostración. Sea i P Jn . Veamos primero que σ k piq “ i para algún k ĺ n. Procedamos por contradicción suponiendo que σ k piq ‰ i para todo k ĺ n. En estas condiciones tendríamos que el conjunto tσpiq, σ 2 piq, . . . , σ n piqu, al cual no pertenece i, tiene menos de n elementos, es decir alguno de los números σpiq, σ 2 piq, . . . , σ n piq está repetido. Sea j el primer número tal que la componente j de la sucesión finita pσpiq, σ 2 piq, . . . , σ n piqq está repetida y sea l el primer entero mayor que j tal que σ j piq “ σ l piq. Como σ j´1 piq ‰ σ l´1 piq, entonces σ no sería inyectiva con lo cual llegamos a una contradicción. De esta forma tenemos que σ k piq “ i para algún k ĺ n. Sea k el primer entero positivo que satisface la propiedad σ k piq “ i y observemos que tσpiq, σ 2 piq, . . . , σ k piqu es un ciclo de σ al cual pertenece i. Hemos demostrado que todo elemento de Jn pertenece a algún ciclo de σ. Tenemos además que si A Ă Jn es un ciclo de σ y j P A, entonces σpjq P A, de donde podemos concluir que dos ciclos diferentes no se intersecan. En efecto, si A y B son dos ciclos a los cuales pertenece j, entonces el conjunto tσpjq, σ 2 pjq, . . . , σ n pjqu, con posibles repeticiones, es a la vez igual a A y a B. ‚ 12.6.4. Definición. Una permutación σ P Sn se llama permutación cíclica si para alguno de sus ciclos A Ă Jn se tiene que si i R A, entonces σpiq “ i. 12.6.5. Teorema. Toda permutación es la composición de una o varias permutaciones cíclicas. Demostración. Sea σ P Sn una permutación y A1 , . . . , Ak sus ciclos diferentes p1 ĺ k ĺ n). Para todo entero l P t1, . . . , ku definamos la permutación σl P Sn como σl piq “ i si i R Al y como σl piq “ σpiq si i P Al . La demostración se concluye al observar que σ “ σ1 ˝ σ2 ˝ ¨ ¨ ¨ ˝ σk y que para l P t1, . . . , ku la permutación σl es una permutación cíclica. ‚ 12.6.6. Teorema. Toda permutación cíclica en Jn (con n ą 1) es la composición de varias transposiciones. Demostración. Si σ es la permutación identidad, entonces σ “ τi,j ˝ τi,j , donde i y j son dos elementos cualesquiera diferentes en Jn . Supongamos que σ P Sn es una permutación cíclica diferente de la identidad y supongamos que A es el único ciclo de la permutación con 336 12.6. Permutaciones más de un elemento. Sea k “ #A e i P A. Tenemos que A “ tσpiq, σ 2 piq, . . . , σ k piqu, donde σ k piq “ i. Observando que σ “ τi,σk´1 piq ˝ ¨ ¨ ¨ ˝ τi,σ2 piq ˝ τi,σpiq concluimos la demostración del teorema. ‚ Como consecuencia inmediata de los teoremas 12.6.5 y 12.6.6 tenemos el siguiente teorema. 12.6.7. Teorema. Toda permutación en Jn (con n ą 1) es la composición de varias transposiciones. 12.6.8. Definición. Toda permutación que sea la composición de un número par de transposiciones se llama permutación par y toda permutación que sea la composición de un número impar de transposiciones se llama permutación impar. Observemos que debido al teorema 12.6.7 cualquier permutación es una permutación par o es una permutación impar. El siguiente teorema nos dice que las permutaciones pares no son permutaciones impares y viceversa. 12.6.9. Teorema. Cualquier permutación en Sn es par o impar y además los conjuntos de permutaciones pares y de permutaciones impares son disjuntos. Demostración. Como ya se dijo, el hecho de que cualquier permutación en Sn sea par o bien impar es consecuencia del teorema 12.6.7. Para demostrar que las permutaciones pares no pueden ser impares haremos uso del siguiente artificio. Definamos la función polinomial de n variables P de la siguiente manera: ź P px1 , x2 , . . . , xn q :“ pxj ´ xi q. iăj ś Observemos que para una transposición τk,l el polinomio de n variables pxτk,l pjq ´ xτk,l piq q iăj ś es igual a ´ pxj ´ xi q. Para cada permutación σ P Sn definamos la función σ ˚ : tP u ÝÑ iăj tP, ´P u tal que σ ˚ pP qpx1 , x2 , . . . , xn q “ P pxσp1q , xσp2q , . . . , xσpnq q. Observando que P ‰ ´P , que σ ˚ pP q “ P si σ es una permutación par y que σ ˚ pP q “ ´P si σ es una permutación impar, se concluye la demostración del teorema. ‚ 12.6.10. Teorema. Una permutación σ P Sn es par si y sólo si hay un número par de parejas pi, jq (con i, j P Jn ) tales que i ă j pero σpiq ą σpjq. Demostración. Tomando la misma notación y terminología que en la demostración del teorema 12.6.9 y recordando que σ ˚ pP q “ P si σś es una permutación par yśque σ ˚ pP q “ ´P si σ es una permutación impar, observemos que pxσpjq ´ xσpiq q “ p´1qm pxj ´ xi q, donde iăj iăj m es la cantidad de parejas pi, jq tales que i ă j pero σpiq ą σpjq. Ahora, p´1qm “ 1 si y sólo si m es par, por lo tanto por lo tanto σ es par si la cantidad de parejas pi, jq tales que i ă j y σpiq ą σpjq es par. ‚ 12.6.11. Definición. El signo de una permutación σ, denotado sgnpσq, se define por # 1 si σ es par sgnpσq :“ ´1 si σ es impar. 12.6. Permutaciones 337 Cuando dos permutaciones tienen el mismo signo decimos también que tienen la misma paridad, es decir tienen la misma paridad si ambas son pares o ambas son impares, de otro modo decimos que tienen diferente paridad. Siempre consideraremos que el signo de una permutación identidad es 1, es decir la permutación identidad es par. 12.6.12. Teorema. Si σ, η P Sn , entonces sgnpσ ˝ ηq “ sgnpσq sgnpηq. Demostración. Supongamos que σ es la composición de n transposiciones y η es la composición de m transposiciones y observemos que sgnpσq “ p´1qn y que sgnpηq “ p´1qm . Como σ˝η es la composición m`n transposiciones, entonces sgnpσ˝ηq “ p´1qm`n “ p´1qm p´1qn “ sgnpσq sgnpηq. ‚ 12.6.13. Corolario. Si σ P Sn , entonces sgnpσq “ sgnpσ ´1 q. Demostración. Del teorema 12.6.12 y del hecho de que el signo de la permutación identidad es 1 se tiene que sgnpσq sgnpσ ´1 q “ sgnpσ ˝ σ ´1 q “ 1, de manera que σ y σ ´1 no pueden tener diferente paridad. 338 12.7. 12.7. Determinantes Determinantes 12.7.1. Definición. Sea A “ pai,j q una matriz n ˆ n. El determinante de A se define como det A :“ ÿ sgnpσq σPSn n ź ai,σpiq . i“1 Si A “ pai,j q, el determinante de A también se denota como |ai,j |i,j , |A| o bien ˇ ¨ ˛ ˇ ˇ a1,1 a1,2 ¨ ¨ ¨ a1,n ˇ a1,1 a1,2 ¨ ¨ ¨ a1,n ˇ ˇ ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ‹ ˇ a2,1 a2,2 ¨ ¨ ¨ a2,n ˇ ˚ ‹ ˇ ˇ det ˚ .. .. .. ˇ . .. .. ‹ “ ˇ .. . . . . ˝ . . . . . ˇˇ . . ‚ ˇˇ . ˇ an,1 an,2 ¨ ¨ ¨ an,n ˇ an,1 an,2 ¨ ¨ ¨ an,n Como propiedades básicas de los determinantes veremos que el determinante de una matriz no invertible es 0, el determinante de cualesquier matriz identidad es 1, detpABq “ pdet Aqpdet Bq, det At “ det A, det A´1 “ det1 A . Si una columna o un renglón de una matriz cuadrada está formada solamente con ceros, entonces el determinante tal matriz es cero. 12.7.2. Teorema. El determinante de una matriz cuadrada A es igual al de su transpuesta At . Demostración. Sea A “ pai,j q. Tenemos que At “ pbi,j q, donde bi,j “ aj,i , y al usar el corolario 12.6.13 tenemos n n n ź ź ÿ ź ÿ ÿ sgnpσq ai,σ´1 piq sgnpσq aσpiq,i “ sgnpσq bi,σpiq “ |At | “ σPSn ÿ “ σPSn i“1 sgnpσ ´1 q n ź i“1 i“1 σPSn ai,σ´1 piq “ ÿ σPSn sgnpσq σPSn n ź i“1 ai,σpiq “ |A|, i“1 donde la última igualdad se debe a que la aplicación σ ÞÑ σ ´1 es una biyección de Sn en Sn . ‚ 12.7.3. Teorema. Si una matriz cuadrada A tiene un renglón cuyas componentes son ceros, entonces |A| “ 0. Demostración. Supongamos que las componentes del renglón k de la matriz A son ceros y sea A “ pai,j q. Para cada σ P Sn tenemos que a1,σp1q ¨ a2,σp2q ¨ ¨ ¨ ¨ ¨ ak,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq “ n ř ś a1,σp1q ¨a2,σp2q ¨¨ ¨ ¨¨0¨¨ ¨ ¨¨an,σpnq “ 0, por lo que el determinante de A es |A| “ sgnpσq ai,σpiq i“1 σPSn ř ř sgnpσq0 “ 0 “ 0. ‚ σPSn σPSn Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.3 tenemos el siguiente corolario. 12.7.4. Corolario. Si una matriz cuadrada A tiene una columna cuyas componentes son ceros, entonces |A| “ 0. 12.7.5. Teorema. Si A “ pai,j q y B “ pbi,j q son matrices cuadradas, donde bi,j “ ai,j para i R tk, lu, con k ‰ l, bk,j “ al,j y bl,j “ ak,j para j P t1, 2, . . . , nu; entonces |B| “ ´|A|. Es 12.7. Determinantes 339 decir si B es la matriz que se obtiene al intercambiar dos renglones de la matriz A, entonces |B| “ ´|A|. Demostración. Tenemos que n n ÿ ź ÿ ź |B| “ sgnpσq bi,σpiq “ sgnpσq aτk,l piq,σpiq σPSn i“1 ÿ n ź “ sgnpσq ÿ “´ ai,σ˝τk,l piq “ i“1 σPSn sgnpσq i“1 σPSn n ź ÿ ´ sgnpσ ˝ τk,l q n ź ai,σ˝τk,l piq i“1 σPSn ai,σpiq “ ´|A|. ‚ i“1 σPSn Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.5 tenemos el siguiente corolario. 12.7.6. Corolario. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para j R tk, lu, bi,k “ ai,l y bi,l “ ai,k para i P t1, 2, . . . , nu; entonces |B| “ ´|A|. Es decir si B es la matriz que se obtiene al intercambiar dos columnas de la matriz A, entonces |B| “ ´|A|. 12.7.7. Teorema. Si A es una matriz cuadrada que tiene dos de sus renglones iguales (en diferente posición), entonces |A| “ 0. Demostración. Supongamos que k ‰ l y que los renglones k y l de la matriz A son iguales. Por el teorema 12.7.5 tenemos que |A| “ ´|A|, por lo tanto |A| “ 0. ‚ Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.7 tenemos el siguiente corolario. 12.7.8. Corolario. Si A es una matriz cuadrada que tiene dos de sus columnas iguales, entonces |A| “ 0. 12.7.9. Teorema. La matriz identidad tiene determinante 1. n n ř ś ś Demostración. Tenemos que det In “ sgnpσq ai,σpiq . Ahora, observando que ai,i “ 1 y que n ś σPSn i“1 i“1 ai,σpiq “ 0 para σ diferente de la permutación identidad se tiene que det In “ 1. ‚ i“1 12.7.10. Teorema. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para i ‰ k y bk,j “ αak,j , entonces |B| “ α|A|. Demostración. Para todo σ P Sn tenemos que b1,σp1q ¨ b2,σp2q ¨ ¨ ¨ ¨ ¨ bn,σpnq “ a1,σp1q ¨ a2,σp2q ¨ n ř ś ¨ ¨ ¨ ¨ αak,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq “ αpa1,σp1q ¨ a2,σp2q ¨ ¨ ¨ ¨ ¨ an,σpnq q, por lo cual |B| “ sgnpσq bi,σpiq “ ř σPSn sgnpσqα n ś i“1 ai,σpiq “ α ř σPSn sgnpσq n ś σPSn ai,σpiq “ α|A|. i“1 ‚ i“1 Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.10 tenemos el siguiente corolario. 12.7.11. Corolario. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para j ‰ k y bi,k “ αai,k , entonces |B| “ α|A|. 12.7.12. Teorema. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para 340 12.7. Determinantes i ‰ k y bk,j “ ak,j ` αal,j , con l ‰ k, entonces |B| “ |A|. Es decir, si B es la matriz que se obtiene dejando igual los renglones de la matriz A diferentes del k-ésimo y el renglón k-ésimo de B es la suma de los renglones k-ésimo y un múltiplo del l-ésimo renglón de la matriz A, entonces |B| “ |A|. Demostración. Tenemos que b1,σp1q ¨ b2,σp2q ¨ ¨ ¨ ¨ ¨ bn,σpnq “ a1,σp1q ¨ a2,σp2q ¨ ¨ ¨ ¨ ¨ pαal,σpkq ` ak,σpkq q ¨ ¨ ¨ ¨ ¨ an,σpnq , por lo que ÿ |B| “ sgnpσq ÿ bi,σpiq i“1 σPSn “ n ź sgnpσqa1,σp1q ¨ ¨ ¨ ¨ ¨ pαal,σpkq ` ak,σpkq q ¨ ¨ ¨ ¨ ¨ an,σpnq σPSn ÿ “ sgnpσqa1,σp1q ¨ ¨ ¨ ¨ ¨ αal,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq σPSn ÿ ` sgnpσqa1,σp1q ¨ ¨ ¨ ¨ ¨ ak,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq σPSn “α ÿ sgnpσqa1,σp1q ¨ ¨ ¨ ¨ ¨ al,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq ` |A|, σPSn pero observemos que ř sgnpσqa1,σp1q ¨ ¨ ¨ ¨ ¨ al,σpkq ¨ ¨ ¨ ¨ ¨ an,σpnq es el determinante de una matriz σPSn cuyos renglones l y k son iguales, por lo que debido al teorema 12.7.7 tal suma es 0 y por lo tanto |B| “ |A|. ‚ Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.12 tenemos el siguiente corolario. 12.7.13. Corolario. Si B es la matriz cuadrada que se obtiene dejando igual las columnas de la matriz A diferentes de la k-ésima y la k-ésima columna de B es la suma de la columna k-ésima y un múltiplo de la l-ésima columna de la matriz A (con l ‰ k), entonces |B| “ |A|. 12.7.14. Definición. Sea n un número entero mayor que 1 y A “ pai,j q una matriz n ˆ n. Si k, l P t1, 2, . . . , nu, denotemos por Mk,l “ pmi,j q la matriz pn ´ 1q ˆ pn ´ 1q tal que: mi,j “ ai,j si i ă k y j ă l; mi,j “ ai`1,j si i ľ k y j ă l; mi,j “ ai,j`1 si i ă k y j ľ l, y mi,j “ ai`1,j`1 si i ľ k y j ľ l. Es decir, Mk,l es la matriz que se obtiene de la matriz A al eliminar el renglón k y la columna j. Al determinante de la matriz Mk,l se le llama el menor de la componente k, l de la matriz A. Así mismo, al número Ak,l :“ p´1qk`l |Mk,l | se le llama el cofactor de la componente k, l de la matriz A. Conservando la notación dada en las definiciones de menor y cofactor de A tenemos el siguiente teorema y su demostración. 12.7.15. Teorema. Si A “ pai,j q es una matriz nˆn (con n ľ 2) y k P t1, 2, . . . , nu, entonces n ÿ |A| “ j“1 ak,j Ak,j . 12.7. Determinantes 341 Demostración. Observemos que ˜ ÿ |A| “ ak,1 ¸ n ź sgnpσq ai,σpiq σPSn ,σpkq“1 i“1,i‰k ÿ n ź ˜ ` ak,2 sgnpσq ¸ ai,σpiq i“1,i‰k σPSn ,σpkq“2 ˜ ÿ ` ¨ ¨ ¨ ` ak,n ¸ n ź sgnpσq ai,σpiq , i“1,i‰k σPSn ,σpkq“n de modo que es suficiente con demostrar que ÿ Ak,j “ sgnpσq n ź ai,σpiq . i“1,i‰k σPSn ,σpkq“j Para cada σ P Sn´1 y k, l P t1, 2, . . . , nu sea σk,l P Sn la permutación tal que: σk,l pkq “ l; σk,l piq “ σpiq si i ă k y σpiq ă l; σk,l piq “ σpi ´ 1q si i ą k y σpi ´ 1q ă l; σk,l piq “ σpiq ` 1 si i ă k y σpiq ą l, y σk,l piq “ σpi ´ 1q ` 1 si i ą k y σpi ´ 1q ą l. Veamos que sgnpσk,l q “ p´1qk`l sgnpσq. Observemos que el número de parejas pσk,k piq, σk,k pjqq con i, j P t1, 2, . . . , nuztku tales que i ă j y σk,k piq ą σk,k pjq es el mismo que el número de parejas pσpiq, σpjqq con i, j P t1, 2, . . . , n ´ 1u tales que i ă j y σpiq ą σpjq. Observemos además que hay tantos elementos i en t1, 2, . . . , k ´ 1u tales que σk,k piq ą k como elementos j en tk ` 1, . . . , n ` 1u tales que σk,k pjq ă k, por lo que el número total de parejas pσk,k piq, σk,k pjqq con i, j P t1, 2, . . . , nu tales que i ă j y σk,k piq ą σk,k pjq es igual a un número x más un número par, donde x es el número de parejas pσpiq, σpjqq con i, j P t1, 2, . . . , n ´ 1u tales que i ă j y σpiq ą σpjq, y el número par es el doble del número de elementos j en tk ` 1, . . . , n ` 1u tales que σk,k pjq ă k. Así tenemos que σ y σk,k tienen la misma paridad para todo k P t1, 2, . . . , nu. Demostremos ahora que sgnpσq “ p´1qk`l sgnpσk,l q, lo cual ya está demostrado cuando l “ k. Supongamos primero que l ă k. Debido a que σl,l “ τl,σk,l plq ˝ τl,σk,l pl`1q ˝ ¨ ¨ ¨ ˝ τl,σk,l pk´2q ˝ τl,σk,l pk´1q ˝ σk,l y a que τl,σk,l pk´1q , τl,σk,l pk´2q , . . . , τl,σk,l pl`1q y τl,σk,l plq son k ´ l transposiciones, tenemos que de aplicar varias veces el teorema 12.6.12 resulta p´1qk`l sgnpσk,l q “ p´1qk´l sgnpσk,l q “ sgnpσl,l q “ sgnpσk,k q “ sgnpσq. Análogamente, cuando l ą k tenemos el mismo resultado al observar que σl,l “ τl,σk,l plq ˝ τl,σk,l pl´1q ˝ ¨ ¨ ¨ ˝ τl,σk,l pk`2q ˝ τl,σk,l pk`1q ˝ σk,l . Ahora, tenemos que k`l Ak,l “ p´1q k`l ÿ |Mk,l | “ p´1q sgnpσq ÿ “ p´1q k`l p´1q sgnpσk,l q σPSn´1 ÿ “ σPSn ,σpkq“l sgnpσq n ź i“1,i‰k n ź i“1,i‰k ai,σpiq , mi,σpiq “ p´1q i“1 σPSn´1 k`l n´1 ź ai,σk,l piq “ k`l ÿ sgnpσq σPSn´1 ÿ σPSn´1 sgnpσk,l q n ź i“1,i‰k n ź i“1,i‰k ai,σk,l piq ai,σk,l piq 342 12.7. Determinantes con lo que el teorema queda demostrado. ‚ Como consecuencia inmediata de los teoremas 12.7.2 y 12.7.15 tenemos el siguiente corolario. 12.7.16. Corolario. Si A “ pai,j q es una matriz n ˆ n (con n ľ 2) y k P t1, 2, . . . , nu, entonces n ÿ |A| “ ai,k Ai,k . i“1 Ejercicios. 1. Hallar los determinantes de las matrices siguientes: ¨ ˛ 3 1 5 ¸ ˜ ¸ ˜ 3 ´ 2 2 2 ´ 12 1 1 ˚ ‹ 2 ‹, 4 6 ´7 , b) , c) ˚ a) ˝ ‚ ´2 2 2 2 2 2 1 ¨ 4 2 ´1 ˚ ˚ 4 6 ´3 d) ˚ ˚ 2 2 1 ˝ 1 6 4 1 ˛ ‹ 3 ‹ ‹. 2 ‹ ‚ ´2 12.8. Matrices y sistemas de ecuaciones lineales 12.8. 343 Matrices y sistemas de ecuaciones lineales 12.8.1. Definición. Una ecuación de la forma a1 x1 ` a2 x2 ` ¨ ¨ ¨ ` an xn “ b, donde a1 , a2 , . . . , an , b son números constantes con algún ai diferente de cero y x1 , x2 , . . . , xn son variables, se llama ecuación lineal y el conjunto de soluciones representa un hiperplano en el espacio de dimensión n. En el caso particular en que b “ 0 la ecuación lineal se llama ecuación lineal homogénea y el conjunto de soluciones representa un hiperplano que pasa por el origen del espacio de dimensión n. 12.8.2. Definición. Una expresión con m ecuaciones lineales con n variables de la forma a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ b2 .. . a1,m x1 ` a2,m x2 ` ¨ ¨ ¨ ` an,m xn “ bm se llama sistema de ecuaciones lineales, en el caso en que las ecuaciones lineales sean homogéneas se dice que el sistema es homogéneo. El conjunto solución de un sistema de ecuaciones lineales representa la intersección de m hiperplanos (posiblemente repetidos) en el espacio de dimensión n. 12.8.3. Definición. El anterior sistema de ecuaciones se puede ecuación matricial de la siguiente manera ¨ ˛¨ ˛ ¨ a1,1 a1,2 ¨ ¨ ¨ a1,n x1 b1 ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ‹ ˚ x2 ‹ ˚ b2 ˚ ‹˚ ‹ ˚ ˚ .. .. .. ‹ ˚ .. ‹ “ ˚ .. ˝ . . . ‚˝ . ‚ ˝ . am,1 am,2 ¨ ¨ ¨ am,n xn bm representar en forma de ˛ ‹ ‹ ‹. ‚ Introduzcamos ahora el concepto de matriz ampliada. 12.8.4. Definición. Si A es una matriz m ˆ n y B es una matriz m ˆ q, definimos a la matriz ampliada pA|Bq como a la matriz m ˆ pn ` qq tal que si 1 ĺ j ĺ n, entonces la componente i, j de pA|Bq es la componente i, j de A y si n ` 1 ĺ j ĺ n ` q, entonces la componente i, j de pA|Bq es la componente i, pj ´ nq de B. A cada sistema de ecuaciones lineales como el dado anteriormente también se le puede representar por medio de la matriz ampliada escrita de la siguiente forma ˇ ¨ ˛ a1,1 a1,2 ¨ ¨ ¨ a1,n ˇˇ b1 ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ˇ b2 ‹ ˚ ˇ ‹ ˚ .. .. .. ˇ .. ‹ . ˝ . . . ˇˇ . ‚ am,1 am,2 ¨ ¨ ¨ am,n ˇ bm 344 12.8. Matrices y sistemas de ecuaciones lineales 12.8.5. Definición. Si dos matrices ampliadas del mismo orden representan sistemas de ecuaciones lineales equivalentes (es decir con el mismo conjunto solución), se dice que las matrices son equivalentes. En el teorema siguiente podemos ver lo importante que es el poder calcular la inversa de una matriz para resolver un sistema de ecuaciones lineales. 12.8.6. Teorema. Si una matriz cuadrada ¨ a1,1 a1,2 ¨ ¨ ¨ a1,n ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ˚ A “ ˚ .. .. .. .. ˝ . . . . an,1 an,2 ¨ ¨ ¨ an,n ˛ ‹ ‹ ‹ ‚ es invertible, entonces para toda matriz columna b “ pb1 b2 ¨ ¨ ¨ bn qt con n componentes, se tiene que el sistema a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ `an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ .. . `an,2 xn “ b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ `an,n xn “ bn tiene como única solución a x “ A´1 b, donde x “ px1 x2 ¨ ¨ ¨ xn qt . Demostración. Si una matriz cuadrada A de n ˆ n es invertible y b “ pb1 b2 ¨ ¨ ¨ bn qt es una matriz columna, entonces el sistema anterior se puede expresar en forma matricial como Ax “ b. Multiplicando ambos lados de la última ecuación matricial por A´1 obtenemos x “ Ix “ A´1 Ax “ A´1 b. ‚ De los teoremas 12.2.2 y 12.4.9 se concluye el siguiente teorema. 12.8.7. Teorema. Si A es una matriz de nˆn, b es una matriz columna de n componentes, xh satisface la ecuación Axh “ 0 y xp satisface la ecuación Axp “ b, entonces Apxh ` xp q “ b. Como una especie de recíproco del teorema anterior tenemos el teorema siguiente. 12.8.8. Teorema. Si A es una matriz de n ˆ n, b es una matriz columna de n componentes, xp y x son tales que Axp “ b y Ax “ b, entonces x “ xh ` xp para algún xh que satisface la ecuación Axh “ 0. Demostración. Basta con tomar xh “ x ´ xp y aplicar el teorema 12.4.9. ‚ 12.8.9. Teorema. Si A es una matriz de n ˆ n, b es una matriz columna de n componentes y existe una matriz columna xp que satisface la ecuación Axp “ b, entonces existe una correspondencia biunívoca entre el conjunto de los vectores columna x que satisfacen la ecuación Ax “ b y el conjunto de los vectores columna y que satisfacen la ecuación homogénea Ay “ 0. Demostración. Observando que la aplicación x ÞÑ x ´ xp es inyectiva, tenemos de los teoremas 12.8.7 y 12.8.8 que también es una biyección entre el conjunto de los vectores columna x que satisfacen la ecuación Ax “ b y el conjunto de los vectores columna y que satisfacen la ecuación Ay “ 0. ‚ 12.9. Operaciones elementales por renglón 12.9. 345 Operaciones elementales por renglón 12.9.1. Definición. Son tres los tipos de operaciones elementales por renglón que se les pueden aplicar a una matriz de tal manera que resulte de nuevo una matriz equivalente a la anterior: a) Intercambio en el orden de los renglones. Consiste en intercambiar dos de los renglones de la matriz, el i y el j por ejemplo, dejando los demás iguales. Si la matriz es m ˆ n, esto es equivalente a multiplicar por la izquierda por la matriz m ˆ m tal que todas las componentes de la diagonal diferentes de la componente i, i y de la componente j, j son 1, las componentes i, j y j, i son 1 y las demás componentes son 0. Tal matriz tiene determinante ´1 (teorema 12.7.5) y su inversa es ella misma. b) Multiplicación de un renglón por un número diferente de 0. Consiste en tomar un renglón, digamos el renglón j, y sustituirlo por el mismo renglón j multiplicado por un número α ‰ 0, dejando los demás renglones iguales. Si la matriz es m ˆ n, esto es equivalente a multiplicar por la izquierda por la matriz m ˆ m tal que todas las componentes de la diagonal diferentes de la componente j, j son 1, la componente j, j es α y las demás componentes son 0, es decir es equivalente a multiplicar por la izquierda por una matriz de la forma ¨ ˛ 1 0 0 0 ¨¨¨ 0 ˚ .. .. .. .. ‹ ˚ . . . . ‹ ˚ ‹ ˚ 0 ‹ 1 0 0 ˚ . ‹ ˚ . ‹ 0 ¨ ¨ ¨ 0 0 α ˚ . ‹ ˚ ‹. 0 ¨ ¨ ¨ 0 0 ˚ 1 0 ‹ ˚ . ‹ .. .. ‹ ... ˚ .. . . ‹ ˚ ˚ .. ‹ . . 1 0 ‚ ˝ . . 0 ¨ ¨ ¨ 0 1 0 ¨¨¨ 0 ¨¨¨ Tal matriz tiene determinante α (teorema 12.7.10) y su inversa es la matriz m ˆ m tal que todas las componentes de la diagonal diferentes de la componente j, j son 1, la componente j, j es α1 y las demás componentes son 0. c) Suma de un múltiplo de un renglón a otro. Consiste en tomar un renglón, digamos el renglón i, multiplicarlo por un número α y sumar el producto a un renglón diferente j. El renglón resultante debe sustituirse por el renglón j quedando todos los demás renglones iguales. Si la matriz es mˆn esto es equivalente a multiplicar por la izquierda por la matriz m ˆ m tal que todas las componentes de la diagonal son 1, la componente i, j es α y las demás componentes son 0. Tal matriz tiene determinante 1 (teorema 12.7.12) y su inversa es la matriz m ˆ m tal que todas las componentes de la diagonal son 1, la componente i, j es ´α y las demás componentes son 0. 12.9.2. Definición. Las matrices cuadradas descritas en los incisos anteriores a), b) y c) asociadas con las operaciones elementales por renglón se llaman matrices elementales. 346 12.9. Operaciones elementales por renglón Veremos que cualquier matriz invertible puede transformarse por medio de operaciones elementales por renglón en la matriz identidad y recíprocamente, la matriz identidad puede transformarse por medio de operaciones elementales por renglón en cualquier matriz invertible. Lo anterior equivale a decir que cualquier matriz invertible es el producto (finito) de matrices elementales. 12.9.3. Definición. Si una matriz A se puede transformar por medio de operaciones elementales por renglón en una matriz B se dice que A y B son semejantes y se denota por A „ B. 12.9.4. Observación. Observemos que la relación de semejanza entre matrices es una relación de equivalencia, es decir es reflexiva, simétrica y transitiva. 12.9.5. Método de Gauss. Un método para calcular la inversa de una matriz cuadrada A “ pai,j qpi,jqPt1,...,nuˆt1,...,nu , cuando exista, es el método de Gauss que se desarrolla partiendo de la matriz ampliada ˇ ¨ ˛ a1,1 a1,2 ¨ ¨ ¨ a1,n ˇˇ 1 0 ¨ ¨ ¨ 0 ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ˇ 0 1 ¨ ¨ ¨ 0 ‹ ˚ ˇ ‹ pA|Iq “ ˚ .. .. .. ˇ .. .. . . .. ‹ .. ˇ ˝ . . . . ‚ . . ˇ . . an,1 an,2 ¨ ¨ ¨ an,n ˇ 0 0 ¨ ¨ ¨ 1 y por medio de operaciones elementales por renglón, transformarla en la matriz ampliada pI|A´1 q. El método de operaciones elementales por renglón también sirve para hallar las soluciones de sistemas de ecuaciones lineales que no necesariamente tienen el mismo número de ecuaciones que de variables, por medio de la matriz que representa al sistema de ecuaciones, usando el método de transformar la matriz de coeficientes (la parte no ampliada) en una matriz escalonada. 12.9.6. Definición. Se dice que una matriz está en forma escalonada si se cumplen las cuatro condiciones siguientes: I) Todos los renglones nulos (si los hay) aparecen en la parte inferior de la matriz. Es decir, si algún renglón es nulo, los renglones siguientes también son nulos. II) La primera componente diferente de cero (a partir de la izquierda) en cualquier renglón que no está compuesto únicamente de ceros es 1. III) Si un renglón dado no está compuesto únicamente por ceros, entonces el renglón anterior (si lo hay) tiene un 1 en una posición anterior (más a la izquierda) a la del primer 1 del renglón dado. IV) Cualquier columna que tenga una componente que sea el primer 1 de un renglón tendrá ceros en las demás posiciones. 12.9.7. Teorema. Toda matriz es semejante a una matriz escalonada. 12.9. Operaciones elementales por renglón 347 Demostración. Procederemos por inducción matemática. Sea m un entero positivo. Si A “ pai,j q es una matriz m ˆ 1, tenemos dos posibilidades, a saber A es una matriz nula o A no es nula. Si A es nula, entonces por definición está en forma escalonada. Si A no es nula, sea k el primer entero tal que ak,1 ‰ 0. Tomando F1 como la matriz que multiplica el 1 , F2 la matriz que intercambia el renglón k por el renglón 1 y para i ą 1 renglón k por ak,1 tomemos Ei la matriz que al renglón i le añade ´ai,1 veces el primer renglón. Tenemos así que la matriz Em Em´1 ¨ ¨ ¨ E2 F2 F1 A es la matriz columna con un 1 en el primer renglón y 0 en los demás, por lo cual es una matriz que está en forma escalonada. Sea n un entero positivo y supongamos que toda matriz mˆn es semejante con una matriz escalonada. Sea A “ pai,j q una matriz m ˆ pn ` 1q y  la matriz m ˆ n que se obtiene a partir de A al eliminar la última columna, es decir  “ pâi,j q es al matriz m ˆ n tal que âi,j “ ai,j . Sean Ê1 , Ê2 , . . . , Êl matrices elementales de orden m ˆ m tales que W “ Êl Êl´1 ¨ ¨ ¨ Ê2 Ê1  es una matriz en forma escalonada. Sea ahora Û “ Êl Êl´1 ¨ ¨ ¨ Ê2 Ê1 y observemos que la matriz W se puede obtener a partir de la matriz Û A al eliminar la última columna. Si Û A está en forma escalonada, entonces hemos terminado. Si Û A no está en forma escalonada, sea k el primer entero positivo tal que todas las componentes del k-ésimo renglón de W son 0. Denotemos a B “ Û A como pbi,j q y sea p un entero tal que k ĺ p ĺ m; H la matriz 1 elemental que multiplica por bp,n`1 al renglón p; K la matriz que intercambia los renglones p y k (si p “ k, entonces K “ I), y para 1 ĺ j ĺ n con j ĺ k definamos la matriz Mj como la matriz que al renglón j le añade ´b veces el renglón k y podemos ver que las primera n columnas de B son las mismas que las de C “ M1 M2 . . . Mk´1 Mk`1 . . . Mn Mn`1 KHB y la única componente diferente de cero de la última columna de C es el 1 que aparece como componente k, n ` 1, de modo que C está en forma escalonada y es semejante a A con lo cual el teorema queda demostrado. ‚ 12.9.8. Teorema. Si A es una matriz cuadrada y E es una matriz elemental del mismo orden que A, entonces |EA| “ |E||A|. Demostración. El teorema se sigue como consecuencia de los teoremas 12.7.5, 12.7.10 y 12.7.12, y de las observaciones hechas en la definición de operación elemental por renglón la cual determina una matriz elemental. ‚ 12.9.9. Teorema. Una matriz cuadrada escalonada diferente de la identidad tiene el último renglón nulo. Demostración. Sea B “ pbi,j q una matriz n ˆ n escalonada diferente de la identidad. Veamos primero que para cada renglón de B, cada componente a la izquierda de la que está en la diagonal es cero. En efecto, si esto no fuera así, existiría un primer renglón pbk,1 , . . . , bk,n q de B con la propiedad de que para algún entero positivo l ă k se tenga bk,l “ 1 y bk,j “ 0 para j ă l. Obviamente k ‰ 1 y para el renglón k ´ 1 de B la primer componente diferente de cero no puede estar antes de la componente k ´ 1 y esto contradice el hecho de que B está en forma escalonada. Por lo tanto, para cada renglón de B, cada componente a la izquierda de la que está en la diagonal es cero. Veamos ahora que algún elemento en la diagonal de B es cero. Si esto no fuera así, por lo expuesto anteriormente y por definición de matriz escalonada, todas las componentes de la diagonal deberían ser iguales a 1 y como en cada renglón las componentes en la diagonal son las primeras diferentes de cero, tendríamos que en cada columna las componentes que 348 12.9. Operaciones elementales por renglón no están en la diagonal serían 0, de modo que B sería la matriz identidad, lo cual es una contradicción, por lo tanto algún elemento en la diagonal de B es cero. Ahora, si bk,k “ 0 y k “ n, entonces el último renglón de B es nulo. Si bk,k “ 0 y k ă n, entonces la primer componente diferente de cero, si la hay, en el renglón k ` 1 está después de la componente k ` 1 y siguiendo este proceso podemos ver que bn,n “ 0. En efecto, si no fuera así existiría un primer l ą k tal que bl,l “ 1, de modo que bl´1,l´1 “ 0 y concluiríamos a la vez que bl,l “ 0, llegando así a una contradicción, por lo tanto bn,n “ 0 y la última componente debe ser cero. ‚ 12.9.10. Teorema. Una matriz cuadrada es semejante a la matriz identidad si y sólo si su determinante es diferente de cero. Demostración. Supongamos que una matriz cuadrada A es semejante a la matriz identidad I y sean E1 , E2 , . . . , Ek matrices elementales tales que I “ Ek Ek´1 ¨ ¨ ¨ E2 E1 A. Por el teorema 12.9.8 y el 12.7.9 tenemos que 1 “ |I| “ |Ek Ek´1 ¨ ¨ ¨ E2 E1 A| “ |Ek ||Ek´1 ¨ ¨ ¨ E2 E1 A| “ |Ek ||Ek´1 ||Ek´2 ¨ ¨ ¨ E2 E1 A| “ ¨ ¨ ¨ “ |Ek ||Ek´1 | ¨ ¨ ¨ |E2 ||E1 ||A|, por lo cual |A| ‰ 0. Supongamos ahora que A es una matriz n ˆ n que no es semejante a la matriz identidad. Por el teorema 12.9.7, la matriz A es semejante a una matriz escalonada B “ pbi,j q diferente de la matriz identidad. Por el teorema 12.9.9, el último renglón de B es nulo, de modo que por el teorema 12.7.3 |B| “ 0. Sean ahora E1 , E2 , . . . , Ek matrices elementales tales que B “ Ek Ek´1 ¨ ¨ ¨ E2 E1 A. Por un razonamiento similar al anterior, 0 “ |B| “ |Ek Ek´1 ¨ ¨ ¨ E2 E1 A| “ |Ek ||Ek´1 | ¨ ¨ ¨ |E2 ||E1 ||A|, y como las matrices elementales tienen determinante diferente de 0, tenemos que |A| “ 0. ‚ 12.9.11. Teorema. Una matriz cuadrada A es invertible si y sólo si A „ I. Demostración. Supongamos que A es invertible. Por el teorema 12.9.7, la matriz A es semejante a una matriz escalonada B por lo que existen matrices elementales E1 , E2 , . . . , Ek tales que B “ Ek Ek´1 ¨ ¨ ¨ E2 E1 A. Como la matriz A es invertible y las matrices elementales son invertibles, entonces por el teorema 12.4.8 tenemos que B también es invertible. Ahora, si B ‰ I, entonces el último renglón de B es nulo, por lo que para toda matriz cuadrada C que sea del mismo orden que B se tiene que BC tiene el último renglón nulo, de donde tenemos que B no sería invertible, por lo tanto B “ I con lo que concluimos que A „ I. Supongamos ahora que A „ I. Existen matrices elementales E1 , E2 , . . . , Ek tales que ´1 I “ Ek Ek´1 ¨ ¨ ¨ E2 E1 A, es decir A “ E1´1 E2´1 ¨ ¨ ¨ Ek´1 Ek´1 y A´1 “ Ek Ek´1 ¨ ¨ ¨ E2 E1 , por lo que A es invertible. ‚ Como consecuencia de los teoremas 12.9.10 y 12.9.11 tenemos el siguiente corolario. 12.9.12. Corolario. Una matriz cuadrada es invertible si y sólo si su determinante es diferente de cero. 12.9.13. Teorema. Si A y B son matrices cuadradas del mismo orden y AB “ I, entonces A “ B ´1 y B “ A´1 . Demostración. Demostremos primero que A es invertible. Si A no fuera invertible, por el teorema 12.9.11 tampoco sería semejante a la matriz identidad I, por lo que sería semejante a una matriz D con el último renglón nulo y existirían matrices elementales E1 , E2 , . . . , Ek tales que D “ Ek Ek´1 ¨ ¨ ¨ E2 E1 A y tendríamos que DB “ Ek Ek´1 ¨ ¨ ¨ E2 E1 también tendría 12.9. Operaciones elementales por renglón 349 el último renglón nulo, de modo que 0 “ |Ek Ek´1 ¨ ¨ ¨ E2 E1 | “ |Ek ||Ek´1 | ¨ ¨ ¨ |E2 ||E1 | ‰ 0, llegando así a una contradicción que demuestra que A es invertible. Ahora, B “ IB “ pA´1 AqB “ A´1 pABq “ A´1 I “ A´1 . Ahora, aplicando el teorema 12.4.8 tenemos también que A “ B ´1 . ‚ Debido al teorema 12.9.13, si queremos verificar que B es la inversa de una matriz cuadrada A es suficiente con verificar sólo una de las igualdades AB “ I ó BA “ I y no las dos que se establecen en la definición de matriz inversa. 12.9.14. Teorema. Si A y B son dos matrices cuadradas del mismo orden, entonces |AB| “ |A||B|. Demostración. Se tiene al menos una de las siguientes tres posibilidades: a) |A| “ 0. b) |B| “ 0 y |A| ‰ 0. c) |A| ‰ 0 y |B| ‰ 0. Si |A| “ 0, entonces A es semejante a una matriz escalonada C con el último renglón nulo, por lo que existen matrices elementales E1 , E2 , . . . , Ek tales que A “ Ek Ek´1 ¨ ¨ ¨ E2 E1 C, y así |AB| “ |Ek Ek´1 ¨ ¨ ¨ E2 E1 CB| “ |Ek Ek´1 ¨ ¨ ¨ E2 E1 ||CB| pero como CB tiene el último renglón nulo, entonces |CB| “ 0, concluyéndose que |AB| “ 0 “ |A||B|. Si |B| “ 0 y |A| ‰ 0, entonces B es semejante a una matriz escalonada D cuyas componentes en el último renglón son solamente ceros y A es semejante a I. Así, existen matrices elementales F1 , . . . , Fp , G1 , . . . , Gq tales que F1 F2 . . . Fp “ A y G1 G2 ¨ ¨ ¨ Gq D “ B, por lo que |AB| “ |F1 F2 ¨ ¨ ¨ Fp G1 G2 ¨ ¨ ¨ Gq D| “ |F1 F2 ¨ ¨ ¨ Fp G1 G2 ¨ ¨ ¨ Gq ||D| “ |F1 F2 ¨ ¨ ¨ Fp G1 G2 ¨ ¨ ¨ Gq |0 “ 0, concluyéndose que |AB| “ 0 “ |A||B|. Si |B| ‰ 0 y |A| ‰ 0, entonces A y B son semejantes a I. Así, existen matrices elementales F1 , . . . , Fp , G1 , . . . , Gq tales que F1 F2 ¨ ¨ ¨ Fp “ A y G1 G2 ¨ ¨ ¨ Gq “ B, por lo que |AB| “ |F1 F2 ¨ ¨ ¨ Fp G1 G2 ¨ ¨ ¨ Gq | “ |F1 ||F2 | ¨ ¨ ¨ |Fp ||G1 ||G2 | ¨ ¨ ¨ |Gq | “ |F1 F2 ¨ ¨ ¨ Fp ||G1 G2 ¨ ¨ ¨ Gq | “ |A||B|. ‚ 12.9.15. Corolario. Si A es una matriz cuadrada invertible, entonces |A´1 | “ 1 . |A| Demostración. Este corolario es una consecuencia de los teoremas 12.9.14 y 12.7.9 y del corolario 12.9.12. ‚ 12.9.16. Definición. Supongamos que tenemos un sistema de n ecuaciones lineales homogéneas con n incógnitas a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ 0 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ 0 .. . a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ ` an,n xn “ 0, 350 12.9. Operaciones elementales por renglón tal sistema siempre tiene como solución a x1 “ 0, x2 “ 0, . . . , xn “ 0 la cual se llama solución trivial del sistema de ecuaciones lineales homogéneas. Si la matriz cuadrada A “ pai,j q de n ˆ n es invertible, entonces la única solución del sistema de ecuaciones lineales es la solución trivial (teorema 12.8.6). Si la matriz A no es invertible, entonces es semejante a una matriz escalonada B “ pbi,j q cuyo último renglón es nulo, por lo que existen enteros positivos k1 , k2 , . . . , kl , tales que para todo i P t1, 2, . . . , nu la primer componente diferente de cero del i-ésimo renglón se encuentra en una posición diferente de la posición i, kj , para j P t1, 2, . . . , lu. Si tj es un número real cualquiera, podemos tomar xkj “ tj . Para las columnas en las posiciones m1 , m2 , . . . , mn´l , donde m1 , m2 , . . . , mn´l son todos diferentes de cada uno de los k1 , k2 , . . . , kl , tenemos que para cada i P t1, 2, . . . , n ´ lu existe un ri ésimo renglón tal que la primer componente diferente de cero es la que se encuentra en la l ř posición mi del renglón y tomando xmi “ ´ bmi ,kj xkj , tenemos una solución del sistema j“1 de ecuaciones. Tal solución es no trivial siempre que alguno de los tj sea diferente de cero, de hecho si el determinante de A es cero, existe una infinidad de soluciones del sistema. Ahora, debido al teorema 12.8.9, tenemos el siguiente teorema. 12.9.17. Teorema. El sistema de ecuaciones lineales a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ .. . b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ ` an,n xn “ bn , tiene una solución única si y sólo si la matriz A “ pai,j q de orden n ˆ n tiene determinante diferente de cero. Recordemos que la solución del sistema de ecuaciones dado en el teorema 12.9.17 está dado por px1 x2 . . . xn qt “ A´1 pb1 b2 . . . bn qt cuando la matriz A es invertible, es decir cuando tiene determinante diferente de cero. Introduciremos a continuación el concepto de matriz adjunta que servirá para calcular, cuando exista, la inversa de una matriz. 12.9.18. Definición. Dada una matriz cuadrada A “ pai,j q de orden n ˆ n, si Ai,j es el cofactor de la componente i, j de la matriz A, a la transpuesta de la matriz pAi,j q se la llama la matriz adjunta de A o adjunta de la matriz A. A la adjunta de la matriz A la denotaremos por A˚ ó por adj A. 12.9.19. Lema. Si A “ pai,j q es una matriz cuadrada y pAi,j q es las matriz de cofactores, entonces para i ‰ j tenemos n ÿ ai,k Aj,k “ 0. k“1 Demostración. Sea B la matriz que se obtiene a partir de la matriz A al reemplazar el j-ésimo renglón de A por el i-ésimo renglón de A. Por el teorema 12.7.7 tenemos que |B| “ 0 12.9. Operaciones elementales por renglón y por el teorema 12.7.15 tenemos que |B| “ 351 n ř ai,k Aj,k , por lo tanto k“1 n ř ai,k Aj,k “ 0. ‚ k“1 12.9.20. Teorema. Para toda matriz cuadrada A, ApA˚ q “ |A|I. Demostración. Sea pbi,j q “ ApA˚ q. La i-ésima fila de A es pai,1 , ai,2 , . . . , ai,n q y la j-ésima columna de A˚ es pAj,1 Aj,2 . . . Aj,n qt . Ahora, como bi,j es la componente i, j de ApA˚ q, entonces n ÿ bi,j “ pai,1 ai,2 . . . ai,n qpAj,1 Aj,2 . . . Aj,n qt “ ai,k Aj,k , k“1 y por el teorema 12.7.15 llegamos a que bk,k “ |A|, pero por el lema 12.9.19, para i ‰ j, se tiene bi,j “ 0, por lo tanto pbi,j q “ |A|I, es decir ApA˚ q “ |A|I. ‚ 12.9.21. Corolario. Si A es una matriz invertible, entonces A´1 “ 1 ˚ A . |A| 1 ˚ Demostración. Observando que la matriz |A| I conmuta con cualquier matriz, tenemos ´ ¯ ´ ¯ ´ ¯ 1 1 1 1 1 que A |A| A˚ “ A |A| I A˚ “ |A| I ApA˚ q “ |A| ApA˚ q “ |A| |A|I “ I. ‚ Otro método para resolver un sistema de ecuaciones lineales lo da el siguiente teorema que se le conoce como la regla de Cramer. Antes de enunciar la regla de Cramer establezcamos algo de notación. En el sistema de ecuaciones lineales a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ .. . b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ ` an,n xn “ bn , denotemos por ∆ al determinante de la matriz A “ pai,j q y por ∆j al determinante que se obtiene al reemplazar la j-ésima columna por la columna b “ pb1 b2 . . . bn qt . Por convención tomaremos x “ px1 x2 . . . xn qt . 12.9.22. Regla de Cramer. sea A “ pai,j q una matriz de orden n ˆ n con determinante diferente de cero. El sistema de ecuaciones lineales a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ .. . b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ ` an,n xn “ bn , 352 12.9. Operaciones elementales por renglón tiene como solución única a x1 “ ∆1 ∆2 ∆n , x2 “ , . . . , xn “ . ∆ ∆ ∆ Demostración. Por el teorema 12.9.20, A´1 “ ∆1 A˚ . Ahora, x “ A´1 b “ ∆1 A˚ b, es decir n n n ř ř ř xj “ ∆1 Ai,j bi , pero por el corolario 12.7.6, Ai,j bi “ bi Ai,j “ ∆j , por lo que xj “ ∆∆j . i“1 i“1 i“1 ‚ Ejercicios. 1. Hallar las adjuntas de las matrices siguientes y en caso de que sean invertibles calcular su inversa: ¨ ˛ ¨ ˛ 4 2 ´1 1 3 1 5 ¸ ˜ ¸ ˜ 3 ´2 2 2 ˚ ‹ 1 ´ 1 1 ˚ ‹ ˚ 4 6 ´3 3 ‹ 2 2 ˚ ‹ ˚ ‹. , b) , c) ˝ 4 6 ´7 ‚, d) ˚ a) 2 ‹ ´2 2 2 2 ˝ 2 2 1 ‚ 2 2 1 1 6 4 ´2 2. Decir si la siguiente matriz es invertible y por el método de Gauss: ¨ 3 2 ˚ ˚ 4 6 ˚ ˚ 2 ´2 ˝ 1 6 en caso de ser invertible calcular su inversa ˛ ´1 1 ´3 ‹ 3 ‹ ‹. 2 ‹ ‚ 1 4 ´2 3. Decir si el siguiente sistema de ecuaciones lineales tiene solución y en caso de que la tenga dar la solución: 3x ` 2y ´ z ` w “ 2 4x ` 6y ´ 3z ` 3w “ 1 2x ´ 2y ` z ` 2w “ 0 x ` 6y ` 4z ´ 2w “ 3. Capítulo 13 CONJUNTOS Y ESTRUCTURAS 13.1. Introducción En este capítulo se estudiarán alguna de las estructuras algebraicas más importantes en las matemáticas como son las de grupo, anillo y cuerpo. Los temas no se verán con la profundidad de los libros especializados y se darán sólo los resultados más importantes, principalmente los que tienen vinculación con la teoría de números y que deducen propiedades de éstos. Al lector que esté interesado en profundizar con los temas de estructuras algebraicas se le invita a estudiar las siguientes obras: «Algèbre» de N. Bourbaki (Hermann, Paris), «The Theory of Groups» de H. Hall (The McMillan Company, New York 1959) y «Lectures in Abstract Algebra I, II, III» de N. Jacobson (Springer-Verlag, New York 1975). Se decidió poner este capítulo en esta parte del libro con el objeto de poder darle al lector una buena variedad de ejemplos de estas estructuras sin que les sean extraños. Comenzaremos el estudio con la estructura algebraica conocida como grupo. 353 354 13.2. Grupos 13.2. Grupos 13.2.1. Definición. Sea G un conjunto y ˚ una operación definida en G. Decimos que el conjunto G con la operación ˚ forma un grupo, o más precisamente, que la pareja pG, ˚q es un grupo, si se satisfacen las siguientes cuatro propiedades: a) La operación ˚ es cerrada en G, es decir si a, b P G, entonces a ˚ b P G. b) La operación ˚ es asociativa, es decir si a, b, c P G, entonces pa ˚ bq ˚ c “ a ˚ pb ˚ cq. c) Existe un elemento e P G tal que para todo a P G, se tiene que a ˚ e “ e ˚ a “ a. d) Para cada a P G, existe un elemento â P G, tal que a ˚ â “ â ˚ a “ e. (Donde e es el dado en c)). 13.2.2. Definición. Al elemento e que aparece en el inciso c) de la definición anterior se le llama elemento identidad del grupo. Al elemento â que aparece en d) se le llama inverso de a (con respecto a la operación ˚). Observemos que a es inverso de â. 13.2.3. Ejemplos. Como ejemplos de grupos tenemos al conjunto de los números reales con la operación de suma y al conjunto de los números enteros también con la suma, en estos casos el elemento identidad es el número 0 y el inverso de un número es el inverso aditivo. Si GLn es el conjunto de las matrices n ˆ n (de números reales) que son invertibles, entonces GLn forma un grupo con la multiplicación de matrices y la matriz identidad In es el elemento identidad. Observemos que ni el conjunto de los números reales ni el de los enteros forman un grupo con la multiplicación, pues el cero no tiene inverso multiplicativo. Ahora, el conjunto Rzt0u sí forma un grupo con la multiplicación, donde la identidad multiplicativa es el número 1. Sin embargo, el conjunto Zzt0u de los enteros diferentes de 0 no forma un grupo con la multiplicación puesto que ningún entero diferente de 1 y de ´1 tiene a un entero como inverso. Otros ejemplos de subconjuntos de números reales que forman un grupo con la multiplicación son p0; `8q, Qzt0u, t1u, t´1, 1u y t2n : n P Zu, entre otros. Veamos algunas propiedades de los grupos. 13.2.4. Teorema. Si pG, ˚q es un grupo que tiene como elemento identidad a e1 y a e2 , entonces e1 “ e2 . Es decir, el elemento identidad de un grupo es único. Demostración. Si e1 y e2 son elementos identidad, entonces e1 “ e1 ˚ e2 “ e2 . ‚ 13.2.5. Teorema. Si pG, ˚q es un grupo, entonces todo elemento de G tiene un único inverso. Demostración. Sean a1 y a2 dos inversos de un mismo elemento a P G y e el elemento identidad. Tenemos que a1 “ a1 ˚ e “ a1 ˚ pa ˚ a2 q “ pa1 ˚ aq ˚ a2 “ e ˚ a2 “ a2 . ‚ 13.2.6. Notación. Mientras no se preste a confusión, siempre que pG, ¨q sea un grupo y a P G, al inverso de a lo denotaremos por a´1 y para a, b P G escribiremos ab en lugar de a ¨ b y e denotará al elemento identidad. Cuando no se especifique cuál es la operación se le denotará como ¨. Cuando la operación del grupo sea denotada con el símbolo +, al inverso 13.2. Grupos 355 de a se le denotará como ´a. En lo que reste del capítulo, G siempre denotará un conjunto que forma un grupo con alguna operación ¨, a menos que expresamente se diga otra cosa. Observemos que no siempre es válida la propiedad conmutativa en los grupos. Por ejemplo, si GLn es el conjunto de matrices invertibles de n ˆ n, no siempre se vale que AB “ BA para A, B P GLn . 13.2.7. Definición. Cuando tengamos un grupo pG, ¨q en el que se cumpla que ab “ ba para todo a, b P G, diremos que el grupo es un grupo conmutativo o también que es un grupo abeliano. 13.2.8. Teorema. Si a, b P G, entonces pabq´1 “ b´1 a´1 . Demostración. De la propiedad asociativa tenemos que pabqpb´1 a´1 q “ apbpb´1 a´1 qq “ appbb´1 qa´1 q “ apea´1 q “ aa´1 “ e, además tenemos también que pb´1 a´1 qpabq “ b´1 pa´1 pabqq “ b´1 ppa´1 aqbq “ b´1 pebq “ b´1 b “ e, por lo tanto b´1 a´1 es el inverso de ab. ‚ 13.2.9. Observación. Debido a la propiedad asociativa, no hay ambigüedad en cuanto al significado de expresiones como abc ó abcd, etc., cuando a, b, c, d P G. Es decir, no importa cuál de las operaciones se realice primero y cuál después, aunque sí importa el orden de aparición de los elementos de G cuando el grupo no es conmutativo. 13.2.10. Notación. Siempre que tengamos una operación que se denote por ¨, donde escribimos ab en lugar de a ¨ b, cuando tengamos una sucesión finita pa1 , a2 , . . . , an q de elementos n ś del conjunto en el cual está definida la operación, el símbolo ak denotará lo siguiente: k“1 1 ź ak “ a1 , k“1 2 ź ak “ a1 a2 , n`1 ź ..., k“1 ˜ ak “ k“1 donde intuitivamente a veces escribimos n ś n ź ¸ ak ak`1 , k“1 ak “ a1 a2 a3 ¨ ¨ ¨ an . De manera similar, cuando la k“1 n ř operación se denote como +, la expresión ak representará lo siguiente: k“1 1 ÿ k“1 ak “ a1 , 2 ÿ ak “ a1 ` a2 , n`1 ÿ ..., k“1 k“1 donde intuitivamente escribimos entero positivo tomaremos an :“ n ř k“1 n ś ak “ n ÿ ¸ ak ` ak`1 , k“1 ak “ a1 ` a2 ` a3 ` ¨ ¨ ¨ ` an . Además, cuando n sea un a y na :“ k“1 ´1 ´n n se un entero negativo an :“ pa q ˜ n ř a. También definiremos a0 :“ e y cuando k“1 . El siguiente corolario es una consecuencia del teorema 13.2.8 y el lector lo puede demostrar con detalle usando inducción matemática. 13.2.11. Corolario. Si pa1 , a2 , . . . , an q es una sucesión finita de elementos de G, entonces ´1 ´1 ´1 pa1 a2 ¨ ¨ ¨ an q´1 “ a´1 n an´1 ¨ ¨ ¨ a2 a1 . Más precisamente, ˜ ¸´1 n n ź ź ak “ a´1 n´k`1 . k“1 k“1 356 13.2. Grupos 13.2.12. Leyes de la cancelación. Sea pG, ¨q un grupo y sean a, b, x P G. aq ax “ bx ùñ a “ b. bq xa “ xb ùñ a “ b. Demostración. Demostraremos solamente la parte a) ya que la demostración de b) es similar. Si ax “ bx, entonces a “ ae “ apxx´1 q “ paxqx´1 “ pbxqx´1 “ bpxx´1 q “ be “ b. ‚ 13.2.13. Definición. La parte a) del teorema 13.2.12 se conoce como la ley de cancelación por la derecha y la parte b) como la ley de cancelación por la izquierda. Cuando el grupo no es conmutativo, no necesariamente es válido que ax “ xb ùñ a “ b. Un ejemplo muy importante de grupo lo da el teorema siguiente. 13.2.14. Teorema. Si S es un conjunto, entonces A pSq :“ tf : f es una biyección de S en Su forma un grupo con la composición de funciones. Demostración. Sean f, g, h P A pSq e I la función identidad en S, es decir I : S ÝÑ S tal que Ipxq “ x. Recordemos que la operación de composición de funciones se denota ˝. Como la composición de dos biyecciones de S en S es una biyección de S en S, tenemos que la operación ˝ es cerrada en A pSq. Como f ˝ I = I ˝ f “ f y además I P A pSq, tenemos que existe el elemento identidad, el cual es I. Tenemos además que f ˝ f ´1 “ f ´1 ˝ f “ I, por lo que la función inversa de f es la inversa con respecto a la operación ˝. Para terminar la demostración del teorema, solamente falta demostrar que se cumple la propiedad asociativa. Dado x P S tenemos que ppf ˝ gq ˝ hqpxq “ pf ˝ gqphpxqq “ f pgphpxqqq “ f ppg ˝ hqpxqq “ pf ˝ pg ˝ hqqpxq, por lo tanto pf ˝ gq ˝ h “ f ˝ pg ˝ hq, es decir se cumple la propiedad asociativa. ‚ 13.2.15. Definición. Sea pG, ¨q un grupo y H Ă G. Decimos que H, con la operación ¨, forma un subgrupo de G o que pH, ¨q es un subgrupo de pG, ¨q, cuando H con la operación ¨ forma un grupo. Al hecho de que pH, ¨q sea un subgrupo de pG, ¨q se le denota pH, ¨q ă pG, ¨q o simplemente como H ă G cuando la referencia a la operación ¨ sea obvia. Cuando H ă G, H ‰ teu y H ‰ G diremos que pH, ¨q es un subgrupo no trivial de pG, ¨q. 13.2.16. Ejemplo. Si tenemos el grupo pZ, `q y n es un entero, entonces el conjunto de todos los múltiplos de n forma un subgrupo de Z con la suma. Al conjunto de los múltiplos de n lo denotaremos por nZ. 13.2.17. Teorema. Sea pG, ¨q un grupo y ∅ ‰ H Ă G. Tenemos que H ă G si y sólo si para todo x, y P H se tiene que xy ´1 P H. Demostración. Debido a la propiedad de que todo elemento de un grupo tiene un inverso y de que la operación en un grupo es cerrada, es obvio que si H ă G, entonces para todo x, y P H se tiene que xy ´1 P H. Supongamos ahora que para todo x, y P H se tiene que xy ´1 P H. La propiedad asociativa en H se sigue de la propiedad asociativa en G. Como H es no vacío, se tiene que existe un x P H, de donde tenemos que e “ xx´1 P H, cumpliéndose así que H tiene al elemento identidad e. Como H tiene como elemento a la identidad e, entonces para todo x P H se 13.2. Grupos 357 tiene que x´1 “ ex´1 P H, por lo que todo elemento de H tiene su inverso en H. De lo anterior concluimos que H ă G, terminando la demostración del teorema. ‚ 13.2.18. Definición. Supongamos que H ă G y que a P G. Sea Ha :“ tha : h P Hu. Cualquier conjunto de la forma Ha donde a P G se llama clase lateral derecha de H. Observemos que la notación anterior tiene sentido siempre y cuando no sucedan cosas «extrañas» como el hecho de que, además de que H ă G, se tenga que H P G. Hecha la aclaración, mientras no se especifique lo contrario, supondremos siempre que si H ă G, entonces H R G de tal manera que la notación Ha no se preste a confusión. Así mismo aH :“ tah : h P Hu y a tal conjunto se le llamará clase lateral izquierda de H. Además si K y L son dos subconjuntos cualesquiera de G, el símbolo KL representará al conjunto tkl : k P K y l P Lu, mientras que el símbolo K ´1 representará al conjunto tk ´1 : k P Ku. Al conjunto de las clases laterales derechas de H incluidas en G lo denotaremos como G{H. 13.2.19. Teorema. Sea pG, ¨q un grupo y H ă G. El conjunto tHa : a P Gu, de todas las clases laterales derechas de H, es una partición en clases de G. Demostración. Como para todo a P G tenemos que a “ ea P Ha, entonces la unión de todas las clases laterales derechas de H es G. Demostremos ahora que dos clases laterales derechas de H son disjuntas o iguales. Sea c un elemento de G que pertenece a dos clases laterales derechas Ha y Hb. Existen un h1 P H y un h2 P H tales que h1 a “ h2 b “ c. Ahora, ´1 ´1 para todo h P H tenemos que ha “ hph´1 1 h1 aq “ hph1 h2 bq “ phh1 h2 qb P Hb, por lo tanto Ha Ă Hb. Análogamente se puede demostrar que Hb Ă Ha, teniendo así que Ha “ Hb. Hemos demostrado pues que dos clases laterales derechas son disjuntas o iguales y así que el conjunto de clases laterales derechas de H es una partición de G. ‚ 13.2.20. Teorema. Si H ă G y H es un conjunto finito, entonces el número de elementos de cualquier clase lateral derecha de H es igual al número de elementos de H. Demostración. Sea Ha una clase lateral derecha de H. Demostremos que la función f : H ÝÑ Ha tal que f phq “ ha es una biyección de H en Ha. Por definición de clase lateral derecha de H, la función f es una función sobre Ha. Ahora, por la ley de la cancelación por la derecha, si h1 ‰ h2 , entonces h1 a ‰ h2 a, de tal manera que f es una biyección de H en Ha y así H y Ha tienen el mismo número de elementos. ‚ 13.2.21. Definiciones. Los dos resultados anteriores y la mayoría de los resultados referentes a clases laterales derechas también son válidos para las clases laterales izquierdas, haciendo los cambios obvios en los enunciados. Cuando H ă G y el conjunto de las clases laterales derechas de H es finito, llamaremos al número de clases laterales derechas de H el índice de H en G y lo denotaremos así rG : Hs. (Debido a la observación anterior, rG : Hs es también el número de clases laterales izquierdas de H). Cuando pG, ¨q sea un grupo y G sea un conjunto finito, diremos que pG, ¨q es un grupo finito y al número de elementos de G se le llama orden del grupo pG, ¨q. En el caso en que G tenga un número infinito de elementos diremos que pG, ¨q es de orden infinito. Al orden de pG, ¨q lo denotaremos así opGq y por simplicidad también decimos que es el orden de G. De los teoremas 13.2.19 y 13.2.20, se deduce el siguiente resultado. 13.2.22. Teorema de Lagrange. Si pG, ¨q es un grupo finito y H ă G, entonces opGq “ opHqrG : Hs. 358 13.2. Grupos Una consecuencia inmediata y menos específica del teorema de Lagrange es el corolario siguiente. 13.2.23. Corolario. Si pG, ¨q es un grupo finito y H ă G, entonces opHq divide a opGq. 13.2.24. Corolario. Si pG, ¨q es un grupo finito, H ă G y K ă H, entonces rG : Ks “ rG : HsrH : Ks. Demostración. Observemos que K ă H y H ă G implica que K ă G. Por el teorema de Lagrange tenemos que opKqrG : Ks “ opGq “ opHqrG : Hs “ opKqrH : KsrG : Hs y dividiendo entre opKq obtenemos que rG : Ks “ rG : HsrH : Ks. ‚ 13.2.25. Notación. Sea pG, ¨q un grupo y g P G. Denotaremos por xgy al conjunto tg n : n P Zu. 13.2.26. Teorema. Si pG, ¨q es un grupo y g P G, entonces xgy ă G. Demostración. Sean m, n P Z. Tenemos que (véase ejercicio 3) g m pg n q´1 “ g m g ´n “ g m´n P xgy y el resultado se sigue del teorema 13.2.17. ‚ 13.2.27. Definiciones. Sea pG, ¨q un grupo y g P G. Al subgrupo pxgy, ¨q se le llama subgrupo cíclico o más específicamente subgrupo cíclico generado por g. Cuando existe un entero positivo n tal que g n “ e, al mínimo de los enteros positivos m que satisfacen la igualdad g m “ e se le llama orden de g. Si no existe ningún número natural n tal que g n “ e, diremos que el orden de g es infinito. Al orden de g lo denotaremos así opgq. Cuando se tiene que G “ xgy, decimos que pG, ¨q es un grupo cíclico, o más específicamente, que es un grupo cíclico generado por g. 13.2.28. Teorema. Si pG, ¨q es un grupo y g P G, entonces el orden de g es igual al orden de xgy. Demostración. Supongamos primero que g tiene orden finito n. Para m P Z, sean a, r enteros tales que 0 ĺ r ă n y m “ an ` r. Con estas condiciones tenemos que g m “ g an g r “ pg n qa g r “ ea g r “ g r , por lo que gm P tg 0 , g 1 , . . . , g n´1 u, es decir xgy Ă tg 0 , g 1 , . . . , g n´1 u, de modo que el orden de xgy es menor o igual que el orden de g. Veamos que es imposible que el orden de xgy sea menor que el orden de g. Si m fuera el orden de xgy y m ă n, entonces alguno de los elementos g 0 , g 1 , . . . , g n´1 estaría repetido, es decir existirían dos números enteros r, s P t0, 1, . . . , n´1u tales que r ă s y g r “ g s , obteniendo que g s´r “ e, y como 0 ĺ s´r ă n, esto contradice el hecho de que el orden de g es n. Por lo anterior vemos que el orden de g es igual al orden de xgy cuando el orden de g es finito. Supongamos ahora que el orden de g es infinito y veamos que todos los elementos 0 1 g , g , . . . , g n , . . . son diferentes, es decir que si m, n son enteros no negativos y g m “ g n , entonces m “ n. Si existieran dos enteros m y n tales que 0 ĺ n ă m y además g m “ g n , entonces g m´n “ e, y como m ´ n ą 0, esto contradiría el hecho de que el orden de g es infinito. Así vemos que necesariamente el orden de xgy es igual al orden de g. ‚ 13.2.29. Teorema. Si pG, ¨q es un grupo finito y g P G, entonces opgq | opGq. Demostración. El teorema es una consecuencia inmediata del teorema 13.2.28 y del corolario 13.2.23. ‚ 13.2.30. Corolario. Si pG, ¨q es un grupo finito y g P G, entonces g opGq “ e. 13.2. Grupos 359 Demostración. Por el teorema 13.2.29, existe un entero m tal que m opgq “ opGq, por lo tanto g opGq “ g m opgqs “ pg opgq qm “ em “ e. ‚ 13.2.31. Corolario. Si pG, ¨q es un grupo finito cuyo orden es un número primo, entonces el grupo es cíclico y generado por cualquier elemento de G diferente de la identidad. Demostración. Supongamos que e ‰ g P G y que el orden de G es un número primo p. Los únicos enteros positivos que dividen a p son 1 y p, pero como g ‰ e, el teorema 13.2.29 nos lleva a que el orden de g es p. Ahora, como xgy Ă G, por el teorema 13.2.28 tenemos que opxgyq “ opgq “ p “ opGq, entonces necesariamente xgy “ G. ‚ 13.2.32. Definición. Sea ϕ : N ÝÑ N definida de la siguiente manera ϕp1q “ 1 y si n ą 1, entonces ϕpnq es el número de enteros positivos menores que n que sean primos relativos con n. A tal función ϕ se le llama la función de Euler y se le denotará así a lo largo de este capítulo. Por ejemplo, los enteros positivos menores que 10 y que son primos relativos con 10 son 1, 3, 7 y 9, por lo que ϕp10q “ 4, de manera similar ϕp2q “ 1, ϕp3q “ 2, ϕp4q “ 2, ϕp5q “ 4, ϕp6q “ 2, ϕp7q “ 6, ϕp8q “ 4, etc. Observemos que si p es un número primo, entonces ϕppq “ p ´ 1. El siguiente lema servirá para dar algunas aplicaciones de los grupos en la teoría de números. 13.2.33. Lema. El conjunto Pn :“ trjsn : j ă n y j es primo relativo con nu, que está incluido en Zn , forma un grupo con la multiplicación módulo n. Demostración. Observemos que debido al teorema 4.7.31, la multiplicación módulo n es asociativa y r1sn es elemento identidad con la multiplicación módulo n, por lo que es suficiente demostrar que la multiplicación módulo n es cerrada en Pn y que todo elemento de Pn tiene un inverso en Pn . Demostremos primero que la operación es cerrada. Sean m, k P t0, 1, . . . , n´1u tales que rmsn , rksn P Pn . Como m y k son primos relativos con n, entonces también lo es mk, pero por el algoritmo de la división, existen enteros a y r, tales que mk “ an ` r y 0 ĺ r ă n, ahora, si r no fuera primo relativo con n, entonces tampoco lo sería an ` r “ mk, de donde tenemos que necesariamente r es primo relativo con n teniéndose así que rmsn rksn “ rrsn P Pn , quedando demostrado que la multiplicación es cerrada en Pn . Demostremos ahora que todo elemento de Pn tiene un inverso multiplicativo. Tomemos un elemento de Pn y denotémoslo como rmsn , donde 0 ĺ m ă n (en realidad se tiene también que 0 ă m). Como la multiplicación módulo n es cerrada en Pn y el conjunto Pn tiene menos de n elementos, entonces alguno de los elementos rms1n , rms2n , . . . , rmsnn , está repetido, es decir existen dos enteros positivos diferentes k, l ĺ n, tales que rmskn “ rmsln . Supongamos que l es el primer entero positivo tal que existe un entero k mayor que l y menor que n`1, tal que rmskn “ rmsln . De la igualdad anterior, obtenemos que n | mk ´ ml “ ml pmk´l ´ 1q y así n | mk´l ´ 1, es decir rmsk´l´1 rmsn “ r1sn , con lo cual concluimos que rmsk´l´1 es el inverso multiplicativo n n de rmsn , terminando así la demostración del lema. ‚ 13.2.34. Teorema de Euler. Si n es un entero positivo y a es primo con respecto a n, entonces aϕpnq ”n 1. Demostración. El teorema se sigue del lema 13.2.33, de la definición de la función de Euler ϕ y del corolario 13.2.30. ‚ 360 13.2. Grupos Como aplicación del teorema de Euler a la teoría de números, tenemos el siguiente corolario conocido como corolario de Fermat. 13.2.35. Corolario de Fermat. Si p es un número primo y a es un entero, entonces ap ”p a. Demostración. Como p es un número primo, entonces ϕppq “ p ´ 1, por lo tanto, si p no divide a un entero a, tenemos que p y a son primos relativos, y además rasp “ rrsp para algún r P t0, 1, . . . , p ´ 1u, por lo que debido al teorema de Euler tenemos que rap sp “ raspp “ p rrspp “ rrsp´1 p rrsp “ r1sp rrsp “ rrsp “ rasp , por lo tanto a ”p a. Ahora, si p divide al número a, p p entonces también divide a a y se tiene que a ”p a, con lo que el corolario queda demostrado. ‚ 13.2.36. Definición. Sea pG, ¨q un grupo y N ă G. Decimos que pN, ¨q es un subgrupo normal de pG, ¨q si para todo g P G tenemos que gN g ´1 Ă N . Al hecho de que pN, ¨q sea un subgrupo normal de pG, ¨q se le denotará como pN, ¨q C pG, ¨q o simplemente como N C G cuando la referencia a la operación ¨ sea clara. 13.2.37. Lema. Sea pG, ¨q un grupo y N C G. Toda clase lateral derecha de N es también una clase lateral izquierda de N y toda clase lateral izquierda de N es también una clase lateral derecha de N . Más precisamente, para todo g P G tenemos que N g “ gN . Demostración. Sea g P G, es decir sea gN una clase lateral izquierda de N . Por hipótesis tenemos que gN g ´1 Ă N . Ahora, por la propiedad asociativa tenemos que gN “ gN pg ´1 gq “ pgN g ´1 qg Ă N g. Como pg ´1 q´1 “ g tenemos también por hipótesis que g ´1 N g Ă N y de nuevo por la propiedad asociativa tenemos que N g “ pgg ´1 qN g “ gpg ´1 N gq Ă gN , concluyendo así que N g “ gN . ‚ 13.2.38. Definición. Cuando pG, ¨q es un grupo y N C G, a cualquier clase lateral izquierda o derecha le llamamos simplemente clase lateral. Esta definición tiene sentido debido al lema anterior. En este contexto, cuando dos elementos g, h P G están en una misma clase lateral, decimos que g y h son congruentes módulo N y a tal hecho se le denota así g ”N h ó así g ” hpmódN q. 13.2.39. Ejemplo. Como ejemplo tenemos que si n es un número entero y nZ es el conjunto de los múltiplos enteros de n, entonces el conjunto de los enteros módulo n coincide con el conjunto de clases laterales de nZ con la operación de suma, es decir, con esta nueva terminología, los enteros módulo n son los enteros módulo nZ, teniéndose que Zn “ Z{ nZ, donde las clases laterales se están tomando con respecto a la operación de suma. 13.2.40. Lema. Sea pG, ¨q un grupo y N C G. El producto de dos clases laterales es una clase lateral. Demostración. Sean g, h P G, es decir sean gN y hN dos clases laterales. Por el lema 13.2.37 y por la propiedad asociativa tenemos que pgN qphN q “ pgN hqN “ pghN qN . Observemos que N N “ N , en efecto si n P N , entonces, como e P N tenemos que n “ ne P N , y si n1 , n2 P N , entonces, por ser N ă G, tenemos que n1 n2 P N . Del hecho de que N N “ N y de la propiedad asociativa tenemos que pghN qN “ ghpN N q “ ghN . ‚ 13.2.41. Lema. Sea pG, ¨q un grupo y N ă G. Si toda clase lateral derecha de N es una clase lateral izquierda de N o si toda clase lateral izquierda de N es una clase lateral derecha de N , entonces N C G y además para todo g P G se tiene que gN g ´1 “ N . 13.2. Grupos 361 Demostración. Supongamos que toda clase lateral derecha de N es una clase lateral izquierda de N . Tenemos pues que si g P G, entonces existe un h P G tal que gN “ N h, pero como g P N h, entonces N h “ N g, por lo que gN “ N g, de donde obtenemos que gN g ´1 “ pN gqg ´1 “ N pgg ´1 q “ N e “ N . De manera análoga se demuestra que si toda clase lateral izquierda de N es una clase lateral derecha de N , entonces gN g ´1 “ N , para todo g P G. ‚ 13.2.42. Lema. Sea pG, ¨q un grupo y N ă G. Si el producto de cualesquiera dos clases laterales derechas (o izquierdas) de N es una clase lateral derecha (o izquierda respectivamente), entonces N C G. Demostración. Se hará la demostración solamente para el caso de clases laterales derechas. Supongamos que el producto de dos clases laterales derechas es una clase lateral derecha y sea g P G. El conjunto pN gqpN g ´1 q es una clase lateral derecha a la cual pertenece la identidad e, por lo que N pgN g ´1 q “ pN gqpN g ´1 q “ N e “ N , teniéndose así que gN g ´1 “ epgN g ´1 q ‚ Ă N pgN g ´1 q “ N , por lo tanto N C G. 13.2.43. Teorema. Sea pG, ¨q un grupo y N ă G. Las siguientes proposiciones son equivalentes: a) N C G. b) Toda clase lateral derecha de N es una clase lateral izquierda de N . Más precisamente, para todo g P N se tiene que gN “ N g. c) El producto de cualesquiera dos clases laterales derechas (o izquierdas) de N es una clase lateral derecha (o izquierda) de N . d) Para todo g P G se tiene que gN g ´1 “ N . e) El conjunto G{N de clases laterales derechas de N forma un grupo con la multiplicación de clases laterales. Demostración. Debido al lema 13.2.37 se tiene que a) implica b). Debido al lema 13.2.40 se tiene que a) implica c). Debido al lema 13.2.41 se tiene que b) implica las proposiciones a) y d). Debido al lema 13.2.42 se tiene que c) implica a). Por definición de grupo normal se tiene que d) implica a). Por definición de grupo se tiene que e) implica c). Hasta aquí podemos observar que las proposiciones a), b), c) y d) son equivalentes y que e) implica cualquiera de éstas. Observemos que si se cumple c), entonces pN gqpN hq “ N pghq, para todo g, h P G, en particular pN gqpN eq “ N g “ pN eqpN gq y pN gqpN g ´1 q “ N e, por lo que N “ N e es el elemento identidad para la multiplicación de clases laterales derechas y el inverso de N g es N g ´1 . Si g, h, k P G, entonces pN gqppN hqpN kqq “ pN gqpN phkqq “ N pgphkqq “ N ppghqkq “ pN pghqqpN kq “ ppN gqpN hqqpN kq. Por lo tanto también se cumple la propiedad asociativa, es decir el conjunto G{N de clases laterales derechas de N forma un grupo con la multiplicación de clases laterales. ‚ Ejercicios. 1. Demostrar que pZn , `q es un grupo conmutativo. 362 13.2. Grupos 2. Supongamos que se tiene un conjunto H “ ta, b, eu de tres elementos en el cual está dada una operación ¨ de la siguiente forma: a ¨ a “ a, a ¨ b “ b ¨ a “ e, a ¨ e “ e ¨ a “ a, b ¨ b “ b, b ¨ e “ e ¨ b “ b y e ¨ e “ e. ¿Es pH, ¨q un grupo conmutativo? 3. Sean m y n números enteros y a, b P G, donde pG, ¨q es un grupo. Demostrar que am`n “ am an ypam qn “ amn . Dar un ejemplo de un grupo en el que no se cumpla que pabqm “ am bm . 4. Sea GLn el conjunto de las matrices n ˆ n que son invertibles y SLn el conjunto de las matrices n ˆ n con determinante 1. Tomando la multiplicación de matrices como operación, demostrar que SLn ă GLn . 5. Sea pG, ¨q un grupo y g P G. Demostrar que pxgy, ¨q es un grupo abeliano. 13.3. Homomorfismos 13.3. 363 Homomorfismos 13.3.1. Definición. Sean pG, ¨q y pG1 , ˚q dos grupos y f : G ÝÑ G. Decimos que f es un homomorfismo entre los grupos pG, ¨q y pG1 , ˚q si para cualesquiera dos elementos g, h P G se tiene que f pg ¨ hq “ f pgq ˚ f phq. Un ejemplo interesante de homomorfismo de grupo es el siguiente. Tomemos los grupos pR, `q y pRzt0u, ¨q y la función exp : R ÝÑx Rzt0u. Tal función exp es un homomorfismo xÞÑe entre los grupos pR, `q y pRzt0u, ¨q puesto que exppx ` yq “ ex`y “ ex ¨ ey “ exppxq ¨ exppyq. El siguiente teorema muestra dos propiedades muy importantes de los homomorfismos de grupos como son los hechos de preservar la identidad y los inversos. 13.3.2. Teorema. Si f : G ÝÑ G1 es un homomorfismo entre los grupos pG, ¨q y pG1 , ˚q, con identidades e y e1 respectivamente entonces: a) f peq “ e1 . b) f px´1 q “ f pxq´1 . (Donde f pxq´1 denota al inverso de f pxq en el grupo pG1 , ˚q). Demostración. Tenemos que e1 ˚ f peq “ f peq “ f pe ¨ eq “ f peq ˚ f peq y por la ley de la cancelación por la derecha concluimos que f peq “ e1 , demostrando así la parte a) del teorema. Ahora, por la parte a) del teorema tenemos que f pxq ˚ f px´1 q “ f px ¨ x´1 q “ f peq “ e1 “ f pxq ˚ f pxq´1 , y por la ley de la cancelación por la izquierda concluimos que f px´1 q “ f pxq´1 , terminando la demostración del teorema. ‚ 13.3.3. Teorema. El recorrido de un homomorfismo f : G ÝÑ G1 entre dos grupos pG, ¨q y pG1 , ˚q forma un subgrupo de pG1 , ˚q. Demostración. Como G es no vacío, el recorrido del homomorfismo f es no vacío. Ahora, por el teorema 13.3.2 a), vemos que f pxq ˚ f pyq´1 “ f pxq ˚ f py ´1 q “ f px ¨ y ´1 q, el cual pertenece al recorrido de f . Así pues, el teorema se sigue del teorema 13.2.17. ‚ 13.3.4. Definición. Sea f : G ÝÑ G1 un homomorfismo entre los grupos pG, ¨q y pG1 , ˚q, el segundo con identidad e1 . Al conjunto tx P G : f pxq “ e1 u se le llama el núcleo de f y se le denota por ker pf q. 13.3.5. Teorema. El núcleo de un homomorfismo f : G ÝÑ G1 entre dos grupos pG, ¨q y pG1 , ˚q forma un subgrupo de pG, ¨q. Demostración. Por el teorema 13.3.2 el núcleo es no vacío y además, si x, y P ker pf q, entonces f px ¨ y ´1 q “ f pxq ˚ f pyq´1 “ e1 ˚ pe1 q´1 “ e1 , por lo que aplicando el teorema 13.2.17 concluimos el teorema. ‚ 13.3.6. Definición. Un homomorfismo entre dos grupos pG, ¨q y pG1 , ˚q que es una función inyectiva se llama isomorfismo de pG, ¨q a pG1 , ˚q. Cuando existe un isomorfismo f : G ÝÑ G1 entre dos grupos pG, ¨q y pG1 , ˚q cuyo recorrido es G1 , se dice que los grupos son isomorfos. La palabra isomorfo significa que tienen la misma forma, es decir si dos grupos son isomorfos, aunque formalmente pueden ser diferentes, su estructura es la misma y todas las propiedades 364 13.3. Homomorfismos interesantes de uno las tiene el otro. Al hecho de que los grupos pG, ¨q y pG1 , ˚q sean isomorfos se le denota así pG, ¨q – pG1 , ˚q. Un automorfismo de un grupo pG, ¨q es un isomorfismo (con respecto a la misma operación ¨) f : G ÝÑ G cuyo recorrido es G. Es obvio que todo grupo pG, ¨q es isomorfo consigo mismo, pues la función identidad en G siempre es un automorfismo. Al conjunto de todos los automorfismos de un grupo pG, ¨q lo denotaremos así AutpGq o como AutpG, ¨q si se quiere ser específico. 13.3.7. Teorema. Si f : G ÝÑ G es un automorfismo de un grupo pG, ¨q, entonces f ´1 también es un automorfismo del mismo grupo. Demostración. Sean a, b P G. Tenemos que f ´1 pa ¨ bq “ f ´1 pf pf ´1 paqq ¨ f pf ´1 pbqqq “ f ´1 pf pf ´1 paq ¨ f ´1 pbqqq “ f ´1 paq ¨ f ´1 pbq. ‚ 13.3.8. Teorema. La composición de dos automorfismos es un automorfismo. Demostración. Sean f y g dos automorfismos de un grupo pG, ¨q y a, b P G. Tenemos que f ˝ gpabq “ f pgpabqq “ f pgpaqgpbqq “ f pgpaqqf pgpbqq “ pf ˝ gpaqqpf ˝ gpbqq. ‚ 13.3.9. Teorema. El conjunto AutpGq forma un subgrupo del grupo pA pGq, ˝q de biyecciones de G en G con la composición de funciones. Demostración. El teorema 13.3.9 se sigue de los teoremas 13.3.7 y 13.3.8 y del teorema 13.2.17. ‚ 13.3.10. Teorema de Cayley. Todo grupo es isomorfo a algún subgrupo de pA pSq, ˝q para algún conjunto S. Demostración. Sea pG, ¨q un grupo. Demostraremos que el grupo pG, ¨q es isomorfo a un subgrupo de pA pGq, ˝q. En nuestro caso el conjunto adecuado S del teorema será el propio G. Para cada g P G definamos la función τg : G ÝÑ G dada por τg paq :“ ga y sea T :“ tτg : g P Gu. Afirmamos que τg es una biyección de G en G. En efecto, τg paq “ τg pbq ðñ ga “ gb ðñ a “ b, por lo que τg es inyectiva, pero además a P G ùñ τg pg ´1 aq “ a de modo que τg es una biyección de G en G. Observando que τg´1 es la función inversa de τg y que τg ˝ τh “ τgh (en particular τg ˝ τh´1 “ τgh´1 ), de modo que por el teorema 13.2.17 tenemos que T ă A pGq. Para terminar de demostrar el teorema, mostraremos que pG, ¨q y pT, ˝q son isomorfos. El candidato a ser un isomorfismo de G sobre T es la función ψ : G ÝÑ T dada por ψpgq “ τg . Veamos primero que ψ es un homomorfismo. En efecto, ψpghq “ τgh “ τg ˝ τh “ ψpgq ˝ ψphq. Veamos ahora que ψ es un homomorfismo sobre T . En efecto, todo elemento de T es de la forma τg para algún g P G y así ψpgq “ τg . Finalmente veamos que y es inyectiva. Tenemos que ψpgq “ ψphq ùñ τg “ τh ùñ τg peq “ τh peq ùñ ge “ he ùñ g “ h. ‚ El teorema anterior indica que cualquier grupo tiene la estructura de un subgrupo de biyecciones con la operación de composición, por lo que al estudiar solamente este tipo de subgrupos estaremos prácticamente estudiando todos los grupos, de hecho el significado original de la palabra grupo era de grupo de biyecciones. Aun así, el trabajo de estudiar los grupos y sus propiedades es ilimitado. Observemos que en el transcurso de la demostración del teorema de Cayley se ha demostrado también el teorema siguiente. 13.3.11. Teorema. Sea pG, ¨q un grupo. Si τg : G ÝÑ G es la función tal que τg paq “ ga, 13.3. Homomorfismos 365 entonces τg es una biyección de G en G. 13.3.12. Teorema. Un homomorfismo f : G ÝÑ G1 entre dos grupos pG, ¨q y pG1 , ˚q es un isomorfismos si y sólo si ker pf q “ teu. Demostración. Como f peq “ e1 , es claro que si f es un isomorfismo, entonces ker pf q “ teu. Ahora, si ker pf q “ teu y f paq “ f pbq, entonces e1 “ f paq ˚ f pbq´1 “ f paq ˚ f pb´1 q “ f pab´1 q, por lo que ab´1 “ e, obteniendo que a “ b y concluyendo así que f es un isomorfismo. ‚ 13.3.13. Teorema. Si N es el núcleo de un homomorfismo f : G ÝÑ G1 entre dos grupos pG, ¨q y pG1 , ˚q, entonces la clase lateral derecha N g es igual a la clase lateral izquierda gN , para todo g P G. Demostración. Sea g P G y f pgq “ g 1 . Demostremos que f ´1 rtg 1 us “ N g. Cualquier elemento de N g es de la forma ng, para algún n P N , de modo que f pngq “ f pnq ˚ f pgq “ e1 ˚ g 1 “ g 1 , por lo que N g Ă f ´1 rtg 1 us. Ahora, si h P f ´1 rtg 1 us, entonces h “ mg para algún m P G (esto se logra tomando m “ hg ´1 ) y además e1 ˚ g 1 “ g 1 “ f phq “ f pmgq “ f pmq ˚ f pgq “ f pmq ˚ g 1 , por lo tanto f pmq “ e1 , es decir m P N y así h “ mg P N g, por lo que f ´1 rtg 1 us Ă N g y así f ´1 rg 1 s “ N g. De manera análoga se demuestra que f ´1 rg 1 s “ gN , por lo que N g “ gN . ‚ 13.3.14. Teorema. Sea pG, ¨q un grupo, N CG y f : G ÝÑ G{N la función tal que f pgq “ N g para todo g P G. La función f es un homomorfismo entre el grupo pG, ¨q y el grupo formado por G{N con la multiplicación de clases laterales. Además el núcleo de f es N . Demostración. Tenemos que si g, h P G, entonces, por el teorema 13.2.43, f pghq “ N pghq “ pN gqpN hq “ f pgqf phq, por lo que f es un homomorfismo. Del hecho de que N g “ N si y sólo si g P N , se sigue que ker pf q “ N . ‚ 13.3.15. Teorema. Sea pG, ¨q un grupo y N ă G. El subgrupo pN, ¨q es un subgrupo normal de pG, ¨q si y sólo si existe algún grupo pG1 , ˚q y un homomorfismo f : G ÝÑ G1 tal que ker pf q “ N . Demostración. Por el teorema 13.3.14 tenemos que si N C G, y tomamos G1 “ G{N , ˚ la operación de multiplicación de clases laterales y f pgq “ N g; entonces ker pf q “ N . Ahora, si f : G ÝÑ G1 es un homomorfismo de grupos tal que ker pf q “ N , entonces, por el teorema 13.3.13 se tiene que N g “ gN , para todo g P G, y por el teorema 13.2.43 se tiene que N C G. ‚ 13.3.16. Teorema. Sean pG, ¨q y pG1 , ˚q grupos, f : G ÝÑ G1 un homomorfismo y N “ kerpf q. La función F : G{N ÝÑ G1 está bien definida y es un isomorfismo de grupos. N ¨gÞÑf pgq Demostración. Veamos primero que F está bien definida. Tenemos que si N g “ N h, entonces h ¨ g ´1 P N por lo que f ph ¨ g ´1 q “ f phq ˚ f pg ´1 q “ f phq ˚ pf pgqq´1 es la identidad en G1 , teniendo así que f pgq “ f phq, es decir F está bien definida. Veamos ahora que F es un homomorfismo. Tenemos que F ppN ¨gq¨pN ¨hqq “ F pN ¨pg¨hqq “ f pg ¨ hq “ f pgq ˚ f phq “ F pN ¨ gq ˚ F pN ¨ hq. por lo que F es un homomorfismo. Ahora F es un isomorfismo debido a que si N ¨ g ‰ N , entonces g R N , de manera que F pN ¨ gq “ f pgq es diferente de la identidad en G1 . ‚ 13.3.17. Definición. Al isomorfismo F dado en el teorema 13.3.16 le llamaremos isomorfismo inducido por el homomorfismo f . 366 13.4. 13.4. Anillos Anillos En esta sección estudiaremos una estructura algebraica en donde, a diferencia de la estructura de grupo, intervienen dos operaciones en vez de una. Después de algunas definiciones veremos unos ejemplos. 13.4.1. Definiciones. Sea R un conjunto en el cual están definidas dos operaciones ` y ¨ a las cuales les llamaremos suma (o adición) y producto (o multiplicación) y que para cualesquiera a, b, c P R se satisfacen las siguientes propiedades: a) pR, `q es un grupo abeliano cuya identidad la denotaremos por 0. b) a ¨ b P R. c) a ¨ pb ¨ cq “ pa ¨ bq ¨ c. d) a ¨ pb ` cq “ pa ¨ bq ` pa ¨ cq y pb ` cq ¨ a “ pb ¨ aq ` pc ¨ aq. Con las condiciones anteriores diremos que la terna pR, `, ¨q es un anillo o que el conjunto R forma un anillo con las operaciones de suma y multiplicación. Cuando exista un elemento 1 P R tal que a ¨ 1 “ 1 ¨ a “ a para todo a P R, entonces diremos que el anillo es un anillo con elemento unitario y al elemento 1 se le llama el elemento unitario o uno (se le llama uno generalmente cuando se denota con ese símbolo). Cuando se cumpla la propiedad conmutativa para la multiplicación, es decir que para todo a, b P R se tenga que a ¨ b “ b ¨ a, diremos que el anillo es un anillo conmutativo. Cuando la terna pR, `, ¨q satisfaga las propiedades a), b) y d), pero para algunos a, b, c P R no se cumpla la propiedad asociativa de la multiplicación (propiedad d)), diremos que pR, `, ¨q es un anillo no asociativo. Estudiaremos algunas propiedades de los anillos, pero no analizaremos los anillos no asociativos. Como ejemplos de anillos tenemos al conjunto de los números reales con la suma y multiplicación usuales, tal anillo es un anillo con elemento unitario y es un anillo conmutativo; el conjunto de las matrices n ˆ n de números reales con la suma y multiplicación de matrices, el cual es un anillo con elemento unitario, pero no es un anillo conmutativo; el conjunto de los números enteros con la suma y multiplicación usuales, el cual es un anillo conmutativo y también es un anillo con elemento unitario; el conjunto de los enteros que son múltiplos de 2 con la suma y multiplicación usuales, el cual es un anillo conmutativo, pero no es un anillo con elemento unitario; el conjunto de los enteros módulo n con la suma y multiplicación módulo n es un anillo conmutativo y también es un anillo con elemento unitario; el conjunto de funciones polinomiales con coeficientes enteros con la suma y multiplicación de funciones es un anillo conmutativo y anillo con elemento unitario. En lo sucesivo escribiremos a veces ab en lugar de a ¨ b y, como sucede con el anillo de los números reales con la suma y multiplicación usuales, supondremos que una expresión donde aparezcan sumas y multiplicaciones, con ausencia de paréntesis se realizarán primero las operaciones de multiplicación y luego las de suma, así por ejemplo ab ` c significará pabq ` c. 13.4. Anillos 367 Veamos otras definiciones que servirán para hacer otras clasificaciones de los anillos. 13.4.2. Definición. Cuando pR, `, ¨q es un anillo conmutativo, existe un a tal que 0 ‰ a P R, existe un b tal que 0 ‰ b P R y además ab “ 0, decimos que a es un divisor del cero (en el anillo). 13.4.3. Ejemplo. Tenemos que el conjunto Z8 con la suma y multiplicación módulo 8 forma un anillo conmutativo y que los elementos r2s8 , r4s8 y r6s8 son divisores del cero (en este caso el cero es r0s8 “ r8s8 ). 13.4.4. Definición. Un anillo conmutativo pR, `, ¨q es un dominio entero, si en R no existen divisores del cero. Es decir, un anillo conmutativo pR, `, ¨q es un dominio si para a, b P R se tiene que ab “ 0 ùñ a “ 0 ó b “ 0. 13.4.5. Ejemplos. Como ejemplos de dominios enteros tenemos a pR, `, ¨q, pZ, `, ¨q, pQ, `, ¨q, pZ3 , `3 , ¨3 q. 13.4.6. Definición. Un anillo pR, `, ¨q es un anillo con división, semicuerpo o semicampo, si pRzt0u, ¨q es un grupo. En el caso en que pR, `, ¨q se un anillo con división y a P Rzt0u escribiremos a veces a1 en lugar de a´1 , es decir a1 es el número tal que a ¨ a1 “ a1 ¨ a “ 1 13.4.7. Ejemplos. Como ejemplos de anillos con división tenemos a pR, `, ¨q, pQ, `, ¨q, pZ7 , `7 , ¨7 q y pGLn Y t0u, `, ¨q, donde GLn es el conjunto de matrices invertibles de n ˆ n y 0 es la matriz de n ˆ n tal que todas sus componentes son 0. 13.4.8. Definición. Un anillo conmutativo pR, `, ¨q es un campo o cuerpo, si pRzt0u, ¨q es un grupo abeliano. Es decir, un cuerpo es un anillo con división que es a su vez un anillo conmutativo. En el caso en que pR, `, ¨q sea un campo, b P R y a P Rzt0u escribiremos a veces ab en lugar de a1 ¨ b. Observemos que todo cuerpo es un dominio entero. 13.4.9. Ejemplos. Como ejemplos de cuerpos tenemos a pR, `, ¨q, pQ, `, ¨q, pZ7 , `7 , ¨7 q. No todos los dominios enteros son cuerpos, por ejemplo pZ, `, ¨q es un dominio entero que no es cuerpo. El anillo pGLn Y t0u, `, ¨q, con n ľ 2, es un ejemplo de un anillo con división que no es un cuerpo. Veamos ahora algunos resultados importantes de la teoría de anillos. 13.4.10. Teorema. Si pR, `, ¨q es un anillo, entonces para todo a, b P R tenemos: a) a0 “ 0a “ 0. b) ap´bq “ p´aqb “ ´pabq. c) p´aqp´bq “ ab. Demostración. Demostremos primero la parte a). Si a P R, entonces a0 ` 0 “ a0 “ ap0 ` 0q “ a0 ` a0 y por la ley de la cancelación por la izquierda, tenemos que a0 “ 0. Análogamente se demuestra que 0a “ 0, verificándose así la propiedad a). Para verificar b) demostraremos solamente que p´aqb “ ´pabq, pues la igualdad ap´bq “ ´pabq se demuestra de manera análoga. Ahora, p´aqb ` ab “ p´a ` aqb “ 0b “ 0, por lo tanto ´ab “ p´aqb. 368 13.4. Anillos La parte c) se deduce aplicando b) dos veces, es decir p´aqp´bq “ ´pap´bqq “ ´p´pabqq “ ab. ‚ 13.4.11. Teorema. Si pR, `, ¨q es un anillo, entonces para todo a, b P R tenemos: a) p´1qa “ ´a. b) p´1qp´1q “ 1. Demostración. Por el teorema 13.4.10 b) tenemos que p´1qa “ ´p1aq “ ´a, obteniéndose así la parte a) del teorema. Por el teorema 13.4.10 c) tenemos que p´1qp´1q “ p1 ¨ 1q “ 1, obteniéndose así la parte b) del teorema. ‚ 13.4.12. Teorema. Todo dominio entero finito es un cuerpo. Demostración. Sea pR, `, ¨q un dominio entero finito, es decir un dominio entero en el cual el conjunto R es finito. Supongamos que #R “ n y que R “ t0, x1 , . . . , xn´1 u, es decir x1 , . . . , xn´1 son todos los n ´ 1 elementos diferentes de 0 de R. Para todo r P R diferente de 0, la función τr : R ÝÑ R dada por τr pxq “ rx es una biyección de R en R (para verificar esto se puede seguir parte de la demostración del teorema de Cayley, observando que τr pxq “ 0 ðñ x “ 0 ). Sea b el único elemento de R tal que rb “ r. Si y P R, entonces y “ rc, para algún c P R. Ahora, yb “ prcqb “ rpcbq “ rpbcq “ prbqc “ rc “ y, por lo que b es el elemento unitario al cual denotaremos por 1. Ahora, como también existe un d tal que rd “ 1, éste debe ser el inverso de r y como r se escogió de manera arbitraria (sólo se pidió que r ‰ 0), entonces el dominio entero finito es, en efecto, un cuerpo. ‚ 13.4.13. Corolario. Si p es un número primo, entonces el anillo pZp , `p , ¨p q es un cuerpo. Demostración. Sean m, n P Jp´1 “ t1, 2, . . . , p ´ 1u. Por ser p un número primo, en la factorización de mn como producto de potencias de primos no aparece p, por lo que p no divide a mn, es decir rmsp rnsp ‰ r0sp . Ahora, por ser pZp , `p , ¨p q un anillo conmutativo, este es un dominio entero y por ser finito, del teorema 13.4.12 se sigue que es un cuerpo. ‚ Observemos que el corolario 13.4.13 también se pudo haber demostrado usando el lema 13.2.33. 13.4.14. Definición. Sean pR, `, ¨q y pR1 , `1 , ¨1 q dos anillos y f : R ÝÑ R1 . Decimos que la función f es un homomorfismo de anillos si es homomorfismo con respecto a la suma y además f pr ¨ sq “ f prq ¨1 f psq, para r, s P R. En el caso de que f sea inyectiva diremos que es un isomorfismo de anillos. Si además de ser f un isomorfismo tenemos que f rRs “ R1 , diremos que R y R1 son isomorfos o, si se quiere ser más específico, diremos que pR, `, ¨q y pR1 , `1 , ¨1 q son anillos isomorfos, lo cual se denota pR, `, ¨q – pR1 , `1 , ¨1 q o simplemente R – R1 cuando no haya peligro de confusión. Ejercicios. ˙ * α β 1. Demostrar que el conjunto : α, β P R forma un cuerpo con la suma y ´β α multiplicación de matrices. (El conjunto anterior es isomorfo con el llamado conjunto de los números complejos). "ˆ 13.4. Anillos 369 2. Demostrar que el conjunto de los números reales con la suma y multiplicación de números reales es isomorfo con un subconjunto del conjunto dado en el ejercicio anterior con la suma y multiplicación de matrices. 3. Demostrar que el conjunto $¨ α β γ δ ’ ’ &˚ ´β α ´δ γ ˚ ˝ ´γ δ α ´β ’ ’ % ´δ ´γ β α , / / . ‹ ‹ : α, β, γ, δ P R ‚ / / ˛ forma un anillo con división con la suma y multiplicación de matrices, pero tal anillo con división no es un cuerpo. 370 13.5. 13.5. Espacios vectoriales Espacios vectoriales En esta sección estudiaremos la estructura de espacio vectorial en la cual está involucrada una operación entre dos conjuntos. ˜ llamada 13.5.1. Definición. Sea V un conjunto en el cual está definida una operación ` suma vectorial, con la cual V forma un grupo conmutativo. Sea pK, `, ¨q un cuerpo y ˜ forma un espacio ˚ : K ˆ V ÝÑ V una operación. Decimos que el conjunto V con la suma ` vectorial o espacio lineal sobre el cuerpo pK, `, ¨q con la operación ˚ si para todo α, β P K y todo u, v P V se satisfacen las siguientes propiedades: ˜ “ pα ˚ uq`pα ˜ ˚ vq; a) α ˚ pu`vq ˜ ˚ uq; b) pα ` βq ˚ u “ pα ˚ uq`pβ c) pαβq ˚ u “ α ˚ pβ ˚ uq; d) 1 ˚ u “ u. ˜ pK, `, ¨q, ˚q es un espacio vectorial o espacio lineal. En tal caso decimos que ppV, `q, Cuando V forma un espacio vectorial sobre el cuerpo pK, `, ¨q con la operación ˚, a los elementos de V se les acostumbra llamar vectores, mientras que a los elementos de K se les llama escalares y a la operación ˚ se le llama multiplicación por escalar o producto por escalar. 13.5.2. Definición y notación. Cuando no se preste a confusión escribiremos ` en lugar de ˜ y al inverso con respecto a la suma vectorial de cada elemento u P V lo denotaremos como `, ´u, mientras que al elemento neutro en V lo denotaremos por 0 y le llamaremos vector cero. De nuevo cuando no se preste a confusión, a la multiplicación por escalar ˚ la denotaremos por ¨, escribiendo α ¨ u (o simplemente αu) en lugar de α ˚ u, para α P K y u P V . 13.5.3. Ejemplo. Si pK, `, ¨q es un cuerpo, tenemos que el ejemplo más sencillo de espacio ˜ “ ` y ˚ “ ¨. Por ejemplo, el conjunto de los números reales R vectorial es cuando V “ K, ` con la suma forma un espacio vectorial sobre el cuerpo pR, `, ¨q con la multiplicación. 13.5.4. Ejemplo. Supongamos de nuevo que pK, `, ¨q es un cuerpo y definamos en Kn la suma como pr1 , r2 , . . . , rn q`ps1 , s2 , . . . , sn q :“ pr1 `s1 , r2 `s2 , . . . , rn `sn q, para pr1 , r2 , . . . , rn q P Kn y ps1 , s2 , . . . , sn q P Kn , y la multiplicación por escalar como αpr1 , r2 , . . . , rn q :“ pαr1 , αr2 , . . . , αrn q, para α P K. Es fácil verificar que el conjunto Kn con la suma y multiplicación por escalar definidas anteriormente forma un espacio vectorial sobre pK, `, ¨q, donde el vector cero es 0 “ p0, 0, . . . , 0q (con todas las componentes iguales al escalar 0 P K). Cuando tengamos un cuerpo pK, `, ¨q y hablemos del espacio vectorial pKn , `q, nos estaremos refiriendo al espacio vectorial sobre pK, `, ¨q con las operaciones dadas en el ejemplo 4, a menos que especifiquemos otra cosa. 13.5.5. Ejemplo. Sean a y b dos números reales con a ă b y sea C ra; bs el conjunto de funciones reales continuas en ra; bs. Si definimos la suma en C ra; bs como la suma de funciones y la multiplicación por escalar como la multiplicación usual de un número real por una función, entonces C ra; bs forma un espacio vectorial sobre pR, `, ¨q. 13.5. Espacios vectoriales 371 Veamos ahora algunas propiedades de los espacios vectoriales. 13.5.6. Teorema. Sea pV, `q un espacio vectorial sobre pK, `, ¨q, y sean u, v P V y α, β P K. Se tienen las siguientes propiedades: a) 0u “ 0; b) α0 “ 0; c) αu “ 0 ùñ (α “ 0 ó u “ 0); d) Si α ‰ 0, entonces αu “ αv ùñ u “ v; e) Si u ‰ 0, entonces αu “ βu ùñ α “ β; f) p´αqu “ ´pαuq, en particular p´1qu “ ´u. Demostración. a) Tenemos que u ` 0 “ u “ 1u “ p1 ` 0qu “ 1u ` 0u “ u ` 0u, es decir u ` 0 “ u ` 0u, y por la ley de cancelación tenemos que 0u “ 0. b) Tenemos que 0 ` α0 “ α0 “ αp0 ` 0q “ α0 ` α0, es decir 0 ` α0 “ α0 ` α0, y por la ley de cancelación tenemos que α0 “ 0. c) Supongamos que αu “ 0. Si α “ 0, entonces se verifica la propiedad c). Si α ‰ 0, entonces u “ 1u “ pα´1 αqu “ α´1 pαuq “ α´1 0, pero por la propiedad b) tenemos que α´1 0 “ 0, es decir u “ 0, verificándose así c). f) Por la propiedad b) de la definición de espacio vectorial y por la propiedad a) del teorema, tenemos que 0 “ 0u “ pα ` p´αqqu “ αu ` p´αqu, por lo tanto p´αqu “ ´pαuq. d) Supongamos que α ‰ 0. Tenemos que αu “ αv ùñ αu ´ pαvq “ 0, pero por f) tenemos que ´pαvq “ p´αqv “ pαp´1qqv “ αpp´1qvq “ αp´vq, por lo tanto αu ´ pαvq “ 0 ùñ αu ` αp´vq “ 0 ùñ αpu ´ vq “ 0, de modo que de la propiedad c) obtenemos que si αu “ αv entonces u ´ v “ 0, es decir u “ v. e) Supongamos que u ‰ 0. Tenemos, por las propiedades c) y f), que αu “ βu ùñ αu ´ pβuq “ 0 ùñ αu ` p´βqu “ 0 ùñ pα ´ βqu “ 0 ùñ α ´ β “ 0 ùñ α “ β. ‚ 13.5.7. Definición. Supongamos que pV, `q es un espacio vectorial sobre un cuerpo pK, `, ¨q. Cuando U es un subconjunto de V tal que pU, `q es un espacio vectorial sobre pK, `, ¨q (con la multiplicación por escalar restringida a K ˆ U ), decimos que U forma un subespacio vectorial de V , o que pU, `q es un subespacio vectorial de pV, `q sobre pK, `, ¨q. También se utiliza el nombre de subespacio lineal como sinónimo subespacio vectorial. 13.5.8. Observación. Observemos que si pU, `q es un subespacio vectorial de pV, `q, entonces pU, `q es un subgrupo de pV, `q. Sin embargo, el hecho de que pU, `q sea un subgrupo de pV, `q no necesariamente implica que sea un espacio vectorial de pV, `q, como lo muestra el siguiente ejemplo. 13.5.9. Ejemplo. Supongamos que tenemos el cuerpo de los números reales pR, `, ¨q y en el conjunto R3 tomemos la operación de suma y multiplicación por escalar como se definió en el ejemplo 4 (tomando K “ R y n “ 3). Tenemos que el conjunto Z3 con la suma forma un 372 13.5. Espacios vectoriales subgrupo de pR3 , `q, pero pZ3 , `q no es un subespacio vectorial de pR3 , `q. Para verificar lo anterior basta con observar que 13 p2, 2, 1q “ p 32 , 23 , 13 q R Z3 . 13.5.10. Teorema. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q y U Ă V . Una condición necesaria y suficiente para que pU, `q sea un subespacio vectorial de pV, `q es que para todo α P K y para todo u, v P U se satisfagan las siguientes dos propiedades: a) u ` v P U ; b) αu P U . Demostración. La necesidad de las propiedades a) y b) se deduce inmediatamente de la definición de espacio vectorial. Veamos la suficiencia de a) y b). De la propiedad b) se tiene que la restricción de la multiplicación por escalar a K ˆ U tiene su recorrido en U . Ahora, si u, v P U , tenemos por b) que ´v “ p´1qv P U , y por a) tenemos que u ´ v P U , de modo que por el teorema 13.2.17, el conjunto U con la suma forma un subgrupo de pV, `q. Las propiedades a), b) y c) de la definición de espacio vectorial se heredan del hecho de que U Ă V , por lo que las propiedades a) y b) son suficientes para que pU, `q sea un subespacio vectorial de pV, `q. ‚ 13.5.11. Ejemplo. Tenemos que R2 y R3 forman un espacio vectorial sobre pR, `, ¨q. Si A es una matriz de orden 2 ˆ 3 y u P R2 , entonces uA P R3 , de manera que la función T : R2 ÝÑ R3 es un homomorfismo del grupo pR2 , `q en el grupo pR3 , `q. En este caso uÞÑuA tenemos que kerpT q forma un subespacio vectorial de R2 y que T rR2 s forma un subespacio vectorial de R3 . En efecto, veamos primero que kerpT q forma un subespacio. Si α P R y u, v P kerpT q, entonces T pu ` vq “ pu ` vqA “ uA ` vA “ 0 ` 0, por lo que u ` v P kerpT q. Ahora, T pαuq “ pαuqA “ αpuAq “ α0 “ 0, por lo cual, debido al teorema 13.5.10, kerpT q forma un subespacio vectorial de R2 . Demostremos ahora que T rR2 s forma un subespacio de R3 . Sean x, y P T rR2 s y α P R. Existen u, v P R2 tales que T puq “ x y T pvq “ y, además u`v P R2 . Tenemos así que T pu`vq “ pu`vqA “ uA`vA “ x`y, por lo que x`y P T rR2 s. Ahora, T pαuq “ pαuqA “ αpuAq “ αx, por lo que αx P T rR2 s y, por el teorema 10, T rR2 s forma un subespacio de R3 . 13.5.12. Definición. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q y sea S “ te1 , e2 , . . . , en u Ă V un conjunto finito. Decimos que un elemento u P V es una combinación lineal de los elementos de S, si existen n escalares α1 , α2 , . . . , αn P K tales que u “ α1 e1 ` α2 e2 ` ¨ ¨ ¨ ` αn en , es decir u“ n ÿ αk ek . k“1 13.5.13. Ejemplo. En Rn cualquier vector es una combinación lineal de te1 , . . . , en u, donde para todo k P t1, 2, . . . , nu tomamos ek como el vector cuya componente k-ésima es 1 y las demás componentes son 0. De esta manera tenemos que si u “ px1 , x2 , . . . , xn q P Rn , entonces u“ n ÿ k“1 x k ek . 13.5. Espacios vectoriales 373 13.5.14. Definición. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q y sea S Ă V . Decimos que S es linealmente independiente o que los elementos de S son linealmente independientes cuando para cualquier conjunto finito ts1 , s2 , . . . , sn u Ă S, se tiene que si α1 , α2 , . . . , αn P K son tales que n ÿ αk sk “ 0, k“1 entonces α1 “ α2 “ ¨ ¨ ¨ “ αn “ 0. 13.5.15. Observación. Observemos que S es un conjunto linealmente independiente si y sólo si ningún elemento v P S puede ser expresado como combinación lineal de elementos de S diferentes de v. En particular tenemos que si S es un conjunto linealmente independiente, entonces el vector cero 0 no pertenece a S. 13.5.16. Definición. Sea pV, `q un espacio vectorial sobre un cuerpo K y S Ă V . Cuando W “ tw P V : existe un conjunto finito ts1 , . . . , sn u Ă S tal que w es una combinación lineal de los elementos de ts1 , . . . , sn uu, decimos que W está generado por S (o que S genera a W ). Estableceremos que el conjunto generado por el conjunto vacío es t0u. A veces se usa la palabra engendrar como sinónimo de generar. 13.5.17. Teorema. Sea pV, `q un espacio vectorial sobre un cuerpo K y S Ă V . El conjunto W que está generado por S forma un subespacio vectorial de pV, `q. Demostración. Sean u, v P W y γ P K. Sean A y B subconjuntos finitos de S tales que u es combinación lineal de elementos de A y v es combinación lineal de elementos de B. Como A y B son finitos, también lo es A Y B, de modo que A Y B tiene m elementos diferentes e1 , e2 , . . . , em , para algún m P NYt0u. Así, existen α1 , α2 , . . . , αm , β1 , β2 , . . . , βm P K tales que m m m ř ř ř pαk ` βk qek , es decir u ` v P W . βk ek , obteniendo así que u ` v “ αk ek y v “ u“ k“1 Ahora, γu “ m ř k“1 k“1 pγαk qek , por lo que γu P W . Usando el teorema 13.5.10 concluimos la k“1 demostración del teorema. ‚ 13.5.18. Definición. Sea pV, `q un espacio vectorial sobre un cuerpo K y pW, `q un subespacio vectorial de pV, `q. Se dice que un subconjunto S de V es una base de W (o de pW, `q), si es linealmente independiente y además genera a W . Cuando S sea igual a un conjunto finito te1 , e2 , . . . , en u con n elementos, a la sucesión pe1 , e2 , . . . , en q le llamaremos base ordenada. 13.5.19. Observación. Observemos que en cualquier espacio vectorial, el vector cero 0 no es elemento de ninguna base. 13.5.20. Ejemplo. En el espacio vectorial pR4 , `q, el conjunto tp1, 0, 0, 0q, p0, 1, 0, 0q, p0, 0, 1, 0qu es una base de tpx, y, z, 0q P R4 : x, y, z P Ru. 13.5.21. Ejemplo. Sea C pRq el conjunto de todas las funciones reales continuas con dominio en el conjunto de los números reales y observemos que forma un espacio vectorial con la suma de funciones sobre el cuerpo pR, `, ¨q. Para cada k P N Y t0u sea ek : R ÝÑk R. Podemos xÞÑx observar que el conjunto tek : k P N Y t0uu es una base del espacio vectorial formado por el conjunto de polinomios. Por ejemplo el polinomio 6 ` x2 ` 3x4 ´ 7x5 es igual a 6e0 pxq ` 1e2 pxq ` 3e4 pxq ` p´7qe5 pxq. Siguiendo las mismas ideas tenemos por ejemplo que el conjunto 374 13.5. Espacios vectoriales de funciones polinomiales de grado menor o igual que 4 forma un subespacio vectorial de C pRq cuya base es te0 , e1 , e2 , e3 , e4 u. 13.5.22. Teorema. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q y B “ te1 , e2 , . . . , em u un subconjunto de V linealmente independiente. Si α1 , α2 , . . . , αm , β1 , β2 , . . . , βm P K son tales que α1 e1 ` α2 e2 ` ¨ ¨ ¨ ` αm em “ β1 e1 ` β2 e2 ` ¨ ¨ ¨ ` βm em , entonces α1 “ β1 , . . . , αm “ βm ; es decir si m ÿ αk e k “ k“1 m ÿ βk ek , k“1 entonces αk “ βk para todo k P t1, 2, . . . , mu. m m m ř ř ř Demostración. Si αk ek “ βk ek , entonces pαk ´ βk qek “ 0, por lo que debido a la k“1 k“1 k“1 definición de independencia lineal tenemos αk ´ βk “ 0 para todo k P t1, 2, . . . , mu, es decir αk “ βk para todo k P t1, 2, . . . , mu. ‚ 13.5.23. Definición. En el espacio vectorial pKm , `q sobre un cuerpo pK, `, ¨q, a la base tδ1 , . . . , δm u tal que δk es el vector cuya k-ésima componente es 1 y las demás componentes son 0 se le llama base canónica de Km y a pδ1 , . . . , δm q le llamaremos base canónica ordenada de Km . 13.5.24. Definición. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q y B “ m ř te1 , e2 , . . . , em u una base de V . Si v “ αk ek , con αk P K, a cada escalar αk se le llak“1 ma la coordenada o componente de v en la dirección de ek , con respecto a la base B. También decimos que αk es la k-ésima coordenada o componente con respecto a la base ordenada pe1 , e2 , . . . , em q y al vector pα1 , α2 , . . . , αm q P Km se le llama vector de coordenadas de v con respecto a pe1 , e2 , . . . , em q. Cuando V “ Km y no especifiquemos con respecto a que base se dan las coordenadas, se sobreentenderá que es con respecto a la base canónica ordenada. 13.5.25. Teorema. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q, B “ te1 , e2 , . . . , em u un subconjunto de V con m elementos diferentes y B 1 “ te11 , e12 , . . . , e1m1 u un subconjunto de V con m1 elementos diferentes (m, m1 P N Y t0u). Si tanto B como B 1 son bases de V , entonces m “ m1 . Demostración. Supongamos que B y B 1 son dos bases de V y veamos que es imposible que m ‰ m1 , suponiendo sin pérdida de generalidad que m ă m1 para llegar a un absurdo. Para cada pj, kq P t1, . . . , mu ˆ t1, . . . , m1 u sea aj,k P K tal que e1k “ m ÿ aj,k ej . j“1 Tomemos la permutación σ P Sm de la siguiente manera: Sea σp1q el primer j tal que aj,1 ‰ 0, además hagamos e11,1 “ paσp1q,1 q´1 e11 , y para k ą 1 hagamos e1k,1 “ e1k ´ aσp1q,k e11,1 13.5. Espacios vectoriales 375 (observemos que la componente de e11,1 en la dirección de eσp1q es 1, mientras que la componente de e1k,1 en la dirección de eσp1q es 0, para k ‰ 1). Convengamos en que e1k,0 “ e1k . Procedamos Ť ahora de manera recursiva suponiendo que l P t1, . . . , m ´ 1u tenemos definido a σplq P Jm z 1ĺiăl tσpiqu y a los vectores e1k,l de manera tal que la componente de e1l,l en la dirección de eσplq es 1, mientras que la componente de e1k,l en la dirección de eσplq es 0, para k ‰ l. Supongamos además que la construcción se hizo de tal forma que, para q ą l, cada e1q,l es igual a e1q más una combinación lineal de elementos de te11 , . . . , e1l u (tal como es el caso para l “ 1). Sea σpl`1q el primer j P t1, . . . , mu tal que la coordenada de e1l`1,l en la dirección de ej es diferente de 0 (observemos que las coordenadas de e1l`1,l en las direcciones de eσp1q , . . . , eσplq con respecto a la base B son 0, pero no todas las coordenadas son 0, pues e1l`1,l es igual a e1l`1 más una combinación lineal de elementos de te11 , . . . , e1l u, lo que contradiría el hecho de que B 1 es una base de V ). Llamémosle αj,k,l a la coordenada del vector e1k,l en la dirección de ej y definamos e1l`1,l`1 como pαl`1,σpl`1q,l q´1 e1l`1,l , pero si k ‰ l `1, definamos entonces e1k,l`1 como e1k,l ´ αk,σpl`1q,l e1l`1,l (observemos que, para k ‰ l ` 1, la componente de e1k,l`1 en la dirección de eσpl`1q es 0, mientras que la componente de e1l`1,l`1 en la dirección de eσpl`1q es 0). De esta manera queda definida la permutación σ P Sm . Concentrémonos finalmente en la naturaleza de los vectores e1k,m observando que si k ĺ m, entonces e1k,m “ eσpkq , y si k ą m, entonces e1k,m “ 0, por ejemplo e1m1 ,m “ 0, pero como e1m1 ,m es igual a e1m1 más una combinación lineal de elementos de te11 , . . . , e1m u los elementos de B 1 “ te11 , . . . , e1m , . . . , e1m1 u no serían linealmente independientes y así B 1 no sería una base de V , viendo así que es imposible la desigualdad m ă m1 . La imposibilidad de la desigualdad m ą m1 se demuestra de manera análoga, con lo que concluimos que m “ m1 . ‚ En vista del teorema anterior, tiene sentido la definición siguiente. 13.5.26. Definición. Sea pV, `q un espacio vectorial y B “ te1 , . . . , em u una base de V con m elementos diferentes, donde m P N. En tal caso decimos que la dimensión de V es m y decimos también que V tiene dimensión finita. En el caso de que un espacio vectorial no tenga una base finita, diremos que tiene dimensión infinita. A la dimensión de V la denotaremos como dim V . 13.5.27. Teorema. Sea pV, `q un espacio vectorial de dimensión finita m y B un subconjunto de V con m elementos linealmente independientes. El subconjunto B es una base de V . Demostración. Sea pW, `q el subespacio vectorial generado por B y sea B 1 una base de V . Si W ‰ V , entonces existiría un elemento e11 de B 1 , tal que e11 R W , con lo que el conjunto B Y te11 u sería linealmente independiente y generaría a un conjunto W1 de dimensión m ` 1. Como dim V “ m, por el teorema 13.5.25, tenemos que W1 ‰ V . Si tenemos que te11 , . . . , e1k u es un subconjunto de B 1 con k elementos tales que B X te11 , . . . , e1k u “ ∅ y B Y te11 , . . . , e1k u es linealmente independiente, entonces el conjunto Wk que genera B Y te11 , . . . , e1k u tendría dimensión m ` k, por lo que Wk ‰ V , debiendo existir así un e1k`1 P B 1 tal que e1k`1 R Wk , con el conjunto B 1 Y te11 , . . . , e1k , e1k`1 u linealmente independiente, y si Wk`1 es el conjunto generado por B 1 Y te11 , . . . , e1k , e1k`1 u, entonces dim Wk`1 “ m ` k ` 1, por lo que debido al teorema 13.5.25 tenemos V ‰ Wk`1 . Construidos así los e1k y los Wk , tendríamos que Wm Ł V , donde Wm está generado por B Y te11 , . . . , e1m u, es decir por B Y B 1 , lo cual es absurdo debido a que B 1 genera a V . Tenemos así que el subespacio generado por B es V . ‚ 13.5.28. Teorema. Si V forma un espacio vectorial de dimensión infinita, entonces para 376 13.5. Espacios vectoriales todo n P N existe un conjunto linealmente independiente Ln Ă V que tiene n elementos. Demostración. Procedamos por inducción matemática. Como V es de dimensión infinita y al conjunto t0u lo genera el conjunto vacío, entonces V ‰ t0u. Sea v1 P V zt0u y tomemos L1 “ tv1 u, el cual es un subconjunto de V linealmente independiente con un elementos. Supongamos que k P N y que tenemos un conjunto linealmente independiente Lk “ tv1 , . . . , vk u Ă V con k elementos. Al tener V dimensión infinita y tener el subespacio pW, `q generado por Lk dimensión k, concluimos que W Ł V , por lo que existe un vk`1 P V zW , el cual no es una combinación lineal de Lk , de modo que el conjunto Lk`1 :“ Lk Y tvk`1 u es linealmente independiente y tiene k ` 1 elementos. Por lo tanto, para todo número natural n, existe un conjunto linealmente independiente Ln Ă V con n elementos. ‚ 13.5.29. Teorema. Si V forma un espacio vectorial de dimensión finita y W forma un subespacio de V , entonces W tiene dimensión finita y además dim W ĺ dim V. Demostración. Supongamos que V sea un espacio vectorial de dimensión finita n y que W forma un subespacio de V . Es imposible que W tenga dimensión infinita, puesto que si la dimensión de W fuese infinita, por el teorema 13.5.28 existiría un conjunto linealmente independiente Ln`1 incluido en W con n ` 1 elementos diferentes e1 , . . . , en , en`1 , de modo que por el teorema 13.5.27 tendríamos que Ln`1 zten`1 u “ te1 , . . . , en u sería una base de V , pero por ser Ln`1 linealmente independiente, entonces en`1 R V , lo que contradice el hecho de que en`1 P Ln`1 Ă W Ă V . Habiendo demostrado que W tiene dimensión finita, tomemos m :“ dim W . De manera similar vemos que es imposible que m ą n, puesto que en dicho caso tendríamos una base de W con m elementos e1 , . . . , en , . . . , em , donde te1 , . . . , en u sería una base de V y además em R V , lo cual contradice que em P W Ă V . Tenemos así que necesariamente dim W ĺ dim V . ‚ 13.5.30. Corolario. Si V forma un subespacio vectorial de dimensión finita y W Ł V forma un subespacio de V , entonces dim W ă dim V. Demostración. Por el teorema 13.5.29 es suficiente ver la imposibilidad de que dim W “ dim V , pero tal imposibilidad se sigue del teorema 13.5.27. ‚ 13.5.31. Notación. Cuando pV, `q sea un espacio vectorial sobre un cuerpo K, v P V y α P Kzt0u, el símbolo αv representará al vector α1 v. 13.5.32. Definiciones y notaciones. Sea W un espacio vectorial y sean U y V subesacios vectoriales de W . Al espacio vectorial generado por U Y V lo denotaremos por U ` V y le llamamos suma de los subespacios vectoriales U y V . En caso de que U X V “ t0u, al espacio vectorial U ` V lo denotaremos por U ‘ V y le llamamos suma directa de los 13.5. Espacios vectoriales 377 espacios vectoriales U y V . Así por ejemplo, la expresión E “ U ‘ V significa que E “ U ` V y además que U X V “ t0u. 13.5.33. Teorema. Si W un espacio vectorial, y U y V son subespacios de W , entonces dimpU ` V q “ dim U ` dim V ´ dimpU X V q. Demostración. Del teorema 13.5.29 tenemos que dimpU X V q ĺ dim U y dimpU X V q ĺ dim V . Sean m “ dimpU X V q, n “ dim V , pw1 , . . . , wm q una base ordenada de U X V y pv1 , . . . , vn q una base ordenada de V . Si pw1 , . . . , wm q genera a V , entonces m “ n, pero si no genera a V sea wm`1 una de las componentes de pv1 , . . . , vn q que no sea combinación lineal de las componentes de pw1 , . . . , wm q. En general, si en V tenemos definidos vectores linealmente independientes w1 , . . . , wl , con m ă l ĺ n, tenemos que si l “ n, entonces pw1 , . . . , wn q es una base ordenada de V , de otro modo tomamos un elemento de wl`1 P tv1 , . . . , vn u. Este proceso se sigue hasta completar los n elementos wi , . . . , wn linealmente independientes que formen la base ordenada pw1 , . . . , wm , . . . , wn q del espacio vectorial V . Tenemos así que existe una base BV de V a la cual pertenecen los vectores w1 , . . . , wm . De manera similar tenemos que existe una base BU de U a la cual pertenecen los vectores w1 , . . . , wm . Como podemos ver, al tomar n1 “ dim U el conjunto BU Y BV tiene n ` n1 ´ m elementos diferentes y tal conjunto es una base de U ` V , es decir se cumple la fórmula dimpU ` V q “ dim U ` dim V ´ dimpU X V q. ‚ Como caso particular del teorema anterior tenemos el corolario siguiente. 13.5.34. Corolario. Si W es un espacio vectorial, y E, U y V son subespacios de W tales que E “ U ‘ V , entonces dimpEq “ dim U ` dim V. 13.5.35. Definiciones y notaciones. Sea K un cuerpo y n P N Y t0u. A una función de n ř la forma px P Kq ÞÑ ak xk , con an ‰ 0 se le llama polinomio de grado n ó función k“0 polinomial de grado n en el cuerpo K. A dicha función se le representa como n ř ak Xk , y k“0 en tal caso al conjunto de todos los polinomios de algún grado n P N Y t0u se le denota por KrXs. es decir Ejercicios. 1. Supongamos que tenemos el espacio vectorial pR3 , `q. Sean α, β, γ P R. Demostrar que tpαx, βx, γxq P R3 : x P Ru forma un subespacio vectorial de pR3 , `q. 2. Sean α1 , α2 , β1 , β2 γ1 , γ2 P R. Demostrar que tpα1 x ` α2 y, β1 x ` β2 y, γ1 x ` γ2 yq P R3 : x, y P Ru forma un subespacio vectorial de R3 . 378 13.5. Espacios vectoriales 3. Sea pV, `q un espacio vectorial sobre un cuerpo pK, `, ¨q. Demostrar que la intersección de dos conjuntos que forman subespacios vectoriales de pV, `q es un conjunto que forma un subespacio vectorial de pV, `q. 4. Decir si lo que se pide demostrar en el ejercicio anterior sigue siendo válido en general si se sustituye la palabra «intersección» por la palabra «unión». Justificar la respuesta. 5. Demostrar que los elementos e1 , e2 , . . . , en dados en el ejemplo 13.5.6 son linealmente independientes. 6. Demostrar que en el espacio vectorial pR3 , `q el conjunto tp1, 0, 0q, p1, 1, 0q, p1, 1, 1qu es una base de R3 . Expresar el vector p3, 4, ´1q como una combinación lineal de esta base. 7. Supongamos que en el ejercicio 1 alguno de los números α, β ó γ es diferente de 0. Decir cuál es la dimensión del subespacio de R3 descrito en el ejercicio y dar una base para tal espacio. 8. Sea V el conjunto de todas las funciones continuas definidas en R. a) Demostrar que V es un espacio vectorial con la suma de funciones. b) Demostrar que RrXs es un subespacio vectorial de V . c) Dar una base del subespacio vectorial RrXs. 9. Sea K un cuerpo y n P N Y t0u: a) Demostrar que KrXs es un espacio vectorial de dimensión infinita. b) Demostrar que el subconjunto de KrXs formado por los polinomios en K de grado menor o igual a n es un subespacio vectorial de KrXs de dimensión n ` 1. c) Dar una base para el subespacio vectorial dado en el inciso b). 13.6. Transformaciones lineales 13.6. 379 Transformaciones lineales En esta sección estudiaremos el concepto de transformación lineal, el cual es un homomorfismo entre dos estructuras de espacio vectorial. Para ser más precisos tenemos la definición siguiente. 13.6.1. Definición. Sean pV1 , `q y pV2 , `q dos espacios vectoriales sobre un mismo cuerpo pK, ¨, `q. Se dice que una función T : V1 ÝÑ V2 es una transformación lineal si para cualesquiera dos vectores v, w P V1 y para cualesquier escalar α P K se tienen las siguientes dos propiedades: a) T pv ` wq “ T pvq ` T pwq; b) T pαvq “ αT pvq. Como sinónimos de transformación lineal existen los términos de función lineal y aplicación lineal. 13.6.2. Observación. Observemos que una función T : V1 ÝÑ V2 es una transformación lineal si y sólo si para cualesquiera dos vectores v, w P V1 y para cualesquier escalar α se tiene que T pαv ` wq “ αT pvq ` T pwq. 13.6.3. Observación. La propiedad a) de la definición de transformación lineal indica que una transformación lineal T : V1 ÝÑ V2 es necesariamente un homomorfismo del grupo pV1 , `q en el grupo pV2 , `q, de modo que se pueden utilizar todas las propiedades referentes a los homomorfismos entre grupos conmutativos. Observemos que el núcleo de una transformación lineal T (visto como el núcleo de un homomorfismo de grupos) es kerpT q “ tv P V1 : T pvq “ 0u. Del teorema 13.5.10 y de la definición de transformación lineal se sigue el teorema siguiente. 13.6.4. Teorema. Sea T : V1 ÝÑ V2 una transformación lineal. El núcleo de T forma un subespacio vectorial de V1 y el recorrido de T forma un subespacio vectorial de V2 . 13.6.5. Definición. Sean T : V1 ÝÑ V2 y S : V1 ÝÑ V2 dos transformaciones lineales y α un escalar. Definiremos las funciones S ` T y αS como S ` T : V1 ÝÑ V2 y αS : V1 ÝÑ V2 . vÞÑSpvq`T pvq vÞÑαSpvq 13.6.6. Observación. Observemos que si pV1 , `q y pV2 , `q son dos espacios vectoriales sobre un cuerpo K, con la definición anterior, el conjunto de todas las transformaciones lineales de V1 en V2 forma un espacio vectorial sobre el cuerpo K. 13.6.7. Notación. Al conjunto de las transformaciones lineales de V1 en V2 lo denotaremos como LpV1 , V2 q o, si queremos especificar el cuerpo de escalares K sobre el cual se está trabajando, lo denotaremos como LK pV1 , V2 q. 13.6.8. Definición. Decimos que dos espacios vectoriales pV1 , `q y pV2 , `q sobre un mismo cuerpo son isomorfos si existe una transformación lineal T : V1 ÝÑ V2 que es una biyección 380 13.6. Transformaciones lineales de V1 en V2 . En dicho caso decimos que T es un isomorfismo de espacios vectoriales. 13.6.9. Definición. Al hecho de que dos espacios vectoriales pV1 , `q y pV2 , `q sean isomorfos se le denota así pV1 , `q – pV2 , `q o simplemente así V1 – V2 . 13.6.10. Observación. Cuando T : V1 ÝÑ V2 es una transformación lineal inyectiva, entonces T ´1 : RpT q ÝÑ V1 es también una transformación lineal. De ahí se desprende fácilmente que la relación –, de isomorfismo entre espacios vectoriales, es una relación de equivalencia. 13.6.11. Teorema. Sea pV, `q un espacio vectorial de dimensión finita n sobre un cuerpo pK, `, ¨q. El espacio vectorial pV, `q es isomorfo con pKn , `q. Demostración. Sea te1 , . . . , en u una base de V y T : Kn ÝÑ Vn pαk qn ÞÑ k“1 ř . Veamos que T es una αk e k k“1 transformación lineal y que es una biyección de Kn en V . Sea γ P K, y sean u “ pαk qnk“1 y v “ pβk qnk“1 elementos de Kn . Tenemos que T pγu ` vq “ T ppγαk ` βk qnk“1 q n ÿ “ pγαk ` βk qek “ k“1 “γ n ÿ k“1 αk ek ` n ÿ n ÿ k“1 γαk ek ` n ÿ βk ek k“1 βk ek “ γT puq ` T pvq, k“1 por lo tanto T es una transformación lineal. El hecho de que T sea una biyección de Kn en V proviene de la definición de base y del teorema 13.5.22. ‚ Del teorema anterior y del hecho que la relación de isomorfismo entre espacios vectoriales es una relación de equivalencia se deduce inmediatamente el siguiente corolario. 13.6.12. Corolario. Dos espacios vectoriales de dimensión finita sobre un mismo cuerpo son isomorfos si y sólo si tienen la misma dimensión. En vista del teorema 13.6.11 y del corolario 13.6.12, el estudiar un espacio vectorial de dimensión finita n sobre un cuerpo K se reduce a estudiar el espacio vectorial pKn , `q. A continuación veremos cómo una transformación lineal, cuyo dominio y recorrido son espacios de dimensión finita, puede ser representada por medio de una matriz, es decir veremos una relación importante que existe entre los conceptos de transformación lineal y de matriz. En adelante, si no se especifica, supondremos que tenemos un espacio vectorial sobre un cuerpo pK, `, ¨q; cuando hablemos de matrices, nos estaremos refiriendo a matrices cuyas componentes son elementos en K; quedará definida la suma y resta de matrices de la misma forma en que se definió en el capítulo 12, lo mismo que la multiplicación de matrices, y la multiplicación de un escalar α por una matriz A “ pai,j q estará dada por αA :“ pαai,j q, así como ´A :“ p´1qA, sólo que en este caso los ai,j y α son elementos de K, y 1 es el elemento identidad para la multiplicación en K; de manera similar se definen los conceptos de diagonal de una matriz, matriz identidad, matriz invertible, matriz inversa, matriz nula, renglón nulo, multiplicación de un renglón por una matriz, transpuesta de una matriz o de un renglón, matriz simétrica, determinante de una matriz cuadrada, menor y cofactor de una componente, matriz ampliada, matrices equivalentes, operaciones elementales por renglón, matrices elementales, matrices semejantes, forma escalonada de una matriz, solución trivial de un sistema de ecuaciones (pero ahora con coeficientes en K) y matriz adjunta. 13.6. Transformaciones lineales 381 Definida ya la terminología y estructura de matrices con componentes en K, enlistaremos los resultados más importantes de éstas, cuyas demostraciones se pueden hacer prácticamente copiando a las dadas en el capítulo 12. 13.6.13. Teorema. Para la suma de matrices se cumplen las propiedades conmutativa y asociativa, además el elemento neutro bajo la suma es una matriz nula. 13.6.14. Teorema. Si α y β son escalares, y además A y B son matrices m ˆ n, entonces pα ` βqA “ αA ` βA y αpA ` Bq “ αA ` βA. 13.6.15. Teorema. Si A es una matriz m ˆ n, B es una matriz n ˆ p y C es una matriz p ˆ q; entonces pABqC “ ApBCq. 13.6.16. Teorema. AIn “ In A “ A. Es decir la matriz In es en efecto la identidad con respecto a la multiplicación de matrices cuadradas de orden n ˆ n. 13.6.17. Teorema. Si una matriz tiene inversa, tal inversa es única. 13.6.18. Teorema. Si A y B son matrices invertibles del mismo orden, entonces pABq´1 “ B ´1 A´1 y además pA´1 q´1 “ A. 13.6.19. Teorema. En la multiplicación de matrices se satisfacen las propiedades distributivas por la izquierda y por la derecha. Es decir, si A y B son matrices de m ˆ r y C y D son matrices de r ˆ n, entonces pA ` BqC “ AC ` BC y ApC ` Dq “ AC ` AD. 13.6.20. Teorema. El determinante de una matriz cuadrada A es igual al de su transpuesta At . 13.6.21. Teorema. Si una matriz cuadrada A tiene un renglón cuyas componentes son ceros, entonces |A| “ 0. 13.6.22. Corolario. Si una matriz cuadrada A tiene una columna cuyas componentes son ceros, entonces |A| “ 0. 13.6.23. Teorema. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para i R tk, lu, bk,j “ al,j y bl,j “ ak,j para j P t1, 2, . . . , nu; entonces |B| “ ´|A|. Es decir si B es la matriz que se obtiene al intercambiar dos renglones de la matriz A, entonces |B| “ ´|A|. 13.6.24. Corolario. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para 382 13.6. Transformaciones lineales j R tk, lu, bi,k “ ai,l y bi,l “ ai,k para i P t1, 2, . . . , nu; entonces |B| “ ´|A|. Es decir si B es la matriz que se obtiene al intercambiar dos columnas de la matriz A, entonces |B| “ ´|A|. 13.6.25. Teorema. Si A es una matriz cuadrada que tiene dos de sus renglones iguales (en diferente posición), entonces |A| “ 0. 13.6.26. Corolario. Si A es una matriz cuadrada que tiene dos de sus columnas iguales, entonces |A| “ 0. 13.6.27. Teorema. La matriz identidad tiene determinante 1. 13.6.28. Teorema. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para i ‰ k y bk,j “ αak,j , entonces |B| “ α|A|. 13.6.29. Corolario. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para j ‰ k y bi,k “ αai,k , entonces |B| “ α|A|. 13.6.30. Teorema. Si A “ pai,j q es una matriz cuadrada y B “ pbi,j q, donde bi,j “ ai,j para i ‰ k y bk,j “ ak,j ` αal,j , con l ‰ k, entonces |B| “ |A|. Es decir, si B es la matriz que se obtiene dejando igual los renglones de la matriz A diferentes del k-ésimo y el renglón k-ésimo de B es la suma de los renglones k-ésimo y un múltiplo del l-ésimo renglón de la matriz A, entonces |B| “ |A|. 13.6.31. Corolario. Si B es la matriz cuadrada que se obtiene dejando igual las columnas de la matriz A diferentes de la k-ésima y la k-ésima columna de B es la suma de la columna k-ésima y un múltiplo de la l-ésima columna de la matriz A (con l ‰ k), entonces |B| “ |A|. 13.6.32. Teorema. Si A “ pai,j q es una matriz nˆn (con n ľ 2) y k P t1, 2, . . . , nu, entonces n ÿ |A| “ ak,j Ak,j . j“1 13.6.33. Corolario. Si A “ pai,j q es una matriz n ˆ n (con n ľ 2) y k P t1, 2, . . . , nu, entonces n ÿ |A| “ ai,k Ai,k . i“1 13.6.34. Teorema. Si una matriz cuadrada ¨ a1,1 a1,2 ¨ ¨ ¨ a1,n ˚ a2,1 a2,2 ¨ ¨ ¨ a2,n ˚ A “ ˚ .. .. .. ... ˝ . . . an,1 an,2 ¨ ¨ ¨ an,n ˛ ‹ ‹ ‹ ‚ es invertible, entonces para toda matriz columna b “ pb1 b2 ¨ ¨ ¨ bn qt con n componentes, se tiene que el sistema a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ `an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ .. . `an,2 xn “ b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ `an,n xn “ bn 13.6. Transformaciones lineales 383 tiene como única solución a x “ A´1 b, donde x “ px1 x2 ¨ ¨ ¨ xn qt . 13.6.35. Teorema. Si A es una matriz de n ˆ n, b es una matriz columna de n componentes, xh satisface la ecuación Axh “ 0 y xp satisface la ecuación Axp “ b, entonces Apxh `xp q “ b. 13.6.36. Teorema. Si A es una matriz de n ˆ n, b es una matriz columna de n componentes, xp y x son tales que Axp “ b y Ax “ b, entonces x “ xh ` xp para algún xh que satisface la ecuación Axh “ 0. 13.6.37. Teorema. Si A es una matriz de n ˆ n, b es una matriz columna de n componentes y existe una matriz columna xp que satisface la ecuación Axp “ b, entonces existe una correspondencia biunívoca entre el conjunto de los vectores columna x que satisfacen la ecuación Ax “ b y el conjunto de los vectores columna y que satisfacen la ecuación homogénea Ay “ 0. 13.6.38. Teorema. Toda matriz es semejante a una matriz escalonada. 13.6.39. Teorema. Si A es una matriz cuadrada y E es una matriz elemental del mismo orden que A, entonces |EA| “ |E||A|. 13.6.40. Teorema. Una matriz cuadrada escalonada diferente de la identidad tiene el último renglón nulo. 13.6.41. Teorema. Una matriz cuadrada es semejante a la matriz identidad si y sólo si su determinante es diferente de cero. 13.6.42. Teorema. Una matriz cuadrada A es invertible si y sólo si A „ I. 13.6.43. Corolario. Una matriz cuadrada es invertible si y sólo si su determinante es diferente de cero. 13.6.44. Teorema. Si A y B son matrices cuadradas del mismo orden y AB “ I, entonces A “ B ´1 y B “ A´1 . 13.6.45. Teorema. Si A y B son dos matrices cuadradas del mismo orden, entonces |AB| “ |A||B|. 13.6.46. Corolario. Si A es una matriz cuadrada invertible, entonces |A´1 | “ 1 . |A| 13.6.47. Teorema. El sistema de ecuaciones lineales a1,1 x1 ` a2,1 x2 ` ¨ ¨ ¨ ` an,1 xn “ b1 a1,2 x1 ` a2,2 x2 ` ¨ ¨ ¨ ` an,2 xn “ .. . b2 a1,n x1 ` a2,n x2 ` ¨ ¨ ¨ ` an,n xn “ bn , tiene una solución única si y sólo si la matriz A “ pai,j q de orden n ˆ n tiene determinante diferente de cero. 13.6.48. Teorema. Para toda matriz cuadrada A, ApA˚ q “ |A|I. 384 13.6. Transformaciones lineales 13.6.49. Corolario. Si A es una matriz invertible, entonces 1 ˚ A´1 “ A . |A| Regresemos al estudio de las transformaciones lineales con el resultado que indica que si conocemos los valores de una transformación lineal evaluada en una base de su dominio entonces podemos conocer el valor de la transformación lineal evaluada en cualquier elemento de su dominio. 13.6.50. Teorema. Sean pV1 , `q y pV2 , `q dos espacios vectoriales sobre un mismo cuerpo. Si B es una base de V1 y f : B ÝÑ V2 , entonces existe una única transformación lineal T : V1 ÝÑ V2 tal que T pbq “ f pbq para todo b P B. Demostración. Para cada v P V1 sean b1 , . . . , bn elementos diferentes en B y α1 , . . . , αn n n ř ř αk bk y definamos T pvq como αk f pbk q. Afirmamos que la función escalares tales que v “ k“1 k“1 T así definida es una transformación lineal y es la única tal que T pbq “ f pbq para todo b P B. En efecto, T es una transformación lineal puesto que si v, w P V1 y γ es un escalar, entonces, para un número natural n suficientemente grande, existen diferentes elementos b1 , . . . , bn ˙P B ˆ n n n ř ř ř pγαk ` βk qbk “ βk bk , de modo que T pγv ` wq “ T αk bk y w “ tales que v “ n ř k“1 pγαk `βk qf pbk q “ k“1 n ř k“1 γαk f pbk q` k“1 n ř βk f pbk q “ γ k“1 n ř αk f pbk q` k“1 n ř k“1 βk f pbk q “ γT pvq`T pwq, k“1 por lo que T es una transformación lineal y obviamente T pbq “ f pbq para todo b P B. Ahora, si 1 T 1 : V1 ÝÑ ˆ V2 fuera una ˙ transformación lineal tal que T pbq “ f pbq para todo ˆ b P B, ˙ entonces n n n n n ř ř ř ř ř T 1 pvq “ T 1 αk bk “ αk T 1 pbk q “ αk f pbk q “ αk T pbk q “ T αk bk “ T pvq, k“1 k“1 k“1 de donde se tiene la unicidad. k“1 k“1 ‚ 13.6.51. Teorema. Si A es una matriz de orden n ˆ m, entonces la función T : Kn ÝÑ Km vÞÑvA es una transformación lineal. Demostración. Por el teorema 13.6.19 tenemos que si u, v P Kn , entonces T pu ` vq “ pu`vqA “ uA`vA “ T puq`T pvq. Ahora, por el teorema 13.6.15, si α P K, entonces T pαuq “ pαuqA “ ppαIn quqA “ pαIn qpuAq “ αpuAq “ αT puq, por lo que T es una transformación lineal. ‚ El teorema 13.6.51 tiene una especie de recíproco. 13.6.52. Teorema. Si T : Kn ÝÑ Km es una transformación lineal, entonces existe una única matriz A de orden n ˆ m tal que para todo u P Kn se tiene que T puq “ uA. Demostración. Tomemos es Kn la base te1 , . . . , en u, donde ek es el vector que tiene la k-ésima componente igual a 1 y las otras iguales a 0. Sea A la matriz de orden n ˆ m cuyo i-ésimo renglón es T pei q. Observando que si B es una matriz de n ˆ m, entonces ei B es el i-ésimo renglón de B y en particular que T pei q “ ei A, tenemos que el resultado se sigue de los teoremas 13.6.50 y 13.6.51. ‚ 13.6.53. Definición. Sea T : Kn ÝÑ Km una transformación lineal. A la matriz A tal que T puq “ uA, para u P Kn , se le llama matriz asociada a T . Recíprocamente, a T se le 13.6. Transformaciones lineales 385 llama transformación lineal asociada a la matriz A. En el caso de que n “ m, se define el determinante de T , denotado det T , como el determinante de su matriz asociada. En el caso más general en el que pV1 , `q es un espacio vectorial de dimensión finita n con base te1 , . . . , en u, pV2 , `q es un espacio vectorial de dimensión finita m con base te11 , . . . , e1m u y T : V1 ÝÑ V2 es una transformación lineal, definimos la matriz asociada a T con respecto a las bases ordenadas pe1 , . . . , en q y pe11 , . . . , e1m q, como la matriz cuya componente i, j es la coordenada de T pei q en la dirección de e1j . Sea pV, `q un espacio vectorial de dimensión finita n, y sean pe1 , e2 , . . . , en q y pe11 , e12 , . . . , e1n q dos bases ordenadas de V . Construyamos la matriz cuadrada de orden n A “ pai,j q de tal n ř manera que para i P t1, 2, . . . , nu se tenga que ei “ ai,k e1k , es decir pai,1 , ai,2 , . . . , ai,n q k“1 es el vector de coordenadas de ei con respecto a pe11 , e12 , . . . , e1n q. Observemos que si v “ α1 e1 ` α2 e2 ` ¨ ¨ ¨ ` αn en , es decir si pα1 , α2 , . . . , αn q es el vector de coordenadas de v con respecto a pe1 , e2 , . . . , en q, entonces pα1 , α2 , . . . , αn qA es el vector de coordenadas de v con respecto a la base ordenada pe11 , e12 , . . . , e1n q. En vista de lo anterior, tenemos la siguiente definición. 13.6.54. Definición. Sea pV, `q un espacio vectorial de dimensión finita n, y sean pe1 , e2 , . . . , en q y pe11 , e12 , . . . , e1n q dos bases ordenadas de V . A la matriz A “ pai,j q de orden n ˆ n tal que n ř ai,k e1k se le llama matriz cambio de base de para cada i P t1, 2, . . . , nu se tiene ei “ k“1 pe1 , e2 , . . . , en q a pe11 , e12 , . . . , e1n q. 13.6.55. Observación. En la definición anterior, en caso de que V “ Kn , pe1 , e2 , . . . , en q sea la base canónica y v P Kn , tendremos que vA es el vector de coordenadas de v con respecto a pe11 , e12 , . . . , e1n q. 13.6.56. Teorema. Si A es la matriz cambio de base de una base ordenada pe1 , e2 , . . . , en q a una base ordenada pe11 , e12 , . . . , e1n q, entonces A es invertible y A´1 es la matriz cambio de base de pe11 , e12 , . . . , e1n q a pe1 , e2 , . . . , en q. Demostración. Sea A la matriz cambio de base de pe1 , e2 , . . . , en q a pe11 , e12 , . . . , e1n q y B la matriz cambio de base de pe11 , e12 , . . . , e1n q a pe1 , e2 , . . . , en q. Si v P V tiene vector de coordenadas a con respecto a pe1 , e2 , . . . , en q y tiene vector de coordenadas b con respecto a pe11 , e12 , . . . , e1n q, entonces aA “ b y bB “ a, de donde se tiene que aAB “ a y bBA “ b. Notando que si escogemos adecuadamente v tenemos que la fórmula aAB “ a es válida para cualquier vector de coordenadas a y también es válida la fórmula bBA “ b para cualquier vector de coordenadas b, concluimos que AB “ In “ BA, es decir B “ A´1 . ‚ Una especie de recíproco del teorema anterior es el siguiente. 13.6.57. Teorema. Si los renglones de una matriz cuadrada no son linealmente independientes, entonces su determinante es cero. Demostración. Sean v1 , v2 , . . . , vn los renglones de una matriz A de orden n ˆ n, es decir A “ pv1 , v2 , . . . , vn q. Si tv1 , v2 , . . . , vn u no es un conjunto linealmente independiente, entonces existe un l P t1, 2, . . . , nu tal que vl ´ n ÿ k“1, k‰l αk vk “ 0, 386 13.6. Transformaciones lineales para algunos escalares α1 , α2 , . . . , αn . Así, al tomar la matriz B “ pw1 , w2 , . . . , wn q, donde wl “ 0 y wk “ vk para k ‰ l, tenemos que las matrices A y B son semejantes, pero el l-ésimo renglón de B es 0, por lo que det B “ 0, y como A „ B, entonces det A “ 0. ‚ 13.6.58. Definición. Si T P LpV1 , V2 q y w P V2 , a una ecuación de la forma T pvq “ w se le llama ecuación lineal y a una ecuación de la forma T pvq “ 0 se le llama ecuación lineal homogénea (la correspondiente a la ecuación T pvq “ w). El teorema siguiente describe la forma en que podemos obtener la solución general de una ecuación lineal si conocemos una solución particular y la solución general de la correspondiente ecuación homogénea. Tal teorema tiene muchas utilidad en diferentes ramas de las matemáticas aplicadas como, por ejemplo, en la solución de ecuaciones diferenciales lineales y en la solución de ecuaciones lineales en diferencias. 13.6.59. Teorema. Sea T P LpV1 , V2 q, w P V2 y v0 P V1 tal que T pv0 q “ w. El conjunto solución de la ecuación T pvq “ w es kerpT q ` v0 , es decir tv P V1 : T pvq “ wu “ tv P V1 : existe un vh P V1 con T pvh q “ 0 y v “ vh ` v0 u. Demostración. Si vh P kerpT q, entonces T pvh ` v0 q “ T pvh q ` T pv0 q “ 0 ` w “ w, por lo tanto kerpT q ` v0 Ă tv P V1 : T pvq “ wu. Ahora, si v1 es tal que T pv1 q “ w, entonces T pv1 ´ v0 q “ T pv1 q ´ T pv0 q “ w ´ w “ 0, es decir v1 ´ v0 P kerpT q, de modo que al tomar vh “ v1 ´ v0 tenemos que v1 “ vh ` v0 , es decir v1 P kerpT q ` v0 , con lo que tenemos tv P V1 : T pvq “ wu Ă kerpT q ` v0 . ‚ Estableceremos algunos conceptos que serán de utilidad siempre que se estudien las propiedades de los espacios vectoriales. 13.6.60. Definición. Cuando T : V ÝÑ V es una transformación lineal, decimos que T es un operador lineal en V . En ese caso, para n P NYt0u definimos el operador T n recursivamente de manera tal que T 0 es la función identidad en V , T 1 “ T y en general T k`1 “ T ˝ T k . En caso de que T sea invertible y k P N definiremos T ´k “ pT ´1 qk . 13.6.61. Definición. Sea V un espacio vectorial sobre un cuerpo K. Cuando T : V ÝÑ K sea una transformación lineal, dicha transformación lineal se llama funcional lineal. 13.6.62. Definiciones. Decimos que una matriz cuadrada pai,j qi,jPJn cuyas componentes están en un campo K es diagonal si todas las componentes que no están en la diagonal son 0, es decir si ai,j “ 0 cuando i ‰ j. Si V un espacio vectorial de dimensión n sobre un campo K decimos que un operador lineal T : V ÝÑ V o su matriz asociada A con respecto a una base pei qni“1 de V es diagonalizable si existe una base pe1i qni“1 tal que la matriz D asociada a T con respecto a la base pe1i qni“1 sea una matriz diagonal. 13.6.63. Observación. En la definición anterior, si P es la matriz cambio de base de pei qni“1 a pe1i qni“1 , entonces A “ P DP ´1 . Ejercicios. 1. Demostrar que la función f : R3 ÝÑ R2 es una transformación lineal. px,y,zqÞÑp2x`z,3x´2yq 2. Hallar la matriz asociada a la transformación lineal del ejercicio anterio con respecto a las bases usuales en R3 y R2 . 13.6. Transformaciones lineales 3. Demostrar que la función f : 387 R3 ÝÑ R2 px,y,zqÞÑp2x`z 2 ,3x´2yq no es una transformación lineal. 4. Sea T “ D |C 2 pr0; 1sq el operador de derivada restringido al conjunto de funciones con dominio en r0; 1s y cuyas primeras dos derivadas son continuas. Demostrar que T es una transformación lineal del espacio C 2 pr0; 1sq en el espacio C 1 pr0; 1sq. 388 13.6. Transformaciones lineales Capítulo 14 TOPOLOGÍA 14.1. Introducción Daremos un vistazo a las estructuras de espacios métricos y topológicos. Para ver más de estos temas el lector puede consultar las siguientes obras: «Principios de Análisis Matemático, 3a edición» de W. Rudin (McGraw-Hill, México 1980), «Introduction to Topology, 2nd edition» de T. W. Gamelin y R. E. Greene (Dover, 1999), «Topology, 2nd edition» de J. R. Munkres (Prentice Hall, 2000) y «Elementos de la Teoría de Funciones y del Análisis Funcional» de A. N. Kolmogórov y S. V. Fomín (Editorial Mir, Moscú 1975). 389 390 14.2. 14.2. Espacios métricos Espacios métricos En esta sección se definirá y estudiará el concepto de métrica y espacio métrico y algunas de sus propiedades. El concepto de espacio métrico fue establecido por primera vez por Maurice Fréchet en 1906 en su tesis titulada «Sur quelques points du calcul fonctionnel». 14.2.1. Definición. Sea X un conjunto no vacío. Decimos que una función ρ : X ˆ X ÝÑ r0; `8q es una métrica o distancia en X si se satisfacen las siguientes propiedades: a) ρpx, yq “ ρpy, xq, para todo x, y P X; b) ρpx, yq “ 0 si y sólo si x “ y; c) ρpx, zq ĺ ρpx, yq ` ρpy, zq para todo x, y, z P X. Cuando ρ es una métrica en X decimos que la pareja pX, ρq es un espacio métrico. A la propiedad c) se le conoce como desigualdad del triángulo. Se desea que el concepto de distancia entre dos objetos indique qué tan cercanos o similares son esos dos objetos bajo algún criterio. 14.2.2. Ejemplo. Si definimos en R ˆ R la función d dada por dpx, yq “ |x ´ y|, podemos ver que tal función es una métrica en R. 14.2.3. Ejemplo. Si X es un conjunto no vacío y definimos la función ρ : X ˆ X ÝÑ R como ρpx, xq “ 0 y ρpx, yq “ 1 si y ‰ x, tal función es una métrica en X. A tal métrica ρ se 14.2. Espacios métricos 391 le llama métrica discreta. 14.2.4. Ejemplo. Si para cualesquiera dos elementos de Rn x “ pxk qnk“1 y y “ pyk qnk“1 n ř definimos ρpx, yq “ |xk ´ yk |, tal función ρ es una métrica. k“1 n n n 14.2.5. Ejemplo. c n Si para cualesquiera dos elementos de R x “ pxk qk“1 y y “ pyk qk“1 definiř mos dpx, yq “ pxk ´ yk q2 , tal función d es una métrica llamada distancia euclidiana. k“1 El lector que quiera verificar que la distancia euclidiana es en efecto una distancia puede hacerlo al revisar la sección 15.2 (corolario 15.2.17). 14.2.6. Ejemplo. Si X es el conjunto de funciones reales continuas en el intervalo cerrado r0; 1s y ρ : X ˆ X ÝÑ R es tal que ρpf, gq “ máxt|f pxq ´ gpxq| : x P r0; 1su, entonces tal función ρ es una métrica. Siempre que hablemos de la distancia en Rn y no especifiquemos a qué distancia nos referimos, sobreentenderemos que es la distancia euclidiana y cuando hablemos de distancia en R sobreentenderemos que es la distancia dada en el ejemplo 14.2.2. Para poder seguir con nuestro estudio, a continuación estableceremos algo de terminología. 14.2.7. Definiciones. Sea pX, ρq un espacio métrico, x P X y r ą 0. Al conjunto Bpx, rq :“ ty P X : ρpx, yq ă ru le llamamos bola abierta o simplemente bola con centro en x y radio r (obviamente la definición de bola depende de la métrica que se esté considerando). Al conjunto Bpx, rq :“ ty P X : ρpx, yq ĺ ru le llamamos bola cerrada con centro en x y radio r. Decimos que un conjunto A Ă X es abierto (con respecto a la métrica ρ) si para todo x P A existe una bola con centro en x que está incluida en A. Si x P V Ă X y V es un conjunto abierto, decimos que V es una vecindad de x. Si E Ă X es un conjunto, ˝ definimos el interior de E como el conjunto E :“ tx : existe una bola con centro en x que ˝ está incluida en Eu y a cualquier elemento de E se le llama punto interior de E. Cuando sea conveniente, denotaremos también al interior de E como intE. Definimos la frontera de un conjunto E Ă X como el conjunto BE :“ tx : para todo r ą 0 se tiene que Bpx, rq X E ‰ ∅ y Bpx, rq X pXzEq ‰ ∅u. Decimos que un conjunto C es cerrado cuando su frontera está incluida en el, es decir cuando BC Ă C. Definimos la cerradura o clausura de un conjunto E Ă X como el conjunto E :“ E Y BE. El exterior de un conjunto E Ă X es por definición ˝ tx P X : x R BE y x R Eu, es decir es el conjunto tx P X : existe un r ą 0 tal que Bpx, rq Ă XzEu. Un elemento x P X es un punto de acumulación de un conjunto E Ă X cuando para todo r ą 0 se tiene que pBpx, rqztxuq X E ‰ ∅. Por otro lado, si x P E Ă X y x no es un punto de acumulación de E, entonces decimos que x es un punto aislado de E. A la colección de todos los conjuntos abiertos A Ă X se le llama topología inducida por la métrica ρ. 14.2.8. Ejemplos. A manera de ejemplos tenemos que los intervalos abiertos son conjuntos abiertos en R; los intervalos cerrados son conjuntos cerrados en R; para a ă b, los intervalos de la forma pa; bs no son ni abiertos ni cerrados; Bpa; bs “ ta, bu; el conjunto t n1 : n P Nu no es ni abierto ni cerrado y su frontera es t n1 : n P Nu Y t0u; BQ “ R; la topología inducida por la métrica discreta en un conjunto X es el conjunto potencia de X y la frontera de cualquier 392 14.2. Espacios métricos subconjunto de X con dicha métrica es el conjunto vacío. Observemos que el interior de un conjunto siempre está incluido en el conjunto. 14.2.9. Teorema. Sea pX, ρq un espacio métrico. Un conjunto C Ă X es cerrado si y sólo si XzC es abierto. Demostración. Supongamos primero que C es un conjunto cerrado y tomemos x P XzC. Como BC Ă C, entonces x R BC, y por lo tanto existe un número r ą 0 tal que Bpx, rq Ă XzC. Concluimos así que XzC es abierto. Supongamos ahora que XzC es abierto y sea x P BC. Como toda bola con centro en x interseca a C, y XzC es abierto, entonces x R XzC, es decir x P C, concluyendo así que BC Ă C, es decir C es cerrado. ‚ 14.2.10. Teorema. Sea pX, ρq un espacio métrico. a) Los conjuntos X y ∅ son abiertos y cerrados a la vez. b) Si tA1 , A2 , . . . , Ak u es una colección finita de conjuntos abiertos, entonces A1 X A2 X ¨ ¨ ¨ X Ak es un conjunto abierto. Ť c) Si tAλ uλPΛ es una colección de conjuntos abiertos (finita o infinita), entonces Aλ es λPΛ un conjunto abierto. Demostración. Si x P X y r ą 0, entonces, por definición de bola, Bpx, rq Ă X, por lo que X es un conjunto abierto y por el teorema 14.2.9 el conjunto vacío es cerrado. Además como Bpx, rq Ă X para todo x P X y todo r ą 0, entonces BX “ ∅, teniéndose así que BX Ă X, es decir X es cerrado, y de nuevo por el teorema 9, ∅ es abierto. Con lo que queda demostrado a). Demostremos ahora b). Si x P A1 X A2 X ¨ ¨ ¨ X Ak , entonces, como cada Aj es abierto, para cada j P t1, . . . , ku existe un rj ą 0 tal que Bpx, rj q Ă Aj . Tomando r “ míntA1 , . . . , Ak u y observando que si j P t1, . . . , ku se tiene que Bpx, rq Ă Bpx, rj q Ă Aj , concluimos que Bpx, rq Ă A1 X A2 X ¨ ¨ ¨ X Ak , teniéndoseŤasí que el conjunto A1 X A2 X ¨ ¨ ¨ X Ak es abierto. Para demostrar c) tomemos un x P Aλ , es decir x P Aλ0 para algún λ0 en Λ. Como λPΛ Ť Ť Aλ0 es abierto, existe un r ą 0 tal que Bpx, rq Ă Aλ0 Ă Aλ , demostrando así que Aλ λPΛ λPΛ es abierto. ‚ Como consecuencia inmediata de los teoremas 14.2.9 y 14.2.10 tenemos el siguiente corolario. 14.2.11. Corolario. Sea pX, ρq un espacio métrico. a) Si tF1 , F2 , . . . , Fk u es una colección finita de conjuntos cerrados, entonces F1 Y F2 Y ¨ ¨ ¨ Y Fk es un conjunto cerrado. Ş b) Si tFλ uλPΛ es una colección de conjuntos cerrados, entonces Fλ es un conjunto ceλPΛ rrado. 14.2. Espacios métricos 393 14.2.12. Teorema. Sea pX, ρq un espacio métrico, x P X y r ą 0. Tenemos que Bpx, rq es un conjunto abierto y Bpx, rq es un conjunto cerrado; es decir las bolas abierta son conjuntos abiertos y las bolas cerradas son conjuntos cerrados. Demostración. Sea y P Bpx, rq, r0 “ ρpx, yq y r1 “ r ´ r0 . Si z P Bpy, r1 q, entonces, por la desigualdad del triángulo, ρpx, zq ĺ ρpx, yq ` ρpy, zq ă r0 ` r1 “ r0 ` pr ´ r0 q “ r, por lo que z P Bpx, rq, concluyendo que Bpx, rq es un conjunto abierto. Por otra parte, sea y R Bpx, rq, r0 “ ρpx, yq y r1 “ r0 ´ r. Si z P Bpy, r1 q, entonces, por la desigualdad del triángulo, r0 “ ρpx, yq ĺ ρpx, zq ` ρpy, zq, por lo que r “ r0 ´ r1 ă r0 ´ρpy, zq ĺ ρpx, zq, por lo que Bpy, r1 q Ă XzBpx, rq, teniéndose así que XzBpx, rq es abierto, y por el teorema 14.2.9, Bpx, rq es cerrado. ‚ 14.2.13. Teorema. Sea pX, ρq un espacio métrico. El interior de un conjunto E Ă X es un conjunto abierto y si A Ă E es un conjunto abierto, entonces A está incluido en el interior de E. Demostración. En el caso en que el interior de E sea el conjunto vacío tenemos por el teorema 14.2.10 que el interior de E es abierto. Supongamos que el interior de E es no vacío y sea x un elemento del interior de E y r un número positivo tal que Bpx, rq Ă E. Como Bpx, rq es abierto, tenemos que si y P Bpx, rq, existe un r0 ą 0 tal que Bpy, r0 q Ă Bpx, rq Ă E, por lo que todos los elementos de Bpx, rq son puntos interiores de E, es decir el interior de E es un conjunto abierto. Ahora, si A Ă E es un conjunto abierto y x P A, entonces existe un r ą 0 tal que Bpx, rq Ă A Ă E, teniéndose así que x está en el interior de E. Por lo tanto, A está incluido en el interior de E. ‚ 14.2.14. Teorema. Sea pX, ρq un espacio métrico. El interior de un conjunto E Ă X está ˝ formado por los puntos de E que no están en su frontera, es decir E “ EzBE. ˝ Demostración. Sea x P E. Por definición, x está en E y no está en BE. Ahora, si x P EzBE, entonces existe una bola con centro en x que no interseca a XzE, lo que significa que tal bola ˝ ˝ está incluida en E, es decir x P E. Tenemos así que E “ EzBE. ‚ 14.2.15. Teorema. Sea pX, ρq un espacio métrico. La cerradura de un conjunto E Ă X es un conjunto cerrado y si C Ą E es un conjunto cerrado, entonces E está incluido en C. Demostración. Para demostrar que E es cerrado, supongamos que x P BE y demostremos que x P E. Para cada r ą 0 existe un yr P Bpx, rq tal que yr P E. Si x no estuviera en E, entonces estaría en el exterior de E, es decir existiría un r ą 0 tal que Bpx, rq Ă XzE, pero por el teorema 14.2.12 el conjunto Bpx, rq es abierto, debiendo existir un r0 ą 0 tal que Bpyr , r0 q Ă Bpx, rq Ă XzE, teniéndose así que yr no estaría ni en E ni en BE, es decir yr R E, llegando así a una contradicción, por lo que necesariamente x debe pertenecer a E. Sea C Ą E un conjunto cerrado. Si x P E, entonces cualquier bola con centro en x interseca a E y por lo tanto también interseca a C, luego, como C es cerrado, x P C. Concluimos así que E Ă C. ‚ 14.2.16. Teorema. Sea pX, ρq un espacio métrico y A, B Ă X. ˝ a) A es abierto si y sólo si A “ A. 394 14.2. Espacios métricos b) A es cerrado si y sólo si A “ A. ˝ ˝ c) A “ XzpXzAq; A “ XzintpXzAq; BA “ AzA. d) pA Y Bq “ A Y B. Demostración. Del teorema 14.2.13 se sigue a) y del teorema 14.2.15 se sigue b). ˝ De la definición de frontera, interior y de cerradura de un conjunto se sigue que BA “ AzA. ˝ De los teoremas 14.2.9, 14.2.13 y 14.2.15 se sigue que A “ XzpXzAq y que A “ XzintpXzAq, con lo que tenemos c). Para demostrar d) supongamos primero que x P A Y B. Si x P A, entonces toda bola con centro en x interseca a A, y por lo tanto también interseca a A Y B, es decir x P pA Y Bq. De manera similar, si x P B, entonces x P pA Y Bq, por lo tanto A Y B Ă pA Y Bq. Ahora, si x P pA Y Bq, entonces cualquier bola con centro en x interseca a A Y B, es decir interseca a A o interseca a B. Si x P A entonces x P A Y B. Si x R A entonces existe un r0 ą 0 tal que Bpx, r0 q no interseca a A, por lo que si r ĺ r0 , entonces Bpx, rq tampoco intersecará a A, de modo que si r ĺ r0 entonces Bpx, rq interseca a B y obviamente también lo interseca si r ą r0 , por tanto x P B. Tenemos así que en cualquier caso x P A Y B, por lo tanto pA Y Bq Ă A Y B, concluyendo que d) es verdadera. ‚ A continuación estudiaremos brevemente el concepto de conexidad. Comencemos definiendo el significado de conjunto conexo. 14.2.17. Definición. Un espacio métrico pX, ρq se dice que es conexo cuando los únicos subconjuntos de X que son abiertos y cerrados a la vez son X y ∅. Por otro lado, si pX, ρq es un espacio métrico, decimos que un conjunto E Ă X es conexo cuando el espacio métrico pE, ρ|E ˆ Eq es conexo (donde ρ|E ˆ E es la métrica ρ con el dominio restringido). El teorema siguiente caracteriza los subconjuntos conexos del conjunto de números reales. 14.2.18. Teorema. Un conjunto E Ă R es conexo si y sólo si es un intervalo. Demostración. Consideraremos al espacio métrico pE, dq, donde d es la distancia euclidiana. Supongamos primero que E es un conjunto conexo. Si E es el conjunto vacío o es un conjunto con un solo punto, entonces es un intervalo. Si E tiene más de un elemento, sean a “ ínf E, b “ sup E y x P pa; bq. Demostremos que x P E. Supongamos que x R E, tomemos los conjuntos E1 :“ ty P E : y ă xu y E2 :“ ty P E : y ą xu, y observemos que E “ E1 Y E2 y E1 “ EzE2 . Para z P E tomemos rz ą 0 suficientemente pequeño (digamos rz ĺ dpz, xq), tenemos que z P E1 ùñ ty P E : dpz, yq ă rz u Ă E1 y que z P E2 ùñ ty P E : dpz, yq ă rz u Ă E2 . Por lo que, tanto E1 como E2 serían conjuntos abiertos, y como E1 “ EzE2 , entonces también serían cerrados, además son diferentes de E y ∅, contradiciendo el hecho de que E es un conjunto conexo. Así tenemos que todo x P pa; bq debe ser necesariamente un elemento de E, es decir pa; bq Ă E. Ahora, por definición de a y b, tenemos que el conjunto E es pa; bq, ra; bs, pa; bs ó ra; bq, concluyendo que E es un intervalo. Supongamos ahora que E es un intervalo. Si E es el conjunto vacío o es un conjunto con un solo punto, entonces sus únicos subconjuntos son ∅ y E. Así, debido al teorema 14.2.10 a), tenemos que E es conexo. Si E tiene más de un elemento, sean a “ ínf E y b “ sup E. 14.2. Espacios métricos 395 Si E no fuera conexo, existiría un conjunto A Ă E diferente de E y del vacío que sería abierto y cerrado a la vez, y además EzA también sería abierto y cerrado. Sean x P A e y P EzA y supongamos sin pérdida de generalidad que x ă y. Denotemos por z al supremo de A X rx; ys y demostremos que z debe pertenecer tanto a A como a EzA, llegando así a una contradicción. Si z P A, entonces z ă y y para todo r ą 0 definamos zr “ mínty, z ` 2r u, teniéndose así que zr P Bpz, rq X pEzAq, es decir A no es abierto. Si z P EzA, entonces z ĺ y y para todo r ą 0 existe un wr P A X pz ´ r; zq (de otro modo z no sería el supremo de A X rx; ys); es decir wr P Bpz, rq X A y z está en la frontera de A pero no en A, con lo que el conjunto A no es cerrado. Por lo tanto, si E es un intervalo, éste debe ser conexo. ‚ 14.2.19. Definiciones. Sea pX, ρq un espacio métrico y E Ă X. Al número suptρpa1 , a2 q : a1 , a2 P Eu se le llama diámetro de E y lo denotaremos por diámpEq. Decimos que E es acotado si está incluido en una bola. 14.2.20. Observación. Observemos que la definición anterior de conjunto acotado es equivalente con la definición de conjunto acotado en R y que en general el diámetro de una bola de radio r es a lo más 2r. A continuación estableceremos el concepto de compacidad, el cual es de gran importancia en muchas ramas de las matemáticas y sirve para determinar la existencia de máximos y mínimos de funciones continuas. 14.2.21. Definición. Sea pX, ρq un espacio métricoŤy E Ă X. Se dice que una colección Ψ de subconjuntos de X es una cubierta de E si E Ă A. En caso de que Ψ sea una cubierta APΨ de E y que todos los elementos de Ψ sean abiertos, decimos que Ψ es una cubierta abierta de E. Cuando una colección Ψ es una cubierta de E, decimos que Ψ cubre a E. 14.2.22. Definición. Sea pX, ρq un espacio métrico y E Ă X. Decimos que E es compacto, si toda cubierta abierta Ψ del conjunto E tiene una subcubierta abierta finita Ψ 1 Ă Ψ , es decir existe una colección Ψ 1 que es subconjunto finito de Ψ y que es una cubierta de E. 14.2.23. Ejemplo. Tenemos que cualquier subconjunto finito es compacto. En efecto, si Ψ es una cubierta abierta de un conjunto finito E, para cada x P E tomamos un elementos Ax P Ψ tal que x P Ax , lo cual es posible debido a que Ψ es una cubierta abierta de E, teniendo así que tAx : x P Eu es una cubierta abierta finita de E que tiene a lo más el mismo número de elementos que E. 14.2.24. Teorema. Sea pX, ρq un espacio métrico y E Ă X. Si E es compacto, entonces es acotado. Demostración. Supongamos que E es compacto. Tenemos que la colección tBpx, 1q : x P Eu es una cubierta abierta de E. Como E es compacto, existe una subcolección finita que es una cubierta de E, es decir existe un n P N y n elementos x1 , x2 , . . . , xn P E tales que tBpx1 , 1q, Bpx2 , 1q, . . . , Bpxn , 1qu es una cubierta de E. Afirmamos que para r “ máxtρpx1 , xk q : k P t1, 2, . . . , nuu tenemos E Ă Bpx1 , r ` 1q. En efecto, si x P E, entonces x P Bpxk , 1q para algún k P t1, 2, . . . , nu y ρpx1 , xq ĺ ρpx1 , xk q ` ρpxk , xq ă r ` 1, es decir 396 14.2. Espacios métricos x P Bpx1 , r ` 1q. ‚ 14.2.25. Teorema. Sea pX, ρq un espacio métrico y E Ă X. Si E es compacto, entonces es cerrado. Demostración. Supongamos que E es compacto y veamos que el complemento de E es abierto. Sea y P XzE y para cada x P E sea rx “ 12 ρpx, yq, teniéndose que la colección tBpx, rx q : x P Eu es una cubierta abierta de E. Por ser E compacto, existe un n P N y n elementos x1 , x2 , . . . , xn P E tales que tBpx1 , rx1 q, Bpx2 , rx2 q, . . . , Bpxn , rxn qu es una cubierta de E. Tomemos ry “ míntrx1 , rx2 , . . . , rxn u. Si w P E, entonces pertenece a alguna bola Bpxk , rk q, y no puede pertenecer a Bpy, ry q, puesto que de ser así tendríamos 2rxk “ ρpy, xk q ĺ ρpy, wq ` ρpw, xk q ă ry ` rxk ĺ 2rxk . Como la bola Bpy, ry q no está incluida en ninguno de los Bpxk , rxk q, entonces no está incluida en E, por lo que XzE es abierto y por el teorema 9, E es cerrado. ‚ 14.2.26. Teorema. Sean a, b P R tales que a ă b. El intervalo ra; bs es compacto. Demostración. Sea Ψ una cubierta abierta de ra; bs, B “ td P ra; bs : existe un subconjunto finito de Ψ que es cubierta de ra; bs} y c “ sup B. Tomemos un conjunto abierto Ac tal que c P Ac P Ψ . Obviamente a ă c ĺ b. Veamos ahora que necesariamente c “ b. Si c fuera menor que b, existiría un r ą 0 tal que pc ´ r; c ` rq Ă Ac , de modo que c ´ 2r P Ac y existe un subconjunto finito Ψ 1 Ă Ψ tal que Ψ 1 es una cubierta de ra; c ´ 2r s. Ahora, el conjunto Ψ 1 Y tAc u es un subconjunto finito de Ψ y es una cubierta abierta de ra; míntc ` 2r , bus, lo cual contradice el hecho de que c “ sup B. ‚ 14.2.27. Teorema. Sea pX, ρq un espacio métrico, E Ă X un conjunto compacto y F Ă X un conjunto cerrado. El conjunto E X F es compacto. Demostración. Sea Ψ una cubierta abierta de E X F y notemos que Ψ Y tXzF u es una cubierta abierta de E y, como E es compacto, existe un conjunto finito Ψ ˚ Ă Ψ Y tXzF u. Ahora, Ψ ˚ es una cubierta abierta finita de E X F , pero como ningún elemento de E X F está en XzF , entonces el conjunto Ψ ˚ ztXzF u Ă Ψ también es una cubierta abierta finita de E X F , por lo tanto E X F es compacto. ‚ El teorema siguiente describe la forma en que deben ser los subconjuntos compactos del conjunto de números reales. 14.2.28. Teorema. Un subconjunto E Ă R es compacto si y sólo si es cerrado y acotado. Demostración. Sea E Ă R. Por el teorema 14.2.25 tenemos que si E es cerrado, entonces es cerrado y acotado. Ahora, si E es cerrado y acotado, existen dos números a, b P R tales que a ă b y E Ă ra; bs, de modo que por el teorema 14.2.26 el intervalo ra; bs es un conjunto compacto y por el teorema 14.2.27 se tiene que E X ra; bs es compacto, pero E “ E X ra; bs. ‚ 14.2.29. Definición. Sean pX, ρq y pE, ζq dos espacios métricos. Si E Ă X y además ρpx, yq “ ζpx, yq para x, y P E, decimos que pE, ζq es un subespacio métrico de pX, ρq. Cuando G Ă E sea abierto con respecto al espacio métrico pE, ζq, diremos que G es abierto relativo a E o abierto en E. La demostración del siguiente teorema se deja al lector. 14.2.30. Teorema. Sea pX, ρq un espacio métrico y pE, ζq un subespacio métrico de pX, ρq. 14.2. Espacios métricos 397 Un conjunto G Ă E es abierto en E si y sólo si existe un conjunto A que es abierto en X y además G “ A X E. 14.2.31. Ejemplo. El conjunto p3; 6s no es un conjunto abierto en R, pero es un conjunto abierto en r0; 6s. Hemos visto que un conjunto puede no ser abierto con respecto a un espacio métrico, pero sí ser abierto con respecto a un subespacio que lo contenga, por lo que en cierto sentido el concepto de ser abierto relativo depende del subespacio del espacio métrico, es decir es en efecto un concepto relativo. Un concepto que no es tan relativo es el de compacidad, como lo muestra el teorema siguiente. 14.2.32. Teorema. Sea pX, ρq un espacio métrico y pE, ζq un subespacio métrico de pX, ρq. Un conjunto C Ă E es compacto con respecto al espacio métrico pE, ζq si y sólo si es compacto con respecto al espacio métrico pX, ρq. Demostración. Sea C Ă E. Supongamos primero que C es compacto con respecto al espacio métrico pX, ρq. Sea tEλ : λ P Λu una cubierta abierta de C con respecto al subespacio métrico pE, ζq. Por el teorema 14.2.30, para cada λ P Λ existe un conjunto Aλ que es abierto en X y además Eλ “ E X Aλ . Como Eλ Ă Aλ , tenemos que tAλ : λ P Λu es una cubierta abierta de C con respecto al espacio métrico pX, ρq, por lo que existe una subcolección tAλ1 , Aλ2 , . . . , Aλn u que es cubierta finita de C. Ahora, observemos que la colección tEλ1 , Eλ2 , . . . , Eλn u es una subcolección finita de tEλ : λ P Λu que cubre a C, por lo que C es compacto con respecto al espacio métrico pE, ζq. Supongamos ahora que C es compacto con respecto al espacio métrico pE, ζq. Sea tAλ : λ P Λu una cubierta abierta de C con respecto al espacio métrico pX, ρq y para cada λ definamos Eλ :“ E X Aλ observando que tEλ : λ P Λu es una cubierta abierta de C con respecto al espacio métrico pE, ζq. Como estamos suponiendo que C es compacto con respecto a pE, ζq, existe una subcolección finita tEλ1 , Eλ2 , . . . , Eλn u que cubre a C por lo que, debido a que Eλ Ă Aλ , también lo cubre la colección tAλ1 , Aλ2 , . . . , Aλn u, teniendo así que C es compacto con respecto al espacio métrico pX, ρq. ‚ Volvamos al tema de los conjuntos conexos. De la definición de conjunto conexo, podemos ver que un conjunto E es conexo si y sólo si no puede expresarse como la unión de dos conjuntos abiertos (con respecto a E), disjuntos y no vacíos. Ş 14.2.33. Teorema. Sea pX, ρq un espacio métrico. Si existe un x P Eλ , donde los Eλ son λPΛ Ť subconjuntos conexos de X para λ P Λ, entonces Eλ es conexo. λPΛ Ş Demostración. Supongamos que x P Eλ , donde los Eλ son subconjuntos conexos de X λPΛ Ť Ť para λ P Λ. Sea A1 Ă Eλ un conjunto abierto y cerrado a la vez, con respecto a Eλ , λPΛ ŤλPΛ de modo que A2 :“ Eλ zA1 es también abierto y cerrado. Tenemos que x P A1 ó x P A2 ; λPΛ supongamos sin pérdida de generalidad que x P A1 . Como cada Eλ es conexo, el conjunto A1 X Eλ es no vacío, abierto y cerrado en Eλ ; así el complemento con respecto a Eλ , que Ť es A2 X Eλ , es el conjunto vacío. Tenemos así que A2 “ pA2 X Eλ q “ ∅, de manera que Ť ŤλPΛ A1 “ Eλ , teniéndose que los únicos subconjuntos de Eλ que con respecto él mismo son λPΛ λPΛ 398 abiertos y cerrados a la vez son el vacío y el mismo 14.2. Espacios métricos Ť Eλ . ‚ λPΛ 14.2.34. Definición. Sea pX, ρq un espacio métrico, E Ă X y x P E. A la unión de todos los subconjuntos conexos a los cuales pertenece x y que están incluidos en E se le llama componente conexa de E. El corolario siguiente se puede deducir del teorema 14.2.33. Dejamos los detalles de la demostración como ejercicio para el lector. 14.2.35. Corolario. Las componentes conexas de un conjunto E son conjuntos conexos y la colección de componentes conexas de un conjunto es una partición en clases de equivalencia de E. Ejercicios. 1. Verificar que las funciones dadas en los ejemplos 14.2.2, 14.2.3, 14.2.4, 14.2.5 y 14.2.6 son métricas. 2. Demostrar el teorema 14.2.30. 3. Demostrar con detalle el corolario 14.2.35. 14.3. Funciones en espacios métricos 14.3. 399 Funciones en espacios métricos En esta sección se generalizará el concepto de función continua para espacios métricos arbitrarios y se estudiarán algunas de sus propiedades. Veamos algunas propiedades de las imágenes e imágenes inversas de las funciones que serán de utilidad en lo sucesivo. 14.3.1. Teorema. Sean X e Y dos conjuntos, f : X ÝÑ Y una función, tAλ : λ P Λu una colección de subconjuntos de X y tBλ : λ P Λu una colección de subconjuntos de Y . Se tienen las siguientes propiedades: „ Ş Ş a) f Aλ Ă f rAλ s. λPΛ λPΛ „ b) Ť Ť f rAλ s “ f λPΛ Aλ . λPΛ „ c) Ş f ´1 rBλ s “ f λPΛ Ş ´1 „ d) Ť λPΛ Bλ . λPΛ f ´1 rBλ s “ f ´1 Ť Bλ . λPΛ e) f rf ´1 rBss Ă B, para todo B Ă Y . f) A Ă f ´1 rf rAss, para todo A Ă X. g) f ´1 prY zBs “ Xzf ´1 rBs, para todo B Ă Y . Ş Demostración. Demostremos primero a). En caso de que f r Ş λPΛ Aλ s “ ∅, la conclusión Ş es obvia. Supongamos que y P f r λPΛ Aλ s, es decir existe un x P λPΛ Aλ , tal que f pxq “ y. Como para todo λŞP Λ existe un x P Aλ tal que fŞ pxq “ y, entonces y P f rAλ s, para todo Ş λ P Λ, es decir y P λPΛ f rAλ s, concluyendo que f r λPΛ Aλ s Ă λPΛ f rAλ s. Ť Demostremos ahora b). Sea y P λPΛ f rAλ s. Existe un λ0 P Λ tal que Ť y P f rAλ0 s, por lo que existe Ť a su vez un x P Aλ0 tal que f pxq Ť “ y, pero tal xŤestá en λPΛ Aλ , porŤlo tanto y P f r λPΛ AλŤ s. Hemos demostrado que λPΛ f rAλ s Ă f r λPΛ Aλ s. Sea z P f r λPΛ Aλ s. Existe un x P λPΛ Aλ tal que fŤ pxq “ y, y tal x está en algún AλŤ1 con λ1 P Ť Λ, de modo que y P f rAλ1 s, por lo tanto y P λPΛ f rAλ s. Tenemos pues que f r λPΛ Aλ s Ă λPΛ f rAλ s, concluyendo la parte b) del teorema. Ş Para demostrar c) supongamos primero que x P λPΛ f ´1 rBλ s, es decir x P f ´1 rBλ s para todo λ P Λ. Sea yŞ“ f pxq. Como x P f ´1 rBλ s para λŞP Λ, entonces y P Bλ para cada ´1 λ es decir y P Ş r λPΛ BŞ λ s, de donde concluimos que λPΛ Bλ , teniéndose así que x P f ŞP Λ, ´1 ´1 ´1 y el elementos λPΛ Ş f rBλ s Ă f r λPΛ Bλ s. Supongamos ahora que x P f r λPΛ Bλ s y sea ´1 de λPΛ Bλ tal queŞy “ f pxq. Como y P Bλ para todo λŞP Λ, entonces x P f rB λ s para todo Ş ´1 ´1 ´1 λ P Λ, es decir x P λPΛ f rBλ s. Tenemos así que f r λPΛ Bλ s Ă λPΛ f rBλ s con lo cual se obtiene la parte c). Ť Demostremos ahora la parte d). Tomemos x P λPΛ f ´1 rBλ s y sea y el elemento de Y tal que y “ f pxq. Como x P f ´1 rBλ0 s para algún λ0 P Λ, entonces y P Bλ0 , por lo tanto 400 14.3. Funciones en espacios métricos Ť Ť Ť ´1 y P ŤλPΛ Bλ , teniendo que x P f ´1 r λPΛ Bλ s, con lo que concluimos que rBλ s Ă λPΛ f Ť ´1 ´1 f rŤ λPΛ Bλ s. Supongamos ahora que x P f r λPΛ Bλ s y sea de nuevo y “ f pxq. Como y P λPΛ Bλ , existe un λ1ŤP Λ tal que y P Bλ1 , teniendo así que x P f ´1 rB algún Ť Ťλ1 s para ´1 ´1 ´1 λ1 P Λ, por lo tanto x P λPΛ f rBλ s, demostrando que f r λPΛ Bλ s Ă λPΛ f rBλ s y terminando la demostración de d). Veamos ahora e). Si y P f rf ´1 rBss, entonces existe un x P f ´1 rBs tal que y “ f pxq, pero f pxq P B, es decir y P B, con lo que concluimos e). Mostremos la veracidad de f). Si x P A, entonces f pxq P f rAs, por lo que si tomamos y “ f pxq, tenemos que x P f ´1 rtyus Ă f ´1 rf rAss y así A Ă f ´1 rf rAss. Concluyamos el teorema demostrando g). Si x P X, entonces x P f ´1 rY zBs ðñ f pxq P Y zB ðñ f pxq R B. Ahora, decir que f pxq P B equivale a decir que x P f ´1 rBs, por lo que f pxq R B significa que x R f ´1 rBs, es decir significa que x P Xzf ´1 rBs, obteniéndose que g) es verdadera y concluyendo así la demostración del teorema. ‚ Definamos ahora el concepto de continuidad en espacios métricos. 14.3.2. Definición. Sean pX, ρq y pY, ηq dos espacios métricos, f : X ÝÑ Y una función y x0 P X. Decimos que la función f es continua en x0 , cuando para todo ε ą 0 existe un δ ą 0 tal que ρpx0 , xq ă δ ùñ ηpf px0 q, f pxqq ă ε, para todo x P X. Así mismo, decimos simplemente que f es continua, cuando es continua en su dominio. Si E Ă X, decimos que f es continua en E, cuando f |E (la restricción de f al conjunto E) es continua con respecto al subespacio métrico pE, ζq de pX, ρq. 14.3.3. Teorema. Sean pX, ρq y pY, ηq dos espacios métricos, f : X ÝÑ Y una función y x0 P X. La función f es continua en x0 si y sólo si para toda vecindad W de f px0 q existe una vecindad V de x0 tal que f rV s Ă W . Demostración. Supongamos que f es continua en x0 y sea W una vecindad de f px0 q. Como W es abierto y f px0 q P W , entonces existe un ε ą 0 tal que Bpf px0 q, εq Ă W . Ahora, por ser f continua en x0 , existe un δ ą 0 tal que ρpx0 , xq ă δ ùñ ηpf px0 q, f pxqq ă ε, es decir f rBpx0 , δqs Ă Bpf px0 q, εq Ă W , por lo que si tomamos V “ Bpx0 , δq se tiene que si f es continua, entonces existe una vecindad V de x0 tal que f rV s Ă W . Supongamos ahora que para toda vecindad W de f px0 q existe una vecindad V de x0 tal que f rV s Ă W . Sea ε ą 0. Como Bpf px0 q, εq es una vecindad de f px0 q, existe una vecindad V de x0 tal que f rV s Ă Bpf px0 q, εq. Ahora, existe un δ ą 0 tal que Bpx0 , δq Ă V , de modo que f rBpx0 , δqs Ă f rV s Ă Bpf px0 q, εq, es decir |x ´ x0 | ă δ ùñ |f px0 q ´ f pxq| ă ε, lo cual significa que f es continua en x0 . ‚ 14.3.4. Teorema. Sean pX, ρq y pY, ηq dos espacios métricos y f : X ÝÑ Y una función. Las siguientes tres propiedades son equivalentes: a) f es continua. b) Para todo abierto W Ă Y se tiene que f ´1 rW s es abierto. c) Para todo cerrado Z Ă Y se tiene que f ´1 rZs es cerrado. 14.3. Funciones en espacios métricos 401 Demostración. a) ùñ b). Supongamos que f es continua y sea W un subconjunto abierto de Y . Para cada x P f ´1 rW s sea Vx una vecindad de x tal que Ť f rVx s Ă W (tal vecindad existe debido al teorema 14.3.3). Observando que f ´1 rW s “ xPf ´1 rW s Vx y usando el teorema 14.2.10 c) tenemos que a) ùñ b). b) ùñ a). Supongamos que para todo abierto W Ă Y se tiene que f ´1 rW s es abierto. Sea x0 P X, ε ą 0 y tomemos W “ Bpf px0 q, εq. Tenemos que f ´1 rBpf px0 q, εqs es un conjunto abierto al cual pertenece x0 , por lo que existe una bola Bpx0 , δq que está incluida en f ´1 rBpf px0 q, εqs, teniéndose así que f rBpx0 , δqs Ă Bpf px0 q, εq, concluyendo que f es continua. b) ðñ c). Supongamos primero que se cumple b) y sea Z Ă Y un conjunto cerrado. Como Y zZ es abierto, tenemos que f ´1 rZs “ Xzf ´1 rY zZs es cerrado (teoremas 14.2.9 y 14.3.1 g)), por lo tanto b) ùñ c). Supongamos ahora que se cumple c) y sea W Ă Y un conjunto abierto. Como W zZ es cerrado, tenemos que f ´1 rW s “ Xzf ´1 rY zW s es abierto, por lo tanto c) ùñ b). ‚ 14.3.5. Teorema. Sean pX, ρq y pY, ηq dos espacios métricos, f : X ÝÑ Y una función continua y C Ă X un conjunto compacto. El conjunto f rCs es compacto. Demostración. Sea tWλ : λ P Λu una cubierta abierta de f rCs. Por el teorema 14.3.4 la colección tf ´1 rWλ s : λ P Λu es una cubierta abierta de C y por ser C un conjunto compacto existe un conjunto finito tλ1 , λ2 , . . . , λn u Ă Λ tal que tf ´1 rWλ1 s, f ´1 rWλ2 s, . . . , f ´1 rWλn su es una cubierta abierta de C. Ahora, la colección tf rf ´1 rWλ1 ss, f rf ´1 rWλ2 ss, . . . , f rf ´1 rWλn ssu es una cubierta de f rCs y, por el teorema 14.3.1 e), también lo es la colección tWλ1 , Wλ2 , . . . , Wλn u, pero ésta última es un subconjunto finito de tWλ : λ P Λu. ‚ El teorema siguiente es una generalización del teorema del valor máximo 10.5.22. 14.3.6. Teorema. Sean pX, ρq un espacio métrico, C Ă X un conjunto compacto f : C ÝÑ R una función continua (o bien f : X ÝÑ R una función continua en C). Existe un x˚ P C tal que f px˚ q “ máxf rCs. Demostración. Por el teorema 14.3.5, el conjunto f rCs es compacto, por el teorema 14.2.28 es cerrado y acotado, y por el axioma del supremo existe un número real y ˚ tal que y ˚ “ sup f rCs. Veamos ahora que el hecho de que f rCs sea cerrado nos lleva a que y ˚ P f rCs. En efecto, si y ˚ R f rCs, entonces, por ser f rCs cerrado, existiría una bola con centro en y ˚ , en nuestro caso un conjunto de la forma py ˚ ´ ε, y ˚ ` εq, tal que py ˚ ´ ε, y ˚ ` εq X f rCs “ ∅, pero en dicho caso tendríamos que todo y P f rCs satisface la desigualdad y ă y ˚ y también la desigualdad y ĺ y ˚ ´ ε, lo que contradice el hecho de que y ˚ es el supremo de f rCs, por lo tanto y ˚ P f rCs, es decir y ˚ “ máxf rCs. Así, existe un x˚ P C tal que f px˚ q “ y ˚ , es decir tal que f px˚ q “ máxf rCs. ‚ Como consecuencia inmediata de los teoremas 14.3.6 y 14.2.28 tenemos el siguiente corolario. 14.3.7. Corolario. Sea C Ă R un conjunto cerrado y acotado y sea f : C ÝÑ R una función continua. Existe un x˚ P C tal que para todo x P C se tiene que f pxq ĺ f px˚ q. 14.3.8. Corolario. Sean pX, ρq un espacio métrico, C Ă X un conjunto compacto f : C ÝÑ R una función continua (o bien f : X ÝÑ R una función continua en C). Existe un x˚ P C tal que f px˚ q “ mínf rCs. 402 14.3. Funciones en espacios métricos Demostración. El resultado se sigue del teorema 14.3.6, al observar que f es continua si y sólo si ´f es continua y tomar x˚ :“ máxp´f rCsq, lo cual lleva a que x˚ “ mínf rCs. ‚ 14.3.9. Teorema. Sean pX, ρq y pY, ηq dos espacios métricos y f : X ÝÑ Y una función continua. Si E es un subconjunto conexo de X, entonces f rEs es un subconjunto conexo de Y. Demostración. Si f rEs no fuera un subconjunto conexo de Y , entonces existiría un conjunto G Ă f rEs que fuera abierto y cerrado con respecto a la métrica η restringida a f rEsˆf rEs, y que además G ‰ ∅ y G ‰ f rEs. Tendríamos pues que los conjuntos E Xf ´1 rGs y Ezf ´1 rGs serían disjuntos, abiertos y cerrados, y además diferentes de ∅ y de E, por lo que E no sería conexo. ‚ El corolario siguiente es una generalización del teorema del valor intermedio. 14.3.10. Corolario. Sea pX, ρq un espacio métrico conexo y f : X ÝÑ R una función continua. Si x1 , x2 P X son tales que f px1 q ă f px2 q, entonces para todo y0 P pf px1 q; f px2 qq existe un x0 P X tal que f px0 q “ y0 . Demostración. Por el teorema 14.3.9 el conjunto f rXs Ă R es conexo, pero debido al teorema 14.2.18 este conjunto es un intervalo, por lo que si los números f px1 q y f px2 q pertenecen a el, también debe pertenecer cualquier número y0 que esté entre ellos, es decir y0 P f rXs, lo que significa que existe un x0 P X tal que f px0 q “ y0 . ‚ 14.3.11. Corolario. Sea pX, ρq un espacio métrico y E Ă X un conjunto tal que para cualesquiera dos elementos x e y de E existe una función continua f : r0; 1s ÝÑ E tal que f p0q “ x y f p1q “ y. El conjunto E es conexo. Demostración. Si E “ ∅, entonces E es conexo. Si E ‰ ∅, existe un x P E y por hipótesis para cualquier y P E existe una función continua f : r0; 1s ÝÑ E tal que f p0q “ x y f p1q “ y. Como x, y P f rr0; 1ss Ă E y, por los teoremas 14.3.9 y 14.2.8, f rr0; 1ss es conexo y tenemos que x e y pertenecen a la misma componente conexa de E. En general cualquier elemento de E pertenece a la misma componente conexa que x y debido al corolario 14.2.35, la única componente conexa de E es E, teniéndose así que E es un conjunto conexo. ‚ 14.3.12. Teorema. Sean pX, ρq y pY, ηq dos espacios métricos, C Ă X un conjunto compacto y f : C ÝÑ Y una función continua e inyectiva. La función f ´1 : f rCs ÝÑ C es continua. Demostración. Por el teorema 14.2.27 cualquier subconjunto F cerrado de C es compacto y por los teoremas 14.3.5 y 14.2.25 el conjunto f rF s es cerrado. Tenemos así que si pf ´1 q´1 rF s “ f rF s es cerrado, de modo que si usamos el teorema 14.3.4, concluimos que f ´1 es una función continua. ‚ 14.3.13. Teorema. Sean pX, ρq, pY, ηq y pZ, γq tres espacios métricos y sean f : X ÝÑ Y y g : Y ÝÑ Z funciones continuas. La función g ˝ f : X ÝÑ Z es continua. Demostración. El teorema se sigue del teorema 14.3.4 y hecho de que para todo conjunto A Ă Z se tiene que pg ˝ f q´1 rAs “ f ´1 rg ´1 rAss. ‚ 14.3.14. Definición. Dados dos espacios métricos pX, ρq y pZ, ζq, decimos que una función f : X ÝÑ Z es uniformemente continua en un conjunto E Ă X si para todo ε ą 0 existe un δ ą 0 tal que para cualesquiera dos elementos x, y P X se tiene ρpx, yq ă δ ùñ ζpf pxq, f pyqq ă ε. 14.3. Funciones en espacios métricos 403 Cuando una función sea uniformemente continua en todo su dominio, diremos simplemente que es uniformemente continua, sin necesidad de especificar en qué conjunto. 14.3.15. Observación. Notemos que si f es uniformemente continua en E, entonces es continua en E. 14.3.16. Teorema. Sean pX, ρq y pZ, ζq dos espacios métricos. Si C Ă X es un conjunto compacto y f : X ÝÑ Z es continua en C, entonces f es uniformemente continua en C. Demostración. Sea C un subconjunto compacto de X y f : X ÝÑ Z una función continua en C. Para todo ε ą 0 y todo x P C sea δx ą 0 tal que para y P C tenemos que ρpx, yq ă δx ùñ ζpf pxq, f pyqq ă 2ε . Como C es compacto, existe una colec" ˆ ˙ ˆ ˙ ˆ ˙* δx1 δx2 δx n ción finita B x1 , , B x2 , , . . . , B xn , que cubre C, donde cada xi es2 2 2 " * δx1 δx2 δxn tá en C. Ahora, si x, y P C son tales que ρpx, yq ă mín , ,..., y tomamos 2 2 2 * ˆ ˙ " δxn δx i δx1 δx2 , ,..., , entonces, al tomar un i P t1, 2, . . . , nu tal que x P B xi , , δ “ mín 2 2 2 2 δx δx tendremos que ρpxi , yq ĺ ρpxi , xq ` ρpx, yq ă i ` i “ δxi , por lo que ζpf pxq, f pyqq ĺ 2 2 ζpf pxq, f pxi qq ` ζpf pxi q, f pyqq ă 2ε ` 2ε “ ε. Es decir, ρpx, yq ă δ ùñ ζpf pxq, f pyqq ă ε, para x, y P C. ‚ 14.3.17. Definición. Sean pX, ρq y pZ, ζq dos espacios métricos. Siempre que exista una biyección f entre X y Z tal que f : X ÝÑ Z es continua y f ´1 : Z ÝÑ X también es continua, diremos que los espacios métricos pX, ρq y pZ, ζq son homeomorfos y se dice que la función f es un homeomorfismo de espacios métricos. 14.3.18. Observación. Tenemos que si pX, ρq y pZ, ζq son dos espacios métricos y f : X ÝÑ Z es un homeomorfismo sobre Z, entonces un conjunto A Ă X es abierto si y sólo si f rAs es abierto; es cerrado si y sólo si f rAs es cerrado; es compacto si y sólo si f rAs es compacto; es conexo si y sólo si f rAs es conexo; aunque puede suceder que A sea acotado y no lo sea f rAs. 14.3.19. Definición. Sea pX, ρq un espacio métrico. Decimos que una sucesión pxn q de elementos de X converge a un x P X (con respecto a la métrica ρ) si para todo ε ą 0 existe un N P N tal que nľN ùñ ρpxn , xq ă ε. 14.3.20. Observación. Una sucesión converge a x si y sólo si cualquiera de sus subsucesiones converge a x. 14.3.21. Teorema. Sea pX, ρq un espacio métrico, y P X y pxn q una sucesión de elementos de X. Existe una subsucesión de pxn q que converge a y si y sólo si para todo ε ą 0 el conjunto tn P N : ρpxn , yq ă εu es infinito. Demostración. Si existe una subsucesión pxmk q de pxn q que converge a y, entonces para todo ε ą 0 existe un N P N tal que si k ľ N , entonces ρpxmk , yq ă ε, de modo que el conjunto tmk : k ľ N u es infinito, pero tmk : k ľ N u Ă tn P N : ρpxn , yq ă εu, por lo que el conjunto tn P N : ρpxn , yq ă εu también es infinito. 404 14.3. Funciones en espacios métricos Supongamos ahora que para todo ε ą 0 el conjunto tn P N : ρpxn , yq ă εu es infinito. Sea m1 P N tal que ρpxm1 , yq ă 1 y procedamos recursivamente definiendo para cada k P N 1 , lo cual es posible debido a que un mk`1 P N tal que mk`1 ą mk y ρpxmk`1 , yq ă k`1 tn P N : ρpxn , yq ă εu es infinito. Así, si ε ą 0 y N es un número natural mayor que 1ε , al tomar k ľ N tenemos que 1 1 ă ε, ρpxmk , yq ă ĺ k N con lo que la subsucesión pxmk q converge a y. ‚ 14.3.22. Teorema. Sea pX, ρq un espacio métrico compacto y pan q una sucesión (infinita) de elementos de X. Existe una subsucesión de pan q que converge a algún y P X. Demostración. Por el teorema 14.3.21, si x es un elemento de X y ninguna subsucesión de pan q converge a x, entonces para algún rx ą 0 el conjunto tn P N : ρpan , xq ă rx u es finito, por lo que existe un Nx P N tal que si n ľ Nx , entonces ρpan , xq ľ rx , es decir el conjunto tn P N : an P Bpx, rx qu es finito. Así, si la sucesión no converge a ningún elemento de X, entonces para todo x P X el conjunto tn P N : an P Bpx, rx qu es finito para algún rx ą 0. Ahora, como X es compacto, existe una colección finita tBpx1 , rx1 q, . . . , Bpxm , rxm qu que cubre a X, de Ťmmodo que solamente habría una cantidad finita de números naturales n para los cuales an P k“1 Bpxk , rxk q “ X, contradiciendo el hecho de que todas las componentes de la sucesión pan q están en X. ‚ 14.3.23. Teorema. Sean pX, ρq y pZ, ηq espacios métricos y pan q una sucesión de elementos de X. Si la sucesión pan q converge a un a P X y f : X ÝÑ Z es una función continua, entonces la sucesión pf pan qq converge a f paq. Demostración. Supongamos que la sucesión pan q converge a un a P X y que f : X ÝÑ Z es una función continua. Sea ε ą 0. Como f es continua, existe un δ ą 0 tal que para todo x P X se tiene que 14.3.24. ρpx, aq ă δ ùñ ηpf pxq, f paqq ă ε. Ahora, como pan q converge a a, existe un N P N tal que 14.3.25. nľN ùñ ρpan , aq ă δ. De las implicaciones 14.3.25 y 14.3.24 se tiene que la sucesión pf pan qq converge a f paq. ‚ El teorema siguiente es un recíproco del teorema 14.3.22. 14.3.26. Teorema. Sea pX, ρq un espacio métrico. Si toda sucesión de elementos en X tiene una subsucesión que converge a algún elemento de X, entonces X es compacto. Demostración. Sea Ψ una cubierta abierta de X. Demostraremos primero que si toda sucesión de elementos en X tiene una subsucesión convergente, entonces existe un δ ą 0 tal que para cada subconjunto E de X con diámetro menor que δ, existe un elemento de Ψ que incluye a E. Procedamos por contradicción. Supongamos que no existe ningún δ ą 0 tal que todo subconjunto de X con diámetro menor que δ esté incluido en algún elemento de Ψ . Debido a la suposición tenemos que para cada k P N existe un Ck Ă X con diámetro menor que k1 tal que no pertenece a ningún elemento de Ψ . Para cada k P N sea xk P Ck . 14.3. Funciones en espacios métricos 405 Por hipótesis tenemos que alguna subsucesión pxnk q de pxk q converge a algún x P X. Ahora, x pertenece a algún elemento A de la cubierta abierta Ψ , pero como A es abierto, podemos elegir un ε ą 0 tal que Bpx, εq `Ă A. Tomando k suficientemente grande, de tal manera que ˘ ε ε 1 ă 2 , tenemos que Cnk Ă B xnk , 2 . Tomando de nuevo k suficientemente grande, de tal nk manera que ρpxnk , xq ă 2ε , tenemos que Cnk Ă Bpx, εq, por lo que Cnk Ă A, contrario a la manera en que se construyeron los Ck . Demostraremos ahora que si cualquier sucesión de elementos de X tiene una subsucesión que converge a un elemento de X, entonces para todo ε ą 0 existe una cubierta finita de X cuyos elementos son bolas de radio ε. De nuevo procederemos por contradicción. Supongamos que existe un ε ą 0 tal que X no puede ser cubierta por un conjunto finito de bolas de radio ε. Sea x1 P X. De acuerdo a la suposición Bpx1 , εq ‰ X. Sea x2 R Bpx1 , εq y de manera recursiva tomemos para cada n P N un elemento xn`1 P X tal que xn`1 R Bpx1 , εq Y ¨ ¨ ¨ Y Bpxn , εq. Ahora, por construcción tenemos que ρpxn`1 , xk q ľ ε para k P t1, 2, . . . , nu. Así, la sucesión pxn q no puede tener una subsucesión convergente, puesto que cualquier x P X está en alguna bola BpxN , εq, y así ρpx, xk q ľ ε, si k ľ N . Hemos pues demostrado que si en X toda sucesión tiene una subsucesión convergente, entonces puede ser cubierto por un número finito de bolas con un radio fijo arbitrario y además existe un δ ą 0 tal que para cada subconjunto E de X con diámetro menor que δ, existe un elemento de Ψ que incluye a E. Tomando ahora ε “ 3δ , tenemos que para algún M P N existen M bolas Bpx1 , εq, Bpx2 , εq, . . . , BpxM , εq, que cubren X, cada una de las cuales tiene diámetro menor que δ, de modo que para cada k P t1, 2, . . . , M u se tiene que existe un Ak P Ψ tal que Bpxk , εq Ă Ak , teniéndose así que la colección tA1 , A2 , . . . , AM u cubre a X, por lo que X es compacto. ‚ 14.3.27. Definición. Sea pX, ρq un espacio métrico, E un conjunto y para cada n P N sea fn : En ÝÑ X tal que E Ă En . Decimos que la sucesión de funciones pfn q8 n“1 converge puntualmente en E a una función f : F ÝÑ X, con E Ă F , si para cada e P E la sucesión 8 pfn peqq8 n“1 converge a f peq. Cuando cada En “ E decimos simplemente que la sucesión pfn qn“1 converge puntualmente a la función f . Cuando tenemos que para todo ε ą 0 existe un N P N tal que n ľ N ùñ ρpfn peq, f peqq ă ε, para todo e P E, decimos que la sucesión de funciones pfn q8 n“1 converge uniformemente a la función f en el conjunto E o que es uniformemente convergente en E. 14.3.28. Observación. Observemos que si una sucesión de funciones converge uniformemente en un conjunto dado, entonces converge puntualmente en el conjunto dado. 14.3.29. Definición. Sea pX, ρq un espacio métrico. Decimos que una sucesión pxk q8 k“1 de elementos de X es de Cauchy (con respecto a la métrica ρ) si para todo ε ą 0 existe un N P N tal que para todo n ľ N y todo m ľ N se tiene que ρpxn , xm q ă ε. 14.3.30. Teorema. En cualquier espacio métrico toda sucesión convergente es de Cauchy. Demostración. Sea pX, ρq un espacio métrico y supongamos que pxk q8 k“1 es una sucesión convergente en X y sea x el punto al cual converge. Para cualquier ε ą 0 existe un número natural N , tal que k ľ N ùñ ρpxk , xq ă 2ε . Ahora, si m, n ľ N ; entonces ρpxn , xq ă 2ε y 406 14.3. Funciones en espacios métricos ρpxm , xq ă 2ε , por lo que ρpxm , xn q ĺ ρpxm ´ xq ` ρpxn , xq ă sucesión convergente es de Cauchy. ε 2 ` ε 2 “ ε; por lo tanto toda ‚ 8 14.3.31. Teorema. Si pxn q8 n“1 es una sucesión de Cauchy con una subsucesión pxnk qk“1 que converge a x, entonces pxn q8 n“1 converge a x. Demostración. Sea ρ la métrica en cuestión, ε ą 0, M P N tal que si i, j ą M , entonces ρpxi , xj q ă 2ε y además ρpxnj , xq ă 2ε . Tenemos que ρpxi , xq ĺ ρpxi , xnN q`ρpxnN , xq ă 2ε ` 2ε “ ε. ‚ 14.3.32. Definición. Decimos que un espacio métrico pX, ρq es completo si en él toda sucesión de Cauchy es convergente. Como ejemplos de espacios métricos completos tenemos tenemos a los conjuntos de la forma Rn con la métrica euclidiana. 14.3.33. Teorema. Sea pX, ρq un espacio métrico y E Ă X un conjunto cerrado. Si pxk q8 k“1 es una sucesión de elementos de E que converge a algún x P X, entonces x P E. Demostración. Sea V una vecindad de x y sea ε ą 0 tal que Bpx, εq Ă V . Por definición de convergencia, existe un N P N tal que si n ľ N , entonces ρpxn , xq ă ε, por lo que V X E ‰ ∅, de manera que x no está en el interior de XzE, el cual es un conjunto abierto, por lo que x no está en XzE, es decir x P E. ‚ 14.3.34. Teorema. Todo subespacio cerrado de un espacio métrico completo es completo. Demostración. Sea pX, ρq un espacio métrico completo y sea Y Ă X un conjunto cerrado. 8 Sea pyk q8 k“1 una sucesión de Cauchy en Y . Por ser pyk qk“1 una sucesión de Cauchy en X y 8 debido al teorema 14.3.30 tenemos que pyk qk“1 converge a un y P X, y por el teorema 14.3.33 tenemos que y P Y . ‚ 14.3.35. Teorema. Si pX, ρq un espacio métrico, E Ă X y x es un punto de acumulación de E, entonces x P E. Demostración. Como E “ E Y BE tenemos que si x P E, entonces x P E, pero si x R E, entonces, por ser x un punto de acumulación, tenemos que para todo r ą 0 se tiene que Bpx, rq X E ‰ ∅ y además, debido a que x R E se tiene que Bpx, rq X pXzEq ‰ ∅, de manera que x P BE. En todo caso se tiene que x P E. ‚ El teorema 14.3.34 tiene un recíproco. 14.3.36. Teorema. Todo subespacio completo de un espacio métrico completo es cerrado. Demostración. Sea pX, ρq un espacio métrico completo y sea Y Ă X tal que pY, ρq es completo. Sea x P E y veamos que necesariamente x P E. Si x no estuviera en E tendríamos que x P BE y sería un punto de acumulación de E, de manera que tendríamos una sucesión pxn q8 n“1 de elementos de X que converge a x (verificar con detalle esta afirmación). Ahora, por el teorema 14.3.30 tenemos que pxn q8 n“1 es una sucesión de Cauchy, y por definición de espacio métrico completo tenemos que x P E, llegando a una contradicción. ‚ Dejamos al lector el demostrar el siguiente teorema (véanse las demostraciones correspondientes para el caso de funciones en los cuales el dominio y el recorrido son subconjuntos de R). 14.3.37. Teorema. Sea pX, ρq un espacio métrico, sean f : X ÝÑ R y g : X ÝÑ R funciones continuas, y sea α P R: 14.3. Funciones en espacios métricos 407 a) La función f ` g, dada por pf ` gqpxq “ f pxq ` gpxq, es continua. b) La función αf , dada por pαf qpxq “ αf pxq, es continua. c) La función f g, dada por pf gqpxq “ f pxqgpxq, es continua. d) La función f {g, dada por pf {gqpxq “ f pxq , gpxq es continua en todo x tal que gpxq ‰ 0. 14.3.38. Notación. Sea pX, ρq un espacio métrico, E Ă X y x P X. Denotaremos por ρpx, Eq al número ínf tρpx, eq : e P Eu. 14.3.39. Teorema. Sea pX, ρq un espacio métrico y E Ă X. La función f : X ÝÑ r0; `8q xÞÑρpx,Eq es uniformemente continua. Demostración. Sean ε ą 0 y x, y P X tales que ρpx, yq ă 4ε . En el caso en que f pxq ĺ f pyq tomemos e P E tal que ρpx, eq ĺ f pxq ` 4ε , de manera que f pyq ĺ ρpy, eq ĺ ρpx, yq ` ρpx, eq ă ε ´ ε¯ ε ` f pxq ` “ f pxq ` , 4 4 2 por lo cual |f pxq´f pyq| “ f pyq´f pxq ă ε. De manera análoga podemos ver que si f pxq ą f pyq entonces |f pxq ´ f pyq| “ f pyq ´ f pxq ă ε. ‚ 14.3.40. Teorema del número de Lebesgue. Sea A una cubierta abierta de un espacio métrico compacto pX, ρq. Existe un número δ ą 0 tal que cualquier subconjunto de X con diámetro menor que δ está incluido en algún elemento de A. Demostración. En el caso en que X P A el resultado se cumple de manera obvia. Demostremos el teorema para el caso en que X R A. Sea tA1 , A2 , . . . , An u Ă A una subcubierta finita con n elementos, y para cada k P t1, 2, . . . , nu sea Ek “ XzAk . Como X es compacto y cada Ek es cerrado, entonces cada Ek es compacto. Sea f : X ÝÑ p0; `8q la función dada por n 1 ÿ f pxq “ ρpx, Ek q, n k“1 la cual es continua debido a los teoremas 14.3.37 y 14.3.39. Para cada x P X y cada Ak tal que x P Ak sea εx,k ą 0 tal que Bpx, εx,k q Ă Ak , de manera que ρpx, Ek q ľ εx,k . Sea εx “ míntεx,k : x P Ak u y observemos que f pxq ľ εnx ą 0. Como f es continua, por el corolario 14.3.8 se tiene que el conjunto f rXs tiene un valor mínimo δ, y por lo anterior tenemos que δ ą 0. Sea B Ă X un conjunto con diámetro menor que δ. En caso de que B “ ∅ tenemos que B está incluido en cualquier Ak . Veamos el caso en que B ‰ ∅ y tomemos b P B. Sea k0 P t1, 2, . . . , nu tal que ρpb, Ek0 q “ máxtρpb, Ek q : k P t1, 2, . . . , nuu para obtener δ ĺ f pbq ĺ ρpb, Ex0 q, 408 14.3. Funciones en espacios métricos de manera que B Ă Bpb, δq Ă Ak0 P A. ‚ 14.3.41. Definición. Al número δ dado en el teorema 14.3.40 se le llama número de Lebesgue de la cubierta A. 14.3.42. Teorema. Sean pX, ρq un espacio métrico compacto, pY, ηq un espacio métrico y Z el conjunto de funciones continuas de X en Y . La función β : Z ˆ Z ÝÑ R dada por βpf, gq :“ máxtηpf pxq, gpxqq : x P Xu está bien definida y es una métrica en Z. Demostración. Demostremos primero que β está bien definida, es decir que para cualquier dos funciones continuas f, g P Z el conjunto tηpf pxq, gpxqq : x P Xu es acotado superiormente y que existe un c P X tal que ηpf pcq, gpcqqq “ suptηpf pxq, gpxqq : x P Xu. Supongamos primero que tηpf pxq, gpxqq : x P Xu no es acotado superiormente y para cada k P N sea xk P X 8 tal que ηpf pxk q, gpxk qq ą k, del teorema 14.3.22 existe una subsucesión puk q8 k“1 de pxk qk“1 que converge a algún punto x0 P X y tómese dicha subsucesión de tal manera que ρpx0 , uk q ă k1 observando que ηpf puk q, gpuk qq ą k. Sea M “ ηpf px0 q, gpx0 qq y N P N suficientemente grande de manera tal que si k ľ N entonces ηpf puk q, f px0 qq ă 1 y ηpgpuk q, gpx0 qq ă 1. De la desigualdad del triángulo tenemos que ηpgpuk q, f puk qq ĺ ηpgpuk q, gpx0 qq ` ηpgpx0 q, f px0 qq ` ηpf px0 , f puk qq ă M ` 2, pero si k ą M ` 2 tenemos que ηpgpuk q, f puk qq ą M ` 2, llegando así a una contradicción y concluyendo que el conjunto tηpf pxq, gpxqq : x P Xu es acotado superiormente. Llamémosle C al supremo de tηpf pxq, gpxqq : x P Xu y sea pwk q8 k“1 una sucesión convergente en X tal 8 que pηpf pwk q, gpwk qqqk“1 sea una sucesión que converja a C. Sea c el punto al cual converge la sucesión pwk q8 k“1 y veamos que ηpf pcq, gpcqq “ C. Sea ε ą 0 y tomemos k suficientemente grande de tal manera que ηpf pcq, f pwk qq ă ε y ηpgpcq, gpwk qq ă ε, de tal suerte que ηpf pwk q, gpwk qq ĺ ηpf pwk q, f pcqq ` ηpf pcq, gpcqq ` ηpgpcq, gpwk q ă ηpf pcq, gpcqq ` 2ε, de manera que al hacer tender k al infinito y luego ε a cero tenemos que C ĺ ηpf pcq, gpcqq, pero como C no puede ser menor que ηpf pcq, gpcqq tenemos que necesariamente ηpf pcq, gpcqq “ C. Habiendo demostrado ya que β está bien definida, demostremos ahora que es una métrica en Z. Sean f , g y h elementos de Z. Si f “ g, entonces βpf, gq “ βpf, f q “ máxtηpf pxq, f pxqq : x P Xu “ máxt0u “ 0, pero si f ‰ g existe un x P X tal que f pxq ‰ gpxq, de manera que ηpf pxq, gpxqq ą 0, y así βpf, gq ľ ηpf pxq, gpxqq ą 0; es decir βpf, gq “ 0 si y sólo si f “ g. Obviamente se tiene que βpf, gq “ βpg, f q, quedando por demostrar solamente que βpf, gq ĺ βpf, hq ` βph, gq. Sea r P X tal que βpf, gq “ ηpf prq, gprqq. Tenemos que βpf, gq “ ηpf prq, gprqq ĺ ηpf prq, hprqq ` ηphprq, gprqq ĺ βpf, hq ` βph, gq, con lo cual el teorema queda demostrado. ‚ 14.3.43. Definición. A la métrica β dada en el teorema 14.3.42 se le llama métrica del supremo. 14.3.44. Notación. En el teorema 14.3.42 cuando Y sea Rn con la métrica euclidiana, a la 14.3. Funciones en espacios métricos 409 métrica del supremo evaluada en pf, gq la denotaremos por }f ´ g}8 , y en el caso de que g sea la función constante 0 se le denotará por }f }8 . 14.3.45. Definición. Sea pX, ρq un espacio métrico. Decimos que un conjunto D Ă X es denso (con respecto a la métrica ρ) si cualquier conjunto abierto no vacío interseca a D, es decir si D “ X. En el caso en que tengamos D Ă Y Ă X, decimos que D es denso en Y si es denso con respecto al espacio métrico pY, ρq. 14.3.46. Teorema de categoría de Baire. Sea pX, ρq un espacio métrico completo y 8 Ş pUk q8 una sucesión de subconjuntos de X que son abiertos y densos. El conjunto Uk es k“1 k“1 también denso en X. Demostración. Sea x0 P X y r0 ą 0. Observemos que es suficiente demostrar que existe 8 Ş un x P Bpx0 , r0 q que pertenece al conjunto Uk . k“1 Como U1 es denso en X, existe un x1 P U1 tal que ρpx0 , x1 q ă ε, pero como además U1 es abierto, existe un r1 ą 0 tal que Bpx1 , r1 q Ă U1 . Tomemos el valor de r1 suficientemente pequeño para que además se satisfaga que r1 ă 1 y Bpx1 , r1 q Ă U1 X Bpx0 , r0 q. Con un argumento similar, tomando x1 en lugar de x0 y r1 en lugar de r0 , tenemos que existe un x2 P X y un r2 P p0; 12 q tal que Bpx2 , r2 q Ă U2 X Bpx1 , r1 q. Así, de manera recursiva podemos 8 definir una sucesión pxk q8 k“1 de elementos de X y una sucesión de radios prk qk“1 de tal manera que 0 ă rk ă k1 y Bpxk , rk q Ă Uk X Bpxk´1 , rk´1 q; 14.3.47. en particular tenemos 14.3.48. Bpxk`1 , rk`1 q Ă Bpxk , rk q Ă Bpxk´1 , rk´1 q Ă Bpx0 , r0 q. De la propiedad 14.3.48 tenemos que para enteros positivos m y n, con m ą n, resulta que xm P Bpxn , rn q, de manera que ρpxm , xn q ă rn , pero rn tiende a 0 cuando n tiende a 8, teniendo así que pxk q8 k“1 es una sucesión de Cauchy. Ahora, como el espacio métrico pX, ρq es completo entonces la sucesión pxk q8 k“1 converge a un x P X. Del teorema 14.3.33 y del hecho de que para todo n P N la sucesión pxk q8 k“n tiene sus componentes en Bpxn , rn q y converge a x, tenemos que x P Bpxn , rn q para todo n P N, de manera que al usar la propiedad 14.3.47 8 Ş obtenemos que x P Un para todo n P N, es decir x P Uk . ‚ k“1 14.3.49. Definiciones y notaciones. Sea pX, ρq un espacio métrico. Decimos que un conjunto C Ă X es un Fσ (pronúnciese «efe sigma»), si es una unión numerable de conjuntos cerrados. Decimos que un conjunto A Ă X es un Gδ (pronúnciese «ge delta»), si es una intersección numerable de conjuntos abiertos. Al conjunto de todos los subconjuntos de X que sean Fσ lo denotaremos por Fσ pXq, o por Fσ pX; ρq si se quiere ser más específico. Al conjunto de todos los subconjuntos de X que sean Gδ lo denotaremos por Gδ pXq, o por Gσ pX; ρq si se quiere ser más específico. El teorema de categoría de Baire se puede reformular de la manera siguiente. 14.3.50. Corolario. Sea pX, ρq un espacio métrico completo y pUk q8 k“1 una sucesión de 8 Ş subconjuntos de X que son Gδ y densos. El conjunto Uk es también denso en X. k“1 410 14.3. Funciones en espacios métricos Demostración. El resultado se sigue del hecho de que la intersección numerable de conjuntos Gδ y densos es una intersección numerable de conjuntos abiertos y densos, y del teorema de categoría de Baire 14.3.46. 14.3.51. Definiciones. Sea pX, ρq un espacio métrico. Decimos que un conjunto E Ă X es diseminado o nunca denso si E no incluye ningún subconjunto abierto no vacío de X. Decimos que un conjunto es de la primera categoría de Baire si es unión numerable de conjuntos diseminados. Decimos que un subconjunto de X es de la segunda categoría de Baire cuando no es de la primera categoría de Baire. Otra versión del teorema de categoría de Baire es el corolario siguiente que explica el nombre de dicho teorema. 14.3.52. Corolario. Sea pX, ρq un espacio métrico completo. El conjunto X es de la segunda categoría de Baire. Demostración. Tenemos que si E Ă X es un conjunto diseminado, entonces E también es diseminado. Tenemos además que XzE es denso, en efecto, si no fuera denso existiría un x P X y un r ą 0 tal que Bpx, rq X pXzEq “ ∅, es decir Bpx, rq Ă E, contradiciendo el hecho de que E es diseminado. Ahora, sea pEk q8 k“1 una sucesión de conjuntos diseminados y veamos que no 8 8 Ť Ş es posible que X “ Ek . Tenemos del teorema de categoría de Baire 14.3.46 que pXzEk q k“1 k“1 es denso, en particular es no vacío, de donde concluimos que 8 Ş pXzEk q “ Xz k“1 haciendo imposible que X “ 8 Ť Ek , pues ∅ no es denso. 8 Ť Ek es denso, k“1 ‚ k“1 Ejercicios. 1. Demostrar que si pX, ρq es un espacio métrico y A Ă X, entonces A es un Fσ si y sólo si XzA es un Gδ . 14.4. Espacios topológicos 14.4. 411 Espacios topológicos Muchas de las propiedades y resultados de los espacios métricos, más que depender de la métrica dependen de la topología inducida por la métrica, por lo que es más conveniente abordar los problemas en base a la estructura de los conjuntos abiertos que en base a la métrica. En esta sección generalizaremos varios conceptos dados en los espacios métricos como lo es el de conjunto abierto. En el caso en que tenemos un espacio métrico, los conjuntos abiertos satisfacen las 3 propiedades dadas en el teorema 14.2.10. Esas 3 propiedades son las que motivan la definición de espacio topológico. 14.4.1. Definición. Sea X un conjunto y T una colección de subconjuntos de X con las siguientes propiedades: I) X, ∅ P T. II) Si A, B P T, entonces A X B P T. III) Si tAλ uλPΛ es una colección de elementos de T, entonces Ť Aλ P T. λPΛ Decimos que el conjunto T es una topología del conjunto X y que la pareja pX, Tq es un espacio topológico. El ejemplo típico de una topología es la topología inducida por una métrica, es decir es el conjunto de todos los conjuntos abiertos de un espacio métrico (tal conjunto es una topología debido al teorema 14.2.10). 14.4.2. Definición. Sea pX, Tq un espacio topológico. Diremos que cualquier elemento de T es un conjunto abierto (con respecto a la topología T ó con respecto al espacio topológico pX, Tq). 14.4.3. Observación. Aclaramos que cuando se hable de conjunto abierto siempre se debe tener presente con respecto a qué topología lo es, de otro modo deberemos especificarlo, pues un conjunto puede ser abierto con respecto a una topología y no serlo con respecto a otra. 14.4.4. Definición. Sea pX, Tq un espacio topológico. Diremos que un subconjunto C de X es un conjunto cerrado si existe un conjunto abierto A P T tal que C “ XzA. Observemos que en un espacio topológico pX, Tq tanto X como ∅ son conjuntos cerrados. Como consecuencia directa de las definiciones de conjuntos abiertos y cerrados tenemos el siguiente teorema. 14.4.5. Teorema. Sea pX, Tq un espacio topológico. a) Si tF1 , F2 , . . . , Fk u es una colección finita de conjuntos cerrados, entonces F1 Y F2 Y ¨ ¨ ¨ Y Fk es un conjunto cerrado. b) Si tFλ uλPΛ es una colección de conjuntos cerrados, entonces Ş λPΛ rrado. Fλ es un conjunto ce- 412 14.4. Espacios topológicos 14.4.6. Definición. Dado un espacio topológico pX, Tq e Y Ă X, podemos observar que el conjunto T|Y :“ tD : D “ A X Y para algún A P Tu es una topología. En tal caso diremos que el espacio topológico pY, T|Y q es un subespacio topológico de pX, Tq y a la topología T|Y le llamamos topología relativa a Y . 14.4.7. Definición. Sea pX, Tq un espacio topológico. Si la topología T es la topología inducida por una métrica, decimos que el espacio topológico pX, Tq es metrizable (o que la topología T es metrizable). 14.4.8. Definición. Dada una topología T, decimos que una colección de conjuntos B Ă T es una base de T si cualquier abierto es la unión de los elementos de unŤsubconjunto de B. No será necesario que ∅ P B para que B sea una base de T pues ∅ “ A. AP∅ 14.4.9. Ejemplo. Como ejemplo de base de una topología, tenemos que cuando T es la topología inducida por una métrica, el conjunto de todas las bolas abiertas relativas a la métrica es una base de T. 14.4.10. Observación. Para que una colección B de subconjuntos de algún conjunto X sea una base de alguna topología de X es necesario y suficiente que la intersección de Ť dos B. elementos de B sea la unión de los elementos de un subconjunto de B y además X “ BPB 14.4.11. Definición. Dada una topología T, decimos que una colección de conjuntos S Ă T es una subbase de T si el conjunto de las intersecciones finitas de elementos de S es una base de T. 14.4.12. Observación. Si tenemosŞuna colección de topologías tTλ uλPΛ de un conjunto X, la intersección de estas topologías Tλ es a su vez una topología de X. Tenemos también λPΛ que dada una colección S de subconjuntos de un conjunto X, siempre existe al menos una topología de X que incluye a S, a saber la topología dada por el conjunto potencia de X. 14.4.13. Definición. Dado un conjunto X y una colección S de subconjuntos de X. A la intersección de todas las topologías de X que incluyen a S se le llama topología de X generada por S. Es decir, la topología generada por S es la topología que incluye a S y que además está incluida en cualquier topología que incluye a S. 14.4.14. Definición. Dado un espacio topológico pX, Tq y x P X. Cualquier abierto V tal que x P V se llama vecindad de x. Una colección U de vecindades de x se llama base local de x si para cualquier vecindad V de x, existe un U P U tal que U Ă V . Generalicemos algo de los conceptos dados para espacios métricos. 14.4.15. Notación. Dado unŞespacio topológico pX, Tq y B Ă X. A la cerradura de B se le define y denota como B :“ tC : C es cerrado y B Ă Cu. La frontera de B que también se denota por BB es el conjunto de todos los x P X tales que cualquier vecindad V de x es ˝ tal que V X B ‰ ∅ y V X pXzBq ‰ ∅. Así mismo el interior de B, que se denota B, es la unión de todos los conjuntos abiertos que están incluidos en B. ˝ 14.4.16. Observación. Es claro que B es un conjunto abierto, B y BB son conjuntos ˝ ˝ ˝ cerrados, y además B Ă B Ă B “ B Y BB, donde B X BB “ ∅. 14.4.17. Definición. Dado un espacio topológico pX, Tq y B Ă X. Decimos que un elemento 14.4. Espacios topológicos 413 x de X es un punto de acumulación de B si para cualquier vecindad V de x se tiene que pV ztxuq X B ‰ ∅. Decimos que x es un punto aislado de B si x P B pero no es punto de acumulación de B. Definimos así mismo el exterior de B como el conjunto de todos los elementos de X que no están en B ni en su frontera, es decir un punto x está en el exterior de B si no está en B ni es punto de acumulación de B. 14.4.18. Definición. Si pX, Tq es un espacio topológico, a cualquier elemento de X se le llama punto. En general si X es un conjunto que tiene una estructura que se le llame «espacio», a los elementos de X se les llama puntos. La demostración del teorema siguiente es similar a la del teorema 14.2.16 y se dejan los detalles de la misma al lector. 14.4.19. Teorema. Sea pX, Tq un espacio topológico y A, B Ă X. ˝ a) A es abierto si y sólo si A “ A. b) A es cerrado si y sólo si A “ A. ˝ ˝ c) A “ XzpXzAq; A “ XzintpXzAq; BA “ AzA. d) pA Y Bq “ A Y B. El concepto de conexidad en espacios topológicos es análogo al de conexidad en espacios métricos y se define a continuación. 14.4.20. Definición. Un espacio topológico pX, Tq se dice que es conexo cuando los únicos subconjuntos de X que son abiertos y cerrados a la vez son X y ∅. Por otro lado, si pX, Tq es un espacio topológico, decimos que un conjunto E Ă X es conexo cuando el espacio topológico pE, T|Eq es conexo. 14.4.21. Observación. Observemos que el conjunto E es conexo si y sólo si no existen conjuntos no vacíos A, B Ă E tales que A Y B “ E, A X B “ ∅ y A X B “ ∅. La demostración del teorema siguiente es similar a la del teorema 14.2.33. Ş 14.4.22. Teorema. Sea pX, Tq un espacio topológico. Si x P Eλ , donde los Eλ son λPΛ Ť subconjuntos conexos de X para λ P Λ, entonces Eλ es conexo. λPΛ 14.4.23. Definición. Sea pX, T un espacio topológico, E Ă X y x P E. A la unión de todos los subconjuntos conexos a los cuales pertenece x y que están incluidos en E se le llama componente conexa de E. El corolario siguiente se deduce del teorema 14.4.22 y de la definición de componente conexa. 14.4.24. Corolario. Las componentes conexas de un conjunto E son conjuntos conexos y la colección de componentes conexas de un conjunto es una partición en clases de equivalencia de E. 414 14.4. Espacios topológicos Establezcamos ahora el concepto de compacidad, el cual es similar al dado en espacios métricos. 14.4.25. Definición. Sea pX, Tq un espacio topológico y E ŤĂ X. Se dice que una colección Ψ de subconjuntos de X es una cubierta de E si E Ă A. En caso de que Ψ sea una APΨ cubierta de E y que todos los elementos de Ψ sean abiertos, decimos que Ψ es una cubierta abierta de E. Cuando una colección Ψ es una cubierta de E, decimos que Ψ cubre a E. 14.4.26. Definición. Sea pX, Tq un espacio topológico y E Ă X. Decimos que E es compacto, si toda cubierta abierta Ψ del conjunto E tiene una subcubierta abierta finita Ψ 1 Ă Ψ , es decir existe una colección Ψ 1 que es subconjunto finito de Ψ y que es una cubierta de E. En el caso de que X sea compacto decimos que el espacio topológico pX, Tq es compacto. 14.4.27. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es T1 o de Fréchet si para cualesquiera dos elementos diferentes x, y P X se tiene que existe una vecindad V de y tal que x R V . 14.4.28. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es T0 o de Kolmogórov si para cualesquiera dos elementos diferentes x, y P X se tiene que existe una vecindad V de y tal que x R V o bien existe una vecindad U de x tal que y R U . 14.4.29. Observación. Un espacio topológico pX, Tq es T1 si y sólo si cada conjunto con un solo elemento txu (con x P X) es un conjunto cerrado. En efecto, si pX, Tq es T1 y x P X, tomemos para cada y P XŤdiferente de x una vecindad Vy de y tal que txu Y Vy ‰ ∅, para tener así que Xztxu “ Vy es abierto, es decir txu es cerrado. Recíprocamente, si para yPXztxu todo x P X el conjunto txu es cerrado e y P Xztxu, tenemos que Xztxu es una vecindad de y que no interseca a txu, por lo que el espacio topológico es T1 . Como podemos ver, todos los espacios topológicos inducidos por espacios métricos son T1 . Tenemos que todos los espacios métricos satisfacen además la propiedad dada en la definición siguiente. 14.4.30. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es de Hausdorff ó T2 si para cualesquiera dos elementos diferentes x, y P X existen vecindades V y W de x y de y respectivamente tales que V X W “ ∅. En lugar de decir «espacio topológico de Hausdorff» diremos simplemente «espacio de Hausdorff». Para dar un ejemplo de un espacio topológico que sea T1 pero no sea T2 , tomemos un conjunto infinito X y definamos T como la colección compuesta del conjunto vacío y todos los conjuntos A Ă X tales que XzA es finito. Como podemos ver, el espacio topológico pX, Tq es T1 pero no es T2 . Generalmente el interés de los espacios T0 que no sean T1 no va más allá de la mera curiosidad, por lo que no serán estudiados en este libro. 14.4.31. Teorema. Sea pX, Tq un espacio de Hausdorff y C Ă X un conjunto compacto. El conjunto C es cerrado. Demostración. Sea x P X tal que x R C y veamos que x no es punto de acumulación de C. Por ser T una topología de Hausdorff, tomemos para cada y P C una vecindad Vy de y y una vecindad Uy de x tales que Vy X Uy “ ∅. Tenemos que la colección tVy : y P Cu es una cubierta abierta de C, por lo que existe una subcolección finita tVyk : k P Jn u con 14.4. Espacios topológicos n P N y cada yk P C tal que C Ă 415 n Ť k“1 Vyk . Ahora, Wx :“ n Ş Uk es un conjunto abierto que k“1 no interseca a C y al cual pertenece x, por lo que x no es un punto de acumulación de C. Tenemos puesŤque para todo x R C, existe una vecindad Wx que no interseca a C, de modo que XzC “ Wx es un conjunto abierto, por lo que C es cerrado. ‚ xPXzC 14.4.32. Teorema. Sea pX, Tq un espacio topológico, C Ă X un conjunto cerrado y K Ă X un conjunto compacto. El conjunto K X C es compacto. Demostración. Tomemos una cubierta abierta tAλ : λ P Λu del conjunto K X C y observemos que tAλ : λ P Λu Y tXzCu es una cubierta abierta de K. Como K es compacto, existe una cubierta abierta finita de K de la forma tAλ1 , Aλ2 , . . . , Aλn , XzCu, con cada λk P Λ. Ahora, la colección tAλ1 , Aλ2 , . . . , Aλn u es una subcolección finita de tAλ : λ P Λu que cubre K X C, demostrando así que K X C es compacto. ‚ Veamos a continuación el concepto de continuidad en espacios topológicos y su relación con los conceptos de compacidad y conexidad. 14.4.33. Definición. Sean pX, T1 q y pY, T2 q dos espacios topológicos y f : X ÝÑ Y una función. Decimos que la función f es continua (con respecto a las topologías T1 y T2 ) si para cualquier conjunto U P T2 se tiene que f ´1 rU s P T1 . Es decir, la función f es continua si la imagen inversa de cualquier conjunto abierto es un conjunto abierto. Observemos que de acuerdo al teorema 14.3.4 la definición anterior es consistente con la definición de continuidad en espacios métricos. Tenemos el siguiente teorema que caracteriza a las funciones continuas en los espacios topológicos. 14.4.34. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos y f : X ÝÑ Y . Las siguientes propiedades son equivalentes: a) La función f es continua. b) Para todo conjunto cerrado Z Ă Y se tiene que f ´1 rZs es un subconjunto cerrado de X. c) Para todo x P X y toda vecindad V de f pxq existe una vecindad U de x tal que f rU s Ă V . Demostración. Demostremos primero que a) ùñ b). Si Z Ă Y es cerrado, entonces Y zZ es abierto, y si además f es continua, entonces f ´1 rY zZs “ Xzf ´1 rZs es abierto, por lo que f ´1 rZs es cerrado. De manera similar se demuestra que b) ùñ a). Para demostrar que a) ùñ c) basta con tomar U “ f ´1 rV s. Veamos ahora que c) ùñ a). Supongamos que se satisface c) sea V Ă Y un conjunto abierto. Ť Para cada x P f ´1 rV s sea Ux una vecindad de x tal que f rUx s Ă V . Tomando U “ Ux tenemos que U es abierto y además U “ f ´1 rV s, concluyendo que f es xPf ´1 rV s continua. ‚ 416 14.4. Espacios topológicos La demostración del teorema siguiente es igual que la del teorema 14.3.5 en espacios métricos. 14.4.35. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos, f : X ÝÑ Y una función continua y C Ă X un conjunto compacto. El conjunto f rCs es compacto. La demostración del siguiente teorema es análoga a la del teorema 14.3.6, el único cambio que es necesario hacer en la demostración es cambiar la referencia al teorema 14.3.5 por una referencia al teorema 14.4.34. 14.4.36. Teorema. Sean pX, Tq un espacio topológico, C Ă X un conjunto compacto f : C ÝÑ R una función continua (o bien f : X ÝÑ R una función continua en C). Existe un x˚ P C tal que f px˚ q “ máxf rCs. 14.4.37. Corolario. Sean pX, Tq un espacio topológico, C Ă X un conjunto compacto f : C ÝÑ R una función continua (o bien f : X ÝÑ R una función continua en C). Existe un x˚ P C tal que f px˚ q “ mínf rCs. Demostración. El resultado se sigue del teorema 14.4.36, al observar que f es continua si y sólo si ´f es continua y tomar x˚ :“ máxp´f rCsq, lo cual lleva a que x˚ “ mínf rCs. ‚ 14.4.38. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos y f : X ÝÑ Y una función continua. Si E es un subconjunto conexo de X, entonces f rEs es un subconjunto conexo de Y . Demostración. Si f rEs no fuera un subconjunto conexo de Y , entonces existiría un conjunto G Ă f rEs que fuera abierto y cerrado con respecto a la topología T2 |f rEs y además G ‰ ∅ y G ‰ f rEs. Tendríamos pues que los conjuntos E X f ´1 rGs y Ezf ´1 rGs serían disjuntos, abiertos y cerrados, y además diferentes de ∅ y de E, por lo que E no sería conexo. ‚ El corolario siguiente es una generalización del teorema del valor intermedio para espacios topológicos. 14.4.39. Corolario. Sea pX, Tq un espacio topológico conexo y f : X ÝÑ R una función continua. Si x1 , x2 P X son tales que f px1 q ă f px2 q, entonces para todo y0 P pf px1 q; f px2 qq existe un x0 P X tal que f px0 q “ y0 . Demostración. Por el teorema 14.4.38 el conjunto f rXs Ă R es conexo, pero debido al teorema 14.2.18 este conjunto es un intervalo, por lo que si los números f px1 q y f px2 q pertenecen a él, también debe pertenecer cualquier número y0 que esté entre ellos, es decir y0 P f rXs, lo que significa que existe un x0 P X tal que f px0 q “ y0 . ‚ 14.4.40. Corolario. Sea pX, Tq un espacio topológico y E Ă X un conjunto tal que para cualesquiera dos elementos x e y de E existe una función continua f : r0; 1s ÝÑ E tal que f p0q “ x y f p1q “ y. El conjunto E es conexo. Demostración. Si E “ ∅, entonces E es conexo. Si E ‰ ∅, existe un x P E y por hipótesis para cualquier y P E existe una función continua f : r0; 1s ÝÑ E tal que f p0q “ x y f p1q “ y. Como x, y P f rr0; 1ss Ă E y, por los teoremas 14.4.38 y 14.4.18, f rr0; 1ss es conexo y tenemos que x e y pertenecen a la misma componente conexa de E. En general cualquier elemento de E pertenece a la misma componente conexa que x y debido al corolario 14.4.24, la única componente conexa de E es E, teniéndose así que E es un conjunto conexo. ‚ 14.4. Espacios topológicos 417 A continuación daremos algo de terminología de problemas de optimización. 14.4.41. Definiciones. Cuando pX, Tq un espacio topológico y tenemos una función f : X ÝÑ R, de la cual deseamos conocer un valor b P X tal que f pbq “ mínf rXs o bien f pbq “ máxf rXs, decimos que estamos en un problema de optimización (problema de minimización o problema de maximización según sea el caso) y se dice que f es la función objetivo del problema de optimización. Cuando b satisface la ecuación f pbq “ mínf rXs decimos que b es una solución mínima del problema, mientras que cuando satisface f pbq “ máxf rXs decimos que es una solución máxima. Una solución óptima de un problema de optimización es una solución mínima cuando el problema es de minimización, mientras que es una solución máxima cuando el problema es de maximización. Si A P T, es decir si A es un subconjunto abierto de X, y a P A es un óptimo de la función f |A, decimos que a es un óptimo local u óptimo relativo de la función f (máximo local o mínimo local según sea el caso). Cuando deseamos que los elementos donde se desea evaluar la función objetivo f , además de pertenecer a X, satisfaga los unos predicados p1 , p2 , . . . , pn , tenemos el problema de optimización, donde la función objetivo es la función restringida f |D, donde D “ tx P X : p1 pxq, p2 pxq, . . . , pn pxq. Tenemos así un nuevo problema de optimización que suele llamarse problema de optimización con restricciones. A las proposiciones de la forma pi pxq tales que i P t1, 2, . . . , nu (donde x es una variable libre) se les llama restricciones del problema de optimización, a los elementos del conjunto D se les llama soluciones factibles del problema. 14.4.42. Teorema. Sean pX, T1 q un espacio topológico y pY, T2 q un espacio de Hausdorff, C Ă X un conjunto compacto y f : C ÝÑ Y una función continua e inyectiva. La función f ´1 : f rCs ÝÑ C es continua. Demostración. Por el teorema 14.4.32 cualquier subconjunto F cerrado de C es compacto y por los teoremas 14.4.35 y 14.4.31 el conjunto f rF s es cerrado. Tenemos así que si pf ´1 q´1 rF s “ f rF s es cerrado, de modo que si usamos el teorema 14.4.34 b), concluimos que f ´1 es una función continua. ‚ 14.4.43. Teorema. Sean pX, T1 q, pY, T2 q y pZ, T3 q tres espacios topológicos y sean f : X ÝÑ Y y g : Y ÝÑ Z funciones continuas. La función g ˝ f : X ÝÑ Z es continua. Demostración. El teorema se sigue de la definición de continuidad en espacios topológicos y del hecho de que para todo conjunto A Ă Z se tiene que pg ˝ f q´1 rAs “ f ´1 rg ´1 rAss. ‚ Establezcamos ahora el concepto de convergencia de sucesiones en espacios topológicos. 14.4.44. Definición. Sea pX, Tq un espacio topológico y pan q8 n“1 una sucesión de elementos 8 de X. Decimos que la sucesión pan qn“1 converge a un x P X si para toda vecindad V de x existe un N P N tal que si n ľ N , entonces an P V . 14.4.45. Teorema. Sea pX, Tq un espacio topológico x P X y B una base local de x. Una sucesión pan q8 n“1 de elementos de X converge a x P X si y sólo si para todo B P B existe un N P N tal que si n ľ N , entonces an P B. Demostración. Por definición se tiene que si pan q8 n“1 converge a x, entonces para todo B P B existe un N P N tal que si n ľ N , entonces an P B. 418 14.4. Espacios topológicos Supongamos que para todo B P B existe un N P N tal que si n ľ N , entonces an P B. Sea V una vecindad de x, por definición de base local, existe un B P B tal que B Ă V y por hipótesis existe un N P N tal que si n ľ N , entonces an P B, pero el hecho de que an P B ‚ implica que an P V , de modo que pan q8 n“1 converge a x. 14.4.46. Observación. Debido al teorema 14.4.45, la definición anterior de convergencia es consistente con la definición de convergencia en espacios métricos al tomar como base local de un punto x al conjunto de todas las bolas abiertas con centro en x. 14.4.47. Definición. Decimos que un espacio topológico pX, Tq es primero numerable si todo elemento de X tiene una base local numerable y decimos que es segundo numerable si la topología T tiene una base numerable. Tenemos que todo espacio métrico pX, dq induce un espacio topológico primero numerable. En efecto, es suficiente tomar como base local de cada x P X a la colección de todas las bolas abiertas con centro en x y radio racional positivo. Tenemos así el siguiente teorema. 14.4.48. Teorema. Todo espacio métrico induce un espacio topológico primero numerable. 14.4.49. Teorema. Sea pX, Tq un espacio topológico primero numerable, x P X y pan q8 n“1 una sucesión de elementos de X. La sucesión pan q8 tiene una subsucesión que converge ax n“1 si y sólo si para toda vecindad V de x el conjunto tn P N : an P V u es un conjunto infinito. 8 Demostración. Supongamos primero que pan q8 n“1 tiene una subsucesión pank qk“1 que converge a x. Sea V una vecindad de x y sea m un número natural tal que ank P V para todo k ľ m. Tenemos que tnk : k ľ mu Ă tn P N : an P V u, y como tnk : k ľ mu es un conjunto infinito, entonces también lo es tn P N : an P V u. Supongamos ahora que para Ť toda vecindad V de x el conjunto tn P N : an P V u es un conjunto infinito y sea B “ tBj u una base local de x que sea numerable. Analicemos jPN Ş primero el caso en que B :“ B P B. Definamos en este caso n1 como el primer número natural tal que an1 P B y definamos recursivamente nk`1 como el primer número natural mayor que nk tal que ank`1 P B. Tenemos así que para toda vecindad V de x, ank P B Ă V , para todo k P N, de modo que la subsucesión pank q8 k“1 converge a x. Ş Veamos ahora el caso en que B R B. Tomemos una subsucesión pank q8 k“1 de la siguiente manera: n1 es el primer número natural tal que an1 P B1 , m1 :“ 1 y tomemos V1 :“ B1 ; definamos recursivamente Vk`1 :“ Bmk`1 , donde mk`1 es el primer número natural mayor m Şk que mk tal que Bmk`1 Ă Bj y definamos nk`1 como el primer número natural mayor que j“1 nk tal que ank`1 P Vk`1 . De esta manera tenemos que Vk`1 Ă Vk Ă Bk . Ahora bien, si V es una vecindad de x, existe un N P N tal que BN Ă V , de modo que para todo k ľ N se tiene que ank P Vk Ă BN Ă V . De esta manera tenemos que la subsucesión pank q8 k“1 así construida converge a x, terminando así la demostración del teorema. ‚ 14.4.50. Notación. Si tenemos que X e Y forman espacios topológicos y A Ă X, se denotará por C A al conjunto de todas las funciones reales cuyo dominio es un subconjunto de X y que son continuas en el conjunto A, mientras que CY pAq denotará al conjunto de todas las funciones cuyo dominio es un subconjunto de X, que son continuas en el conjunto A y cuyo 14.4. Espacios topológicos 419 recorrido está incluido en Y . Las dos notaciones anteriores obviamente dependen del contexto, puesto que se da por sobreentendido cuál es el conjunto X y su topología. 14.4.51. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es T3 ó regular si además de ser T1 se tiene que para cualquier conjunto cerrado F y para cualquier x P XzF se tiene que existen dos conjuntos abiertos disjuntos U y V tales que x P U y F ĂV. 14.4.52. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es T4 ó normal si además de ser T1 se tiene que para cualquier dos conjuntos cerrados disjuntos F y H se tiene que existen dos conjuntos abiertos disjuntos U y V tales que H Ă U y F Ă V . 14.4.53. Observación. Fácilmente podemos ver que T4 ùñ T3 ùñ T2 ùñ T1 ùñ T0 . 14.4.54. Teorema. Sea pX, dq un espacio métrico. La topología inducida por la métrica d es normal. Demostración. Sea T la topología inducida por d. Veamos primero que T es T1 . Sean x e y dos elementos diferentes de X y r “ dpx, yq. Tenemos obviamente que x P Bpx, 4r q e y P Bpy, 4r q, donde Bpx, 4r q y Bpy, 4r q son abiertos disjuntos, concluyendo así que T es T1 . Sean ahora F y G dos conjuntos cerrados disjuntos. Para cada x P F sea rx ą 0 tal que G X Bpx, rxŤq “ ∅ y para cada y P G sea ry Ť ą 0 tal que F X Bpy, ry q “ ∅. Observemos que ry G Ă U :“ tBpy, 4 q : y P Gu y F Ă V :“ tBpx, r4x q : x P F u. Si los conjuntos U y V son abiertos y además son disjuntos el teorema queda demostrado. Tales conjuntos son abiertos por ser unión de abiertos. Si U y V no fueran disjuntos, existiría un z P U X V y para tal z existiría un x P F y un y P G tales que dpx, zq ă r4x y dpz, yq ă r4y , teniéndose así que dpx, yq ă r4x ` r4y . Ahora, al tomar r˚ :“ máxtrx , ry u tendríamos que dpx, yq ă r˚ , estando en contradicción con la definición de rx o con la de ry . ‚ La demostración del siguiente teorema la dejamos al lector. 14.4.55. Teorema. Un espacio topológico pX, Tq es normal si y sólo si además de ser T1 se tiene que para cada cerrado F Ă X y cada abierto W Ą F , existe un abierto U Ą F tal que U Ă W. La siguiente definición es muy importante y será de utilidad en la demostración del teorema que enunciaremos próximamente. 14.4.56. Definición. Sea pX, Tq un espacio topológico. Decimos que un conjunto D Ă X es denso (con respecto a T) si cualquier conjunto abierto no vacío interseca a D, es decir si D “ X. En el caso en que tengamos D Ă Y Ă X, decimos que D es denso en Y si es denso con respecto a la topología relativa a Y . 14.4.57. Ejemplo. Como ejemplo típico de conjunto denso tenemos que Q es denso en R. 14.4.58. Observación. Si en el espacio topológico pX, Tq tenemos que B es una base de T, entonces un conjunto D Ă X es denso si y sólo si cualquier elemento de B interseca a D. 14.4.59. Lema de Urysohn. Sea pX, Tq un espacio topológico normal. Dados dos conjuntos F y G cerrados y disjuntos, existe una función continua f : X ÝÑ r0; 1s tal que f pxq “ 0 para todo x P F y f pyq “ 1 para todo y P G. 420 14.4. Espacios topológicos Demostración. Si tomamos U1 “ XzG, tenemos del teorema 14.4.55 que existe un abierto U 1 tal que F Ă U 1 Ă U 1 Ă U1 . Usando de nuevo el teorema 14.4.55 tenemos que existen 2 2 2 dos conjuntos abiertos U 1 y U 3 , el primero siendo tal que F Ă U 1 Ă U 1 Ă U 1 y el segundo 4 4 4 4 2 siendo tal que U 1 Ă U 3 Ă U 3 Ă U1 . Procedamos de manera recursiva suponiendo que para 2 4 4 cada entero positivo n tenemos definidos 2n conjuntos abiertos de la forma U kn , con k P 2 n para k P t1, 2, . . . , 2 ´ 1u. Definamos t1, 2, . . . , 2n u tales que F Ă U 1n y U kn Ă U kn Ă U k`1 2 2 2 2n k`1 los conjuntos de la forma U n`1 u observando que ya los tenemos k , para k P t1, 2, . . . , 2 2 definidos para el caso en que k es par. Por el teorema 14.4.55 existe un conjunto abierto 2 1 1 1 U n`1 tal que F Ă U n`1 Ă U n`1 Ă U 1n “ U n`1 y para cada entero impar k, mayor que 1 2 2 2 2 2 y menor que 2n`1 , existe un conjunto abierto U k 2n`1 tal que U k´1 ĂU n`1 2 k 2n`1 ĂU k 2n`1 Ă U k`1 . n`1 2 Tenemos así que para t, s P D :“ t 2kn : n P N y k P J2n u se tiene que D es un conjunto denso en r0; 1s y si t ă s, entonces F Ă Ut Ă Us Ă U1 “ XzG. Construyamos pues la función f : X ÝÑ r0; 1s de la siguiente manera: # 1, para x P G f pxq “ f pxq “ ínf ts P D : x P Us u, para x P XzG. Terminemos con la demostración del teorema demostrando que f es continua y que f pxq “ 0 para todo x P F . Si x P F , entonces x P Us para todo s P D, pero como ínf D “ 0 tenemos que f pxq “ 0. Demostremos ahora que f es continua en cada x P X. Sea ε ą 0. Si f pxq “ 0, sea s P D tal que s ă ε y observemos que x P Us y f rUs s Ă p´ε; εq “ pf pxq ´ ε; f pxq ` εq. Si f pxq “ 1, sea s P D tal que s ą 1 ´ ε y observemos que f rXzUs s Ă p1 ´ ε; 1 ` εq “ pf pxq ´ ε; f pxq ` εq. Si 0 ă f pxq ă 1, sea s P D tal que f pxq ´ ε ă s ă f pxq y sea t P D tal que f pxq ă t ă f pxq ` ε y observemos que Ut zUs es un conjunto abierto, x P Ut zUs y además ‚ f rUt zUs s Ă pf pxq ´ ε; f pxq ` εq. 14.4.60. Corolario. Sea pX, Tq un espacio topológico normal, sean F y G dos conjuntos cerrados y disjuntos, y sean dos números reales a, b P R tales que a ă b. Existe una función continua f : X ÝÑ ra; bs tal que f pxq “ a para todo x P F y f pyq “ b para todo y P G. Demostración. Por el lema de Urysohn, existe una función continua g : X ÝÑ r0; 1s tal que gpxq “ 0, para todo x P F y gpyq “ 1, para todo y P G, de modo que es suficiente con tomar la función f dada por f pwq “ pb ´ aqgpwq ` a, la cual obviamente es continua. ‚ 14.4.61. Teorema. Sean pX, Tq un espacio topológico, pY, ρq un espacio métrico y pfn q8 n“1 una sucesión de funciones de X en Y que converge uniformemente a una función f : X ÝÑ Y . Si cada fn es continua en algún punto x0 P X, entonces f es continua en x0 . En particular, si cada fn es continua, entonces f es continua. Demostración. Para cada ε ą 0 sea Nε P N tal que ρpfn pxq, f pxqq ă 3ε para todo x P X y todo n ľ Nε . Como fNε es continua en x0 , existe un abierto U de x0 tal que ρpfNε pxq, fNε px0 qq ă 3ε para todo x P U , de modo que ρpf pxq, f px0 qq ĺ ρpf pxq, fNε pxqq ` ρpfNε pxq, fNε px0 qq ` ρpf px0 q, fNε px0 qq ă ε ε ε ` ` “ ε, 3 3 3 14.4. Espacios topológicos 421 por lo que f es continua en x0 . ‚ 14.4.62. Teorema de extensión de Tietze. Sea pX, Tq un espacio topológico normal, F Ă X un conjunto cerrado y f : F ÝÑ R una función continua y acotada. Existe una función continua y acotada g : X ÝÑ R tal que g|F “ f . Demostración. Sean c0 :“ supt|f pxq| : x P F u, F0 :“ tx P F : f pxq ľ c30 u y G0 :“ tx P F : f pxq ĺ ´ c30 u. Como F0 y G0 son conjuntos cerrados y disjuntos tenemos que, debido al corolario 14.4.60, existe una función continua h0 : X ÝÑ r´ c30 ; c30 s tal que h0 rF0 s “ t c30 u y h0 rG0 s “ t´ c30 u. En particular tenemos que |h0 pxq| ĺ c0 3 para todo x P X y 2c0 para todo x P F. 3 Podemos construir de manera recursiva una sucesión de funciones continuas phn q8 n“1 tales que |f pxq ´ h0 pxq| ĺ 14.4.63. 2n c0 |hn pxq| ĺ n`1 3 para todo x P X y 14.4.64. |f pxq ´ h0 pxq ´ h1 pxq ´ ¨ ¨ ¨ ´ hn pxq| ĺ 2n`1 c0 3n`1 para todo x P F. En efecto, supongamos las funciones h0 , h1 , . . . , hm : X ÝÑ R han sido construidas de tal manera que son continuas y se satisfacen las desigualdades 14.4.63 y 14.4.64. Tomemos cm :“ supt|f pxq ´ h0 pxq ´ h1 pxq ´ ¨ ¨ ¨ ´ hm pxq| : x P F u y repitamos el argumento anterior reemplazando a c0 por cm para obtener una función continua hm`1 : X ÝÑ r´ c3m ; c3m s tal que |hm`1 pxq| ĺ cm 3 para todo x P X y 2cm para todo x P F. 3 Como las desigualdades 14.4.63 y 14.4.64 son verdaderas para n “ m, tenemos que cm ĺ 2m`1 c , obteniendo 14.4.63 y 14.4.64 para n “ m ` 1 y en consecuencia para todo n P N. 3m`1 0 Tomemos ahora gn :“ h0 ` h1 ` ¨ ¨ ¨ ` hn , para n P N. Si n ą m, entonces ˇ ˇ ˜ ˆ ˙k ¸ n n ˇ ÿ ˇ c ÿ 2 ˇ ˇ 0 |gn pxq ´ gm pxq| “ ˇ hk pxqˇ ĺ ˇk“m`1 ˇ 3 k“m`1 3 ˆ ˙m`1 ˜ ˆ ˙n´m ¸ ˆ ˙m`1 2 2 2 “ c0 1´ ĺ c0 , 3 3 3 |f pxq ´ h0 pxq ´ h1 pxq ´ ¨ ¨ ¨ ´ hm pxq ´ hm`1 pxq| ĺ 422 14.4. Espacios topológicos para todo x P X, es decir 14.4.65. ˆ ˙m`1 2 |gn pxq ´ gm pxq| ĺ c0 , 3 para todo x P X lo cual indica que pgn pxqq8 n“1 es una sucesión de Cauchy y, debido al criterio de la sucesión de Cauchy, tenemos que converge a un número gpxq, teniendo así una función g : X ÝÑ R tal que para todo x P X se tiene que gpxq “ lím gn pxq. Ahora, si en la desigualdad 14.4.65 hacemos nÑ8 tender n a infinito, obtenemos que la sucesión de funciones pgk q8 k“1 converge uniformemente a la función g, de modo que por el teorema 14.4.61 tenemos que g es continua. Debido a 14.4.64 tenemos que g|F “ f y debido a 14.4.63 ˆ ˙ 8 ˆ ˙n c0 1 c0 ÿ 2 “ “ c0 , |gpxq| ĺ 3 n“0 3 3 1 ´ 23 por lo que g no sólo es acotada, sino que tiene la misma cota que f . ‚ 14.4.66. Corolario. Sea pX, Tq un espacio topológico normal, F Ă X un conjunto cerrado y f : F ÝÑ ra; bs una función continua (donde a y b son número reales tales que a ă b). Existe una función continua g : X ÝÑ ra; bs tal que g|F “ f . ‰ “ ; b´a como hpxq “ f pxq ´ b`a . Del teorema Demostración. Definamos h : F ÝÑ ´ b´a 2 2 2 anterior y de la conclusión de ‰su demostración podemos concluir que existe una función “ b´a ; tal que i|F “ h. Ahora, si tomamos gpxq “ ipxq ` b`a continua i : X ÝÑ ´ b´a 2 2 2 obtendremos el resultado deseado. ‚ El siguiente es un resultado que da un condición suficiente para que un espacio T2 sea T4 . 14.4.67. Teorema. Cualquier espacio topológico Hausdorff y compacto es normal. Demostración. Sea pX, Tq un espacio topológico Hausdorff y compacto y sean F y G dos conjuntos cerrados y disjuntos. Por el teorema 14.4.32 tenemos que F y G son compactos. Para cada par de puntos diferentes x, y P X sean Vx,y y Vy,x vecindades de x e y respectivamente tales que Vx,y X Vy,x “ ∅. Para cada x R G tenemos la colección tVy,x : y P Gu, la cual es una cubierta abierta de G que no interseca a txu, pero por ser G compacto existe una subcubierta finita tVyx,k ,x : k P t1, 2, . . . , npxquu, donde cada yx,k P G. Para x R G tomemos los conjuntos Ť Şnpxq abiertos Ux :“ npxq k“1 Vyx,k ,x y Wx :“ k“1 Vx,yx,k , los cuales son tales que x R Ux Ą G, x P Wx y Ux X Wx “ ∅. Como podemos ver, hemos demostrado que el espacio topológico es regular. Tenemos ahora que la colección tWx : x P F u es una cubierta abierta de F , pero por ser F compacto existe una Ť subcubierta finita tW Şmxk : k P t1, 2, . . . , muu, donde cada xk P F . Ahora, m los conjuntos A :“ k“1 Wxk y B :“ k“1 Uxk no solamente son abiertos disjuntos, sino además satisfacen F Ă A y G Ă B. ‚ 14.4.68. Definiciones. La razón por la cual se acostumbra denotar con la letra T a las propiedades T1 , T2 , T3 y T4 proviene de la palabra alemana «trennungsaxiome» que significa axioma de separación. Así, en lugar de decir que un espacio topológico es Tn a veces se dice que satisface el n-ésimo axioma de separación o que satisface el axioma de separación número n. De manera similar, a veces en lugar de decir que un espacio topológico es primero 14.4. Espacios topológicos 423 numerable o segundo numerable, se dice respectivamente que satisface el primer axioma de numerabilidad o que satisface el segundo axioma de numerabilidad. 14.4.69. Definición. Decimos que un espacio topológico pX, Tq (o la topología T) es separable si existe un conjunto numerable denso D Ă X. Decimos así mismo que un subconjunto Y de X es separable si es separable con su topología relativa, es decir si existe un conjunto numerable E Ă Y tal que Y Ă E. Observemos que a pesar del nombre, la propiedad de que un espacio topológico sea separable, más que ser una propiedad de separación es una propiedad de numerabilidad. 14.4.70. Teorema. Sean pX, T1 q e pY, T2 q espacios topológicos. Si X “ A Y B, los conjuntos A y B son cerrados, las funciones f : A ÝÑ Y y g : B ÝÑ Y son continuas y f pxq “ gpxq para todo x P A X B, si además la función h : X ÝÑ Y está dada por # f pxq si x P A , hpxq “ gpxq si x P B entonces h es continua. Demostración. Este teorema es una consecuencia inmediata del teorema 14.4.34 al aplicar la equivalencia entre los incisos a) y c). ‚ 14.4.71. Definiciones. Sean pX, T1 q e pY, T2 q espacios topológicos. Decimos que f : X ÝÑ Y es una función abierta (con respecto a las topologías T1 y T2 ) si para todo A P T1 se tiene que f rAs P T2 ; es decir, f es abierta si la imagen de un conjunto abierto bajo f es un conjunto abierto. Así mismo, decimos que f es una función cerrada si para todo conjunto cerrado C Ă X se tiene que f rCs es cerrado. 424 14.5. 14.5. Topología producto Topología producto 14.5.1. Definición. Dados dos espacios topológicos pX, Tq y pY, Jq, dfinimos la topología producto del conjunto X ˆ Y (relativa a las topologías T y J) como la generada por los conjuntos de la forma A ˆ B, donde A P T y B P J. Es decir, la topología producto de X ˆ Y es la topología cuya base es la colección de conjuntos de la forma A ˆ B, con A y B abiertos en X e Y respectivamente. Generalizando un poco más el concepto, si tenemos n espacios topológicos pX1 , T1 q, pX2 , T2 q, . . . , pXn , Tn q, definimos la topología producto del conjunto X1 ˆ X2 ˆ ¨ ¨ ¨ ˆ Xn como la topología cuya base es la colección de los conjuntos de la forma A1 ˆ A2 ˆ ¨ ¨ ¨ ˆ An , donde cada Aj P Tj . Hasta ahora hemos definido el producto cartesiano de una sucesión finita de conjuntos. Definamos el producto cartesiano de una colección arbitraria de conjuntos y tratemos de establecer ahí una topología. 14.5.2. Definición. Sea Λ un conjunto de índices Ś tal que para cada λ P Λ tenemos un conAλ como el conjunto de todas las funciones junto Aλ . Definimos el producto cartesiano λPΛ α : Λ ÝÑ Ť Aλ tales que αpλq P Aλ . Cuando Λ “ N podemos escribir λPΛ Ś n Ś Ak ó A1 ˆ A2 ˆ ¨ ¨ ¨ k“1 Ak , o bien A1 ˆ A2 ˆ ¨ ¨ ¨ ˆ An , como Ś Aλ es un producto ya lo habíamos hecho. Cuando Λ sea un conjunto finito diremos que en lugar de Aλ . Cuando Λ “ Jn escribiremos 8 Ś λPΛ k“1 λPΛ cartesiano finito, de otro modo diremos que es un producto cartesiano infinito. 14.5.3. Notación. Cuando el dominio de α sea Λ y para cada λ P Λ tomamos xλ “ αpλq, escribiremos a veces pxλ qλPΛ en lugar de α, de manera similar a como se hizo con las sucesiones. Ś Aλ , definimos la proyección corres14.5.4. Definición. Dado un producto cartesiano λPΛ pondiente al índice δ P Λ como la función ą Aλ ÝÑ Aδ , prδ : λPΛ αÞÑαpδq es decir es la función tal que prδ ppxλ qλPΛ q “ xδ . Cuando Λ “ N ó Λ “ Jn , a la proyección correspondiente a índice k le llamamos la k-ésima proyección. 14.5.5. Observación. Observemos que si tenemos un producto cartesiano finito con su topología producto, las proyecciones son funciones continuas. En efecto si AjŚes un abierto Śn ´1 de Xj , entonces prj rAj s “ k“1 Ak , donde Ak “ Xk para k ‰ j, por lo que nk“1 Ak es un elemento en la base de la topología producto, teniendo así que prj es continua. Ś En el caso general en que tengamos productos no necesariamente finitos de la forma Xλ , λPΛ donde cada Xλ es un conjunto con una topología Tλ , tomemos un A en Xδ y Aλ “ Xλ para Ś λ ‰ δ y establezcamos que Opδ, Aq :“ Aλ , con Aδ “ A. Para que cada proyección prδ λPΛ sea continua es necesario y suficiente que los conjuntos de la forma Opδ, Aq y sean abiertos cuando A es un abierto en Xδ . Así, la mínima topología del producto cartesiano que hace que las proyecciones sean continuas es la generada por la colección tOpA, δq : A es un abierto 14.5. Topología producto 425 de Xδ y δ P Λu, la cual, como podemos ver, es base de alguna topología. Tenemos pues la siguiente definición de topología producto que garantiza que las proyecciones sean continuas. 14.5.6. Definición. Sea Λ un conjunto de índices y para cada λ P Λ sea pXλ ,Ś Tλ q un espacio topológico. Definimos la topología producto en el producto cartesiano Xλ como la λPΛ Ś generada por conjuntos de la forma Aλ , donde para algún δ P Λ se tiene que Aδ es abierto λPΛ en Xδ y Aλ “ Xλ para todo λ P Λztδu. 14.5.7. Teorema. Sea Λ un conjunto de índices, donde para cadaŚλ P Λ pXλ , Tλ q es un espacio topológico, y sea B la colección de conjuntos de la forma Aλ , donde existe un λPΛ conjunto finito de índices F “ tλ1 , λ2 , . . . , λn u tales que para cada j P Jn se tiene Śque Aλj es abierto en Xλj y Aλ “ Xλ para todo λ P ΛzF . La colección B es una base de Aλ con la λPΛ topología producto. Ś Aλ P B Demostración. Veamos primero que todos los elementos de B son abiertos. Sea Ś λPΛ Ş Bβ , Aλ “ y sea F un subconjunto finito de Λ tal que Aλ “ Xλ si λ P ΛzF . Tenemos que βPF λPΛ Ś donde Bβ “ Uλ,β y cada Uλ,β es un abierto en Xλ tal que si λ ‰ β, entonces Uλ,β “ Xλ . λPΛ Ś Como podemos ver, Aλ es una intersección finita de conjuntos abiertos, por lo que es un λPΛ conjunto abierto. Más aún, la intersecciónŤ de dos elementos de B es un elemento de B. Ahora, observemos que el conjunto t D : D Ă Bu es una topología incluida en la topología producto cuya base Ťes B, pero como el generador de la topología producto está incluido en B tenemos que t D : D Ă Bu es la topología producto, es decir B es una base de la topología producto. ‚ Ś 14.5.8. Corolario. Si A es un conjunto abierto de Xλ con la topología producto, entonces λPΛ existe un conjunto finito Λ0 Ă Λ tal que prλ rAs “ Xλ para todo λ P ΛzΛ0 . Demostración. Como la colección B dada en el teorema 14.5.7 es una base de la topología Ť producto, entonces cualquier abierto A en la topología producto es de la forma γPΓ Bγ , donde cada Bγ P Γ está en B. Ahora, sea γ0 P Γ y Λ0 “ tλ P Λ : prλ rBγ0 s ‰ Xλ u. Debido al teorema 14.5.7, se tiene que Λ0 es finito, además para todo λ P ΛzΛ0 se tiene que Xλ Ą prλ rAs Ą prλ rBγ0 s “ Xλ . ‚ 14.5.9. Definición. Sea Λ un conjunto de índices y para cada λ P ΛŚ sea pXλ , Tλ q un espacio topológico. Definimos la topología caja en el producto cartesiano Xλ como la generada λPΛ Ś por conjuntos de la forma Aλ , donde cada Aλ es un conjunto abierto de Xλ con respecto λPΛ a la topología Tλ . De manera parecida, pero aún más sencilla, a como se demostró el teorema 14.5.7, se puede demostrar el siguiente teorema. 14.5.10. Teorema. Sea Λ un conjunto de índices, donde para cada Ś λ P Λ pXλ , Tλ q es un espacio topológico, y sea B la colección de conjuntos de la forma Aλ , donde cada Aλ es λPΛ Ś abierto en Xλ . La colección B es una base de Xλ con la topología caja. λPΛ 426 14.5. Topología producto Ś Xλ , donde cada Xλ forme un espacio topológico, a Ś menos que especifiquemos otra cosa, al decir abierto de Xλ nos estaremos refiriendo a λPΛ Ś abierto con respecto a la topología producto, así mismo, decir topología de Xλ significará Cuando tengamos un producto λPΛ λPΛ topología producto. 14.5.11. Teorema. Sea Λ un conjunto de índices, donde para cada λ P Λ pXλ , Tλ q es Ś un espacio de Hausdorff, entonces Xλ forma un espacio de Hausdorff con la topología λPΛ producto. Demostración. Sean x “ pxλ qλPΛ y y “ pyλ qλPΛ dos elementos diferentes de Ś Xλ . Por λPΛ ser diferente, existe al menos un β P Λ tal que xβ ‰ yβ , por lo que existen dos conjuntos Ux , Uy P Tβ , tales que x P Ux , y P Uy y Ux X Uy “ ∅. Si tomamos Aβ “ Ux , A1β “ Uy y Ś Ś Aλ “ A1λ “ Xλ para λ ‰ β, tenemos que los conjuntos Aλ y A1λ son abiertos disjuntos λPΛ λPΛ Ś 1 Ś ‚ Aλ , por lo que la topología producto es de Hausdorff. Aλ e y P y además x P λPΛ λPΛ Debido a que la topología producto está incluida en la topología caja, tenemos el corolario siguiente. 14.5.12. Corolario. Sea Λ un Ś conjunto de índices, donde para cada λ P Λ pXλ , Tλ q es un espacio de Hausdorff, entonces Xλ forma un espacio de Hausdorff con la topología caja. λPΛ 14.5.13. Teorema. Sea Λ un conjunto de índices, donde para cada λ P Λ pXλ , Tλ q es un espacio de topológico. Si para cada λ P Λ se tiene que Aλ Ă Xλ , entonces ą ą Aλ . Aλ “ λPΛ λPΛ Ś Ś Demostración. Sea x “ pxλ qλPΛ un elemento de Aλ . Sea Aλ y veamos que x P λPΛ λPΛ Ś Uλ un elemento en la base de la topología producto dada en el teorema 7 al cual U “ λPΛ pertenece x. Como cada xλ P Aλ , tenemos queŚ para cada λ P Λ existe un yλ P Uλ X Aλ , teniendo así que existe un y “ pyλ qλPΛ P U X Aλ . De lo anterior tenemos que en toda λPΛ Ś Ś vecindad de x hay un elemento de Aλ , es decir que x P Aλ . λPΛ λPΛ Ś Ś Sea ahora x “ pxλ qλPΛ un elemento de Aλ y veamos que x P Aλ . Para cada λ P Λ λPΛ λPΛ Ś sea Uλ un abierto de Xλ al cual pertenece xλ . Observemos que pr´1 Vλ , donde β rUβ s “ λPΛ Vβ “ Uβ y Vλ “ Xλ para todo λ ‰ β. Como para cada β P Λ tenemos que pr´1 β rUβ s es Ś Ś ´1 un abierto de Xλ , entonces existe un y “ pyλ qλPΛ P prβ rUβ s X Aλ . De lo anterior λPΛ λPΛ tenemos Ś que para todo β P Λ existe un yβ P Uβ X Aβ , por lo cual xβ P Aβ , teniéndose así que xP Aλ . ‚ λPΛ 14.5.14. Teorema. Sea Λ un conjunto de índices, donde para cada λ P Λ tenemos Śque pXλ , Tλ q es un espacio de topológico. Sea pA, Tq un espacio topológico. Sea f : A ÝÑ Xλ λPΛ 14.5. Topología producto 427 una función dada por, f paq “ pfα paqqλPΛ , donde para cada λ P Λ se tiene que fλ : A ÝÑ Xλ . La función f es continua si y sólo si cada fλ es continua. Demostración. que f es Ś Supongamos primero que cada fλ es continua y demostremos Ś continua. Sea Vλ un elemento básico en la topología producto de Xλ , donde tenemos λPΛ λPΛ una cantidad finita de n índices diferentes „ λ1 , λ2 , . . . , λn P Λ, tales que Vλ “ Xλ para λ ‰ n Ś Ş Xλ “ fλ´1 rVλi s, el cual es un conjunto abierto por λ1 , λ2 , . . . , λn . Tenemos que f ´1 i i“1 λPΛ ser intersección finita de abiertos, y debido al teorema 14.4.34 tenemos que f es continua. Supongamos ahora que f es continua y demostremos que cada fλ es continua. Sea β P Λ y Vβ un subconjunto abierto de Xβ . Tenemos que fβ´1 rVβ s “ f ´1 rpr´1 β rVβ ss, y como tanto f ´1 como pr son funciones continuas, tenemos que fβ rVβ s es abierto, concluyendo así que fβ es continua. ‚ 14.5.15. Definición. Siea ρ una métrica en un conjunto X. A la función ρ˚ : X ˆ X ÝÑ R dada por ρ˚ px, yq :“ míntρpx, yq, 1u se le llama métrica acotada estándar correspondiente a ρ. 14.5.16. Lema. Sea ρ una métrica en X y ρ˚ su correspondiente métrica acotada estándar. La función ρ˚ es una métrica en X que induce la misma topología que ρ. Demostración. Para ver que ρ˚ es en efecto una métrica sólo vale la pena demostrar la desigualdad del triángulo. Sean x, y, z P X. Si ρpx, yq ĺ 1 y ρpy, zq ĺ 1, entonces ρ˚ px, zq ĺ ρpx, zq ĺ ρpx, yq ` ρpy, zq “ ρ˚ px, yq ` ρ˚ py, zq. Si ρpx, yq ą 1 ó ρpy, zq ą 1, entonces ρ˚ px, yq ` ρ˚ py, zq ľ 1, por lo que ρ˚ px, zq ĺ ρ˚ px, yq ` ρ˚ py, zq. Tenemos pues que se cumple la desigualdad del triángulo y así ρ˚ es una métrica. Para ver que ρ y ρ˚ inducen la misma topología, observemos que el conjunto B formado por todas las bolas con respecto a la métrica ρ con radio menor que 12 es una base para la topología inducida por ρ y también para la topología inducida por ρ˚ , tenemos que ambas métricas inducen la misma topología. ‚ 14.5.17. Definición. Sea Λ un conjunto de índices, donde para cada λ P Λ tenemos un espacio métrico pXλ , dλ q. Para cada dλ Ś sea d˚λ su métrica acotada estándar correspondiente. A la métrica ρ definida en el conjunto Xλ por λPΛ ρpx, yq “ suptd˚λ pxλ , yλ q : λ P Λu, Ś donde x “ pxλ qλPΛ e y “ pyλ qλPΛ son elementos de Xλ , se le llama métrica uniforme del λPΛ Ś producto Xλ . λPΛ Veamos queŚ la métrica uniforme ρ dada en la definición anterior es en efecto una métrica. Sean x, y, z P Xλ . Es obvio que ρpx, yq “ ρpy, xq, que ρpx, yq ľ 0 y que ρpx, yq “ 0 si λPΛ 428 14.5. Topología producto y sólo si x “ y, restando sólo por verificar la desigualdad del triángulo. Para cada λ P Λ tenemos ρpx, yq ` ρpy, zq ľ d˚λ pxλ , yλ q ` d˚λ pyλ , zλ q ľ d˚λ pxλ , zλ q, por lo que ρpx, yq ` ρpy, zq ľ suptd˚λ pxλ , zλ q : λ P Λu “ ρpx, zq, cumpliéndose así la desigualdad del triángulo. 14.5.18. Teorema. Sea Λ un conjunto de índices, donde para cada λ P Λ tenemos un espacio Ś métrico pXλ , dλ q y Tλ es la topología inducida por dλ . Sea T la topología producto en Xλ , λPΛ Tu la topología inducida por la métrica uniforme ρ y Tb la topología caja. Tenemos que T Ă Tu Ă Tb . Demostración. Demostremos primero que T Ă Tu . Para cada λ P Λ sea Bλ la base de la topología Tλ cuyos elementos son las bolas con respecto Ś a la métrica d˚λ dada en la definición anterior. Sea B la colección de conjuntos de la forma Bλ , donde cada Bλ P Bλ λPΛ y existe un conjunto finito Λ0 Ă Λ tal Ś que si λ P ΛzΛ0 , entonces Bλ “ Xλ . Observemos Bλ P B y para cada λ P Λ sean cλ y rλ el centro que B es una base de T. Sea B “ λPΛ y radio respectivamente de Bλ . Sea ahora x P B y para cada λ P Λ sean xλ “ prλ pxq, r̂λ,x “ rλ ´d˚λ pxλ , cλ q y B̂λ,x “ tyλ P Xλ : d˚λ pxλ , yλ q ă r̂λ,x u. Observemos ahora que B̂λ,x Ă Bλ , para cada λ P Λ. Sean Λ0 *:“ tλ P Λ : Bλ ‰ Xλ u y řx :“ míntr̂λ,x : λ P Λ0 u, y observemos que " Ś Xλ : ρpx, yq ă řx Ă B y más aún yP λPΛ + # B“ ď xPB yP ą Xλ : ρpx, yq ă řx . λPΛ " * Ś Ahora, cada conjunto y P Xλ : ρpx, yq ă řx es un abierto con respecto a la métrica λPΛ uniforme ρ, por lo que B P Tu , es decir T Ă Tu . Demostremos ahora que Tu Ă Tb . Denotemos por Bu a la base de Tu compuesta por todas las bolas con respecto a la métrica uniforme ρ. Sea B P Bu , donde c “ pcλ qλPΛ es su centro y r es su radio. Observando que ď ą tyλ P Xλ : d˚λ pcλ , yλ q ă su P Tb , B“ 0ăsăr λPΛ tenemos que Tu Ă Tb . ‚ 14.5.19. Teorema. Bajo las condiciones del teorema 14.5.18 tenemos que si Λ es un conjunto infinito y si cuando 0 ă ε ă δ ă 1, λ P Λ y xλ P Xλ se tiene que tyλ P Xλ : d˚λ pxλ , yλ q ă εu Ĺ tyλ P Xλ : d˚λ pxλ , yλ q ă δu ‰ Xλ , entonces las topologías T, Tu y Tb son diferentes. Ś Demostración. Sea ε ą 0 como en la hipótesis del teorema y x “ pxλ qλPΛ P Xλ . Para λPΛ cada λ P Λ sea Bλ “ tyλ P Xλ : d˚λ pxλ , yλ q ă εu. Tenemos que la bola # + ą B :“ y P Xλ : ρpx, yq ă ε , λPΛ 14.5. Topología producto Ś que está incluida en 429 Bλ , es un elemento de Tu , pero no es un elemento de T debido al λPΛ corolario 14.5.8, por lo tanto T ‰ Tu . Sea ahora Λ1 un subconjunto infinito numerable de Λ, sea ψ : N ÝÑ Λ1 una biyección de kÞÑλk N en Λ1 y sea Bk una bola en Xλk referente a la métrica d˚λk con radio k1 . Debido a la hipótesis del teorema, existe un N P N tal que para todo k ľ N se tiene que Bk ‰ŚXλk . Definamos Cλ como Xλ si λ ‰ λk para todo k P N y como Bk si λ P Λ1 . El conjunto Cλ es abierto con λPΛ respecto a la topología caja, pero no es abierto con respecto a la topología uniforme, puesto " * Ś Ś Ś que, de serlo, para cada x P Cλ , existiría una bola y P Xλ : ρpx, yq ă εx Ă Cλ , λPΛ λPΛ λPΛ lo cual es imposible puesto que # + ą ď ą tyλ P Xλ : d˚λ pxλ , yλ q ă su, yP Xλ : ρpx, yq ă εx “ 0ăsăεx λPΛ λPΛ y ninguno de los conjuntos Ś Ś tyλ P Xλ : d˚λ pxλ , yλ q ă su está incluido en λPΛ Cλ , puesto que λPΛ si k ą 1s , entonces Cλk Ĺ tyλk P Xλk : d˚λk pxλk , yλk q ă su. ‚ 14.5.20. Observación. Si A y B son dos conjuntos, recordando el significado de AB, podemos Ś observar que AB “ B. aPA De la observación anterior y del teorema 14.5.19 tenemos el corolario siguiente. 14.5.21. Corolario. Con respecto a la métrica euclidiana en R, si Λ es un conjunto infinito entonces en el conjunto ΛR las topologías caja, uniforme y producto son diferentes. A pesar del corolario anterior, tenemos que la topología producto en NR es metrizable, como lo muestra el teorema siguiente. 14.5.22. Teorema. Si d es la métrica euclidiana en R, d˚ es la correspondiente métrica acoN 8 tada estándar, y para cualesquiera dos elementos a “ pan q8 n“1 y b “ pbn qn“1 de R definimos " ˚ * d pan , bn q ρpa, bq :“ sup ; n nPN entonces ρ es una métrica que induce a la topología producto en NR. Demostración. Dejemos al lector la demostración de que ρ es una métrica y mostremos primero que la topología inducida por ρ está incluida en la topología producto. Sea U un abierto con respecto a ρ y sea x “ pxn q8 n“1 P U . Encontremos un abierto Vx con respecto a la topología producto tal que x P Vx Ă U . Para cada r ą 0 sea Bx,r la bola abierta con respecto a la métrica ρ con centro en x y radio r. Tomemos r suficientemente pequeño para que Bx,ε Ă U y sea N un número natural tal que N1 ă ε. Para cada n ă N sea An “ pxn ´ nε; xn ` nεq y para cada n ľ N sea An “ R. Tomemos el abierto en la topología producto dado por ą Vx :“ An nPN y observemos que Vx Ă Bx,ε , de tal suerte que Vx Ă U y así U “ respecto a la topología producto. Ť xPU Vx es abierto con 430 14.5. Topología producto Supongamos ahora que W es un elemento básico con respecto a la topología producto, el cual es de la forma ą W “ Wn , nPN donde cada Wn es abierto en R y para algún N P N tenemos que si n ľ N, entonces Wn “ R. Sea ahora y “ pyn q8 n“1 P W y para cada n ă N tomemos 1 ą εn ą 0 tal que pyn ´ εn ; yn ` εn q Ă Wn y definamos !ε ) n : n P t1, 2, . . . , N u . ε˚y :“ mín n Afirmamos que y P By,ε Ă W . En efecto, es obvio que y P By,ε˚y , y además si x P By,ε˚y , entonces para j ľ N tenemos que yj P R “ Wj , y si i ă N , entonces dpyi , xi q d˚ pyi , xi q εi “ ă ε˚y ă , i i i es decir dpyi , xi q ă εi , por lo que xi P Wi , por lo tanto By,ε˚y Ă W . Tenemos pues que ď By,ε˚y , W “ yPW por lo que W es abierto con respecto a la métrica ρ. ‚ 14.5.23. Teorema. Si tenemos una cantidad finita de espacios compactos X1 , X2 , . . . , Xn , entonces el espacio X1 ˆ X2 ˆ ¨ ¨ ¨ ˆ Xn es compacto con la topología producto. Demostración. Haremos la demostración sólo para n “ 2 (la demostración para el caso general se puede hacer por inducción matemática haciendo uso del hecho de que los espacios de la forma X ˆ Y ˆ Z y pX ˆ Y q ˆ Z son homeomorfos). Sea Ψ una cubierta abierta de X1 ˆ X2 y para cada px, yq P X1 ˆ X2 sean Ax,y y Bx,y vecindades de x e y respectivamente tales que Ax,y ˆ Bx,y está incluido en algún elemento Cx,y de Ψ . Para cada x P X1 tomemos una cubierta finita de X2 de la forma tBx,y1 , Bx,y2 , . . . , Bx,ynpxq u. Tenemos que la colección de conjuntos de la forma Ax,yi con x P X1 e i P t1, 2, . . . , npxq es una cubierta de X1 , por lo que existe una subcubierta finita, de manera que existe una cantidad finita de puntos x1 , x2 , . . . , xm tales que {Ax,y : x “ xi para algún i P t1, 2, . . . , mu e y P ty1 , y2 , . . . , ynpxq u} es una cubierta de X1 . Observemos además que {Ax,y ˆBx,y : x “ xi para algún i P t1, 2, . . . , mu e y P ty1 , y2 , . . . , ynpxq u} es una cubierta finita de X1 ˆ X2 y cada uno de sus elementos está incluido en algún elemento de Ψ , de manera que Ψ tiene una subcubierta finita de X1 ˆ X2 . ‚ 14.5.24. Teorema del tubo. Sea X un espacio topológico e Y un espacio compacto. Si E Ă X y W es un conjunto abierto en X ˆ Y en el cual está incluido el conjunto E ˆ Y , entonces existe un conjunto U que es abierto en X tal que E ˆ Y Ă U ˆ Y Ă W . Demostración. Para cada px, yq P W sean Ux,y una vecindad de x y Vx,y una vecindad de y tales que Ux,y ˆ Vx,y Ă W . Tenemos que para cada x P E el conjunto Ψ :“ tVx,y : y P Y u es una cubierta abierta de Y . Como Y es compacto Ψ tiene una subcubierta finita npxq Ť tVx,y1 , Vx,y2 , . . . , Vx,yn pxq u, de manera que txu ˆ Y Ă pUx,yi ˆ Vx,yi q Ă W . Ahora, si Ux :“ i“1 14.5. Topología producto 431 npxq Ş npxq Ť Ux,yi tenemos que txu ˆ Y Ă Ux ˆ Y Ă pUx,yi ˆ Vx,yi q Ă W . Si tomamos ahora i“1 i“1 Ť U :“ Ux , obtendremos que E ˆY Ă U ˆY Ă W , con lo que el teorema queda demostrado. xPE ‚ 432 14.6. Topología cociente 14.6. Topología cociente En esta sección estudiaremos brevemente un tipo particular de topologías, las llamadas topologías cocientes. Dado un espacio topológico pX, Tq y una relación de equivalencia R en el conjunto X, queremos definir un conjunto en el cual todos los elementos de una misma clase de equivalencia de R se vean como uno solo y definir en el una topología con propiedades interesantes. Tenemos con precisión la definición siguiente. 14.6.1. Definición. Sea pX, Tq un espacio topológico y R una relación de equivalencia en X. Denotemos por X{R al conjunto de todas las clases de equivalencia de la relación R, al cual llamaremos conjunto cociente de R, y por π : X ÝÑ X{R a la función tal que πpxq es la clase de equivalencia en la cual está x. Dicha función π se llama la proyección en el conjunto cociente X{R. Al conjunto de todos los conjuntos U Ă X{R tales que π ´1 rU s es abierto se le llama topología cociente de X{R. 14.6.2. Observación. Observemos que la topología cociente es, en efecto, una topología. 14.6.3. Teorema. La topología cociente de X{R (con respecto al espacio topológico pX, Tq) es la unión de todas las topologías del conjunto X{R que hacen continua a la proyección en el conjunto cociente X{R. Demostración. Sea C la topología cociente y M una topología de X{R para la cual la proyección en X{R (que seguiremos denotándola por π) es continua. Como π es continua con respecto a M, entonces para todo A P M tenemos que π ´1 rAs P T, es decir π ´1 rAs es un subconjunto abierto de X, lo cual significa que A P C, por lo tanto M Ă C. ‚ Una forma de caracterizar a la topología cociente es mediante el teorema siguiente. 14.6.4. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos, sea R una relación de equivalencia en X y sea π : X ÝÑ X{R la proyección en X{R. Una función f : X{R ÝÑ Y es continua si y sólo si f ˝ π es continua. Demostración. Como la composición de dos funciones continuas es una función continua tenemos que si f es continua, entonces f ˝ π es continua. Supongamos ahora que f ˝ π es continua y sea V P T2 . Tenemos que pf ˝ πq´1 rV s “ π ´1 rf ´1 rV ss es un abierto de X. Ahora, por definición de topología cociente, tenemos que f ´1 rV s es abierto con respecto a la topología cociente, por lo tanto f es continua. ‚ 14.6.5. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos, sea R una relación de equivalencia en X, sea π : X ÝÑ X{R la proyección en X{R y sea f : X ÝÑ Y una función continua. Si f es constante en cada clase de equivalencia de R, entonces existe una función continua g : X{R ÝÑ Y tal que f “ g ˝ π. Demostración. Sea g : X{R ÝÑ Y la función tal que para cada A P X{R se tiene que gpAq “ f paq para todo a P A. Por hipótesis tenemos que g está bien definida. La continuidad de g se sigue del teorema 14.6.4. ‚ 14.6.6. Teorema. Sean pX, T1 q y pY, T2 q dos espacios topológicos Hausdorff y compactos y sea f : X ÝÑ Y una función continua sobre Y . Sea R la relación de equivalencia en X tal que x0 Rx1 ðñ f px0 q “ f px1 q. El conjunto X{R con la topología cociente es homeomorfo a Y. 14.6. Topología cociente 433 Demostración. Como X{R es la imagen de X bajo la proyección π en el conjunto cociente X{R y π es continua, tenemos que X{R es compacto. Sea g : X{R ÝÑ Y la función continua que satisface g ˝ π “ f (tal función existe debido al teorema 14.6.5 y como podemos ver es una biyección de X{R sobre Y ). Por el teorema 14.4.42 el conjunto X{R es homeomorfo a Y. ‚ 434 14.6. Topología cociente Capítulo 15 ANÁLISIS GEOMÉTRICO 15.1. Distancia entre dos Puntos En esta sección daremos la definición de distancia entre dos elementos del conjunto Rn . Después de definir la distancia daremos una motivación informal del por qué de dicha definición. Recordemos que si n es un entero positivo, el conjunto Rn es el conjunto de sucesiones finitas de números reales con n componentes, a tal conjunto también lo llamaremos hiperespacio o espacio Rn y a sus elementos los llamaremos puntos. Supondremos siempre que n es un entero positivo cualquiera, pero el lector que desee tener una idea intuitiva del significado geométrico de Rn , así como de los resultados que involucran a Rn , puede marcar la atención en los casos en que n es 1, 2 ó 3. Aún y cuando es intuitivamente difícil imaginarse o interpretar geométricamente los resultado en Rn cuando n ą 3, el estudio es conveniente debido a la gran cantidad de aplicaciones que tiene en disciplinas prácticas como lo son: la física, los métodos de optimización, el reconocimiento de patrones, los procesos estocásticos, la teoría del control, entre otras. En el caso en que n “ 1, se puede pensar en R1 como si fuera el conjunto R al hacer la correspondencia biunívoca que a cada elemento x P R le asigna el elemento de R1 cuya única componente es x. 15.1.1. Definición. Definimos la distancia euclidiana entre dos puntos c P “ pp1 , p2 , . . . , pn q n ř ppk ´ qk q2 . En y Q “ pq1 , q2 , . . . , qn q en Rn como el número no negativo distpP, Qq “ k“1 este capítulo usaremos simplemente la palabra distancia en lugar de distancia euclidiana a menos que el contexto marque explícitamente algún otro significado. Para hacer intuitivamente aceptable la definición anterior, hagamos una discusión informal, donde tal vez usemos conceptos no definidos y afirmaciones no demostradas, pero que servirán para que aceptemos que representa la noción de distancia que usamos frecuentemente. La parte rigurosa de la sección termina en la definición anterior y lo que sigue de ésta no será utilizada en el resto del libro. Basémonos en la figura siguiente. Tenemos un cuadrado con vértices A, B, C y D, y lados 435 436 15.1. Distancia entre dos Puntos de longitud a`b. En ese cuadrado ponemos un cuadrado inscrito, cuya longitud del lado es c y sus vértices son P , Q, R y S, de tal suerte que la distancia de A al punto P es a, la de P a B es b, la de P a Q es c, la de B a Q es a, etc. El área de la región cuadrada grande es pa ` bq2 y el área de la región cuadrada inscrita (la sombreada) es c2 . Por otra parte, el área de la región formada por el cuadrado grande (la de vértices A, B, C y D) es igual a la suma de las áreas de las cuatro regiones triangulares que se forman (cada una de las cuales tiene área ab{2) más el área de la región cuadrada inscrita que tiene vértices P , Q, R y S (la cual es c2 ). Pero la suma de las cuatro regiones triangulares es 2ab, por lo que tenemos que pa ` bq2 “ 2ab ` c2 ? , es decir a2 ` 2ab ` b2 “ 2ab ` c2 , de donde obtenemos que c2 “ a2 ` b2 , o bien que c “ a2 ` b2 . Resumimos lo anterior diciendo que en un triángulo rectángulo, la suma del cuadrado de los catetos es igual al cuadrado de la hipotenusa, que es lo que se conoce como el teorema de Pitágoras. Si en R2 tomamos dos puntos P “ pp1 , p2 q y Q “ pq1 , q2 q, tenemos que los puntos P , Q, y además el punto B “ pq1 , p2 q, son los vértices de un triángulo rectángulo cuya hipotenusa es la distancia de P a Q y cuyos catetos son la distancia de P a B y la de Q aa B, pero estas últimas distancias son |p1 ´ q1 | y |p2 ´ q2 |, y así, la distancia de P a Q es pp1 ´ q1 q2 ` pp2 ´ q2 q2 , que es como se definió la distancia entre dos puntos para el caso en que el espacio es R2 . Ahora, si tenemos dos puntos P “ pp1 , p2 , p3 q y Q “ pq1 , q2 , q3 q en R3 , tenemos que los puntos P , Q y T = pq1 , q2 , p3 q son los vértices de un triángulo rectángulo cuya hipotenusa es la distancia entre P y Q y cuyos catetos son las distancias de P a T y de T a Q respectivamente. 2 Ahora, a la distancia de P a T debe ser la distancia de pp1 , p2 q a pq1 , q2 q en R , la cual es igual a pp1 ´ q1 q2 ` pp2 ´ q2 q2 , mientras que la distancia de T a Q debe ser |p3 ´ q3 |, por lo que la distancia entre P y Q deberá ser c´ ¯2 a pp1 ´ q1 q2 ` pp2 ´ q2 q2 ` pp3 ´ q3 q2 “ a pp1 ´ q1 q2 ` pp2 ´ q2 q2 ` pp3 ´ q3 q2 , que es como se definió la distancia entre dos puntos para el caso en que el espacio es R3 . En general, si m es un entero positivo y la distancia entre dos puntos P 1 “ pp1 , p2 , . . . , pm q cm ř y Q1 “ pq1 , q2 , . . . , qm q en Rm está dada por ppk ´ qk q2 , entonces, para deducir la disk“1 tancia entre los dos puntos P “ pp1 , p2 , . . . , pm , pm`1 q y Q “ pq1 , q2 , . . . , qm , qm`1 q en Rm`1 , definimos el punto T “ pq1 , q2 , . . . , qm , pm`1 q en Rm`1 y podemos considerar a los puntos P , Q y T como los vértices de un triángulo rectángulo cuya hipotenusa es la distancia entre P y Q, y cuyos catetos son las distancias de P a T y de Q a T . Ahora, la distancia entre P y T es igual a la distancia entre P 1 y Q1 , y la distancia entre Q y T es |pm`1 ´ qm`1 |, por lo 15.1. Distancia entre dos Puntos 437 tanto la distancia entre P y Q es g˜d ¸2 f m f ÿ e ppk ´ qk q2 ` |pm`1 ´ qm`1 |2 k“1 d “ m ÿ g fm`1 fÿ 2 2 ppk ´ qk q ` ppm`1 ´ qm`1 q “ e ppk ´ qk q2 , k“1 k“1 lo que nos lleva a que la fórmula para calcular la distancia entre dos puntos es también válida en Rm`1 , lo que es consistente con nuestra definición de distancia entre dos puntos en Rn para todo número natural n. 15.2. Álgebra en Rn 438 15.2. Álgebra en Rn En esta sección estableceremos el álgebra en Rn y la usaremos para definir los conceptos de recta, plano, hiperplano, etc. en Rn . 15.2.1. Definiciones. Definimos la suma de dos puntos P “ pp1 , p2 , . . . , pn q y Q “ pq1 , q2 , . . . , qn q en Rn como el punto P ` Q :“ pp1 ` q1 , p2 ` q2 , . . . , pk ` qk , . . . , pn ` qn q. Así mismo, definimos la resta de P y Q como el punto P ´ Q :“ pp1 ´ q1 , p2 ´ q2 , . . . , pk ´ pk , . . . , pn ´ qn q. Ahora, si t P R, definimos el producto o producto por escalar de t y P como el punto dado por tP :“ ptp1 , tp2 , . . . , tpk , . . . , tpn q. Al punto p0, 0, . . . , 0q en Rn tal que todas sus componentes son 0 lo representaremos por 0 y le llamaremos origen del espacio Rn . A la distancia entre el origen 0 y un punto cualquiera P se le llama la norma de P y se le denota por |P |. Observemos que la distancia entre dos puntos P y Q está dada por |P ´ Q| y que si t es un número real, entonces |tP | “ |t||P |. Obviamente también es válido que |P ´ Q| “ |Q ´ P |. 15.2.2. Definición. Diremos que un conjunto l Ă Rn es una recta, cuando existan puntos P y Q con Q ‰ 0 tales que l “ tS P Rn : S “ P ` tQ, para algún t P Ru. Si R “ P ` Q, se verifica que P, R P l y decimos que la recta l pasa por los puntos P y R. ÐÑ A tal recta se le denota porP R. P i PP PP PP P P PrP P PPR r P PP PP P q 15.2.3. Definición. Si R y P son dos puntos diferentes de Rn , el conjunto tS P Rn : S “ ÝÝÑ P ` tpR ´ P q para algún t ľ 0u se llama rayo y se le denota por P R. Al punto P del rayo ÝÝÑ P R se le llama extremo del rayo. Pr PP PPR r P PP PP P P q P 15.2. Álgebra en Rn 439 ÝÝÑ ÝÝÑ 15.2.4. Definición. A la unión de dos rayos P Q y P R que no estén incluidos en una misma recta y que tengan el mismo extremos P se le llama ángulo y se le denota por =RP Q. Al punto P del ángulo =RP Q se le llama vértice (del ángulo). P HH H Q1 r HH Rr H HH HH j 15.2.5. Definición. Si R y P son dos puntos diferentes de Rn , el conjunto tS P Rn : S “ P ` tpR ´ P q para algún t P r0; 1su se llama segmento de recta o simplemente segmento, y se le denota por P R. A los puntos P y R de tal segmento se les llama extremos del segmento. Observemos que los extremos del segmento pertenecen al segmento. A la distancia entre los extremos de un segmento se le llama longitud del segmento. Pr PP PP P PP P PP PR r Si t P p0; 1q y S “ P ` tpR ´ P q, decimos que S está entre P y R. El punto medio M del segmento P R lo definimos como el punto P ` 21 pR ´ P q, es decir es 12 pP ` Rq; a tal punto también se le llama punto medio entre P y R. Pr M r Rr 15.2.6. Definición. Un conjunto Ω Ă Rn se dice que es convexo si cualquier segmento con extremos en Ω está incluido en Ω, es decir Ω es convexo si para todo P, R P Ω y todo t P r0; 1s se tiene que tR ` p1 ´ tqP P Ω. conjunto no convexo conjunto convexo 15.2.7. Definición. Diremos que un conjunto Π Ă Rn es un hiperplano, cuando existan n números a1 , . . . , an , no todos iguales a cero, y un número d tales que # + n ÿ Π “ px1 , x2 , . . . , xn q P Rn : ak x k “ d . k“1 15.2. Álgebra en Rn 440 En el caso" anterior decimos que Π es un hiperplano de dimensión n ´ 1. A un conjunto de * n ř la forma px1 , x2 , . . . , xn q P Rn : ak xk ă d se le llama semiespacio o semiespacio de k“1 dimensión n. 15.2.8. Definición. Los elementos de un conjunto de puntos se dice que están alineados cuando todos pertenecen a una misma recta, en caso contrario diremos que son no alineados. 15.2.9. Definición. Dados tres puntos diferentes no alineados P , Q y R. A la unión de los tres segmentos diferentes P Q, QR y RP se le llama triángulo y se le denota por ŸP QR. Los puntos P , Q y R se llaman vértices del triángulo ŸP QR y los segmentos P Q, QR y RP se llaman lados del triángulo. También decimos que los ángulos =P QR, =QRP y =QP R son los ángulos del triángulo ŸP QR. 15.2.10. Definición. Supongamos que tenemos 3 puntos diferentes P , Q y R tales que Q, R y 0 son no alineados. Un conjunto de la forma Γ “ tS P Rn : S “ P ` tQ ` sR para algún t P R y algún s P Ru. se llama plano o plano de dimensión 2. 15.2.11. Definición. Decimos que dos rectas l1 y l2 son paralelas si ambas están incluidas en un mismo plano y además l1 X l2 “ ∅. Al hecho de que las rectas l1 y l2 sean paralelas se le denota así l1 k l2 . 15.2.12. Definición. Si Γ es un plano, Q P Γ y r ą 0; al conjunto c de todos los puntos P P Γ tal que la distancia entre P y Q es r se le llama circunferencia, al punto Q se le llama centro de la circunferencia y al número r se le llama radio de la circunferencia. Al doble del radio de una circunferencia se le llama diámetro de la circunferencia. Al conjunto de puntos S del plano Γ tales que la distancia entre S y Q es menor que r se le llama interior de la circunferencia c. El exterior de c es el conjunto de puntos del plano Γ cuya distancia al centro Q es mayor que r. A la unión de una circunferencia con su interior se le llama círculo y por definición, el centro, radio, diámetro, interior y exterior de la circunferencia son respectivamente el centro, radio, diámetro, interior y exterior del círculo. 15.2.13. Definición. En geometría se suele utilizar la palabra cortar como sinónimo de intersecar. Cuando la intersección de dos conjuntos es un conjunto tQu con un solo elemento se dice que estos conjuntos se cortan o se intersecan en Q. 15.2.14. Definición. Terminemos las definiciones de esta sección definiendo el producto punto, producto escalar o producto interno de dos puntos P “ pp1 , p2 , . . . , pn q y Q “ pq1 , q2 , . . . , qn q en Rn como el número P ¨ Q :“ n ÿ pk qk . k“1 Dicho de otra manera, P ¨ Q es la única componente de la matriz P Qt . El origen de la definición de producto punto y de la suma de puntos se debe al matemático y físico norteamericano Josiah Willard Gibbs (1836-1903) principal precursor del Análisis Vectorial. Tales conceptos fueron generalizados más tarde por el matemático alemán David 15.2. Álgebra en Rn 441 Hilbert (1862-1943), quién trabajó sobre los fundamentos de la geometría, creando un sistema axiomático y demostrando su consistencia. Observemos que es válida la propiedad conmutativa del producto punto y la propiedad distributiva del producto punto con respecto a la suma de puntos. El resultado siguiente se conoce como la desigualdad de Schwarz, aunque también tiene los nombres de otros matemáticos como Cauchy y Buniacovski. 15.2.15. Desigualdad de Schwarz. Si P y Q P Rn , entonces a ? |P ¨ Q| ĺ P ¨ P Q ¨ Q. Demostración. Observemos que si Q “ 0, la relación claramente se cumple, es decir se tiene la igualdad. Suponiendo que Q ‰ 0, tenemos que 0ĺ n ÿ k“1 n ÿ “ |pQ ¨ Qqpk ´ pP ¨ Qqqk |2 ppQ ¨ Qqpk ´ pP ¨ Qqqk qppQ ¨ Qqpk ´ pP ¨ Qqqk q k“1 2 “ pQ ¨ Qq n ÿ p2k ´ pQ ¨ QqpP ¨ Qq k“1 ´ pP ¨ QqpQ ¨ Qq n ÿ k“1 n ÿ pk q k k“1 n ÿ 2 qk pk ` pP ¨ Qq qk2 k“1 2 “ pQ ¨ Qq pP ¨ P q ´ 2pQ ¨ QqpP ¨ Qq ` pP ¨ Qq2 pQ ¨ Qq “ pQ ¨ QqppQ ¨ QqpP ¨ P q ´ pP ¨ Qq2 q, pero como Q ¨ Q ą 0, tenemos que pP ¨ Qq2 ĺ pQ ¨ QqpP ¨ P q, de donde se concluye la desigualdad de Schwarz. ‚ 15.2.16. Desigualdad del triángulo. Si P y Q son dos puntos en Rn , entonces |P ` Q| ĺ |P | ` |Q|. Demostración. Como |P `Q|2 “ pP `Qq¨pP `Qq “ P ¨P `2P ¨Q`Q¨Q ĺ |P |2 `|Q|2 `2|P ¨ Q|, de la desigualdad de Schwarz obtenemos que |P `Q|2 ĺ |P |2 `|Q|2 `2|P ||Q| “ p|P |`|Q|q2 y al aplicar la raíz cuadrada se concluye la desigualdad del triángulo. ‚ Otra versión de la desigualdad del triángulo, que incluso refleja más el nombre de la desigualdad, es el corolario siguiente. 15.2.17. Desigualdad del triángulo. Si P , Q y R son tres puntos en Rn , entonces |P ´ Q| ĺ |P ´ R| ` |Q ´ R|. 15.2. Álgebra en Rn 442 R A A A P A A A Q Demostración. Esta versión de la desigualdad del triángulo se sigue al poner en la versión 15.2.16 de la desigualdad del triángulo P ´ R en lugar de P y R ´ Q en lugar de Q. ‚ 15.2.18. Corolario. Si P “ pp1 , p2 , . . . , pn q y Q “ pq1 , q2 , . . . , qn q son puntos en Rn , entonces |P ´ Q| ĺ n ÿ |pk ´ qk |. k“1 Demostración. Haremos la demostración por inducción matemática. Si n “ 1, entonces a |P ´ Q| “ pp1 ´ q1 q2 “ |p1 ´ q1 |, por lo que se cumple la afirmación. Supongamos que la desigualdad se cumple cuando n “ m. Si P, Q P Rm`1 , entonces, al utilizar la desigualdad del triángulo, tenemos |P ´ Q| “ |pp1 , p2 , . . . , pm , pm`1 q ´ pq1 , q2 , . . . , qn , qm`1 q| “ |pp1 ´ q1 , p2 ´ q2 , . . . , pm ´ qm , 0q ` p0, 0, . . . , 0, pm`1 ´ qm`1 q| ĺ |pp1 ´ q1 , p2 ´ q2 , . . . , pm ´ qm , 0q| ` |p0, 0, . . . , 0, pm`1 ´ qm`1 q| d m ÿ a ppk ´ qk q2 ` 0 ` 0 ` 0 ` ¨ ¨ ¨ ` 0 ` ppm`1 ´ qm`1 q2 “ k“1 “ |pp1 ´ q1 , p2 ´ q2 , . . . , pm ´ qm q| ` |pm`1 ´ qm`1 | m m`1 ÿ ÿ ĺ |pk ´ qk | ` |pm`1 ´ qm`1 | “ |pk ´ qk |, k“1 k“1 con lo que terminamos la demostración. ‚ 15.2.19. Teorema. Si P , Q y R son tres puntos en Rn y R está entre P y Q, entonces |P ´ Q| “ |P ´ R| ` |R ´ Q|. Demostración. Sean P y Q dos puntos diferentes en Rn y R “ P `tpQ´P q, con 0 ă t ă 1, un punto entre P y Q. Por definición de distancia entre dos puntos tenemos que |P ´ R| “ t|Q ´ P | “ t|P ´ Q| y |R ´ Q| “ |P ` tpQ ´ P q ´ Q| “ |pt ´ 1qpQ ´ P q| “ p1 ´ tq|P ´ Q|, por lo que |P ´ R| ` |R ´ Q| “ t|P ´ Q| ` p1 ´ tq|P ´ Q| “ |P ´ Q|. ‚ 15.2.20. Teorema. Dados dos puntos diferentes, existe solamente una recta a la cual pertenecen. 15.2. Álgebra en Rn 443 Demostración. Sean A y B dos puntos diferentes en Rn . Claramente A y B pertenecen a la recta l “ tS P Rn : S “ A ` tpB ´ Aq para algún t P Ru. Supongamos que también pertenece a una recta l1 “ tS P Rn : S “ P ` tQ para algún t P Ru, con Q ‰ 0. Existen dos números reales diferentes t0 y t1 tales que A “ P ` t0 Q y B “ P ` t1 Q. Si S P l, entonces existe un número real t tal que S “ A ` tpB ´ Aq “ pP ` t0 Qq ` tpP ` t1 Q ´ pP ` t0 Qqq “ P ` pt0 ` tt1 ` tt0 qQ P l1 , por lo tanto l Ă l1 . Ahora, si S P l1 , entonces S “ P ` sQ para algún s P R, de modo que S “ P ` sQ “ A ´ t0 Q ` sQ “ A ` ps ´ t0 qQ “ 0 pB ´ Aq P l, por lo tanto l1 Ă l, con lo que concluimos que l “ l1 . ‚ A ` ts´t 1 ´t0 15.2.21. Teorema. Dados tres puntos diferentes no alineados, existe un único plano al cual pertenecen. Demostración. Si A, B y C son tres puntos diferentes no alineados, es claro que pertenecen al plano Π “ tS P Rn : S “ A ` tpB ´ Aq ` spC ´ Aq para algunos t, s P Ru. Si Π 1 “ tS P Rn : S “ P ` tQ ` sR para algunos t, s P Ru, donde P , P ` Q y P ` R no están alineados y A, B, C P Π 1 , entonces existen tres parejas diferentes de números reales pt1 , s1 q, pt2 , s2 q y pt3 , s3 q tales que 15.2.22. A “ P ` t1 Q ` s1 R, B “ P ` t2 Q ` s2 R y C “ P ` t3 Q ` s3 R. Si S P Π, entonces existe pt, sq P R2 tal que S “ A ` tpB ´ Aq ` spC ´ Aq “ P ` t1 Q ` s1 R ` tppt2 ´ t1 qQ ` ps2 ´ s1 qRq ` sppt3 ´ t1 qQ ` ps3 ´ s1 qRq “ P ` pt1 ` tpt2 ´ t1 q ` spt3 ´ t1 qqQ ` ps1 ` tps2 ´ s1 q ` sps3 ´ s1 qqR P Π 1 , por lo tanto Π Ă Π 1 . Demostremos ahora que Π 1 Ă Π y terminemos así la demostración del teorema. Si S P Π 1 , entonces S “ P ` t1 Q ` s1 R para un t1 y un s1 pertenecientes al conjunto de números reales, por lo que de 15.2.22 tenemos que S “ A ´ t1 Q ´ s1 R ` t1 Q ` s1 R “ A ` pt1 ´ t1 qQ ` ps1 ´ s1 qR. De 15.2.22 tenemos que B ´ A “ pt2 ´ t1 qQ ` ps2 ´ s1 qR y C ´ A “ pt3 ´ t1 qQ ` ps3 ´ s1 qR. ´ ¯ t3 ´t1 1 pB ´ Aq ´ pC ´ pB ´ Aq. Si t ‰ t , entonces Si t1 “ t2 , entonces s1 ‰ s2 y R “ s2 ´s 1 2 t2 ´t1 ´´ ¯ ¯ 1 t3 ´t3 Aq “ ps2 ´ s1 q ´ ps3 ´ s1 q R y como A, B y C son no alineados, obtenemos que ´t1 ´ t2¯ ´ ¯ t3 ´t1 t3 ´t3 A ` t2 ´t1 pB ´ Aq ‰ A ` pC ´ Aq, por lo cual t2 ´t1 ps2 ´ s1 q ´ ps3 ´ s1 q ‰ 0 y así R es de la forma αpB ´ Aq `βpC ´ Aq (ya sea que t1 “ t2 ó t1 ‰ t2 ). Análogamente Q es de la forma γpB ´ Aq ` δpC ´ Aq. Ahora, S “ A ` pt1 ´ t1 qQ ` ps1 ´ s1 qR “ A `pt1 ´ t1 qpγpB ´ Aq ` δpC ´ Aqq ` ps1 ´ s1 qpαpB ´ Aq ` βpC ´ Aqq “ A ` ppt1 ´ t1 qγ ` ps1 ´ s1 qαqpB ´ Aq ` ppt1 ´ t1 qδ ` ps1 ´ s1 qβqpC ´ Aq P Π, por lo que Π 1 Ă Π y terminamos así la demostración del teorema. ‚ 15.2.23. Corolario. Si un plano Π1 está incluido en un plano Π2 , entonces Π1 “ Π2 . 15.2. Álgebra en Rn 444 Demostración. Tomando tres puntos diferentes no alineados en Π1 , estos también deben estar en Π2 y por el teorema 15.2.21, Π1 “ Π2 . ‚ 15.2.24. Teorema. Un subconjunto de R3 es un plano si y sólo si es un hiperplano de dimensión 2. Demostración. Para pa, b, cq ‰ p0, 0, 0q sea Π “ tpx, y, zq P R3 : ax ` by ` cz “ du un hiperplano de dimensión 2. Supongamos primero que a ‰ 0 y observemos que Π “ tpx, y, zq P R3 : px, y, zq “ pd{a, 0, 0q ` tp´b{a, 1, 0q ` sp´c{a, 0, 1q para algunos s, t P Ru, el cual es un plano. De manera análoga se demuestra que Π es un plano cuando b ‰ 0 y cuando c ‰ 0. Supongamos ahora que Γ es un plano incluido en R3 . El plano Γ es de la forma tpx, y, zq P 3 R : px, y, zq “ px0 , y0 , z0 q ` tpα, β, γq ` spδ, η, ρq para algunos s, t P Ru, donde pδ, η, ρq ‰ p0, 0, 0q y pα, β, γq ‰ spδ, η, ρq para todo s P R. Tenemos que si px, y, zq P Γ , entonces existen valores de s y t para los cuales se satisface el siguiente sistema de ecuaciones x ´ x0 “ tα ` sδ y ´ y0 “ tβ ` sη 15.2.25. z ´ z0 “ tγ ` sρ. Si α ‰ 0, sea α1 el número tal que α1 α “ β y sea α2 el número tal que α2 α “ γ. Tenemos que el sistema 15.2.25 es equivalente al sistema x ´ x0 15.2.26. “ tα ` sδ α1 px ´ x0 q ´ py ´ y0 q “ spα1 δ ´ ηq α2 px ´ x0 q ´ pz ´ z0 q “ spα2 δ ´ ρq. Si α1 δ ´ η “ 0, entonces Γ está incluido en el hiperplano de dimensión 2 definido como tpx, y, zq P R3 : α1 x ´ y “ spα1 δ ´ ηq ´ y0 ` α1 x0 u, el cual es un plano que por el corolario 15.2.23 es igual a Γ . Si α1 δ ´η ‰ 0, tomemos como β1 el número tal que β1 pα1 δ ´ηq “ α2 δ ´ρ, obteniendo de 15.2.26 que pβ1 α1 ´ α2 qpx ´ x0 q ´ β1 py ´ y0 q ` z ´ z0 “ 0, es decir Γ está incluido en el hiperplano de dimensión 2 definido como tpx, y, zq P R3 : β1 α1 x ´ β1 y ` z “ pβ1 α1 ´ α2 qx0 ´ β1 y0 ` z0 u, el cual también es un plano que por el corolario 15.2.23 es igual a Γ. ‚ 15.2.27. Teorema. Un subconjunto de R2 es una recta si y sólo si es un hiperplano de dimensión 1. Demostración. Si l es un hiperplano de dimensión 1, entonces l es de la forma tpx, yq P R2 : ax ` by “ du para algunos números a, b, c P R tales que pa, bq ‰ p0, 0q. Si a ‰ 0, entonces l “ tpx, yq P R2 : px, yq “ pd{a, 0q ` tp´b{a, 1q para algún t P Ru, la cual es una recta. Si b ‰ 0, entonces l “ tpx, yq P R2 : px, yq “ p0, d{bq ` tp1, ´a{bq para algún t P Ru, la cual también es una recta. Por otra parte, si l1 es una recta incluida en R2 , entonces existen dos puntos P “ pα, βq y Q “ pγ, δq ‰ p0, 0q tales que l1 “ tpx, yq P R2 : px, yq “ pα, βq ` tpγ, δq para algún t P Ru. Si γ ‰ 0, entonces l1 “ tpx, yq P R2 : γδ x ´ y “ α γδ ´ βu, el cual es un hiperplano de dimensión 1. Ahora, si δ ‰ 0, entonces l1 “ tpx, yq P R2 : x ´ γδ y “ α ´ β γδ u, el cual también es un hiperplano de dimensión 1. ‚ 15.2. Álgebra en Rn 445 Se deja al lector el demostrar que un subconjunto de R1 tiene un solo elemento si y sólo si es un hiperplano de dimensión 0. 15.2.28. Teorema. Si tenemos un plano γ “ tS P Rn : S “ P ` tQ ` sR para algún t P R y algún s P Ru (donde 0, Q y R son no alineados), entonces para cada S0 P Γ , existe una única pareja ordenada de números reales pt0 , s0 q tal que S0 “ P ` t0 Q ` s0 R. Demostración. Por definición de Γ , si S0 P Γ , entonces existe una pareja pt0 , s0 q P R2 tal que S0 “ P ` t0 Q ` s0 R. Si pt, sq P R2 fuera una pareja tal que S0 “ P ` tQ ` sR, entonces 0 ´s R, por lo que pt ´ t0 qQ “ ps0 ´ sqR. Ahora, si t fuera diferente de t0 , entonces Q “ 0 ` st´t 0 0, Q y R estarían alineados, lo cual contradiría el hecho de que Γ es un plano; por lo tanto t “ t0 , pero como R ‰ 0, la ecuación pt ´ t0 qQ “ ps0 ´ sqR implica que s “ s0 , de tal manera que la pareja pt0 , s0 q P R2 que satisface S0 “ P ` t0 Q ` s0 R es única. ‚ 15.2.29. Teorema. Sean l1 y l2 dos rectas paralelas incluidas en Rn tales que l1 “ tS P Rn : S “ P ` tR para algún t P Ru y Q P l2 . La recta l2 está dada por l2 “ tS P Rn : S “ Q ` tR para algún t P Ru. Demostración. Como l1 k l2 , entonces P , P ` R y Q son no alineados y el plano en el que están estos puntos, que es el mismo en el que están l1 y l2 , es Γ “ tS P Rn : S “ P ` tR ` spQ ´ P q para alguna pareja pt, sq P R2 u. Ahora, si S1 P R1 , entonces existe un t1 P R tal que S1 “ P ` t1 R y además S1 “ Q ` r1 pP ´ Qq ` t1 R, donde, por el teorema 15.2.28, necesariamente r1 “ 1. Recíprocamente, como P ` t1 R P l1 , entonces si r1 “ 1, se tiene que Q “ r1 pP ´ Qq ` t1 R P l1 . Ahora, sea S2 P l2 diferente de Q, por el teorema 15.2.28 existen dos números reales únicos r2 y t2 , tales que S2 “ Q ` r2 pP ´ Qq ` t2 R. Veamos que necesariamente r2 “ 0. Si r2 ‰ 0, entonces Q ` r12 pr2 pP ´ Qq ` t2 Rq P l2 , pero como Q ` r12 pr2 pP ´ Qq ` t2 Rq “ P ` rt22 R, entonces también pertenece a l1 , contradiciendo así el hecho de que l1 y l2 son paralelas, por lo tanto r2 “ 0 y S2 “ Q ` t2 R, teniéndose así que l2 “ tS P Rn : S “ Q ` tt2 R para algún t P Ru “ tS P Rn : S “ Q ` tR para algún t P Ru. ‚ 15.2.30. Corolario (unicidad de las paralelas). Dada una recta l1 y un punto Q que no está en l1 , existe una única recta l2 tal que l1 k l2 y Q P l2 . Demostración. Sea l1 “ tS P Rn : S “ P ` tR para algún t P Ru. El plano en el cual está incluida l1 y al cual pertenece Q es Γ “ tS P Rn : S “ P ` tR ` spQ ´ P q para alguna pareja pt, sq P R2 u, y por el teorema 15.2.28 (fijando s “ 1), tenemos que una recta paralela a l1 a la cual pertenece Q es l2 “ tS P Rn : S “ Q ` tR para algún t P Ru, y por el teorema 15.2.29 tal recta es única. ‚ 15.2.31. Teorema. Dado un plano Γ , existen tres puntos no alineados A, B y C que pertenecen a Γ . Demostración. Por definición de plano, existen tres puntos P , Q y R tales que Q, R y 0 son no alineados y Γ “ tS P Rn : S “ P ` tQ ` sR para algún t P R y algún s P Ru. Ahora, Q, R y 0 son no alineados si y sólo si son no alineados P , P ` Q y P ` R. En efecto P , P ` Q 15.2. Álgebra en Rn 446 y P ` R son alineados ðñ existe un t P R tal que P ` Q “ P ` tpP ` R ´ P q ðñ existe un t P R tal que Q “ tR ðñ Q, R y 0 son alineados. Así, tomando A “ P , B “ P ` Q y C “ P ` R y observando que estos puntos pertenecen a Γ , el teorema queda demostrado. ‚ 15.2.32. Teorema. Si tenemos un plano Γ y dos puntos A y B diferentes en el plano Γ , entonces la recta a la cual pertenecen A y B está incluida en Γ . Demostración. Por el teorema 15.2.31, existe un punto C en Γ tal que A, B y C no están alineados. Ahora, por el teorema 15.2.21 tenemos que necesariamente Γ “ tS P Rn : S “ A ` tpB ´ Aq ` spC ´ Aq para algún t P R y algún s P Ru y como la recta a la cual pertenecen A y B es l “ tS P Rn : S “ A ` tpB ´ Aq para algún t P Ru, tenemos que (al fijar s “ 0) l Ă Π. ‚ 15.2.33. Teorema. Si tenemos un hiperplano Π incluido en Rn y dos puntos P y Q diferentes en el hiperplano Π, entonces la recta a la cual pertenecen P y Q está incluida en Π. Demostración. Por definición de hiperplano, existen n números a1 , . . . , an no todos iguales n ř a cero y un número d tales que Π “ tpx1 , x2 , . . . , xn q P Rn : ak xk “ du. Para cada número k“1 natural i menor o igual que n denotemos como pi y como qi a las i-ésimas componentes de P y Q respectivamente. La recta que pasa por P y Q es l “ tS P Rn : S “ P ` tpQ ´ P q para algún t P Ru, por lo que si S P l, existe un t P R tal que S “ P ` tpQ ´ P q y como P y Q pertenecen a Π, entonces n ÿ ak ppk ` tpqk ´ pk qq “ d ` td ´ td “ d, k“1 por lo que S “ P ` tpQ ´ P q P Π, concluyendo así que l Ă Π. ‚ 15.2.34. Teorema. Si P , Q y R son tres puntos diferentes alineados, entonces se cumple solamente una de las tres afirmaciones siguientes: a) P está entre Q y R; b) Q está entre P y R; c) R está entre P y Q. Más precisamente, si R “ Q ` spP ´ Qq, entonces: R está entre P y Q si y sólo si 0 ă s ă 1; Q está entre P y R si y sólo si s ă 0; P está entre Q y R si y sólo si s ą 1. Demostración. La recta que pasa por los puntos P , Q y R es tS : S “ Q ` tpP ´ Qq para algún t P Ru, luego existe un número real s diferente de 0 y de 1, tal que R “ Q ` spP ´ Qq; pero observemos que esta última igualdad es equivalente a P “ Q ` 1s pR ´ Qq y también a 1 Q “ P ` 1´s pR ´P q. Ahora, por definición, el punto R está entre P y Q si y sólo si 0 ă s ă 1; el punto P está entre Q y R si y sólo si 0 ă 1{s ă 1, es decir si y sólo si s ą 1, y el punto Q 1 está entre P y R si y sólo si 0 ă 1´s ă 1, es decir si y sólo si s ă 0. ‚ 15.2.35. Teorema. Sean A, B y C tres puntos alineados con A ‰ C y sea t P R tal que B “ A ` tpC ´ Aq. El número t es mayor o igual que 0 si y sólo si t “ |B´A| y el número t es |C´A| menor o igual que 0 si y sólo si t “ ´ |B´A| . |C´A| 15.2. Álgebra en Rn 447 Demostración. Como |B ´ A| “ |t||C ´ A|, entonces |t| “ sólo si t ľ 0, y t “ ´ |B´A| |C´A| |B´A| , |C´A| si y sólo si t ĺ 0. por lo que t “ |B´A| |C´A| si y ‚ 15.2.36. Teorema. Sean A, B y C tres puntos diferente no alineados. Si t ą 0, P “ A ` tpB ´ Aq y Q “ A ` tpC ´ Aq, entonces |P ´ Q| “ t|B ´ C|. Es decir, si P es el punto ÝÝÑ en el rayo AB cuya distancia al punto A es t veces la distancia entre A y B, y si Q es el ÝÝÑ punto en el rayo AC cuya distancia al punto A es t veces la distancia entre A y C; entonces la distancia entre P y Q es t veces la distancia entre B y C. Q 1 C A HH H HH B H PHHH j H Demostración. |P ´ Q| “ |A ` tpB ´ Aq ´ pA ` tpC ´ Aqq| “ |tpB ´ Aq ´ tpC ´ Aq| “ |tpB ´ Cq| “ |t||B ´ C| “ t|B ´ C|. ‚ 15.2.37. Teorema. Sean A, B y C tres puntos diferente no alineados. Si 1 ‰ t ą 0, ÐÑ ÐÑ P “ A ` tpB ´ Aq y Q “ A ` tpC ´ Aq, entonces las rectas CB y QP son paralelas. Q 1 C A HH H H B H H PHH HH j ÐÑ Demostración. Como A, B y C son no alineados, entonces P, Q R CB. Ahora, Q ´ P “ ÐÑ tpC ´ Bq, por lo que la recta QP es igual a tS : S “ P ` spC ´ Bq para algún s P Ru, la cual ÐÑ es paralela a tS : S “ B ` spC ´ Bq para algún s P Ru “ CB. ‚ 448 15.3. 15.3. Trayectorias y sus longitudes Trayectorias y sus longitudes En esta sección estudiaremos brevemente el concepto de longitud de una trayectoria que servirá, entre otras cosas, para definir adecuadamente a las funciones trigonométricas. La siguiente definición de continuidad es similar a la usada para funciones reales. 15.3.1. Definición. Sea I un intervalo de números reales. Una función ϕ : I ÝÑ Rn es continua en x0 P I si para todo ε ą 0 existe un δ ą 0 tal que si |y ´ x0 | ă δ e y P I, entonces |ϕpyq ´ ϕpx0 q| ă ε. Diremos que ϕ es continua si es continua en todo elemento de I. 15.3.2. Definición. Sea I un intervalo. Cuando ϕ : I ÝÑ Rn es continua decimos que el recorrido de ϕ es una trayectoria o, si queremos ser más específicos, que es la trayectoria de ϕ. 15.3.3. Definiciones. Sean a, b P R diferentes con a ă b. Cuando ϕ : ra; bs ÝÑ Rn es continua e inyectiva, diremos que la trayectoria de ϕ es un arco o una trayectoria simple con extremos, y se dice que los puntos ϕpaq y ϕpbq son los extremos de la trayectoria. En general se le llama arco o trayectoria simple con extremos a cualquier conjunto que sea homeomorfo al intervalo r0; 1s. Cuando ϕ es continua, ϕpaq “ ϕpbq y además ϕpxq ‰ ϕpyq para x e y diferentes y pertenecientes al intervalo ra; bq, diremos que la trayectoria de ϕ es una trayectoria cerrada simple. Una trayectoria simple es una trayectoria simple con extremos o una trayectoria cerrada simple. trayectoria simple con extremos trayectoria cerrada simple 15.3.4. Observación. Si γ es una trayectoria simple con extremos, la definición de sus extremos no depende de la función ϕ de la cual es trayectoria. En efecto, si γ es la trayectoria de dos funciones continuas e inyectivas ϕ : ra; bs ÝÑ Rn y ψ : rc; ds ÝÑ Rn , entonces la función ψ ´1 ˝ ϕ : ra; bs ÝÑ rc; ds es continua (teoremas 14.3.12 y 14.3.13) e inyectiva (la composición de funciones inyectivas es una función inyectiva), más aún ψ ´1 ˝ϕrta, bus “ tc, du (teorema 10.5.25), por lo que ϕrta, bus “ ψrtc, dus, es decir los dos extremos de γ son ψpcq y ψpdq. 15.3.5. Definición. A una trayectoria que está incluida en un plano se le llamará trayectoria plana. 15.3.6. Definiciones. Sea I un intervalo de números reales. Cuando una trayectoria es la trayectoria de una función continua ϕ : I ÝÑ Rn , diremos que ϕ es una parametrización de la trayectoria. Cuando una trayectoria simple con trayectoria plana no simple extremos γ tenga una parametrización inyectiva ϕ : ra; bs ÝÑ R, diremos que ϕ es una parametrización simple de γ. En el caso en que γ sea una trayectoria cerrada simple y 15.3. Trayectorias y sus longitudes 449 ϕ : ra; bs ÝÑ Rn sea una parametrización de γ tal que ϕpaq “ ϕpbq y además ϕpxq ‰ ϕpyq para x e y diferentes y pertenecientes al intervalo ra; bq, diremos que ϕ es una parametrización simple de γ. 15.3.7. Observación. Una trayectoria puede tener varias parametrizaciones. Por ejemplo el segmento con extremos P y Q tiene la parametrización ϕ : r0; 1s ÝÑ Rn dada por ϕptq “ tP ` p1 ´ tqQ, la parametrización ψ : r0; 1s ÝÑ Rn dada por ψptq “ p1 ´ tqP ` tQ, la parametrización η : r0; 1s ÝÑ Rn dada por γptq “ p1 ´ t2 qP ` t2 Q, o bien la parametrización τ : r0; 12 s ÝÑ Rn dada por τ ptq “ p1 ´ 2tqP ` 2tQ. 15.3.8. Definición. Si ϕ : I ÝÑ Rn es una función, decimos que ϕi : I ÝÑ R, con i P t1, 2, . . . , nu, es una función componente (la i-ésima función componente) de ϕ, si para todo x P I tenemos que ϕi pxq es la i-ésima componente de ϕpxq. Mientras no se establezca lo contrario, a la k-ésima función componente de una función ϕ la denotaremos por ϕk . 15.3.9. Teorema. Sea I un intervalo y x0 P I. Una función ϕ : I ÝÑ Rn es continua en x0 si y sólo si sus funciones componentes son continuas en x0 . Demostración. Supongamos primero que las funciones componentes ϕ1 , ϕ2 , . . . , ϕn de ϕ son continuas en x0 P I. Para ε ą 0 existen n números positivos δ1 , δ2 , . . . , δn tales que para todo k P t1, 2, . . . , nu se tiene ε |y ´ x0 | ă δk e y P I ùñ |ϕk px0 q ´ ϕk pyq| ă , n por lo que si hacemos δ “ míntδ1 , δ2 , . . . , δn u tenemos entonces que n n ÿ ÿ ε ĺ ε, |y ´ x0 | ă δ e y P I ùñ |px0 q ´ pyq| ĺ |ϕk px0 q ´ ϕk pyq| ă n k“1 k“1 por lo tanto ϕ es continua en x0 . Supongamos ahora que ϕ es continua en x0 . Dado ε ą 0 existe un δ ą 0 tal que si |y´x0 | ă δ e y P I, entonces |ϕpyq ´ ϕpx0 q| ă ε. Pero como |ϕk pyq ´ ϕk px0 q| ĺ |ϕpyq ´ ϕpx0 q| ă ε para todo k P t1, 2, . . . , nu, entonces cada una de las funciones componentes de ϕ son continuas. ‚ 15.3.10. Corolario. Sea I un intervalo. Una función ϕ : I ÝÑ Rn es continua si y sólo si sus funciones componentes son continuas. Demostración. La función ϕ es continua ðñ ϕ es continua en cada elemento de I ðñ cada ϕk es continua en cada elemento de I ðñ cada ϕk es continua. ‚ 15.3.11. Definición. Dado un intervalo cerrado ra; bs, decimos que ∆ es una partición del intervalo ra; bs si ∆ es una sucesión finita pxk qnk“0 , donde x0 “ a, xk ă xk`1 para k P t0, 1, . . . , n ´ 1u y xn “ b. Al conjunto de todas las particiones del intervalo ra; bs lo denotaremos por Pba . 15.3.12. Definición. Si γ es una trayectoria simple y ϕ : ra; bs ÝÑ Rn es una parametrización simple de γ, definimos la longitud de γ como # + n ÿ `pγq :“ sup |ϕpxk q ´ ϕpxk´1 q| : px0 , x1 , . . . , xn q P Pba . k“1 Cuando `pγq P R diremos que γ tiene longitud finita o que es rectificable, de otro modo diremos que tiene longitud infinita. 450 15.3. Trayectorias y sus longitudes Se deja al lector el verificar que la longitud de una trayectoria simple no depende de la parametrización simple dada, así como el que esta definición no contradice la de longitud de un segmento. 15.3.13. Definición. Cualquier segmento cuyos extremos son dos puntos de una trayectoria γ se dice que es una cuerda de γ. De la definición de longitud se sigue inmediatamente el siguiente teorema. 15.3.14. Teorema. La longitud de cualquier trayectoria simple es mayor o igual que la de cualquiera de sus cuerdas. 15.3.15. Teorema. Sean: ϕ : ra; bs ÝÑ Rn una parametrización simple de una trayectoria simple γ; x un elemento del intervalo abierto pa; bq; ϕ1 : ra; xs ÝÑ Rn y ϕ2 : rx; bs ÝÑ Rn restricciones de ϕ con sus trayectorias respectivas γ1 y γ2 . Tenemos que `pγq “ `pγ1 q ` `pγ2 q. Demostración. Demostremos primero que `pγq ľ `pγ1 q ` `pγ2 q. Para cada ∆1 “ px0 , . . . , xn q P Pxa y ∆2 “ py0 , . . . , ym q P Pbx tenemos que px0 , . . . , xn , y1 , . . . , ym q P Pba , por lo cual `pγq ľ n ÿ |ϕpxk q ´ ϕpxk´1 q| ` k“1 m ÿ |ϕpyk q ´ ϕpyk´1 q|. k“1 Dejando fijo ∆1 y tomando el supremo sobre las particiones ∆2 tenemos que n ÿ `pγq ľ |ϕpxk q ´ ϕpxk´1 q| ` `pγ2 q. k“1 Ahora, si en esta última desigualdad tomamos el supremo sobre todas las particiones ∆1 , obtenemos `pγq ľ `pγ1 q ` `pγ2 q. Demostremos ahora que `pγq ĺ `pγ1 q ` `pγ2 q. Sea ∆ “ pt0 , t1 , . . . , ts q P Pba . Si x es una componente de ∆, entonces existe un entero positivo i ă s tal que x “ ti , obteniéndose así que pt0 , . . . , ti q P Pxa y pti , . . . , ts q P Pbx , de donde s ÿ k“1 |ϕptk q ´ ϕptk´1 q| “ i ÿ k“1 |ϕptk q ´ ϕptk´1 q| ` s ÿ k“i`1 |ϕptk q ´ ϕptk´1 q| ĺ `pγ1 q ` `pγ2 q, 15.3. Trayectorias y sus longitudes es decir s ÿ 451 |ϕptk q ´ ϕptk´1 q| ĺ `pγ1 q ` `pγ2 q. k“1 Veamos que la última desigualdad también es válida si x no es una componente de ∆. Si x no es una componente de ∆, existe un entero positivo i ĺ s tal que ti´1 ă x ă ti , obteniéndose que pt0 , t1 , . . . , ti´1 , xq P Pxa y px, ti , . . . , ts q P Pbx y al usar la desigualdad del triángulo 15.2.17 obtenemos ˜ ¸ s i´1 ÿ ÿ |ϕptk q ´ ϕptk´1 q| ĺ |ϕptk q ´ ϕptk´1 q| ` |ϕpxq ´ ϕpti´1 q| k“1 k“1 ˜ ` s ÿ |ϕpti q ´ ϕpxq| ` ¸ |ϕptk q ´ ϕptk´1 q| ĺ `pγ1 q ` `pγ2 q, k“i`1 es decir s ÿ |ϕptk q ´ ϕptk´1 q| ĺ `pγ1 q ` `pγ2 q k“1 para cualquier partición ∆ “ pt0 , t1 , . . . , ts q P Pba , de donde al tomar el supremo sobre todos los ∆ se obtiene `pγq ĺ `pγ1 q ` `pγ2 q. ‚ 15.3.16. Teorema. Sea r ą 0. La circunferencia incluida en R2 con centro en el origen 0 “ p0, 0q y radio r es una trayectoria cerrada simple con longitud finita. Demostración. Por definición de circunferencia y de distancia entre dos puntos, tenemos que la circunferencia con centro en el origen y radio r es el conjunto de todos los puntos px, yq que satisfacen la ecuación x2 ` y 2 “ r 2 , ? ? por lo que el punto px, yq está en la circunferencia si y sólo si y “ r2 ´ x2 ó y “ ´ r2 ´ x2 , con x P r´r; rs. Ahora, la circunferencia tpx, yq : x2 ` y 2 “ r2 u es la unión de γ1 “ tpx, yq : x2 `y 2 “ r2 e y ľ 0u y γ2 “ tpx, yq : x2 `y 2 “ r2 e y ĺ 0u, y la intersección de estos dos últimos conjuntos es tp´r, 0q, pr, 0qu. Tenemos además que una parametrización simple ? de γ1 con 2 extremos p´r, 0q y pr, 0q es la función ψ1 : r´r; rs ÝÑ R definida como ψ1 ptq “ pt, r2 ´ t2 q, mientras que ? una parametrización simple de γ2 es la función ψ2 : r´r; rs ÝÑ R2 definida como ψ2 ptq “ pt, ´ r2 ´at2 q, aunque también lo es la función ψ2˚ : rr; 3rs ÝÑ R2 definida como ψ2˚ ptq “ p´t`2r, ´ r2 ´ pt ´ 2rq2 q. Utilizando las parametrizaciones anteriores podemos dar una parametrización simple de la circunferencia completa mediante la función ψ : r´r; 3rs ÝÑ R2 dada por # ψ1 ptq si t P r´r; rs ψptq “ ψ2˚ ptq si t P rr; 3rs , observando así que la circunferencia es una trayectoria cerrada simple. Demostremos ahora que la trayectoria ψrr0; rss tiene longitud menor o igual que 2r. Si ∆ “ pt0 , t1 , . . . , tn q es una partición del intervalo r0; rs, entonces n ÿ k“1 |ψ1 ptk q ´ ψ1 ptk´1 q| ĺ n ÿ k“1 p|tk ´ tk´1 | ` |yk ´ yk´1 |q, 452 15.3. Trayectorias y sus longitudes a donde yk “ r2 ´ t2k para k P t0, 1, 2, . . . , nu y además r “ y0 ą y1 ą ¨ ¨ ¨ ą yn “ 0, por lo que n ř p|tk ´ tk´1 | ` |yk ´ yk´1 |q “ 2r y así `pψrr0; rssq ĺ 2r. Análogamente podemos demostrar k“1 que `pψrrr; 0ssq ĺ 2r, por lo que debido al teorema 15.3.15 tenemos que `pγ1 q ĺ 4r. Usando, para hacer los cálculos más simples, a ψ2 como parametrización simple de γ2 , se demuestra análogamente que `pγ2 q ĺ 4r y utilizando de nuevo el teorema 15.3.15 obtenemos que la longitud de la circunferencia es menor o igual que 8r. ‚ 15.3.17. Definición. Definimos el número π (léase pi) como la mitad de la longitud de una circunferencia incluida en R2 con centro en el origen y radio 1. Es decir la longitud de tal circunferencia es 2π. 15.3.18. Teorema. Sea γ una trayectoria simple, con longitud finita s y parametrización simple ϕ : ra; bs ÝÑ Rn . La función f : ra; bs ÝÑ r0; ss, tal que f paq “ 0 y a cada x P pa; bs le asigna la longitud de γx :“ ϕrra; xss, es una función continua y estrictamente creciente. Demostración. La función f es estrictamente creciente pues si a ă x1 ă x2 ĺ b, entonces f px1 q “ `pγx1 q ă `pγx1 q ` |f px2 q ´ f px1 q| ĺ `pγx1 q ` `pϕ rrx1 ; x2 ssq “ `pγx2 q “ f px2 q. (Para el caso en que a “ x1 ă x2 ĺ b tenemos que f px1 q “ 0 ă `pγx2 q “ f px2 q). Demostremos ahora que f es continua en a, es decir que para todo ε ą 0 existe un δ ą 0 tal que |t ´ a| ă δ y a ă t ĺ b ùñ |f ptq ´ f paq| ă ε. Como f es estrictamente creciente, podemos observar que el hecho de que no sea continua en a implica que existe un ε ą 0 tal que f ptq ľ ε para todo t P pa; bs. Para cualquier y0 P pa; bq existe una partición px0 , x1 , . . . , xn q P Pya0 tal que n1 ÿ ε |ϕpx1,k q ´ ϕpx1,k´1 q| ą . 2 k“1 Al tomar un número y1 en el intervalo abierto pa; x1,1 q tal que |ϕpx1,1 q ´ ϕpaq| ă que |ϕpy1 q ´ ϕpaq| ` |ϕpx1,1 q ´ ϕpy1q| ľ |ϕpx1,1 q ´ ϕpaq| tenemos que |ϕpx1 q ´ ϕpy1 q| ` ε 4 y observar n ÿ ε |ϕpxk q ´ ϕpxk´1 q| ą , 4 k“2 por lo que `pϕrry1 ; y0 ssq ą 4ε . De manera análoga, existe un y2 P pa; y1 q tal que `pϕrry2 ; y1 ssq ą 4ε y de manera recursiva, para cualquier entero positivo m, una vez determinado el ym P pa; ym´1 q tal que `pϕrrym ; ym´1 ssq ą 4ε , podemos tomar un ym`1 P pa; ym q tal que `pϕrrym`1 ; ym ssq ą 4ε . Ahora, por la propiedad arquimediana, existe un número natural N tal que N4ε ą s, de modo que aplicado N ` 1 veces el teorema 15.3.15 tenemos que `pγq “ `pϕ rry0 ; bssq ` N ÿ m“1 `pϕ rrym ; ym´1 ssq ` `pϕ rra; yN ssq ą Nε ą s, 4 lo cual contradice el hecho de que `pγq “ s, por lo que f es continua en a. Para demostrar que f es continua en b tomemos la parametrización simple de γ dada por ψ : r´b; ´as ÝÑ Rn tal que ψptq “ ϕp´tq y definamos gpxq :“ `pψrr´b; xssq “ s ´ f p´xq, 15.3. Trayectorias y sus longitudes 453 por lo que g es continua en ´b, pero en general g es continua t si y sólo si f es continua en ´t, por lo tanto f es continua en b. Veamos ahora la continuidad de f en un número x P pa; bq con las observaciones dadas a continuación. La demostración de que f es continua por la izquierda en x se hace de la misma forma que la de que f es continua en b pero tomando `pγx q en lugar de s. La demostración de que f es continua por la derecha en x se hace de manera análoga a la de demostrar que es continua en a, pero tomando `pγq ´ `pγx q en lugar de s. ‚ 15.3.19. Corolario. Sea γ una trayectoria simple, con longitud finita s. Existe una parametrización simple ψ : r0; ss ÝÑ γ de la trayectoria γ tal que para todo t P p0; ss la longitud de ψrr0; tss es t. Demostración. Del teorema 15.3.18 tenemos que si tomamos una parametrización simple ϕ : ra; bs ÝÑ Rn y una función continua y estrictamente creciente f : ra; bs ÝÑ r0; ss, tal que f paq “ 0 y a cada x P pa; bs le asigna la longitud de γx :“ ϕrra; xss. Por el teorema del valor intermedio, f es una correspondencia biunívoca entre ra; bs y r0; ss, de modo que por el teorema 10.5.26, la función f ´1 : r0; ss ÝÑ ra; bs es continua e inyectiva, por lo que ψ :“ ϕ ˝ f ´1 es la parametrización simple de γ tal que para todo t P p0; ss la longitud de ψrr0; tss es t. ‚ 15.3.20. Teorema. Sea γ una trayectoria simple con extremos, con longitud finita s y con parametrización simple ϕ : ra; bs ÝÑ Rn . Sea además f : ra; bs ÝÑ r0; ss tal que f paq “ 0 y a cada x P pa; bs le asigna la longitud de γx :“ ϕrra; xss. Si 0 ă r ă s, entonces existe un único número t entre a y b tal que f ptq “ r. Demostración. Sea 0 ă r ă s. Del teorema 15.3.18 se tiene que f es continua y estrictamente creciente. Como f es continua, entonces por el teorema del valor intermedio se sigue que existe un t entre a y b tal que f ptq “ r, pero como f es estrictamente creciente, entonces es inyectiva, por lo que el valor de t es único. ‚ 15.3.21. Definición. Sea I un intervalo, η : I ÝÑ Rn una parametrización de alguna trayectoria γ y para cada k P Jn sea ηk la k-ésima función componente de η; es decir para cada t P I tenemos ηptq “ pη1 ptq, η2 ptq, . . . , ηn ptqq. Decimos que η es derivable en t0 P I si 0q existe. En tal caso el límite anterior se denota como η 1 pt0 q y se dice que es la lím ηptq´ηpt t´t0 tÑt0 derivada de η en t0 . Cuando η 1 ptq exista para todo t P I, se dice que η es derivable y la función η 1 : I ÝÑ1 Rn se llama la derivada de η. tÞÑη ptq Si ηptq representa la posición de una partícula en el tiempo t, entonces |η 1 ptq| es la rapidez con la que se mueve la partícula en el tiempo t y en el caso en que tal rapidez se diferente de 0 tenemos que |η11ptq| η 1 ptq es un vector de norma 1 que indica la dirección en la cual se mueve la partícula en el tiempo t. En los casos prácticos en que la función η describe el movimiento de una partícula ya sea en R, R2 ó R3 , la derivada η 1 siempre existirá y además será una función continua. 15.3.22. Teorema. Sea η : I ÝÑ Rn una parametrización y para cada k P Jn sea ηk la k-ésima función componente de η. La parametrización η es derivable en t0 si y sólo si cada ηk es derivable en t0 . En el caso en que η sea derivable en t0 se tiene que η 1 pt0 q “ pη11 pt0 q, η21 pt0 q, . . . , ηn1 pt0 qq. 454 15.3. Trayectorias y sus longitudes Demostración. Supongamos primero que cada ηk es derivable en t0 . Para cada ε ą 0 sea δ ą 0 tal que para todo k P Jn se tiene ˇ ˇ ˇ ε ˇ ηk ptq ´ ηk pt0 q 1 ˇ ´ ηk pt0 qˇˇ ă . 0 ă |t ´ t0 | ă δ ùñ ˇ t ´ t0 n Tenemos que si |t ´ t0 | ă δ, entonces ˇ ˇ ˇ ˇ ˇ ˇ pηj ptq ´ ηj pt0 qqnj“1 ˇ ˇ ηptq ´ ηpt0 q n ˇ n ˇ 1 1 ˇ ˇ pt qq “ pt qq ´ pη ´ pη 0 0 j“1 ˇ j“1 ˇ j j ˇ ˇ t ´ t0 t ´ t0 ˇ ˇ n ˇ n ÿ ˇ ÿ ε ˇ ηj ptq ´ ηj pt0 q ´ ηj1 pt0 qˇ ă ĺ “ ε, ˇ ˇ t ´ t0 n j“1 j“1 por lo tanto si cada ηk1 es derivable en t0 , entonces η es derivable en t0 y η 1 pt0 q “ pη11 pt0 q, η21 pt0 q, . . . , ηn1 pt0 qq. Supongamos ahora que η es derivable en t0 y para cada k sea ηk˚ la k-ésima componente de η 1 pt0 q. Tenemos que para todo ε ą 0 existe un δ ą 0 tal que ˇ ˇ ˇ ηptq ´ ηpt0 q ˇ 0 ă |t ´ t0 | ă δ ùñ ˇˇ ´ η 1 pt0 qˇˇ ă ε. t ´ t0 Tenemos que si 0 ă |t ´ t0 | ă δ, entonces ˇ ˇ ˇˇˆ ˙n ˇˇ ˇ ηk ptq ´ ηk pt0 q ˇ η ptq ´ η pt q ˇ j ˇ j 0 ˇ ´ ηk˚ ˇˇ ĺ ˇ ´ ηj˚ ˇ ˇ ˇ ˇ t ´ t0 t ´ t0 j“1 ˇ ˇ ˇ ˇ ηptq ´ ηpt0 q ´ η 1 pt0 qˇˇ ă ε, “ ˇˇ t ´ t0 por lo que cada ηk es derivable en t0 y además ηk1 pt0 q “ ηk˚ , es decir η 1 pt0 q “ pη11 pt0 q, η21 pt0 q, ‚ . . . , ηn1 pt0 qq. 15.4. Ortogonalidad 15.4. 455 Ortogonalidad 15.4.1. Definición. Decimos que dos puntos P y Q pertenecientes a Rn son ortogonales si P ¨ Q “ 0. Por ejemplo los puntos p1, 1, 0q y p0, 0, 1q en R3 son ortogonales, también en R2 son ortogonales los puntos pa, bq y p1, ´ ab q siempre que b sea diferente de cero. 15.4.2. Definición. Si tenemos una recta que pasa por dos puntos diferentes P y Q, podemos observar que el conjunto Π “ tA P Rn : pA ´ Qq ¨ pP ´ Qq “ 0u es un hiperplano. Diremos que tal hiperplano es ortogonal en Q a la recta que pasa por los puntos P y Q (también se dice que tal recta es ortogonal en Q a dicho hiperplano). Observemos que la definición anterior no depende de la elección que se haya hecho del punto P en la recta, con tal de que éste sea diferente de Q. En efecto, si S “ Q ` tpP ´ Qq y t ‰ 0, entonces pA ´ Qq ¨ pP ´ Qq “ 0 ðñ tpA ´ Qq ¨ pP ´ Qq “ 0 ðñ pA ´ Qq ¨ ptpP ´ Qqq “ 0 ðñ pA ´ Qq ¨ pQ ` tpP ´ Qq ´ Qq “ 0 ðñ pA ´ Qq ¨ pS ´ Qq “ 0. Conservemos la notación y terminología de la definición anterior y veamos que si A P Π, entonces la distancia entre A y P es la misma que la distancia entre A y 2Q ´ P . Para esto tomemos A “ pa1 , . . . , an q, P “ pp1 , . . . , pn q y Q “ pq1 , . . . , qn q teniendo así d d n n ÿ ÿ |A ´ p2Q ´ P q| “ pak ´ 2qk ` pk q2 “ ppak ´ qk q ` ppk ´ qk qq2 k“1 d n ÿ “ k“1 pak ´ qk q2 ` k“1 d n ÿ “ n ÿ “ pak ´ qk q2 ` n ÿ “ pak ´ qk q2 ` n ÿ “ pak ´ qk q2 ` n ÿ “ ppk ´ qk q2 ` 2pA ´ Qq ¨ pP ´ Qq n ÿ ppk ´ qk q2 n ÿ ppk ´ qk q2 ´ 2pA ´ Qq ¨ pP ´ Qq k“1 pak ´ qk q2 ` k“1 d pak ´ qk qppk ´ qk q k“1 k“1 k“1 d n ÿ n ÿ k“1 k“1 d ppk ´ qk q2 ` 2 k“1 k“1 d n ÿ n ÿ ppk ´ qk q2 ´ 2 k“1 n ÿ pak ´ qk qppk ´ qk q k“1 d ppak ´ qk q ´ ppk ´ qk qq2 “ k“1 n ÿ pak ´ pk q2 “ |A ´ P |. k“1 De las igualdades anteriores, al utilizar el hecho de que d n n ÿ ÿ 2 |A ´ P | “ pak ´ qk q ` ppk ´ qk q2 , k“1 k“1 tenemos que |A ´ P |2 “ |A ´ Q|2 ` |P ´ Q|2 . Enunciemos estos dos últimos resultados como teoremas. 15.4.3. Teorema. Sean P y Q dos puntos diferentes. Si Π es el hiperplano ortogonal en el 456 15.4. Ortogonalidad punto Q a la recta que pasa por P y Q, y A P Π, entonces la distancia entre A y P es la misma que la distancia entre A y 2Q ´ P . 15.4.4. Teorema. Si A, P y Q son tres puntos tales que pA ´ Qq ¨ pP ´ Qq “ 0, entonces |A ´ P |2 “ |A ´ Q|2 ` |P ´ Q|2 . 15.4.5. Definición. Cuando nuestro espacio sea Rn , diremos que una recta l1 es ortogonal a otra recta l2 en un punto Q si ambas rectas pasan por Q y l2 está incluida en el hiperplano ortogonal a l1 en Q. También se dice que l1 y l2 son ortogonales (en Q). En el caso en que n ľ 3, diremos que un plano Γ (de dimensión 2) y una recta l son ortogonales en un punto Q, si tanto el plano como la recta pasan por Q y Γ está incluida en el hiperplano ortogonal a l1 en Q. Veamos que dada una recta incluida en Rn que pasa por dos puntos diferentes P y Q, y un punto R P Rn que no esté en la recta, siempre existe un único hiperplano ortogonal a tal recta y al cual pertenece R. 15.4.6. Teorema. Sean P , Q y R tres puntos diferentes no alineados en Rn y l una recta tal que P , Q P l. Existe un único hiperplano ortogonal a l al cual pertenece R. Además, el ´Qq pP ´ Qq. punto donde se interseca la recta l y el hiperplano ortogonal es Q ` pR´Qq¨pP |P ´Q|2 Demostración. Como el punto Q ` P ‰Q` pR´Qq¨pP ´Qq pP |P ´Q|2 pR´Qq¨pP ´Qq pP |P ´Q|2 ´ Qq P l, tenemos por definición que si ´ Qq, entonces el hiperplano ortogonal a l en tal punto es ! Π :“ A P Rn : pA ´ Q ´ pR´Qq¨pP ´Qq pP |P ´Q|2 ´ Qqq ¨ pP ´ Q ´ pR´Qq¨pP ´Qq pP |P ´Q|2 ) ´ Qqq “ 0 . Pero R P Π. En efecto, pR ´ Q ´ pR´Qq¨pP ´Qq pP |P ´Q|2 “ ppR ´ Qq ´ pR´Qq¨pP ´Qq pP |P ´Q|2 “ pR ´ Qq ¨ pP ´ Qq ´ Ahora, si P “ Q ` ´ Qqq ¨ pP ´ Q ´ ´ Qqq ¨ ppP ´ Qq ´ ppR´Qq¨pP ´Qqq2 pR´Qq¨pP ´Qq pP |P ´Q|2 Rn : pA ´ P q ¨ pQ ´ P q “ 0u y pR´Qq¨pP ´Qq pP |P ´Q|2 |P ´Q|2 ´ Qqq pR´Qq¨pP ´Qq pP |P ´Q|2 ´ pR ´ Qq ¨ pP ´ Qq ` ´ Qqq ppR´Qq¨pP ´Qqq2 |P ´Q|2 “ 0. ´ Qq, entonces el hiperplano ortogonal a l en P es tA P pR´Qq¨pP ´Qq |P ´Q|2 “ 1, teniéndose también que R pertenece al ´Qq hiperplano ortogonal a l en P , en efecto, pR ´ P q ¨ pQ ´ P q “ pP ´ Rq ¨ pR´Qq¨pP pP ´ Qq “ |P ´Q|2 ´Qq ´Qq ppP ´ Qq ` pQ ´ Rqq ¨ pR´Qq¨pP pP ´ Qq “ pR ´ Qq ¨ pP ´ Qq ´ pR´Qq¨pP pR ´ Qq ¨ pP ´ Qq “ |P ´Q|2 |P ´Q|2 pR ´ Qq ¨ pP ´ Qq ´ 1pR ´ Qq ¨ pP ´ Qq “ 0. Demostremos que tal plano, ortogonal a la recta l y al cual pertenece R es único. Procedamos por contradicción y supongamos que hay dos planos diferentes Π1 y Π2 a los cuales pertenece R tales que el primero es el plano perpendicular a l en un punto B1 P l y el segundo es el plano perpendicular a l en un punto B2 P l, donde B1 ‰ B2 (de otro modo Π1 sería igual a Π2 ). Por el teorema 15.4.4 tenemos que 15.4. Ortogonalidad 457 |B2 ´R|2 “ |B1 ´R|2 `|B2 ´B1 |2 “ |B2 ´R|2 `|B2 ´B1 |2 `|B2 ´B1 |2 “ |B2 ´R|2 `2|B2 ´B1 |2 , lo cual es imposible si B2 ‰ B1 . ‚ 15.4.7. Corolario. Sean P , Q y R tres puntos diferentes en Rn no alineados y l una recta tal que P, Q P l. Existe una única recta l1 ortogonal a l, a la cual pertenece R. Además, el ´Qq punto donde se intersecan l y l1 es Q ` pR´Qq¨pP pP ´ Qq. |P ´Q|2 Demostración. Por el teorema 15.4.6, existe un único hiperplano ortogonal a l al cual ´Qq pP ´ Qq. Sea l1 la recta que pertenece R y tal plano corta a l en el punto Q ` pR´Qq¨pP |P ´Q|2 ´Qq pasa por R y Q ` pR´Qq¨pP pP ´ Qq, por el teorema 15.2.33 tenemos que l1 está incluida en |P ´Q|2 ´Qq pP ´ Qq, por lo que es ortogonal a l y como el hiperplano ortogonal a l en Q ` pR´Qq¨pP |P ´Q|2 el hiperplano ortogonal a l al cual pertenece R es único, entonces cualquier recta ortogonal a l, a la cual pertenece R, debe estar incluida en dicho hiperplano y debe cortar a l en ´Qq Q ` pR´Qq¨pP pP ´ Qq, pero como por dos puntos diferentes solamente pasa una recta, |P ´Q|2 entonces tal recta necesariamente es l1 . ‚ 15.4.8. Teorema. Si P y Q son puntos diferentes de 0 y ortogonales en Rn , entonces los puntos P , Q y 0 son no alineados. Demostración. Si fueran alineados, entonces existiría un número real t diferente de cero, tal que P “ tQ, de tal suerte que P ¨ Q “ tQ ¨ Q “ t|Q|2 ‰ 0, contradiciendo el hecho de que P y Q son ortogonales. ‚ 15.4.9. Corolario. Si Γ es un plano, Q P Γ , u y v son puntos ortogonales con norma 1 y además Q ` u, Q ` v P Γ . Entonces cualquier punto del plano Γ se puede representar de manera única como una suma de la forma Q ` αu ` βv, para algunos α, β P R. Recíprocamente, cualquier suma de la forma Q ` αu ` βv con α, β P R, es un punto del plano Γ. Demostración. El resultado se sigue del teorema 15.4.8 y de los teoremas 15.2.21 y 15.2.28. ‚ 15.4.10. Definición. Cuando tengamos dos o más puntos con norma 1 que sean ortogonales entre sí, diremos que tales puntos son ortonormales y que el conjunto cuyos elementos son tales puntos es un conjunto ortonormal. 15.4.11. Definición. Sean Γ un plano; Q P Γ ; u y v dos puntos ortonormales tales que Q ` u, Q ` v P Γ , y la recta l “ tQ ` αu : α P Ru Ă Γ . A los conjuntos Γ1 “ tQ ` αu ` βv : α P R y β ą 0u y Γ2 “ tQ ` αu ` βv : α P R y β ă 0u se llama semiplanos de Γ o lados de la recta l en el plano Γ . También se dice que la recta l es la arista o el borde de estos semiplanos y que los semiplanos Γ1 y Γ2 son lados opuestos, o que uno es el opuesto del otro. Observemos que los dos lados de una recta en un plano son conjuntos convexos y disjuntos, además si un segmento tiene sus extremos en lados opuestos de una recta, éste corta a la recta. Si tenemos un plano Γ al cual pertenecen el origen y dos puntos ortonormales u y v, entonces, por el corolario 9, para cualquier punto P P Γ existen dos números α y β tales que P “ αu`βv. Al efectuar la operación de producto punto de P con u y de P con v obtenemos P ¨u “ pαu`βvq¨u “ αu¨u`βv¨u “ α y también P ¨v “ pαu`βvq¨v “ αu¨v`βv¨v “ β. En 458 15.4. Ortogonalidad general, si tenemos un conjunto ortonormal con n puntos diferentes tu1 , u2 , . . . , uk , . . . , un u n n ř ř yP “ xk uk , entonces P ¨ ui “ xk uk ¨ ui “ xi , teniéndose así el siguiente teorema. k“1 k“1 15.4.12. Teorema. Si tu1 , u2 , . . . , uk , . . . , um u Ă Rn es un conjunto ortonormal con m m ř elementos y P “ xk uk , entonces P ¨ ui “ xi . k“1 15.4.13. Definiciones. A los puntos que tengan norma 1 se les llama puntos unitarios. Si P, u P Rn y u es un punto unitario, al valor P ¨ u se le llama componente de P en la dirección de u. La proyección ortogonal de P en una recta l se define como el punto donde se cortan l y la recta ortogonal a l que pasa por P (en el caso en que P P l, la proyección ortogonal de P en l es P ). De manera similar cuando Π es un plano o un hiperplano, se define la proyección ortogonal de P en Π como el punto donde se cortan Π y la recta ortogonal a Π que pasa por P . Si Ω Ă Rn es un conjunto no vacío y P P Rn , definimos la distancia de P a Ω (o entre P y Ω) como el ínf t|A ´ P | : A P Ωu. 15.4.14. Teorema. Sean P , Q y R tres puntos diferentes no alineados en Rn , l la recta que 1 pR ´ Qq y pasa por R y Q, S la proyección ortogonal de P en l, u el punto unitario |R´Q| 1 v el punto unitario |P ´S| pP ´ Sq. El punto P se puede expresar como P “ Q ` αu ` βv, donde α es la componente de P ´ Q en la dirección de u, β es la componente de P ´ Q en la dirección de v, S “ Q ` αu y los puntos u y v son ortonormales. Demostración. Como l “ tA P Rn : A “ Q ` tu para algún t P Ru, tenemos que existe un α P R, tal que S “ Q ` αu. Ahora, si β “ |P ´ S|, entonces P ´ S “ βv, por lo cual S ´ Q “ αu y P “ Q ` pS ´ Qq ` pP ´ Sq “ Q ` αu ` βv, es decir P ´ Q “ αu ` βv. Por el teorema 15.4.12 tenemos que α es la componente de P ´ Q en la dirección de u y β es la componente de P ´ Q en la dirección de v. Como la recta l y la recta que pasa por los puntos P y S son ortogonales, entonces pR ´ Sq ¨ pP ´ Sq “ 0 y pQ ´ Sq ¨ pP ´ Sq “ 0, por lo que al restar tenemos que pR ´ Qq ¨ pP ´ Sq “ 0, es decir |R ´ Q|βu ¨ v “ 0 y como |R ´ Q|, β ą 0, entonces u ¨ v “ 0, por lo tanto u y v son ortonormales. ‚ 15.4.15. Teorema. Si l Ă Rn es una recta (o un hiperplano o un plano), R un punto de Rn y P es un punto de l por el cual pasa una recta ortogonal a l, entonces la distancia entre l y R es la distancia entre P y R. Demostración. Si R P l, es obvio que la distancia entre l y R es cero y como en este caso R “ P , también la distancia entre P y R es cero. Si R R l y Q P l, entonces, por el teorema 4, se tiene que |Q ´ R|2 “ |Q ´ P |2 ` |P ´ R|2 ľ |R ´ P |2 , por lo que |Q ´ R| ľ |R ´ P |. Es decir, la distancia entre P y R es la mínima de las distancias entre R y algún punto de l. ‚ El teorema siguiente dice un poco más que el teorema 15.4.15. 15.4.16. Teorema. Si l Ă Rn es una recta (o un hiperplano o un plano); R es un punto de Rn ; P es un punto de l por el cual pasa una recta ortogonal a l y a la cual pertenece R, y Q un punto de l diferente de P ; entonces |P ´ R| ă |Q ´ R|. 15.4. Ortogonalidad 459 Demostración. Por el teorema 4 se tiene que |Q ´ R|2 “ |Q ´ P |2 ` |P ´ R|2 ą |R ´ P |2 , concluyéndose que |P ´ R| ă |Q ´ R|. ‚ 15.4.17. Teorema. Sean P , Q y R tres puntos diferentes en Rn . El punto R está entre P y Q si y sólo si |P ´ Q| “ |P ´ R| ` |Q ´ R|. Demostración. Por el teorema 15.2.19, si R está entre P y Q, entonces |P ´ Q| “ |P ´ R| ` |Q ´ R|. Ahora, si R está en la recta que pasa por P y Q, pero no está entre P y Q, entonces, por el teorema 15.2.34 tenemos que P está entre R y Q o bien Q está entre P y R. Si P está entre R y Q, entonces |Q ´ R| “ |P ´ R| ` |P ´ Q| y así |P ´ Q| ă |P ´ R| ` |Q ´ R|. En el caso en que Q esté entre P y R se tiene que |P ´ R| “ |P ´ Q| ` |Q ´ R|, por lo tanto |P ´ Q| ă |P ´ R| ` |Q ´ R|. En el caso en que P , Q y R no estén alineados, sea R1 la proyección ortogonal de R en la recta que pasa por los puntos P y Q. Por la desigualdad del triángulo 15.2.17 y el teorema 15.4.16 tenemos que |P ´ Q| ĺ |P ´ R1 | ` |Q ´ R1 | ă |P ´ R| `|Q ´ R|, concluyendo así con la demostración del teorema. ‚ El teorema que sigue dice que si en un plano dos rectas son paralelas y una de ellas es ortogonal a una tercera, entonces la otra también es ortogonal a la tercera. 15.4.18. Teorema. Sean l1 Ă Rn una recta y Q P Rn un punto que no está en l1 . La recta l2 , a la cual pertenece Q y que es paralela a l1 , es ortogonal en Q a la recta que es ortogonal a l1 y que pasa por Q. Demostración. Sea l3 la única recta ortogonal a l1 en Q (corolario 15.4.7). l3 l1 Q l2 Si l2 no fuera ortogonal en Q a la recta l3 , entonces al tomar un punto P P l2 diferente de Q, por el corolario 15.4.7 existiría una recta l que pasaría por P y que sería ortogonal a l3 . Debido al corolario 15.2.30, l no es paralela a l1 , por lo que existiría un punto S Pl 1 X l, pero de nuevo por el corolario 15.4.7 tendríamos que l “ l1 , en cuyo caso P P l1 Xl2 , contradiciendo el hecho de que l1 y l2 son paralelas. De lo anterior concluimos que l2 es ortogonal en Q a la recta l3 , donde l3 es la recta ortogonal a l1 que pasa por Q. ‚ 460 15.5. Isometrías entre planos 15.5. Isometrías entre planos 15.5.1. Definición. Sea A Ă Rn , B Ă Rm y η : A ÝÑ B una correspondencia biunívoca entre A y B. Decimos que η es una isometría entre A y B si η preserva distancias, es decir si para cualesquiera dos puntos P, Q P A se tiene que |P ´ Q| “ |ηpP q ´ ηpQq|. También decimos que los conjuntos A y B son isométricos cuando existe una isometría entre ellos. 15.5.2. Teorema. Si u y v son dos puntos ortonormales en Rn y Q P Rn , entonces la función η que a cada punto pα, βq P R2 le asigna el punto Q ` αu ` βv, es una isometría entre el plano R2 y el plano tS P Rn : S “ Q ` αu ` βv para algunos α, β P Ru. Demostración. Sean pα1 , β1 q y pα2 , β2 q elementos de R2 . La distancia entre estos puntos a 2 es pα1 ´ α2 q ` pβ1 ´ β2 q2 y la distancia entre los correspondientes puntos en el recorrido de η es a |Q ´ Q ` pα1 ´ α2 qu ` pβ1 ´ β2 qv| “ |pα1 ´ α2 qu ` pβ1 ´ β2 qv|2 a “ |pα1 ´ α2 qu|2 ` |pβ1 ´ β2 qv|2 a “ pα1 ´ α2 q2 ` pβ1 ´ β2 q2 . ‚ Una generalización del teorema 15.5.2 es el siguiente teorema. 15.5.3. Teorema. Si u1 , u2 , . . . , um son m puntos ortonormales en Rn y Q P Rn , entonces la función η que a cada punto pα1 , α2 , . . . , αm q P Rm le asigna el punto Q ` α1 u1 ` α2 u2 ` ¨ ¨ ¨ ` αm um , es una isometría entre el plano Rm y el conjunto tS P Rn : S “ Q ` α1 u1 ` α2 u2 ` ¨ ¨ ¨ ` αm um para algunos α1 , α2 , . . . , αm P Ru. Demostración. Sean pα1 , α2 , . . . , αm q y pβ1 , β2 , . . . , βm q elementos de Rm . La distancia entre estos puntos es a pα1 ´ β1 q2 ` pα2 ´ β2 q2 ` ¨ ¨ ¨ ` pαm ´ βm q2 y la distancia entre los correspondientes puntos en el recorrido de η es |Q ´ Q ` pα1 ´ β1 qu1 ` pα2 ´ β2 qu2 ` ¨ ¨ ¨ ` pαm ´ βm qum | a “ |pα1 ´ β1 qu1 ` pα2 ´ β2 qu2 ` ¨ ¨ ¨ ` pαm ´ βm qum |2 a “ |pα1 ´ β1 qu1 |2 ` |pα2 ´ β2 qu2 |2 ` ¨ ¨ ¨ ` |pαm ´ βm qum |2 a “ pα1 ´ β1 q2 ` pα2 ´ β2 q2 ` ¨ ¨ ¨ ` pαm ´ βm q2 . ‚ 15.5.4. Definición. Una expresión de la forma α1 u1 ` α2 u2 ` ¨ ¨ ¨ ` αm um , donde α1 , α2 , . . . , αm P R y u1 , u2 , . . . , um P Rn , se dice que es una combinación lineal de los puntos u1 , u2 , . . . , um . Los elementos de un subconjunto tu1 , u2 , . . . , um u de Rn con m elementos diferentes se dice que son linealmente independientes si ninguno de ellos se puede expresar como combinación lineal de los otros. Un conjunto de la forma tS P Rn : S “ Q ` α1 u1 ` α2 u2 ` ¨ ¨ ¨ ` αm um para algunos α1 , α2 , . . . , αm P Ru, donde Q P Rn y los puntos 15.5. Isometrías entre planos 461 u1 , u2 , . . . , um P Rn son linealmente independientes se llama subespacio afín o simplemente subespacio de Rn de dimensión m. 15.5.5. Teorema. Si η : Rn ÝÑ Rm es una isometría entre Rn y un subconjunto de Rm y R está entre P y Q, entonces ηpRq está entre ηpP q y ηpQq. Demostración. Al ser η una isometría y al estar R entre P y Q se tiene que |ηpP q´ηpQq| “ |P ´ Q| “ |P ´ R| ` |Q ´ R| “ |ηpP q ´ ηpRq| ` |ηpQq ´ pRq|, y debido al teorema 15.4.17 tenemos que ηpRq está entre ηpP q y ηpQq. ‚ 15.5.6. Teorema. Si η : Rn ÝÑ Rm es una isometría entre Rn y un subconjunto de Rm , y l Ă Rn es una recta, entonces ηrls es también una recta. Demostración. Sean P y Q dos puntos diferentes en la recta l, teniéndose así que l “ tS P Rn : S “ Q ` tpP ´ Qq para algún t P Ru. Sea l1 Ă Rm la recta que pasa por los puntos ηpQq y ηpP q. Debido a los teoremas 15.5.5 y 15.2.34 tenemos que si R P l, entonces ηpRq P l1 . Mostremos ahora que si R1 P l1 , entonces existe un R P l tal que ηpRq “ R1 . Sea t el número real tal que R1 “ ηpQq ` tpηpP q ´ ηpQqq y R “ Q ` tpP ´ Qq. Tenemos que |R1 ´ ηpQq| “ |t||ηpP q ´ ηpQq| “ |t||P ´ Q| “ |R ´ Q| “ |ηpRq ´ ηpQq| y análogamente |R1 ´ ηpP q| “ |ηpRq ´ ηpP q|. Sea ahora s el número real tal que ηpRq “ ηpQq ` spηpP q ´ ηpQqq y veamos que s “ t, lo cual significará que R1 “ ηpRq. Si R está en el segmento de recta con extremos P y Q, entonces, por el teorema 15.4.17, tanto R1 como ηpRq están en el segmento |R1 ´ηpQq| de recta con extremos ηpP q y ηpQq, y por el teorema 15.2.35 obtenemos que t “ |ηpP “ q´ηpQq| |ηpRq´ηpQq| |ηpP q´ηpQq| “ s. Si P está entre Q y R, entonces, por el teorema 15.4.17, ηpP q está entre ηpQq y ηpRq, pero también está entre ηpQq y R1 , por lo que otra vez por el teorema 15.2.35 |ηpRq´ηpQq| |R1 ´ηpQq| “ |ηpP “ s. Finalmente, si Q está entre P y R, entonces, obtenemos que t “ |ηpP q´ηpQq| q´ηpQq| por el teorema 15.4.17, ηpQq está entre ηpP q y ηpRq, pero también está entre ηpP q y R1 , por |R1 ´ηpQq| |ηpRq´ηpQq| lo que de nuevo por el teorema 15.2.35 obtenemos que t “ ´ |ηpP “ ´ |ηpP “ s. ‚ q´ηpQq| q´ηpQq| 15.5.7. Teorema. Si η : Rn ÝÑ Rm es una isometría entre Rn y un subconjunto de Rm ; P, Q P Rn son dos puntos diferentes, y S “ Q ` tpP ´ Qq; entonces ηpSq “ ηpQq ` tpηpP q ´ ηpQqq. Demostración. Por el teorema 15.5.6, ηpSq “ ηpQq ` spηpP q ´ ηpQqq para algún número real s. Por ser η una isometría, entonces |s| “ |t|. Si s “ 0, entonces s “ t. Si s fuera diferente de cero e igual a ´t, entonces el teorema 15.5.5 estaría en contradicción con el teorema 15.2.34, por lo que necesariamente s “ t. ‚ 15.5.8. Teorema. Si η : Rn ÝÑ Rm es una isometría entre Rn y un subconjunto de Rm , y P, Q P Rn son dos puntos ortogonales; entonces ηpP q ´ ηp0q y ηpQq ´ ηp0q son ortogonales. Demostración. Por ser η una isometría y ser P y Q ortogonales tenemos que |ηpP q´ηpQq|2 “ |P |2 ` |Q|2 “ |ηpP q ´ ηp0q|2 ` |ηpQq ´ ηp0q|2 . Pero por otro lado, |ηpP q ´ ηpQq|2 “ |pηpP q´ηp0qq´pηpQq´ηp0qq|2 “ |ηpP q´ηp0q|2 `|ηpQq´ηp0q|2 `2pηpP q´ηp0qq¨pηpQq´ηp0qq, por lo tanto pηpP q´ηp0qq¨pηpQq´ηp0qq “ 0, es decir ηpP q´ηp0q y ηpQq´ηp0q son ortogonales. ‚ 15.5.9. Teorema. Sea η : R2 ÝÑ Rn una isometría (entre R2 y ηrR2 s), O “ ηp0, 0q, u “ ηp1, 0q ´ O y v “ ηp0, 1q ´ O. Los puntos u y v son ortonormales y además para cada pareja 462 15.5. Isometrías entre planos pα, βq P R2 se tiene que ηpα, βq “ O ` αu ` βv. Demostración. Por definición de isometría y por el teorema 15.5.8 tenemos que u y v son ortonormales. Veamos ahora que para todo pα, βq P R2 el punto ηpα, βq pertenece al plano Π “ tS P Rn : S “ O ` tu ` sv, para algún pt, sq P R2 u. Por el teorema 15.5.7, ηpα, 0q “ O ` αpηp1, 0q ´ Oq “ O ` αu, ηp0, βq “ O ` βpηp0, 1q ´ Oq “ O ` βv. Ahora, como el punto p 12 , 12 q es un punto entre p1, 0q y p0, 1q, entonces, por el teorema 15.5.5, el punto ηp 12 , 21 q está entre O ` u y O ` v, es decir está en el plano al cual pertenecen los puntos O, O ` u y O ` v, es decir ηp 12 , 12 q P Π, y también por el teorema 15.5.5, por estar p 12 , 21 q entre p0, 0q y p1, 1q, entonces ηp 12 , 12 q está entre O y ηp1, 1q, por lo que ηp1, 1q P Π y por el teorema 15.2.34 tenemos que ηpt, tq P Π, para todo t P R. Tenemos por el teorema 15.5.7 que ηpα, βq “ ηpαp1, 0q ` βp0, 1qq “ ηpαp1, 0q ` αβ pαp1, 1q ´ αp1, 0qq “ ηpαp1, 0qq ` αβ pηpαp1, 1qq ´ ηpαp1, 0qqq “ O ` αu ` αβ pηpα, αq ´ pO ` αuqq, el cual está en la recta que pasa por los puntos O ` αu y ηpα, αq, pero dicha recta está incluida en Π, por lo que ηpα, βq P Π. Como ηpα, βq P Π, existe una pareja pt, sq P R2 tal que ηpα, βq “ O ` tu ` sv. Tenemos que debido al teorema 15.4.15 y como pα, 0q es la proyección ortogonal en el eje X del punto pα, βq, entonces O ` αu es la proyección ortogonal de ηpα, βq en la recta l1 que pasa por O y por O ` αu. Análogamente, O ` βu es la proyección ortogonal de ηpα, βq en la recta l2 que pasa por O y por O ` βu. Usando ahora el teorema 15.4.12, vemos que la componente de ηpα, βq ´ O en la dirección de u es t, pero como O ` αu es la proyección ortogonal de ηpα, βq en l1 , entonces t “ α. De manera análoga se demuestra que s “ β, por lo que ηpα, βq “ O ` αu ` βu. ‚ 15.5.10. Corolario. Sea η : R2 ÝÑ Rn una isometría. El conjunto ηrR2 s es un plano. Demostración. Por el teorema 9, ηrR2 s “ tS P Rn : S “ O ` tu ` sv, para algún pt, sq P R2 u, donde O “ ηp0, 0q, u “ ηp1, 0q ´ O y v “ ηp0, 1q ´ O. ‚ 15.5.11. Corolario. Sea η : Rn ÝÑ Rm una isometría y Π Ă Rn un plano. El conjunto ηrΠs es también un plano. Demostración. Sean O, u y v tres puntos en Rn tales que u y v son ortonormales y sea Π “ tS P Rn : S “ O ` tu ` sv, para algún pt, sq P R2 u. Sea ahora η1 : R2 ÝÑ Rn la isometría dada por η1 pα, βq “ O ` αu ` βv, la cual tiene como recorrido al plano Π y sea η2 : R2 ÝÑ Rm la isometría dada por η2 “ η ˝ η1 , la cual tiene como recorrido al conjunto ηrΠs. El conjunto ηrΠs es un plano debido al corolario 15.5.10. ‚ 15.5.12. Teorema. La imagen bajo una isometría η : Rn ÝÑ Rm de una trayectoria en Rn es una trayectoria en Rm . Demostración. Sea γ2 Ă Rm la imagen bajo la isometría η de una trayectoria γ1 Ă Rn y ϕ1 : ra; bs ÝÑ Rn una parametrización de γ1 . Veamos que ϕ2 :“ η ˝ϕ1 es una parametrización de γ2 . Como ϕ1 es continua, para todo x0 P ra; bs y todo ε ą 0 existe un δ ą 0 tal que si x P ra; bs y |x ´ x0 | ă δ, entonces |ϕ1 pxq ´ ϕ1 px0 q| ă ε, pero por ser η una isometría, la última desigualdad implica que |ηpϕ1 pxqq ´ ηpϕ1 px0 qq| ă ε, es decir |ϕ2 pxq ´ ϕ2 px0 q| ă ε, con lo que ϕ2 es una parametrización de γ2 . ‚ 15.5.13. Teorema. La imagen γ2 bajo una isometría η : Rn ÝÑ Rm de una trayectoria simple γ1 en Rn es una trayectoria simple y tiene la misma longitud que γ1 . 15.5. Isometrías entre planos 463 Demostración. Sea ϕ1 : ra; bs ÝÑ Rn una parametrización simple de γ1 y observemos que ϕ2 :“ η ˝ ϕ1 es una parametrización simple de γ2 . El resultado se sigue de la definición de trayectoria simple e isometría, y del hecho de que para cualquier partición ∆ “ pt0 , t1 , . . . , tn q del dominio común ra; bs de ϕ1 y ϕ2 se tiene que n ÿ |ϕ1 ptk q ´ ϕ1 ptk´1 q| “ k“1 n ÿ |ϕ2 ptk q ´ ϕ2 ptk´1 q|. ‚ k“1 15.5.14. Notación. Denotemos por S1 a la circunferencia incluida en R2 con centro en p0, 0q y radio 1, a la cual llamaremos circunferencia unitaria. Y 1 -1 1 2 4 3 5 X -1 circunferencia con centro en H0,0L y radio 1 -2 Recordemos que la longitud de la circunferencia S1 incluida en R2 con centro en p0, 0q y radio 1 es 2π. Por el teorema 15.3.15 tenemos que `pS1 X tpx, yq : y ľ 0uq ` `pS1 X tpx, yq : y ĺ 0uq “ `pS1 q “ 2π. Observemos que la isometría η : R2 ÝÑ R2 tal que ηpα, βq “ pα, ´βq transforma S1 X tpx, yq : y ľ 0u en S1 X tpx, yq : y ĺ 0u, es decir ηrS1 X tpx, yq : y ľ 0us “ S1 X tpx, yq : y ĺ 0u por lo que debido al teorema 15.5.13 se tiene que `pS1 X tpx, yq : y ľ 0uq “ `pS1 X tpx, yq : y ĺ 0uq “ π. Y 1 -1 Π 1 X De manera similar, al aplicar la isometría δ tal que δpα, βq “ p´α, βq, obtenemos que `pS1 X tpx, yq : y ľ 0 y x ľ 0uq “ `pS1 X tpx, yq : y ľ 0 y x ĺ 0uq “ `pS1 X tpx, yq : y ĺ 0 y x ĺ 0uq “ `pS1 X tpx, yq : y ĺ 0 y x ľ 0uq “ π2 . 464 15.5. Isometrías entre planos Y 1 Π 2 -1 1 X Tenemos pues, como resultado de las observaciones anteriores, el siguiente teorema. 15.5.15. Teorema. a) `pS1 X tpx, yq : y ľ 0uq “ `pS1 X tpx, yq : y ĺ 0uq “ π. b) `pS1 X tpx, yq : y ľ 0 y x ľ 0uq “ `pS1 X tpx, yq : y ľ 0 y x ĺ 0uq “ `pS1 X tpx, yq : y ĺ 0 y x ĺ 0uq “ `pS1 X tpx, yq : y ĺ 0 y x ľ 0uq “ π2 . 15.5.16. Definición. Sea c una circunferencia, A y B dos puntos diferentes de c, ϕ : ra; bs ÝÑ c una parametrización simple de la circunferencia c, los números d y e tales que a ĺ d ă e ă b, ϕpdq “ A y ϕpeq “ B. Al conjunto ϕrrd; ess se le llama arco de circunferencia con extremos A y B. 15.5.17. Teorema. Si u y v son dos puntos ortonormales en Rn , Q P Rn y Π “ tS P Rn : S “ Q ` αu ` βv para algunos α, β P Ru un plano. La circunferencia c con centro en Q y radio 1 tiene longitud 2π, el arco de circunferencia c X tS P Rn : S “ Q ` αu ` βv, α ľ 0 y β ľ 0u tiene longitud π2 y el arco de circunferencia c X tS P Rn : S “ Q ` αu ` βv, β ľ 0u tiene longitud π. Demostración. El teorema es consecuencia de los teoremas 15.5.15, 15.5.13 y 15.5.2. ‚ 15.5.18. Definición. Sea c una circunferencia con centro en un punto O y l una recta que pasa por O y que está incluida en el plano en el cual B O A está incluida la circunferencia c. Cualquier arco de la circunferencia c cuyos extremos están en l se llama media circunferencia. Un arco de circunferencia que no es media circunferencia, pero que está incluido en una media circunferencia se llama arco menor de circunferencia. Un arco de circunferencia que no es media circunferencia, pero que incluye a una media circunferencia se llama arco mayor de circunferencia. 15.5. Isometrías entre planos 465 B B O O A A arco menor de circunferencia arco mayor de circunferencia 15.5.19. Corolario. Cualquier media circunferencia incluida en una circunferencia de radio 1 tiene longitud π. Demostración. El corolario es consecuencia de la definición de media circunferencia, del teorema 15.5.17 y del hecho de que el conjunto c X tS P Rn : S “ Q ` αu ` βv, β ľ 0u descrito en el teorema 15.5.17 es una media circunferencia (cuyos extremos son Q ` u y Q ´ u). ‚ 15.5.20. Teorema. Si u y v son dos puntos ortonormales en Rn , Q P Rn y Π es el plano tS P Rn : S “ Q ` αu ` βv para algunos α, β P Ru. Entonces la circunferencia c incluida en Π con centro en Q y radio r ą 0 es el conjunto tS P Rn : S “ Q ` αu ` βv y α2 ` β 2 “ r2 u. Demostración. El punto Q ` αu ` βv está en la circunferencia c si y sólo si |Q ` αu ` βv ´ Q| “ r, pero la última igualdad es equivalente a pαu ` βvq ¨ pαu ` βvq “ r2 , es decir a α2 ` β 2 “ r 2 . ‚ 15.5.21. Ejemplo. El ejemplo más simple de una isometría η : Rn ÝÑ Rn es cuando η es una traslación, es decir cuando existe un Q P Rn tal que para todo P P Rn se tiene que ηpP q “ Q ` P . 15.5.22. Teorema. La longitud de una media circunferencia incluida en una circunferencia de radio r es π r. Demostración. Sea S una media circunferencia incuida en una circunferencia de radio r que está en un plano Π. Sea O el centro de la circunferencia en la que está incluida S. Sea U la media circunferencia tP P Π : P ´ O “ 1r pP 1 ´ Oq para algún P 1 P Su, de la cual podemos observar que está incluida en una circunferencia de radio 1. Sea ϕ : r0; 1s ÝÑ U una parametrización simple de U y observemos que ψ : r0; 1s ÝÑ S es una parametrización tÞÑO`rpϕptq´Oq simple de S tal que si x, y P r0; 1s entonces ψpxq ´ ψpyq “ rpϕpxq ´ ϕpyqq, de manera que # + n ÿ n 1 `pSq “ sup |ψpxk q ´ ψpxk´1 | : pxi qi“0 P P0 k“1 # “ sup n ÿ + r|ϕpxk q ´ ϕpxk´1 | : pxi qni“0 P P10 k“1 # n ÿ “ sup r + |ϕpxk q ´ ϕpxk´1 | : pxi qni“0 P P10 k“1 # “ r sup n ÿ k“1 + |ϕpxk q ´ ϕpxk´1 | : pxi qni“0 P P10 “ r`pU q, 466 15.5. Isometrías entre planos pero por el corolario 15.5.19 tenemos `pU q “ π, de manera que `pSq “ πr. ‚ Del teorema anterior y del teorema 15.3.15 se concluye el resultado siguiente. 15.5.23. Fórmula para la longitud de una circunferencia. La longitud de cualquier circunferencia de radio r es 2πr. 15.6. Medidas de ángulos 15.6. 467 Medidas de ángulos 15.6.1. Definición. Sea c una circunferencia incluida en Rn con centro en un punto O y radio 1. Sean P y Q dos puntos diferentes en c tales que P , Q y O no están alineados. Sea ψ : r0; 2πs ÝÑ Rn P 1 la parametrización simple de c tal que ψp0q “ Q, ψpθq “ P para algún θ P p0; πq y además la longiΘ O tud de ψrr0; tss es igual a t, para todo t P p0; 2πs (tal parametrización existe gracias al corolario Q 15.3.19 y al hecho de que c es la imagen de S1 bajo una isometría). Definimos la medida del ángulo =QOP como el número θ tal que ψpθq “ P , es decir, la medida del ángulo =QOP es la longitud del arco de la circunferencia con centro en O y radio 1, tal que tiene como extremos a P y a Q y cuya longitud es menor que π (por ser la longitud menor que π , se trata de un arco menor). A la medida del ángulo =QOP se le denotará por |=QOP | o por >QOP . 15.6.2. Teorema. Sea η : Rn ÝÑ Rm una isometría y c Ă Rn una circunferencia con centro en O y radio r. El conjunto ηrcs es una circunferencia con centro en ηpOq y radio r. Demostración. Sea Π1 el plano en el cual está incluida la circunferencia c y Π2 “ ηrΠ1 s el cual es un plano debido al corolario 15.5.11. Por definición de isometría tenemos que cualquier elemento de ηrcs está en la circunferencia incluida en Π2 con centro en ηpOq y radio r. Ahora, si P2 pertenece a la circunferencia incluida en Π2 con centro en ηpOq y radio r, entonces, por definición de isometría, el punto P1 P Π1 tal que ηpP1 q “ P2 , es un punto que pertenece a c. Por lo tanto ηrcs es la circunferencia incluida en Π2 con centro en ηpOq y radio r. ‚ Debido al teorema 15.5.7 tenemos que la imagen bajo una isometría de un ángulo es un ángulo y debido a los teoremas 15.5.13 y 15.6.2 tenemos que las isometrías preservan medidas de ángulos, es decir tenemos el teorema siguiente. 15.6.3. Teorema. Si η es una isometría, tenemos un ángulo =QOP incluido en el dominio de η y =T RS “ ηr=QOP s, entonces >QOP “ >T RS. 15.6.4. Definiciones. Una forma tradicional de medir los ángulos es usar grados. Definimos un grado como el número g tal 360g “ 2π, es decir un grado es la trescientos sesentava parte de la longitud de una circunferencia de radio 1. Un grado dividido entre 60 se llama minuto y un minuto dividido entre 60 se llama segundo, es decir un minuto es la sesentava parte de un grado y un segundo es la sesentava parte de un minuto. La forma más usual de denotar a un número igual a x grados es x˝ y para denotar al número que es igual a x grados más y minutos más z segundos se usa la expresión x˝ y 1 z 2 , por ejemplo 52 grados, más 21 minutos, más 36 segundos se expresa así 52˝ 211 362 . El número x grados más y minutos se expresa simplemente x˝ y 1 , así como el número y minutos como y 1 , el número y minutos más z segundos como y 1 z 2 y el número z segundos simplemente como z 2 . Al número 2π, que es la longitud de una circunferencia de radio 1, se le llama revolución y se le denota como rev. Si η es una isometría, Λ está incluida en el dominio de η y Γ “ ηrΛs, entonces decimos que Λ y Γ son congruentes. Al hecho de que Λ y Γ sean congruentes se le denota así Λ – Γ . 468 15.6. Medidas de ángulos Existe también el concepto de «radián», que se acostumbra definir como una revolución entre 2π ó como 180˝ entre 2π, pero tal cantidad es igual al número 1, por lo que consideramos que es innecesario establecer tal concepto debido a que no ganamos nada con cambiarle de nombre al número 1. A continuación estudiaremos el concepto de perpendicularidad y temas relacionados con este concepto. 15.6.5. Definición. A cualquier ángulo cuya medida sea π2 , o lo que es lo mismo, que su medida sea de 90˝ , se le llama ángulo recto. Si la medida de un ángulo es mayor que 90˝ , decimos que el ángulo es obtuso. Si la medida de un ángulo es menor que 90˝ , decimos que el ángulo es agudo. 15.6.6. Definición. Sea =QOP un ángulo recto. Si l es un segmento, recta o rayo incluido ÐÑ ÐÑ en la recta OP tal que O P l y si m es un segmento, recta o rayo incluido en la recta OQ tal que O P m, entonces decimos que l y m son perpendiculares (más específicamente que son perpendiculares en el punto O). Al hecho de que l y m sean perpendiculares se le denota l K m. El teorema siguiente muestra la relación que existe entre los conceptos de perpendicularidad y ortogonalidad. ÐÑ ÐÑ 15.6.7. Teorema. Dos rectas OP y OQ son perpendiculares en O si y sólo si los puntos ÐÑ ÐÑ Q ´ O y P ´ O son ortogonales. Es decir las rectas OP y OQ son perpendiculares si y sólo si son ortogonales. ÐÑ ÐÑ Demostración. Sea Π el plano en el cual están incluidas las rectas OP y OQ. Supongamos ÐÑ ÐÑ primero que las rectas OP y OQ son ortogonales. Por el teorema 15.5.2 la función η : R2 ÝÑ 1 1 pP ´ Qq ` β |Q´O| pQ ´ Oq, Π, tal que para todo pα, βq P R2 se tiene que ηpα, βq “ O ` α |P ´O| es una isometría sobre el plano Π . Ahora, por los teoremas 15.5.15 y 15.6.3 tenemos que ÐÑ ÐÑ =QOP “ π2 , es decir OP K OQ. ÐÑ ÐÑ Partamos ahora del supuesto de que OP K OQ con >QOP “ π2 . Definamos la función η : 1 R2 ÝÑ Π como la isometría tal que ηp0, 0q “ O, ηp1, 0q “ O ` |P ´O| pP ´Qq y ηp0, 1q “ O `v, t s donde v es el vector unitario ortogonal a P ´O tal que O`v “ O` |P ´O| pP ´Oq` |Q´O| pQ´Oq, para algún t P R y algún s ą 0, es decir que O ` v y Q estén del mismo lado de la recta ÐÑ OP . Por el teorema 15.5.2 la función η es una isometría y por el teorema 15.5.8 los puntos v y P ´ O son ortogonales. Por los teoremas 15.5.15 y 15.6.3 tenemos que >pO ` vqOP “ π2 . ÝÝÑ ÝÝÑ Afirmamos que O ` v P OQ. En efecto, si O ` v R OQ, entonces por el teorema 15.3.15 tendríamos una de las siguientes dos posibilidades: a) >P OQ ` >QOpO ` vq “ π2 ó b) >P OpO ` vq ` >QOpO ` vq “ π2 . Pero ambas posibilidades son falsas ya que >P OQ “ π2 “ ÝÝÑ ÐÑ ÐÑ >P OpO ` vq y >QOpO ` vq ą 0. Por lo tanto O ` v P OQ, luego las rectas OP y OQ son ortogonales. ‚ Con el teorema 15.6.7 podemos ver que el concepto de rectas perpendiculares dado en este capítulo es consistente con el dado en el capítulo 10. 15.6.8. Definición. Cuando A, B y C son tres puntos alineados tales que B está entre A y C, y además D es un punto que no está en la recta a la cual pertenecen los puntos A, B y 15.6. Medidas de ángulos 469 C, decimos que los ángulos =ABD y =CBD forman un par lineal. 15.6.9. Definición. Decimos que dos ángulos son suplementarios si la suma de sus medidas es 180˝ . En tales condiciones también decimos que un ángulo es el suplemento del otro. 15.6.10. Teorema del suplemento. Si dos ángulos forman un par lineal, entonces son suplementarios. Demostración. Del corolario 15.5.19 y del teorema 15.3.15 se sigue el teorema del suplemento. ‚ 15.6.11. Definición. Sea =ABC un ángulo y sean los puntos D y E tales que B está entre A y D, y B está entre C y E. En tales condiciones decimos que los ángulos =ABC y =DBE son opuestos por el vértice. 15.6.12. Teorema de los ángulos opuestos por el vértice. Si dos ángulos son opuestos por el vértice, entonces son congruentes. Demostración. Sean =ABC y =DBE dos ángulos opuestos por el vértice y supongamos, sin perder generalidad, que B está entre A y D. Por el teorema del suplemento tenemos que >ABC ` >DBC “ π “ >DBE ` >DBC, de donde concluimos que >ABC “ >DBE, es decir =ABC – =DBE. ‚ 15.6.13. Definición. Definimos el interior de un ángulo =ABC como el conjunto de todos ÐÑ los puntos P que están del mismo lado que A de la recta BC y del mismo lado que C de ÐÑ la recta AB. Al conjunto de puntos del plano en el cual está el ángulo =ABC pero que no está ni en el ángulo ni en su interior se le llama exterior del ángulo =ABC. Definimos así mismo el interior de un triángulo como la intersección de los interiores de sus ángulos y el exterior de un triángulo como el conjunto de puntos del plano en el cual está el triángulo tales que no están en el triángulo ni en su interior. Ŋ un arco menor con ex15.6.14. Teorema. Sea AB tremos A y B, de una circunferencia c con centro O. Ŋ diferentes de los extremos Todos los puntos de AB están en el interior del ángulo =AOB. B O Demostración. Sea D el punto en el rayo opuesto A ÝÝÑ Ŋ está incluido a OB tal que OD “ OB. El arco AB en la media circunferencia de c con extremos B y D Ŋ diferentes de B y a la cual pertenece el punto A, por lo que todos los puntos del arco AB ÐÑ Ŋ están del mismo lado que A de la recta OB. Análogamente, todos los puntos del arco AB ÐÑ diferentes de A están del mismo lado que B de la recta OA. Por lo tanto, todos los puntos Ŋ diferentes de los extremos están en el interior del ángulo =AOB. de AB ‚ Ŋ un arco menor con extremos A y B de una circunferencia c con 15.6.15. Teorema. Sea AB ÝÝÑ Ŋ centro O. Si P está en el interior del =AOB, entonces el rayo OP corta al arco menor AB. ÝÝÑ ÝÑ Ŋ entonces el punto Q P Ý Demostración. Si OP no cortara al arco menor AB, OP tal que OQ “ 1, sería un punto que está en el exterior de =AOB, y como O P QP , entonces el 470 15.6. Medidas de ángulos ÐÑ ÐÑ segmento QP no cortaría a la recta OA ni a OB, de modo que P estaría en el exterior de ÐÑ Ŋ =AOB. Por lo tanto el rayo OP corta al arco menor AB. ‚ 15.6.16. Teorema de adición de ángulos. Si un punto D está en el interior de un ángulo =ABC, entonces >ABC “ >ABD ` >DBC. Demostración. El resultado es una consecuencia de los teoremas 15.3.15, 15.6.14 y 15.6.15, y de las definiciones de interior y de medida de un ángulo. ‚ 15.6.17. Definición. Decimos que dos ángulos son complementarios si la suma sus medidas es 90˝ . En tales condiciones también decimos que un ángulo es el complemento del otro. 15.6.18. Teorema. Sean l1 y l2 dos rectas paralelas y l3 una recta que corta a l1 y l2 en los puntos P y Q respectivamente. Si R es un punto de l3 tal que P está entre Q y R, y S y T son puntos de l1 y l2 respectivamente tales que están en el mismo lado de l3 ; entonces >P QT “ >RP S. ÐÑ Demostración. Sean A P l1 y B P l2 puntos alineados con R tales que AB K l1 y sean ÝÑ ÝÝÑ ÐÑ C P QT y D P QP tales que |Q ´ C| “ |P ´ A| y DC K l2 . Por los teoremas 15.4.18 y 15.6.7 ÐÑ ÐÑ ÐÑ tenemos que AB K l2 y DC k AB. Ahora, por la unicidad de las paralelas y por los teoremas 15.2.36 y 15.2.37 tenemos que |D ´ C| “ |R ´ A| y |Q ´ D| “ |P ´ R|. Observemos ahora que tenemos una isometría η tal que ηpAq “ C, ηpRq “ D y ηpP q “ Q. Por el teorema 15.6.3 tenemos que las isometrías preservan ángulos, es decir >P QT “ >RP S. ‚ 15.6.19. Corolario. Sean l1 y l2 dos rectas paralelas y l3 una recta que corta a l1 y l2 en los puntos P y Q respectivamente. Si T y U son puntos de l2 y l1 respectivamente que están en lados opuestos de l3 , entonces >P QT “ >QP U . Demostración. Sea S un punto de l1 que está del mismo lado de l3 que T , y R un punto de l3 tal que P está entre Q y R. Por el teorema 15.6.18 tenemos que >P QT “ >RP S, pero por el teorema de los ángulos opuestos por el vértice >QP U “ >RP S, por lo que >P QT “ >QP U . ‚ 15.6.20. Teorema. La suma de las medidas de los ángulos de un triángulo es 180˝ . ÐÑ Demostración. Sea ŸABC un triángulo. Llamémosle l a la recta paralela a AC que pasa por B y sean P y Q puntos de l tales que B está entre P y Q, con P del mismo lado que A ÐÑ ÐÑ de la recta BC y por consiguiente Q del mismo lado que C de la recta AB. Por el corolario 15.6.19 tenemos que >ACB “ >QBC y que >CAB “ >P BA, pero por los teoremas de adición de ángulos y del suplemento tenemos que >P BA ` >ABC ` >QBC “ 180˝ , por lo tanto >CAB ` >ABC ` >ACB “ 180˝ . ‚ 15.6.21. Corolario. Sea ŸABC un triángulo y D un punto tal que C está entre A y D. Tenemos que >BCD “ >ABC ` >BAC. Demostración. El corolario es consecuencia del teorema 15.6.20 y del teorema del suplemento 15.6.10. ‚ Como consecuencia inmediata del teorema 15.6.20 tenemos los siguientes dos corolarios. 15.6.22. Corolario. Ningún triángulo tiene más de un ángulo obtuso. 15.6.23. Corolario. Ningún triángulo tiene más de un ángulo recto. 15.6.24. Definición. En un triángulo ŸABC el ángulo =ABC se dice que es opuesto al 15.6. Medidas de ángulos 471 lado AC y que es adyacente a los lados AB y BC. Similarmente decimos que el lado AC es opuesto al ángulo =ABC y adyacente a los ángulos =CAB y =ACB. 15.6.25. Definición. Decimos que un triángulo es un triángulo rectángulo si alguno de sus ángulos es recto. Al lado opuesto al ángulo recto se le llama hipotenusa del triángulo y los lados adyacentes del ángulo recto se llaman catetos del triángulo. Como consecuencia de los teoremas 15.4.4 y 15.6.7 tenemos el siguiente teorema famoso. 15.6.26. Teorema de Pitágoras. En un triángulo rectángulo la suma de los cuadrados de las longitudes de los catetos es igual al cuadrado de la longitud de la hipotenusa. 15.6.27. Definición. Una recta que es perpendicular a un segmento en su punto medio se llama mediatriz del segmento. : rB C mediatriz del segmento AB C C C C CrA 9 15.6.28. Teorema de la mediatriz. La mediatriz de un segmento incluida en un plano, que incluye al segmento, es el conjunto de puntos del plano que están a la misma distancia de los extremos del segmento. Demostración. Sea AB un segmento incluido en un plano Π, l la mediatriz de AB incluida en Π y M el punto medio de AB. El teorema afirma que l “ tP P Π : |A ´ P | “ |B ´ P |u. Si P P l, entonces existe una única isometría η en el plano Π tal que ηpM q “ M , ηpP q “ P y ηpAq “ B, por lo que |A ´ P | “ |B ´ P |, con lo que tenemos que l Ă tP P Π : |A ´ P | “ |B ´ P |u. Supongamos ahora que P ‰ M es un punto en Π tal que |A ´ P | “ |B ´ P | (sabemos de antemano que M P l). Debido a la desigualdad del triángulo tenemos que |A ´ P | ` |P ´ B| ą |A´B|, por lo que |A´P | ą |A´M |. Sea P 1 el punto de l que está en el mismo lado de la recta a ÐÑ AB que P tal que |M ´ P 1 | “ |A ´ P |2 ´ |A ´ M |2 . Por el teorema de Pitágoras tenemos a que |M ´ P 1 | “ |A ´ P 1 |2 ´ |A ´ M |2 , de donde concluimos que |A ´ P 1 | “ |A ´ P |. Como l Ă tP P Π : |A ´ P | “ |B ´ P |u, entonces también podemos concluir que |B ´ P 1 | “ |B ´ P |. ÐÑ ÐÑ Si M 1 es el punto donde se cortan AB yala perpendicular a AB quea pasa por P , entonces, por 1 2 1 2 el teorema de Pitágoras, |A ´ M | “ |A ´ P | ´ |P ´ M | “ |B ´ P |2 ´ |P ´ M 1 |2 “ |B ´ M 1 |, concluyendo que M 1 es el punto medio de AB, es decir M 1 “ M , por lo tanto P pertenece a la mediatriz de AB y así l Ą tP P Π : |A ´ P | “ |B ´ P |u. De lo anterior tenemos que l “ tP P Π : |A ´ P | “ |B ´ P |u. ‚ 15.6.29. Definición. Decimos que un triángulo es equilátero cuando todos sus lados son congruentes, que es isósceles cuando exactamente dos de sus lados son congruentes y que es escaleno cuando ningún lado es congruente con otro. 15.6.30. Teorema del triángulo isósceles. Si un triángulo tiene dos lados congruentes, entonces sus ángulos opuestos son también congruentes. Es decir si ŸABC es un triángulo tal que |A ´ B| “ |B ´ C|, entonces >BAC “ >BCA. 472 15.6. Medidas de ángulos Demostración. Supongamos que en un triángulo ŸABC tenemos |A ´ B| “ |B ´ C| y sea M el punto medio del segmento AC. Por el teorema de la mediatriz, los ángulos =BM A y =BM C son rectos, por lo que existe una isometría η tal que ηpM q “ M , ηpBq “ B y ηpAq “ C. Por el teorema 15.6.3 tenemos que >BAC “ >BCA. ‚ Como consecuencia directa del teorema del triángulo isósceles tenemos el siguiente corolario. 15.6.31. Corolario. Todo triángulo equilátero tiene sus tres ángulos congruentes. 15.6.32. Teorema. En un triángulo ŸABC, si |B´C| ă |B´A|, entonces >BAC ă >BCA. Demostración. Sea D P AB tal que |B ´ D| “ |B ´ C|. Por el corolario 15.6.21, >BDC ą >BAC; por el teorema de adición de ángulos tenemos que >BCA ą >BCD, y por el teorema 15.6.30 tenemos que >BDC “ >BCD; por lo tanto >BCA ą >BAC. ‚ El siguiente teorema es un recíproco del teorema 15.6.32. 15.6.33. Teorema. En un triángulo, si un ángulo mide más que otro, entonces el lado opuesto al ángulo mayor es mayor que el lado opuesto al ángulo menor. Es decir, si en un triángulo ŸABC tenemos que >BAC ą >BCA, entonces |B ´ C| ą |B ´ A|. Demostración. Sea ŸABC un triángulo tal que >BAC ą >BCA. Si |B ´ C| “ |B ´ A|, entonces estaríamos en contradicción con el teorema del triángulo isósceles, y si |B ´ C| ă |B ´ A|, entonces estaríamos en contradicción con el teorema 15.6.32, por lo que la única posibilidad es que |B ´ C| ą |B ´ A|. ‚ El siguiente teorema es un recíproco del teorema del triángulo isósceles. 15.6.34. Teorema. Si en un triángulo ŸABC tenemos que >BAC “ >BCA, entonces |B ´ C| “ |B ´ A|. Demostración. Supongamos que >BAC “ >BCA. Si |B´C| ă |B´A| ó |B´C| ą |B´A|, entonces, por el teorema 15.6.32, tendríamos que >BAC ă >BCA ó >BAC ą >BCA, por lo que la única posibilidad es que |B ´ C| “ |B ´ A|. ‚ 15.6.35. Teorema. Dado un plano Π. Si c es una circunferencia con centro en un punto O incluida en Π y l es una recta incluida en Π tal que c y l se intersecan solamente en un punto P , entonces l K OP . Demostración. Veamos que P es el punto más cercano de la recta l al centro O de la circunferencia c. Si existiera otra punto Q diferente de P en la recta l tal que |Q´O| ă |P ´O|, entonces al tomar un punto R en la recta l tal que Q sea el punto medio del segmento P R observamos que |R ´ O| “ |P ´ O|, es decir R P c, lo cual contradice el hecho de que c y l se intersecan solamente en el punto P . Por lo tanto no existe ningún punto Q en la recta l tal que |Q ´ O| ă |P ´ O|. Ahora, sea P 1 P l tal que l K OP 1 . Si P ‰ P 1 , entonces el triángulo ŸOP 1 P es rectángulo y la hipotenusa es OP , por lo que |P 1 ´ O| ă |P ´ O|, contradiciendo lo que se demostró en el párrafo anterior. Por lo tanto P “ P 1 y así l K OP . ‚ Observemos que en la demostración del teorema 15.6.35 también se demostró el siguiente resultado. 15.6.36. Teorema. Dado un plano Π. Si c es una circunferencia con centro en un punto O 15.6. Medidas de ángulos 473 y radio r que está incluida en Π y l es una recta incluida en Π tal que c y l se intersecan solamente en un punto P , entonces para todo punto Q P l se tiene que |Q ´ O| ľ r. El teorema 15.6.35 tiene el siguiente recíproco. 15.6.37. Teorema. Dado un plano Π. Si c es una circunferencia incluida en Π, con centro en un punto O; l es una recta incluida en Π, y P P l X c es tal que l K OP ; entonces l X c “ tP u. Demostración. Si P 1 P l es diferente de P , entonces OP 1 es la hipotenusa del triángulo ŸOP 1 P , por lo que |O ´ P 1 | ą |O ´ P |, luego P 1 R c. ‚ 15.6.38. Teorema. Si en un triángulo ŸABC existe un punto D entre A y B tal que |A ´ D| “ |A ´ C|, entonces |B ´ C| ą |C ´ D|. Demostración. Por el teorema del triángulo isósceles, >ADC “ >ACB, pero por los corolarios 15.6.22 y 15.6.23 tenemos que el ángulo =ADC es agudo. Ahora, debido al teorema del suplemento, =BDC es obtuso y de nuevo por el corolario 15.6.22 y el teorema 15.6.32 tenemos que |B ´ C| ą |C ´ D|. ‚ 15.6.39. Teorema. Supongamos que incluidos en un plano están un triángulo ŸABC tal que el ángulo =ACB no es agudo y una circunferencia c con centro en A y radio r “ |A ´ C|. Sea D el punto que pertenece a la circunferencia c y al lado AB del triángulo ŸABC y sea Ŋ el arco menor de c con extremos C y D. La longitud de CD Ŋ es menor que la de BC. CD Demostración. Sea pP0 , P1 , . . . , Pn q una sucesión de n ` 1 puntos en CD tales que P0 “ C, Pn “ B y para i P t1, 2, . . . , n ´ 1u, Pi está entre Pi´1 y Pi`1 . Para i P t0, 1, . . . , n ´ 1, nu sea Qi el punto que está en la intersección de c y el segmento APi . Sea ahora R1 “ P1 y para ÐÑ i P t2, 3, . . . , nu sea Ri el punto de APi que está en la recta paralela a BC que pasa por Qi´1 . Por el corolario 15.6.21, el ángulo =APi´1 Pi no es agudo, de modo que por los teoremas 15.6.20 y 15.6.33 obtenemos que si i P t1, 2, . . . , nu, entonces |A ´ Pi´1 | ă |A ´ Pi |, en particular |A ´ Pi | ą r “ |A ´ P0 |. Tenemos también, por los teoremas 15.6.36, 15.6.37 y la unicidad de las paralelas, que |Pi ´ Pi´1 | ľ |Ri ´ Qi´1 | y |A ´ Ri | ą r. Ahora, debido al teorema 15.6.38, tenemos que |Ri ´ Qi´1 | ą |Qi ´ Qi´1 |. De lo anterior tenemos que n n ÿ ÿ |B ´ C| “ |Pi ´ Pi´1 | ą |Qi ´ Qi´1 |, i“1 i“1 pero como |B ´ C| es la longitud del segmento BC tenemos que la longitud de BC es mayor n ř que |Qi ´ Qi´1 |. i“1 Ŋ una parametrización simple del arco menor CD Ŋ y px0 , x1 , . . . , Sea ahora η : ra; bs ÝÑ CD xn q P Pba cualquier partición del intervalo ra; bs tal que ηpaq “ C y ηpbq “ D. Si tomamos ÝÝÑ Qi “ ηpxi q y Pi el punto donde se cortan el rayo AQi y el segmento BC, vemos que la n ř |ηpxi q ´ ηpxi´1 q|, por lo que la longitud de BC es mayor o longitud de BC es mayor que i“1 Ŋ igual que la del arco menor CD. Utilizando la conclusión del párrafo anterior para cada uno de los arcos menores de c con Ŕ extremos Qi´1 y Qi , los cuales denotaremos como QŔ i´1 Qi , tenemos que la longitud de Qi´1 Qi 474 15.6. Medidas de ángulos es menor o igual que la del segmento Qi´1 Ri , pero la longitud de Qi´1 Ri es menor que la de Pi´1 Pi (excepto cuando i “ 1, en cuyo caso tales segmentos son iguales), por lo que la n n ř Ŋ que es igual a ř `pQŔ longitud de CD, `pPi´1 Pi q, pero este último i´1 Qi q, es menor que i“1 número es la longitud del segmento BC. i“1 ‚ 15.7. Conceptos generales 15.7. 475 Conceptos generales En esta sección veremos una serie de definiciones básicas relacionadas con las figuras geométricas planas y del espacio. 15.7.1. Definiciones. Supongamos que tenemos una sucesión finita pP1 , P2 , . . . , Pn q de n puntos diferentes en un plano (con Ť n ą 2 y tomemos P0 “ Pn y Pn`1 “ P1 ), que para 1 ĺ k ĺ n se tiene Pk Pk`1 X Pi Pi`1 “ tPk , Pk`1 u y los punto Pk´1 , Pk , Pk`1 no iPt1,2,...,nuztku Ť están alineados. Bajo estas condiciones al conjunto Pi Pi`1 lo llamamos polígono iPt1,2,...,nu de n lados o n-gono. A cada punto Pk se le llama vértice del polígono y a cada segmento Pk Pk`1 se le llama lado del polígono y a cada ángulo =Pk´1 Pk Pk`1 se le llama ángulo del polígono (observemos que un polígono de n lados tiene también n ángulos y n vértices). Como sabemos cuando el polígono es de 3 lados se llama triángulo, pero cuando es de 4 lados se llama cuadrilátero, cuando es de 5 lados se llama pentágono, cuando es de 6 lados hexágono, cuando es de 7 se llama heptágono, cuando es de 8 octágono, cuando es de 9 nonágono, cuando es de 10 decágono y cuando es de 12 dodecágono. Dos lados de un cuadrilátero son opuestos siŤno se intersecan. Pi Pi`1 es un polígono convexo si para cada uno de Decimos que el polígono iPt1,2,...,nu sus ángulos =Pk´1 Pk Pk`1 , el polígono está incluido en la unión del ángulo =Pk´1 Pk Pk`1 con su interior. El interior de un polígono convexo se define como la intersección de los interiores de sus ángulos. Observemos que el interior de un polígono convexo es un conjunto convexo, pero un polígono convexo no es un conjunto convexo. Si los vértices de un polígono p están en una circunferencia c y todos los otros puntos de p están en el interior de c, decimos que el polígono p está inscrito en la circunferencia c o que la circunferencia c está circunscrita en el polígono p. Un polígono que tiene todos sus lados congruentes y todos sus ángulos congruentes se llama polígono regular. El lector debe poder demostrar que cualquier polígono regular está inscrito en una y sólo a una circunferencia. El centro de un polígono regular es por definición el centro de la circunferencia a la cual está inscrito. La apotema de un polígono regular es la distancia del centro del polígono regular a cualquiera de sus lados. El lector debe ser capaz de demostrar que la distancia del centro de un polígono regular a cualquiera de sus lados es siempre la misma, es decir que el significado de apotema está bien definido. Dos lados de un polígono con un vértice en común se llaman consecutivos. Dos ángulos de un cuadrilátero se dice que son opuestos si no incluyen un mismo lado. Dos ángulos de un polígono cuyos vértices son los extremos de un lado del polígono se llaman consecutivos. Al cuadrilátero cuyos lados son AB, BC, CD y DA lo denotaremos como ˝ABCD. Las diagonales de un cuadrilátero ˝ABCD son los segmentos AC y BD. Un trapecio es un cuadrilátero que tiene al menos dos lados paralelos. Un paralelogramo es un cuadrilátero en el cual cualquier lado es paralelo a su lado opuesto. Observemos que todos los paralelogramos son trapecios. Un rombo es un paralelogramo en el cual todos sus lados son congruentes. Un rectángulo es un paralelogramo en el cual todos sus lados son rectos. 476 15.7. Conceptos generales Un cuadrado es un rectángulo tal que todos sus lados son congruentes, es decir es un rectángulo que es a la vez un rombo. Un cuadrilongo es un rectángulo que no es un cuadrado. Un romboide es un paralelogramo que no es un rombo. Un trapezoide es un cuadrilátero que no es trapecio. Definimos la distancia entre dos rectas paralelas como la distancia de cualquiera de los puntos de una recta a la otra recta. En un trapecio, a las longitudes de los lados paralelos se les llama bases y a la distancia entre las rectas que incluyen a tales lados se le llama altura correspondiente a tales bases. En un triángulo, a la longitud de uno de sus lados se le llama base y su altura correspondiente es la distancia del vértice que no está en el lado, a la recta que incluye el lado. Una región triangular es la unión de un triángulo con su interior; una región cuadrada es la unión de un cuadrado con su interior; una región rectangular es la unión de un rectángulo con su interior; una región trapecial es la unión de un trapecio con su interior. Una región circular es un círculo, es decir es la unión de una circunferencia con su interior. Diremos que dos hiperplanos son paralelos cuando éstos no se cortan. Por ejemplo en R3 dos planos son paralelos si no se cortan y en R2 dos rectas son paralelas si no se cortan. Una esfera es un conjunto de puntos px, y, zq P R3 tales que existe un punto pa, b, cq P R3 y un número r ą 0 con la propiedad de que la distancia entre pa, b, cq y px, y, zq es r. Al punto pa, b, cq le llamamos centro de la esfera y al número r le llamamos radio de la esfera. Un conjunto C Ă R3 es un cilindro si existe un conjunto plano A tal que C es la unión de todas las rectas que cortan a A y son perpendiculares al plano en el cual está incluido A, es decir C es el conjunto de todos los puntos cuya proyección en el plano en el cual está A es el conjunto A. En las condiciones anteriores decimos que el conjunto A genera al cilindro C. Si tenemos en R3 dos planos paralelos Π1 y Π2 , al conjunto T de puntos de C que están ya sea en Π1 , en Π2 o entre puntos de Π1 y Π2 se le llama cilindro truncado. A los conjuntos Π1 X C y Π2 X C le llamamos bases del cilindro truncado T y a la distancia entre los planos Π1 y Π2 le llamamos altura del cilindro truncado T . Cuando nos refiramos a la base o a la altura de un cilindro significará (sin necesidad de hacer aclaración alguna) a la base o a la altura de un cilindro truncado. Un conjunto K Ă Rn se llama cono si existe un punto V P K tal que para todo P P K y para todo λ ľ 0, el punto V ` λpP ´ V q P K. Si el punto V con la propiedad anterior es único, a tal punto se le llama vértice del cono K. Si c es una circunferencia y V es un punto que no está en el plano en el cual está incluida la circunferencia c, decimos que el conjunto tV ` λpP ´ V q : P P c y λ P Ru es un cono circular. Como podemos observar, el cono circular es en efecto un cono. Cuando tenemos un cono circular tV ` λpP ´ V q : P P c y λ P Ru, tal que el plano en el cual está incluida la circunferencia c es perpendicular a la recta que pasa por el centro O de la circunferencia c y por el vértice V , entonces decimos que el cono circular es un cono circular recto y que la recta que pasa por O y por V es su eje. Si C es un círculo, es decir la unión de una circunferencia con su interior, y V es un punto que no está en el plano en el cual está incluido el círculo C, decimos que el conjunto tV ` λpP ´ V q : P P C y λ P Ru es un cono circular sólido. Si tenemos en Rn dos hiperplanos paralelos Π1 y Π2 , al conjunto T de puntos de K que están ya sea en Π1 , en Π2 o entre puntos de Π1 y Π2 se le llama cono truncado. A los conjuntos Π1 X K y Π2 X K le llamamos bases del cono truncado T y a la distancia entre los planos Π1 y Π2 le llamamos 15.7. Conceptos generales 477 altura del cono truncado T . Cuando nos refiramos a la base o a la altura de un cono nos estaremos refiriendo a la base o a la altura de un cono truncado. Dado un número r ą 0 y un punto O en un conjunto S isométrico a R3 , al conjunto E de todos los puntos de S que están a una distancia r de O se le llama esfera con centro en O y radio r. Así mismo, al conjunto de todos los puntos de S que estén a una distancia de O menor o igual que r le llamaremos esfera rellena con centro en O y radio r. Similarmente a la definición anterior tenemos que dado un número r ą 0 y un punto O en un conjunto S isométrico a Rn , al conjunto E de todos los puntos de S que están a una distancia r de O se le llama esfera de dimensión n ´ 1 con centro en O y radio r. Así mismo, al conjunto de todos los puntos de S que estén a una distancia de O menor o igual que r le llamaremos esfera rellena de dimensión n con centro en O y radio r. 478 15.8. 15.8. Funciones trigonométricas Funciones trigonométricas En esta sección definiremos las funciones trigonométricas y daremos algunas de sus propiedades más importantes. B 15.8.1. Definiciones. Sea θ un número enΠ tre 0 y π2 . En un triángulo rectángulo ŸABC -Θ 2 c tal que el ángulo =ACB es recto y >BAC “ a θ, tomemos a igual a la distancia entre B y C; b igual a la distancia entre A y C, y c igual a la longitud de la hipotenusa del triángulo Θ ŸABC, es decir c es la distancia entre A y A C b B. Definimos el seno, coseno, tangente, cotangente, secante y cosecante de θ respectivamente como ac , cb , ab , ab , cb y ac . Al seno, coseno, tangente, cotangente, secante y cosecante de θ los denotaremos respectivamente como senpθq, cospθq, tanpθq, cotpθq, secpθq y cscpθq. Es decir tenemos las siguientes identidades: senpθq “ ac , cospθq “ cb , tanpθq “ ab , cotpθq “ ab , secpθq “ cb , cscpθq “ ac . Las funciones sen, cos, tan, cot, sec y csc reciben el nombre de funciones trigonométricas. Tomamos por definición senp0q “ 0, cosp0q “ 1, tanp0q “ 0 y secp0q “ 1. Los valores de cotp0q y cscp0q quedarán indefinidos, al menos por el momento. Así mismo, definimos senp π2 q “ 1, cosp π2 q “ 0, cotp π2 q “ 0 y cscp π2 q “ 1. Los valores de tanp π2 q y secp π2 q quedarán indefinidos por el momento. El lector podrá observar que las definiciones anteriores no dependen del triángulo ŸABC que se haya a escogido, siempre y cuando =ACB sea recto y >BAC “ θ. Debido a las definiciones anteriores y a que la suma de las medidas de los ángulos de un triángulo es π, tenemos las identidades dadas en el teorema siguiente. 15.8.2. Teorema. Si θ P r0; π2 s, entonces ` ˘ ` ˘ ` ˘ sen π2 ´ θ “ cospθq, cos π2 ´ θ “ senpθq, tan π2 ´ θ “ cotpθq, ` ˘ ` ˘ ` ˘ cot π2 ´ θ “ tanpθq, sec π2 ´ θ “ cscpθq, csc π2 ´ θ “ secpθq, siempre que los valores estén definidos. En el teorema siguiente se dan los valores de las funciones trigonométricas en 30˝ , 45˝ y 60˝ . 15.8. Funciones trigonométricas 479 B P ë 60 45ë !!!! 2 1 1 C 2 30ë 45ë A 1 Q M !!!! 3 15.8.3. Funciones trigonométricas de 30˝ , 45˝ y 60˝ . Se tienen las siguientes identidades: senp30˝ q “ 21 , cosp30˝ q “ ? 3 , 2 tanp30˝ q “ ?1 3 cotp30˝ q “ ? 3, ? senp45˝ q “ ?1 2 “ cosp45˝ q “ ?1 2 “ ? “ 3 , 3 tanp45˝ q “ 1, cotp45˝ q “ 1, ? ? secp30˝ q “ ?23 “ 23 3, secp45˝ q “ 2, ? cscp30˝ q “ 2, cscp45˝ q “ 2, 2 , 2 ? 2 , 2 senp60˝ q “ ? 3 , 2 cosp60˝ q “ 12 , ? tanp60˝ q “ 3, cotp60˝ q “ ?1 3 ? “ 3 , 3 secp60˝ q “ 2, ? cscp60˝ q “ ?23 “ 23 3. Demostración. Tomemos un triángulo rectángulo ŸABC tal que su ángulo =ACB sea recto y los catetos tengan longitud 1. Tenemos que los ángulos agudos =A y =B del triángulo son ˝ congruentes. Como la suma de las medidas de los ángulos de un triángulo es 180 , entonces ?la ? ˝ 2 2 medida de los ángulos =A y =B?es 45 , además la longitud de la hipotenusa es 1 ` 1 “ 2. ? Por lo tanto cosp45˝ q “ ?12 “ 22 , senp45˝ q “ ?12 “ 22 , tanp45˝ q “ 11 “ 1, cotp45˝ q “ 11 “ 1, ? ? ? ? secp45˝ q “ 12 “ 2, cscp45˝ q “ 12 “ 2. Si incluido en un plano está un triángulo ŸP QR tal que sus tres ángulos sean congruentes (se deja al lector el demostrar que tal triángulo existe), entonces la mediatriz del segmento P R que está incluida en el plano, pasa por Q y por el punto medio M del segmento P R. Tenemos, debido al teorema 15.6.34, que el triángulo ŸP QRaes equilátero, de modo que a |P ´ Q| “ 2|P ´ M | y por el teorema de Pitágoras |Q ´ M | “ |P ´ Q|2 ´ |P ?´ M |2 “ 3|P ´ M |2 “ ? ? 3|P ´M | 3 3|P ´ M |. Ahora, como >QM P “ 60˝ , tenemos que senp60˝ q “ 2|P “ , cosp60˝ q “ ´M | 2 ? ? ? |P ´M | 3|P ´M | 1 ˝ ˝ ?1 , secp60˝ q “ 2, cscp60˝ q “ ?2 “ 2 3. “ , tanp60 q “ “ 3, cotp60 q “ 2|P ´M | 2 |P ´M | 3 3 3 1 ˝ ˝ ˝ Ahora, aplicando el teorema 15.8.2 tenemos que senp30 q “ cosp60 q “ , cosp30 q “ 2 ? ? ? 3 1 3 ˝ ˝ ˝ ˝ ˝ ˝ senp60 q “ 2 , tanp30 q “ cotp60 q “ ?3 “ 3 , cotp30 q “ tanp60 q “ 3, secp30 q “ ? cscp60˝ q “ ?23 “ 32 3 y cscp30˝ q “ secp60˝ q “ 2. ‚ A continuación daremos una definición más general de los valores de las funciones trigonométricas cuando se evalúan en números del intervalo r0; 2πs y más adelante cuando se evalúan en cualquier número real. 15.8.4. Definiciones. Sea c la circunferencia incluida en R2 con centro en p0, 0q y radio 1. Sea ψ : r0; 2πs ÝÑ R2 la parametrización simple de c tal que ψp0q “ p1, 0q, ψp π2 q “ p0, 1q y 480 15.8. Funciones trigonométricas además la longitud de ψrr0; θss es igual a θ, para todo θ P p0; 2πs. Para θ P r0; 2πs definimos el coseno de θ como la abscisa del punto ψpθq y el seno de θ como la ordenada del punto ψpθq, es decir ψpθq “ pcospθq, senpθqq. De manera más general, si t es un número real y la pareja de números pk, θq P Z ˆ r0; 2πs es tal que t “ θ ` 2kπ, definimos cosptq :“ cospθq y 1 y secpθq :“ cospθq , y cuando senptq :“ senpθq. Cuando cospθq ‰ 0, definimos tanpθq :“ senpθq cospθq cospθq 1 senpθq ‰ 0, definimos cotpθq :“ senpθq y cscpθq :“ senpθq . Debido a la parametrización anterior, a las funciones trigonométricas también se les llama funciones circulares. 1 HcosHΘL,senHΘLL 0.5 -1 -0.5 Θ 0.5 1 1.5 -0.5 -1 De las definiciones anteriores de deduce inmediatamente el teorema siguiente. 15.8.5. Teorema. Las funciones trigonométricas tienen período 2π. 15.8.6. Teorema. Para todo número real t se tienen las siguientes identidades: senpt ` πq “ ´ senptq, cospt ` πq “ ´ cosptq. Demostración. Antes de dar la demostración general, veámosla para algunos casos particulares. Si θ P r0; πs, entonces los puntos pcospθq, senpθqq y pcospθ ` πq, senpθ ` πqq son los extremos de la media circunferencia incluida en la circunferencia con centro en p0, 0q y radio 1, por lo que también son los extremos de un segmento de longitud 2 cuyo punto medio es p0, 0q, por lo tanto pcospθ ` πq, senpθ ` πqq “ p´ cospθq, ´ senpθqq, es decir el resultado se cumple cuando t P r0; πs. Ahora, si t P pπ; 2πs, entonces por lo demostrado en el párrafo anterior y por el teorema 15.8.5 tenemos que senptq “ ´ senpt ´ πq “ ´ senppt ´ πq ` 2πq “ ´ senpt ` πq, es decir senpt ` πq “ ´ senptq y análogamente se demuestra que cospt ` πq “ ´ cosptq. Supongamos en general que t P R y sean θ P r0; 2πs y k P Z tales que t “ θ ` 2kπ. Para el caso en que θ P r0; πs tenemos que θ ` π P r0; 2πs, por lo que senpt ` πq “ senpθ ` π ` 2kπq “ senpθ`πq “ ´ senpθq “ ´ senpθ`2kπq “ ´ senptq. Para el caso en que θ P pπ; 2πs tenemos que θ´π P r0; 2πs, por lo que senpt`πq “ senpθ`2kπ`πq “ senpθ´π`2pk `1qπq “ senpθ´πq “ ´ senpθ ´ π ` πq “ ´ senpθq “ ´ senptq. Análogamente se tiene que cospt ` πq “ ´ cosptq. ‚ 15.8. Funciones trigonométricas 481 Como consecuencia inmediata del teorema 15.8.6 tenemos el siguiente corolario. 15.8.7. Corolario. Las funciones tan y cot tienen período π. 15.8.8. Teorema. La función cos es una función par y la función sen es una función impar. Es decir, si t P R, entonces: cosp´tq “ cosptq, senp´tq “ ´ senptq. Demostración. Supongamos primero que θ P p0; π2 q. La recta vertical que corta al eje de las abscisas en el punto Q “ pcospθq, 0q, corta a la circunferencia con centro en 0 “ p0, 0q y radio 1 en el primer cuadrante en el punto P “ px, yq “ pcospθq, senpθqq, teniéndose así un triángulo rectángulo ŸP 0Q cuyo ángulo =P 0Q mide θ. Ahora, tal recta vertical también corta a la circunferencia en el cuarto cuadrante en el punto P 1 “ px, ´yq, teniéndose que el ángulo =P 1 0Q mide también θ, de tal manera que P 1 “ pcosp2π ´ θq, senp2π ´ θqq “ pcosp´θq, senp´θqq. Con lo anterior tenemos que cosp´θq “ cospθq y senp´θq “ ´ senpθq. Para el caso en que t “ 0 una simple evaluación muestra que el resultado del teorema es válido. Para el caso en que t “ π2 , con el uso del teorema 15.8.6 y una evaluación se muestra que el resultado es también válido. Tenemos así que el resultado es válido cuando t P r0; π2 s. Si t P r´ π2 ; 0s, entonces tomando θ “ ´t tenemos que cosp´tq “ cospθq “ cosp´θq “ cosptq y senp´tq “ senpθq “ ´p´ senpθqq “ ´ senp´θq “ ´ senptq, por lo que tenemos ahora que el teorema es valido cuando t P r´ π2 ; π2 s. Cuando t P r π2 ; πs, tenemos que ´t P r´π; ´ π2 s y ´t ` π P r0; π2 s, por lo que del teorema 15.8.6 y del párrafo anterior tenemos que cosp´tq “ ´ cosp´t ` πq “ ´ cospt ´ πq “ ´p´ cosptqq “ cosptq y senp´tq “ ´senp´t ` πq “ senpt ´ πq “ ´ senptq. Ahora cuando t P r´π; ´ π2 s, entonces ´t P r π2 ; πs, por lo cual se tiene que cosp´tq “ cosp´p´tqq “ cosptq y senp´tq “ ´ senp´p´tqq “ ´ senptq. De esta forma tenemos que la fórmula del teorema es válida cuando t P r´π; πs. En general, si t P R, entonces existe un número θ P r´π; πs y un entero k tales que t “ θ ` 2kπ, por lo que, debido al teorema 15.8.5, cosp´tq “ cosp´θ ´ 2kπq “ cosp´θq “ cospθq “ cosptq y senp´tq “ senp´θ ´ 2kπq “ senp´θq “ ´ senpθq “ ´ senptq. ‚ 15.8.9. Corolario. Las funciones tan y cot son funciones impares. Es decir, si t P R, entonces: tanp´tq “ ´ tanptq y cotp´tq “ ´ cotptq. Demostración. Del teorema 15.8.8 tenemos que tanp´tq “ de manera similar se demuestra que cotp´tq “ ´ cotptq. senp´tq cosp´tq “ ´ senptq cosptq “ ´ tanptq y ‚ Del teorema 15.8.8 y de la definición de sec y csc se deduce el siguiente corolario. 15.8.10. Corolario. la función sec es una función par y la función csc es una función impar. 15.8.11. Teorema. Si t es un número real, entonces psenptqq2 ` pcosptqq2 “ 1. 482 15.8. Funciones trigonométricas Demostración. Sea P “ pcosptq, senptqq, 0 “ p0, 0q y Q “ pcosptq, 0q. Tenemos un triángulo rectángulo ŸP 0Q cuyo ángulo =P Q0 es recto y cuya hipotenusa tiene longitud 1. En tal triángulo las longitudes de los catetos son | cosptq| y | senptq|, por lo que debido al teorema de Pitágoras tenemos que psenptqq2 ` pcosptqq2 “ | senptq|2 ` | cosptq|2 “ 1. ‚ Si en la fórmula dada en el teorema 15.8.11 dividimos entre psenptqq2 , obtenemos la fórmula dada en el siguiente corolario. 15.8.12. Corolario. Si t es un número real, entonces 1 ` pcotptqq2 “ pcscptqq2 . Similarmente, si en la fórmula del teorema 15.8.11 dividimos entre pcosptqq2 , obtenemos la fórmula dada en el siguiente corolario. 15.8.13. Corolario. Si t es un número real, entonces 1 ` ptanptqq2 “ psecptqq2 . 15.8.14. Teorema. Si t P R, entonces ˘ ` ˘ ` sen π2 ` t “ sen π2 ´ t y cos `π 2 ˘ ` ˘ ` t “ ´ cos π2 ´ t . Demostración. Por los teoremas 15.8.6 y 15.8.8 tenemos que senp π2 `tq “ ´ senp π2 `t´πq “ ´ senpt ´ π2 q “ senp π2 ´ tq y cosp π2 ` tq “ ´ cosp π2 ` t ´ πq “ ´ cospt ´ π2 q “ ´ cosp π2 ´ tq. ‚ El siguiente teorema es una generalización del teorema 15.8.2. 15.8.15. Teorema. Si t P R, entonces ` ˘ ` ˘ ` ˘ sen π2 ´ θ “ cospθq, cos π2 ´ θ “ senpθq, tan π2 ´ θ “ cotpθq, ` ˘ ` ˘ ` ˘ cot π2 ´ θ “ tanpθq, sec π2 ´ θ “ cscpθq, csc π2 ´ θ “ secpθq, (siempre que los valores estén definidos). Demostración. Veamos primero que si θ P p´ π2 ; 0q, entonces senp π2 ´θq “ cospθq y cosp π2 ´θq “ senpθq. En efecto, tenemos que cuando θ P p´ π2 ; 0q, entonces ´θ P p0; π2 q, por lo que, debido a los teoremas 15.8.2, 15.8.6, 15.8.8 y 15.8.14, senp π2 ´ θq “ senp π2 ` θq “ cosp´θq “ cospθq y cosp π2 ´ θq “ ´ cosp π2 ` θq “ ´ senp´θq “ senpθq. Por lo tanto, si θ P p´ π2 ; π2 s se tiene que senp π2 ´ θq “ cospθq y cosp π2 ´ θq “ senpθq. Supongamos ahora que θ P r´π; ´ π2 s. Tenemos que θ ` π P r0; π2 s y senp π2 ´ θq “ ´ senp´θ´π` π2 q “ ´ senp´pθ`πq` π2 q “ ´ cospθ`πq “ cospθq y cosp π2 ´θq “ ´ cosp´θ´π` π2 q “ ´ cosp´pθ ` πq ` π2 q “ ´ senpθ ` πq “ senpθq. Si t P r π2 ; πs, entonces ´t P r´π; ´ π2 s y senp π2 ´ tq “ senp π2 ´ p´tqq “ cosp´tq “ cosptq y cosp π2 ´ tq “ ´ cosp π2 ´ p´tqq “ ´ senp´tq “ senptq. 15.8. Funciones trigonométricas 483 Hemos demostrado que senp π2 ´ θq “ senpθq y que cosp π2 ´ θq “ senpθq cuando θ P r´π; πs. Supongamos que t P R, entonces t “ θ ` 2kπ, donde θ P r´π; πs y k es un número entero. En tales circunstancias tenemos que senp π2 ´ tq “ senp π2 ´ θ ´ 2kπq “ senp π2 ´ θq “ cospθq “ cosptq y cosp π2 ´ tq “ cosp π2 ´ θ ´ 2kπq “ cosp π2 ´ θq “ senpθq “ senptq. Por lo tanto se cumplen las dos primeras fórmulas del teorema. Las otras fórmulas se deducen de estas y de la forma en que están definidas las funciones trigonométricas evaluadas en número real arbitrario. ‚ 15.8.16. Fórmula para el coseno de una diferencia. Si α y β son números reales, entonces cospβ ´ αq “ cospαq cospβq ` senpαq senpβq. Demostración. En el caso en que α “ β, podemos ver que el resultado se sigue de una simple sustitución de valores y el uso del teorema 15.8.11. Demostremos ahora el caso en que 0 ĺ α ă β ă 2π. En tal caso, sean R “ p1, 0q, P1 “ px1 , y1 q “ pcospαq, senpαqq, P2 “ px2 , y2 q “ pcospβq, senpβqq, P3 “ px3 , y3 q “ pcospβ ´ αq, senpβ ´ αqq, los cuales son puntos en la circunferencia con centro en 0 “ p0, 0q y radio 1. Ahora, como las isometrías preservan longitudes de arcos de circunferencias, tenemos que la 1 HcosHΑL,senHΑLL=P1 P3 =HcosHΒ-ΑL,senHΒ-ΑLL 0.5 Β-Α Β-Α HcosHΒL,senHΒLL=P2 -2 -1.5 -1 -0.5 0.5 R 1 1.5 2 -0.5 -1 isometría que transforma 0 en 0, el punto R en P1 y el punto P3 en un punto que está del ÐÑ mismo lado de la recta 0P1 que el punto P2 , es tal que a P3 lo transforma precisamente en P entre R y P3 es la misma que la distancia entre P1 y P2 , es decir a2 , por lo cual la distancia a px3 ´ 1q2 ` y32 “ px2 ´ x1 q2 ` py2 ´ y1 q2 , por lo cual px3 ´ 1q2 ` y32 “ px2 ´ x1 q2 ` py2 ´ y1 q2 , pero desarrollando la expresión anterior obtenemos px23 ` y32 q ´ 2x3 ` 1 “ px22 ` y22 q ` px21 ` y12 q ´ 2px2 x1 ` y2 y1 q. Ahora, usando el hecho de que x23 ` y32 “ x22 ` x22 “ x21 ` y12 “ 1 tenemos que ´2x3 ` 2 “ ´2px2 x1 ` y2 y1 q ` 2, pero simplificando tenemos x3 “ x2 x1 ` y2 y1 , o equivalentemente cospβ ´ αq “ cospβq cospαq ` senpβq senpαq. Tenemos pues que el teorema se cumple cuando 0 ĺ α ă β ă 2π. 484 15.8. Funciones trigonométricas Ahora, si 0 ĺ β ă α ă 2π tenemos que cospβ ´ αq “ cospα ´ βq “ cospαq cospβq ` senpαq senpβq “ cospβq cospαq ` senpβq senpαq, por lo que el resultado también se vale cuando 0 ĺ β ă α ă 2π. Finalmente tenemos que si α y β son dos números reales cualesquiera, entonces α “ θ1 ` 2nπ y β “ θ2 ` 2mπ, donde m y n son números enteros y 0 ĺ θ1 , θ2 ă 2π. En estas condiciones tenemos que cospβ ´ αq “ cospθ2 ´ θ1 ` 2pm ´ nqπq “ cospθ2 ´ θ1 q “ cospθ2 q cospθ1 q ` senpθ2 q senpθ1 q “ cospβq cospαq ` senpβq senpαq, con lo que terminamos la demostración del teorema. ‚ 15.8.17. Fórmula para el coseno de una suma. Si α y β son números reales, entonces cospβ ` αq “ cospαq cospβq ´ senpαq senpβq. Demostración. Del teorema 15.8.8 y de la fórmula para el coseno de una diferencia 15.8.16 tenemos que cospβ ` αq “ cospβ ´ p´αqq “ cosp´αq cospβq ` senp´αq senpβq “ cospαq cospβq ´ senpαq senpβq. ‚ 15.8.18. Fórmula para el seno de una diferencia. Si α y β son números reales, entonces senpβ ´ αq “ senpβq cospαq ´ cospβq senpαq. Demostración. De la fórmula 15.8.17 y del teorema 15.8.15 tenemos que senpβ ´ αq “ cosp π2 ´ pβ ´ αqq “ cospp π2 ´ βq ` αq “ cosp π2 ´ βq cospαq ´ senp π2 ´ βq senpαq “ senpβq cospαq ´ cospβq senpαq. ‚ 15.8.19. Fórmula para el seno de una suma. Si α y β son números reales, entonces senpβ ` αq “ senpβq cospαq ` cospβq senpαq. Demostración. De la fórmula 15.8.18 tenemos que senpβ ` αq “ senpβ ´ p´αqq “ senpβq cosp´αq ´ cospβq senp´αq “ senpβq cospαq ` cospβq senpαq. ‚ 15.8.20. Fórmula para la tangente de una suma. Si α y β son números reales, entonces tanpβ ` αq “ tanpβq ` tanpαq . 1 ´ tanpβq tanpαq Demostración. De la fórmula 15.8.19 tenemos que senpβ ` αq senpβq cospαq ` cospβq senpαq “ cospβ ` αq cospβq cospαq ´ senpβq senpαq psenpβq cospαq ` cospβq senpαqq { cospβq cospαq tanpβq ` tanpαq “ “ . pcospβq cospαq ´ senpβq senpαqq { cospβq cospαq 1 ´ tanpβq tanpαq tanpβ ` αq “ ‚ 15.8. Funciones trigonométricas 485 De la fórmula 15.8.20 y del hecho de que la tangente es una función impar obtenemos el siguiente corolario. 15.8.21. Fórmula para la tangente de una diferencia. Si α y β son números reales, entonces tanpβq ´ tanpαq tanpβ ´ αq “ . 1 ` tanpβq tanpαq De las fórmulas para el seno, coseno y tangente de una suma obtenemos las siguientes fórmulas. 15.8.22. Fórmulas del ángulo doble. Si θ es un número real, entonces senp2θq “ 2 senpθq cospθq, cosp2θq “ pcospθqq2 ´ psenpθqq2 “ 1 ´ 2psenpθq2 “ 2pcospθqq2 ´ 1, tanp2θq “ 2 tanpθq . 1´ptanpθqq2 De las fórmulas para calcular cosp2θq, de la definición de tangente y haciendo α “ 2θ obtenemos las fórmulas siguientes. 15.8.23. Fórmulas del ángulo medio. Si α es un número real, entonces c 1 ´ cospαq | senp α2 q| “ , 2 c 1 ` cospαq | cosp α2 q| “ , 2 d | tanp α2 q| “ 1 ´ cospαq . 1 ` cospαq A continuación deduciremos una fórmula que nos permite calcular las longitudes de los lados de un triángulo cuando conocemos solamente la longitud de un lado y la medida de dos ángulos. 15.8.24. Ley de los senos. Si ŸABC es un triángulo, a “ |B ´ C|, b “ |A ´ C|, c “ |A ´ B|, α “ >BAC, β “ >ABC y γ “ >ACB, entonces a b c “ “ . senpαq senpβq senpγq β CC a Cc C C γ αC b 486 15.8. Funciones trigonométricas Demostración. Observemos que cuando el triángulo ŸABC es un triángulo rectángulo, la fórmula se deduce fácilmente. Supongamos pues que el triángulo no es un triángulo rectángulo. ÐÑ Sea D la proyección de C en la recta AB y h “ |C ´D|. Debido al teorema 15.8.14 tenemos que senp180˝ ´ βq “ senp90˝ ` p90˝ ´ βqq “ senp90˝ ´ p90˝ ´ βqq “ senpβq. Si el ángulo =ABC es agudo, entonces =ABC “ =CBD, pero si es obtuso, entonces >CBD “ 180˝ ´ β. En cualquiera de los casos ha “ senp>CBDq “ senpβq y análogamente senpαq “ hb , por lo que a b tenemos que h “ a senpβq “ b senpαq, de donde concluimos que senpαq “ senpβq . De manera c a ‚ análoga se demuestra que senpαq “ senpγq con lo que el teorema queda demostrado. La fórmula siguiente sirve para calcular la longitud de un lado de un triángulo cuando se conocen las longitudes de los otros dos lados y la medida del ángulo adyacente a los lados conocidos. 15.8.25. Ley de los cosenos. Sea ŸABC un triángulo, a “ |B ´C|, b “ |A´C|, c “ |A´B| y α “ >BAC, entonces a2 “ b2 ` c2 ´ 2bc cospαq. ‚ Demostración. Sea η una isometría que transforma el triángulo ŸABC en un triángulo Ÿ0P Q Ă R2 de tal manera que ηpAq “ 0 “ p0, 0q, ηpBq “ P “ pc, 0q, ηpCq “ Q “ px, yq, con y ą 0. Observemos que x “ b cospαq e y “ b senpαq. Usando la fórmula de la distancia entre dos puntos tenemos que a2 “ |P ´ Q|2 “ pb cospαq ´ cq2 ` pb senpαqq2 “ b2 pcospαqq2 ´ 2bc cospαq ` c2 ` b2 psenpαqq2 “ b2 ppcospαqq2 ` psenpαqq2 q ` c2 ´ 2bc cospαq “ b2 ` c2 ´ 2bc cospαq, con lo que la f´rmula queda demostrada. ‚ Veamos a continuación un resultado que relaciona al coseno con el producto punto. 15.8.26. Teorema. Si P, R P Rn son tales que los puntos P , R y 0 no están alineados y θ “ >P 0R, entonces R ¨ P “ |R||P | cospθq. 1 Demostración. Sea u el punto tal que u “ |R| R (es decir u es el punto de norma 1 tal que |R|u “ R) y sea v un punto ortonormal a u que está en el plano en el cual están P , R y 0. Sean además p1 y p2 los números reales tales que P “ p1 u ` p2 v y sea η la isometría del plano en el cual están los puntos 0, P y R, al plano R2 tal que ηp0q “ p0, 0q, ηpuq “ p1, 0q y ηpvq “ p0, 1q. Tenemos que ηpRq “ p|R|, 0q y ηpP q “ pp1 , p2 q, y como las isometrías preservan medidas de ángulos, entonces p1 “ |P | cospθq, concluyendo así que R ¨ P “ |R|p1 “ |R||P | cospθq. ‚ Ejercicios. π 1. Dar una expresión algebraica para: a) cosp 12 q, π b) senp 12 q, c) cosp π8 q, d) senp π8 q. 15.9. Gráficas de las funciones trigonométricas y sus inversas 15.9. 487 Gráficas de las funciones trigonométricas y sus inversas 15.9.1. Teorema. Las funciones sen y cos son continuas. Demostración. La continuidad de las funciones sen y cos en el intervalo cerrado r0; 2πs se sigue del hecho de que son las funciones componentes de una trayectoria cerrada simple y del teorema 15.3.9. En general, sea t0 P R. Si t0 “ θ ` 2kπ con θ P p0; 2πq y k P Z, entonces lím senptq “ lím senps ` 2kπq “ lím senpsq “ senpθq “ senpt0 q, tÑt0 sÑθ sÑθ y también lím cosptq “ lím cosps ` 2kπq “ lím cospsq “ cospθq “ cospt0 q, tÑt0 sÑθ sÑθ por lo que en este caso las funciones sen y cos son continuas en t0 cuando t0 “ θ ` 2kπ con θ P p0; 2πq. Ahora, si t0 “ 2kπ con k P Z, entonces lím cosptq “ lím` cosps ` 2kπq “ lím` cospsq “ cospsq “ cosp0q “ 1 “ cospt0 q tÑt` 0 sÑ0 sÑ0 y también lím cosptq “ lím´ cosps ` 2πq “ lím´ cospsq “ cosp2πq “ 1 “ cospt0 q, tÑt´ 0 sÑ2π sÑ2π por lo que la función cos es continua en t0 , para cualquier número real t0 y análogamente se demuestra que la función sen es continua en cualquier número real. Tenemos así que las funciones sen y cos son continuas. ‚ 15.9.2. Teorema. 1 senptq “ 1. tÑ0 t lím H1,tanHΘLL Hx,yL 0.5 π , 2 Θ entonces Demostración. Si 0 ă θ ă tenemos que el segmento cuyos extremos son pcospθq, senpθqq y pcosp´θq, senp´θqq es una cuer- -1 -0.5 0.5Hx,0L 1 da de la circunferencia incluida en R2 con centro en p0, 0q y radio 1. Los extremos de tal cuerda también son extremos de un arco menor cuya -0.5 longitud es 2θ. Ahora, la longitud de la cuerda es 2 senpθq y como la longitud de la cuerda es menor que la del arco, tenemos que 2 senpθq ă 2θ, es de-1 cir senpθq ă θ, donde además θ es la longitud del arco menor con extremos pcospθq, senpθqq y p1, 0q. Ahora, observemos que el punto p1, tanpθqq está en la recta vertical que pasa por p1, 0q y en el rayo con extremo p0, 0q y que pasa por px, yq “ pcospθq, senpθqq, por lo que debido al teorema 488 15.9. Gráficas de las funciones trigonométricas y sus inversas 15.6.39, la distancia de p1, 0q a p1, tanpθqq (la cual es tanpθq) es mayor que la longitud del arco menor con extremos p1, 0q y px, yq (la cual es θ ), por lo tanto senpθq ă θ ă tanpθq. 15.9.3. Si en 15.9.3 dividimos entre senpθq, obtenemos la fórmula 1ă 1 θ ă , senpθq cospθq la cual es equivalente a cospθq ă 15.9.4. senpθq ă 1. θ Ahora, debido a que cosp´θq “ cospθq y a que senp´θq “ senpθq , tenemos que la fórmula 15.9.4 ´θ θ π también se cumple cuando ´ 2 ă θ ă 0. Usando en la fórmula 15.9.4, el teorema del sándwich 10.4.7 y el teorema 15.9.1 concluimos la demostración del teorema. ‚ 15.9.5. Teorema. 1 ´ cosptq “ 0. tÑ0 t lím Demostración. Utilizando el teorema 15.9.2 y el hecho de que las funciones sen y cos son continuas tenemos que p1 ´ cosptqqp1 ` cosptqq 1 ´ pcosptqq2 psenptqq2 1 ´ cosptq “ lím “ lím “ lím tÑ0 tÑ0 tp1 ` cosptqq tÑ0 tp1 ` cosptqq tÑ0 t tp1 ` cosptqq senptq senptq “ lím lím “ 1p0{2q “ 0. tÑ0 t tÑ0 1 ` cosptq lím ‚ 15.9.6. Teorema. La derivada de cos es ´ sen y la derivada de sen es cos. Demostración. Usaremos los teoremas 15.9.2 y 15.9.5, el hecho de que las funciones sen y cos son continuas y las fórmulas para el seno y el coseno de una suma para calcular cos1 ptq y sen1 ptq. Por una parte tenemos que cospt ` ∆q ´ cosptq ∆Ñ0 ∆ cosptq cosp∆q ´ senptq senp∆q ´ cosptq “ lím ∆Ñ0 ∆ senp∆q 1 ´ cosp∆q “ ´ senptq lím ´ cosptq lím “ ´ senptq, ∆Ñ0 ∆Ñ0 ∆ ∆ cos1 ptq “ lím por otra parte senpt ` ∆q ´ senptq ∆ senptq cosp∆q ` cosptq senp∆q ´ senptq “ lím ∆Ñ0 ∆ 1 ´ cosp∆q senp∆q “ ´ senptq lím ` cosptq lím “ cosptq, ∆Ñ0 ∆Ñ0 ∆ ∆ sen1 ptq “ lím ∆Ñ0 15.9. Gráficas de las funciones trigonométricas y sus inversas 489 con lo que el teorema queda demostrado. ‚ Observemos que si 0 ă x ă π, entonces senpxq ą 0 y que si π ă x ă 2π, entonces senpxq ă 0. Es decir si x P p0; πq, entonces cos1 pxq ă 0 y si x P pπ; 2πq, entonces cos1 pxq ą 0. De lo anterior tenemos que la función cos es decreciente en el intervalo cerrado r0; πs y creciente en el intervalo cerrado rπ; 2πs. Del hecho de que la función cos tiene período 2π podemos observar que el valor máximo de la función cos es 1 y lo toma en 0 y en cualquier valor de la forma 2kπ (con k P Z), y el valor mínimo es ´1 y lo toma en π y en cualquier valor de la forma π ` 2kπ (con k P Z). Como la función cos es decreciente en el intervalo cerrado r0; πs y creciente en el intervalo cerrado rπ; 2πs, entonces en el intervalo cerrado r0; 2πs hay dos únicos valores de x tales que cospxq “ 0 (uno en el intervalo abierto p0; πq y . Ahora, como el otro en el intervalo abierto pπ; 2πq), como sabemos, estos valores son π2 y 3π 2 la función cos tiene período 2π, tenemos que el conjunto de todos los x tales que cospxq “ 0 es t π2 ` kπ : k P Zu. Analicemos ahora la función sen. Tenemos que cospxq ą 0 si x P p´ π2 ; π2 q y que cospxq ă 0 q, por lo que si x P p´ π2 ; π2 q, entonces sen1 pxq ą 0 y si x P p π2 ; 3π q, entonces si x P p π2 ; 3π 2 2 π π 1 sen pxq ă 0. Es decir, la función sen es creciente en el intervalo cerrado r´ 2 ; 2 s y es decreciente en el intervalo cerrado r π2 ; 3π s. Debido a que la función sen tiene período 2π podemos observar 2 que el valor máximo del seno es 1 y lo toma en π2 y en cualquier número de la forma π2 ` 2kπ (con k P Z), y el valor mínimo es ´1 y lo toma en ´ π2 , en 3π y en cualquier número de la 2 forma ´ π2 ` 2kπ (con k P Z). Podemos ver así que hay un único valor de x en el intervalo q tal que abierto p´ π2 ; π2 q tal que senpxq “ 0 y un único valor de x en el intervalo abierto p π2 ; 3π 2 senpxq “ 0, por lo tanto los dos únicos valores de x que hacen que senpxq “ 0 son 0 y π. De nuevo, como sen tiene período 2π, entonces el conjunto de todos los x tales que senpxq “ 0 es t2kπ : k P Zu. Observando que cos2 pxq “ ´ cospxq y que sen2 pxq “ ´ senpxq tenemos que la función s. Así, los puntos de cos es cóncava hacia abajo en r´ π2 ; π2 s y cóncava hacia arriba en r π2 ; 3π 2 inflexión del coseno son los de la forma p π2 ` kπ, 0q (con k P Z); la función sen es cóncava hacia abajo en r0; πs y cóncava hacia arriba en rπ; 2πs, de modo que los puntos de inflexión del seno son los de la forma pkπ, 0q (con k P Z). Con la descripción anterior tenemos datos suficientes para trazar una muy buena gráfica de las funciones seno y coseno. Además podemos determinar el dominio de las funciones tan, cot, sec y csc. Y 1 Y 1 y=senHxL y=cosHxL X X -2 Π -Π -1 Π 2Π 3Π -2 Π -Π -1 Π 2Π 15.9.7. Teorema. La derivada de la tangente es el cuadrado de la secante, es decir D tanpxq “ psecpxqq2 . Demostración. ˆ ˙ d senpxq sen1 pxq cospxq ´ senpxq cos1 pxq cospxq cospxq ` senpxq senpxq D tanpxq “ “ “ 2 d x cospxq pcospxqq pcospxqq2 1 “ “ psecpxqq2 . ‚ 2 pcospxqq 490 15.9. Gráficas de las funciones trigonométricas y sus inversas De manera análoga se demuestra el teorema siguiente. 15.9.8. Teorema. La derivada de la cotangente es el opuesto del cuadrado de la cosecante, es decir D cotpxq “ ´pcscpxqq2 . 15.9.9. Teorema. La derivada de la secante es la secante multiplicada por la tangente, es decir D secpxq “ secpxq tanpxq. Demostración. D secpxq “ d pcospxqq´1 dx “ ´1pcospxqq´2 p´ senpxqq “ secpxq tanpxq. ‚ De manera análoga se demuestra el teorema siguiente. 15.9.10. Teorema. La derivada de la cosecante es el opuesto de la cosecante multiplicada por la cotangente, es decir D cscpxq “ ´ cscpxq cotpxq. Observemos que las funciones tangente y secante tienen dominio común, el cual es el conjunto de números reales x tales que cospxq ‰ 0, es decir el dominio común es Rzt π2 ` kπ : k P Zu. De la misma manera las funciones cotangente y cosecante tienen dominio común, el cual es el conjunto de todos los números reales x tales que senpxq ‰ 0, es decir el dominio común es Rzt2kπ : k P Zu. Como las funciones sen y cos tienen valor máximo a 1 y valor mínimo ´1, por el teorema el teorema del valor intermedio, tenemos que el recorrido de tales funciones es r´1; 1s. De lo anterior concluimos que el recorrido de las funciones sec y csc es el conjunto p´8; ´1s Y r1; `8q. Ahora, como la secante es la inversa multiplicativa del coseno, tenemos que ésta es decreciente en el intervalo p´ π2 ; 0s y creciente en el intervalo r0; π2 q, toma un mínimo relativo en 0, el valor de dicho mínimo relativo es 1, y como límπ cospxq “ límπ cospxq “ 0 y secpxq ą 0 cuando x P p´ π2 ; π2 q, xÑ´ 2 xÑ 2 tenemos que lím secpxq “ lím secpxq “ `8, con lo que la gráfica de π` π´ xÑ 2 xÑ 2 la función sec tiene como asíntotas verticales a las rectas con ecuaciones x “ ´ π2 y x “ π2 . Tenemos además que la función secante es creY q, toma ciente en p π2 ; π] y decreciente en rπ; 3π 2 6 un máximo relativo en π, el valor de dicho 5 máximo relativo es ´1, y como límπ cospxq “ 4 xÑ 2 lím3π cospxq “ 0 y secpxq ă 0 cuando x P p π2 ; 3π q, 2 y=secHxL 3 2 xÑ 1 tenemos que lím secpxq “ lím ´ secpxq “ ´8, π` 2 xÑ 3π 2 xÑ 2 X con lo que la gráfica de la función sec tiene también como asíntota vertical a la recta con ecuación x “ 3π . Ahora, sec2 pxq “ ddx secpxq tanpxq “ 2 -3 secpxqptanpxqq2 ` psecpxqq3 “ secpxqpptanpxqq2 ` -4 psecpxqq2 q, por lo que si x P p´ π2 ; π2 q, entonces -5 sec2 pxq ą 0 y si x P p π2 ; 3π q, entonces sec2 pxq ă 0; 2 -6 es decir la gráfica de la secante es cóncava hacia π π arriba en p´ 2 ; 2 q y cóncava hacia abajo en p π2 ; 3π q. 2 De manera análoga podemos ver que la cosecante toma un mínimo relativo en π2 , el valor de dicho mínimo relativo es 1, es decreciente en p0; π2 s y creciente en r π2 ; πq; toma un máximo relativo en 3π , el valor de dicho máximo relativo es ´1, es creciente en pπ; 3π s y decreciente 2 2 3π en r 2 ; 2πq; lím` cscpxq “ lím´ cscpxq “ `8 y lím` cscpxq “ lím´ cscpxq “ ´8, por lo que Π 3 Π -Π - -2 Π- 2 -1 2 -2 xÑ0 Π 2 Π xÑπ 3Π 2 Π 2 xÑπ xÑ2π 15.9. Gráficas de las funciones trigonométricas y sus inversas 491 la gráfica de la función csc tiene como asíntotas verticales a las rectas con ecuaciones x “ 0, x “ π y x “ 2π ; además la gráfica de la cosecante es cóncava hacia arriba en p0; πq y cóncava hacia abajo en pπ; 2πq. Y Con lo anterior y usando el hecho de que las 6 funciones trigonométrica tienen período 2π, esta5 mos en condiciones de trazar las gráficas de las 4 y=cscHxL funciones sec y csc. 3 Estudiemos ahora las funciones tan y cot. Te2 nemos que tanp0q “ 0 y tan1 p0q “ psecp0qq2 “ 1; 1 para x P p´ π2 ; 0q tenemos que tanpxq ă 0 y para X Π Π 3Π 2Π 3 Π -Π - Π x P p0; π2 q tenemos que tanpxq ą 0; de lo anterior -2 Π- 2 -1 2 2 2 y del hecho de que límπ cospxq “ límπ cospxq “ 0, -2 xÑ 2 xÑ´ 2 -3 tenemos que lím tanpxq “ ´8 y lím tanpxq “ π` π´ xÑ 2 xÑ 2 -4 `8, por lo que el recorrido de tan es el con-5 junto R y la gráfica de la tangente tiene como -6 asíntotas verticales a las rectas con ecuaciones x “ ´ π2 y x “ π2 . Ahora, tenemos que tan2 pxq “ 2psecpxqq2 tanpxq, por lo que p0, 0q es un punto de inflexión de la tangente, la cual es cóncava hacia abajo en p´ π2 ; 0s y cóncava hacia arriba en r0; π2 q. Además, como el lector podrá demostrar, la tangente es una función impar con período π, lo que nos ayuda a hacer un buen trazo de su gráfica con los datos que se han deducido. Y y=tanHxL 1 3Π - 2 -Π Π - 2 -1 Π 2 Π 3Π 2 2Π 5Π 2 X Análogamente podemos deducir las siguientes propiedades de la función cotangente: cotp π2 q “ 0 y cot1 p π2 q “ ´1; para x P p0; π2 q tenemos que cotpxq ą 0 y para x P p π2 ; πq tenemos que cotpxq ă 0; lím` cotpxq “ `8, lím´ cotpxq “ ´8, por lo que el recorrido de la cotangente es xÑ0 xÑπ R y su gráfica tiene como asíntotas verticales a las rectas con ecuaciones x “ 0 y x “ π; la cotangente además tiene un punto de inflexión en p π2 , 0q, es cóncava hacia arriba en p0; π2 s y cóncava hacia abajo en r π2 ; πq; la cotangente es una función impar con período π. Y y=cotHxL 1 X 3Π -2 Π - 2 -Π Π - 2 -1 Π 2 Π 3Π 2 2Π Debido a que las funciones trigonométricas no son inyectivas, no podemos definir sus 492 15.9. Gráficas de las funciones trigonométricas y sus inversas funciones inversas, por ejemplo senpπq “ senp´πq “ senp0q “ 0, es decir no existe un valor único de θ que haga que senpθq “ 0. Podemos observar sin embargo que el recorrido de la función sen es el intervalo cerrado r´1; 1s y además para cualquier valor y P r´1; 1s existe un único valor de θ en el intervalo cerrado r´ π2 ; π2 s tal que y “ senpθq. Debido a lo anterior tiene sentido y es legítima la siguiente definición. 15.9.11. Definición. A la función arc sen : r´1; 1s ÝÑ r´ π2 ; π2 s tal que arc senpyq “ θ si y sólo si y “ senpθq y θ P r´ π2 ; π2 s se le llama función arco seno. Es decir, la función arco seno es la inversa de la función seno con restricción del dominio al intervalo r´ π2 ; π2 s. Podemos asimismo observar que el recorrido de la función cos es r´1; 1s y para cualquier valor de x en el intervalo cerrado r´1; 1s existe un único θ P r0; πs tal que x “ cospθq, de donde tenemos la siguiente definición. 15.9.12. Definición. A la función arc cos : r´1; 1s ÝÑ r0; πs tal que arc cospxq “ θ si y sólo si x “ cospθq con θ P r0; π] se le llama función arcocoseno. Es decir, la función arco coseno es la inversa de la función coseno con restricción del dominio al intervalo r0; πs. Observemos ahora que el recorrido de la función tan es el conjunto de todos los números reales y que para cualquier valor z P R existe un único θ P p´ π2 ; π2 q tal que tanpθq “ z, teniendo así la siguiente definición. 15.9.13. Definición. A la función arctan : R ÝÑ p´ π2 ; π2 q tal que arctanpzq “ θ si y sólo si z “ tanpθq y θ P p´ π2 ; π2 q se le llama función arco tangente. Es decir, la función arco tangente es la inversa de la función tangente con restricción del dominio al intervalo p´ π2 ; π2 q. De manera similar tenemos que el recorrido de la función cot es R y que para todo z P R existe un único θ P p0; πq tal que cotpθq “ z, por lo que podemos establecer la siguiente definición. 15.9.14. Definición. A la función arccot : R ÝÑ p0; πq tal que arccotpzq “ θ si y sólo si z “ cotpθq y θ P p0; πq se le llama función arco cotangente. Es decir, la función arco cotangente es la inversa de la función cotangente con restricción del dominio al intervalo p0; πq. Observando ahora que el recorrido de la función sec es el conjunto p´8; ´1s Y r1; `8q y que para todo z P p´8; ´1s Y r1; `8q existe un único θ P r0; π2 q Y p π2 ; πs tal que secpθq “ z, tenemos la siguiente definición. 15.9.15. Definición. A la función arcsec : p´8; ´1s Y r1; `8q ÝÑ r0; π2 q Y p π2 ; πs tal que arcsecpzq “ θ si y sólo si z “ secpθq y θ P r0; π2 q Y p π2 ; πs se le llama función arco secante. Es decir, la función arco secante es la inversa de la función secante con restricción del dominio al conjunto r0; π2 q Y p π2 ; πs. Finalmente tenemos que el recorrido de la función csc es el conjunto p´8; ´1sYr1; `8q y que para todo z P p´8; ´1s Y r1; `8q existe un único θ P r´ π2 ; 0q Y p0; π2 s tal que cscpθq “ z, teniendo así la siguiente definición. 15.9.16. Definición. A la función arccsc : p´8; ´1s Y r1; `8q ÝÑ r´ π2 ; 0q Y p0; π2 s tal que arccscpzq “ θ si y sólo si z “ cscpθq y θ P r´ π2 ; 0q Y p0; π2 s se le llama función arco cosecante. 15.9. Gráficas de las funciones trigonométricas y sus inversas 493 Es decir, la función arco cosecante es la inversa de la función cosecante con restricción del dominio al conjunto r´ π2 ; 0q Y p0; π2 s. 15.9.17. Definición. A las funciones arco seno, arco coseno, arco tangente, arco cotangente, arco secante y arco cosecante se les llama funciones trigonométricas inversas. Veamos algunas propiedades de cada una de las funciones trigonométricas inversas que servirán, entre otras cosas, para hacer un buen trazo de sus gráficas. 15.9.18. Teorema. arc sen1 pxq “ ? 1 . 1´x2 1 Y 1 sen1 parc senpxqq Demostración. Tenemos que arc sen pxq “ 1 , pero como ´ π2 ĺ arc senpxq ĺ π2 , entonces cosparc senpxqq cosparc senpxqq ľ 0 y como 1 “ pcosparc senpxqqq2 ` psenparc senpxqqq2 ? “ pcosparc senpxqqq2 ` x2 , entonces cosparc senpxqq “ 1 ´ x2 , de donde concluimos que 1 ‚ arc sen1 pxq “ ?1´x 2. “ Π 2 y=arcsenHxL -1 1 X Observemos que para todo x P p´1; 1q tenemos que arc sen1 pxq ą 0, por lo que la función arc sen es Π creciente, en particular arc sen1 p0q “ 1. Tenemos que - 2 D` arc senp1q “ D´ arc senp´1q “ `8, por lo que las rectas tangentes a la gráfica de la función arc sen en los puntos p1, π2 q y p´1, ´ π2 q son verticales. Además 3 arc sen2 pxq “ xp1 ´ x2 q´ 2 , por lo que la gráfica de arc sen es cóncava hacia arriba en r0; 1s, es cóncava hacia abajo en r´1; 0s, tiene un punto de inflexión en p0, 0q y la recta tangente en el punto de inflexión tiene pendiente 1. 15.9.19. Teorema. arc cos1 pxq “ ? ´1 . 1´x2 Demostración. La demostración es muy parecida a la del teorema anterior. Tenemos que arc cos1 pxq “ 1 “ ´ senparc1 cospxqq , pero como 0 ĺ cos1 parc cospxqq arc cospxq ĺ π, entonces senparc cospxqq ľ 0 y como 1 “ pcosparc cospxqqq2 ` psenparc cospxqqq2 “ x2 ` psenparc cospxqqq2 , entonces senparc cospxqq “ ? 1 ´ x2 , de donde concluimos que arc cos1 pxq “ ? ´1 . ‚ 1´x2 Y Π y=arccosHxL Π 2 X -1 1 Observemos que para todo x P p´1; 1q se tiene 1 que arc cos pxq ă 0, por lo que la función arc cos es decreciente, en particular arc cos1 p0q “ ´1. Tenemos que D` arc cosp1q “ D´ arc cosp´1q “ ´8, por lo que las rectas tangentes a la gráfica de la función arc sen en los puntos p1, 0q y 3 p´1, πq son verticales. Además arc cos2 pxq “ xp1 ´ x2 q´ 2 , por lo que la gráfica de arc sen es cóncava hacia abajo en r0; 1s, es cóncava hacia arriba en r´1; 0s, tiene un punto de inflexión en p0, π2 q y la recta tangente en el punto de inflexión tiene pendiente ´1. 15.9.20. Teorema. arctan1 pxq “ 1 . 1`x2 494 15.9. Gráficas de las funciones trigonométricas y sus inversas Demostración. Tenemos que arctan1 pxq “ 1 tan1 parctanpxqq “ 1 , psecparctanpxqqq2 pero como psecparctanpxqqq2 “ 1 ` ptanparctanpxqqq2 “ 1 ` x2 , tenemos que arctan1 pxq “ 1 . 1`x2 1 ‚ Observemos que arctan pxq ą 0 para todo x P R, por lo que la función arctan es Y creciente en todo su dominio. Tenemos adeΠ ´2x 2 más que arctan pxq “ p1`x2 q2 , por lo que si 2 y=arctanHxL 2 x ă 0 entonces arctan pxq ą 0, y si x ą 0, X -6 -3 3 6 entonces arctan2 pxq ă 0; es decir, la función Π - arctan es cóncava hacia arriba en el intervalo 2 p´8; 0s, es cóncava hacia abajo en el intervalo r0; `8q, tiene un punto de inflexión en p0, 0q y la recta tangente en el punto de inflexión tiene pendiente 1. Además, como la función tan es tanpxq “ `8, entonces creciente en el intervalo abierto p´ π2 ; π2 q, límπ ` tanpxq “ ´8 y lím π´ xÑ´ 2 xÑ 2 lím arctanpxq “ ´ π2 y lím arctanpxq “ π2 , por lo que la gráfica de la función arctan tiene xÑ`8 xÑ´8 como asíntotas horizontales a las rectas con ecuaciones y “ ´ π2 e y “ π2 . 15.9.21. Teorema. arccot1 pxq “ ´1 . 1`x2 Demostración. Tenemos que arccot1 pxq “ 1 cot1 parccotpxqq “ 1 , ´pcscparccotpxqqq2 pero como pcscparccotpxqqq2 “ 1 ` pcotparccotpxqqq2 “ 1 ` x2 , tenemos que arctan1 pxq “ ´1 . 1`x2 1 ‚ Observemos que arccot pxq ă 0 para todo x P R, por lo que la función arccot es decreY ciente en todo su dominio. Tenemos además Π 2x que arccot2 pxq “ p1`x 2 q2 , por lo que si x ă 0 Π 2 y=arccotHxL entonces arccot pxq ă 0, pero si x ą 0, en2 2 X tonces arccot pxq ą 0; es decir, la función -6 -3 3 6 arccot es cóncava hacia abajo en el intervalo p´8; 0s, es cóncava hacia arriba en el intervalo r0; `8q, tiene un punto de inflexión en p0, π2 q y la recta tangente en el punto de inflexión tiene pendiente ´1. Además, como la función cot es decreciente en el intervalo abierto p0; πq, lím` cotpxq “ `8 y lím´ cotpxq “ ´8, entonces xÑ0 xÑπ lím arccotpxq “ π y lím arccotpxq “ 0, por lo tanto la gráfica de la función arccot tiene xÑ´8 xÑ`8 como asíntotas horizontales a las rectas con ecuaciones y “ 0 e y “ π. 15.9.22. Teorema. arcsec1 pxq “ ?1 . |x| x2 ´1 Demostración. Tenemos que arcsec1 pxq “ 1 sec1 parcsecpxqq “ 1 1 “ , secparcsecpxqq tanparcsecpxqq x tanparcsecpxqq 2 pero observemos que ptanparcsecpxqqq2 “ psecparcsecpxqqq? ´ 1 “ x2 ´ 1 y arcsecpxq P r0; π2 q ó arcsecpxq P p π2 ; πs, en ambos casos | tanparcsecpxq| “ x2 ´ 1. Si arcsecpxq P?r0; π2 q, en? tonces tanparcsecpxqq “ x2 ´ 1 y x ľ 1, por lo que x tanparcsecpxqq “ |x| x2 ´ 1 “ 15.9. Gráficas de las funciones trigonométricas y sus inversas 495 ? x2 ´ 1 y x ĺ ´1, por x tanparcsecpxqq. Si arcsecpxq P p π2 ; πs, entonces ´ tanparcsecpxqq “ ? lo que x tanparcsecpxqq “ ´xp´ tanparcsecpxqqq “ |x| x2 ´ 1. Por lo tanto, tenemos que ‚ arcsec1 pxq “ |x|?1x2 ´1 . Observemos que arcsec1 pxq ą 0 para todo x ă ´1 y para todo x ą 1, por lo que la función es creciente en el intervalo p´8; ´1s y en el intervalo r1; `8q. El lector podrá de2 ? ´1q , por mostrar que arcsec2 pxq “ ´p2x 2 3 x|x| Y Π Π px ´1q 2 lo que tenemos que si x ą 1 entonces y=arcsecHxL 2 arcsec pxq ă 0, pero si x ă ´1 entonces X -5 -4 -3 -2 -1 1 2 3 4 5 arcsec2 pxq ą 0; es decir, la gráfica de la función arcsec es cóncava hacia arriba en el intervalo p´8; ´1s y es cóncava hacia abajo en el intervalo r1; `8q. Como la función sec es secpxq “ ´8 y lím secpxq “ `8, creciente en los intervalos r0; π2 q y p π2 ; πs, y además lím π´ π` xÑ 2 xÑ 2 entonces lím arcsecpxq “ π2 y lím arcsecpxq “ π2 ; por lo tanto, la recta con ecuación y “ π2 xÑ´8 xÑ`8 es una asíntota horizontal de la gráfica de la función arc cos. Podemos observar también que D´ arcsecp´1q “ `8 “ D` arcsecp1q. 15.9.23. Teorema. arccsc1 pxq “ ?´1 . |x| x2 ´1 Demostración. Tenemos que arccsc1 pxq “ 1 csc1 parccscpxqq “ 1 1 “ , ´ cscparccscpxqq cotparccscpxqq ´x cotparccscpxqq 2 pero observemos que pcotparccscpxqqq2 “ pcscparccscpxqqq ´1 “ x2 ´1 y arccscpxq P r´ π2 ; 0q ó ? arccscpxq P p0; π2 s, en?ambos casos | cotparccscpxq| “ x2 ´ 1. Si arccscpxq P r´ π2 ; 0q, entonces ´ cotparccscpxqq “ x2 ´ 1 y x ĺ ´1, por lo que x cotparccscpxqq ? “ ´xp´ cotparccscpxqq “ ? π 2 2 |x| x ´ 1. Si arccscpxq ? P p0; 2 s, entonces cotparccscpxqq “ 1 x ´ 1 y´1x ľ 1, por lo que x cotparccscpxqq “ |x| x2 ´ 1. Por lo tanto tenemos que arccsc pxq “ |x|?x2 ´1 . ‚ De manera análoga a como se dedujeron las propiedades de la gráfica de la función arcsec podemos deducir que la función arccsc es decreciente en los intervalos p´8; ´1s y r1; `8q, es cóncava hacia abajo en el intervalo p´8; ´1s y cóncava hacia arriba en r1; `8q, tiene al eje X como asíntota horizontal, además de que D´ arccscp´1q “ ´8 “ D` arccscp1q. Y Π 2 -5 -4 -3 -2 -1 Ejercicios. 1. Hallar las derivadas de las funciones siguientes: a) px P Rq ÞÑ senpx3 q, b) px P p1; `8qq ÞÑ px ´ 1qcospxq . Π - 2 y=arccscHxL 1 2 3 4 5 X 496 15.9. Gráficas de las funciones trigonométricas y sus inversas 2. Demostrar ˆ ˙ que hay un número c P p0; 1q tal que la derivada de la función pt P Rq ÞÑ πt evaluada en c es 1. sen 2 senptq . tÑ0 t2 3. Calcular lím 4. Sean l0 , l1 y l2 tres rectas paralelas en un plano. Supongamos que los puntos de l1 están del lado opuesto l0 al lado en que están los puntos de l2 y sean d1 la distancia entre l0 y l1 , y d2 la distancia entre l0 y l2 . Sean A y A1 dos puntos diferentes de l0 . a) Para cada θ P p0; π2 q tomemos Cpθq P l2 tal que >A1 ACpθq “ θ y r1 pθq :“ dist pA, Cpθqq. Demostrar que la función pθ P p0; π2 qq ÞÑ r1 pθq es continua. b) Demostrar que límr1 pθq “ `8 y límπ r1 pθq “ d1 . θÑ0 θÑ 2 π q 3 c) Para cada θ P p0; tomemos Bpθq P l3 de tal manera que >A1 ABpθq “ π3 ´ θ y pθq “ `8 y que límπ rr21 pθq “ 0. sea r2 pθq “ dist pA, Bpθqq. Demostrar que lím rr12 pθq pθq θÑ0 d) Demostrar que existe un θ0 P p0; π3 q tal que r1 pθ0 q r2 pθ0 q θÑ 3 “ 1. e) Demostrar que dadas tres rectas paralelas en un plano existe un triángulo equilátero cuyos vértices están en alguna de esas rectas. 15.10. Ecuaciones de la recta 15.10. 497 Ecuaciones de la recta En esta sección estudiaremos varias formas de representar a una recta en R2 mediante las ecuaciones que la describen. Comencemos con algo de terminología. 15.10.1. Definiciones. Entenderemos, mientras no se diga otra cosa que el eje X es el conjunto tpx, 0q : x P Ru y que el eje Y es el conjunto tp0, yq : y P Ru. Al plano en el que están incluidos el eje X y el eje Y, es decir a R2 , le llamaremos también plano X Y. Cuando tengamos en el plano X Y dos puntos de la forma px1 , y1 q y px2 , y2 q con x1 ă x2 , diremos que el punto px1 , y1 q está a la izquierda del punto px2 , y2 q; también diremos que el punto px2 , y2 q está a la derecha del punto px1 , y1 q. Cuando tengamos en el plano X Y dos puntos de la forma px1 , y1 q y px2 , y2 q con y1 ă y2 , diremos que el punto px1 , y1 q está abajo del punto px2 , y2 q; también diremos que el punto px2 , y2 q está arriba del punto px1 , y1 q. Al conjunto de puntos del eje X con coordenadas no negativas se le llama semieje X positivo o parte positiva del eje X y lo denotaremos por X` . Al conjunto de puntos del eje Y con coordenadas no negativas se le llama semieje Y positivo o parte positiva del eje Y y lo denotaremos por Y` . Diremos que es horizontal cualquier rayo o segmento que esté incluido en el eje X o en una recta paralela al eje X. Diremos que es vertical cualquier rayo o segmento que esté incluido en el eje Y o en una recta paralela al eje Y. Si px0 , y0 q está en una recta l que no es vertical, al lado de l en el cual está el punto px0 , y0 ` 1q se llama lado de arriba de l y al otro lado se le llama lado de abajo de l. Si px0 , y0 q está en una recta l que no es horizontal, al lado de l en el cual está el punto px0 ` 1, y0 q se llama lado derecho de l y al otro lado se le llama lado izquierdo de l. Dada una recta l Ă R2 que no es horizontal, si Q es el punto donde se cortan l y el eje X, R es un punto a la derecha de Q y P es un punto en l que está en el lado de arriba de la recta horizontal que pasa por R, definimos la inclinación de l como el número >P QR, el cual pertenece al intervalo abierto p0; πq; definimos además la inclinación de cualquier recta horizontal como 0. Observemos que la pendiente de una recta no vertical con inclinación θ es tanpθq y la inclinación de una recta vertical es de 90˝ . Debido a que dos rectas paralelas en el plano X Y tienen la misma inclinación (teorema 15.6.18), podemos concluir que también tienen la misma pendiente (en el caso de que las rectas sean verticales, ambas tienen pendiente infinita). Enunciemos esto en forma de teorema. 15.10.2. Teorema. Dos rectas paralelas en el plano X Y tienen pendientes iguales. 15.10.3. Definición. Sean dos rectas l1 , l2 Ă R2 que son diferentes, no horizontales y que se cortan en un punto P ; sean además R y S dos puntos de l1 y l2 respectivamente que están en el lado de arriba de la horizontal que pasa por P . Al ángulo =RP S le llamamos ángulo entre l1 y l2 . El ángulo entre una recta horizontal y otra no horizontal que se cortan en un punto P es el ángulo =AP B, donde A está a la derecha de P y B está en la recta no horizontal y en el lado de arriba de la horizontal. 15.10.4. Teorema. Sea l una recta no vertical en el plano X Y, P1 “ px1 , y1 q y P0 “ px0 , y0 q dos puntos diferentes en la recta l. La pendiente m de la recta l está dada por m“ y1 ´ y0 . x1 ´ x0 498 15.10. Ecuaciones de la recta Demostración. Si l es horizontal, entonces y1 “ y0 , por lo que m“0“ y1 ´ y0 . x1 ´ x0 Si l no es horizontal y P1 está arriba de la horizontal a la cual pertenece P0 , tomamos R ÐÝÑ a la derecha de P0 . Las rectas P0 R y el eje X son paralelas (o iguales) y cortadas por la recta secante l, por lo que >RP0 P1 es la inclinación de l, por lo tanto m “ tanp>RP0 P1 q “ y1 ´ y0 . x1 ´ x0 Ahora, si P0 está arriba de P1 , entonces debido a lo anterior tenemos m“ y0 ´ y1 ´py1 ´ y0 q y1 ´ y0 “ “ . x0 ´ x 1 ´px1 ´ x0 q x1 ´ x0 ‚ 15.10.5. Teorema. Sea l una recta no vertical con pendiente m, P0 “ px0 , y0 q un punto en l y P1 “ px1 , y1 q diferente de P0 tal que m“ y1 ´ y0 . x1 ´ x0 Entonces P1 P l. Demostración. Como l no es vertical, entonces no tiene pendiente infinita y x1 ‰ x0 . Ahora, sea P11 “ px1 , y11 q el punto en l cuya proyección en el eje X es px1 , 0q. Por el teorema y 1 ´y 0 , de modo que y11 ´y0 “ y1 ´y0 , 15.10.4 tenemos que m “ x11 ´x00 , pero por otra parte m “ xy11 ´y ´x0 ‚ es decir y11 “ y1 , por lo que P1 “ P11 , luego P1 P l. Observemos que de los dos teoremas anteriores podemos concluir que existe solamente una recta con pendiente m que pasa por un punto dado P0 . El teorema siguiente nos da una caracterización de la recta por medio de una fórmula cuando conocemos un punto de la recta y su pendiente. 15.10.6. Teorema. La ecuación de la recta no vertical que pasa por el punto P0 “ px0 , y0 q y tiene pendiente m está dada por 15.10.7. y ´ y0 “ mpx ´ x0 q. Demostración. Para el caso en que m sea cero, la recta es horizontal y cualquier punto P “ px, yq está en la recta si y sólo si y “ y0 , es decir y ´ y0 “ 0 “ 0px ´ x0 q. Si la pendiente m es diferente de 0 y P “ px, yq es un punto que satisface la ecuación 15.10.7, entonces px, yq “ px0 , y0 q ó m“ y ´ y0 ; x ´ x0 en ambos casos, por el teorema 15.10.5, P está en la recta con pendiente m que pasa por px0 , y0 q. 15.10. Ecuaciones de la recta 499 Ahora, si P “ px, yq está en la recta, entonces, por el teorema 15.10.4, px, yq “ px0 , y0 q ó bien m“ y ´ y0 x ´ x0 y en ambos casos se satisface la ecuación 15.10.7. con x ‰ x0 , ‚ La ecuación de la recta vertical que pasa por un punto px0 , y0 q es x “ x0 . Del teorema anterior se deduce directamente la ecuación de cualquier recta que no sea vertical dados dos puntos diferentes por los que pasa. Tal ecuación está enunciada en el siguiente teorema. 15.10.8. Teorema. La ecuación de una recta que pasa por los puntos px0 , y0 q y px1 , y1 q, con x0 ‰ x1 , está dada por 15.10.9. y ´ y0 “ y1 ´ y0 px ´ x0 q. x1 ´ x0 15.10.10. Forma general de la ecuación de la recta. Un conjunto en el plano es una recta si y sólo si su ecuación es de la forma 15.10.11. Ax ` By ` C “ 0, donde A, B y C son constantes, y A ‰ 0 ó B ‰ 0. Demostración. Si B “ 0, entonces A ‰ 0 y la ecuación Ax ` By ` C “ 0 es equivalente a x “ ´C{A que es la ecuación de una recta vertical. Si B ‰ 0, entonces la ecuación Ax ` By ` C “ 0 es equivalente a y ´ p´C{Bq “ p´A{Bqx, que es la ecuación de la recta con pendiente ´A{B que corta al eje Y en el punto p0, ´C{Bq. Recíprocamente, veamos que dada una recta, su ecuación es equivalente 15.10.11. Si la recta es vertical su ecuación es x “ x0 ó equivalentemente x ´ x0 “ 0 que es de la forma 15.10.11 al tomar C “ ´x0 , B “ 0 y A “ 1. Si la recta no es vertical, entonces tiene una ecuación de la forma y ´ y0 “ mpx ´ x0 q, pero esta ecuación es equivalente a una de la forma mx ´ y ´ mx0 ` y0 “ 0 la cual, al tomar A “ m, B “ ´1 y C “ ´mx0 ` y0 , queda de la forma 15.10.11. ‚ 15.10.12. Definición. A la ecuación 15.10.11 se le llama ecuación general de la recta. Analicemos ahora la relación entre las pendientes m1 y m2 de dos rectas perpendiculares l1 y l2 que son verticales ni horizontales. Supongamos sin pérdida de generalidad que la inclinación θ2 de l2 es mayor que la inclinación θ1 de l1 . Como l1 K l2 , entonces θ2 “ θ1 ` π2 , por lo tanto m2 “ tanpθ2 q “ tanpθ1 ` π2 q “ ´1 ´1 ´1 tanp π2 ´ p´θ1 qq “ cotp´θ1 q “ ´ cotpθ1 q “ tanpθ “m , es decir m2 “ m . Hemos demostrado 1q 1 1 el teorema siguiente. 15.10.13. Teorema. Si m1 y m2 son las pendientes de dos rectas perpendiculares tales que ´1 ninguna de las dos es vertical ni horizontal, entonces m2 “ m . 1 Con el teorema anterior se facilita el hallar una fórmula para encontrar la distancia de un punto P0 a una recta l (conociendo las coordenadas del punto y la ecuación general de la recta). Cuando la recta es vertical u horizontal, es fácil hallar la distancia a un punto 500 15.10. Ecuaciones de la recta dado. Supongamos que l es una recta que no es vertical ni horizontal y cuya ecuación es Ax ` By ` C “ 0 y P0 “ px0 , y0 q. La pendiente de la recta l es ´A{B. Sea l1 la recta perpendicular a l tal que P0 P l1 . Como l1 K l, entonces la pendiente de l1 es B{A. Sea P1 “ px1 , y1 q el punto donde se intersecan l y l1 , es decir sea P1 la proyección de P0 en l. La distancia de P0 a P1 es la distancia de P0 a l. La ecuación de l1 está dada por y ´ y0 “ B px ´ x0 q. A Ahora, px1 , y1 q satisface las ecuaciones y ´ y0 “ B px ´ x0 q A de donde ˆ Ax1 ` B y Ax ` By ` C “ 0, ˙ B px1 ´ x0 q ` y0 ` C “ 0, A pero ˆ Ax1 ` B ˙ B px1 ´ x0 q ` y0 ` C “ 0 A ðñ Ax1 ` B2 B2 x1 ´ x0 ` By0 “ ´C A A ðñ pA2 ` B 2 qx1 “ B 2 x0 ´ ABy0 ´ AC ðñ x1 “ B 2 x0 ´ ABy0 ´ AC . A2 ` B 2 y1 “ B 2 y0 ´ ABx0 ´ AC , A2 ` B 2 Análogamente se tiene que y la distancia entre px0 , y0 q y px1 , y1 q es a px1 ´ x0 q2 ` py1 ´ y0 q2 dˆ ˙2 ˆ 2 ˙2 B 2 x0 ´ ABy0 ´ AC A x0 ´ ABx0 ´ BC “ ´ x0 ` ´ y0 A2 ` B 2 A2 ` B 2 d p´A2 x0 ´ ABy0 ´ ACq2 p´B 2 y0 ´ ABx0 ´ BCq2 “ ` pA2 ` B 2 q2 pA2 ` B 2 q2 d A2 pAx0 ` By0 ` Cq2 B 2 pBy0 ` Ax0 ` Cq2 “ ` pA2 ` B 2 q2 pA2 ` B 2 q2 c |Ax0 ` By0 ` C| pAx0 ` By0 ` Cq2 ? “ “ , 2 2 A `B A2 ` B 2 15.10. Ecuaciones de la recta 501 por lo que la distancia de P0 “ px0 , y0 q a la recta l es |Ax0 ` By0 ` C| ? . A2 ` B 2 Supongamos ahora que l es una recta horizontal con ecuación Ax ` By ` C “ 0. En este caso A “ 0 y la ecuación de la recta es equivalente a y “ ´C{B,?por lo que la distancia de px0 , y0 q a l es | ´ C{B ´ y0 | “ |By0 ` C|{|B| “ |Ax0 ` By0 ` C|{ A2 ` B 2 . Análogamente, si l es una recta ? vertical con ecuación Ax ` By ` C “ 0, la distancia de px0 , y0 q a l es |Ax0 ` By0 ` C|{ A2 ` B 2 . Así pues, hemos demostrado el siguiente teorema. 15.10.14. Teorema. Dada una recta incluida en el plano X Y con ecuación Ax ` By ` C “ 0 y un punto P0 “ px0 , y0 q. La distancia de P0 a la recta está dada por |Ax0 ` By0 ` C| ? . A2 ` B 2 15.10.15. Definición. Cuando l Ă R2 es la recta tangente a la gráfica de una función f en un punto P0 “ px0 , y0 q, decimos que la recta perpendicular a l en el punto px0 , y0 q es la recta normal a la gráfica de f en el punto px0 , y0 q. La figura de la derecha muestra las rectas tangente y normal a las gráficas de una función f en un punto P0 . Del teorema 15.10.13 y de la definición anterior se deduce el teorema siguiente. 2 1.5 gráfica de f 1 recta normal en P0 0.5 -2 -1 1 2 3 4 -0.5 P0 -1 -1.5 recta tangente en P0 -2 15.10.16. Teorema. Sea f una función tal que es derivable en x0 y f 1 px0 q ‰ 0; sea además y0 “ f px0 q. La ecuación de la recta normal a la gráfica de f en el punto P0 “ px0 , y0 q está dada por ´1 px ´ x0 q ` y0 . y“ 1 f px0 q Ejercicios. 1. Hallar la distancia de la recta con ecuación y “ 2x al punto p2, 1q. 502 15.11. 15.11. Ecuaciones de la circunferencia Ecuaciones de la circunferencia En esta sección deduciremos la ecuación de una circunferencia con centro en un punto Q “ pa, bq y radio r ą 0. Sea P “ px, yq un punto en el plano X Y que está a una distancia r de pa, bq. De acuerdo a la fórmula de la distancia entre dos puntos tenemos que la distancia entre px, yq y pa, bq es r si y sólo si a px ´ aq2 ` py ´ bq2 “ r, lo cual a su vez es equivalente a px ´ aq2 ` py ´ bq2 “ r2 . Tenemos así el siguiente teorema. 15.11.1. Teorema. La fórmula de una circunferencia con centro en pa, bq y radio r está dada por px ´ aq2 ` py ´ bq2 “ r2 . Observemos que la ecuación de una circunferencia puede representarse en diferentes formas equivalentes, a saber a px ´ aq2 ` py ´ bq2 “ r, x2 ´ 2ax ` a2 ` y 2 ´ 2by ` b2 ´ r2 “ 0, x2 ` y 2 ´ 2ax ´ 2by ` a2 ` b2 ´ r2 “ 0, es decir la ecuación de la circunferencia puede tomar la forma x2 ` y 2 ` Ax ` By ` C “ 0, 15.11.2. con A “ ´2a, B “ ´2b y C “ a2 ` b2 ´ r2 . Pero una ecuación de la forma 15.11.2 no siempre representa una circunferencia. Hagamos un análisis más detallado. x2 ` y 2 ` Ax ` By ` C “ 0 ðñ ˆ ˙2 ˆ ˙ 2 ˆ ˙2 ˆ ˙2 A B A B 2 x ` Ax ` ` y ` By ` “ ` ´C 2 2 2 2 2 ðñ ˆ A x` 2 ˙2 ˆ B ` y` 2 ˙2 ˆ ˙ 2 ˆ ˙2 A B “ ` ´ C, 2 2 lo cual representa una circunferencia con centro en p ´A , ´B q ` A ˘2 ` B ˘2 ` A ˘2 ` B ˘2 2 2 solamente cuando 2 ` 2 ´ C ą 0. Si 2 ` 2 ´ C ă 0, y radio b` ˘ A 2 2 ` ` B ˘2 2 ´C entonces la ecuación 15.11.2 representa al conjunto vacío, pues es imposible que dos números reales al cuadrado sumen ` A ˘2 ` B ˘2 un número negativo. Si 2 ` 2 ´ C “ 0, entonces la ecuación 15.11.2 representa al conjunto cuyo único elemento es el punto p ´A , ´B q, debido a que para que la suma de dos 2 2 15.11. Ecuaciones de la circunferencia 503 números reales elevados al cuadrado sea cero es necesario y suficiente que los números sean cero. Resumimos lo anterior en el teorema siguiente. 15.11.3. Teorema. Si A, B y C son constantes, entonces: dada en 15.11.2 es la de b` ˘ la `ecuación ˘ ` A ˘2 ` B ˘2 ´A ´B A 2 B 2 una circunferencia con centro en p 2 , 2 q y radio ` ´ C cuando ` ą 2 2 ` A ˘2 `2 B ˘2 2 ´A ´B C; es la del conjunto cuyo único elemento es el punto p 2 , 2 q cuando 2 ` 2 “ C; es ` ˘2 ` ˘2 la del conjunto vacío cuando A2 ` B2 ă C. 504 15.12. 15.12. Ecuaciones de la parábola Ecuaciones de la parábola parábola eje El concepto de parábola tiene aplicaciones en distintas áreas del conocimiento y utilidad en la vida moderna como son la descripción de las trayectorias de los proyectiles, las telecomunicaciones, diseño de lámparas, radares y puentes. 15.12.1. Definición. Sea l una recta y F F directriz un punto que no está en l. Al conjunto de todos los puntos P que están en el plano al cual pertenecen F y los puntos de l tales que la distancia de P a F es la distancia de P a la recta l se le llama parábola. Al punto F se le llama foco de la parábola y a la recta l se le llama directriz de la parábola. La recta que pasa por el foco y es perpendicular a la directriz se llama eje de la parábola. 15.12.2. Ejemplo. Hallar la ecuación de la parábola cuya directriz es la recta con ecuación ? y “ x y el foco es el punto p0, 2 2q. Solución. La recta con ecuación y “ x se puede expresar en su forma general mediante la ecuación y ´ x “ 0. Ahora, cualquier punto px, yq está en la parábola si y?sólo si la distancia de la directriz a px, yq es la misma que la distancia de px, yq al foco p0, 2 2q, expresado esto en fórmulas se tiene (debido a la fórmula para la distancia entre dos puntos y a la fórmula para la distancia entre una recta y un punto) que el punto px, yq está en la parábola si y sólo si b ? |x ´ y| 2 ` py ´ 2 2q2 , a “ px ´ 0q 12 ` p´1q2 pero tenemos que |x ´ y| a “ 12 ` p´1q2 ðñ ðñ ðñ b ? px ´ 0q2 ` py ´ 2 2q2 ? px ´ yq2 “ x2 ` py ´ 2 2q2 2 ? x2 ´ 2xy ` y 2 “ 2x2 ` 2y 2 ´ 8 2y ` 16 ? x2 ` y 2 ` 2xy ´ 8 2y ` 16 “ 0. Es decir, una ecuación de dicha parábola está dada por ? x2 ` y 2 ` 2xy ´ 8 2y ` 16 “ 0. 15.12.3. Definiciones. Sea F el foco de una parábola y A el punto donde se intersecan su directriz y su eje, al punto medio del segmento con extremos A y F , es decir al punto 15.12. Ecuaciones de la parábola 505 V “ A`F , se le llama vértice de la parábola. Observemos que el vértice V es el punto de 2 la parábola más cercano al foco y a la directriz. A cualquier segmento cuyos extremos son puntos que pertenecen a la parábola se le llama cuerda de la parábola. A cualquier cuerda de la parábola que pase por el foco se le llama cuerda focal. La cuerda focal perpendicular al eje de la parábola se le llama lado recto. Observemos que la longitud del lado recto es 4 veces la distancia del vértice al foco. Deduzcamos ahora en forma general la ecuación de una parábola cuya directriz es horizontal y cuyo eje es vertical. Sea V “ ph, kq el vértice de una parábola y F “ ph, k ` pq su foco, donde p es un número diferente de cero. Observemos que el eje de la parábola es vertical y su ecuación es x “ h, además la directriz es horizontal y su ecuación es y “ k ´ p. Si p ą 0, el foco está arriba de la directriz y si p ă 0, entonces el foco está abajo de la directriz. Ahora, la ecuación de la directriz puede expresarse en la forma y ` pp ´ kq “ 0. Por definición de parábola el punto P “ px, yq está en la parábola si y sólo si la distancia de px, yq a ph, k ` pq es igual a la distancia de px, yq a la directriz. Es decir, P está en la parábola si y sólo si |y ` pp ´ kq| a ? “ px ´ hq2 ` py ´ pk ` pqq2 , 2 1 pero tenemos que |y ` pp ´ kq| a ? “ px ´ hq2 ` py ´ pk ` pqq2 12 ðñ py ` pp ´ kqq2 “ px ´ hq2 ` y 2 ´ 2pk ` pqy ` pk ` pq2 ðñ y 2 ` 2py ´ 2ky ` p2 ´ 2kp ` k 2 “ px ´ hq2 ` y 2 ´ 2ky ´ 2py ` k 2 ` 2kp ` p2 ðñ 2py ´ 2kp “ px ´ hq2 ´ 2py ` 2kp ðñ px ´ hq2 “ 4ppy ´ kq. Lo anterior se puede resumir en el teorema siguiente. 15.12.4. Teorema. La ecuación de una parábola con vértice V “ ph, kq, foco F “ ph, k ` pq y directriz con ecuación y “ k ´ p está dada por px ´ hq2 “ 4ppy ´ kq, donde |4p| es la longitud del lado recto y además: 506 15.12. Ecuaciones de la parábola a) Si p ą 0, el foco está arriba de la directriz. b) Si p ă 0, el foco esta abajo de la directriz. Análogamente se puede demostrar el teorema siguiente. 15.12.5. Teorema. La ecuación de una parábola con vértice ph, kq, foco F “ ph ` p, kq y directriz con ecuación x “ h ´ p está dada por py ´ kq2 “ 4ppx ´ hq, donde |4p| es la longitud del lado recto y además: a) Si p ą 0, el foco está a la derecha de la directriz. b) Si p ă 0, el foco está a la izquierda de la directriz. Observemos que la ecuación de una parábola con eje vertical puede expresarse en la forma x2 ` Ax ` By ` C “ 0, mientras que la ecuación de una parábola con eje horizontal puede expresarse en la forma y 2 ` Ax ` By ` C “ 0. Ejercicios. 1. Hallar la ecuación de la parábola que tiene como directriz a la recta con ecuación y “ 2x y foco el punto p1, 1q. 2. Hallar la ecuación de la parábola que tiene eje vertical, tiene vértice en p3, 2q y pasa por el punto p1, 0q. 3. Hallar la directriz, vértice y foco de la parábola y 2 ` 6y “ 4x ` 1. 15.13. Ecuaciones de la elipse 15.13. 507 Ecuaciones de la elipse 15.13.1. Definiciones. Sean F1 y F2 dos puntos en un plano y s un número mayor A1 que la distancia entre F1 y F2 . Al conjunto de L1 puntos P en el plano tales que la distancia de P a F1 más la distancia de P a F2 es igual a eje focal V2 F2 C F1 V1 la constante s se le llama elipse. Los puntos F1 y F2 se llaman focos de la elipse y al L2 número s se llama constante de la elipse. A A2 la recta l que pasa por los focos se le llama eje focal. Los puntos V1 y V2 de la elipse, que están en el eje focal, se llaman vértices de la elipse. Al segmento cuyos extremos son los vértices de la elipse se le llama eje mayor de la elipse. Al punto medio C del eje mayor de la elipse se le llama centro de la elipse. La recta l1 incluida en el mismo plano en el cual está la elipse, perpendicular al eje focal l y que pasa por el centro C se llama eje normal de la elipse. Designemos por A1 y A2 los puntos donde se cortan el eje normal y la elipse. Al segmento cuyos extremos son A1 y A2 se le llama eje menor. Si B1 y B2 son dos puntos diferentes de la elipse, al segmento cuyos extremos son B1 y B2 se le llama cuerda de la elipse. Cualquier cuerda que pase por uno de los focos se llama cuerda focal. A la cuerda focal L1 L2 que sea perpendicular al eje focal se le llamará lado recto de la elipse. eje normal 15.13.2. Ejemplo. Hallar la ecuación de la elipse con focos F1 “ p´1, ´4q y F2 “ p´4, ´2q y cantidad constante 5. Solución. Un punto P “ px, yq está en la elipse si y sólo si |P ´ F1 | ` |P ´ F2 | “ 5, es decir 15.13.3. a a px ´ p´1qq2 ` py ´ p´4qq2 ` px ´ p´4qq2 ` py ´ p´2qq2 “ 5, pero tenemos que a a px ´ p´1qq2 ` py ´ p´4qq2 ` px ´ p´4qq2 ` py ´ p´2qq2 “ 5 ðñ a px ` 1q2 ` py ` 4q2 ` a a px ` 1q2 ` py ` 4q2 “ 5 ´ px ` 4q2 ` py ` 2q2 “ 5 ðñ 15.13.4. a px ` 4q2 ` py ` 2q2 ùñ 15.13.5. ðñ a ˇ ˇ a ˇ ˇ px ` 1q2 ` py ` 4q2 “ ˇ5 ´ px ` 4q2 ` py ` 2q2 ˇ a px ` 1q2 ` py ` 4q2 “ 25 ´ 10 px ` 4q2 ` py ` 2q2 ` px ` 4q2 ` py ` 2q2 508 15.13. Ecuaciones de la elipse ðñ a x2 ` 2x ` 1 ` y 2 ` 8y ` 16 “ 25 ´ 10 px ` 4q2 ` py ` 2q2 ` x2 ` 8x ` 16 ` y 2 ` 4y ` 4 ðñ a 6x ´ 4y ` 28 “ 10 px ` 4q2 ` py ` 2q2 15.13.6. ùñ a |6x ´ 4y ` 28| “ 10 px ` 4q2 ` py ` 2q2 15.13.7. ðñ 36x2 ` 16y 2 ` 784 ´ 48xy ` 336x ´ 224y “ 100px ` 4q2 ` 100py ` 2q2 ðñ 9x2 ` 4y 2 ` 196 ´ 12xy ` 84x ´ 56y “ 25px ` 4q2 ` 25py ` 2q2 ðñ 9x2 ` 4y 2 ` 196 ´ 12xy ` 84x ´ 56y “ 25x2 ` 200x ` 400 ` 25y 2 ` 100y ` 100 ðñ 16x2 ` 12xy ` 21y 2 ` 116x ` 156y ` 304 “ 0, 15.13.8. por lo que la elipse debe satisfacer la ecuación 15.13.8. Para demostrar que la fórmula 15.13.8 es la ecuación de la elipse es suficiente demostrar que 15.13.7 ùñ 15.13.6 y que 15.13.5 ùñ 15.13.4. Para ver que 15.13.7 ùñ 15.13.6, demostremos que es imposible que se cumpla la ecuación a 6x ´ 4y ` 28 “ ´10 px ` 4q2 ` py ` 2q2 . 15.13.9. Tenemos que a 6x ´ 4y ` 28 “ ´10 px ` 4q2 ` py ` 2q2 ðñ a x2 ` 2x ` y 2 ` 8y ` 17 “ 25 ` 10 px ` 4q2 ` py ` 2q2 ` x2 ` 8x ` y 2 ` 4y ` 20 ðñ x2 ` 2x ` 1 ` y 2 ` 8y ` 16 a “ 25 ` 10 px ` 4q2 ` py ` 2q2 ` x2 ` 8x ` 16 ` y 2 ` 4y ` 4 ðñ ðñ a px ` 1q2 ` py ` 4q2 “ 25 ` 10 px ` 4q2 ` py ` 2q2 ` px ` 4q2 ` py ` 2q2 ´ ¯2 a px ` 1q2 ` py ` 4q2 “ 5 ` px ` 4q2 ` py ` 2q2 15.13. Ecuaciones de la elipse 509 ðñ 15.13.10. a px ´ p´1qq2 ` py ´ p´4qq2 ´ a px ´ p´4qq2 ` py ´ p´2qq2 “ 5. Pero la ecuación 15.13.10 es imposible puesto que, debido a la desigualdad del triángulo, a a px ´ p´1qq2 ` py ´ p´4qq2 ´ px ´ p´4qq2 ` py ´ p´2qq2 a ? ? ĺ p´1 ´ p´4qq2 ` p´4 ´ p´2qq2 “ 9 ` 4 “ 13 ă 5, por lo tanto 15.13.7 ùñ 15.13.6. De manera análoga a como se demostró la imposibilidad de 15.13.10 se demuestra la imposibilidad de la ecuación a a px ` 1q2 ` py ` 4q2 “ ´5 ` px ` 4q2 ` py ` 2q2 y tal imposibilidad nos lleva a que la ecuación 15.13.5 implica la 15.13.4. Así la igualdad 15.13.8 es la ecuación de la elipse, es decir el punto P “ px, yq está en la elipse si y sólo si satisface 15.13.8. Establezcamos ahora fórmulas de la elipse para los casos particulares en que los ejes sean paralelos a los ejes de coordenadas. Veamos el caso en que la elipse tiene eje mayor horizontal. Sean C “ ph, kq el centro de la elipse; F1 “ ph ´ c, kq, F2 “ ph ` c, kq los focos, con c ą 0; V1 “ ph ´ a, kq, V2 “ ph ` a, kq los vértices, con a ą c. Observemos que la constante de la elipse es 2a, de modo que un punto P “ px, yq está en la elipse si y sólo si |F1 ´ P | ` |F2 ´ P | “ 2a, es decir a a px ´ ph ´ cqq2 ` py ´ kq2 ` px ´ ph ` cqq2 ` py ´ kq2 “ 2a, pero tenemos que a a px ´ ph ´ cqq2 ` py ´ kq2 ` px ´ ph ` cqq2 ` py ´ kq2 “ 2a ðñ 15.13.11. a a px ´ ph ´ cqq2 ` py ´ kq2 “ 2a ´ px ´ ph ` cqq2 ` py ´ kq2 ùñ 15.13.12. ðñ a px ´ ph ´ cqq2 ` py ´ kq2 ˇ ˇ a ˇ ˇ 2 2 “ ˇ2a ´ px ´ ph ` cqq ` py ´ kq ˇ a 4xc ´ 4hc ´ 4a2 “ ´4a px ´ ph ` cqq2 ` py ´ kq2 ðñ 15.13.13. a a2 ´ cpx ´ hq “ a px ´ ph ` cqq2 ` py ´ kq2 510 15.13. Ecuaciones de la elipse ùñ pa2 ´ cpx ´ hqq2 “ a2 pppx ´ hq ´ cq2 ` py ´ kq2 q 15.13.14. ðñ a4 ´ 2a2 cpx ´ hq ` c2 px ´ hq2 “ a2 ppx ´ hq2 ´ 2px ´ hqc ` c2 ` py ´ kq2 q ðñ a4 ` c2 px ´ hq2 “ a2 px ´ hq2 ` a2 c2 ` a2 py ´ kq2 ðñ pa2 ´ c2 qpx ´ hq2 ` a2 py ´ kq2 “ a4 ´ a2 c2 . 15.13.15. Ahora, los extremos del lado menor son de la forma A1 “ ph, k ` bq y A2 “ ph, k ´ bq con b ą 0, pero |F1 ´ A1 | “ a, de donde, por el teorema de Pitágoras, tenemos que b2 “ a2 ´ c2 y tenemos que la ecuación 15.13.13 es equivalente a px ´ hq2 py ´ kq2 ` “ 1. a2 b2 15.13.16. Para ver que la ecuación 15.13.16 es la ecuación de la elipse es suficiente con demostrar que cualquier punto que satisfaga 15.13.15 debe estar en la elipse. Ahora, la ecuación 15.13.15 2 conduce a que px´hq ĺ 1, de donde ´a ĺ x ´ h ĺ a, pero como a ą c, tenemos que a2 2 cpx ´ hq ă a , es decir a2 ´ cpx ´ hq ą 0, de donde se puede ver que la ecuación 15.13.14 implica la 15.13.13. Veamos ahora que la ecuación 15.13.12 implica la 15.13.11. Para demostrarlo es suficiente demostrar la imposibilidad de la ecuación a a ´ px ´ ph ´ cqq2 ` py ´ kq2 “ 2a ´ px ´ ph ` cqq2 ` py ´ kq2 , la cual es equivalente a la ecuación a a px ´ ph ` cqq2 ` py ´ kq2 ´ px ´ ph ´ cqq2 ` py ´ kq2 “ 2a, pero por la desigualdad del triángulo tenemos que a a px ´ ph ` cqq2 ` py ´ kq2 ´ px ´ ph ´ cqq2 ` py ´ kq2 ă 2c ă 2a, por lo que la ecuación 15.13.16 es la de la elipse con centro en ph, kq, focos ph ´ c, kq y ph `´c, kq, vértices¯ ph´ ´ a, kq y ph¯` ´ a, kq. Observemos de los lados rectos ¯ ´que los extremos ¯ 2 2 2 2 son k ` c, k ` ba , k ` c, k ´ ba , k ´ c, k ` ba y k ´ c, k ´ ba , y la longitud de cada 2 lado recto es 2 ba . Resumamos los análisis anteriores en el siguiente teorema. 15.13.17. Teorema. La ecuación de una elipse con centro en ph, kq, vértices en ph ` a, kq y ph ´