See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/261714614
Algebra y geometria lineal
Book · January 2007
CITATIONS
READS
5
80
1 author:
Rafael M. Rubio
University of Córdoba
104 PUBLICATIONS 706 CITATIONS
SEE PROFILE
All content following this page was uploaded by Rafael M. Rubio on 16 August 2024.
The user has requested enhancement of the downloaded file.
Álgrebra y Geometrı́a Lineal
Andrés Raya, Alfonso Rı́der, Rafael Rubio
2
Índice general
3
Índice general
0.1.
0.2.
0.3.
0.4.
0.5.
0.6.
Del contenido de este libro . . . . . . . . . . . . . . . . . . . . . .
El libro concebido como referencia . . . . . . . . . . . . . . . . .
Los vectores libres . . . . . . . . . . . . . . . . . . . . . . . . . .
Fundamentación de la Geometrı́a . . . . . . . . . . . . . . . . . .
Polivalencia del Algebra Vectorial . . . . . . . . . . . . . . . . . .
Dimensiones arbitrarias . . . . . . . . . . . . . . . . . . . . . . .
15
15
16
16
17
18
1. Vectores Libres
19
1.1. Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2. El plano geométrico . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3. Semirrectas o rayos . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4. Segmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5. Vectores fijos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6. Longitudes y distancias . . . . . . . . . . . . . . . . . . . . . . . 21
1.7. Módulo de un vector . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.8. Paralelismo de rectas. El concepto de dirección . . . . . . . . . . 22
1.9. Dirección de un vector . . . . . . . . . . . . . . . . . . . . . . . . 22
1.10. Semiplanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.11. Sentido de un vector . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.12. Multiplicación de números por vectores fijos . . . . . . . . . . . . 24
1.13. El Teorema de Thales . . . . . . . . . . . . . . . . . . . . . . . . 25
1.14. Puntos medios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.15. Simetrı́as centrales . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.16. Equipolencia de vectores fijos . . . . . . . . . . . . . . . . . . . . 27
1.17. Paralelogramos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.18. El concepto de vector libre . . . . . . . . . . . . . . . . . . . . . . 29
1.19. Adición de vectores libres . . . . . . . . . . . . . . . . . . . . . . 31
1.20. Multiplicación de números por vectores libres . . . . . . . . . . . 33
1.21. Dependencia lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.22. Bidimensionalidad del plano . . . . . . . . . . . . . . . . . . . . . 39
1.23. Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.24. La recta geométrica . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.25. El espacio geométrico . . . . . . . . . . . . . . . . . . . . . . . . 40
4
Índice general
2. Espacios Vectoriales
43
2.1. El concepto de espacio vectorial . . . . . . . . . . . . . . . . . . . 43
2.2. Primeras propiedades de los espacios vectoriales . . . . . . . . . . 44
2.3. Los vectores libres . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.4. Los cuerpos como espacios vectoriales sobre sı́ mismos . . . . . . 46
2.5. Espacios cartesianos . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.6. Espacios de sucesiones . . . . . . . . . . . . . . . . . . . . . . . . 47
2.7. Espacios de polinomios . . . . . . . . . . . . . . . . . . . . . . . . 48
2.8. Espacios de funciones . . . . . . . . . . . . . . . . . . . . . . . . 49
2.9. Algebras asociativas . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.10. Espacios vectoriales sobre cuerpos no conmutativos . . . . . . . . 49
2.11. Módulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3. Subespacios Vectoriales
53
3.1. Definición de subespacio vectorial . . . . . . . . . . . . . . . . . . 53
3.2. Caracterizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3. Combinaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4. Intersección de subespacios vectoriales . . . . . . . . . . . . . . . 55
3.5. Subespacio generado por un conjunto de vectores . . . . . . . . . 56
3.6. Suma de subespacios . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.7. Subespacios de vectores libres . . . . . . . . . . . . . . . . . . . . 58
3.8. El espacio l∞ de las sucesiones acotadas . . . . . . . . . . . . . . 58
3.9. El espacio c de las sucesiones convergentes . . . . . . . . . . . . . 59
3.10. El espacio c0 de las sucesiones infinitésimas . . . . . . . . . . . . 60
3.11. El espacio IKn [ξ] de polinomios de grado a lo sumo n . . . . . . . 60
3.12. Subálgebras asociativas . . . . . . . . . . . . . . . . . . . . . . . 61
3.13. El álgebra de las funciones convergentes en un punto . . . . . . . 61
3.14. Algebras de funciones continuas . . . . . . . . . . . . . . . . . . . 62
3.15. Algebras de funciones derivables . . . . . . . . . . . . . . . . . . 62
3.16. Algebras de funciones integrables . . . . . . . . . . . . . . . . . . 62
3.17. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 64
4. Sistemas Generadores
67
4.1. Sistemas generadores de un espacio . . . . . . . . . . . . . . . . . 67
4.2. Reducción de sistemas generadores . . . . . . . . . . . . . . . . . 67
4.3. Espacios vectoriales de generación finita e infinita . . . . . . . . . 68
4.4. Concepto de dependencia e independencia lineal . . . . . . . . . 69
4.5. Propiedades elementales de la dependencia . . . . . . . . . . . . . 69
4.6. Conjuntos ligados y conjuntos libres . . . . . . . . . . . . . . . . 71
4.7. Ampliación de conjuntos libres . . . . . . . . . . . . . . . . . . . 71
4.8. Concepto de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 72
Índice general
5
5. Espacios de Generación Finita
75
5.1. Teorema fundamental de los espacios de generación finita . . . . 75
5.2. Obención de bases a partir de un sistema generador . . . . . . . 77
5.3. Equicardinalidad de bases para generación finita . . . . . . . . . 77
5.4. Concepto de dimensión de un espacio . . . . . . . . . . . . . . . . 78
5.5. La dimensión como cardinal mı́nimo de un sistema generador . . 78
5.6. Caracterización de la finito-dimensionalidad . . . . . . . . . . . . 79
5.7. Obtención de bases a partir de un conjunto libre . . . . . . . . . 79
5.8. La dimensión como cardinal máximo de un conjunto libre . . . . 80
5.9. Rango de varios vectores . . . . . . . . . . . . . . . . . . . . . . . 80
5.10. Coordenadas de un vector en una base . . . . . . . . . . . . . . . 81
5.11. Las deltas de Kronecker . . . . . . . . . . . . . . . . . . . . . . . 82
5.12. Espacios de vectores libres . . . . . . . . . . . . . . . . . . . . . . 83
5.13. Espacios analı́ticos . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.14. El espacio f de las sucesiones casi nulas . . . . . . . . . . . . . . 84
5.15. Espacios de polinomios . . . . . . . . . . . . . . . . . . . . . . . . 85
5.16. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 86
6. Aplicaciones Lineales
89
6.1. Definición de aplicación lineal . . . . . . . . . . . . . . . . . . . . 89
6.2. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.3. Imagen y núcleo de una aplicación lineal . . . . . . . . . . . . . . 91
6.4. Linealidad y generación . . . . . . . . . . . . . . . . . . . . . . . 92
6.5. Linealidad y dependencia . . . . . . . . . . . . . . . . . . . . . . 93
6.6. Linealidad y bases . . . . . . . . . . . . . . . . . . . . . . . . . . 94
6.7. Composición e inversión de aplicaciones lineales . . . . . . . . . . 94
6.8. Isomorfı́a de espacios vectoriales. Espacios abstractos . . . . . . . 95
6.9. El isomorfismo de Descartes . . . . . . . . . . . . . . . . . . . . . 96
6.10. Isomorfı́a y dimensión . . . . . . . . . . . . . . . . . . . . . . . . 97
6.11. Igualación de los espacios f y IR[ξ] . . . . . . . . . . . . . . . . . 98
6.12. Isomorfı́a y rango . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.13. El grupo lineal de un espacio vectorial . . . . . . . . . . . . . . . 98
6.14. Espacios de aplicaciones lineales . . . . . . . . . . . . . . . . . . 99
6.15. Otras propiedades de la composición . . . . . . . . . . . . . . . . 101
6.16. El álgebra de los endomorfismos de un espacio . . . . . . . . . . 102
6.17. Homotecias vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 102
6.18. Subespacios invariantes por un endomorfismo . . . . . . . . . . . 104
6.19. Vectores dobles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.20. Linealidad en el Análisis . . . . . . . . . . . . . . . . . . . . . . . 106
6.21. Morfismos de álgebras asociativas . . . . . . . . . . . . . . . . . . 107
6.22. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 108
6
Índice general
7. Suma Directa
111
7.1. Suma directa de subespacios . . . . . . . . . . . . . . . . . . . . . 111
7.2. Descomposición de un espacio en suma directa de subespacios . . 112
7.3. Sumas directas en vectores libres . . . . . . . . . . . . . . . . . . 112
7.4. Producto directo de dos espacios vectoriales . . . . . . . . . . . . 113
7.5. Relación entre los productos directos y las sumas directas . . . . 114
7.6. Proyecciones asociadas a una descomposición en suma directa . . 115
7.7. Endomorfismos proyectores . . . . . . . . . . . . . . . . . . . . . 117
7.8. Simetrı́as oblı́cuas . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 120
8. Dimensión y Codimensión de Subespacios
123
8.1. Subespacios de un espacio de dimensión finita . . . . . . . . . . . 123
8.2. Infinito-dimensionalidad de los espacios de funciones . . . . . . . 124
8.3. El lema de ampliación de bases . . . . . . . . . . . . . . . . . . . 124
8.4. Existencia de complementarios . . . . . . . . . . . . . . . . . . . 124
8.5. Dimensión de la suma e intersección . . . . . . . . . . . . . . . . 125
8.6. Dimensión de un espacio producto . . . . . . . . . . . . . . . . . 127
8.7. Subespacios de dimensión finita. Rectas y planos . . . . . . . . . 128
8.8. Ecuaciones paramétricas de un subespacio . . . . . . . . . . . . . 128
8.9. Codimensión de un subespacio . . . . . . . . . . . . . . . . . . . 130
8.10. Subespacios de codimensión finita. Hiperplanos . . . . . . . . . . 130
8.11. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 131
9. Espacios Cociente
135
9.1. Congruencias en un espacio, módulo un subespacio . . . . . . . . 135
9.2. Espacio cociente . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
9.3. Epimorfismo canónico sobre un subespacio . . . . . . . . . . . . . 136
9.4. Primer Teorema de Isomorfı́a . . . . . . . . . . . . . . . . . . . . 137
9.5. Inyección canónica de un subespacio . . . . . . . . . . . . . . . . 138
9.6. Descomposición canónica de una aplicación lineal . . . . . . . . . 138
9.7. Isomorfı́a del espacio cociente con los complementarios . . . . . . 139
9.8. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 140
10.Subespacios y Aplicaciones Afines
141
10.1. Comentarios a un capı́tulo de Geometrı́a . . . . . . . . . . . . . 141
10.2. Subespacios afines de un espacio vectorial . . . . . . . . . . . . . 142
10.3. Caracterización de los subespacios afines . . . . . . . . . . . . . 142
10.4. Dimensión de un subespacio afı́n . . . . . . . . . . . . . . . . . . 143
10.5. Contenido entre subespacios afines . . . . . . . . . . . . . . . . . 143
10.6. Combinaciones afines . . . . . . . . . . . . . . . . . . . . . . . . 144
10.7. Dependencia e independencia afı́n . . . . . . . . . . . . . . . . . 146
10.8. Ecuaciones paramétricas de subespacios afines . . . . . . . . . . 148
10.9. Imagen inversa de un vector en una aplicación lineal . . . . . . . 149
10.10.Traslaciones en un espacio vectorial . . . . . . . . . . . . . . . . 150
10.11.Aplicaciones afines . . . . . . . . . . . . . . . . . . . . . . . . . . 151
Índice general
7
10.12.Morfismos y combinaciones afines . . . . . . . . . . . . . . . . . 153
10.13.El grupo afı́n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
10.14.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 156
11.Matrices y sus Operaciones
159
11.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
11.2. Igualdad de matrices . . . . . . . . . . . . . . . . . . . . . . . . 160
11.3. Tipos particulares de matrices . . . . . . . . . . . . . . . . . . . 160
11.4. Espacios vectoriales de matrices . . . . . . . . . . . . . . . . . . 162
11.5. Dimensión del espacio de matrices . . . . . . . . . . . . . . . . . 163
11.6. Multiplicación de matrices . . . . . . . . . . . . . . . . . . . . . 164
11.7. Propiedades de la multiplicación de matrices . . . . . . . . . . . 165
11.8. El álgebra de las matrices cuadradas . . . . . . . . . . . . . . . . 166
11.9. El grupo lineal de grado n . . . . . . . . . . . . . . . . . . . . . 167
11.10.Traza de una matriz cuadrada . . . . . . . . . . . . . . . . . . . 167
11.11.Trasposición de matrices . . . . . . . . . . . . . . . . . . . . . . 168
11.12.Matrices simétricas y antisimétricas . . . . . . . . . . . . . . . . 170
11.13.Parte simétrica y parte antisimétrica de una matriz cuadrada . . 171
11.14.Matrices hermı́ticas y antihermı́ticas . . . . . . . . . . . . . . . . 172
11.15.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 173
12.Rango de una Matriz
177
12.1. Rango de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . 177
12.2. Matrices cuadradas regulares . . . . . . . . . . . . . . . . . . . . 179
12.3. Caracterización del rango mediante submatrices principales . . . 180
12.4. Método del orlado para el cálculo del rango . . . . . . . . . . . . 181
12.5. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 182
13.Determinantes
187
13.1. Aplicaciones multilineales . . . . . . . . . . . . . . . . . . . . . . 187
13.2. Aplicaciones multilineales alternadas . . . . . . . . . . . . . . . . 188
13.3. Formas multilineales y multilineales alternadas . . . . . . . . . . 189
13.4. Formas n-lineales alternadas de un espacio n- dimensional . . . 190
13.5. La función determinante del espacio IK n . . . . . . . . . . . . . 193
13.6. Determinante de una matriz cuadrada . . . . . . . . . . . . . . . 194
13.7. Determinantes y trasposición . . . . . . . . . . . . . . . . . . . . 196
13.8. Determinante de un producto . . . . . . . . . . . . . . . . . . . 197
13.9. Determinantes y regularidad . . . . . . . . . . . . . . . . . . . . 197
13.10.El grupo lineal especial de grado n . . . . . . . . . . . . . . . . . 198
13.11.Adjuntos y menores complementarios . . . . . . . . . . . . . . . 198
13.12.Cálculo de determinantes . . . . . . . . . . . . . . . . . . . . . . 201
13.13.Triangularización de determinantes . . . . . . . . . . . . . . . . 202
13.14.Matriz adjunta de una matriz cuadrada . . . . . . . . . . . . . . 203
13.15.Cálculo de la matriz inversa . . . . . . . . . . . . . . . . . . . . 204
13.16.Determinantes y rango de una matriz . . . . . . . . . . . . . . . 205
13.17.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 205
8
Índice general
14.Aplicaciones Lineales en Dimensión Finita
211
14.1. Aplicaciones lineales de rango finito . . . . . . . . . . . . . . . . 211
14.2. Endomorfismos de un espacio finito-dimensional . . . . . . . . . 212
14.3. Automorfismos de un espacio finito-dimensional . . . . . . . . . 213
14.4. Igualdad de dos morfismos que empiezan en dimensión finita . . 213
14.5. Matriz de un morfismo lineal entre espacios finito-dimensionales 214
14.6. Ecuaciones de una aplicación lineal . . . . . . . . . . . . . . . . 215
14.7. Matriz de un endomorfismo . . . . . . . . . . . . . . . . . . . . . 215
14.8. Matriz de una homotecia . . . . . . . . . . . . . . . . . . . . . . 216
14.9. Matriz de una forma lineal . . . . . . . . . . . . . . . . . . . . . 216
14.10.Determinación de aplicaciones lineales mediante matrices . . . . 216
14.11.El isomorfismo lineal
M (B, B 0 ) : AL(V, V0 , IK) → M(m, n, IK) . . . . . . . . . . . . . 217
14.12.Dimensión del espacio de aplicaciones lineales . . . . . . . . . . 218
14.13.Matriz de una compuesta . . . . . . . . . . . . . . . . . . . . . . 219
14.14.Matriz de la inversa de un isomorfismo lineal . . . . . . . . . . . 220
14.15.EL isomorfismo de álgebras unitarias
M t (B) : End(V, IK) → M(n, IK) . . . . . . . . . . . . . . . . . . 220
14.16.El isomorfismo de grupos
M t (B) : GL(V, IK) → GL(n, IK) . . . . . . . . . . . . . . . . . . 221
14.17.Dimensión y una base de la imagen . . . . . . . . . . . . . . . . 221
14.18.Coordenadas de un vector imagen . . . . . . . . . . . . . . . . . 222
14.19.Dimensión y una base del núcleo . . . . . . . . . . . . . . . . . . 223
14.20.Imagen inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
14.21.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 225
15.Sistemas Lineales
229
15.1. Ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . 229
15.2. Sistemas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
15.3. Interpretación geométrica de un sistema lineal . . . . . . . . . . . 231
15.4. La condición de Rouché Frobenius . . . . . . . . . . . . . . . . . 231
15.5. Sistemas y regla de Cramer . . . . . . . . . . . . . . . . . . . . . 232
15.6. Estudio y resolución de los sistemas homogéneos . . . . . . . . . 233
15.7. Estudio resolución de los sistemas completos . . . . . . . . . . . . 234
15.8. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 236
16.Dualidad
239
16.1. Espacio dual de uno dado. Bases duales . . . . . . . . . . . . . . 239
16.2. El espacio bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
16.3. Hiperplanos y formas lineales . . . . . . . . . . . . . . . . . . . . 242
16.4. Ecuación implı́cita de un hiperplano . . . . . . . . . . . . . . . . 244
16.5. Proyecciones sobre hiperplanos y rectas. Ecuaciones . . . . . . . 245
16.6. Simetrı́as especulares axiales. Ecuaciones . . . . . . . . . . . . . . 245
16.7. Ecuaciones implı́citas de un subespacio . . . . . . . . . . . . . . . 246
16.8. Paso de las ecuaciones implı́citas a las paramétricas . . . . . . . . 247
16.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 250
Índice general
9
17.Trasposición de Aplicaciones Lineales
259
17.1. Trasposición de una aplicación lineal . . . . . . . . . . . . . . . . 259
17.2. Traspuesta de una traspuesta . . . . . . . . . . . . . . . . . . . . 261
17.3. Trasposición entre espacios finito-dimensionales . . . . . . . . . . 261
17.4. Matriz y rango de la aplicación lineal
traspuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262
17.5. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 264
18.Cambios de Base
267
18.1. Matriz de un cambio de bases . . . . . . . . . . . . . . . . . . . . 267
18.2. Cambios de bases y matrices regulares . . . . . . . . . . . . . . . 267
18.3. Cambios de bases y automorfismos lineales . . . . . . . . . . . . 268
18.4. Composición de dos cambios . . . . . . . . . . . . . . . . . . . . . 268
18.5. Cambio idéntico y cambio recı́proco . . . . . . . . . . . . . . . . 269
18.6. Orientación de bases en espacios vectoriales reales . . . . . . . . 269
18.7. Cambio entre bases duales . . . . . . . . . . . . . . . . . . . . . . 270
18.8. Cambio de coordenadas . . . . . . . . . . . . . . . . . . . . . . . 271
18.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 272
19.Equivalencia y Semejanza de Matrices
277
19.1. Matriz de una aplicación lineal al cambiar de bases . . . . . . . 277
19.2. Matrices equivalentes . . . . . . . . . . . . . . . . . . . . . . . . 278
19.3. Interpretación geométrica de la equivalencia de matrices . . . . . 279
19.4. Equivalencia y rango. Matriz canónica de una clase . . . . . . . 280
19.5. Matriz de un endomorfismo lineal al cambiar de base . . . . . . 281
19.6. Semejanza de matrices cuadradas . . . . . . . . . . . . . . . . . 282
19.7. Interpretación geométrica de la semejanza de matrices . . . . . . 283
19.8. Traza y determinante de un endomorfismo . . . . . . . . . . . . 283
19.9. El grupo lineal especial de un espacio finito-dimensional . . . . . 284
19.10.Paridad o imparidad de un automorfismo de un espacio real . . 285
19.11.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 285
20.Espacios Afines
291
20.1. El concepto de espacio afı́n. Dimensión . . . . . . . . . . . . . . 291
20.2. Los espacios vectoriales como espacios afines . . . . . . . . . . . 291
20.3. Primeras propiedades de los espacios afines . . . . . . . . . . . . 292
20.4. Vector de posición de un punto . . . . . . . . . . . . . . . . . . . 292
20.5. Subespacios afines . . . . . . . . . . . . . . . . . . . . . . . . . . 293
20.6. Caracterización de los subespacios afines . . . . . . . . . . . . . 294
20.7. Subespacios afines de un espacio vectorial . . . . . . . . . . . . . 295
20.8. Determinación de subespacios afines . . . . . . . . . . . . . . . . 295
20.9. Contenido entre subespacios afines . . . . . . . . . . . . . . . . . 296
20.10.Incidencia de subespacios afines . . . . . . . . . . . . . . . . . . 296
20.11.Subespacios afines complementarios . . . . . . . . . . . . . . . . 297
20.12.Paralelismo de subespacios afines . . . . . . . . . . . . . . . . . 298
20.13.Proyecciones paralelas . . . . . . . . . . . . . . . . . . . . . . . . 299
10
Índice general
20.14.Combinaciones afines . . . . . . . . . . . . . . . . . . . . . . . . 299
20.15.Dependencia e independencia afı́n . . . . . . . . . . . . . . . . . 302
20.16.Puntos medios y baricentros . . . . . . . . . . . . . . . . . . . . 304
20.17.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 305
21.Coordenadas en Espacios Afines
309
21.1. Sistemas de referencia. Coordenadas . . . . . . . . . . . . . . . . 309
21.2. Ecuaciones paramétricas de un subespacio afı́n . . . . . . . . . . 310
21.3. Ecuaciones implı́citas de un subespacio afı́n . . . . . . . . . . . . 312
21.4. Incidencia en dimensión finita . . . . . . . . . . . . . . . . . . . . 313
21.5. Paralelismo en dimensión finita . . . . . . . . . . . . . . . . . . . 314
21.6. Posiciones relativas . . . . . . . . . . . . . . . . . . . . . . . . . . 315
21.7. Dependencia e independencia afı́n en dimensión finita . . . . . . 316
21.8. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 318
22.Aplicaciones Afines
323
22.1. Traslaciones en un espacio afı́n . . . . . . . . . . . . . . . . . . . 323
22.2. El concepto de aplicación afı́n . . . . . . . . . . . . . . . . . . . 325
22.3. Aplicaciones afines entre espacios vectoriales . . . . . . . . . . . 326
22.4. Ejemplos de morfismos afines . . . . . . . . . . . . . . . . . . . . 326
22.5. Composición e inversión de aplicaciones afines . . . . . . . . . . 327
22.6. Ecuación vectorial de una aplicación afı́n . . . . . . . . . . . . . 329
22.7. Determinación y descomposición de aplicaciones afines . . . . . 330
22.8. Isomorfı́a de espacios afines . . . . . . . . . . . . . . . . . . . . . 332
22.9. Aplicaciones afines y dependencia afı́n . . . . . . . . . . . . . . . 332
22.10.Aplicaciones afines y subespacios afines . . . . . . . . . . . . . . 334
22.11.Aplicaciones afines y paralelismo . . . . . . . . . . . . . . . . . . 334
22.12.Puntos dobles de un endomorfismo afı́n . . . . . . . . . . . . . . 335
22.13.Matriz de una aplicación afı́n . . . . . . . . . . . . . . . . . . . . 336
22.14.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 339
23.El Grupo Afı́n. Cambio de Coordenadas
341
23.1. El grupo afı́n de un espacio afı́n . . . . . . . . . . . . . . . . . . . 341
23.2. Grupo de las afinidades que tienen como doble un punto dado . . 342
23.3. Descomposición semidirecta del grupo afı́n . . . . . . . . . . . . . 343
23.4. Matriz de una afinidad . . . . . . . . . . . . . . . . . . . . . . . . 343
23.5. Cambio de coordenadas en un espacio afı́n . . . . . . . . . . . . . 344
23.6. Orientación de sistemas de referencia en espacios afines reales . . 345
23.7. Paridad e imparidad de las afinidades de un espacio real . . . . . 346
23.8. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 346
24.Simetrı́as, Traslaciones y Homotecias
349
24.1. Simetrı́as centrales . . . . . . . . . . . . . . . . . . . . . . . . . . 349
24.2. El grupo T C(E, IK) . . . . . . . . . . . . . . . . . . . . . . . . . 350
24.3. Homotecias afines . . . . . . . . . . . . . . . . . . . . . . . . . . 351
24.4. El grupo HP∗ (E, IK) de las homotecias concéntricas . . . . . . . . 352
Índice general
11
24.5. El grupo T H∗ (E, IK) . . . . . . . . . . . . . . . . . . . . . . . . 353
24.6. Composición de traslaciones con homotecias y simetrı́as centrales 356
24.7. Estructura de los grupos T H∗ (E, IK) y T C(E, IK) . . . . . . . . 358
24.8. Proyecciones paralelas y simetrı́as oblı́cuas . . . . . . . . . . . . 359
24.9. Simetrı́as especulares y simetrı́as axiales . . . . . . . . . . . . . . 364
24.10.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 365
25.Clasificación de Endomorfismos Lineales. Preliminares
369
25.1. Semejanza de matrices y endomorfismos lineales . . . . . . . . . . 369
25.2. El problema de la diagonalización . . . . . . . . . . . . . . . . . . 369
25.3. El problema de la triangularización . . . . . . . . . . . . . . . . . 370
25.4. Las formas canónicas de Jordan . . . . . . . . . . . . . . . . . . . 371
26.Autovalores y Autovectores de un Endomorfismo Lineal
373
26.1. Autovalores y autovectores . . . . . . . . . . . . . . . . . . . . . 373
26.2. Subespacios invariantes por un endomorfismo . . . . . . . . . . . 373
26.3. Autoespacio asociado a un autovalor . . . . . . . . . . . . . . . . 374
26.4. Caso finito-dimensional. Polinomio caracterı́stico . . . . . . . . . 375
26.5. Restricción de un endomorfismo a un subespacio invariante . . . 377
26.6. Una cota para la dimensión del autoespacio de un autovalor . . . 380
26.7. Suma directa de subespacios invariantes . . . . . . . . . . . . . . 380
26.8. Autovectores asociados a autovalores distintos . . . . . . . . . . . 381
26.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 383
27.Triangularización y Diagonalización de Endomorfismos
389
27.1. Endomorfismos triangularizables y diagonalizables . . . . . . . . 389
27.2. Una condición necesaria . . . . . . . . . . . . . . . . . . . . . . . 389
27.3. Caracterización de la triangularización . . . . . . . . . . . . . . . 390
27.4. Diagonalización en el caso de espectro simple . . . . . . . . . . . 392
27.5. Caracterización de la diagonalización . . . . . . . . . . . . . . . . 392
27.6. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 394
28.Polinomio Mı́nimo de un Endomorfiso
399
28.1. Potencias naturales de un endomorfismo . . . . . . . . . . . . . 399
28.2. Polinomios en un endomorfismo . . . . . . . . . . . . . . . . . . 400
28.3. El álgebra IK[f ] . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
28.4. Caso finito - dimensional. Polinomio mı́nimo de un endomorfismo 401
28.5. Teorema de Hamilton - Cayley . . . . . . . . . . . . . . . . . . . 402
28.6. Raı́ces del polinomio mı́nimo . . . . . . . . . . . . . . . . . . . . 403
28.7. Polinomio mı́nimo en un subespacio invariante . . . . . . . . . . 404
28.8. Polinomio mı́nimo y suma directa . . . . . . . . . . . . . . . . . 405
28.9. Espacios indescomponibles . . . . . . . . . . . . . . . . . . . . . 405
28.10.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 406
12
Índice general
29.Escomposición Primaria
409
29.1. Núcleo de un polinomio respecto de un endomorfismo . . . . . . 409
29.2. Existencia de subespacios f -invariantes propios . . . . . . . . . . 411
29.3. Descomposición primaria . . . . . . . . . . . . . . . . . . . . . . . 413
29.4. Descomposición primaria para un endomorfismo triangularizable 415
29.5. Cálculo del polinomio mı́nimo de un endomorfismo triangularizable416
29.6. Caracterización de la diagonalización mediante el polinomio mı́nimo417
29.7. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 418
30.Introducción a las Formas de Jordan
421
30.1. El Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422
30.2. Matrices de Jordan en dimensión 2 . . . . . . . . . . . . . . . . . 422
30.3. Matrices de Jordan en dimensión 3 . . . . . . . . . . . . . . . . . 425
30.4. Matrices de Jordan en dimensión 4 . . . . . . . . . . . . . . . . . 430
30.5. Comentarios finales . . . . . . . . . . . . . . . . . . . . . . . . . . 443
30.6. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 446
31.Endomorfismos Nilpotentes
451
31.1. Endomorfismos nilpotentes . . . . . . . . . . . . . . . . . . . . . 451
31.2. Polinomio caracterı́stico y mı́nimo de un endomorfismo nilpotente451
31.3. Restricción a un subespacio invariante . . . . . . . . . . . . . . . 452
31.4. Subespacios anuladores . . . . . . . . . . . . . . . . . . . . . . . 452
31.5. Descomposición por complementación de un endomorfismo nilpotente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
31.6. Base asociada a la descomposición por complementación . . . . 455
31.7. Espacios cı́clicos respecto de un endomorfismo . . . . . . . . . . 457
31.8. Espacios cı́clicos respecto de un endomorfismo nilpotente . . . . 457
31.9. Matriz de un endomorfismo nilpotente de un espacio cı́clico . . . 458
31.10.Subespacios cı́clicos respecto de un endomorfismo nilpotente . . 459
31.11.Descomposición canónica de un endomorfismo nilpotente . . . . 459
31.12.Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . 462
32.El Teorema de Jordan
467
32.1. Endomorfismos triangularizables con un solo autovalor . . . . . . 467
32.2. Teorema de Jordan para endomorfismos triangularizables . . . . 469
32.3. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 470
33.Espacios Vectoriales Complejos
475
33.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475
33.2. Conjugación en el cuerpo de los números complejos . . . . . . . . 476
33.3. Aplicaciones semilineales . . . . . . . . . . . . . . . . . . . . . . . 477
33.4. Conjugación de vectores complejos . . . . . . . . . . . . . . . . . 478
33.5. Conjugación de matrices complejas . . . . . . . . . . . . . . . . . 480
33.6. Conjugación de endomorfismos lineales complejos . . . . . . . . . 480
33.7. Dimensión real de un espacio vectorial complejo . . . . . . . . . . 481
33.8. Complexificación de un espacio vectorial real . . . . . . . . . . . 482
Índice general
13
33.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 484
34.Endomorfismos de Espacios Reales
487
34.1. Raı́ces imaginarias de un polinomio de coeficientes reales . . . . . 487
34.2. Extensión de los endomorfismos reales al campo complejo . . . . 489
34.3. Autovectores de un autovalor imaginario . . . . . . . . . . . . . . 491
34.4. Autoespacio real de una pareja de autovalores complejos conjugados492
34.5. Matriz canónica reducida real . . . . . . . . . . . . . . . . . . . . 494
34.6. Endomorfismos reales en dimensión 2 con autovalores imaginarios 498
34.7. Endomorfismos reales en dimensión 3 con autovalores imaginarios 498
34.8. Endomorfismos reales en dimensión 4 con autovalores imaginarios 498
34.9. Complementos / Ejercicios . . . . . . . . . . . . . . . . . . . . . . 500
14
Índice general
0.1. Del contenido de este libro
15
Introducción
0.1.
Del contenido de este libro
El presente libro está dedicado al estudio de los Espacios Vectoriales y temas
relacionados con ellos (matrices, determinantes, sistemas lineales,espacios
afines y clasificación de endomrfismos). Forma parte, con otros en fase de
redacción, de un Curso de Algebra y Geometrı́a, que pretendemos ofrecer
a nuestros alumnos de la Licenciatura en Ciencias Fı́sicas. Sin embargo, ni la
materia en sı́ ni el enfoque personal que perseguimos en su redacción, son especı́ficos de estos estudiantes. Nuestro curso podrı́a ser válido igualmente para
otros alumnos de Ciencias (quı́micos, biólogos e incluso futuros matemáticos),
ası́ como para los de cualquier Ingenierı́a, lo mismo media que superior.
0.2.
El libro concebido como referencia
Bueno es advertir desde ahora que el libro no pretende ser completo en el sentido que los topólogos y matemáticos en general damos a este término. Como le
ocurre a los números racionales, tiene huecos y lagunas por doquier. Más bien
está concebido como una especie de guión (aunque en realidad es bastante más
que eso) donde aparecen todas las definiciones y demostraciones de teoremas
que un profesor necesitarı́a para el desarrollo de la clase real. Los huecos, las
lagunas, se refieren principalmente a lo que llamarı́amos motivaciones, introducciones históricas, razonamientos plausibles, uso de figuras y mayor abundancia
de ejemplos y ejercicios.
Claro está que, ante tan grande ausencia, debemos justificar nuestra postura: no es que no seamos partidarios de redactar estos complementos, sino que
nos inclinamos porque su exposición es algo que pertenece al acto lectivo en
sı́ (la clase) y debe llevar la impronta de la persona que lo cuenta (el profesor).
Cualquier antiguo alumno nuestro puede atestiguar cómo en clase usamos y
hasta abusamos de este material complementario. En otras palabras: nosotros
mismos al impartir las clases serı́amos los primeros en no seguir al pie de la letra
el texto que ahora presentamos: éste quedarı́a como una especie de referencia
donde, lo que sı́ es esencial, queda pulido y fijado, cosa que por otra parte no
siempre se consigue en los sesenta minutos de clase presencial.
16
0.3.
Índice general
Los vectores libres
El origen del concepto de espacio vectorial está en los llamados vectores libres.
En realidad, copia de ellos las operaciones de adición de vectores y la multiplicación de números por vectores y se obliga a que estas operaciones tengan las
mismas propiedades fundamentales que tienen las operaciones con vectores.
Una vez hecho esto, la teorı́a de espacios vectoriales se convierte en un capı́tulo
más del Algebra, entendida ésta como el estudio de conjuntos dotados de operaciones que a su vez están sujetas a cumplir determinadas propiedades. Sin
embargo, como iremos viendo a lo largo de este libro, los espacios vectoriales
toman una y otra vez como prestado el indudablemente lenguaje geométrico
propio de los vectores libres. De esta forma conseguimos geometrizar, con toda
la carga positiva que ello arrastra, este capı́tulo de la muchas veces llamada
Algebra Abstracta, con cierto matiz peyorativo para el adjetivo, procedente tal
vez de la aridez y frialdad que muchos dicen ver en las operaciones y en los
desarrollos formales.
Para poder dar este barniz geométrico a nuestra teorı́a es conveniente hacer un
amplio repaso de vectores libres. Nosotros lo planteamos en el primer capı́tulo del libro, y bueno será adelantar un detalle sobre el que nos extenderemos
al comienzo del mismo, que ası́ dicho, no deja de ser una verdad de Perogrullo: el estudio de los vectores libres requiere conocimientos previos y sólidos de
Geometrı́a.
0.4.
Fundamentación de la Geometrı́a
Hemos escrito conocimientos sólidos. O sea, debidamente fundamentados. La
Geometrı́a sin duda está dotada de unos cimientos casi perfectos desde que el
matemático griego Euclides redactara sus Elementos hacia el año 300 antes de
Jesucristo. Además, sus imperfecciones fueron limadas por el alemán Hilbert al
comienzo del siglo XX. Colocada, por otra parte, como ámbito real en el que se
ha desarrollado durante siglos la Fı́sica (especialmente la Mecánica y no digamos
la Óptica), su aprendizaje ha sido ineludible para toda persona culta de nuestra
civilización occidental.
La Geometrı́a, a la manera de Euclides, ha formado parte en efecto de cualquier
programa educativo (en sus etapas primaria y secundaria sobre todo) para generaciones enteras hasta muy avanzado el siglo XX, y, además, con carácter
casi exclusivo respecto de otros posibles enfoques y ampliaciones de la propia
Geometrı́a.
Y al hablar de otros enfoques y ampliaciones podemos pensar, por ejemplo, en la
llamada Geometrı́a Analı́tica, creada en la primera mitad del siglo XVII por los
franceses Fermat y Descartes, la cual, mediante el uso de coordenadas, permitió el estudio de cuestiones geométricas con técnicas numéricas y algebraicas. O
en la Geometrı́a Proyectiva de Desargues, o la Geometrı́a Diferencial de Monge.
Todas ellas contribuyeron al nacimiento de la Geometrı́a Vectorial, en pleno siglo
0.5. Polivalencia del Algebra Vectorial
17
XIX, siendo sus principales promotores Grassmann, Cayley y Hamilton, pero
todas ellas, a su vez, seguı́an fundamentándose en la Geometrı́a de Euclides.
Sólo en épocas más cercanas ha sido posible un cambio radical en la manera de
fundamentar la Geometrı́a, consistente en tomar los espacios vectoriales como
punto de partida. Este cambio precisaba una clarificación, o mejor, una rigorización de los números reales, labor que se culminó en la segunda mitad del
XIX y a la que contribuyeron entre otros Weierstrass, Dedekind y Cantor. Y lo
precisaba porque los espacios vectoriales descansan a su vez en los escalares o
números, elementos en definitiva de lo que en Algebra se llaman cuerpos conmutativos, y de los que números reales y números complejos son sus dos ejemplos
más importantes.
Es decir, modernamente, se procede al revés: los elementos primitivos, por decirlo de alguna manera, son los vectores entendidos como miembros de un
espacio vectorial, y con ellos vamos construyendo todo un edificio que, si bien
es puramente algebraico, como ya hemos tenido ocasión de señalar, lo vamos
geometrizando paulatinamente siempre con la guı́a, como también hemos señalado, de lo que pasaba con los vectores libres. Al hablar de espacios vectoriales
irán apareciendo, en efecto, los subespacios que generalizan a las rectas y planos
clásicos, aparecerá el concepto de aplicación lineal, inspirado y generalizador de
las transformaciones geométricas, llegaremos al concepto de dimensión, etc. En
etapas posteriores hablaremos de los espacios afines, ligados a un espacio vectorial, en los que reaparece el concepto de punto y en los que se incluyen todas
las cuestiones de paralelismo e incidencia. También lo haremos (si bien no en
este volumen sino en otro que titularemos Algebra y Geometrı́a Cuadrática) de
espacios vectoriales euclı́deos, éstos siempre con los números reales como cuerpo de base, en los que el instrumento básico serán los productos escalares,
generalización abstracta del conocido en vectores libres, dando entrada a conceptos como perpendicularidad, longitudes, ángulos, etc; y llegarán por fin
los espacios afines euclı́deos en los que se confluyen todos los conceptos de la
Geometrı́a tradicional.
Dentro de todas estas elaboraciones jugarán un papel destacado los espacios
analı́ticos o cartesianos, entendidos como conjuntos de parejas ordenadas, ternas
ordenadas, etc., de elementos de un cuerpo. Cuando éste sea el IR de los números
reales, llegamos a que el plano euclı́deo tradicional se sustituye sin más por el
espacio afı́n euclı́deo de las parejas, mientras que el espacio lo hace por el de las
ternas.
0.5.
Polivalencia del Algebra Vectorial
El alumno suele dudar de la necesidad de tanto edificio para llegar al final a algo
que históricamente ya era conocido. Tenemos que decirles que están cargados
de razón: si se trata únicamente de obtener una nueva fundamentación de la
Geometrı́a, el Algebra Vectorial es un lujo. Pero es que hay más . . .
18
Índice general
También les diremos que, conforme avancen en sus estudios, eleven su nivel
y vayan abandonando las formulaciones puramente elementales, irán comprobando por sı́ mismos cómo la Teorı́a de Espacios Vectoriales, además de servir
para otra fundamentación la Geometrı́a de Euclides, son un útil cuasi imprescindible del Análisis y la Fı́sica Clásica, y desde luego totalmente imprescindible en el estudio de las Ecuaciones Diferenciales, el Análisis Funcional o la
Mecánica Cuántica. Sin el álgebra de los espacios vectoriales queda coja la
moderna Geometrı́a Diferencial, incluyendo las coordenadas generalizadas de
la Mecánica Analı́tica. Sin ella se carece de lenguaje para las Geometrı́as no Euclı́deas dotadas de métricas generalizadas. Por ejemplo, la Geometrı́a asociada a
las transformaciones de Lorentz, que no es otra que la del famoso espacio-tiempo
de Einstein, o, si se quiere, el espacio tetradimensional de Minkowski.
0.6.
Dimensiones arbitrarias
La inercia mental tiende a asociar el concepto de dimensión con magnitudes
que se dicen extraı́das del mundo real: unidimensionales son los objetos que sólo
tienen largo, bidimensionales los que poseen largo y ancho, tridimensionales
los dotados de largo, ancho y alto. Y no hay más, dicen algunos. Los fı́sicos
relativistas se encargaron de romper este aserto: otra magnitud, el tiempo, puede
jugar y juega el papel de cuarta dimensión en el citado espacio de Minkowski.
Pero he aquı́ que los matemáticos hablan de espacios n-dimensionales, siendo n
un entero positivo arbitrario. ¿Dónde están las dimensiones superiores a cuatro?
Respondemos con otra pregunta, desconcertante tal vez para el estudiante que
se inicia: ¿quién ha dicho que estén en alguna parte?
Insistiremos una vez más en nuestras ideas: el concepto de dimensión será algebraico y por tanto no cabe esperar que el olmo nos ofrezca peras. Pero al estar
inspirado en los casos geométricos elementales, lo barnizamos, como hemos dicho en párrafos anteriores, hasta conseguir que el fruto del olmo se geometrice
y nos dé la apariencia de pera.
Enedimensional va a ser, en definitiva, todo proceso para cuya descripción o
determinación se precisen n datos independientes. Por ejemplo cualquier función
de n variables de las que se estudian en Análisis. Por ejemplo, cualquier sistema
dinámico que dependa de n coordenadas generalizadas. Si se quiere, désele a
cada dimensión la interpretación concreta de esa variable o de esa coordenada.
Y, puestos a generalizar, ¿por qué no infinitas dimensiones? Por ejemplo, los desarrollos en serie de Fourier, fundamentales en todas las cuestiones ondulatorias
de la Fı́sica, dependen de sus infinitos sumandos y el ámbito en que hoy se estudian son los espacios (infinito- dimensionales) de Hilbert. Los mismos espacios
que se hicieron imprescindibles en la formulación matemática de la Mecánica
Cuántica una vez que Heisenberg enunciara su Principio de Incertidumbre en
1927.
Andrés Raya, Alfonso Rı́der, Rafael Rubio. 2007.
19
Capı́tulo 1
Vectores Libres
1.1.
Nota
Los vectores libres fueron incorporados al saber matemático hacia mitad del siglo
XIX y desde entonces su uso se ha hecho imprescindible en muchos cursos de
Geometrı́a Elemental, y, por supuesto, en todos los de Fı́sica General. Debemos,
pues, suponer que forman parte del actual bagaje cultural-cientı́fico de nuestros
alumnos. Nosotros, humildemente, sólo pretendemos hacer un recordatorio de
los mismos.
Ahora bien, puesto que su introducción (lo mismo para geómetras que para
fı́sicos) se hace partiendo de un conocimiento previo de la recta, el plano y
el espacio geométricos, nuestra inquietud, antes de iniciar la redacción del
tema, podrı́a sintetizarse en estas preguntas:
- ¿Qué nivel exacto de conocimientos debemos presuponer?
- ¿Qué Geometrı́a es la que realmente conocen los estudiantes recién incorporados a la Universidad?
- ¿Se basa su conocimiento geométrico en alguna de las versiones de la axiomática de Euclides, o, simplemente, se limita a una exploración intuitiva y
empı́rica de los tres ámbitos geométricos?
1.2.
El plano geométrico
Aunque más adelante añadamos alguna cuestión relativa a la recta o al espacio,
centremos ahora nuestra atención en el plano geométrico.
Se trata de un conjunto P cuyos elementos reciben el nombre de puntos en el
que se destacan ciertos subconjuntos llamadas rectas; unos y otros se relacionan
mediante enunciados cuya validez admitimos de entrada. Son los postulados o
axiomas, de los que, a modo de ejemplo, recordamos uno:
por dos puntos distintos pasa una recta y sólo una.
20
Capı́tulo 1. Vectores Libres
A la vez que se van añadiendo los diversos postulados, se establecen conceptos
como paralelismo y corte de rectas, segmentos y ángulos, se introducen magnitudes como longitudes, áreas, etc., y se definen transformaciones como giros,
simetrı́as axiales, homotecias. En nuestro repaso no reseñaremos ningún sistema
completo de axiomas, no pretenderemos agotar conceptos y teoremas de la geometrı́a del plano, sino que nos ceñiremos a lo que sea imprescindible para la
construcción de los vectores libres.
El lector interesado puede encontrar una exposición exhaustiva en
PUIG ADAM, PEDRO (1986), Curso de Geometrı́a Métrica, Tomo I, Euler
Editorial, Madrid.
Más escueta, aunque mejor adaptada a nuestros fines, es la contenida en
CHOQUET, GUSTAVE (1964), L’enseignement de la géometrie, Hermann,
Paris.
1.3.
Semirrectas o rayos
Fijada una recta r del plano geométrico P y un punto A en ella, el conjunto
r − {A} es la unión de dos subconjuntos no vacı́os y disjuntos entre sı́, llamados
semirrectas abiertas (o rayos) de origen (o frontera) A. Se dice que cada
una de ellas es opuesta de la otra. Dos puntos X, Y de r − {A} se dice que
están al mismo lado de A si pertenecen a la misma semirrecta. En caso
contrario se dice que están en distinto lado. Si a una semirrecta le añadimos
el origen, hablaremos de semirrecta cerrada.
Dados dos puntos distintos A, B del plano, denotaremos por < A, B > la recta
que pasa por ellos. La semirrecta cerrada de origen A a la que pertenece B se
denotará como [A, B >, lo mismo que [B, A > indicará la semirrecta cerrada de
origen B que pasa por A.
1.4.
Segmentos
El conjunto
[A, B] = [A, B > ∩[B, A >
se conoce como segmento de extremos A y B. Entre sus puntos están A y B;
de los restantes, se dice que están situados entre A y B. El orden en que se
nombren los extremos es indiferente, de manera que, en tanto que conjuntos, se
tiene [A, B] = [B, A]. También cabe la consideración de segmentos degenerados
como el [A, A], que se reduce a un punto.
1.5.
Vectores fijos
Llamamos vector fijo de origen A y extremo B a una pareja ordenada (A, B)
de puntos de P. Su representación serı́a una flecha que va de A a B.
1.6. Longitudes y distancias
21
Que la pareja sea ordenada significa que, como vectores, (A, B) será distinto de
(B, A), siempre que A 6= B. Precisamente en el caso A = B (o sea, vectores
con origen y extremo coincidentes), el vector (A, A) se nombra como nulo y se
representa por el propio punto.
Si A 6= B, < A, B > se nombra como el soporte del vector. Dos vectores fijos
(A, B) y (C, D) no nulos pueden tener el mismo o distinto soporte.
No debe confundirse el vector (A, B) con el segmento [A, B], pues en éste no importa el orden en que se nombren los puntos. Este matiz justifica cierto lenguaje
que entiende los vectores fijos como segmentos orientados.
1.6.
Longitudes y distancias
Previa fijación de una unidad o escala, a los segmentos se le asigna una magnitud
llamada longitud. Su resultado (como se sabe cuando menos desde la época de
Pitágoras) es un número no siempre racional, es decir, se trata de un número
real, al que también llamaremos distancia de A a B y denotaremos como
d(A, B). Será positivo o nulo, siendo nulo cuando y sólo cuando A = B. Como
[A, B] = [B, A], se tendrá una propiedad simétrica para la distancia: d(B, A) =
d(A, B). Euclides ya probó que para tres puntos distintos y no alineados (es
decir, formando triángulo) A ,B, C, se cumple
d(A, C) < d(A, B) + d(B, C),
Por el contrario,
La igualdad d(A, C) = d(A, B) + d(B, C) se cumple si y sólo si A, B, C están
alineados y B ∈ [A, C].
Dado un número λ ≥ 0, siempre existen segmentos que lo tienen por longitud,
o, lo que es igual, parejas de puntos que lo tienen por distancia. En particular,
se tiene un resultado que usaremos con frecuencia:
Fijado un punto O en una recta r y un número λ > 0, hay dos puntos en
r situados a distancia λ de O, cada uno de ellos en una de las semirrectas de
origen O.
1.7.
Módulo de un vector
El número d(A, B) también se nombra como módulo del vector (A, B), y se
denota k (A, B) k.
Coincidirá con el módulo de (B, A), y será nulo si y sólo si se trata de un vector
nulo.
22
Capı́tulo 1. Vectores Libres
1.8.
Paralelismo de rectas. El concepto de dirección
En el conjunto de rectas del plano P se define la siguiente relación binaria: Se
dice que la recta r es paralela a la recta s cuando
r = s, o bien r ∩ s = ∅.
Un postulado que ahora usaremos dice lo siguiente:
por un punto B no perteneciente a una recta r, pasa una recta s y sólo una
que sea paralela a s.
Proposición 1 El paralelismo entre rectas es una relación de equivalencia.
Demostracion:
1. Toda recta r es paralela a ella misma porque r = r.
2. Si r = s, también s = r, y si r ∩ s = ∅, también s ∩ r = ∅, o sea, si r es
paralela a s, s es paralela a r.
3. Si r es paralela a s y s es paralela a t, pueden presentarse las siguientes
situaciones:
a) r = s, s = t. Entonces, r = t.
b) r = s, s ∩ t = ∅. Entonces, r ∩ t = ∅.
c) r ∩ s = ∅, s = t. Entonces, r ∩ t = ∅.
d ) r ∩ s = ∅, s ∩ t = ∅. Si r ∩ t 6= ∅, aplicando que por un punto exterior
(uno de los de corte de r y t ) a una recta (la s ) pasa una única
recta paralela a ella, se tiene r = t. En caso, contrario, obtenemos
r ∩ t = ∅.
En todas las alternativas hemos llegado a que r es paralela a t.
2
La clase asociada a cada recta r por esta relación, se llama su dirección. Esto,
en definitiva, significa que dos rectas tienen igual dirección si y sólo si son
paralelas.
1.9.
Dirección de un vector
Dado un vector fijo no nulo (A, B), su dirección es la de la recta < A, B >. De
otra forma: (A, B) y (C, D) tienen la misma dirección cuando sus rectas soporte
son paralelas. A veces se escribe Sen(A, B).
¿Tienen dirección los vectores nulos (A, A)? Por no haber una única recta que
pase por A, se suele decir que su dirección es indeterminada. Ahora bien, como
1.10. Semiplanos
23
por A pasa una paralela a una dirección dada arbitrariamente, la indeterminación cabe ser interpretada en el sentido de que (A, A) posee cualquier dirección. Esto justifica que en la frase dos vectores de igual dirección pueda incluirse
la posibilidad de que uno de ellos sea nulo.
1.10.
Semiplanos
Dada una recta r del plano geométrico P, el conjunto P − r es unión de dos
subconjuntos no vacı́os y disjuntos entre sı́, llamados semiplanos abiertos de
borde (arista o frontera) r . Se dice que cada uno de ellos es opuesto del otro.
Dos puntos X, Y de P −r se dice que están al mismo lado de r si pertenecen
al mismo semiplano. En caso contrario se dice que están en distinto lado. Si
a un semiplano le añadimos su arista, hablaremos de semiplano cerrado.
Dada una recta r y un punto C 6∈ r, el semiplano cerrado de arista r al que
pertenece C se denotará como [r, C >. Si r está determinada por dos puntos A
y B, escribimos [A, B, C >.
Si dos puntos X e Y exteriores a r están al mismo lado de r, lo está todo el
segmento [X, Y ]; si están en lados opuestos, el segmento [X, Y ] tiene un punto
de corte con la arista. Si dos rectas distintas r y s son paralelas, s queda incluı́da
en uno de los semiplanos de borde r ; si se cortan en un punto A, las semirrectas
de origen A en que se divide s se quedan en distintos lados de r .
1.11.
Sentido de un vector
Muchos textos elementales afirman que el sentido de un vector fijo (A, B) es
el marcado desde A a B. Colocan al lado una flecha (A, B), el lector fija su vista
en ella, mira el punto A y luego el B y se queda tan conforme: ha entendido lo
del sentido. Sin embargo, haciendo un juego de palabras, nosotros afirmamos
que hablar del sentido de un solo vector, carece de todo sentido. El sentido, en
efecto, va a ser una comparación entre dos vectores fijos. Otros autores vienen
a decir que es la cualidad que distingue al vector (A, B) del (B, A). Aquı́ ya
hay mejora porque se hace intervenir a dos vectores distintos, pero no se aclara
cómo se va a saber si tal distinción existe o no entre parejas arbitrarias (A, B)
y (C, D).
Empecemos por fijar la idea de que la comparación en sentido sólo se va definir
para dos vectores fijos (A, B) y (C, D), no nulos, que tengan previamente la
misma dirección.
Si los vectores están en la misma recta, se dice que (A, B) tiene el mismo
sentido que (C, D) cuando
[A, B >⊆ [C, D >, o bien [C, D >⊆ [A, B > .
En particular si A = C, tienen el mismo sentido cuando [A, B >= [A, D >, es
decir, cuando sus extremos están en la misma semirrecta de origen A.
24
Capı́tulo 1. Vectores Libres
Si los vectores están en rectas paralelas distintas, se dice que (A, B) tiene el
mismo sentido que (C, D) cuando [A, C, B >= [A, C, D >, o sea, cuando los
extremos estén en un mismo semiplano de los determinados por la recta que
une los orı́genes.
En todo caso, la frase (A, B) tiene distinto sentido (o sentido opuesto) que
(C, D) se define por negación de las anteriores afirmaciones.
Puede escribirse Sen(A, B) = Sen(C, D) para indicar la igualdad de sentido,
y Sen(A, B) = −Sen(C, D) para indicar sentidos opuestos. En particular, se
comprueba sin más que
Sen(A, B) = −Sen(B, A).
1.12.
Multiplicación de números por vectores fijos
Sea a ∈ IR un número y sea (X, Y ) un vector fijo. Mediante las siguientes reglas,
definiremos un nuevo vector, denotado a(X, Y ), al que llamaremos producto
de a por (X, Y ):
a(X, Y ) = (X, X) si a = 0
a(X, Y ) = (X, X) si X = Y
Si X 6= Y y a 6= 0, se buscan en la recta < X, Y > dos puntos equidistantes de
X en la cantidad λ =| a | d(X, Y ), uno P en la semirrecta [X, Y > y otro Q en
la opuesta. Entonces,
a(X, Y ) = (X, P ) si a > 0
a(X, Y ) = (X, Q) si a < 0
En todo caso, se cumple
k a(X, Y ) k=| a |k (X, Y ) k .
Si los datos son ambos no nulos, se cumple
Sen(a(X, Y )) = Sen(X, Y ).
En cuanto al sentido, se tendrá
Sen(a(X, Y )) = Sign(a)Sen(X, Y ),
donde Sign es la función signo de los
½ números reales, es decir,
+1 si a > 0
Sign(a) =
−1 si a < 0
Un hecho a destacar es que si O 6= X, dado cualquier punto Y de < O, X >,
siempre existe un número λ tal que (O, Y ) = λ(O, X): basta tomar
λ = ± k (O, Y ) k / k (O, X k,
con signo + si Y ∈ [O, X >, y con signo - en caso contrario.
1.13. El Teorema de Thales
1.13.
25
El Teorema de Thales
Prescindiendo del origen y nivel del bagaje geométrico de nuestros alumnos,
por mı́nimo que éste fuere, supondremos de conocimiento universal un enunciado atribuido al matemático griego Thales de Mileto. Hay muchas maneras de
presentarlo. En nuestro lenguaje actual valdrı́a ésta:
Dadas dos rectas p y q incidentes en un punto O, cortémoslas por dos paralelas disjuntas r y s, y sean
A = r ∩ p, A0 = s ∩ p, B = r ∩ q, B 0 = s ∩ q.
Entonces,
(O, A0 ) = λ(O, A) ⇒ (O, B 0 ) = λ(O, B).
(Por ser r y s disjuntas, al menos una de estas dos rectas no puede pasar por
O. En el enunciado se ha supuesto implı́citamente que O 6∈ r, lo que permite
asegurar la existencia del número λ que en él aparece; si r pasara por O, bastarı́a
cambiar r por s).
De inmediato se prueba una especie de recı́proco:
Dadas dos rectas p y q incidentes en un punto O, si se tienen parejas de
puntos A, A0 ∈ p y B, B 0 ∈ q, de manera que O 6∈< A, B > y exista un número
λ para el cual
(O, A0 ) = λ(O, A), (O, B 0 ) = λ(O, B),
se demuestra que < A, B > es paralela a < A0 , B 0 >.
En ambas hipótesis, también se demuestra que
(A0 , B 0 ) = λ(A, B).
1.14.
Puntos medios
Proposición 2 Dados dos puntos distintos X e Y , existe un punto único
O ∈ [X, Y ] que equidista de X e Y .
Demostracion:
Existencia: Sea O el punto tal que (X, O) = (X, Y )/2. Por propia construcción, se cumple que d(X, O) = d(X, Y )/2 y que O ∈ [X, Y >. Este punto
también está en [Y, X >, pues de lo contrario tendrı́amos
d(X, O) = d(X, Y ) + d(Y, O) ⇒ 0 = d(X, Y )/2 + d(Y, O),
relación que evidentemente es absurda. Estando en [X, Y > y en [Y, X >, queda
probado que O ∈ [X, Y ]. Además, O equidista de X e Y porque
d(X, Y ) = d(X, O) + d(O, Y ) = d(X, Y )/2 + d(O, Y ) ⇒ d(O, Y ) = d(X, Y )/2.
26
Capı́tulo 1. Vectores Libres
Unicidad: como en [X, Y > no puede haber dos puntos distintos a la misma
distancia de X, tampoco en [X, Y ].
2
El punto O de este teorema recibe el nombre de punto medio de X e Y , o
punto medio del segmento [X, Y ].
Señalemos que también procede hablar del punto medio de segmentos [X, X], si
lo tomamos como el propio punto X.
Proposición 3 Dados dos puntos distintos X y O, existe un punto único Y ∈<
X, O > de manera que O es punto medio de [X, Y ].
Demostracion:
Para la existencia basta tomar el punto Y de manera que (X, Y ) = 2(X, O).
La unicidad se razona como en la anterior proposición.
2
Naturalmente, si X = O, se tomarı́a Y = O.
1.15.
Simetrı́as centrales
Fijado O, según la proposición 3, a cada punto X del plano le asignamos otro
X 0 , único, tal que O es punto medio de X y X 0 . Este punto se conoce como
simétrico de X respecto de O. La aplicación X 7→ X 0 , que denotaremos
por SO , se llama simetrı́a central, siendo O nombrado como centro de la
simetrı́a.
Tomando los vectores con origen en O, al multiplicar (O, X) por el número -1,
se obtiene un vector (O, Y ) cuyo extremo dista de O lo mismo que X, pero con
sentido opuesto. Es claro que Y no puede ser otro que el simétrico X 0 = SO (X)
de X. Esta observación justifica la escritura
(O, X 0 ) = −(O, X),
que es una ecuación vectorial de la simetrı́a central, a la vez que permite usar
el Teorema de Thales y sus consecuencias, adaptadas al caso del factor λ =
−1. Con la definición de simetrı́a y el citado teorema, se pueden demostrar las
siguientes propiedades de las simetrı́as:
1. O se aplica sobre sı́ mismo y es el único con esta propiedad.
2. X y X 0 están alineados con O y a distintos lados del mismo.
3. Si aplicamos dos veces consecutivas una simetrı́a central, cada X vuelve a
su posición inicial, con lo cual (siendo I la aplicación identidad del plano),
se tiene
SO ◦ SO = I ⇔ (SO )−1 = SO .
1.16. Equipolencia de vectores fijos
27
4. Dados dos puntos X e Y , distintos entre sı́ y distintos de O, la recta
< X 0 , Y 0 > que pasa por sus simétricos es paralela a la < X, Y >.
5. El simétrico de un vector no nulo (X, Y ), es otro vector (X 0 , Y 0 ) de igual
módulo y dirección, pero sentido opuesto.
6. Las simetrı́as centrales son movimientos geométricos, entendiendo por
tales las trasformaciones que conservan la distancia entre puntos.
7. Las simetrı́as son transformaciones afines, es decir, cambian rectas en
rectas, conservando, además, la posición relativa de sus puntos. En concreto, si una recta pasa por el centro, se transforma en ella misma, mientras
que si no pasa se cambia en otra paralela y disjunta con ella.
1.16.
Equipolencia de vectores fijos
Se dice que el vector fijo (A, B) es equipolente al (C, D) cuando el punto medio
del segmento [A, D], que une el origen del primero con el extremo del segundo,
coincide con el punto medio del segmento [B, C] que une el extremo del primero
con el origen del segundo. Lo denotamos como
(A, B) ≡ (C, D).
Proposición 4 (A, B) ≡ (C, D) ⇔ (A, C) ≡ (B, D).
Demostracion:
Basta aplicar la definición y observar que los segmentos [B, C] y [C, B] coinciden.
2
Proposición 5 Dos vectores nulos son equipolentes.
Demostracion:
Si en la definición ponemos A = B, C = D, los segmentos [A, D] y [B, C]
son el mismo, luego comparten el punto medio.
2
Siendo P el punto medio común de [A, D] y [B, C], de la definición de equipolencia se deduce que en la simetrı́a SP las parejas A, D y B, C se corresponden
entre sı́. Recı́procamente, si existe un punto P tal que SP (A) = D, SP (B) = C,
es punto medio común de ambos segmentos, luego los vectores son equipolentes.
Es decir,
Proposición 6 Es necesario y suficiente para que (A, B) ≡ (C, D) que exista
un punto P tal que SP (A) = D, SP (B) = C.
Proposición 7 Dos vectores equipolentes tienen el mismo módulo, dirección y
sentido.
28
Capı́tulo 1. Vectores Libres
Demostracion:
Supongamos (A, B) ≡ (C, D). Si P es el punto medio de [A, D] y [B, C],
puesto que SP (A, B) = (D, C), estos vectores son de igual módulo y dirección.
Como (D, C) y (C, D) comparten dirección y módulo, lo mismo le pasará a
(A, B) y (C, D). Si los vectores son no nulos, (A, B) tiene sentido opuesto al
de su simétrico (D, C); éste, a su vez, tiene sentido opuesto al de (C, D), luego
(A, B) y (C, D) son de igual sentido.
2
Si (C, D) es equipolente a (A, A), tendrá módulo nulo, luego C = D. Ası́ completamos la proposición 4 de esta otra forma:
Proposición 8 Es necesario y suficiente para que un vector (C, D) sea equipolente a uno nulo (A, A), que (C, D) también sea nulo.
Proposición 9 Dos vectores de igual módulo, dirección y sentido, son equipolentes.
Demostracion:
1. Si el módulo común es 0, se trata de vectores nulos y por tanto equipolentes.
2. En caso contrario, sean (A, B) y (C, D) vectores de igual módulo, dirección
y sentido, y sea P el punto medio de [A, D]. El simétrico B 0 de B mediante
SP está en la paralela a < A, B > que pasa por A0 = D. Como las rectas
< A, B > y < C, D > son paralelas, esto quiere decir que B 0 ∈< C, D >. El
vector (A0 , B 0 ) = (D, B 0 ) tiene sentido opuesto que (A, B), luego también
opuesto de (C, D), o sea igual sentido que (D, C). Estando B 0 y C a un
mismo lado de D, puesto que
d(C, D) = d(A, B) = d(A0 , B 0 ) = d(D, B 0 ),
necesariamente es B 0 = C. Ası́, SP (A) = D y SP (B) = C, y basta aplicar
la proposición 6.
2
Uniendo las proposiciones 7 y 9, llegamos al habitual criterio de equipolencia:
Proposición 10 Es necesario y suficiente para que dos vectores sean equipolentes que tengan igual módulo, dirección y sentido.
Proposición 11 La equipolencia es una relación de equivalencia en el conjunto
de los vectores fijos.
Demostracion:
Basta aplicar la proposición anterior, recordando que todas las igualdades
son reflexivas, simétricas y transitivas.
2
1.17. Paralelogramos
1.17.
29
Paralelogramos
En los casos de vectores no nulos, la definición de equipolencia y todo lo deducido
de ella incluye tanto la posibilidad de que (A, B) y (C, D) estén sobre la misma
recta, como la de que estén en rectas paralelas disjuntas. Para este segundo caso,
hay otro criterio de equipolencia que, por clásico, no queremos dejar sin citar.
Recordemos que un cuadrilátero ABDC se dice que es un paralelogramo cuando < A, B > sea paralela a < C, D > y < A, C > sea paralela a < B, D >. Los
segmentos [A, D] y [B, C] son sus diagonales.
Proposición 12 Es necesario y suficiente para que un cuadrilátero ABDC sea
un paralelogramo que sus diagonales se corten en el punto medio de ambas.
Demostracion:
1. Supongamos que ABDC sea un paralelogramo. Sea P el punto medio
de la diagonal [A, D] y sea B 0 = SP (B). La recta < D, B 0 >, simétrica
de < A, B >, debe ser paralela a ella; como < C, D > también lo es y D
está en ambas, deben coincidir, luego B 0 ∈< C, D >. De la misma manera,
< A, B 0 >, simétrica de < D, B >, es paralela a ella, como < A, C >
también lo es y A está en ambas, coincidirán y tendremos B 0 ∈< A, C >.
Ası́, el punto B 0 , lo mismo que el C, están en la intersección de < C, D >
y < A, C >, luego B 0 = C. Por corresponderse B y C en la simetrı́a
SP , P es punto medio de la diagonal [B, C], que es lo que se trataba de
demostrar.
2. Si en el cuadrilátero ABDC, las diagonales [A, D] y [B, C] tienen un punto
medio común P , en la simetrı́a SP se corresponde A con D y B con C.
Por tanto, < D, C > es paralela a < A, B > por ser su simétrica; de igual
forma, son simétricas y paralelas < D, B > y < A, C >, luego la figura es
un paralelogramo.
2
Que las diagonales tengan un punto medio común P , es lo mismo que decir que
SP (A) = D, SP (B) = C. Recordando la proposición 6, llegamos al criterio que
habı́amos anunciado:
Proposición 13 Si A 6= B, C 6= D, < A, B >6=< C, D >, entonces,
(A, B) ≡ (C, D) ⇔ ABDC es un paralelogramo.
1.18.
El concepto de vector libre
Ya hemos probado que la equipolencia es una relación de equivalencia entre
vectores fijos. Cada una de las clases de equipolencia recibe el nombre de vector
30
Capı́tulo 1. Vectores Libres
libre, el cual se dice representado por cualquiera de los vectores fijos (A, B)
de la misma. El vector libre representado por (A, B) se denotará
AB,
debiendo quedar claro que una igualdad como la
AB = CD
significa en concreto que (A, B) ≡ (C, D).
El conjunto de vectores libres del plano P se indicará por V. El módulo de
un vector libre será el de cualquiera de sus representantes. Como los vectores
fijos nulos son equipolentes entre sı́, definen un único vector libre al que desde
ahora llamamos vector libre nulo y denotamos por 0. Quitado este caso, la
dirección de un vector libre será la de sus representantes. Dos vectores libres
no nulos de la misma dirección se podrán comparar en sentido, comparando sus
representantes. En particular, AB y BA serán iguales en módulo y dirección,
pero tienen sentidos opuestos. Se dirá que BA es el vector libre opuesto del
AB y se escribirá BA = −AB.
Proposición 14 Dado un vector fijo (A, B) y dado un punto O, siempre existe
otro punto X tal que (A, B) ≡ (O, X).
Demostracion:
Sea P el punto medio de [B, O] y sea X = SP (A). El vector simétrico
(X, O) del (A, B) tiene su mismo módulo, su misma dirección y sentido opuesto;
(X, O), a su vez, tiene también módulo y dirección común con (O, X) y sentido
opuesto. Por tanto, (A, B) y (O, X) coinciden en las tres cualidades, luego son
equipolentes.
2
Proposición 15
(O, X) ≡ (O, Y ) ⇒ X = Y.
Demostracion:
Como las rectas < O, X > y < O, Y > son paralelas y tienen un punto
común, coinciden luego O, X, Y están alineados. La igualdad de sentidos obliga
a que X e Y estén en la misma semirrecta de origen O. La igualdad de módulos
indica que ambos equidistan de O, luego X = Y .
2
El primer enunciado quiere decir que siempre es posible construir un representante de un vector libre dado con origen en un punto O de situación arbitraria.
Esto justifica el adjetivo de libre, a la vez que justifica escrituras como las x,
y, etc..., con una sola letra, para referirnos a vectores libres: sus representantes
podrán ponerse con el origen o punto de aplicación que nos convenga. El segundo significa que no puede haber dos vectores equipolentes y distintos con igual
origen.
1.19. Adición de vectores libres
31
Juntando ambos, resulta que fijado O, siempre hay un representante y sólo
uno de cada vector libre que tenga su origen en O. Esto permite representar el
conjunto V de los vectores libres como el conjunto de todas las flechas con origen
en O. El vector libre nulo 0 se representa por el origen O. Si x se representa
por (O, X), su opuesto −x se representa por (O, X 0 ), donde X 0 es el simétrico
de X respecto del origen. Todos los vectores libres de una dirección dada se
representan en la recta que pasa por O y tiene dicha dirección.
1.19.
Adición de vectores libres
Dados dos vectores libres x e y, y fijado un punto O, de acuerdo con la proposición 14, podemos encontrar puntos X e Y de manera que
x = OX, y = XY,
a la vez que podemos considerar un nuevo vector
z = OY.
Esta construcción es independiente del punto O fijado: si tomamos, otro punto
P , buscamos Q y R tales que x = PQ, y = QR y consideramos el vector PR,
aplicando las proposiciones 4 y 11, obtenemos
OX = PQ, XY = QR ⇒ (O, X) ≡ (P, Q), (X, Y ) ≡ (Q, R) ⇒
⇒ (O, P ) ≡ (X, Q), (X, Q) ≡ (Y, R) ⇒ (O, P ) ≡ (Y, R) ⇒
⇒ (O, Y ) ≡ (P, R) ⇒ OY = PR.
Este vector, único para los datos x e y, se denotará x + y y se llama vector
suma del vector x con el vector y. Repitiendo su construcción, se tiene
x = OX, y = XY ⇒ x + y = OY.
Ası́, tenemos una operación interna en V. La llamaremos adición de vectores
libres. Sus propiedades fundamentales son las propias de lo que en Algebra
llamamos un grupo abeliano, donde el neutro va a ser el vector libre nulo 0 y el
simétrico de un vector libre x va a ser su opuesto −x.
Proposición 16 Cualesquiera que sean x, y, z ∈ V, se tiene
1. (x + y) + z = x + (y + z)
2. x + 0 = 0 + x = x
3. x + (−x) = (−x) + x = 0
4. x + y = y + x
32
Capı́tulo 1. Vectores Libres
Demostracion:
Fijemos un punto O. Entonces,
1. buscando puntos X, Y , Z tales que x = OX, y = XY, z = YZ, se tiene
(x + y) + z = (OX + XY) + YZ = OY + YZ = OZ,
x + (y + z) = OX + (XY + YZ) = OX + XZ = OZ.
2. Si tomamos x = OX, 0 = XX = OO, se cumple
x + 0 = OX + XX = OX = x,
0 + x = OO + OX = OX = x.
3. Tomando x = OX, −x = XO, se obtiene
x + (−x) = OX + XO = OO = 0,
(−x) + x = XO + OX = XX = 0.
4. buscando puntos X, Y , P , Q tales que x = OX, y = XY = OP, x = PQ,
sea M el punto medio de [X, P ]. Entonces,
¾
OX = PQ ⇒ Q = SM (O)
⇒Y =Q⇒
OP = XY ⇒ Y = SM (O)
⇒ x + y = OX + XY = OY = OQ = OP + PQ = y + x.
2
Esta operación induce otra, la sustracción de vectores libres, sin más que
tomar
x − y = x + ( − y).
Se cumplirán todas las propiedades de los grupos abelianos. Por ejemplo, cabe
recordar las dos siguientes:
−(x + y) = (−x) + (−y) = −x − y, −(−x) = x.
Si los sumandos x = OX e y = XY tienen la misma dirección, los puntos O,
X, Y están alineados, luego x + y = OY mantiene la dirección de los datos.
Como el vector nulo está en cualquier dirección y como el opuesto de un vector
tiene su misma dirección, resulta
Proposición 17 Los vectores libres de una dirección dada constituyen un subgrupo del grupo aditivo V.
Si los sumandos x = OX e y = XY, además de la dirección, tienen el mismo
sentido, se cumplirá
[X, Y >⊂ [O, X >⇒ [O, Y >= [O, X >,
es decir, OY = x + y comparte sentido con los sumandos.
1.20. Multiplicación de números por vectores libres
1.20.
33
Multiplicación de números por vectores libres
Definido ya el producto de un número por un vector fijo, se tiene
Proposición 18 Siendo a ∈ IR, se cumple
(A, B) ≡ (O, X) ⇒ a(A, B) ≡ a(O, X).
Demostracion:
Si a = 0, tanto a (A, B) como a E(O, X) son nulos y por tanto equipolentes.
Si (A, B) es nulo, también lo es (O, X), luego los dos productos son nulos y de
nuevo equipolentes. En el caso general, comprobamos que
k a(A, B) k=| a |k (A, B) k=| a |k (O, X) k=k a(O, X) k,
Sen(a(A, B)) = Sen(A, B) = Sen(O, X) = Sen(a(O, X)),
Sen(a(A, B)) = Sign(a)Sen(A, B) = Sign(a)Sen(O, X) = Sen(a(O, X)),
y resulta que, efectivamente, a(A, B) ≡ a(O, X).
2
Esta proposición permite considerar el producto de números por vectores
libres: bastará tomar un representante cualquiera del vector libre, multiplicarlo
por el número y considerar el vector libre representado por el producto.
Se dice que un vector libre y es combinación lineal de otro x cuando
se obtenga como resultado de multiplicar x por un cierto número λ. Es decir,
cuando y = λx.
Si x = 0 cualquier combinación suya vuelve a ser nula, pero si x 6= 0, al
hacer combinaciones, obtenemos diversos vectores λx, todos ellos de su misma
dirección. Recı́procamente, si damos un vector y en la dirección de x, fijando un
origen O y buscando puntos X e Y tales que x = OX, y = OY, resulta que Y
está alineado con O y X (distintos por ser x 6= 0); entonces, como se señaló en
la sección 1.12, existe un número λ tal que (O, Y ) = λ(O, X), es decir, tal que
y = OY = λOX = λx.
De esta forma queda razonado lo siguiente:
Proposición 19 Es necesario y suficiente para que un vector y sea combinación lineal de otro x no nulo, que ambos tengan igual dirección.
Proposición 20 Cualesquiera que sean a ∈ IR, x ∈ V, se tiene
(−a)x = −(ax) :
34
Capı́tulo 1. Vectores Libres
Demostracion:
Si a = 0, se tiene (−0)x = 0x = 0 = −0 = −(0x). En caso contrario, se
comprueba la igualdad en módulo, dirección y sentido:
k (−a)x k=| −a |k x k=| a |k x k=k ax k=k −(ax) k,
Sen((−a)x) = Sen(x) = Sen(ax) = Sen(−(ax)),
Sen((−a)x) = Sign(−a)Sen(x) = −Sign(a)Sen(x) =
= −Sen(ax) = −(−Sen(−(ax))) = Sen(−(ax)).
2
Señalamos ahora las cuatro propiedades fundamentales de la multiplicación de
números por vectores libres:
Proposición 21 Cualesquiera que sean a,b ∈ IR, x, y ∈ V, se tiene
1. 1x = x.
2. a(bx) = (ab)x.
3. (a + b)x = ax + bx.
4. a(x + y) = ax + ay.
Demostracion:
Directamente pueden comprobarse estas propiedades siempre que alguno de
los datos a, b, x, y que intervienen en ellas sea nulo. Podemos suponer, pues,
que ninguno de ellos lo sea.
1. Trivialmente los dos miembros comparten módulo, dirección y sentido.
2. Basta observar que
k a(bx) k=| a |k bx k=| a | (| b |k x k) =
= (| a || b |) k x k=| ab |k x k=k (ab)x k,
Sen(x) = Sen(bx) = Sen(a(bx)) = Sen((ab)x),
Sen(a(bx)) = Sign(a)Sen(bx) = Sign(a)Sign(b)Sen(x) =
= Sign(ab)Sen(x) = Sen((ab)x).
3. De acuerdo con los signos de los números a y b se presentan tres posibilidades:
1.20. Multiplicación de números por vectores libres
35
a) Los dos son positivos.
De a > 0, b > 0, se concluye que también a + b > 0, y se tiene
k (a + b)x k=| a + b |k x k= (a + b) k x k= a k x k +b k x k=
=| a |k x k + | b |k x k=k ax k + k bx k=k ax + bx k,
Sen((a + b)x) = Sen(x) = Sen(ax) = Sen(bx) = Sen(ax + bx),
porque la suma de dos vectores de la misma dirección, la mantiene,
Sen((a + b)x) = Sign(a + b)Sen(x) = Sen(x) = Sen(ax + bx),
ya que
Sen(ax) = Sign(a)x = Sen(x),
Sen(bx) = Sign(b)x = Sen(x),
y la suma de vectores de igual sentido, tiene el mismo que los sumandos.
b) Los dos son negativos.
De a < 0, b < 0, se concluye que también a + b < 0. Aplicando la
proposición 20 y el apartado anterior, se tiene
−(a + b)x = (−(a + b))x = ((−a) + (−b))x = (−a)x + (−b)x =
= (−(ax)) + (−(bx)) = −(ax + bx) ⇒ (a + b)x = ax + bx.
c) Uno es positivo y otro negativo.
Suponiendo, por ejemplo, a > 0, b < 0, para su suma caben tres
opciones:
1) a + b > 0 :
(a + b)x + (−b)x = ((a + b) + (−b))x = ax ⇒
⇒ (a + b)x = ax − (−b)x = ax + bx
2) a + b < 0 :
−(a + b)x + ax = (−(a + b) + a)x = −bx ⇒ (a + b)x = ax + bx.
3) a + b = 0 :
(a + b)x = 0x = 0 = ax − ax = ax + (−a)x = ax + bx.
4. Si los vectores x e y son de igual dirección, por la proposición 19, existe un
número b tal que y = bx. Entonces, aplicando las propiedades anteriores,
se obtiene
a(x + y) = a(x + bx) = a((1 + b)x) = (a(1 + b))x =
36
Capı́tulo 1. Vectores Libres
= (a + ab)x = ax + (ab)x = ax + a(bx) = ax + ay.
Si las direcciones son distintas y a = 1, aplicamos la primera propiedad.
Si a 6= 1, tomamos un origen O y puntos X, Y , X 0 , Y 0 tales que
x = OX, y = XX0 , ax = OY, ay = YY0 ,
de manera que
x + y = OX0 , ax + ay = OY’.
Como los vectores y, ay son de igual dirección y a 6= 1, las rectas
r =< X, X 0 >, s =< Y, Y 0 >
son paralelas y disjuntas. Sean, por otro lado,
p =< O, X >, q =< O, X 0 >,
y sea, finalmente,
Z = s ∩ q.
Aplicando el Teorema de Thales, se tendrá
OY = aOX ⇒ OZ = aOX0 = a(x + y), YZ = aXX0 = ay.
Como también YY0 = ay, deducimos que Z = Y 0 , luego
a(x + y) = OZ = OY0 = ax + ay.
2
1.21.
Dependencia lineal
Dados dos vectores x e y, ası́ como dos números a y b, la suma
ax + by
de una combinación de x con otra de y, se dice que es una combinación lineal
de x e y con coeficientes a y b.
Si se toman a = b = 0, el resultado es 0, pero esto mismo puede ocurrir en otros
casos. Dilucidaremos en cuáles:
Proposición 22 Dados dos vectores libres x e y, es necesario y suficiente para
que existan números a y b, uno de ellos al menos no nulo, tales que
ax + by = 0,
que ambos vectores coincidan en dirección.
1.21. Dependencia lineal
37
Demostracion:
1. Supongamos que exista una relación ax + by = 0, donde al menos un
número, por ejemplo b, es distinto de 0. Entonces, multiplicando por el
número 1/b, se despeja y, obteniéndose
a
y = − x.
b
Por tanto, y es combinación lineal de x, de donde se sigue que
Sen(y) = Sen(x).
2. Si x = 0, construimos la combinación lineal 1x + 0y = 0, donde 1 6= 0. Si
x 6= 0, según la proposición 18, puede tomarse y = λx, en cuyo caso se
tendrá
0 = λx − y = λx + (−1)y, con − 1 6= 0.
2
Cualquiera de las dos condiciones equivalentes de esta proposición sirve para
definir ax e y como vectores linealmente dependientes. La segunda (igual
dirección) ofrece la interpretación geométrica de esta definición y la primera
(existencia de la relación ax + by = 0, con números no nulos) la caracteriza en
términos algebraicos.
Negándolas se llega al concepto de vectores linealmente independientes.
Es decir, x e y serán linealmente independientes cuando la única manera de
conseguir que ax + by = 0, sea la a = b = 0. En versión geométrica lo serán
siempre que tengan distinta dirección. Como el vector nulo tiene la dirección de
cualquier otro, dos vectores independientes han de ser necesariamente no nulos.
Aclarado el concepto de dependencia o independencia lineal para dos vectores,
pensemos ahora en uno solo. Tomando la definición algebraica, un vector x
será linealmente dependiente si existe una relación ax = 0, con a 6= 0.
Pero, multiplicando por 1/a, de aquı́ se concluye que x = 0. Ası́ llegamos a
la interpretación geométrica: un solo vector es linealmente dependiente cuando
sea el vector nulo. Negando esta definición, dirı́amos que x es linealmente
independiente siempre que x 6= 0, en cuyo caso, si ax = 0, necesariamente se
tiene a = 0.
Lo mismo que se ha hecho con dos vectores, si sumamos combinaciones ax, by,
cz de tres vectores construimos una combinación lineal
ax + by + cz
de los vectores x, y, z con coeficientes los números a, b, c. Siguiendo con
nuestro orden de ideas, se dirá que x, y, z son linealmente dependientes si
existe una combinación lineal nula de ellos, en la que al menos un coeficiente no
sea nulo.
38
Capı́tulo 1. Vectores Libres
Proposición 23 Dados tres vectores libres x, y, z, es necesario y suficiente
para que sean linealmente dependientes que uno de los vectores sea combinación
lineal de los otros dos.
Demostracion:
1. Si son linealmente dependientes, existe una relación
ax + by + cz = 0,
con algún coeficiente no nulo. Si, por ejemplo, c 6= 0, multiplicamos por
1/c y obtenemos
a
b
z = − x − y,
c
c
luego z es combinación lineal de x e y.
2. Recı́procamente, si uno de los vectores, por ejemplo el z, es combinación
lineal de los otros dos, existirá una relación
z = λx + µy,
de la cual se pasa a la
0 = λx + µy − z = λx + µy + (−1)z, con − 1 6= 0,
luego se trata de vectores linealmente dependientes.
2
De la misma manera, se dirı́a que x, y, z son linealmente independientes
si la única posibilidad para que ax + by + cz = 0, es la a = b = c = 0.
Pero, ¿existen en el plano P ternas de vectores independientes? Si existieran,
ninguno de ellos podrı́a ser nulo: si, por ejemplo, z = 0, tendrı́amos
0x + 0y + 1z = 0, con 1 6= 0.
Tampoco ninguna de las parejas que formemos con ellos puede ser de vectores
dependientes: si, por ejemplo, la pareja x e y fuese dependiente habrı́a una
relación ax + by = 0, con un coeficiente al menos no nulo. Entonces, se tendrı́a:
ax + by + 0z = 0, con a 6= 0 o b 6= 0.
Por tanto, de existir ternas independientes, los tres vectores serı́an no nulos
y cualquier pareja de ellos tendrı́an distinta dirección. Antes de terminar de
responder a nuestra pregunta, observemos este enunciado:
Proposición 24 Sean u, v dos vectores libres linealmente independientes. Entonces, para cada vector libre x, existen números λ y µ tales que
x = λu + µv.
1.22. Bidimensionalidad del plano
39
Demostracion:
Si x = 0, se toma λ = µ = 0. Si Sen(x) = Sen(u), existe un λ tal que
x = λu, y basta tomar µ = 0. Si Sen(x) = Sen(v), existe un µ tal que x = µv,
y basta tomar λ = 0. En los demás, fijamos un origen O y buscamos puntos A,
B, X tales que
u = OA, v = OB, x = OX.
Por X se traza la paralela a < O, B >, la cual cortará a < O, A > en un punto
P , y se traza la paralela a < O, A >, la cual cortará a < O, B > en un punto Q.
Por propia construcción, OP XQ es un paralelogramo, luego, por la proposición
13, se tendrá OP = QX, y por la 4, OQ = PX.
Por otra parte,
P ∈< O, A >⇒ Sen(OP) = Sen(OA) = Sen(u) ⇒ ∃λ/ OP = λu,
Q ∈< O, B >⇒ Sen(OQ) = Sen(OB) = Sen(v) ⇒ ∃µ/OQ = µv,
con lo cual se obtiene
x = OX = OP + PX = OP + OQ = λu + µv.
2
Ahora pensemos en la pareja x e y como independiente; el tercer vector z
será combinación lineal de ellos, luego, por la proposición 23, x, y, z son dependientes. En resumen: en el plano geométrico no puede haber tres vectores que
sean linealmente independientes.
1.22.
Bidimensionalidad del plano
En la sección 0.6 de nuestra introducción comentábamos que lo bidimensional
va ligado a la existencia de las magnitudes largo y ancho. La imprecisión de
este lenguaje puede ser ahora corregida: que haya largo y ancho quiere decir
que existen cuando menos dos direcciones distintas, es decir, parejas de vectores
linealmente independientes. Además, en el caso del plano geométrico, por no
haber ternas de vectores independientes, es imposible la existencia de una tercera
dirección independiente con dos previamente dadas. Dirı́amos que en el plano
es imposible la existencia de la magnitud alto, ligada a la tridimensionalidad.
Ası́, la bidimensionalidad del plano queda precisada por el hecho de que lo
más que pueden existir en él son parejas de vectores linealmente independientes.
1.23.
Coordenadas
Pero a nuestra proposición 24 se le puede sacar mucho más jugo. Que todo
vector x sea combinación lineal de dos vectores independientes u y v, significa
que al combinarlos de todas las maneras posibles mediante las dos operaciones
40
Capı́tulo 1. Vectores Libres
de los vectores libres, generamos el conjunto total V. Esta idea se formaliza
diciendo que u y v forman un sistema generador. Y más aún: si imaginamos
dos descomposiciones
x = λu + µv = λ0 u + µ0 v
de un mismo x como combinación lineal de u y v, resulta, al aplicar que u y v
son linealmente independientes, que
(λ − λ0 )u + (µ − µ0 )v = 0 ⇒ λ − λ0 = µ − µ0 = 0 ⇒ λ = λ0 , µ = µ0 .
Es decir, fijados dos vectores libres independientes u y v, cada vector x tiene
asociado un solo par ordenado (λ, µ), formado con los coeficientes de su combinación lineal. Esto se formalizará diciendo que u y v forman una base, o sistema de ejes. Los números λ y µ serán las coordenadas de x en dicha base,
y, de esta manera, la teorı́a de vectores libres se liga a la Geometrı́a Analı́tica
de Fermat-Descartes citada en nuestra introducción.
1.24.
La recta geométrica
Repasado ya el plano geométrico P, pensemos ahora en un universo unidimensional R, es decir, en una recta geométrica como conjunto total. Sus elementos
los seguimos nombrando como puntos, y, como en el plano, podremos hablar de
semirrectas, segmentos, vectores fijos, longitudes, distancias y módulo
de un vector. El concepto de paralelismo es superfluo, o, si se quiere, trivialmente, todos los vectores son de la misma dirección. Sı́ procede comparar
el sentido de dos vectores y definir la multiplicación de números por vectores fijos. Seguirán existiendo los puntos medios y seguiremos considerando
las simetrı́as centrales como transformaciones de centro O que a un punto
X asocia otro X 0 de manera que O es punto medio de ambos. Se definirá la
equipolencia de vectores fijos, que equivaldrá a la igualdad de módulos y
sentido, y se llegará, finalmente, al concepto de vector libre. Con estos nuevos
entes se tendrá una adición y una multiplicación por números. Habrá vectores independientes por sı́ solos, pero será imposible que dos los sean entre
sı́, es decir, la recta geométrica será unidimensional. Una base será un solo
vector no nulo y en ella cada vector tendrá una única coordenada.
1.25.
El espacio geométrico
El espacio geométrico es un conjunto E, con unos elementos nombrados como
puntos, y dos familias destacadas de subconjuntos, las rectas y los planos,
sujetos a cumplir ciertos axiomas, como por ejemplo éste
por tres puntos no alineados pasa un plano y sólo uno.
Con cada recta y cada punto de la misma que fijemos, se vuelven a definir las
semirrectas, e inmediatamente se habla de segmentos y de vectores fijos,
1.25. El espacio geométrico
41
entendidos éstos de nuevo como parejas ordenadas de puntos. Se definen las
longitudes y distancias, asignando a cada vector un módulo.
Sin embargo, la intersección vacı́a no va a definir ahora el paralelismo entre
rectas, sino entre planos: el plano p es paralelo al q cuando
p = q, o bien p ∩ q = ∅.
Esta va a ser una relación de equivalencia, con la que se define la dirección
de un plano, de manera que dos planos tendrán igual dirección cuando sean
paralelos entre sı́.
En cuanto a la posición relativa de dos rectas r y s del espacio, van a aparecer dos
posibilidades: rectas coplanarias si existe un plano p que contenga a ambas o
rectas que se cruzan en el caso contrario. Se dirá, entonces, que r es paralela
a s si coinciden o bien si son a la vez coplanarias y disjuntas. Con esta definición,
se vuelven a tener las propiedades reflexiva, simétrica y transitiva del paralelismo
de rectas, pudiendo por tanto hablar de dirección de una recta como una
cualidad que tiene dicha recta junto a todas sus paralelas. Esto permitirá como
en la geometrı́a plana hablar de dirección de un vector.
Si en el espacio E se fija un plano p y una recta r contenida en él, se definen
los semiplanos y, con ellos, se llega a comparar en sentido dos vectores
de igual dirección. Se define la multiplicación de números por vectores
fijos, se razona la existencia de puntos medios y se consideran las simetrı́as
centrales. Ası́ llegamos al concepto de equipolencia de vectores fijos que
permite definir vectores libres en el espacio E. Fijado un punto O, volvemos
a representarlos como todas las flechas con origen en O. Los de una dirección
dada se representan en la recta de igual dirección que pasa por O. La novedad
es que ahora podemos hablar de vectores coplanarios como aquellos cuyos
representantes se sitúan en planos paralelos: todos los que lo sean entre sı́ se
representan en el plano que pasa por O paralelo a los que contienen a los vectores.
Habrá una adición de vectores libres y una multiplicación de números
por vectores libres, con idénticas propiedades a las operaciones con vectores
libres del plano. Lo mismo que al sumar vectores de igual dirección aparece otro
de la misma dirección, al sumar vectores coplanarios, la suma estará en el mismo
plano.
Los conceptos algebraicos de dependencia e independencia lineal se tratan
de la misma forma. Geométricamente saldrá que un solo vector dependiente es el
vector nulo, que dos vectores dependientes están en una misma recta y que tres
vectores dependientes han de ser coplanarios. Por tanto, tres vectores independientes serán necesariamente no coplanarios. Finalmente, en E será imposible
la existencia de cuatro vectores linealmente independientes, lo que justificará la
tridimensionalidad del espacio geométrico.
Tres vectores no coplanarios u, v, w serán sistema generador y base del
conjunto de vectores libres del espacio. Fijada una base, a cada vector x se le
42
Capı́tulo 1. Vectores Libres
asignará una terna ordenada de números λ, µ, ν de manera que
x = λu + µv + νw,
que será única y cuyas componentes serán las coordenadas de x en la base u,
v, w.
43
Capı́tulo 2
Espacios Vectoriales
2.1.
El concepto de espacio vectorial
Sea V 6= ∅ un conjunto dotado de una operación interna
+ : V × V → V,
cumpliendo las cuatro propiedades
1) ∀x, y, z ∈ V ⇒ (x + y) + z = x + (y + z).
2) ∃0 ∈ V/(∀x ∈ V ⇒ x + 0 = 0 + x = x).
3) ∀x ∈ V ⇒ (∃ − x ∈ V/x + (−x) = (−x) + x = 0).
4) ∀x, y ∈ V ⇒ x + y = y + x.
Sea IK un cuerpo conmutativo, respecto del cual V posea una operación externa
· : IK × V → V,
cumpliendo que
5) ∀x ∈ V ⇒ 1x = x.
6) ∀a, b ∈ IK, ∀x ∈ V ⇒ a(bx) = (ab)x.
7) ∀a, b ∈ IK, ∀x ∈ V ⇒ (a + b)x = ax + bx.
8) ∀a ∈ IK, ∀x, y ∈ V ⇒ a(x + y) = ax + ay.
En estas condiciones se dice que la cuaterna
(V, IK, + : V × V → V, · : IK × V → V)
define una estructura de espacio vectorial en V sobre el cuerpo conmutativo IK.
44
Capı́tulo 2. Espacios Vectoriales
Los elementos de V reciben el nombre de vectores, mientras que los de IK se
llaman números o escalares. La operación interna de V se llamará adición
de vectores. Las propiedades primera y cuarta dicen, respectivamente, que
esta operación es asociativa y conmutativa. El elemento 0 que aparece en
la segunda es el elemento neutro y se nombrará como vector nulo. Para cada
vector x, el vector −x de la tercera propiedad es su simétrico y se dirá que es el
vector opuesto de x. En conjunto, las cuatro propiedades indican que V es un
grupo abeliano para la adición de vectores. La operación externa se conoce como
multiplicación de números por vectores. La propiedad quinta se conoce
como modular o propiedad de neutralidad. En la sexta interviene esta
multiplicación a la vez que la multiplicación interna de elementos del cuerpo IK;
de aquı́, que la nombremos como propiedad asociativa mixta. La propiedad
séptima es la propiedad distributiva respecto de la adición de números,
mientras que la última es la propiedad distributiva respecto de la adición
de vectores.
2.2.
Primeras propiedades de los espacios vectoriales
Puesto que V es un grupo abeliano para su adición, se tienen sin más las siguientes propiedades:
1. Propiedad asociativa generalizada de la suma de vectores.
2. El vector nulo 0 es único.
3. Para cada x ∈ V, su opuesto −x es único.
4. El opuesto de una suma es la suma de los opuestos:
−(x + y) = (−x) + (−y) = −x − y.
5. El opuesto del opuesto es el propio vector:
−(−x) = x.
6. Se puede simplificar un sumando repetido en los dos miembros de una
igualdad:
x + z = y + z ⇒ x = y,
z + x = z + y = x = y.
7. Se puede efectuar la sustracción de vectores mediante la regla
x − y = x + ( − y).
En cuanto a la multiplicación de números por vectores, cabe señalar
2.2. Primeras propiedades de los espacios vectoriales
45
8. Si un factor es nulo, el producto es el vector nulo:
0x = 0, a0 = 0.
En efecto,
ax = (a + 0)x = ax + 0x ⇒ 0 = 0x,
ax = a(x + 0) = ax + a0 ⇒ 0 = a0.
9. Si un producto es nulo, debe ser nulo uno de los dos factores:
ax = 0 ⇒ a = 0 o x = 0.
Supongamos ax = 0. Si a = 0, no hay nada que demostrar. En caso
contrario, existe a−1 , y, entonces,
a−1 (ax) = (a−1 a)x = 1x = x = a−1 0 = 0.
10. Si en un factor hay un opuesto, se obtiene el opuesto del resultado:
(−a)x = a(−x) = −(ax)
Basta ver que
0 = 0x = (a + (−a))x = ax + (−a)x ⇒ (−a)x = −(ax),
0 = a0 = a(x + (−x)) = ax + a(−x) ⇒ a(−x) = −(ax).
11. Si en los dos factores hay opuestos, el producto no se altera:
(−a)(−x) = ax.
Aplicando las propiedades anteriores, sale sin más
(−a)(−x) = −(a(−x)) = −(−(ax)) = ax.
12. Propiedad distributiva respecto de la sustracción de números:
(a − b)x = ax − bx.
En efecto,
(a − b)x = (a + (−b))x = ax + (−b)x = ax + (−(bx)) = ax − bx.
13. Propiedad distributiva respecto de la sustracción de vectores:
a(x − y) = ax − ay.
Basta ver que
a(x − y) = a(x + (−y)) = ax + a(−y) = ax + (−(ay)) = ax − ay.
46
Capı́tulo 2. Espacios Vectoriales
14. Simplificación de factores no nulos:
ax = ay, a 6= 0 ⇒ x = y; ax = bx, x 6= 0 ⇒ a = b.
Siendo a 6= 0, se tiene
ax = ay ⇒ ax − ay = a(x − y) = 0 ⇒ x − y = 0 ⇒ x = y.
De igual forma, si x 6= 0, tenemos
ax = bx ⇒ ax − bx = (a − b)x = 0 ⇒ a − b = 0 ⇒ a = b.
2.3.
Los vectores libres
De acuerdo con nuestro capı́tulo anterior, los primeros ejemplos de espacios
vectoriales los constituyen los vectores libres de la recta, el plano y el espacio
geométricos. En todos ellos, el cuerpo de escalares es el IR de los números
reales.
2.4.
Los cuerpos como espacios vectoriales sobre
sı́ mismos
Las propiedades de las operaciones de cuerpo hacen sin más que al poner V = IK
la adición de números se convierta en una adición de vectores y la multiplicación
de números equivalga a una multiplicación de números por vectores. Ası́ todo
cuerpo es espacio vectorial sobre sı́ mismo.
2.5.
Espacios cartesianos
Siendo n ≥ 1 un entero, consideremos el conjunto
IK n = {(x1 , x2 , . . . , xn )/x1 , x2 , . . . , xn ∈ IK},
cuyos elementos son n-uplas ordenadas de números del cuerpo IK. Los números
que intervienen en cada una de ellas se nombran como sus componentes, adjetivadas con el lugar que ocupen:
x1 es la primera componente,
x2 es la segunda componente,
...,
xn es la n-ésima componente.
Por ser elementos de un producto cartesiano, una igualdad como la
(x1 , x2 , . . . , xn ) = (y1 , y2 , . . . , yn ),
2.6. Espacios de sucesiones
47
equivale a las n igualdades numéricas
x1 = y1 , x2 = y2 , . . . , xn = yn .
Por otra parte, en el conjunto IK n se definen las operaciones
(x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = (x1 + y1 , x2 + y2 , . . . , xn + yn ),
a(x1 , x2 , . . . , xn ) = (ax1 , ax2 , . . . , axn ),
llamadas adición de n-uplas y multiplicación de números por n-uplas.
Aplicando las respectivas propiedades del cuerpo IK, componente a componente,
se comprueba que la adición es asociativa y conmutativa, ası́ como que la multiplicación de números por n-uplas verifica las cuatro que se exigen a la ley
externa de los espacios vectoriales. Además, la n-upla
(0, 0, . . . , 0)
actúa como vector nulo, y
−(x1 , x2 , . . . , xn ) = (−x1 , −x2 , . . . , −xn )
actúa como vector opuesto del (x1 , x2 , . . . , xn ).
Los espacios vectoriales ası́ obtenidos (uno para cada n y para cada IK), se
conocen como espacios cartesianos o espacios analı́ticos. En particular,
IK 1 vuelve a ser el cuerpo como espacio sobre sı́ mismo que ya hemos citado.
Por razones que se entenderán más adelante, los espacios cartesianos serán los
más importantes de cuantos aparezcan en este libro, constituyendo el soporte
operativo único sobre el que construiremos toda la teorı́a de lo que llamaremos
espacios vectoriales finito-dimensionales.
2.6.
Espacios de sucesiones
Las sucesiones que se estudian en los cursos de Cálculo y en la Topologı́a no
son sino aplicaciones cuyo conjunto inicial es el IN de los números naturales y el
final es un conjunto cualquiera A. Es decir, siendo A 6= ∅ un conjunto, se llama
sucesión en A a toda aplicación
x : IN → A.
Sin embargo, para las sucesiones no se emplea la notación funcional ordinaria
sino que se escribe
xn en lugar de x(n),
usando la expresión término de lugar n para indicar la imagen del natural n
mediante la aplicación x. De acuerdo con ello, la sucesión se suele presentar en
la forma
(x0 , x1 , x2 , . . . , xn , . . .),
48
Capı́tulo 2. Espacios Vectoriales
donde vamos escribiendo sucesivamente las imágenes de los números en su orden
natural, y lo hacemos dentro de un paréntesis para recordar que si entre los
términos hiciéramos un cambio de orden, cambiarı́a la aplicación y por tanto
se tratarı́a de una sucesión diferente. Con esta interpretación, las sucesiones
aparecen como una generalización al infinito de las n-uplas de elementos del
conjunto.
El conjunto de todas las sucesiones en A se denota por el sı́mbolo AIN . En el
caso de que A sea un cuerpo conmutativo IK, en el conjunto IK IN se definen las
operaciones
(x0 , x1 , x2 , . . . , xn , . . .) + (y0 , y1 , y2 , . . . , yn , . . .) =
= (x0 + y0 , x1 + y1 , x2 + y2 , . . . , xn + yn , . . .),
a(x0 , x1 , x2 , . . . , xn , . . .) = (ax0 , ax1 , ax2 , . . . , axn , . . .),
llamadas adición de sucesiones y multiplicación de números por sucesiones.
Estas operaciones convierten a IK IN en un espacio vectorial sobre IK, en el cual
el elemento neutro es la sucesión nula
(0, 0, 0, . . . , 0, ..),
y, para cada sucesión (x0 , x1 , x2 , . . . , xn , . . .), la opuesta es la sucesión
−(x0 , x1 , x2 , . . . , xn , . . .) = (−x0 , −x1 , −x2 , . . . , −xn , . . .).
Las restantes propiedades son consecuencia de las correspondientes numéricas
y basta aplicarlas lugar a lugar.
2.7.
Espacios de polinomios
En el anillo IK[ξ] de polinomios sobre un cuerpo conmutativo IK, la ley
a(a0 + a1 ξ + a2 ξ 2 + . . . + ar ξ r ) =
= (aa0 ) + (aa1 )ξ + (aa2 )ξ 2 + . . . + (aar )ξ r
define una operación externa (multiplicación de números por polinomios) para la
que es fácil comprobar que cumple las propiedades que se exigen en los espacios
vectoriales. Ası́, IK[ξ] con su primera operación interna (adición de polinomios)
y esta nueva operación, se convierte en un espacio vectorial sobre IK.
Es bueno señalar que la segunda operación interna (multiplicación de polinomios) está ligada a la operación externa mediante la propiedad
(ap(ξ))q(ξ) = p(ξ)(aq(ξ)) = a(p(ξ)q(ξ)).
2.8. Espacios de funciones
2.8.
49
Espacios de funciones
Siendo D ⊆ IR, sabemos que el conjunto
DIR = {f : D → IR}
de las funciones reales de una variable real y dominio D, es un anillo para
las habituales operaciones de adición y multiplicación de funciones. También
aquı́ puede definirse una operación externa (multiplicación de números por funciones) sin más que poner
(af )(x) = af (x),
y se comprueba que cumple los requisitos de ley externa de los espacios vectoriales.
Como en el caso de los polinomios, se establece fácilmente la propiedad
(af )g = f (ag) = a(f g),
que relaciona la multiplicación externa con la interna.
2.9.
Algebras asociativas
Si, como en los dos últimos ejemplos, en un anillo V se da una operación externa
· : IK×V → V que lo convierta en espacio vectorial sobre un cuerpo conmutativo
IK, y si las multiplicaciones externa e interna quedan ligadas por la propiedad
∀a ∈ IK, ∀x, y ∈ V ⇒ (ax)y = x(ay) = a(xy),
se dice que V queda dotado de la estructura de álgebra asociativa sobre el
cuerpo conmutativo IK.
A las álgebras asociativas se le añaden adjetivos como unitaria, conmutativa,
etc..., siempre que V los posea como anillo. Tanto los polinomios como las
funciones, son casos de álgebras asociativas unitarias y conmutativas.
2.10.
Espacios vectoriales sobre cuerpos no conmutativos
Obsérvese que en la definición de espacio vectorial, la multiplicación interna del cuerpo IK sólo interviene en la llamada propiedad asociativa mixta,
a(bx) = (ab)x. Si IK no fuese conmutativo, esta propiedad tendrı́a otro posible
enunciado: a(bx) = (ba)x.
Esto justifica que, entonces, haya dos tipos distintos de espacios vectoriales:
los llamados espacios vectoriales sobre IK por la izquierda, en que la
propiedad asociativa mixta tiene su escritura habitual, y espacios vectoriales
sobre IK por la derecha, en que tiene la contraria.
50
Capı́tulo 2. Espacios Vectoriales
En el segundo caso, es habitual, a la vez que conveniente, presentar la ley externa
en la forma
· : V × IK → V,
lo que quiere decir que el producto de un número a por un vector x lo escribiremos como
xa en lugar de ax.
Entonces, las propiedades de la ley externa toman el aspecto
5) x1 = x
6) (xb)a = x(ba)
7) x(a + b) = xa + xb
8) (x + y)a = xa + ya
y el enunciado de la propiedad asociativa mixta recupera su orden natural.
2.11.
Módulos
Si en la definición de espacio vectorial se sustituye el cuerpo conmutativo IK
por un anillo unitario y conmutativo A, se llega al concepto de módulo sobre
A.
Si A no es conmutativo, aparece la misma alternativa de lateralidad de antes, y se
habla de módulos por la izquierda y módulos por la derecha, adoptando
como se ha indicado en espacios vectoriales la escritura a uno u otro lado,
según proceda. Precisamente esta distinción de lateralidad es más frecuente en
el estudio de los módulos que en el de los espacios vectoriales, y lo es porque
en niveles superiores la presencia de anillos no conmutativos es mayor que la de
cuerpos de este tipo.
Complementos / Ejercicios
1. Sea IK un cuerpo conmutativo y sea J un conjunto (finito o infinito). En
el conjunto
IK J = {f : J → IK}
de todas las funciones de dominio J y valores en IK, se definen las operaciones
(f + g)(j) = f (j) + g(j), (af )(j) = af (j),
donde f, g ∈ IK J , a ∈ IK. Comprobar que IK J se convierte en un espacio
vectorial sobre IK, el cual recibe el nombre de espacio cartesiano sobre
IK asociado a J. Si J es finito de cardinal n, comprobar que IK J se
iguala al espacio IK n , mientras que si J = IN nos aparece el espacio IK IN
de sucesiones en IK.
2.11. Módulos
51
2. En el conjunto IK IN de las sucesiones en IK, la ley
(x0 , x1 , x2 , . . . , xn , . . .)(y0 , y1 , y2 , . . . , yn , . . .) =
= (x0 y0 , x1 y1 , x2 y2 , . . . , xn yn , . . .),
define otra operación interna llamada multiplicación de sucesiones.
Comprobar que, con ella, IK IN se convierte en álgebra asociativa, conmutativa y unitaria. Encontrar el elemento unidad y caracterizar los elementos
invertibles. Mostrar una pareja de divisores de cero.
52
Capı́tulo 2. Espacios Vectoriales
53
Capı́tulo 3
Subespacios Vectoriales
3.1.
Definición de subespacio vectorial
Sea U un subconjunto no vacı́o de un espacio vectorial V, definido sobre un
cuerpo conmutativo IK. Se dice que U es un subespacio vectorial de V cuando U sea un espacio sobre IK mediante las operaciones de V restringidas a
elementos de U.
No se trata, pues, de un subconjunto cualquiera, ni siquiera de un espacio vectorial dentro de otro, sino que el subespacio ha de ser espacio para las mismas
operaciones que el total. Para destacar la peculiaridad de estos subconjuntos
U de V, escribiremos U ≤ V, en lugar de U ⊆ V, siempre que se trate de
subespacios.
Entre los subespacios de V, siempre está el propio V y el subespacio nulo {0}.
Estos se denominan a veces subespacios impropios; por contra, se denominan
subespacios propios a los demás, esto es, a los subespacios U tales que
{0} 6= U 6= V.
3.2.
Caracterizaciones
De acuerdo con la definición, para que U sea un espacio por sı́ solo, lo primero
que tendrá que ocurrir es que la restricción de la operaciones de V a U sean
verdaderas operaciones en U, es decir,
1) ∀x, y ∈ U ⇒ x + y ∈ U.
2) ∀a ∈ IK, ∀x ∈ U ⇒ ax ∈ U.
Además, U ha de tener un vector nulo. Como el de V (por su universalidad)
sirve para U y como el neutro en cada espacio es único, se deberá cumplir que
3) 0 ∈ U.
54
Capı́tulo 3. Subespacios Vectoriales
Finalmente, si cada vector x de U ha de tener un opuesto en U. Por la unicidad
en V de los opuestos, éste no puede ser otro que el que ya poseı́a como elemento
del total. O sea,
4) ∀x ∈ U ⇒ −x ∈ U.
Como las restantes propiedades de espacio vectorial son hereditarias para cada
parte de V, estas condiciones también resultan suficientes:
Proposición 25 Un subconjunto U 6= ∅ de V es un subespacio vectorial si y
sólo si
1. ∀x, y ∈ U ⇒ x + y ∈ U.
2. ∀a ∈ IK, ∀x ∈ U ⇒ ax ∈ U.
3. 0 ∈ U.
4. ∀x ∈ U ⇒ −x ∈ U.
En realidad estas condiciones son sobreabundantes. En efecto, como U es no
vacı́o, existe al menos un vector x ∈ U, de manera que al aplicar la segunda
condición a este vector y al número 0, se tiene que 0x = 0 ∈ U; de la misma
manera, cada vez que tomemos un x ∈ U, multiplicándolo por el escalar -1,
queda (−1)x = −(1x) = −x ∈ U. Por tanto,
Proposición 26 Un subconjunto U 6= ∅ de V es un subespacio vectorial si y
sólo si
1. ∀x, y ∈ U ⇒ x + y ∈ U.
2. ∀a ∈ IK, ∀x ∈ U ⇒ ax ∈ U.
Hay otra forma de caracterizar los subespacios con una sola condición:
Proposición 27 Un subconjunto U 6= ∅ de V es un subespacio vectorial si y
sólo si
∀a, b ∈ IK, ∀x, y ∈ U ⇒ ax + by ∈ U.
Demostracion:
Si U es subespacio, por la segunda condición de la proposición anterior, sale
que tanto ax como by están en U. Aplicando la primera condición a estos dos
vectores, queda que ax + by ∈ U.
Si U satisface esta única condición, particularizándola para los números
a = b = 1, se tiene que 1x + 1y = x + y ∈ U, mientras que particularizándola
para b = 0, obtenemos ax + 0y = ax + 0 = ax ∈ U.
2
3.3. Combinaciones lineales
3.3.
55
Combinaciones lineales
Dado un conjunto finito de vectores
{x1 , x2 , . . . , xr }
y un conjunto de números
{a1 , a2 , . . . , ar },
llamamos combinación lineal de los vectores x1 , x2 , . . . , xr , con coeficientes los números a1 , a2 , . . . , ar , al vector
a1 x1 + a2 x2 + . . . + ar xr .
La última condición para caracterizar a los subespacios, significa que toda combinación lineal formada con parejas de vectores de U ha de estar en U. La
propiedad asociativa de la suma permite extender esta afirmación a combinaciones lineales con cualquier cantidad de vectores. Incluso vale para combinaciones de un solo vector, pues, como hemos visto, basta tomar nulo el coeficiente
del segundo sumando. Recı́procamente, si toda combinación lineal de elementos
de U está en U, en particular, lo están las de parejas de vectores. Por tanto,
podemos enunciar esta nueva caracterización:
Proposición 28 Un subconjunto U 6= ∅ de V es un subespacio vectorial si y
sólo si toda combinación lineal formada con vectores de U esté en U.
3.4.
Intersección de subespacios vectoriales
Proposición 29 La intersección de una cantidad cualquiera de subespacios vectoriales de V es otro subespacio vectorial.
Demostracion:
Sea Λ 6= ∅ un conjunto cualquiera y sea {Uλ }λ∈Λ una familia de subespacios
de V. Entonces,
x, y ∈
\
Uλ ⇒ x, y ∈ Uλ , ∀λ ∈ Λ ⇒ ax + by ∈ Uλ , ∀λ ∈ Λ ⇒
λ∈Λ
\
⇒ ax + by ∈
Uλ ,
λ∈Λ
cualesquiera que sean a, b ∈ IK. Por tanto,
T
λ∈Λ Uλ es un subespacio.
2
Este resultado es independiente del cardinal de Λ, valiendo por tanto para cardinales finitos e infinitos. El subespacio intersección será el máximo subespacio
contenido a la vez en todos los que intersecamos.
56
Capı́tulo 3. Subespacios Vectoriales
3.5.
Subespacio generado por un conjunto de
vectores
Si ∅ 6= C ⊆ V, existen subespacios de V que contienen a C: cuando menos el
propio V. Por eso tiene sentido la siguiente definición:
El resultado
G(C) =
\
U
C⊆U,U≤V
de intersecar todos los subespacios U de V que contengan a C, recibe el nombre
de subespacio vectorial generado por el conjunto C.
Por propia construcción, G(C) contiene a C y es el mı́nimo subespacio (para la
relación de contenido entre subespacios) con esta propiedad.
Hay otra forma de definirlo, ésta operativa, a la que llegaremos después de probar
algunas proposiciones.
Proposición 30 Sea < (C) > el conjunto formado por todas las combinaciones
lineales
a1 u1 + a2 u2 + . . . + ar ur
construidas con cantidades finitas de vectores de C. Probaremos que < C > es
un subespacio de V.
Demostracion:
Si los vectores
x = a1 u1 + a2 u2 + . . . + ar ur , y = b1 v1 + b2 v2 + . . . + bs vs
están en < C > es porque
u1 , u2 , . . . , ur , v1 , v2 , . . . , vs ∈ C.
Entonces, dados a, b ∈ IK, se tiene
ax + by =
= (aa1 )u1 + (aa2 )u2 + . . . + (aar )ur +
+(bb1 )v1 + (bb2 )v2 + . . . + (bbs )vs ,
vuelve a ser combinación lineal de una cantidad finita de vectores de C, luego
ax + by ∈< C >.
2
Proposición 31 Se cumple C ⊆< C >, y por tanto, G(C) ⊆< C >.
Demostracion:
Basta considerar que cada vector u ∈ C coincide con la combinación lineal
1u, luego u ∈< C >. Conseguido esto, < C > es uno de los subespacios que
intersecamos para obtener G(C), luego G(C) ⊆< C >.
2
3.6. Suma de subespacios
57
Proposición 32 Siendo U ≤ V tal que C ⊆ U, se cumple que < C >≤ U. En
particular, < C >⊆ G(C).
Demostracion:
Si C ⊆ U, cualquier parte finita de C está en U y, por ser éste un subespacio,
sigue estando en U cualquier combinación lineal que formemos con los vectores
de la misma. Por tanto, < C >≤ U. Como el propio G(C) contiene a C, se
tendrá < C >⊆ G(C).
2
Uniendo las dos últimas proposiciones, queda probado que
Proposición 33 Para cada subconjunto C 6= ∅ del espacio V, se tiene
G(C) =< C > .
Ası́, el subespacio generado por C queda caracterizado como el conjunto de
combinaciones lineales construidas con cantidades finitas de vectores de C. Esto
justifica el nombre de clausura lineal de C, que algunos autores usan para
nombrar al subespacio G(C).
3.6.
Suma de subespacios
Dados U, W ≤ V, su unión conjuntista U∪W no es en general otro subespacio.
Sin embargo es posible considerar el subespacio
<U∪W >
generado por ella. Este, será el mı́nimo subespacio que contiene a la vez a U y a
W. Cada uno de sus elementos será una combinación lineal finita de elementos de
la unión de U con W; si en ella agrupamos en un bloque u todos los sumandos en
los que aparezcan vectores de U (lo que es válido por las propiedades asociativa
y conmutativa de la suma), por ser éste un subespacio, resultará que u ∈ U; en
los restantes sumandos aparecerán vectores todos ellos de W, de forma que al
agruparlos en un solo vector w, por ser W otro subespacio, se tiene que w ∈ W.
Con esto, lo que se demuestra es que
< U ∪ W >⊆ {u + w/u ∈ U, w ∈ W}.
Proposición 34 Dados dos subespacios U, W ≤ V, el conjunto
U + W = {u + w/u ∈ U, w ∈ W}
de todos los resultados de sumar un vector de U con otro de W, es un nuevo
subespacio, el cual contiene a U y a W, de manera que contiene a < U ∪ W >.
Finalmente,
< U ∪ W >= U + W.
58
Capı́tulo 3. Subespacios Vectoriales
Demostracion:
1. Si tomamos a, b ∈ IK, u1 , u2 ∈ U, w1 , w2 ∈ W, se tiene
a(u1 + w1 ) + b(u2 + w2 ) = (au1 + bu2 ) + (aw1 + bw2 ),
donde au1 + bu2 ∈ U, aw1 + bw2 ∈ W, lo que prueba que U + W es
subespacio vectorial.
2. Los vectores u ∈ U se pueden escribir como u+0, donde 0 ∈ W, mientras
que los w ∈ W se escriben como 0+w, con 0 ∈ U. Esto prueba que U+W
contiene tanto a U como a W.
3. Si contiene a ambos, contiene a su unión, y, por tanto, al subespacio generado por la unión.
4. Antes hemos razonado el contenido contrario. Por tanto,
< U ∪ W >= U + W.
2
Esta proposición justifica que llamemos subespacio suma de U con W, al
generado por su unión y que escribamos U + W en lugar de < U ∪ W >.
3.7.
Subespacios de vectores libres
Al sumar dos vectores de la misma dirección, ası́ como al multiplicar un número
por un vector de una dirección dada, los resultados mantienen la dirección. Por
tanto, tanto en el plano P como en el espacio E, los vectores libres de una
dirección dada forman un subespacio vectorial.
Lo mismo ocurre en el espacio E con el conjunto de vectores libres coplanarios
entre sı́, o sea, situados en planos paralelos a uno dado.
3.8.
El espacio l∞ de las sucesiones acotadas
El espacio IK IN de todas las sucesiones de términos en IK tiene interés, más
que por sı́ mismo, por el hecho de albergar muchos subespacios que aparecen en
Topologı́a y en Análisis. En estos casos los cuerpos sobre los que más se trabaja
son IR y C,
I de manera que al hablar de sucesiones asumiremos implı́citamente
que IK es uno de estos dos. Conviene recordar a este respecto que con la notación
| x | indicamos el valor absoluto de x cuando x ∈ IR, pero también el módulo
de x cuando x ∈ C.
I
Una sucesión x = (x0 , x1 , x2 , . . . , xn , . . .) se dice que es acotada si existe un
número real positivo h (llamado cota de la sucesión) de manera que
∀n ∈ IN ⇒| xn |≤ h.
3.9. El espacio c de las sucesiones convergentes
59
Usando la desigualdad triangular | x + y |≤| x | + | y | que tiene tanto el valor
absoluto de los números reales como el módulo de los complejos, ası́ como la
igualdad | xy |=| x || y |, probaremos el siguiente enunciado.
Proposición 35 La suma de dos sucesiones acotadas y el producto de un número
por una sucesión acotada, son sucesiones acotadas.
Demostracion:
Si x = (xn ) e y = (yn ) son dos sucesiones acotadas con cotas respectivas h
y k, y a es un número, se tiene
| xn + yn |≤| xn | + | yn |≤ h + k, ∀n ∈ IN,
| axn |=| a || xn |≤| a | h, ∀n ∈ IN.
2
IN
Ası́, por la proposición 26, las sucesiones acotadas son un subespacio de IK .
Aislado como espacio, se denota por los sı́mbolos
l∞ o m,
y se nombra como el espacio vectorial de las sucesiones acotadas, sobreentendiendo por contexto si nos referimos al caso real o al complejo.
3.9.
El espacio c de las sucesiones convergentes
Una sucesión x = (xn ) de elementos de IK (IR o C)
I se dice convergente si existe
un número L ∈ IK tal que, para todo número real ² > 0, se puede determinar
un lugar N² de manera que
∀n ≥ N² ⇒| xn − L |< ².
El número L recibe el nombre de lı́mite de la sucesión x, y se escribe
L = lı́m xn .
n→∞
En los cursos de introducción al Análisis se prueban sin mayor dificultad las
siguientes afirmaciones:
1. Toda sucesión convergente es acotada.
2. No toda sucesión posee lı́mite, pero, en caso de tenerlo, su valor es único.
3. Si x = (xn ), y = (yn ) son convergentes y a es un número, las sucesiones
x + y, ax son convergentes y se tienen las fórmulas
lı́m (xn + yn ) = lı́m xn + lı́m yn ,
n→∞
n→∞
n→∞
lı́m (axn ) = a lı́m xn .
n→∞
n→∞
60
Capı́tulo 3. Subespacios Vectoriales
De la última se sigue que las sucesiones convergentes son un subespacio de
l∞ , y, a su vez, de IK IN . Es el llamado espacio vectorial de las sucesiones
convergentes, que se denotará por el sı́mbolo
c.
3.10.
El espacio c0 de las sucesiones infinitésimas
Una sucesión convergente de lı́mite nulo se conoce como sucesión infinitésima,
y el conjunto de todas ellas se denota por
c0 .
Supongamos que a ∈ IK y que x, y ∈ c0 . Aplicando las fórmulas de antes, se
tiene
lı́m (xn + yn ) = lı́m xn + lı́m yn = 0 + 0 = 0,
n→∞
n→∞
n→∞
lı́m (axn ) = a lı́m xn = a0 = 0,
n→∞
n→∞
es decir, x + y ∈ c0 , ax ∈ c0 , con lo cual c0 ≤ c ≤ l∞ ≤ IK IN . Ası́, queda
construido el espacio vectorial de las sucesiones infinitésimas.
Aún dentro de este espacio hay muchos de interés en Análisis, sobre todo los ligados al concepto de sumabilidad de sucesiones (o convergencia de series numéricas). Los más relevantes se presentan cuando se aborda el estudio de los productos
escalares y las normas.
3.11.
El espacio IKn [ξ] de polinomios de grado a
lo sumo n
Fijado un entero n ≥ 0, indicamos por IKn [ξ] el conjunto de todos los polinomios con coeficientes en IK y grado menor o igual que n. Como al sumar dos
polinomios, el grado de la suma no supera al mayor de los grados, si ambos lo
tienen por debajo o igual que n, lo mismo le pasará a su suma. De la misma
manera, al multiplicar un número por un polinomio, el producto conserva el
grado (o, incluso lo rebaja si el número es 0), con lo cual, si el polinomio se
toma en IKn [ξ], el producto lo estará.
Ası́, se asegura que IKn [ξ] es un subespacio vectorial de IK[ξ]. Lo nombraremos
como el espacio vectorial de los polinomios de grado a lo sumo n. Al
ir variando n, tenemos tantos espacios de este tipo como números naturales, lo
mismo que, fijado n, hay uno para cada cuerpo conmutativo IK que tomemos.
Precisamente al poner n = 0 (polinomios constantes), vuelve a aparecer el cuerpo
IK como espacio sobre sı́mismo.
3.12. Subálgebras asociativas
3.12.
61
Subálgebras asociativas
Un subconjunto no vacı́o U de un álgebra asociativa V será una subálgebra
asociativa cuando sea a la vez subanillo y subespacio vectorial. De acuerdo
con la caracterización dada en 26, y la conocida para subanillos, para que U sea
subálgebra de V será necesario y bastará con las condiciones
1. ∀x, y ∈ U ⇒ x + y ∈ U.
2. ∀x, y ∈ U ⇒ xy ∈ U.
3. ∀a ∈ IK, ∀x ∈ U ⇒ ax ∈ U.
3.13.
El álgebra de las funciones convergentes
en un punto
Dentro del cuerpo real IR, sea D un intervalo (abierto, cerrado, semiabierto, de
longitud finita o de longitud infinita) y consideremos el espacio vectorial DIR de
las funciones numéricas de dominio D.
Fijado un número x0 , perteneciente a D o cuando menos situado en un extremo
de D, se dice que f es convergente en x0 si existe un número real L tal que,
para todo número ² > 0, se puede determinar otro δ > 0 de manera que
| x − x0 |< δ ⇒| f (x) − L |< ².
El número L recibe el nombre de lı́mite de la función f en las cercanı́as de
x0 (o cuando x tiende a x0 ), y se escribe
L = lı́m f (x).
x→x0
Lo mismo que para las sucesiones, se prueba que los lı́mites de funiones, si
existen, son únicos. Además, se tiene
lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x),
x→x0
x→x0
x→x0
lı́m (f (x)g(x)) = lı́m f (x) lı́m g(x),
x→x0
x→x0
x→x0
lı́m (af (x)) = a lı́m f (x),
x→x0
x→x0
siempre que los lı́mites del segundo miembro existan. Por tanto, las funciones
convergentes en x0 forman un subanillo y un subespacio vectorial del DIR , es
decir, constituyen un álgebra asociativa.
62
3.14.
Capı́tulo 3. Subespacios Vectoriales
Algebras de funciones continuas
Sabemos que una función f es continua en un punto x0 ∈ D, cuando admita
lı́mite en sus cercanı́as, y, además,
lı́m f (x) = f (x0 ).
x→x0
Las reglas anteriores, junto a la manera como se definen las operaciones con
funciones, aseguran que la suma de funciones continuas, el producto de funciones continuas, ası́ como el producto de un número por una función continua,
dan como resultado nuevas funciones continuas. Por ello, todas las funciones
continuas en x0 forman un álgebra asociativa.
Una función f es continua en el intervalo D cuando lo sea en todos sus
puntos. Como antes, resulta que todas las funciones continuas en D forman un
álgebra asociativa. Esta se suele denotar como
C(D).
3.15.
Algebras de funciones derivables
La función f es derivable en un punto x0 ∈ D, cuando exista el número
lı́m
x→x0
f (x) − f (x0 )
,
x − x0
llamado derivada de f en x0 y denotada por cualquiera de los sı́mbolos
f 0 (x0 ) o Df (x0 ).
El lector conoce que se prueban las fórmulas
D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ),
D(f g)(x0 ) = Df (x0 )g(x0 ) + f (x0 )Dg(x0 ),
D(af )(x0 ) = aDf (x0 ),
siempre que f y g sean derivables en x0 , lo que nos permite afirmar que las
funciones derivables en un punto son un álgebra asociativa.
De igual forma, se podrá hablar del álgebra asociativa de las funciones derivables
en el intervalo D, entendiendo por tales aquellas funciones que sean derivables
en cada punto x0 ∈ D.
3.16.
Algebras de funciones integrables
Se dice que la función f es acotada en su dominio D, si existe un positivo
h (cota de f en D) tal que
∀x ∈ D ⇒| f (x) |≤ h.
3.16. Algebras de funciones integrables
63
En la Teorı́a de la Integral (de Riemann) se trabaja con funciones acotadas en
un intervalo cerrado D = [a, b].
Una partición de [a, b] es un conjunto finito
P = {a = x0 , x1 , x2 , . . . , xn−1 , xn = b}
de puntos del intervalo, dados en orden ascendente y de manera que entre ellos
siempre figuren los extremos a y b. Dadas dos particiones P y Q de [a, b] se dice
que Q es más fina que P cuando P ⊆ Q.
Una función acotada f , se dice que es integrable en [a, b] si existe un número
I tal que, fijado cualquier positivo ², existe al menos una partición P (²) de [a, b]
de manera que para cualquier otra partición
P = {a = x0 , x1 , x2 , . . . , xn−1 , xn = b}
más fina que P (²) y para cualesquiera n-uplas
{t1 , t2 , . . . , tn }
elegidas de forma que
xi−1 ≤ ti ≤ xi ,
para cada valor de i = 1, 2, . . . , n, se verifique
|
n
X
f (ti )(xi − xi−1 ) − I |< ².
i=1
Este número I recibe el nombre de integral de f en [a, b] y se escribe
Z b
I=
f (x)dx.
a
Si dos funciones f y g son integrables y c ∈ IR, se prueba que
Z b
Z b
(f (x) + g(x))dx =
a
Z b
f (x)dx +
a
Z b
g(x)dx,
a
Z b
cf (x)dx = c
a
f (x)dx,
a
lo que permite afirmar que el conjunto de funciones integrables en un intervalo
[a, b] es un espacio vectorial real.
Aunque no se tenga una fórmula para expresar la integral de un producto, sı́ se
prueba que
Z b
f (x)g(x)dx
a
existe siempre que f y g sean integrables. Por tanto, la estructura que se alcanza
es la de álgebra asociativa.
64
Capı́tulo 3. Subespacios Vectoriales
3.17.
Complementos / Ejercicios
1. Dilucidar cuáles de los siguientes subconjuntos de IRn son subespacios
vectoriales
a) {(x, y) ∈ IR2 /y ≤ 0}.
b) {(x, y) ∈ IR2 /x > 0, y > 0}.
c) {(x, y) ∈ IR2 /y = −3x}.
d ) {(x, y) ∈ IR2 /y = −3x + 1}.
e) {(x, y, z) ∈ IR3 /z = 2}.
f ) {(x, y, z) ∈ IR3 /2x − y − 12z = 0}.
g) {(x, y, z) ∈ IR3 /2x − y − 12z = 1}.
h) {(x, y, z) ∈ IR3 /x = y = z}.
i ) {(x, y, z) ∈ IR3 /x = t + 1, y = 2t, z = t − 1, t ∈ IR}.
j ) {(x, y, z) ∈ IR3 /y = 0}.
2. Determinar cuáles de los siguientes subconjuntos de IR4 son subespacios
vectoriales:
a) U = {(x, y, z, t)/x + y + z + t = 0}.
b) U = {(x, y, z, t)/x = y = z = t}.
c) U = {(x, y, z, t)/x = y, z = t}.
d ) U = {(x, y, z, t)/t = 0}.
e) U = {(x, y, z, t)/x = 1}.
f ) U = {(x, y, z, t)/x, y, z, t ∈ Z}.
g) U =< (1, 2, 3, 4) > .
3. Justificar en cada caso por qué el siguiente subconjunto U del espacio
vectorial V = IRIN no es un subespacio vectorial:
a) U = {(xn )/ lı́mn→∞ xn = 1}.
b) U = {(xn )/xn > 0, ∀n ∈ IN }.
c) U = {(xn )/ no existe lı́mn→∞ xn }.
4. Dentro del espacio IR[ξ] se considera el subconjunto U formado por todos
los polinomios de grado igual a un natural n prefijado. Justificar por qué U
no puede ser subespacio vectorial.
5. Sea V el espacio vectorial de las funciones reales continuas en el intervalo
[0, 1]. Dilucidar qué subconjuntos U de V son subespacios vectoriales
a) U = {f ∈ V/f (1) = 0}.
3.17. Complementos / Ejercicios
65
R1
b) U = {f ∈ V/ 0 f (x)dx = 1}.
c) U = {f ∈ V/f (0) = 1}.
R1
d ) U = {f ∈ V/ 0 f (x)dx = 0}.
6. Las sucesiones constantes, ¿forman subespacio vectorial? ¿Forman subálgebra?
7. Si IK = IR o IK = C,
I el Álgebra V = IK IN suele denotarse como s. Razonar
que los conjuntos
l∞ , c, c0 .
son subálgebras de s. Dentro de l∞ , comprobar que c0 es un ideal.
8. Dado un cuerpo conmutativo IK y un conjunto J, una función f : J → IK
se dice casi nula o de soporte finito cuando f (j) = 0, salvo para una
cantidad finita de valores de j. El conjunto de todas ellas se denota
IK (J) .
Comprobar que se trata de un subespacio del espacio cartesiano IK J .
9. Razonar que IK (J) = IK J si y sólo si J es de cardinal finito.
66
Capı́tulo 3. Subespacios Vectoriales
67
Capı́tulo 4
Sistemas Generadores
4.1.
Sistemas generadores de un espacio
Se dice que un conjunto no vacı́o G ⊆ V es un sistema generador del espacio
vectorial V, cuando < G >= V.
De acuerdo con lo expuesto en el capı́tulo anterior, G es un sistema generador
cuando todo vector x ∈ V se obtenga como combinación lineal de una parte
finita de vectores de G.
4.2.
Reducción de sistemas generadores
La existencia de sistemas generadores está garantizada en todo caso, pues cuando menos el espacio total V se genera ası́ mismo. Naturalmente, interesará conocer sistemas generadores más reducidos, y, como meta final, sistemas generadores
de cardinal mı́nimo. Una puerta para la obtención de los mismos, la abre la siguiente
Proposición 36 Si un vector u de un sistema generador G de V es combinación lineal de otros vectores de G −{u}, entonces G −{u} es un nuevo sistema
generador de V.
Demostracion:
Por hipótesis existirá una combinación lineal
u = a1 u1 + a2 u2 + . . . + ar ur , con u1 , u2 , . . . , ur ∈ G − {u}.
Al expresar un vector arbitrario x ∈ V como combinación lineal de una parte
finita de G, pueden ocurrir dos casos:
1. En ella no aparece el vector u. Entonces, x ∈< G − {u} >.
68
Capı́tulo 4. Sistemas Generadores
2. En ella sı́ aparece u. Los restantes vectores son de G−{u}. Si en el sumando
en que aparezca u, lo sustituimos por su expresión anterior, x queda como
combinación lineal de vectores de G − {u.}
Esto prueba que todo vector x se puede conseguir como combinación lineal de
vectores de G − {u}, luego este conjunto también genera a V.
2
Este resultado se nombra como Lema de reducción de sistemas generadores.
4.3.
Espacios vectoriales de generación finita e
infinita
Un espacio vectorial V se dice que es de generación finita cuando admita un
sistema generador G de cardinal finito. En caso contrario, se dice que V es de
generación infinita.
Esta distinción constituye una clasificación muy importante de los espacios vectoriales. En los de generación finita, de la existencia de un sistema generador
como el G = {u1 , u2 , . . . , ur }, se sigue que, para cada vector x ∈ V, existen
unos números a1 , a2 , . . . , ar tales que
x = a1 u1 + a2 u2 + . . . + ar ur .
El lema de reducción de sistemas generadores permitirá depurar este sistema
generador, en el sentido de eliminar de él vectores que sean combinación lineal
de los restantes, hasta llegar a un sistema generador de cardinal mı́nimo, en el
que ningún vector se obtenga como combinación lineal de los otros. Un tal conjunto será nombrado más adelante como una base. Cuando lleguemos a ella, los
coeficientes de la combinación lineal de un vector genérico, se nombrarán como
coordenadas de dicho vector. El uso de las mismas permite un tratamiento
más elemental de los espacios de generación finita, razón que justifica que éstos
sean los más estudiados en primeros cursos universitarios.
Sin embargo, ya hemos tenido ocasión de señalar que el avance simultáneo durante el primer tercio del siglo XX de la Mecánica Cuántica y los Espacios de
Hilbert ha hecho imprescindible el conocimiento de los espacios de generación
infinita. Su estudio presenta ciertas dificultades que obligan a postergarlo. Por
nuestra parte, hablaremos de ellos hasta donde se pueda, pero lo que no haremos nunca (como consuman bastantes textos de Algebra Lineal) es ignorarlos
de tal manera que el lector dude, no ya de su interés, sino hasta de su misma
existencia.
4.4. Concepto de dependencia e independencia lineal
4.4.
69
Concepto de dependencia e independencia
lineal
Dado un conjunto finito {u1 , u2 , . . . , ur } de vectores de V, siempre existen combinaciones lineales tales que
a1 u1 + a2 u2 + . . . + ar ur = 0,
entre ellas la combinación lineal trivial en la que todos los coeficientes son nulos.
Según que existan o no existan otras posibles, los vectores se dirán que son
linealmente dependientes o linealmente independientes. Es decir:
Los vectores u1 , u2 , . . . , ur son linealmente dependientes si existen números
a1 , a2 , . . . , ar , no todos ellos nulos, de manera que
a1 u1 + a2 u2 + . . . + ar ur = 0.
Por el contrario, se dirá que son linealmente independientes si la única
posibilidad para que
a1 u1 + a2 u2 + . . . + ar ur = 0,
es que a1 = a2 = . . . = ar = 0.
4.5.
Propiedades elementales de la dependencia
Probaremos algunas propiedades de la dependencia lineal. Junto a cada una,
colocaremos otra para la independencia, que no requerirá más demostración
que observar que su enunciado se hace por negación del anterior.
Proposición 37 Si uno de los vectores de {u1 , u2 , . . . , ur } es nulo, éstos son
linealmente dependientes.
Demostracion:
Suponiendo, por ejemplo, ur = 0, podrı́amos escribir
0u1 + 0u2 + . . . + 0ur−1 + 1ur = 0,
donde el coeficiente 1 de ur es no nulo.
2
Proposición 38 Si los vectores de {u1 , u2 , . . . , ur } son linealmente independientes, ninguno de ellos es nulo.
Proposición 39 Un vector u es dependiente si y sólo si u = 0.
Demostracion:
70
Capı́tulo 4. Sistemas Generadores
⇐) Si u = 0, aplicamos la proposición 37.
⇒) Si a u = 0, con a 6= 0, necesariamente se tiene u = 0.
2
Proposición 40 Un vector u es independiente si y sólo si u 6= 0.
Proposición 41 Sea un entero r ≥ 2. Los vectores {u1 , u2 , . . . , ur } son linealmente dependientes si y sólo si uno de ellos se obtiene como combinación lineal
de los restantes.
Demostracion:
Si un vector, por ejemplo el útimo, es combinación lineal de los otros, tendremos una relación
ur = a1 u1 + a2 u2 + . . . + ar−1 ur−1 ,
de la que se obtiene
a1 u1 + a2 u2 + . . . + ar−1 ur−1 − ur = 0.
Como el coeficiente -1 de ur es no nulo, los r vectores son linealmente dependientes.
Si son linealmente dependientes, habrá una relación
a1 u1 + a2 u2 + . . . + ar ur = 0,
donde al menos un coeficiente es no nulo. Si, por ejemplo, fuese ar 6= 0, multiplicando por 1/ar podemos despejar ur en la forma
ur = −
a1
a2
ar−1
u1 − u2 − . . . −
ur−1 ,
ar
ar
ar
es decir, como combinación lineal de los r − 1 vectores restantes.
2
Proposición 42 Sea un entero r ≥ 2. Los vectores {u1 , u2 , . . . , ur } son linealmente independientes si y sólo si ninguno de ellos se obtiene como combinación
lineal de los restantes.
Proposición 43 Si los vectores de {u1 , u2 , . . . , ur } son linealmente dependientes, también lo son los de cualquier conjunto
{u1 , u2 , . . . , ur ; v1 , v2 , . . . , vs }
del que formen parte.
4.6. Conjuntos ligados y conjuntos libres
71
Demostracion:
Por hipótesis existe una relación
a1 u1 + a2 u2 + . . . + ar ur = 0,
donde al menos un ai 6= 0. Entonces, en
a1 u1 + a2 u2 + . . . + ar ur + 0v1 + 0v2 + . . . + 0vs = 0,
sigue habiendo un coeficiente (el mismo ai de antes) no nulo, y de aquı́ se sigue
la dependencia del conjunto más amplio.
2
Proposición 44 Si los vectores de {u1 , u2 , . . . , ur ; v1 , v2 , . . . , vs } son linealmente independientes, cualquier parte suya {u1 , u2 , . . . , ur } también está formada por vectores linealmente independientes.
4.6.
Conjuntos ligados y conjuntos libres
Un conjunto C ⊆ V, de cardinal finito o infinito, se llamará conjunto ligado
cuando al menos una de sus partes finitas esté formada por vectores linealmente
dependientes.
En caso contrario, o sea, cuando toda parte finita de C esté formada por vectores
independientes, se dirá que es un conjunto libre.
Ya que toda parte finita de un subconjunto es parte finita del total, es claro
que cualquier conjunto que contenga a uno ligado, vuelve a ser ligado. Por igual
razón, los subconjuntos de un conjunto libre vuelven a ser libres.
Como el vacı́o es subconjunto de cualquier conjunto, al estar dentro de cualquier
conjunto libre, se acostumbra a admitirlo como libre.
Supongamos que C es un conjunto de cardinal finito. Si C es ligado, por la
proposición 43, la totalidad de sus vectores serán linealmente dependientes. Si
C es libre, por propia definición, sus vectores han de ser linealmente independientes.
4.7.
Ampliación de conjuntos libres
Proposición 45 Sea L un conjunto libre tal que < L >6= V. Tomando un
vector u 6∈< L >, se prueba que L ∪ {u} es libre.
Demostracion:
Si en una parte finita de L ∪ {u} no interviene u, se queda dentro de L, y,
por ello, está formada por vectores independientes. Imaginemos una parte finita
{u1 , u2 , . . . , ur , u} ⊆ L ∪ {u}
72
Capı́tulo 4. Sistemas Generadores
de la que sı́ forme parte el nuevo vector. Dada una relación lineal
a1 u1 + a2 u2 + . . . + ar ur + bu = 0,
debe ser b = 0, pues de lo contrario se podrı́a despejar u a partir de los vectores
anteriores llegando a que u ∈< L >, en contra de su elección. Una vez que
b = 0, la relación se reduce a una combinación lineal nula entre vectores del
conjunto libre L, razón que llevará a la anulación de todos sus coeficientes. Esto
prueba que también los vectores de {u1 , u2 , . . . , ur , u} son independientes, lo
que completa la demostración.
2
Este enunciado se conoce como Lema de ampliación de conjuntos libres.
4.8.
Concepto de base
Sea V 6= {0} un espacio vectorial sobre IK. Un conjunto B 6= ∅ que sea a la vez
sistema generador y conjunto libre se dice que es una base de V.
Usando técnicas de la Teorı́a Avanzada de Conjuntos se prueba que todo espacio
vectorial admite una base, ası́ como que dos posibles bases de un mismo espacio
tienen igual cardinal. En el capı́tulo siguiente probaremos estos hechos si bien
únicamente para espacios de generación finita.
4.9.
Complementos / Ejercicios
1. Sea IK un cuerpo conmutativo, sea V un espacio vectorial sobre IK, sea
{u1 , u2 , . . . , ur }, con r ≥ 2, un conjunto finito de vectores de V. Se denominan operaciones elementales sobre los vectores dados a cada uno
de los tres siguientes procesos:
a) Cambio de lugar entre dos vectores ui y uj , con i 6= j.
b) Sustitución de un vector ui por el λui , con λ 6= 0.
c) Sustitución de un vector ui por el ui + λuj , con i 6= j.
Estos procesos se esquematizan, respectivamente, en la forma
ui ↔ uj , ui ↔ λui , ui ↔ ui + λuj .
Razonar que U =< u1 , u2 , . . . , ur > no se altera por aplicación de operaciones elementales sobre sus generadores.
2. Razonar que el subespacio U =< u1 , u2 , . . . , ur > se conserva por permutación de sus generadores.
3. Razonar que U =< u1 , u2 , . . . , ur > no se altera si un vector ui se sustituye por su suma con una combinación lineal de los restantes.
4.9. Complementos / Ejercicios
73
4. Razonar que la primera operación elemental es suplerflua, es decir, que
puede obtenerse mediante una cadena finita de las otras dos.
5. Razonar que la dependencia o independencia lineal de varios vectores
u1 , u2 , . . . , ur no se altera por aplicación a los mismos de operaciones
elementales.
6. Dados r vectores u1 , u2 , . . . , ur ∈ IK n , supongamos que
uj = (a1j , a2j , . . . , anj )
y planteemos una relación lineal nula
x1 u1 + x2 u2 + . . . + xr ur = 0
entre ellos. Operando el primer miembro e igualando al segundo, la ecuación
vectorial de antes se convierte en el sistema lineal homogéneo
a x + a12 x2 + . . . + a1r xr = 0
11 1
a21 x1 + a22 x2 + . . . + a2r xr = 0
...
an1 x1 + an2 x2 + . . . + anr xr = 0
el cual posee n ecuaciones y r incógnitas. Estudiar la independencia o dependencia lineal de los vectores, equivale entonces a ver si la única solución
de este sistema es la x1 = x2 = . . . = xr = 0, o, por el contrario, si hay
otras soluciones posibles. La resolución de este sistema puede hacerse por
métodos elementales (igualación, sustitución, reducción), técnicas equivalentes a la aplicación de lo que ahora llamamos operaciones elementales.
Utilizando estas ideas, decı́dase la independencia o dependencia lineal de
los siguientes conjuntos de vectores:
a) (0, 1, 2, 3), (2, −2, 3, 3), (0, 0, 3, 1).
b) (1, 2, 1, 2), (0, 4, 1, 3), (2, 0, 1, 1).
c) (1, −1, 3, 2), (0, 1, 2, −1), (2, −3, 4, 5), (1, 0, 4, 1).
d ) (1, −1, 3, 2), (0, 1, 2, −1), (1, 0, 4, 1), (2, −3, 4, 4).
7. Situándonos en el espacio vectorial V = IRIR , comprobar que los dos
siguientes conjuntos de funciones son ligados:
a) {cos2 x, sen2 x, 8}.
b) {ch2 x, sh2 x, 3}.
8. Se considera el espacio vectorial complejo C
I IR = {f : IR → C}.
I Razonar
que la sucesión de funciones
fn (x) = einx = cos nx + i sen nx
donde x ∈ IR, constituye un conjunto libre.
74
Capı́tulo 4. Sistemas Generadores
9. Se considera el espacio vectorial real IRIR = {f : IR → IR}. Razonar que
la sucesión de funciones
1, cos x, sen x, cos 2x, sen 2x, . . . , cos nx, sen nx, . . .
constituye un conjunto libre.
75
Capı́tulo 5
Espacios de Generación
Finita
5.1.
Teorema fundamental de los espacios de generación finita
Proposición 46 Sea L 6= ∅ un conjunto libre en un espacio V de generación
finita y sea G, con cardinal r ≥ 1, un sistema generador. Entonces, L es de
cardinal finito y se cumple
Card(L) ≤ Card(G).
Además, existe un sistema generador de cardinal r que contiene a L.
Demostracion:
Supongamos que el sistema generador sea el conjunto
G = {v1 , v2 , v3 , . . . , vr }.
Siendo L 6= ∅, existe al menos un vector u1 ∈ L. Por ser G sistema generador,
tendremos una combinación lineal
u1 = a11 v1 + a21 v2 + a31 v3 + . . . + ar1 vr ,
y por ser L libre, necesariamente es u1 6= 0. Por ello, habrá cuando menos un
coeficiente ai1 6= 0, con 1 ≤ i ≤ r. Renumerando si fuera preciso los vectores
de G, no hay inconveniente en suponer que el coeficiente no nulo sea el a11 .
Entonces, operando, se obtiene
v1 =
a21
a31
ar1
1
u1 −
v2 −
v3 − . . . −
vr .
a11
a11
a11
a11
76
Capı́tulo 5. Espacios de Generación Finita
Sustituyendo v1 por esta expresión en toda combinación lineal genérica de vectores de V respecto del sistema generador G, concluı́mos que el conjunto
G1 = {u1 , v2 , v3 , . . . , vr }, con Card(G1 ) = r,
es un nuevo sistema generador de V. Si fuese r = 1, necesariamente debe ser
L = {u1 } porque de existir otro vector u2 ∈ L, serı́a combinación lineal de
u1 en contra de que {u1 , u2 } ⊆ L sea libre; pero, entonces, el teorema habrı́a
concluı́do pues Card(L) = 1 = r. Aún siendo r > 1, también el teorema concluye
si L = {u1 } pues Card(L) = 1 < r.
Si r > 1 y L 6= {u1 }, tomamos un vector u2 ∈ L − {u1 } y lo expresamos como
combinación lineal de los vectores de G1 :
u2 = a12 u1 + a22 v2 + a32 v3 + . . . + ar2 vr ,
pudiendo asegurar que existe al menos un ai2 6= 0, con 2 ≤ i ≤ r, pues de lo
contrario tendrı́amos
u2 = a12 u1 ,
en contra de que {u1 , u2 } ⊆ L sea libre. No hay inconveniente en suponer que
sea a22 6= 0, lo que nos permite obtener
v2 = −
a12
1
a32
ar2
u1 +
u2 −
v3 − . . . −
vr .
a22
a22
a22
a22
Sustituyendo v2 por esta expresión en toda combinación lineal genérica de vectores de V respecto del sistema generador G1 , concluı́mos que el conjunto
G2 = {u1 , u2 , v3 , . . . , vr }, con Card(G2 ) = r,
es otro sistema generador de V. Si fuese r = 2, necesariamente debe ser L =
{u1 , u2 } porque de existir otro vector u3 ∈ L, serı́a combinación lineal de u1 y
u2 en contra de que {u1 , u2 , u3 } ⊆ L sea libre; entonces, el teorema concluye
pues Card(L) = 2 = r. Si r > 2, también el teorema concluye en caso de que
L = {u1 , u2 } pues Card(L) = 2 < r.
En el supuesto r > 2 y L 6= {u1 , u2 }, tomamos un vector u3 ∈ L − {u1 , u2 }
y repetimos el mismo proceso de antes para obtener un sistema generador G3 ,
de cardinal r, en el que figuren u1 , u2 , u3 , y el teorema concluye tanto si r = 3
como si L = {u1 , u2 , u3 } y r > 3.
Siendo r finito, este proceso reiterativo tiene con seguridad un final. En el caso
más extremo se culminará al cabo de r pasos, pues obtenido un sistema generador
Gr = {u1 , u2 , u3 , . . . , ur }, con u1 , u2 , u3 , . . . , ur ∈ L y Card(Gr ) = r,
necesariamente es L = {u1 , u2 , u3 , . . . , ur }, ya que si existiera otro vector
ur+1 ∈ L, serı́a combinación lineal de los vectores de Gr en contra de que
{u1 , u2 , u3 , . . . , ur , ur+1 } ⊆ L sea libre.
2
5.2. Obención de bases a partir de un sistema generador
77
Esta proposición es sin duda el más importante de toda la teorı́a vectorial de
generación finita. El procedimiento mediante el cual vamos suprimiendo, paso a
paso, vectores de un sistema generador para sustituirlos por otros de un conjunto
libre, se suele nombrar como Proceso de Steinitz y el propio enunciado se
conoce como Teorema de Steinitz.
5.2.
Obención de bases a partir de un sistema
generador
Proposición 47 Si V 6= {0} admite un sistema generador
G = {v1 , v2 , . . . , vr }
de cardinal finito, existe un conjunto B ⊆ G que es base de V.
Demostracion:
Si los vectores de G fuesen independientes, G es libre y por tanto base: se toma
B = G y la demostración acaba. Si no lo fuesen, un vector de G es combinación
lineal de los restantes 42. Renumerándolos si fuera preciso, no hay inconveniente
en suponer que sea vr . Entonces, por la proposición 36 de reducción de sistemas
generadores, el conjunto
G1 = {v1 , v2 , . . . , vr−1 }
es otro sistema generador. Si sus vectores son independientes, basta tomar B =
G1 . En caso contrario, razonamos como antes para pasar a un sistema generador
G2 de cardinal r − 2. Repitiendo el proceso, y por contar sólo con una cantidad
finita de vectores, tenemos la seguridad de llegar a un conjunto
B = Gp = {v1 , v2 , . . . , vr−s }
que sea un sistema generador libre, es decir, base. En el caso más extremo, nos
quedaremos con un solo vector como generador, en cuyo caso B = {v1 } serı́a
la base buscada, pues de no ser v1 libre, serı́a nulo y esto nos conducirı́a a que
V = {0}.
2
Este resultado se nombra como Método descendente de obtención de
bases.
5.3.
Equicardinalidad de bases para generación
finita
Probada la existencia de bases en todo espacio de generación finita, pasamos a
razonar un invariante de las mismas:
78
Capı́tulo 5. Espacios de Generación Finita
Proposición 48 Sea V 6= {0} un espacio de generación finita y sean A y B
dos bases de V. Entonces,
Card(A) = Card(B).
Demostracion:
Considerando A como conjunto libre y B como sistema generador, el Teorema
de Steinitz afirma que
Card(A) ≤ Card(B).
Tomados ahora, A como sistema generador y B como conjunto libre, el mismo
teorema permite escribir
Card(B) ≤ Card(A).
De ambas desigualdades se sigue la igualdad de cardinales.
5.4.
2
Concepto de dimensión de un espacio
Sabido ya que el cardinal de todas las bases de V es un invariante, dicho cardinal
se nombra como dimensión del espacio V y se denota
dim(V).
En el caso de los espacios de generación finita, la dimensión será finita, o
sea, un número entero positivo. Esto explica que se use el término espacio
finito-dimensional como sinónimo de espacio de generación finita, lo mismo que en el supuesto de generación infinita se hable de espacio infinitodimensional. Aunque carezca de base, el espacio nulo {0} se incluye entre los
finito-dimensionales y se conviene en que
dim({0}) = 0.
5.5.
La dimensión como cardinal mı́nimo de un
sistema generador
Proposición 49 En un espacio de generación finita, todo sistema generador G
cumple que
dim(V) ≤ Card(G).
En el caso en que dim(V) = Card(G), G es una base.
Demostracion:
Si G es un sistema generador, usando la proposición 47, existe una base B
tal que B ⊆ G. Esto prueba que
dim(V) = Card(B) ≤ Card(G).
5.6. Caracterización de la finito-dimensionalidad
79
Si dim(V) = Card(G), la anterior desigualdad se convierte en igualdad lo mismo
que el contenido B ⊆ G, luego G es base.
2
Ası́, la dimensión de V se interpreta como el cardinal mı́nimo de sus sistemas
generadores. Entre ellos, los de cardinal mı́nimo son bases.
5.6.
Caracterización de la finito-dimensionalidad
Proposición 50 Sea V un espacio vectorial sobre IK tal que los cardinales de
los conjuntos libres sean finitos y estén acotados superiormente. Entonces, todo
conjunto libre L de cardinal máximo es una base de V y éste es un espacio de
generación finita.
Demostracion:
Si < L >6= V, existe un vector u 6∈< L > y por el Lema de ampliación de
los conjuntos libres (proposicón 45), también es libre el conjunto L ∪ {u}. Pero
esto nos conduce a la relación
Card(L ∪ {u}) = Card(L) + 1 > Card(L),
que contradice la hipótesis de que Card(L) sea máximo entre los de los conjuntos
libres. Por tanto, < L >= V, y L es una base. Como toda base es sistema
generador y Card(L) es finito, V es de generación finita.
2
Proposición 51 Un espacio vectorial V es de generación finita si y sólo si los
cardinales de sus conjuntos libres son finitos y se encuentran acotados superiormente.
Demostracion:
Si los cardinales de los conjuntos libres son finitos y admiten cota superior,
acabamos de probar (proposición 50) que V es de generación finita.
Si V es de generación finita, del Teorema de Steinitz (proposición 46) se
sigue que los conjuntos libres son de cardinal finito y que dim(V) sirve como
cota superior de dichos cardinales.
2
Esta es una caracterización de la finito-dimensionalidad de los espacios. Negándola,
aparece otra para la infinito-dimensionalidad:
Proposición 52 Un espacio vectorial V es de generación infinita si y sólo si
admite conjuntos libres de cardinal arbitrariamente grande.
5.7.
Obtención de bases a partir de un conjunto
libre
Proposición 53 Si en el espacio V 6= {0} de generación finita tenemos un
conjunto libre
L = {u1 , u2 , . . . , up }
80
Capı́tulo 5. Espacios de Generación Finita
existe un una base B tal que L ⊆ B.
Demostracion:
Sea n = dim(V) y sea G una base. Como G es sistema generador, de acuerdo
con el Teorema de Steinitz, será p ≤ n. Aplicando a L el proceso de Steinitz,
pasamos a otro sistema generador
B = {u1 , u2 , . . . , up , wp+1 , . . . , wn }
que incluye todos los vectores de L y n − p pertenecientes a G. Como su cardinal
coincide con la dimensión, en realidad B es una base y el teorema queda probado.
2
Este resultado se nombra como Método ascendente de obtención de bases.
5.8.
La dimensión como cardinal máximo de un
conjunto libre
Proposición 54 Si L es un conjunto libre en un espacio V de generación finita,
se cumple
Card(L) ≤ dim(V).
En el caso en que Card(L) = dim(V), L es una base.
Demostracion:
Si L es un conjunto libre, existe una base B tal que L ⊆ B (proposición 53).
Esto prueba que
Card(L) ≤ Card(B) = dim(V).
Si Card(L) = dim(V), la anterior desigualdad se convierte en igualdad lo mismo
que el contenido L ⊆ B, luego L es base.
2
Ası́, la dimensión de V se interpreta como el cardinal máximo entre los de los
conjuntos libres. Además, los conjuntos libres de cardinal máximo son bases. Por
otro lado, las proposiciones 49 y 54, aseguran que en un espacio de dimensión
conocida n, para probar que un conjunto de cardinal n es base basta con que
sea bien un sistema generador, bien un conjunto libre.
5.9.
Rango de varios vectores
Independientemente de que V sea finito o infinito-dimensional, dado un conjunto
de vectores
C = {u1 , u2 , . . . , ur }
no vacı́o y de cardinal finito, por propia construcción, el subespacio < C >
será de generación finita. Entonces, tiene sentido definir el rango de los vectores u1 , u2 , . . . , ur como la dimensión de < C >. Se denota como
rang{u1 , u2 , . . . , ur }.
5.10. Coordenadas de un vector en una base
81
Si u1 = u2 = . . . = ur = 0, el rango es 0. En los demás casos, habrá que buscar
una base del susbespacio U =< u1 , u2 , . . . , ur > y podremos hacerlo por uno
de los dos siguientes caminos:
1. Método descendente
Consistirá en aplicar al sistema generador {u1 , u2 , . . . , ur } de U la proposición 47. Una vez obtenida una base de U, de acuerdo con la proposición
49, el rango queda interpretado como la cantidad mı́nima de vectores entresacados de ellos que generan el mismo subespacio que la totalidad.
2. Método ascendente
Se empieza por eliminar los vectores nulos que haya, y se señala uno entre
los no nulos. Salvo reordenación, supongamos que sea el u1 . A continuación
se estudia si cada uno de los restantes es o no combinación lineal de u1 . Los
que lo sean, pueden suprimirse a efectos de generación, y si todos lo son el
método concluye con < u1 > como base de U. Pero si uno, que podemos
renumerar como u2 , no es combinación lineal de u1 , la pareja {u1 , u2 } es
libre. Pasamos a estudiar si los vectores que queden son o no combinación
lineal de u1 y u2 . Se suprimen los que lo sean y si esto ocurre con todos concluye el método con la base < u1 , u2 > para U. Si algún vector,
digamos que u3 , no es combinación de u1 y u2 , el conjunto {u1 , u2 , u3 }
es libre y reiteramos el proceso. Como partimos de una cantidad finita
de vectores, este proceso tiene fin, llegando a una base {u1 , u2 , . . . , up },
donde p ≤ r, de U. Según la proposición 54, el rango se interpreta como
la cantidad máxima de vectores datos que son independientes.
5.10.
Coordenadas de un vector en una base
Proposición 55 Sea V un espacio de dimensión finita n ≥ 1 y sea B un sistema generador de cardinal n. Entonces, B es una base si y sólo si cada vector
x de V se expresa de una sola manera como combinación lineal de los vectores
de B.
Demostracion:
Supongamos que B = {v1 , v2 , . . . , vn }. Si un vector x tuviera dos expresiones
x = x1 v1 + x2 v2 + . . . + xn vn = y1 v1 + y2 v2 + . . . + yn vn ,
como combinación lineal de los vectores de B, se tendrá
(x1 − y1 )v1 + (x2 − y2 )v2 + . . . + (xn − yn )vn = 0.
Si B es base, es libre, luego
x1 − y1 = x2 − y2 = . . . = xn − yn = 0 ⇒ x1 = y1 , x2 = y2 , . . . , xn = yn .
82
Capı́tulo 5. Espacios de Generación Finita
Puesto que para el vector nulo se tiene
0 = 0v1 + 0v2 + . . . + 0vn ,
de cualquier otra relación
a1 v1 + a2 v2 + . . . + an vn = 0
se deduce que
a1 = a2 = . . . = an = 0,
luego B es libre y, por tanto, base.
2
Proposición 56 Siendo B una base de V, para cualesquiera vectores x e y,
ası́ como para cualquier número a ∈ IK, se tiene que
x=
n
X
x i vi , y =
i=1
n
X
yi vi ⇒ x + y =
i=1
n
X
(xi + yi )vi , ax =
i=1
n
X
(axi )vi .
i=1
Demostracion:
Basta aplicar las propiedades de ambas operaciones.
2
Siendo B una base, los n coeficientes x1 , x2 , . . . , xn de la combinación lineal
(única)
x = x1 v1 + x2 v2 + . . . + xn vn ,
reciben el nombre de coordenadas del vector x en la base B. Más en concreto
se habla de primera, segunda, . . . , n-ésima coordenada, según el lugar
que indiquemos. La proposición 56 significa que las coordenadas de una suma
se obtienen sumando lugar a lugar y que las coordenadas de un producto se
obtienen multiplicando el escalar por cada una de ellas.
5.11.
Las deltas de Kronecker
Sea B = {v1 , v2 , . . . , vn } una base de un espacio V. Para cada ı́ndice j, la
igualdad vj = vj indica que las coordenadas de vj en la base B son todas nulas
salvo la de lugar j que vale 1. Utilizando los n2 números
½
1 si i = j
δij =
0 si i 6= j
conocidos como las deltas de Kronecker, se puede escribir
vj =
n
X
i=1
δij vi .
5.12. Espacios de vectores libres
5.12.
83
Espacios de vectores libres
En la recta todo vector libre no nulo es un sistema generador, a la vez que un
conjunto libre, luego se trata de una base. Por ello, la dimensión de la recta vale
1. Todo conjunto de dos o más vectores es ligado.
En el plano, son sistemas generadores todas las parejas de vectores de dirección
distinta, los cuales son linealmente independientes. Formarán una base, luego la
dimensión del plano es 2. Dos vectores de igual dirección serán dependientes y
cualquier conjunto de tres o más vectores planos será ligado.
En el espacio, las ternas de vectores no coplanarios forman sistema generador y
son linealmente independientes. Son una base, por lo cual la dimensión del espacio de vectores libres es 3. Cada terna de vectores coplanarios y cada conjunto
de cuatro o más vectores es ligado.
5.13.
Espacios analı́ticos
Los vectores más sencillos (a parte de la n-upla nula) de un espacio cartesiano
IK n son, sin duda, los
e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1).
De acuerdo con las operaciones de este espacio, se observa que
x = (x1 , x2 , . . . , xn ) = (x1 , 0, . . . , 0) + (0, x2 , . . . , 0) + . . . + (0, 0, . . . , xn ) =
= x1 (1, 0, . . . , 0) + x2 (0, 1, . . . , 0) + . . . + xn (0, 0, . . . , 1) =
= x1 e1 + x2 e2 + . . . + xn en
lo que prueba que constituyen un sistema generador de IK n , y nos confirma que
este espacio es de generación finita. Por otra parte,
a1 e1 + a2 e2 + . . . + an en =
= a1 (1, 0, . . . , 0) + a2 (0, 1, . . . , 0) + . . . + an (0, 0, . . . , 1) =
= (a1 , 0, . . . , 0) + (0, a2 , . . . , 0) + . . . + (0, 0, . . . , an ) =
= (a1 , a2 , . . . , an ) = 0 = (0, 0, . . . , 0) ⇒ a1 = a2 = . . . = an = 0,
es decir, los vectores son independientes, por lo que se trata de un conjunto
libre. Ası́, forman una base, y podemos afirmar que
dim(IK n ) = n.
Por supuesto, hay otras bases del espacio cartesiano, pero la sencillez de ésta,
justifica que la nombremos como la base canónica, dando el mismo adjetivo a
cada uno de sus vectores e1 , e2 , . . . , en . Además, la igualdad x = (x1 , x2 , . . . , xn ) =
x1 e1 + x2 e2 + . . . + xn en , obtenida más arriba indica que las componentes de
una n-upla ordenada coinciden con sus coordenadas en la base canónica.
84
5.14.
Capı́tulo 5. Espacios de Generación Finita
El espacio f de las sucesiones casi nulas
La consideración de los vectores canónicos de los espacios analı́ticos se generaliza
a los espacios de sucesiones IK IN mediante sus elementos
e0 = (1, 0, 0, . . . , 0, . . .)
e1 = (0, 1, 0, . . . , 0, . . .)
e2 = (0, 0, 1, . . . , 0, . . .)
...
en = (0, 0, 0, . . . , 1, . . .)
...,
es decir, sucesiones cuyos infinitos términos son todos nulos, salvo el del lugar
subindicado que lo ocupa el escalar 1, y que llamaremos sucesiones canónicas.
¿Formarán un sistema generador del espacio? La respuesta va a ser que no y
para razonarla empezaremos por observar cuál el susbespacio
< e0 , e1 , e2 , . . . , en , . . . >
generado por ellas. Como sabemos estará formado por todos los resultados de
hacer combinaciones lineales con partes finitas del conjunto generador. Ahora
bien, cada vez que tomemos unas cuantas de estas sucesiones canónicas, comparando una a una sus subı́ndices, encontraremos entre ellas una cuyo lugar,
digamos que p, sea el más avanzado de todos; entonces, en las combinaciones
lineales que hagamos con ellas aparecerán sucesiones cuyos términos, desde el
lugar p + 1 en adelante, sean todos iguales a 0. Esto imposibilita que cualquier
sucesión que tenga infinitos términos no nulos, como ocurre con sucesiones tan
simples como la constante (1, 1, 1, . . . , 1, . . .), pueda pertenecer al subespacio que
generan las sucesiones e0 , e1 , e2 , . . . , en , . . .
Ası́, pues, si bien las n-uplas canónicas sirven para generar el espacio cartesiano,
las sucesiones canónicas no generan la totalidad del espacio de sucesiones.
Precisamente el subespacio propio que generan las sucesiones canónicas aparece
en Análisis, denotándose por cualquiera de los sı́mbolos
f, IK (IN ) .
Sus elementos, por la razón antes señalada de que tendrán todos sus términos
iguales a 0 desde un cierto lugar en adelante, se denominan sucesiones casi
nulas (o nulas salvo una cantidad finita de términos).
Fijado un entero r ≥ 0, pensemos en una relación lineal como la
a0 e0 + a1 e1 + a2 e2 + . . . + ar er = 0.
5.15. Espacios de polinomios
85
Operando se llega a que
(a0 , a1 , a2 , . . . , ar , 0, 0, . . .) = (0, 0, 0, . . . , 0, 0, 0, . . .) ⇒
⇒ a0 = a1 = a2 = . . . = ar = 0,
lo que quiere decir que las sucesiones de {e0 , e1 , e2 , . . . , er } son linealmente
independientes. Si en cualquier otra parte finita del sistema generador de f es
r el lugar más avanzado que aparezca, estará contenida en el anterior conjunto,
por lo que también sus elementos serán independientes. Ası́, queda razonado
que dicho sistema generador es libre y, por tanto, una base.
Nos hemos encontrado, pues, con un primer ejemplo de espacio de dimensión
infinita.
5.15.
Espacios de polinomios
La operatividad de los polinomios pone de manifiesto que cada
p(ξ) = a0 + a1 ξ + a2 ξ 2 + . . . + ar ξ r ,
es combinación lineal de los polinomios 1, ξ, ξ 2 , . . . , ξ r , es decir, de una parte
finita del conjunto
{1, ξ, ξ 2 , . . . , ξ n , . . .},
formado por todos los monomios normalizados o de coeficiente 1. Por tanto,
éste será un sistema generador del espacio vectorial IK[ξ]. Razones obvias justifican que se le nombre como sistema generador canónico del espacio de
polinomios.
Si acotamos los grados y nos quedamos con el conjunto finito
{1, ξ, ξ 2 , . . . , ξ n },
se obtiene un sistema generador del espacio IKn [ξ]. También se adjetivará como
canónico y prueba que cada IKn [ξ] es un espacio de generación finita.
Cualquier parte finita del sistema generador canónico de IK[ξ], puede incluirse en
{1, ξ, ξ 2 , . . . , ξ r } sin más que elegir r como el máximo grado entre sus elementos.
Ahora bien, estos monomios canónicos son linealmente independientes pues una
combinación lineal de 1, ξ, ξ 2 , . . . , ξ r no es sino un polinomio genérico
a0 + a1 ξ + a2 ξ 2 + . . . + ar ξ r
de grado r, el cual, en caso de coincidir con el polinomio nulo, necesariamente tiene nulos todos sus coeficientes. Entonces, son independientes todos los
monomios de cualquier parte finita y queda razonado que {1, ξ, ξ 2 , . . . , ξ n , . . .}
es un conjunto libre.
86
Capı́tulo 5. Espacios de Generación Finita
En resumen, IK[ξ] es un espacio de dimensión infinita con base canónica
{1, ξ, ξ 2 , . . . , ξ n , . . .}.
Sin embargo, para un n ≥ 0 prefijado,
{1, ξ, ξ 2 , . . . , ξ n }
es una base de IKn [ξ], de manera que éste es finito-dimensional y
dim(IKn [ξ]) = n + 1.
5.16.
Complementos / Ejercicios
1. Encontrar una base para los siguientes subespacios de IR3 :
a) A = {(x, y, z)/x = 3t, y = −2t, z = t}.
b) B = {(x, y, z)/2x − y − z = 0}.
c) C = {(x, y, z)/3x − y + 2z = 0}.
d ) B ∩ C.
2. Encontrar una base para los subespacios
a) U =< (1, 4, −2), (2, 1, 2), (−1, 3, −4) >⊆ IR3 .
b) W =< (1, −1, 1, −1), (2, 0, 0, 1), (4, −2, 2, 1), (7, −3, 3, −1) >⊆ IR4 .
3. Aplicar el método descendente para calcular el rango y una base del subespacio que generan los vectores del espacio (Z/5Z)3
(2, 1, 2), (−1, 3, −4), (1, 4, −2)
4. Rango y una base del subespacio generado en IR5 por los vectores
u1 = (5, 3, 0, 2, 1), u2 = (11, 2, 0, 4, −1), u3 = (7, 18, 0, 4, 11),
u4 = (2, 2, 0, −2, 0), u5 = (3, 21, 0, 0, 13).
5. Calcular el rango de los siguientes sistemas de vectores de IR4 , ası́ como
una base del subespacio que generan:
a) {(2, −1, 3, 2), (0, 2, −1, 1), (4, 0, 5, 5, ), (2, 7, −1, 6)}
b) {(1, 0, 1, 0), (2, 1, 0, −1), (−1, 2, 1, 0), (2, 3, 2, −1), (4, −1, 0, −1)}
5.16. Complementos / Ejercicios
87
6. Sea IK un cuerpo conmutativo, sea V un espacio vectorial sobre IK, sea
{u1 , u2 , . . . , ur }, con r ≥ 2, un conjunto finito de vectores de V. Razonar
que su rango es invariante por operaciones elementales. Aplı́quese esto
para calcular el rango y una base del subespacio de IR4 generado por
(0, 1, 2, −1), (2, −3, 4, 5), (1, 0, 4, 1), (1, −3, 0, 4), (1, −1, 3, 2)
7. Encontrar una base para el espacio generado por el siguiente conjunto de
vectores del espacio (Z/7Z)4 :
{(1, −1, 1, −1), (0, 2, −2, 0), (4, −2, 2, 1), (1, −3, 3, −1)}.
8. Calcular, según los valores de α, β, γ, el rango del siguiente conjunto de
vectores de IR3 :
S = {(1, −1, 0), (2, 1, α), (3, 0, β), (1, γ, 1)}.
9. Determinar si el conjunto de polinomios dados es una base para el espacio
vectorial V indicado:
a) {1 − ξ 2 , ξ}. V = IR2 [ξ].
b) {ξ, 1 + ξ 2 , ξ 2 − 5}. V = IR2 [ξ].
c) {ξ 2 − 1, ξ 2 − 2, ξ 2 − 3}. V = IR2 [ξ]
d ) {1, 1 + 2ξ + ξ 2 , 1 − ξ 3 , 1 + ξ 3 }. V = IR3 [ξ]
e) {3, ξ 3 − 4ξ + 6, ξ 2 }. V = IR3 [ξ]
f ) {1, 1 + ξ, 1 + ξ 2 , 1 + ξ 3 }. V = IR3 [ξ]
10. Sea a ∈ IR un número fijo. Comprobar que
n
{1, ξ − a,
(ξ − a)2
(ξ − a)
,...,
},
2!
n!
es una base de IRn [ξ]. (Este tipo de bases se llaman bases de Taylor).
11. Consideremos únicamente el grupo aditivo del cuerpo algebraico
√
√
Q( 2) = {x + y 2/x, y ∈ Q}.
Si agregamos la operación externa
√
√
√
√
Q × Q( 2) → Q( 2), de ley a(x + y 2) = (ax) + (ay) 2,
√
se comprueba que Q( 2) se convierte en un espacio vectorial sobre Q.
Cuál es su dimensión y su base canónica?
88
Capı́tulo 5. Espacios de Generación Finita
12. Sea V un espacio vectorial complejo. Si la operación externa la efectuamos
únicamente con escalares reales, V se convierte en un nuevo espacio vectorial, ahora sobre el cuerpo IR. Si V, como espacio complejo, tiene dimensión n, ¿qué dimensión tiene como espacio real?
89
Capı́tulo 6
Aplicaciones Lineales
6.1.
Definición de aplicación lineal
Sea IK un cuerpo conmutativo y sean V y V0 dos espacios vectoriales sobre un
mismo cuerpo conmutativo IK. Una aplicación f : V → V0 recibe el nombre de
aplicación lineal o morfismo lineal cuando
1. ∀x, y ∈ V ⇒ f (x + y) = f (x) + f (y).
2. ∀a ∈ IK, ∀x ∈ V ⇒ f (ax) = af (x).
Siendo f una aplicación lineal, adoptaremos la siguiente terminologı́a:
monomorfismo lineal si f es inyectiva,
epimorfismo lineal si f es suprayectiva,
isomorfismo lineal si f es biyectiva,
endomorfismo lineal de V cuando V0 = V,
automorfismo lineal de V cuando V0 = V y f es isomorfismo lineal,
forma lineal en V cuando f : V → IK.
Por la primera condición, todo morfismo lineal es un morfismo de los grupos
aditivos de V y V0 , con lo cual indica que f es compatible con las operaciones
internas. La segunda propiedad manifiesta que esta compatibilidad se mantiene
para las leyes externas de ambos espacios.
90
Capı́tulo 6. Aplicaciones Lineales
6.2.
Propiedades
Proposición 57 Sea f : V → V0 un morfismo lineal. Entonces,
1. f (0) = 0.
2. ∀x ∈ V ⇒ f (−x) = −f (x).
3. ∀x, y ∈ V ⇒ f (x − y) = f (x) − f (y).
Demostracion:
Es la misma que en morfismos de grupos.
2
Proposición 58 Una aplicación f : V → V0 entre espacios vectoriales sobre
IK es lineal si y sólo si
∀a ∈ IK, ∀x, y ∈ V ⇒ f (ax + by) = af (x) + bf (y).
Demostracion:
Si f es lineal, se tiene
f (ax + by) = f (ax) + f (by) = af (x) + bf (y).
Si f verifica la condición del enunciado, basta adaptarla al caso a = b = 1
para obtener la primera condición de linealidad; aplicándola con a arbitrario y
b = 0, se tiene la segunda.
2
Proposición 59 Una aplicación f : V → V0 entre espacios vectoriales es un
morfismo lineal si y sólo si, para todo entero r ≥ 1 y cualesquiera a1 , a2 , . . . , ar ∈
IK, u1 , u2 , . . . , ur ∈ V, se cumple que
f (a1 u1 + a2 u2 + . . . + ar ur ) = a1 f (u1 ) + a2 f (u2 ) + . . . + ar f (ur ),
Demostracion:
Si se cumple esta condición, en particular se cumplirá que
f (ax + by) = af (x) + bf (y),
luego, según la proposición 58, f es lineal.
Razonemos por recurrencia en r:
1. Si r = 1, por la segunda condición de linealidad, se tiene
f (au) = af (u).
6.3. Imagen y núcleo de una aplicación lineal
91
2. Supuesto que la fórmula se cumpla para r sumandos, se tiene
f (a1 u1 + a2 u2 + . . . + ar ur + ar+1 ur+1 ) =
= f ((a1 u1 + a2 u2 + . . . + ar ur ) + ar+1 ur+1 ) =
= f (a1 u1 + a2 u2 + . . . + ar ur ) + f (ar+1 ur+1 ) =
= (a1 f (u1 ) + a2 f (u2 ) + . . . + ar f (ur )) + ar+1 f (ur+1 ) =
= a1 f (u1 ) + a2 f (u2 ) + . . . + ar f (ur ) + ar+1 f (ur+1 ).
2
Ası́, las aplicaciones lineales se confunden con las que conservan las combinaciones lineales.
6.3.
Imagen y núcleo de una aplicación lineal
Proposición 60 Sea f : V → V0 un morfismo lineal y sea U ≤ V. Entonces,
f (U) ≤ V0 .
Demostracion:
Sean a ∈ IK, x0 , y0 ∈ f (U). Puesto que existen vectores x, y ∈ U tales que
f (x) = x0 , f (y) = y0 , se tiene
x + y ∈ U ⇒ x0 + y0 = f (x) + f (y) = f (x + y) ∈ f (U),
ax ∈ U ⇒ ax0 = af (x) = f (ax) ∈ f (U).
Tomando, en particular, U = V, resulta que
Imf = {f (x)/x ∈ V}
es un subespacio de V0 . Se conoce como imagen de la aplicación lineal f .
2
Proposición 61 Una aplicación lineal f : V → V0 es un epimorfismo si y sólo
si
Imf = V0 .
Demostracion:
Basta aplicar la definición conjuntista de Im f .
2
Proposición 62 Sea f : V → V0 un morfismo lineal y sea U0 ≤ V0 . Entonces,
f −1 (U0 ) ≤ V.
92
Capı́tulo 6. Aplicaciones Lineales
Demostracion:
Sean a ∈ IK, x, y ∈ f −1 (U0 ). Puesto que f (x), f (y) ∈ U0 , se tiene
f (x) + f (y) ∈ U0 ⇒ f (x + y) = f (x) + f (y) ∈ U0 ⇒ x + y ∈ f −1 (U0 ),
af (x) ∈ U0 ⇒ f (ax) = af (x) ∈ U0 ⇒ ax ∈ f −1 (U0 ).
Tomando, en particular, el subespacio nulo U0 = {0} de V0 , resulta que
f −1 (0) = {x ∈ V/f (x) = 0} = Ker f
es un subespacio de V. Se conoce como núcleo de la aplicación lineal f .
2
Proposición 63 Un morfismo f : V → V0 es un monomorfismo si y sólo si
Ker f = {0}.
Demostracion:
Sea f inyectiva. Entonces,
x ∈ Ker f ⇒ f (x) = 0 = f (0) ⇒ x = 0 ⇒ Ker f = {0}.
Si Ker f = {0}, se tiene
f (x) = f (y) ⇒ f (x)−f (y) = f (x − y) = 0 ⇒ x − y ∈ Ker f ⇒
⇒ x − y = 0 ⇒ x = y,
luego f es inyectiva.
2
Proposición 64 Un morfismo lineal f : V → V0 es biyectivo si y sólo si
Im f = V0 , Ker f = {0}.
Demostracion:
Basta aplicar conjuntamente las proposiciones 61 y 63.
6.4.
2
Linealidad y generación
Proposición 65 Sea f : V → V0 una aplicación lineal. Si G es un sistema
generador de V, entonces f (G) es un sistema generador del subespacio Im f de
V0 .
6.5. Linealidad y dependencia
93
Demostracion:
Por hipótesis, todo vector x de V se escribe como
x = a1 u1 + a2 u2 + . . . + ar ur , con u1 , u2 , . . . , ur ∈ G.
Entonces, como f conserva las combinaciones lineales, se tiene
f (x) = a1 f (u1 ) + a2 f (u2 ) + . . . + ar f (ur ),
donde
f (u1 ), f (u2 ), . . . , f (ur ) ∈ f (G),
luego f (G) genera a Im f .
2
El cardinal de f (G) será menor o igual que el de G, luego si V fuese de generación
finita, después de este resultado, Im f también lo será.
Si f fuese un epimorfismo, f (G) genera a V0 . Por tanto, un epimorfismo que
empiece en un espacio de generación finita no puede acabar sino en otro también
de generación finita.
6.5.
Linealidad y dependencia
Proposición 66 Sea f : V → V0 un morfismo lineal. Entonces,
1. f conserva la dependencia lineal,
2. f conserva la independencia lineal si y sólo si es inyectiva.
Demostracion:
1. Si varios vectores son dependientes, uno de ellos es combinación lineal de
los restantes. Su imagen será combinación de las imágenes de los otros,
luego los vectores transformados son dependientes.
2. Sean u1 , u2 , . . . , ur ∈ V vectores independientes. De una relación
a1 f (u1 ) + a2 f (u2 ) + . . . + ar f (ur ) = 0
se pasa, aplicando la linealidad, a la
f (a1 u1 + a2 u2 + . . . + ar ur ) = 0.
luego a1 u1 + a2 u2 + . . . + ar ur ∈ Ker f . Si f es inyectiva, se tratará del
vector nulo. Pero de
a1 u1 + a2 u2 + . . . + ar ur = 0,
se obtiene a1 = a2 = . . . = ar = 0, luego los vectores imagen vuelven a
ser independientes. Supongamos ahora que f conserva la independencia
lineal: tomando en V un vector u 6= 0, por sı́ solo es independiente, luego
f (u) lo será y por ello no podrá ser nulo. De aquı́ se sigue que Ker f = {0},
luego f es inyectiva.
94
Capı́tulo 6. Aplicaciones Lineales
2
Este teorema indica que los morfismos lineales cambian conjuntos ligados en
conjuntos ligados, pero en general los conjuntos libres no tendrán por qué cambiarse en otros libres: lo harán si y sólo si f es un monomorfismo.
6.6.
Linealidad y bases
Puesto que en general la independencia lineal no se conserva en una aplicación
lineal, una base no se cambia en otra base. Sin embargo:
Proposición 67 Sea f : V → V0 un monomorfismo lineal. Si B es una base
de V, entonces f (B) es una base del subespacio Im f de V0 .
Demostracion:
Por ser lineal, f (B) genera a Im f (proposición 65). Por ser inyectiva, f (B)
es libre (proposición 66). De ambos hechos se obtiene que f (B) es una base de
la imagen.
2
Proposición 68 Sea f : V → V0 un isomorfismo lineal. Si B es una base de
V, f (B) es una base de V0 .
Demostracion:
Por ser suprayectiva es Imf = V0 . Como, además es monomorfismo, basta
aplicar lo anterior.
2
6.7.
Composición e inversión de aplicaciones lineales
Proposición 69 Dados tres espacios V, V0 y V00 sobre IK y dadas dos aplicaciones lineales f : V → V0 , g : V0 → V00 , la aplicación compuesta g ◦ f :
V → V00 es lineal. En cada V, la identidad I es lineal. Dado un morfismo lineal
biyectivo f : V → V0 , su inversa f −1 : V0 → V es lineal.
Demostracion:
1. Si a ∈ IK, x, y ∈ V, se tiene
(g ◦ f )(x + y) = g(f (x + y)) = g(f (x) + f (y)) =
= g(f (x)) + g(f (y)) = (g ◦ f )(x) + (g ◦ f )(y),
(g ◦ f )(ax) = g(f (ax)) = g(af (x)) = ag(f (x)) = a(g ◦ f )(x),
I(x + y) = x + y = I(x) + I(y),
I(ax) = ax = aI(x),
con lo que se prueban las dos primeras afirmaciones
6.8. Isomorfı́a de espacios vectoriales. Espacios abstractos
95
2. Dados a ∈ IK, x0 , y0 ∈ V0 , puesto que existen vectores x, y ∈ V tales que
f (x) = x0 , f (y) = y0 , se tiene
f −1 (x0 + y0 ) = f −1 (f (x) + f (y)) = f −1 (f (x + y)) =
= x + y = f −1 (x0 ) + f −1 (y0 ),
f −1 (ax0 ) = f −1 (af (x)) = f −1 (f (ax)) = ax = af −1 (x0 ),
lo que demuestra la última afirmación.
2
Proposición 70 La compuesta de dos isomorfismos lineales es otro isomorfismo lineal. En cada espacio, la identidad es un automorfismo lineal. La inversa
de un isomorfismo lineal es otro isomorfismo lineal.
Demostracion:
Basta aplicar la proposición anterior y recordar que la compuesta de dos
aplicaciones biyectivas es biyectiva, que la identidad es biyectiva y que la inversa
de una biyectiva es biyectiva.
2
6.8.
Isomorfı́a de espacios vectoriales. Espacios
abstractos
Dados dos espacios vectoriales V y V0 sobre el mismo cuerpo conmutativo
IK, se dice que V es isomorfo a V0 siempre que exista un isomorfismo lineal
f : V → V0 . Esta relación se denotará como
V ≃ V0 .
Proposición 71 La isomorfı́a entre espacios posee las propiedades
(Refexiva) Todo espacio V cumple V ≃ V.
(Simétrica) Si V ≃ V0 , también V0 ≃ V.
(Transitiva) Si V ≃ V0 y V0 ≃ V00 , se tiene V ≃ V00 .
Demostracion:
La reflexividad en cada espacio V la establece su identidad I. Para cada
isomorfismo f : V → V0 , la simetrı́a se consigue con f −1 : V0 → V. Para
dos isomorfismos f : V → V0 , g : V0 → V00 , la transitividad se obtiene con
g ◦ f : V → V00 .
2
La isomorfı́a permite clasificar los espacios sobre un mismo cuerpo IK, poniendo
en cada clase un espacio y todos los isomorfos con él. Ya hemos señalado que todo
morfismo lo que hace es establecer una compatibilidad entre las dos operaciones
96
Capı́tulo 6. Aplicaciones Lineales
de los espacios vectoriales. Si además hay una biyección entre los conjuntos, lo
que concluı́mos es que un espacio isomorfo a otro lo que hace es presentar de
otra manera concreta las operaciones del primero, o si se quiere que las parejas
de operaciones concretas de ambos son igualables en abstracto. Por eso, cada
clase de isomorfı́a se nombra como un espacio vectorial abstracto sobre
IK. Cada uno de los espacios de la clase son modelos concretos o copias del
mismo.
6.9.
El isomorfismo de Descartes
Sea IK un cuerpo conmutativo, V un espacio vectorial de dimensión finita n ≥ 1
sobre IK y B = {v1 , v2 , . . . , vn } una base de V. Las n coordenadas de un vector
x respecto de B, colocadas en su orden natural, constituyen una n-upla ordenada (x1 , x2 , . . . , xn ) o elemento del espacio cartesiano IK n . Como son únicas
(proposición 55), la correspondencia
x=
n
X
xi vi 7→ d(x) = (x1 , x2 , . . . , xn ),
i=1
es una aplicación d : V → IK n .
Proposición 72 La anterior aplicación
d(x) = (x1 , x2 , . . . , xn )
es un isomorfismo de V sobre IK n . Para cada j ∈ [1, n] se cumple
d(vj ) = ej .
Demostracion:
La linealidad se sigue de la proposición 56 y de las reglas de operar en IK n :
d(x + y) = (x1 + y1 , x2 + y2 , . . . , xn + yn ) =
= (x1 , x2 , . . . , xn ) + (y1 , y2 , . . . , yn ) = d(x) + d(y),
d(ax) = (ax1 , ax2 , . . . , axn ) = a(x1 , x2 , . . . , xn ) = ad(x).
Si x ∈ Ker d, se tiene
d(x) = (x1 , x2 , . . . , xn ) = 0 = (0, 0, . . . , 0) ⇒ x1 = x2 = . . . = xn = 0 ⇒
⇒ x = 0v1 + 0v2 + . . . + 0vn = 0,
luego d es inyectiva. También es suprayectiva, pues tomada la n-upla (x1 , x2 , . . . , xn )
como dato, el vector x = x1 v1 + x2 v2 + . . . + xn vn se aplica en ella mediante
d. Finalmente, la igualdad vj = vj expresa a vj como una combinación lineal
6.10. Isomorfı́a y dimensión
97
en B en la cual los coeficientes son nulos salvo el lugar j que vale 1. Esto es lo
mismo que escribir d(vj ) = ej .
2
La aplicación d recibe el nombre de isomorfismo de Descartes del espacio
n-dimensional V sobre IK n respecto de la base B = {v1 , v2 , . . . , vn }.
Si no hay lugar a confusión en la referencia a la base B, suele usarse la escritura
x = d(x) = (x1 , x2 , . . . , xn )
para indicar las coordenadas de x dicha base.
6.10.
Isomorfı́a y dimensión
Proposición 73 Sea f : V → V0 un isomorfismo lineal. Si V es de dimensión
finita, V0 también lo es y se cumple que dim(V0 ) = dim(V).
Demostracion:
Si B es una base de V, f (B) lo es de V0 (proposición 68). Como f es biyectiva,
sus cardinales coinciden.
2
Proposición 74 Si V es un espacio vectorial de dimensión finita n ≥ 1 sobre
un cuerpo conmutativo IK, V es isomorfo al espacio IK n .
Demostracion:
Basta fijar una base B en V y usar el isomorfismo de Descartes.
2
Proposición 75 Dos espacios sobre IK que tengan igual dimensión n, son isomorfos.
Demostracion:
Puesto que ambos son isomorfos a IK n , basta aplicar las propiedades simétrica y transitiva de la isomorfı́a.
2
Proposición 76 Dos espacios sobre un mismo cuerpo conmutativo son isomorfos si y sólo si sus dimensiones coinciden.
Demostracion:
Basta unir las proposiciones 73 y 75.
2
En resumen, para cada cuerpo IK y cada dimensión finita n ≥ 1 habrá un solo
espacio vectorial abstracto. Su modelo más simple es el espacio cartesiano IK n .
98
6.11.
Capı́tulo 6. Aplicaciones Lineales
Igualación de los espacios f y IR[ξ]
El hecho de que dos espacios de igual dimensión sean isomorfos (proposición
75) sigue siendo válido para dimensiones infinitas. Aunque no hagamos la demostración, procede mostrar un ejemplo.
Las bases canónicas
{e0 , e1 , e2 , . . . , en , . . .} y {1, ξ, ξ 2 , . . . , ξ n , . . .}
de los espacios f y IR[ξ] son ambas de cardinal infinito-numerable (es decir, el
cardinal de IN ). Entonces, los dos espacios son de igual dimensión y debieran ser
isomorfos. En efecto, dada una sucesión casi nula x = (x0 , x1 , x2 , . . . , xn , . . .), si
p es el lugar más avanzado donde aparece un término no nulo, la correspondencia
x 7→ x0 + x1 ξ + x2 ξ 2 + . . . + xp ξ p
es una aplicación biyectiva y lineal de f sobre IR[ξ], luego f ≃ IR[ξ].
6.12.
Isomorfı́a y rango
Proposición 77 Sea f : V → V0 un isomorfismo lineal. Dados varios vectores
u1 , u2 , . . . , ur ∈ V, se cumple que
rang{f (u1 ), f (u2 ), . . . , f (ur )} = rang{u1 , u2 , . . . , ur }.
Demostracion:
La restricción de f al subespacio U =< u1 , u2 , . . . , ur > se convierte en un
isomorfismo de U sobre f (U), luego
rang{f (u1 ), f (u2 ), . . . , f (ur )} = dim(f (U)) =
= dim(U) = rang{u1 , u2 , . . . , ur }.
2
6.13.
El grupo lineal de un espacio vectorial
Para cada espacio V sobre IK, sea GL(V, IK) el conjunto de sus automorfismos
lineales.
Proposición 78 GL(V, IK) es un subgrupo del grupo (S(V), ◦) de las aplicaciones biyectivas de V sobre sı́ mismo.
6.14. Espacios de aplicaciones lineales
99
Demostracion:
Tomando V = V0 = V00 en la composición de dos isomorfismos, tenemos que
la composición de dos automorfismos de V es otro automorfismo. La identidad
I (neutro en el grupo S(V)) es un automorfismo de V. Como f −1 es un isomorfismo si f lo es, tomando V = V0 , se obtiene que el inverso de un automorfismo
de V es otro automorfismo.
2
Se conoce como grupo lineal (general) del espacio vectorial V. Sus elementos se nombran también como transformaciones lineales de V.
6.14.
Espacios de aplicaciones lineales
Fijados dos espacios V y V0 sobre IK, en el conjunto
AL(V, V0 , IK) = {f : V → V0 /f es lineal}
se establecen operaciones de la siguiente manera:
a) Dadas f, g ∈ AL(V, V0 , IK), se define f + g como la aplicación
(f + g)(x) = f (x) + g(x), ∀x ∈ V.
b) Dados α ∈ IK, f ∈ AL(V, V0 , IK), se define αf como la aplicación
(αf )(x) = αf (x), ∀x ∈ V.
Siempre cabe considerar una aplicación f0 : V → V0 definida por la ley
f0 (x) = 0, ∀x ∈ V,
igual que, dada f ∈ AL(V, V0 , IK), podemos definir −f como la aplicación
(−f )(x) = −f (x), ∀x ∈ V.
Proposición 79 Dados f, g ∈ AL(V, V0 , IK), α ∈ IK, se tiene que
f + g, f0 , −f, αf
son lineales, ası́ como que
f + f0 = f = f0 + f, f + (−f ) = f0 = (−f ) + f.
Demostracion:
Sean a ∈ IK, x, y ∈ V. Entonces,
100
Capı́tulo 6. Aplicaciones Lineales
1. (f + g)(x + y) = f (x + y) + g(x + y) =
= (f (x) + f (y)) + (g(x) + g(y)) = (f (x) + g(x)) + (f (y) + g(y)) =
= (f + g)(x) + (f + g)(y),
(f + g)(ax) = f (ax) + g(ax) = af (x) + ag(x) = a(f (x) + g(x)) =
= a(f + g)(x).
2. f0 (x + y) = 0 = 0 + 0 = f0 (x) + f0 (y),
f0 (ax) = 0 = a0 = af0 (x).
3. (−f )(x + y) = −f (x + y) = −(f (x) + f (y)) = (−f (x)) + (−f (y)) =
= (−f )(x) + (−f )(y),
(−f )(ax) = −f (ax) = −(af (x)) = a(−f (x)) = a(−f )(x).
4. (αf )(x + y) = αf (x + y) = α(f (x) + f (y)) = αf (x) + αf (y) =
= (αf )(x) + (αf )(y),
(αf )(ax) = αf (ax) = α(af (x)) = (αa)f (x) = (aα)f (x) =
= a(αf (x)) = a(αf )(x).
5. (f + f0 )(x) = f (x) + f0 (x) = f (x) + 0 = f (x) =
= 0 + f (x) = f0 (x) + f (x) = (f0 + f )(x) ⇒ f + f0 = f = f0 + f.
6. (f + (−f ))(x) = f (x) + (−f )(x) = f (x) + (−f (x)) = f (x) − f (x) =
= 0 = f0 (x) = 0 = −f (x) + f (x) = (−f )(x) + f (x) = ((−f ) + f )(x) ⇒
⇒ f + (−f ) = f0 = (−f ) + f.
2
Ası́ hemos definido una adición de aplicaciones lineales. En lo sucesivo f +g
se llamará la aplicación lineal suma de f y g. Esta operación admite como
neutro a la aplicación f0 que llamaremos aplicación lineal nula. Para cada f
lineal, −f sirve de simétrica de f , por lo que la nombraremos como la aplicación
lineal opuesta de la f . Finalmente, queda definida una multiplicación de
escalares por aplicaciones lineales, de manera que αf se llamará producto
de α por f .
Aplicando los dos miembros de cada igualdad a un vector genérico de V y,
usando la respectiva propiedad en los vectores de V0 , se comprueba que, cualesquiera que sean los datos f, g, h ∈ AL(V, V0 , IK) y α, β ∈ IK, son ciertas las
propiedades
(f + g) + h = f + (g + h), f + g = g + f,
6.15. Otras propiedades de la composición
101
1f = f, (αβ)f = α(βf ),
(α + β)f = αf + βf, α(f + g) = αf + αg.
Con esta observación, lo que queda probado es que AL(V, V0 , IK) es un nuevo
espacio vectorial sobre IK.
Un caso particular de interés lo constituye el espacio AL(V, IK, IK), formado
por las formas lineales σ : V → IK. Este espacio se conoce como el dual de V
y se denota como V∗ . Será estudiado en detalle más adelante.
6.15.
Otras propiedades de la composición
Proposición 80 La composición de morfismos lineales cumple las propiedades
siguientes:
(Asociativa) : f : V → V0 , g : V0 → V00 , h : V00 → V000 ⇒ h ◦ (g ◦ f ) =
(h ◦ g) ◦ f.
(Distributiva) f : V → V0 , g, h : V0 → V00 ⇒ (g + h) ◦ f = g ◦ f + h ◦ f.
f, g : V → V0 , h : V0 → V00 ⇒ h ◦ (f + g) = h ◦ f + h ◦ g.
(De neutralidad) f : V → V0 ⇒ f ◦ IV = f = IV 0 ◦ f.
(Asociativa mixta) f : V → V0 , g : V0 → V00 , a ∈ IK ⇒ (ag) ◦ f = a(g ◦ f ) =
g ◦ (af ).
Demostracion:
a) La asociativa se cumple en cualquier composición. Para las demás igualdades,
basta probar que sus dos miembros hacen el mismo efecto sobre un vector
genérico x ∈ V:
b) ((g + h) ◦ f )(x) = (g + h)(f (x)) = g(f (x)) + h(f (x)) =
= (g ◦ f )(x) + (h ◦ f )(x) = (g ◦ f + h ◦ f )(x),
(h ◦ (f + g))(x) = h((f + g)(x)) = h(f (x) + g(x)) =
= h(f (x)) + h(g(x)) = (h ◦ f )(x) + (h ◦ g)(x) = (h ◦ f + h ◦ g)(x).
(f ◦ IV )(x) = f (IV (x)) = f (x) = IV 0 (f (x)) = (IV 0 ◦ f )(x).
((ag) ◦ f )(x) = (ag)(f (x)) = ag(f (x)) = a(g ◦ f )(x) =
= (a(g ◦ f ))(x) = (g ◦ f )(ax) = g(f (ax)) =
= g(af (x)) = g((af )(x)) = (g ◦ (af ))(x).
2
La propiedad conmutativa no siempre es planteable y, cuando lo es, no tiene por
qué cumplirse.
102
6.16.
Capı́tulo 6. Aplicaciones Lineales
El álgebra de los endomorfismos de un espacio
Los elementos de AL(V, V, IK) son los endomorfismos de V. Por tal razón, este
espacio suele denotarse como
End(V, IK).
Proposición 81 La composición es una operación interna de End(V, IK).
Demostracion:
Dados f, g ∈ End(V, IK), g ◦ f es lineal porque f y g lo son, y empieza y
acaba en V porque f y g lo hacen.
2
Proposición 82 Si a la estructura vectorial de End(V, IK) le añadimos la operación de composición de endomorfismos, resulta un álgebra asociativa. Excluı́do
el espacio V = {0}, este algebra es unitaria.
Demostracion:
Basta adaptar las propiedades de la proposición 79. Como neutro actúa el
automorfismo I, distinto de f0 siempre que V 6= {0}.
2
Los elementos invertibles de este álgebra son los automorfismos de V. O sea, su
grupo multiplicativo es el ya conocido grupo lineal GL(V, IK).
En general, los endomorfismos no conmutan. Si una pareja f, g ∈ End(V, IK)
cumple g ◦ f = f ◦ g, se dirá que f y g son permutables entre sı́.
6.17.
Homotecias vectoriales
Dado un escalar µ , el endomorfismo lineal Hµ = µI se conoce como homotecia
vectorial de razón µ. Aplicada a un vector, se tendrá
Hµ (x) = (µI)(x) = µI(x) = µx,
es decir, las homotecias cambian cada vector en otro proporcional a él según un
factor fijo y son los endomorfismos más sencillos del espacio V. La homotecia
de razón 0 es el endomorfismo f0 , mientras que la de razón 1 es el automorfismo
I. Denotaremos por
H(V, IK) y H∗ (V, IK),
respectivamente, el conjunto de todas las homotecias y el de las homotecias de
razón no nula.
6.17. Homotecias vectoriales
103
Proposición 83 Dado un espacio V 6= {0}, la aplicación
H : IK → End(V, IK), de ley µ → Hµ ,
es un monomorfismo de anillos.
Demostracion:
1. Hµ1 = (µ1 + µ2 )I = µ1 I + µ2 I = Hµ1 + Hµ2 .
2. Hµ1 = (µ1 µ2 )I = (µ2 I) ◦ (µ1 I) = Hµ2 ◦ Hµ1 .
3. Por ser V 6= {0}, sabemos que I 6= f0 . Entonces,
Hµ = I ⇒ µI = I ⇒ (µ−1)I = f0 ⇒ µ−1 = 0 ⇒ µ = 1 ⇒ Ker H = {1}.
2
Proposición 84 Dado un espacio V 6= {0}, el conjunto H(V, IK) es un subcuerpo conmutativo del anillo End(V, IK), isomorfo a IK. El conjunto H∗ (V, IK)
es un subgrupo abeliano del grupo GL(V, IK), isomorfo al grupo IK ∗ .
Demostracion:
En la anterior proposición se tiene
ImH = H(V, IK), H(IK ∗ ) = H∗ (V, IK),
de manera que el monomorfismo H establece los isomorfismos
IK ≃ H(V, IK), IK ∗ ≃ H∗ (V, IK),
que hacen de H(V, IK) un cuerpo y de H∗ (V, IK) un grupo, ambos conmutativos.
2
De estos isomorfismos se sigue que
1. la suma de dos homotecias es otra homotecia con razón la suma de sus
razones.
2. la composición de dos homotecias es otra homotecia y su razón es el producto de las razones.
3. las homotecias no nulas son automorfismos y se cumple
(Hµ )−1 = Hµ−1
Proposición 85 Las homotecias permutan con cualquier endomorfismo de V.
Las de razón no nula permutan con cualquier automorfismo de V.
104
Capı́tulo 6. Aplicaciones Lineales
Demostracion:
Si f es un endomorfismo cualquiera, se tiene
Hµ ◦ f = (µI) ◦ f = µ(I ◦ f ) = µ(f ◦ I) = f ◦ (µI) = f ◦ Hµ .
La segunda afirmación es una particularización de la primera.
2
Aunque no hagamos aquı́ la demostración, también es cierto el enunciado recı́proco: un endomorfismo que permuta con cualquier otro es una homotecia; un automorfismo que permuta con los demás es una homotecia de razón no nula.
Proposición 86 El conjunto H∗ (V, IK) es un subgrupo normal de GL(V, IK).
Demostracion:
Tomando un automorfismo f y un número µ 6= 0, de la conmutación de f
con Hµ se sigue que
f ◦ Hµ ◦ f −1 = Hµ ◦ f ◦ f −1 = Hµ ◦ I = Hµ ∈ H∗ (V, IK).
2
Proposición 87 Sea Hµ una homotecia de razón no nula. Sea U un subespacio
vectorial de V. Entonces, Hµ (U) = U.
Demostracion:
Si x ∈ U, también Hµ (x) = µx ∈ U. Esto significa que Hµ (U) ⊆ U. Por
otra parte, dado y ∈ U, el vector x = µ−1 y cumple
Hµ (x) = µ(µ−1 )y = (µµ−1 )y = 1y = y,
luego U ⊆ Hµ (U). De ambos contenidos, se tiene la igualdad.
6.18.
2
Subespacios invariantes por un endomorfismo
Sean f un endomorfismo y U un subespacio de un espacio vectorial V. Se dice
que U es f -invariante (o invariante por f ) si
∀x ∈ U ⇒ f (x) ∈ U.
Entonces, la restricción de f a U se convierte en un endomorfismo de U.
En las homotecias de razón no nula, todo subespacio es invariante (proposición
87). Para todo f , los subespacios impropios {0} y V siempre son invariantes.
Hay otros:
6.18. Subespacios invariantes por un endomorfismo
105
Proposición 88 Dado un endomorfismo f de V los subespacios Im f y Ker f
son invariantes por f .
Demostracion:
a) Como todo f (x) está en Im f , en particular, lo estará cuando se tome x en
Im f , luego f (Im f ) ⊆ Im f .
b) Por definición de Ker f , se tiene f (Ker f ) = {0} ⊆ Ker f .
2
Proposición 89 Si U y W son subespacios f -invariantes, también lo son los
subespacios U + W y U ∩ W.
Demostracion:
1. Si x = u + w ∈ U + W, se tiene
¾
u ∈ U ⇒ f (u) ∈ U
⇒ f (u) + f (w) = f (u + w) = f (x) ∈ U + W.
w ∈ W ⇒ f (w) ∈ W
2. Si x ∈ U ∩ W, también f (x) ∈ U ∩ W porque f (x) ∈ U y f (x) ∈ W.
2
Proposición 90 Sean f y g dos endomorfismos, sea a ∈ IK. Si un subespacio
U es invariante por f y g, también lo es mediante
f + g, af, g ◦ f.
Demostracion:
Sea x ∈ U. Entonces,
1. (f + g)(x) = f (x) + g(x) ∈ U porque cada sumando está en U.
2. (af )(x) = af (x) ∈ U porque f (x) ∈ U.
3. (g ◦ f )(x) = g(f (x)) ∈ U porque
x ∈ U ⇒ f (x) ∈ U, f (x) ∈ U ⇒ g(f (x)) ∈ U.
2
106
Capı́tulo 6. Aplicaciones Lineales
6.19.
Vectores dobles
Un vector x ∈ V se dice vector doble o fijo mediante un endomorfismo f de
V cuando
f (x) = x.
El conjunto de todos los vectores dobles lo denotamos como D y no es vacı́o
pues en todo caso 0 ∈ D. A veces ocurre que D = {0}, por ejemplo en las
homotecias de razón µ 6= 1, ya que
µx = x ⇒ (µ − 1)x = 0 ⇒ x = 0.
En cualquier caso, se tiene que
Proposición 91 El conjunto D de vectores dobles mediante un endomorfismo
f de V es un subespacio vectorial, invariante por f .
Demostracion:
Puesto que
f (x) = x ⇔ 0 = f (x) − x = f (x) − I(x) = (f − I)(x) ⇔ x ∈ Ker(f − I),
se tiene D = Ker(f − I), igualdad que prueba que D es subespacio. De la
definición de D se sigue que f (D) = D, luego D es f -invariante.
2
6.20.
Linealidad en el Análisis
Ilustraremos en este apartado la presencia que tiene la linealidad en los procesos
operativos (lı́mites, derivadas e integrales) del Análisis.
Siendo IK uno de los cuerpos IR o C,
I al considerar la aplicación
lı́m : c → IK, de ley (xn ) → lı́m xn ,
n→∞
n→∞
las reglas de cálculo de lı́mites
lı́m (xn + yn ) = lı́m xn + lı́m yn , lı́m (axn ) = a lı́m xn .
n→∞
n→∞
n→∞
n→∞
n→∞
significan que se trata de un morfismo lineal. Como cualquier número L es
un lı́mite, por ejemplo de la sucesión constante (L, L, L, . . . , L, . . .), se trata de
un epimorfismo. Su núcleo es precisamente el subespacio c0 de las sucesiones
infinitésimas.
Otro tanto cabe afirmar de los lı́mites de funciones. Puesto que
lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x), lı́m (af (x)) = a lı́m f (x),
x→x0
x→x0
x→x0
x→x0
x→x0
6.21. Morfismos de álgebras asociativas
107
la aplicación
f 7→ lı́m f (x),
x→x0
que se establece entre el espacio de las funciones convergentes en x0 y el propio
cuerpo IK, es un epimorfismo lineal con núcleo igual a las funciones de lı́mite
nulo.
En cuanto a las derivadas, puesto que
D(f + g) = Df + Dg, D(af ) = aDf,
la aplicación
f 7→ Df
es lineal.
Si hablamos de derivada en un punto x0 , esta aplicación empieza en el espacio
de funciones derivables en él y acaba en el cuerpo numérico.
Si hablamos de funciones derivables en todo un intervalo D, el operador de
derivación comienza en el espacio de todas las funciones derivables en D y acaba
en el de las funciones continuas en el mismo D. Precisamente en este caso, y
con ayuda del Teorema del Valor Medio de Lagrange, se prueba que el núcleo
de este operador está formado por las funciones constantes en D.
Si D = [a, b] es un intervalo cerrado, podemos hablar del operador de integración
Z b
f 7→
f (x)dx,
a
que se establece desde el espacio de funciones integrables hasta el cuerpo IR.
Las fórmulas
Z b
Z b
Z b
(f (x) + g(x))dx =
f (x)dx +
g(x)dx,
a
a
Z b
a
Z b
cf (x)dx = c
a
f (x)dx,
a
prueban su linealidad.
6.21.
Morfismos de álgebras asociativas
Si V y V0 son dos álgebras asociativas sobre el mismo IK, una aplicación f :
V → V0 se dirá que es un morfismo de álgebras asociativas cuando
1. ∀x, y ∈ V ⇒ f (x + y) = f (x) + f (y).
2. ∀x, y ∈ V ⇒ f (xy) = f (x)f (y).
3. ∀a ∈ IK, ∀x ∈ V ⇒ f (ax) = af (x).
108
Capı́tulo 6. Aplicaciones Lineales
O sea, f debe ser a la vez morfismo de anillos y aplicación lineal.
Su núcleo será a la vez subespacio e ideal de V. Su imagen será una subálgebra
de V0 . La composición de dos morfismos de álgebras será otro morfismo, la
identidad I en cada álgebra es un morfismo y la inversa de un morfismo biyectivo
de álgebras es otro morfismo biyectivo.
Si V es un álgebra unitaria y f es un morfismo no nulo de álgebras, la imagen
Im f ⊆ V0 es unitaria. El neutro de la multiplicación se cambia en neutro y
cada elemento invertible en V se cambia en otro invertible dentro de Im f .
Puesto que
lı́m (f (x)g(x)) = lı́m f (x) lı́m g(x),
x→x0
x→x0
x→x0
la toma de lı́mites es un morfismo de álgebras asociativas. Sin embargo la fórmula
D(f g) = Df g + f Dg,
muestra que el operador de derivación no es morfismo de álgebras. Otro tanto
cabe decir del operador de integración definida.
6.22.
Complementos / Ejercicios
1. ¿Cuáles de las siguientes aplicaciones f : IR2 → IR2 son lineales?
a) f (x, y) = (x, 0),
b) f (x, y) = (1, y),
c) f (x, y) = (x2 , y 2 ),
d ) f (x, y) = (x + y, x − y).
2. En el espacio IR[ξ], se considera la aplicación
γ(p(ξ)) = ξp(ξ).
Comprobar que es lineal. Siendo δ el endomorfismo de derivación, calcular
δ ◦ γ n − γ n ◦ δ.
3. Sea V = IRIR el espacio de las funciones reales de dominio IR. Sea la
aplicación
F : IR3 → V, de ley F (a, b, c)(x) = a + b cos2 x + c sen2 x.
a) Probar que F es lineal.
b) Determinar el subespacio Ker F , indicando si F es o no es inyectiva.
c) Determinar el subespacio Im F .
6.22. Complementos / Ejercicios
109
d ) Determinar F −1 (U), donde U es el subespacio de V formado por las
funciones constantes.
4. Sea f : V → V0 una aplicación lineal. Sea U un subespacio de V. Razonar
que f −1 (f (U)) = U+ Ker f .
5. Sea U un subespacio de V y sea f un automorfismo. Si U es invariante
por f también lo es por f −1 .
6. Se ha indicado que f y IR[ξ] son isomorfos como espacios vectoriales. Sin
embargo, como álgebras no pueden serlo. ¿Por qué?
7. La toma de lı́mites es una aplicación lineal del espacio c sobre el IK. ¿Es
morfismo de álgebras?
110
Capı́tulo 6. Aplicaciones Lineales
111
Capı́tulo 7
Suma Directa
7.1.
Suma directa de subespacios
Dados dos subespacios U y W de V, cada vector x ∈ U + W es suma de uno u
de U con otro w de W. Ahora bien, la descomposición x = u + w, en general,
no será única. Por ello, tiene sentido la siguiente definición:
Se dice que U + Wes suma directa del subespacio U con el subespacio W
cuando, para cada vector x ∈ U + W, existan unos únicos vectores u ∈ U,
w ∈ W, de manera que x = u + w. Significaremos esta peculiaridad con la
escritura
U + W = U ⊕ W.
Proposición 92 El subespacio U + W es una suma directa si y sólo si
U ∩ W = {0}.
Demostracion:
Si suponemos dos descomposiciones
x = u + w = u0 + w0 , con u, u0 ∈ U, w, w0 ∈ W,
para un mismo vector x ∈ U + W, operando se obtiene
u − u0 = w0 − w,
donde el primer miembro pertenecerá a U, por ser éste subespacio, y, por la
misma razón, el segundo miembro pertenece a W; el valor común, será nulo por
estar en la intersección, luego
u0 = u, w0 = w,
con lo que la descomposición ha de ser única.
112
Capı́tulo 7. Suma Directa
Si x ∈ U ∩ W, podemos escribir
x = x + 0 = 0 + x,
con x ∈ U, 0 ∈ W en la primera descomposición y 0 ∈ U, x ∈ W en la
segunda. Si la descomposición ha de ser única, de aquı́ se sigue que x = 0, luego
la intersección de los subespacios debe ser nula.
2
7.2.
Descomposición de un espacio en suma directa de subespacios
Si para dos subespacios vectoriales U y W de V se cumple la relación
V = U ⊕ W,
se dice que W es un subespacio complementario de U, o bien que U es un
subespacio complementario de W. También se dice que V se descompone en
suma directa de sus subespacios U y W.
Proposición 93 Dos subespacios U, W de V son mutuamente complementarios si y sólo si cada vector del espacio total se obtiene como suma de uno de U
con otro de W, y, además, de manera única.
Demostracion:
Basta aplicar las definiciones.
2
Proposición 94 Dos subespacios U, W de V son mutuamente complementarios si y sólo si
U + W = V, U ∩ W = {0}.
Demostracion:
Basta aplicar las proposiciones 93 y 92.
7.3.
2
Sumas directas en vectores libres
Si en el plano P se toman dos rectas r y s de distinta dirección y llamamos U y
W a los subespacios de vectores situados en cada una de sus direcciones, resulta
que el plano de vectores libres es suma directa de U y W.
Si en E tomamos una recta r incidente en un punto con un plano p , al construir
la recta U de vectores libres de r y el plano W de vectores libres de p, el espacio
total de vectores es suma directa de U con W.
7.4. Producto directo de dos espacios vectoriales
7.4.
113
Producto directo de dos espacios vectoriales
Proposición 95 Dados dos espacios vectoriales U y W sobre un mismo cuerpo
conmutativo IK, las operaciones
(u1 , w1 ) + (u2 , w2 ) = (u1 + u2 , w1 + w2 ), a(u, w) = (au, aw),
convierten al conjunto U × W en un nuevo espacio vectorial. En él se tiene
0 = (0, 0), −(u, w) = (−u, −w).
Demostracion:
Las propiedades asociativa y conmutativa de la adición, ası́ como las cuatro
de la ley externa, se obtienen aplicando la respectiva propiedad en cada una de
las dos componentes. Por la definición de vector nulo en cada espacio, se tiene
(u, w) + (0, 0) = (u + 0, w + 0) = (u, w) = (0 + u, 0 + w) = (0, 0) + (u, w),
quedando probado que (0, 0) es el vector nulo de U × W. Igualmente, por la
definición de opuesto en cada espacio, obtenemos
(u, w) + (−u, −w) = (u + (−u), w + (−w)) = (0, 0) =
= ((−u) + u, (−w) + w) = (−u, −w) + (u, w),
lo que prueba que (−u, −w) es la pareja opuesta de la (u, w).
2
Este espacio se conoce como el producto directo (o producto cartesiano)
del espacio U por el espacio W.
Proposición 96 Los subconjuntos
U∗ = {(u, 0)/u ∈ U}, W∗ = {(0, w)/w ∈ W}
son subespacios de U × W, isomorfos respectivamente con U y W. Además,
U × W = U∗ ⊕ W∗ .
Demostracion:
1. Las igualdades
(u1 , 0) + (u2 , 0) = (u1 + u2 , 0 + 0) = (u1 + u2 , 0),
a(u, 0) = (au, a0) = (au, 0),
(0, w1 ) + (0, w2 ) = (0 + 0, w1 + w2 ) = (0, w1 + w2 ),
a(0, w) = (a0, aw) = (0, aw)
prueban que U∗ y W∗ son subespacios de U × W.
114
Capı́tulo 7. Suma Directa
2. Las aplicaciones
α : U∗ → U, β : W∗ → W, de leyes α(u, 0) = u, β(0, w) = w,
son obviamente biyectivas y son morfismos lineales porque
α((u1 , 0)+(u2 , 0)) = α(u1 +u2 , 0+0) = α(u1 +u2 , 0) = u1 +u2 = α(u1 )+α(u2 ),
α(a(u, 0)) = α(au, a0) = α(au, 0) = au = aα(u),
β((0, w1 )+(0, w2 )) = β(0+0, w1 +w2 ) = β(0, w1 +w2 ) = w1 +w2 = β(w1 )+β(w2 ),
β(a(0, w)) = β(a0, aw) = β(0, aw) = aw = aβ(w).
3. Cada elemento de (u, w) ∈ U × W se descompone en la forma
(u, w) = (u + 0, 0 + w) = (u, 0) + (0, w), con (u, 0) ∈ U∗ , (0, w) ∈ W∗ ,
y la descomposición es única, pues
(u, w) = (u0 , 0) + (0, w0 ) = (u0 + 0, 0 + w0 ) = (u0 , w0 ) ⇒ u = u0 , w = w0 .
Por tanto, U × W = U∗ ⊕ W∗ .
2
7.5.
Relación entre los productos directos y las
sumas directas
Proposición 97 Si V = U ⊕ W, entonces V ≃ U × W.
Demostracion:
Establezcamos una correspondencia
σ :V →U×W
de la siguiente forma: si x = u + w, con u ∈ U, w ∈ W, entonces,
σ(x) = (u, w).
a) Esta correspondencia tiene sentido porque los vectores de V admiten una
descomposición como la indicada, y se trata de una aplicación porque
dicha descomposición es única.
b) Es inyectiva ya que
σ(x) = σ(y) = (u, w) ⇒ x = u + w, y = u + w ⇒ x = y.
c) Es una aplicación suprayectiva ya que, dada una pareja (u, w), al formar
su suma u + w = x en V, se cumple σ(x) = (u, w).
7.6. Proyecciones asociadas a una descomposición en suma directa
115
d) Es lineal porque
σ(x1 + x2 ) = σ((u1 + w1 ) + (u2 + w2 )) = σ((u1 + u2 ) + (w1 + w2 )) =
= (u1 + u2 , w1 + w2 ) = (u1 , w1 ) + (u2 , w2 ) = σ(x1 ) + σ(x2 ),
σ(ax) = σ(a(u + w)) = σ((au) + (aw)) = (au, aw) = a(u, w) = aσ(x).
2
En la proposición 96 hemos probado que
U × W = U∗ ⊕ W∗ ,
donde
U∗ = {(u, 0)/u ∈ U} ≃ U, W∗ = {(0, w)/w ∈ W} ≃ W.
Ahora acabamos de ver que
V = U ⊕ W ⇒ V ≃ U × W.
Tenemos ası́ dos procesos uno recı́proco del otro. Esta reciprocidad justifica la
equivalencia entre los productos directos y las sumas directas. Si importante
es el primero, por cuanto permite construir nuevos espacios a partir de otros
conocidos, no lo es menos el segundo, que da entrada a descomponer un espacio
en otros más pequeños y reducir su estudio al de éstos.
7.6.
Proyecciones asociadas a una descomposición en suma directa
Si tenemos una descomposición V = U ⊕ W del espacio V como suma directa
de dos subespacios U y W, para cada x ∈ V existen unos vectores (únicos)
u ∈ U, w ∈ W tales que x = u + w. Ası́ tenemos las aplicaciones
p : V → U, de ley p(x) = u,
q : V → W, de ley q(x) = w.
La primera se llama proyección de V sobre U paralelamente a W, mientras
que la segunda se nombra como proyección de V sobre W paralelamente
a U. Por la propia definición, podrá escribirse
x = p(x) + q(x).
Proposición 98 Si V = U ⊕ W es suma directa de sus subespacios U y W,
las proyecciones p y q son endomorfismos lineales de V.
116
Capı́tulo 7. Suma Directa
Demostracion:
Sean x, y ∈ V, a ∈ IK. Puesto que U y W son subespacios de V, se cumple
que
p(x) + p(y) ∈ U, ap(x) ∈ U, q(x) + q(y) ∈ W, aq(x) ∈ W.
Entonces, aplicando la unicidad de la descomposición de cada vector en uno de
U y otro de W, se tiene:
a) p(x + y) + q(x + y) = x + y = (p(x) + q(x)) + (p(y) + q(y)) =
= (p(x) + p(y)) + (q(x) + q(y)) ⇒
⇒ p(x + y) = p(x) + q(y), q(x + y) = q(x) + q(y).
b) p(ax) + q(ax) = ax = a(p(x) + q(x)) = ap(x) + aq(x) ⇒
⇒ p(ax) = ap(x), q(ax) = aq(x).
2
Proposición 99 Si V = U ⊕ W es suma directa de sus subespacios U y W,
para las proyecciones paralelas p y q se cumple que
x ∈ U ⇔ p(x) = x ⇔ q(x) = 0, Imp = U, Ker p = W,
x ∈ W ⇔ q(x) = x ⇔ p(x) = 0, Imq = W, Ker q = U.
Demostracion:
a) Recordando que 0 está en cualquier subespacio, se tiene
x ∈ U ⇒ x = x + 0 = p(x) + q(x) ⇒ p(x) = x, q(x) = 0,
x ∈ W ⇒ x = 0 + x = p(x) + q(x) ⇒ p(x) = 0, q(x) = x.
b) Puesto que siempre p(x) ∈ U y q(x) ∈ W, es claro que
p(x) = x ⇒ x ∈ U,
q(x) = x ⇒ x ∈ W.
c) Las equivalencias se completan viendo que
q(x) = 0 ⇒ x = p(x) + 0 = p(x) ∈ U,
p(x) = 0 ⇒ x = 0 + q(x) = q(x) ∈ W.
7.7. Endomorfismos proyectores
117
d) Como los vectores de U se cambian en ellos mismos mediante p, se tiene
U ⊆ Im p. Análogamente, W ⊆ Im q porque todo vector de W se iguala
a su propia imagen. Por la definición de las proyecciones, se tienen los
contenidos contrarios, luego U = Im p, W = Im q.
e) De la equivalencia x ∈ U ⇒ q(x) = 0 se tiene que U = Ker q, lo mismo
que la igualdad W = Ker p resulta de x ∈ W ⇒ p(x) = 0.
2
De esta proposición se sigue que U y W son invariantes tanto mediante p como
mediante q. Además, el conjunto de vectores dobles de p se confunde con U,
mientras que el de vectores dobles de q lo hace con W.
Proposición 100 Si V = U ⊕ W es suma directa de sus subespacios U y W,
para las proyecciones paralelas p y q se cumple que
p + q = I, p ◦ p = p, q ◦ q = q, q ◦ p = p ◦ q = f0 .
Demostracion:
a) Por la definición de p y q, se tiene
I(x) = x = p(x) + q(x) = (p + q)(x), ∀x ∈ V ⇒ I = p + q.
b) Como para todo x ∈ V se sabe que p(x) ∈ U y q(x) ∈ W, se tiene
(p ◦ p)(x) = p(p(x)) = p(x) ⇒ p ◦ p = p,
(p ◦ q)(x) = p(q(x)) = p(0) = 0 ⇒ q ◦ p = f0 .
(q ◦ q)(x) = q(q(x)) = q(x) ⇒ q ◦ q = q,
(q ◦ p)(x) = q(p(x)) = q(0) = 0 ⇒ p ◦ q = f0 .
2
En la descomposición trivial V = V ⊕ {0}, las proyecciones son el automorfismo
identidad y el endomorfismo nulo. En los demás casos, U y W serán propios y
ambas proyecciones son endomorfismos ni inyectivos ni nulos ya que sus núcleos
e imágenes son subespacios propios.
7.7.
Endomorfismos proyectores
La propiedad p ◦ p = p, q ◦ q = q de las proyecciones sirve, por generalización,
para la siguiente definición: se dice que una aplicación lineal f : V → V es un
endomorfismo proyector del espacio V cuando
f 2 = f ◦ f = f.
118
Capı́tulo 7. Suma Directa
Proposición 101 Si f es un endomorfismo proyector, g = I − f también lo
es. Además,
V = Imf ⊕ Ker f.
Demostracion:
Para la primera afirmación basta ver que
g ◦ g = (I − f ) ◦ (I − f ) = I ◦ I − I ◦ f − f ◦ I + f ◦ f =
= I − f − f + f = I − f = g.
La segunda se razona ası́:
a) Dado un vector arbitrario x, sea w = x − f (x). Aplicando f se obtiene
f (w) = f (x) − f (f (x)) = f (x) − f (x) = 0 ⇒ w ∈ Ker f ⇒
⇒ x = f (x) + w ∈ Imf + Ker f ⇒ V = Imf + Ker f.
b) Si y ∈ Im f ∩ Ker f , existe un x ∈ V tal que y = f (x). Aplicando f se
tendrá
0 = f (y) = f (f (x)) = f (x) = y ⇒ Imf ∩ Ker f = {0}.
2
En esta suma directa el proyector dato sirve como proyección sobre Im f paralelamente a Ker f , mientras que g = I − f es la proyección sobre el núcleo
paralelamente a la imagen.
7.8.
Simetrı́as oblı́cuas
Sea V un espacio vectorial sobre un cuerpo conmutativo IK de caracterı́stica
distinta de 2. Un endomorfismo s de V se dice que es involutivo, o que se trata
de una simetrı́a oblı́cua, cuando
s2 = s ◦ s = I.
De la propia definición se sigue que s es biyectivo (y, por tanto, un automorfismo
lineal de V) e inverso de sı́ mismo.
La identidad I, ası́ como la homotecia −I, de razón −1, es decir, la aplicación
de ley x → −x, son involutivos. La segunda se conoce como simetrı́a central.
Proposición 102 Sea p un endomorfismo de V y sea s = 2p − I. Entonces, s
es involutivo si y sólo si p es un proyector. En tal caso
1. p ◦ s = p
7.8. Simetrı́as oblı́cuas
119
2. la restricción de s a Im p es la aplicación I
3. la restricción de s a Ker p es la aplicación −I
Demostracion:
Basta ver que
s2 = I ⇒ 4p2 − 4p + I = I ⇒ 4p2 − 4p = f0 ⇒ p2 − p = f0 ⇒ p2 = p.
Por otra parte, se tiene
1. p ◦ s = 2p2 − p = 2p − p = p
2. s(x) = x ⇒ (2p − I)(x) = 2p(x) − x = x ⇒
⇒ 2p(x) = 2x ⇒ p(x) = x ⇒ x ∈ Imp.
3. s(x) = −x ⇒ (2p − I)(x) = 2p(x) − x = −x ⇒
⇒ 2p(x) = 0 ⇒ p(x) = 0 ⇒ x ∈ Ker p.
2
Un proyector p y un automorfismo involutivo s ligados por la fórmula
s = 2p − I,
se dice que son asociados entre sı́. Tomando
U = Im p, W = Ker p,
estos subespacios se nombran, respectivamente, como eje y dirección de la
simetrı́a. La relación que liga a s y p puede escribirse en la forma
p(x) =
x + s(x)
2
y se interpreta en el sentido de que el punto medio de un vector y su simétrico
es el proyectado de x sobre el eje paralelamente a la dirección. En cuanto a las
afirmaciones de la proposición 102, la primera significa que
p(s(x)) = p(x),
o sea, el simétrico de un vector tiene el mismo proyectado que el propio vector.
Las otras dos indican que los vectores del eje son los dobles en la simetrı́a,
mientras que los de la dirección se cambian por su opuesto.
La fórmula s = 2p − I puede utilizarse en ambos sentidos:
1. Si partimos de s, mediante su definición s2 = I, construı́mos p y calculamos
Im p y Ker p para conocer el eje y la dirección de s.
120
Capı́tulo 7. Suma Directa
2. Si partimos de p, sirve para construir una simetrı́a con eje y dirección
prefijados. Esta es la forma usual de proceder siempre que se conozca una
descomposición V = U ⊕ W, pues basta tomar p como la proyección
sobre U paralelamente a W. En tal caso, la simetrı́a asociada al segundo
proyector q = I − p es la
2q − I = 2(I − p) − I = I − 2p = −s.
Esto justifica que, al igual que las proyecciones p y q se estudian simultáneamente, hagamos lo mismo con las simetrı́as s y −s. Tal como ocurre con p y q,
s y −s intercambian eje y dirección.
Por ejemplo si partimos de los proyectores triviales I y f0 , las simetrı́as asociadas
son I y −I. La primera tiene a V como eje y a {0} como dirección, mientras
que para −I ocurre lo contrario.
7.9.
Complementos / Ejercicios
1. Sea D un intervalo de IR (abierto o cerrado) centrado en el origen. Sea
V = IRD el espacio vectorial de las funciones reales de dominio D. Una
función f ∈ V se llama par cuando su gráfica sea simétrica respecto del
eje de ordenadas, es decir, cuando
f (−x) = f (x), ∀x ∈ D.
En cambio, f se llama impar cuando su gráfica sea simétrica respecto del
origen, o sea, cuando
f (−x) = −f (x), ∀x ∈ D.
Sea P el conjunto de todas las funciones pares y sea I el de las funciones
impares. Comprobar que P e I son subespacios de V, ası́ como que
V = P ⊕ I.
Describir los proyectores y las simetrı́as oblı́cuas asociados.
2. Consideremos la aplicación
p : IKn [ξ] → IKn [ξ], de ley p(
n
X
i=0
i
ai ξ ) =
n−1
X
ai ξ i .
i=0
Demostrar que se trata de un proyector. Descomponer el espacio IKn [ξ]
en suma directa de Im p y Ker p. Describir su simetrı́a asociada.
3. Si a la adición ordinaria del cuerpo C
I le añadimos la operación
IR × C
I → C,
I de ley α(x + iy) = (αx) + i(αy),
7.9. Complementos / Ejercicios
121
se convierte en un espacio vectorial real isomorfo al IR2 . Comprobar que
la conjugación habitual de C,
I esto es, la aplicación
x + iy → x − iy
es una simetrı́a. Describir los proyectores y la segunda simetrı́a.
4. Dada una descomposición V = U ⊕ W de V en dos subespacios propios, sean p y q las respectivas proyecciones y sea µ 6= 0 un escalar. El
endomorfismo
DU,W,µ = p + µq
se conoce como deformación uniforme (o deslizamiento oblı́cuo) de
espejo (o eje) U, directriz W y razón µ. Comprobar que se trata de un
automorfismo lineal, cuyo inverso es otra deformación. ¿De qué trasformación se trata en los casos µ = 1 y µ = −1? Suponiendo que µ 6= 1, razonar
que
a) los vectores de U y sólo ellos son dobles
b) los vectores de W y sólo ellos se corresponden en una homotecia de
razón µ.
5. Dada una descomposición V = U ⊕ W de V en dos subespacios propios,
{DU,W,µ /µ ∈ IK ∗ }
es un grupo isomorfo al grupo multiplicativo IK ∗ .
6. Dada una descomposición V = U ⊕ W, supongamos que existe un morfismo lineal g : U → V0 . Razonar que puede extenderse a otro morfismo
f de V en V0 , esto es, existe f : V → V0 tal que
f (u) = g(u), ∀u ∈ U.
7. Sean U, W, T subespacios de V tales que V = U ⊕ W = U ⊕ T, W ⊆ T.
Razonar que W = T.
122
Capı́tulo 7. Suma Directa
123
Capı́tulo 8
Dimensión y Codimensión
de Subespacios
8.1.
Subespacios de un espacio de dimensión finita
Proposición 103 Todo subespacio U de un espacio finito-dimensional V, es
también de dimensión finita y se cumple
dim(U) ≤ dim(V).
La igualdad dim(U) = dim(V) equivale a U = V.
Demostracion:
Puesto que los conjuntos libres de vectores en U también lo son en V, sus
cardinales son finitos y están acotados por el número dim(V). Entonces, U es
también de generación finita (proposición 54) y se cumple que
dim(U) ≤ dim(V).
Si dim(U) = dim(V), cualquier base A de U es un conjunto libre con cardinal
igual a la dimensión de V. Entonces, A es base de V (proposición 54) y por
ello sistema generador. De aquı́ se sigue que U =< A >= V. La implicación
contraria es trivial.
2
De acuerdo con esta proposición, un espacio V que contenga un subespacio
infinito-dimensional, no podrı́a tener dimensión finita, es decir, deberá ser también infinito-dimensional.
124
Capı́tulo 8. Dimensión y Codimensión de Subespacios
8.2.
Infinito-dimensionalidad de los espacios de
funciones
Sea cual fuera el conjunto D ⊆ IR, dentro del álgebra DIR de las funciones reales
de una variable real y dominio D, están las funciones polinómicas
p(x) = a0 + a1 x + a2 x2 + . . . + ar xr
de variable real, formando un subálgebra asociativa. Esto permite considerar al
espacio IR[x], cuya dimensión se ha señalado en la sección 5.15 que es infinita,
como un subespacio de DIR .
Según la observación del anterior apartado, podemos asegurar que DIR tiene
dimensión infinita.
8.3.
El lema de ampliación de bases
Proposición 104 Si A es una base de un subespacio U de un espacio V de
dimensión finita, existe una base B del total de manera que A ⊆ B.
Demostracion:
53.
Observando que A es un conjunto libre en V, basta aplicar la proposición
2
Este enunciado, cuya validez podrı́a demostrarse también en los espacios de
dimensión infinita, se conoce como el Lema de ampliación de bases. En la
práctica esta base se obtendrá a partir de una base C de V sin más que aplicar
cuantos pasos se precisen del proceso de Steinitz.
8.4.
Existencia de complementarios
Proposición 105 Todo subespacio U de un espacio V de dimensión finita,
admite un subespacio complementario W, y se cumple
dim(W) = dim(V) − dim(U).
Demostracion:
Sean p = dim(U), n = dim(V) y q = n − p. Sea
A = {u1 , u2 , . . . , up }
una base de U, y sea
B = {u1 , u2 , . . . , up ; w1 , w2, . . . , wq },
una base de V obtenida por ampliación de la de U. Consideremos, entonces, el
subespacio
W =< w1 , w2 , . . . , wq > .
8.5. Dimensión de la suma e intersección
125
El sistema generador de W es libre por estar extraı́do del conjunto libre B, luego
es base de W, lo que permite asegurar que
dim(W) = q = n − p = dim(V) − dim(U).
Por ser B un sistema generador de V, para cada vector x ∈ V, se tendrá
x = a1 u1 + a2 u2 + . . . + ap up + b1 w1 + b2 w2 + . . . + bq wq = u + w,
donde
u = a1 u1 + a2 u2 + . . . + ap up ∈ U, w = b1 w1 + b2 w2 + . . . + bq vq ∈ W.
Esto prueba que V = U + W. Por otra parte, si x ∈ U ∩ W, existen escalares
a1 , a2 , . . . , ap , b1 , b2 , . . . , bq tales que
x = a1 u1 + a2 u2 + . . . + ap up = b1 w1 + b2 w2 + . . . + bq wq .
Entonces, pasando todo a un miembro y aplicando que el conjunto B es libre,
tenemos
a1 u1 + a2 u2 + . . . + ap up − b1 w1 − b2 w2 − . . . − bq wq = 0 ⇒
a1 = a2 = . . . = ap = −b1 = −b2 = . . . = −bq = 0 ⇒ x = 0,
lo que prueba que U ∩ W = {0}. Ahora, podemos afirmar que W es un subespacio complementario de U (proposición 94).
2
Probada la existencia de un complementario para cada subespacio de un espacio
finito-dimensional, cabe señalar que éste no será único. Ahora bien, sea cual sea,
y se obtenga como se obtenga, un complemento W de U, lo que sı́ se probará más
adelante es la validez general de la fórmula que liga las dimensiones de U y W.
Señalemos, por último, que este mismo teorema podrı́a enunciarse y demostrarse
en espacios de dimensión infinita.
8.5.
Dimensión de la suma e intersección
Proposición 106 Sean U y W dos subespacios, ambos de generación finita,
dentro de un espacio vectorial V. Entonces, U + W y U ∩ W son de generación
finita y se cumple
dim U + dim W = dim(U + W) + dim(U ∩ W).
Demostracion:
Sean A y C sistemas generadores de U y W, respectivamente. Sea x = u+w,
con u ∈ U, w ∈ W. Por hipótesis, existen vectores u1 , u2 , . . . , ur ∈ A y vectores
w1 , w2 , . . . , ws ∈ C tales que
u = a1 u1 + a2 u2 + . . . + ar ur , w = b1 w1 + b2 w2 + . . . + b2 ws ,
126
Capı́tulo 8. Dimensión y Codimensión de Subespacios
en cuyo caso
x = u + w = a1 u1 + a2 u2 + . . . + ar ur + b1 w1 + b2 w2 + . . . + b2 ws
es combinación lineal de la cantidad r + s de vectores
u1 , u2 , . . . , ur , w1 , w2 , . . . , ws
todos ellos pertenecientes a A∪C. Esto prueba que A∪C es un sistema generador
de U + W. En el caso de que A y C sean de cardinal finito, su unión también
lo es, luego U + W es de generación finita. En cuanto al subespacio U ∩ W,
será de generación finita por ser subespacio tanto de U como de W que lo son.
Sean, ahora,
p = dim(U), q = dim(W), m = dim(U ∩ W),
y sea
{v1 , v2 , . . . , vm }
una base de U ∩ W. Por ampliación de esta base, podemos obtener otras
{v1 , v2 , . . . , vm ; um+1 , . . . , up }, {v1 , v2 , . . . , vm ; wm+1 , . . . , wq },
para U y W, respectivamente. Su unión
{v1 , v2 , . . . , vm ; um+1 , . . . , up ; wm+1 , . . . , wq },
donde hemos suprimido, por superfluos, los vectores repetidos, será, un sistema
generador de U+W. Supongamos una combinación lineal nula de sus elementos:
c1 v1 + c2 v2 + . . . + cm vm + am+1 um+1 + . . . + ap up +
+bm+1 wm+1 + . . . + bq wq = 0,
y consideremos el vector
v = bm+1 wm+1 + . . . + bq wq =
= −(c1 v1 + c2 v2 + . . . + cm vm + am+1 um+1 + . . . + ap up )
Observando su primera expresión anotamos que es un vector de W, mientras que
observando la segunda se anota que está en U. Estará, pues, en la intersección,
por lo que existen unos números d1 , d2 , . . . , dm tales que
−(c1 v1 + c2 v2 + . . . + cm vm + am+1 um+1 + . . . + ap up ) =
= d1 v1 + d2 v2 + . . . + dm vm ⇒
⇒ (d1 + c1 )v1 + (d2 + c2 )v2 + . . . + (dm + cm )vm +
+am+1 um+1 + . . . + ap up = 0 ⇒
⇒ d1 + c1 = d2 + c2 = . . . = dm + cm = am+1 = . . . = ap = 0
8.6. Dimensión de un espacio producto
127
ya que llegamos a una combinación lineal nula de todos los vectores de la base
de U. Entonces, para el vector v de antes, queda
v = bm+1 wm+1 + . . . + bq wq = −(c1 v1 + c2 v2 + . . . + cm vm ) ⇒
⇒ c1 v1 + c2 v2 + . . . + cm vm + bm+1 wm+1 + . . . + bq wq = 0 ⇒
⇒ c1 = c2 = . . . = cm = bm+1 = . . . = bq = 0,
porque hemos llegado a una combinación lineal nula de los vectores de la base
de W. Con esto lo que hemos razonado es que
{v1 , v2 , . . . , vm ; um+1 , . . . , up ; wm+1 , . . . , wq }
es libre y, por tanto, base de U + W. En consecuencia,
dim(U + W) = m + (p − m) + (q − m) = p + q − m =
= dim(U) + dim(W) − dim(U ∩ W),
que es lo que se trataba de demostrar.
2
La igualdad de esta proposición se conoce como la Fórmula de Grassmann.
Proposición 107 Si U y W son subespacios mutuamente complementarios de
un espacio V de dimensión finita V, se tiene
dim(V) = dim(U) + dim(W).
Demostracion:
Basta aplicar la fórmula de Grassmann, teniendo en cuenta que en este caso
U + W = V y U ∩ W = {0}.
2
8.6.
Dimensión de un espacio producto
Proposición 108 Si U y W son dos espacios vectoriales de dimensión finita,
el espacio U × W también lo es y se cumple
dim(U × W) = dim(U) + dim(W).
Demostracion:
Recordando la descomposición U × W = U∗ ⊕ W∗ , donde U∗ ≃ U y
W ≃ W (proposición 96), basta aplicar que espacios isomorfos comparten
dimensión (proposición 73) y que la dimensión de una suma directa es la suma
de las dimensiones de ambos sumandos (proposición 107).
2
∗
128
8.7.
Capı́tulo 8. Dimensión y Codimensión de Subespacios
Subespacios de dimensión finita. Rectas y
planos
En todo espacio V 6= {0}, independientemente de la finitud o infinitud de su
dimensión, existen subespacios finito-dimensionales: siempre que tomemos algún
conjunto C ⊆ V de cardinal finito, el subespacio U =< C > es de generación
finita y, por ello, finito-dimensional cumpliéndose que dim(U) ≤ Card(C). Pero,
la existencia de subespacios de dimensión finita puede matizarse más aún:
Proposición 109 Si V 6= {0} es de dimensión finita, admite subespacios de
cualquier dimensión r tal que 0 ≤ r ≤ dim(V). Si V es de dimensión infinita,
admite subespacios de cualquier dimensión r ≥ 0.
Demostracion:
En todo caso con dimensión nula está el subespacio U0 = {0}.
Por ser V 6= {0}, existe al menos un vector u1 6= 0, por tanto independiente,
por lo cual U1 =< u1 > es un subespacio de dimensión 1.
Si U1 = V, no hay nada más que demostrar, pero en caso contrario existe al
menos un vector u2 6∈< u1 >. El lema de ampliación de conjuntos libres, asegura
que {u1 , u2 } es libre, luego U2 =< u1 , u2 > es un subespacio con dimensión 2.
Si U2 = V, la demostración termina. De no ser ası́, podemos reiterar el proceso
para encontrar un subespacio U3 de dimensión 3, y ası́ sucesivamente.
Al ir aumentando las dimensiones de unidad en unidad, en los casos finitodimensionales este proceso siempre tendrá un final una vez que se alcance la
dimensión del espacio total.
Si V es infinito-dimensional, por inducción, vamos construyendo los subespacios
U0 , U1 , U2 , . . . , Ur . Como nunca podrá darse la igualdad V = Ur , el proceso
puede reiterarse indefinidamente.
2
Vista su existencia, señalemos los subespacios más usuales en las aplicaciones
geométricas: se trata de los de dimensión 1, llamados rectas vectoriales, y de
los de dimensión 2, conocidos como planos vectoriales.
8.8.
Ecuaciones paramétricas de un subespacio
Sea V un espacio de dimensión finita n ≥ 1 y sea B = {v1 , v2 , . . . , vn } una base
de V. Sea U un subespacio de dimensión p y sea A = {u1 , u2 , . . . , up } una base
de U. Para un vector x ∈ U tendremos
x=
p
X
j=1
λj uj =
n
X
x i vi ,
i=1
donde λ1 , λ2 , . . . , λp son sus coordenadas en la base de U y x1 , x2 , . . . , xn sus
coordenadas en la base de V. Para relacionar unas con otras, bastará conocer las
8.8. Ecuaciones paramétricas de un subespacio
129
coordenadas α1j , α2j , . . . , αnj de cada vector uj de A en la base B del espacio
total, es decir, bastará con tener las igualdades
uj =
n
X
αij vi , con j ∈ [1, p],
i=1
porque, entonces, aplicando las propiedades de las operaciones entre vectores,
obtenemos
p
X
λj u j =
j=1
=
p
X
j=1
p X
n
n
X
X
λj (
αij vi ) =
(
λj αij vi ) =
i=1
j=1 i=1
p
p
n X
X
X
(
λj αij )vi ⇒ xi =
λj αij , con i ∈ [1, n] ⇒
i=1 j=1
x
1
x2
.
..
xn
j=1
=
=
λ1 α11
λ1 α21
+12 λ2 α
+22 λ2 α
+...
+...
+1p λp α
+2p λp α
=
λ1 αn1
+n2 λ2 α
+...
+np λp α
Estas son las ecuaciones paramétricas del subespacio U respecto de
las bases A de U y B de V. Las coordenadas en la base de U se llaman
parámetros y hay tantos como su dimensión. La igualdad
x = λ1 u1 + λ2 u2 + . . . + λp up ,
se llama ecuación paramétrico-vectorial del subespacio U. Las anteriores
se suelen nombrar como ecuaciones escalares o en coordenadas.
Si U es una recta, generada por un vector no nulo
u = α1 v1 + α2 v2 + . . . + αn vn ,
su ecuación paramétrico-vectorial es la igualdad
x = λu,
mientras que las ecuaciones paramétricas en coordenadas serán las
x1 = λα1 , x2 = λα2 , . . . , xn = λαn .
Si U es un plano, generado por dos vectores independientes
u = α1 v1 + α2 v2 + . . . + αn vn , v = β1 v1 + β2 v2 + . . . + βn vn ,
la ecuación vectorial será
x = λu + µv,
y las ecuaciones escalares del plano resultan las
x1 = λα1 + µβ1 , x2 = λα2 + µβ2 , . . . , xn = λαn + µβn .
130
8.9.
Capı́tulo 8. Dimensión y Codimensión de Subespacios
Codimensión de un subespacio
De la proposición 107 se sigue, definitivamente, que todos los posibles complementos de un subespacio son de la misma dimensión. Este hecho se prueba
también en los espacios de generación infinita, de manera que tiene sentido la
siguiente definición:
La dimensión de un subespacio complementario W de otro U, se llama codimensión de U y se denota
codim(U).
En los espacios finito-dimensionales, se tiene sin más
codim(U) = dim(V) − dim(U).
8.10.
Subespacios de codimensión finita. Hiperplanos
Definida la codimensión de un subespacio U como la dimensión de un complementario W de U, en los espacios finito-dimensionales existen subespacios de
cualquier codimensión q tal que 0 ≤ q ≤ dim(V), pues basta recordar que todo
subespacio admite un complementario y aplicar esto a subespacios de dimensión
p = dim(V) − q, los cuales siempre existen según hemos probado (109).
En particular, los subespacios de codimensión 1 (esto es, los subespacios complementarios de las rectas), reciben el nombre de hiperplanos. Si V es de
dimensión finita n, se trata, pues, de los de dimensión igual a n − 1, Si n = 1,
el único hiperplano es {0}; si n = 2, las rectas son hiperplanos; si n = 3, los
hiperplanos son los planos.
En dimensión infinita, la existencia de subespacios de codimensión finita arbitraria estará asegurada si admitimos, como hemos hecho aunque sin demostración,
la existencia de complementarios. Entonces, se tratarı́a de los complementos de
los subespacios referidos en la proposición 109. También podrı́a hacerse, probando la existencia de hiperplanos y razonando después que todo subespacio de
codimensión finita es intersección de una cantidad finita de ellos. Pero, dejando
de lado el problema de existencia, caracterizemos a los más interesantes de los
subespacios de codimensión finita:
Proposición 110 Un subespacio H de V, tal que H 6= V, es un hiperplano si
y sólo si de toda relación H ≤ W ≤ V se deduzca que
H = W o bien W = V.
Demostracion:
De H < V se deduce que hay al menos un vector u 6∈ H. Entonces, es claro
que u 6= 0, que < u > ∩ H = {0} y que H << u > +H ≤ V. Esto último
8.11. Complementos / Ejercicios
131
implica que < u > +H = V, luego
V =< u > ⊕ H ⇒ codim(H) = dim(< u >) = 1.
Supongamos que V =< u > ⊕ H, con u 6= 0. Para cualquier subespacio W
tal que H < W, existirá cuando menos un vector w ∈ W, pero w 6∈ H. Para él
se tendrá w = au + h, donde a ∈ IK ∗ , h ∈ H. Entonces, se cumple
w − h = au ∈ W ⇒ u ∈ W ⇒< u >≤ W ⇒
⇒ V =< u > +H ≤ W ⇒ W = V.
2
Esta proposición viene a decir que los hiperplanos son subespacios maximales
para la relación de contenido.
8.11.
Complementos / Ejercicios
1. Determinar dos subespacios distintos de IR3 complementarios del
U =< (2, 1, 1), (1, 3, 0) > .
2. Determinar dos subespacios distintos de IR3 complementarios del
U =< (1, 2, 1) > .
Escribir las ecuaciones paramétricas de cada uno de ellos.
3. Determinar dos subespacios distintos de IR4 complementarios del
U =< (1, 3, 0, −1), (2, 5, 1, 2), (1, 2, 1, 3) > .
4. Determinar dos subespacios distintos de IR4 complementarios del
U =< (1, 1, 0, 1), (0, 1, 1, 2), (1, 0, 1, 1) > .
Escribir las ecuaciones paramétricas de cada uno de ellos.
5. Determinar las dimensiones y bases en los subespacios U + W, U ∩ W de
IR4 , siendo
U =< (1, 2, 1, 2), (0, 1, 2, 0) >, W =< (2, 0, 0, 1), (0, 5, 4, 3) > .
6. Dentro de IR5 se tienen dos subespacios U y W ambos de dimensión 3.
¿Qué posibles dimensiones tiene U ∩ W?
7. ¿Son isomorfos los espacios IK m × IK n y IK m+n ? ¿Por qué?
132
Capı́tulo 8. Dimensión y Codimensión de Subespacios
8. Si H es un hiperplano dentro de un espacio V de dimensión finita n,
razonar directamente que H es un subespacio maximal.
9. En el espacio IRn [ξ], sea U el subconjunto formado por los polinomios que
admiten a λ como raı́z. Comprobar que U es un subespacio y determinar
un complemento del mismo.
10. Sea V el espacio de las funciones continuas en un intervalo cerrado [a, b]
de IR. Dada una función ϕ estrictamente positiva (es decir, tal que ϕ(x) >
0, ∀x ∈ [a, b]), sean
Z b
U =< ϕ >, W = {g ∈ V
g(x)ϕ(x)dx = 0}.
a
Comprobar que W es un subespacio, complementario de U (e hiperplano,
por tanto).
11. En el espacio IK J , donde J es un conjunto arbitrario, se considera, para
cada i ∈ J, el vector
ei (j) = δij .
Comprobar que {ei /i ∈ J} es una base del subespacio IK (J) . Razonar
que, si J es de cardinal infinito, tanto IK (J) como IK J son espacios de
dimensión infinita.
12. Sea V un espacio de dimensión infinita sobre IK y sea B = {vj }j∈J (donde
J será un conjunto de cardinal infinito) una base de V. Razonar que la
aplicación d : V → IK J que a cada vector x le asigna sus coordenadas en
la base B es un isomorfismo de V sobre IK (J) en el cual
d(vi ) = ei , ∀i ∈ J.
(Esta es una generalización del conocido isomorfismo de Descartes).
13. Dentro del espacio IRIN se considera el subconjunto F formado por las
sucesiones (x0 , x1 , x2 , . . . , xn , . . .) tales que
xn+2 = xn+1 + xn , ∀n ∈ IN,
llamadas sucesiones de Fibonacci.
a) Razonar que F es un subespacio bidimensional. ¿Cuál será su base
canónica?
b) Comprobar que las sucesiones (2, 3, 5, 8, 13, . . .), (1, 2, 3, 5, 8, . . .), son
base del espacio F de Fibonacci. Calcular las coordenadas en la misma
de la sucesión (1, 1, 2, 3, 5, 8, . . .).
8.11. Complementos / Ejercicios
133
14. De manera más general, sean λ, µ dos números reales y consideremos el
conjunto V de sucesiones (xn ) tales que
xn+2 + λxn+1 + µxn = 0.
(Técnicamente ésta es un caso particular de ecuación en diferencias. En
concreto, es una ecuación en diferencias lineal homogénea de segundo
orden y coeficientes constantes).
a) Véase que V es un plano de IRIN y muéstrese su base canónica.
b) Supóngase que la ecuación algebraica ξ 2 + λξ + µ = 0 (ecuación
caracterı́stica) posee raı́ces reales y distintas (esto es, supóngase
que λ2 − 4µ > 0). Razonar que cada una de las sucesiones
p
−λ ± λ2 − 4µ n
un = (
)
2
es solución de la ecuación en diferencias y que ambas son linealmente
independientes. ¿Cuál es la solución general de la ecuación?
c) Expresar la solución general de la ecuación de Fibonacci.
d ) Obtener el número
lı́m xn
n→∞
sabiendo que x0 = 0, x1 = 1/2, xn+2 = (xn + xn+1 )/2.
e) Obtener el número
∞
X
xn
n=0
sabiendo que 4xn+2 = xn , x0 = 8, x1 = 1.
15. Sea V = IRIR . La igualdad
an (x)y n) + an−1 (x)y n−1) + . . . + a2 (x)y 00 + a1 (x)y 0 + a0 (x)y = 0,
donde an , an−1 , a2 , a1 , a0 son funciones continuas en todo IR e y es una
función desconocida se conoce como una ecuación diferencial lineal
homogénea de orden n. Cada función f (x) tal que sustituı́da tanto ella como sus derivadas en la ecuación conviertan a ésta en una igualdad
verdadera, se conoce como una solución particular. Siendo W el conjunto de todas ellas, véase que W es un subespacio vectorial de V. En
los textos de Análisis se prueba que W tiene dimensión igual al orden
n de la ecuación. Si se conocieran n soluciones particulares f1 , f2 , . . . , fn
linealmente independientes, ¿cómo se expresarı́a la solución general? En
Mecánica Clásica son frecuentes las ecuaciones lineales de segundo orden,
por ejemplo la ecuación diferencial del movimiento armónico simple
y 00 + k 2 y = 0.
Expresar su solución general.
134
Capı́tulo 8. Dimensión y Codimensión de Subespacios
135
Capı́tulo 9
Espacios Cociente
9.1.
Congruencias en un espacio, módulo un subespacio
Sea U ≤ V. Dados x, y ∈ V se dice que x es congruente con y, módulo U,
y se denota x ≡ y mód U, cuando
y − x ∈ U.
Proposición 111 La congruencia módulo U es una relación de equivalencia
en V. La clase de cada vector x es el conjunto x + U de todos los resultados de
sumar x con los diversos vectores de U.
Demostracion:
(Reflexiva) x ≡ x, porque x − x = 0 ∈ U.
(Simétrica) x ≡ y ⇒ y − x ∈ U ⇒ −(y − x) = x − y ∈ U ⇒ y ≡ x.
(Transitiva) x ≡ y, y ≡ z ⇒ y − x ∈ U, z − y ∈ U ⇒
⇒ z − x = (z − y) + (y − x) ∈ U ⇒ x ≡ z.
Fijado x, su clase es
{y ∈ V/x ≡ y mód U} = {y ∈ U/y − x = u ∈ U} =
= {y ∈ U/y = x + u, donde u ∈ U} = x + U.
2
El conjunto de todas las clases de congruencia se denota como
V/U.
136
Capı́tulo 9. Espacios Cociente
9.2.
Espacio cociente
Proposición 112 El conjunto V/U queda dotado de la estructura de espacio
vectorial sobre el mismo cuerpo IK que V mediante las operaciones
(x + U) + (y + U) = (x + y) + U,
a(x + U) = (ax) + U.
Demostracion:
1. En primer lugar hay que probar que estas operaciones son válidas en el sentido de tener resultado único, independiente de los representantes tomados
para las clases datos. En efecto, si en la clase x + U cambiamos su representante x por otro x0 , como ambos deben ser congruentes se cumplirá que
x0 − x ∈ U, en cuyo caso
½ 0
(x + y) − (x + y) = x0 − x ∈ U ⇒ (x0 + y) + U = (x + y) + U
(ax0 ) − (ax) = a(x0 − x) ∈ U ⇒ (ax0 ) + U = (ax) + U
Si en la suma cambiamos el representante del segundo dato, el razonamiento es similar.
2. Puesto que las operaciones con clases se efectúan a partir de las correspondientes con sus representantes, se heredan sin más las propiedades
asociativa y conmutativa de la adición, ası́ como las cuatro propiedades
de la multiplicación por números.
3. La clase 0 + U = U, sirve de neutro para la adición de clases.
4. Para cada x, las clases x + U y (−x) + U son opuestas entre sı́.
2
Este nuevo espacio vectorial V/U, recibe el nombre de espacio vectorial cociente del espacio V mediante el subespacio U.
9.3.
Epimorfismo canónico sobre un subespacio
Proposición 113 La aplicación
π : V → V/U, de ley π(x) = x + U,
es un epimorfismo lineal, cuyo núcleo es U.
9.4. Primer Teorema de Isomorfı́a
137
Demostracion:
a) La linealidad se obtiene de la manera como se han definido las operaciones
en el espacio cociente:
π(ax + by) = (ax + by) + U = ((ax) + U) + ((by) + U =
= (a(x + U)) + (b(y + U)) = aπ(x) + bπ(y).
b) π es suprayectiva porque cada clase x + U procede mediante π de su
representante x.
c) x ∈ Ker π ⇒ π(x) = x + U = 0 + U ⇒ x ∈ U.
2
Este morfismo será nombrado como el epimorfismo canónico asociado al
subespacio vectorial U, y también como la proyección canónica de V
sobre el cociente V/U.
9.4.
Primer Teorema de Isomorfı́a
Si f : V → V0 es una aplicación lineal, la congruencia módulo el subespacio
Ker f se expresará ası́:
x ≡ y mód Ker f ⇔ y − x ∈ Ker f ⇔
⇔ f (y − x) = 0 ⇔ f (y) − f (x) = 0 ⇔ f (y) = f (x).
Como dos vectores congruentes representan la misma clase, tendremos
x + Ker f = y + Ker f ⇔ f (y) = f (x).
Esto justifica que la correspondencia
f ∗ : V/Ker f → V0 , de ley f ∗ (x + Ker f ) = f (x),
sea una verdadera aplicación, y, además, inyectiva. Por otra parte es un morfismo
lineal:
f ∗ (a(x + Ker f ) + b(y + (Ker f )) = f ∗ ((ax + by) + Ker f ) =
= f (ax + by) = af (x) + bf (y) = af ∗ (x + Ker f ) + bf ∗ (y + Ker f ).
Finalmente, es obvio que
Im f ∗ = Im f,
por lo que f ∗ será suprayectiva o no a la vez que lo sea f . Ahora bien, la
suprayectividad se consigue trivialmente si sustituı́mos V0 por el subespacio
Im f , de manera que, en resumen, queda probado lo siguiente:
138
Capı́tulo 9. Espacios Cociente
Proposición 114 La correspondencia
f ∗ : V/Ker f → Imf , de ley f ∗ (x + Ker f ) = f (x),
es un isomorfismo de espacios vectoriales.
Este resultado es el Primer Teorema de Isomorfı́a para las aplicaciones
lineales.
9.5.
Inyección canónica de un subespacio
Sea U un subespacio de V. La restricción a U de la identidad I de V se convierte
en una aplicación ι : U → V que trivialmente es lineal e inyectiva. Se conoce
como la inyección canónica (o el monomorfismo canónico) de U en V.
9.6.
Descomposición canónica de una aplicación
lineal
Consideremos ahora la proyección canónica π de V sobre V /Ker f , ası́ como la
inyección canónica ι del subespacio Im f en el espacio V0 . Entonces, para cada
x ∈ V se tiene
(ι ◦ f ∗ ◦ π)(x) = (ι ◦ f ∗ )(x + Ker f ) = ι(f (x)) = f (x),
es decir, se tiene la descomposición
f = ι ◦ f∗ ◦ π
del morfismo f en un epimorfismo seguido de un isomorfismo y de un monomorfismo. Esta igualdad se nombra como la descomposición canónica de la
aplicación lineal f , y viene a expresar la conmutatividad del siguiente diagrama
9.7. Isomorfı́a del espacio cociente con los complementarios
f
V
139
- V0
6
π
ι
?
V /ker f
9.7.
f∗
- Im f
Isomorfı́a del espacio cociente con los complementarios
Proposición 115 Sea U un subespacio de V y sea W cualquier complemento
suyo. Entonces, V/U ≃ W.
La descomposición V = U ⊕ W permite considerar la proyección q : V → W de
V sobre W paralelamente a U, de la cual sabemos que Ker q = U, Im q = W.
Aplicando el primer teorema de isomorfı́a, se obtiene
V/U ≃ W.
Proposición 116 Un espacio cociente V/U es finito-dimensional si y sólo si
U es un subespacio de codimensión finita. En ambos supuestos,
dim(V/U) = codim(U).
Demostracion:
Si U tiene codimensión finita, cualquier complemento W de U es finitodimensional y se cumple dim(W) = codim (U). Como W es isomorfo a V/U y
espacios isomorfos tienen la misma dimensión (proposición 73), V/U será finitodimensional y se tendrá dim(V/U) = dim(W) = codim (U).
Recı́procamente, si V/U es finito-dimensional, lo es W y se cumple dim(V/U) =
dim(W). Entonces, U es codimensión finita y se tiene codim (U) = dim(W) =
dim(V/U).
2
140
Capı́tulo 9. Espacios Cociente
La fórmula que acabamos de establecer justifica que algunos autores definan la
codimensión de un subespacio U de V como la dimensión del espacio cociente
V/U.
En el caso particular de que V sea de dimensión finita, se tendrá
dim(V/U) = dim(V) − dim(U).
9.8.
Complementos / Ejercicios
1. Siendo U un subespacio de un espacio finito-dimensional V, razonar de
forma directa (es decir, sin usar el teorema de isomorfı́a) la fórmula
dim(V/U) = dim(V) − dim(U).
2. Sea f : V → V0 una aplicación lineal y sea U un subespacio de V. Razonar
que existe una aplicación lineal h : V/U → V0 tal que f = h ◦ π si y sólo
si U ⊆ Ker f .
3. Sea U un subespacio invariante del endomorfismo f de V. Razonar que
la correspondencia h(x + U) = f (x) + U es un endomorfismo de V/U.
141
Capı́tulo 10
Subespacios y Aplicaciones
Afines
10.1.
Comentarios a un capı́tulo de Geometrı́a
Como excepción a nuestra intención de libro-guión, nos permitiremos algunos
comentarios previos a la redacción del presente capı́tulo. Son reflexiones que
enlazarı́an con el espı́ritu de nuestro capı́tulo de introducción.
La construcción del espacio cociente V/U de uno dado mediante un subespacio
suyo, suele tacharse de muy abstracta por lectores primerizos. De hecho hay textos de Espacios Vectoriales de nivel universitario que ni siquiera la contemplan.
Nosotros, por el contrario, utilizaremos las clases de congruencia en V, módulo
U (o sea, los elementos de V/U), para introducir en el Algebra Lineal algunos
conceptos, mediante los cuales alcanzar nuestro objetivo de geometrizarla, o, si
se quiere, de convertir la Geometrı́a en una de sus partes.
Advertiremos, antes de que algún lector se nos adelante, que este capı́tulo y su
siguiente pueden ser en cierta medida redundantes con los últimos de este libro,
dedicados al estudio de los Espacios y Aplicaciones Afines. En efecto ası́ es y
si lo ampliáramos un poco más (por ejemplo con cuestiones de paralelismo e
incidencia en las que aquı́ no abundaremos), los citados capı́tulos serı́an superfluos. ¿Para qué incluirlo, pues? La razón primera que se nos ocurre esgrimir es
la de poder interpretar en términos geométricos, como haremos más adelante,
el estudio de los Sistemas Lineales. Pero hay más: queremos que este libro sea
abierto y polivalente en el sentido de ofrecer más de una alternativa a la hora
de usarlo en la clase real. En realidad la Teorı́a de Espacios Afines (donde como
decı́amos en nuestra introducción se recupera el concepto y uso de los puntos)
se mantiene en los textos quizás como un soporte que parece hacer más intuitiva la Geometrı́a de dos y tres dimensiones. Si nuestros alumnos no poseen un
cierto grado de madurez en tal Geometrı́a, bueno será dejar las cosas tal como
las presentamos. Pero si contamos con alumnos más formados y que precisan
142
Capı́tulo 10. Subespacios y Aplicaciones Afines
cuanto antes el salto a espacios infinito-dimensionales, valdrı́a la pena engordar
un poco el presente capı́tulo y suprimir sin más los capı́tulos finales. Esto puede
ser incluso conveniente si queremos maximizar el rendimiento del siempre escaso
tiempo con que contamos para desarrollar los programas.
Usando los vectores libres como guı́a para introducir nuevos conceptos, pensemos
en el caso tridimensional y supongamos que hemos llevado un representante de
cada vector a un origen común O. Un subespacio vectorial U será bien una
recta, bien un plano, que pase por dicho origen. Si ahora sumamos un vector
fijo b con todos los de U, comprobamos que los extremos de todos los vectores
resultado van describiendo la recta o el plano, según sea U, paralelos al propio
U, que pasa por el extremo de b. Es decir, las rectas y planos que no pasan
por el origen, se describen mediante todos los vectores de un conjunto b + U,
donde U (subespacio vectorial) sı́ pasa por el mismo. Esto justifica la siguiente
definición.
10.2.
Subespacios afines de un espacio vectorial
Sea V un espacio vectorial sobre un cuerpo conmutativo IK. Sea b ∈ V y sea
U ≤ V. Se llama subespacio afı́n que pasa por b y está dirigido por U
al conjunto b + U.
Dos subespacios b + U y c + U, dirigidos por un mismo U, se dice que son paralelos entre sı́. Como, fijado U, los conjuntos b+U son las clases de congruencia,
módulo U, cada dos de ellos o bien coinciden o bien son disjuntos. Usando la
definición de la congruencia, estas dos posibilidades quedan caracterizadas ası́:
a) b + U = c + U ⇒ c − b ∈ U ⇒ c ∈ b + U
b) (b + U) ∩ (c + U) = ∅ ⇒ b − c 6∈ U ⇒ c 6∈ b + U.
Si, en particular, ponemos c = 0, tendremos
a) b + U = U ⇒ b ∈ U ⇒ 0 ∈ b + U,
b) (b + U) ∩ U = ∅ ⇒ b 6∈ U ⇒ 0 6∈ b + U.
Esto pone de manifiesto que los subespacios vectoriales son afines, pero no al
revés. Además, un subespacio afı́n será vectorial si y sólo si contiene al vector
nulo.
10.3.
Caracterización de los subespacios afines
Proposición 117 Un conjunto F 6= ∅ de vectores es un subespacio afı́n si y
sólo si, para algún b ∈ F , el conjunto
F − b = {x − b/x ∈ F}
10.4.
Dimensión de un subespacio afı́n
143
es un subespacio vectorial. En ambos casos,
F − c = F − b, ∀c ∈ F.
Demostracion:
Llamando U al conjunto F − b, basta observar que
U = F − b ⇒ F = b + U.
Entonces, para todo c, se va a tener
c ∈ F = b + U ⇒ c + U = b + U = F ⇒ F − c = U = F − b.
2
10.4.
Dimensión de un subespacio afı́n
Finita o infinita, a cada subespacio afı́n b + U se le asigna como dimensión la
que tenga U. Es decir, dim(b + U) = dim(U).
Si se toma U = {0}, los subespacios afines que dirige son los conjuntos unitarios
{b}. Se les llama puntos, y su dimensión será nula. Esto justifica que, por abuso
de lenguaje, algunos autores hablen indistintamente de puntos o vectores. Si U
es una recta vectorial, b + U se llama recta afı́n, y su dimensión es uno.
Si U es un plano vectorial, b + U es un plano afı́n, y su dimensión es dos.
Finalmente, llamaremos hiperplanos afines a los subespacios b+U dirigidos
por un hiperplano vectorial U. Tendrán dimensión n − 1 siempre que V sea de
dimensión finita n.
Ya hemos señalado que existen subespacios afines disjuntos. Si dos subespacios
afines no son disjuntos se prueba que su intersección es otro subespacio afı́n.
Para completar, entonces, que al cortar subespacios afines salga otro subespacio
afı́n, se admite que el conjunto vacı́o ∅ es un subespacio afı́n de V. Su
dimensión se toma como -1.
10.5.
Contenido entre subespacios afines
La relación de pertenencia b ∈ c + W se expresa en Geometrı́a con la frase el
subespacio afı́n c + W pasa por b. Equivale a la {b} ⊆ c + W, donde b
toma el significado de punto o subespacio afı́n cero-dimensional.
De manera más general, se dice que un subespacio afı́n c+W pasa por otro
b + U cuando lo contenga, es decir, cuando b + U ⊆ c + W.
Proposición 118 Si c + W pasa por b + U, se cumple U ⊆ W.
144
Capı́tulo 10. Subespacios y Aplicaciones Afines
Demostracion:
Como b ∈ c + W, podemos poner c + W = b + W. Entonces, para cada
u ∈ U se tiene
x = b + u ∈ b + U ⇒ x ∈ c + W = b + W ⇒ ∃w ∈ W/x = b + w ⇒
⇒ u = x − b = w ⇒ u ∈ W.
2
Lo contrario es falso: puede ser incluso que U = W y que los subespacios b + U
y c + W sean disjuntos, con lo que ninguno pasa por el otro.
Proposición 119 Si c + W pasa por b + U y los subespacios U y W son de
dimensión finita, se cumple que dim(b + U) ≤ dim(c + W). Si las dimensiones
coinciden, necesariamente b + U = c + W.
Demostracion:
La desigualdad entre las dimensiones es consecuencia de que U ⊆ W. Si
dim(U) = dim(V), el contenido se convierte en igualdad. Entonces, como b + U
y c + W no son disjuntos, deben coincidir.
2
10.6.
Combinaciones afines
Sea r ≥ 0 un número entero y sean b0 , b1 , b2 , . . . , br varios vectores de V. Se
dice que el vector
x = a0 b0 + a1 b1 + a2 b2 + . . . + ar br ,
donde a0 , a1 , a2 , . . . , ar ∈ IK, es combinación afı́n de b0 , b1 , b2 , . . . , br cuando
a0 + a1 + a2 + . . . + ar = 1.
También se dice que x depende afı́nmente de b0 , b1 , b2 , . . . , br .
Proposición 120 El conjunto de todas las combinaciones afines de los vectores
b0 , b1 , b2 , . . . , br es un subespacio afı́n F, el cual pasa por los vectores dados y
está contenido en cualquier otro subespacio afı́n G que pase por ellos.
Demostracion:
a) Si r = 0, es decir, si se trata de un solo vector b0 , la única combinación
afı́n que puede formarse es la trivial x = b0 , la cual es el subespacio
afı́n cero-dimensional {b0 }. Este, está trivialmente contenido en cualquier
subespacio G que pase por b0 .
10.6.
Combinaciones afines
145
b) Si r ≥ 1, despejando uno de los coeficientes, por ejemplo el a0 , las combinaciones afines se presentan en la forma
x = b0 + a1 (b1 − b0 ) + a2 (b2 − b0 ) + . . . + ar (br − b0 ),
donde ahora a1 , a2 , . . . , ar toman valores arbitrarios. Recı́procamente, si
se parte de una combinación lineal como ésta, se reconstruye una afı́n sin
más que tomar
a0 = 1 − a1 − a2 − . . . − ar .
Por tanto, el conjunto se combinaciones afines se iguala con el
F = b0 + < b1 − b0 , b2 − b0 , . . . , br − b0 >
que efectivamente es un subespacio afı́n y pasa por cada uno de los vectores
dados. Por otra parte, si G, dirigido por el subespacio vectorial U, pasa
por estos vectores, se puede poner G = b0 + U y se cumple, para cada
i ≥ 1, que bi − b0 ∈ U. Por ello,
< b1 − b0 , b2 − b0 , . . . , br − b0 >⊆ U,
luego F ⊆ G.
2
El subespacio F formado por las combinaciones afines de b0 , b1 , b2 , . . . , br lo
denotamos como
<< b0 , b1 , b2 , . . . , br >>
y lo nombramos como subespacio afı́n generado por b0 , b1 , b2 , . . . , br .
Proposición 121 Un conjunto F 6= ∅ de vectores es un subespacio afı́n si y
sólo si cualquier combinación afı́n de vectores de F está en F.
Demostracion:
Fijemos un b ∈ F y sea U = F − b. Probaremos que U ≤ V. Dados
x, y ∈ F, se tiene z = x + y − b ∈ F porque es combinación afı́n de x, y, b.
Entonces,
(x − b) + (y − b) = z − b ∈ U,
luego la suma de elementos de U está en U.
Dados a ∈ IK y x ∈ F, se tiene z = ax + (1 − a)b ∈ F porque es combinación
afı́n de x, b. Por tanto,
a(x − b) = z − b ∈ U,
luego el producto de un escalar por un elemento de U está en U.
Sea F 6= ∅ un subespacio afı́n y sea U el subespacio vectorial que lo dirige.
Dados b0 , b1 , b2 , . . . , br ∈ F, por la proposición 120, sabemos que << b0 , b1 , b2 , . . . , br >>⊆
F, luego cualquier combinación afı́n de elementos de F está en F.
2
146
Capı́tulo 10. Subespacios y Aplicaciones Afines
En el último teorema la cantidad de vectores con los que formamos combinaciones afines es arbitraria. Imponiendo una leve restricción, se puede trabajar
sólo con dos:
Proposición 122 Sea IK un cuerpo conmutativo de caracterı́stica distinta de
dos. Un conjunto F 6= ∅ de vectores es un subespacio afı́n si y sólo si cualquier
combinación afı́n de dos vectores de F está en F.
Demostracion:
Fijemos un b ∈ F y sea U = F − b. Probaremos que U ≤ V.
Dados x, y ∈ F, se tiene
u=
x+y
∈ F ⇒ z = 2u − b ∈ F ⇒
2
⇒ (x − b) + (y − b) = x + y − 2b = 2(u − b) = z − b ∈ U,
luego la suma de elementos de U está en U.
Dados a ∈ IK y x ∈ F, como en la proposición 121, donde se ha usado una
combinación afı́n de dos vectores de F, se tiene que a(x − b) ∈ U.
Si F es subespacio afı́n, en la proposición 121 se ha probado que cualquier
combinación afı́n de vectores de F está en F. En particular, las de dos vectores
lo estarán.
2
10.7.
Dependencia e independencia afı́n
Los vectores b0 , b1 , b2 , . . . , br se dicen afı́nmente dependientes si existe una
combinación lineal
a0 b0 + a1 b1 + a2 b2 + . . . + ar br = 0,
donde
a0 + a1 + a2 + . . . + ar = 0,
en la cual haya al menos un coeficiente ai 6= 0.
En caso contrario, es decir, cuando la única combinación lineal
a0 b0 + a1 b1 + a2 b2 + . . . + ar br = 0, a0 + a1 + a2 + . . . + ar = 0,
es la que tiene todos sus coeficientes ai nulos, se dice que los vectores b0 , b1 , b2 , . . . , br
son afı́nmente independientes.
De las definiciones se deduce que un solo vector b0 es siempre afı́nmente independiente.
Proposición 123 Si r ≥ 1, los vectores b0 , b1 , b2 , . . . , br son afı́nmente dependientes o independientes a la vez que los b1 − b0 , b2 − b0 , . . . , br − b0 sean
linealmente dependientes o independientes.
10.7.
Dependencia e independencia afı́n
147
Demostracion:
Si partimos de una combinación afı́n nula, como la suma de todos los coeficientes debe valer cero, tenemos
a0 = −a1 − a2 − . . . − ar ⇒ 0 = a0 b0 + a1 b1 + a2 b2 + . . . + ar br =
= a1 (b1 − b0 ) + a2 (b2 − b0 ) + . . . + ar (br − b0 ).
Si los vectores b1 − b0 , b2 − b0 , . . . , br − b0 son linealmente dependientes, hay
un ai , con i ∈ [1, r], no nulo, lo que implica que b0 , b1 , b2 , . . . , br sean afı́nmente
dependientes. Recı́procamente, si partimos de la dependencia afı́n, algún ai , con
i ∈ [0, r] es no nulo; necesariamente debe ser i ≥ 1, pues a1 = a2 = . . . = ar = 0
conllevarı́a que también a0 = 0; pero, esto significa que b1 −b0 , b2 −b0 , . . . , br −
b0 son linealmente dependientes. Si las dependencias se implican mutuamente,
sus contrarias, es decir, la indepencia afı́n y la lineal, también lo harán.
2
En esta proposición, la elección de b0 es irrelevante. Si se toma cualquier otro,
basta renumerarlos para que la demostración sea la misma.
Proposición 124 Si r ≥ 1, los vectores b0 , b1 , b2 , . . . , br , son afı́nmente dependientes si y sólo si uno de ellos es combinación afı́n de los demás.
Demostracion:
Si, por ejemplo, b0 es combinación afı́n de b1 , b2 , . . . , br , existen escalares
a1 , a2 , . . . , ar tales que
b0 = a1 b1 + a2 b2 + . . . + ar br , a1 + a2 + . . . + ar = 1.
Restando b0 en ambos miembros, queda
−b0 + a1 b1 + a2 b2 + . . . + ar br = 0, −1 + a1 + a2 + . . . + ar = 0,
luego se trata de vectores afı́nmente dependientes.
Si son afı́nmente dependientes, en la combinación
a0 b0 + a1 b1 + a2 b2 + . . . + ar br = 0,
habrá al menos un coeficiente no nulo; si, salvo reordenación, suponemos que
a0 6= 0, podemos tomar
b0 = (−a1 /a0 )b1 + (−a2 /a0 )b2 + . . . + (−ar /a0 )br .
Ahora bien, como a0 + a1 + a2 + . . . + ar = 0, se tiene
(−a1 /a0 ) + (−a2 /a0 ) + . . . + (−ar /a0 ) = a0 /a0 = 1,
luego b0 es combinación afı́n de los restantes vectores.
2
148
Capı́tulo 10. Subespacios y Aplicaciones Afines
Proposición 125 Si r ≥ 1, los vectores b0 , b1 , b2 , . . . , br , son afı́nmente independientes si y sólo si ninguno es combinación afı́n de los demás.
Demostracion:
Se obtiene por negación del anterior enunciado.
2
Proposición 126 Si los vectores b0 , b1 , b2 , . . . , br son afı́nmente independientes, existe un subespacio afı́n r-dimensional, y sólo uno, que pasa por ellos.
Demostracion:
Si r = 0 el teorema es trivial tomando el subespacio afı́n {b0 }. Si r ≥ 1,
el subespacio F =<< b0 , b1 , b2 , . . . , br >> pasa por los vectores dados; por
la proposición 123, su dimensión será r. Si G es otro subespacio afı́n que pasa
por b0 , b1 , b2 , . . . , br , sabemos que F ⊆ G; si G es también de dimensión r, la
proposición 119 asegura que F = G.
2
Dado un solo vector b0 , sabemos que es afı́nmente independiente. Se determina
a sı́ mismo en cuanto punto o subespacio afı́n de dimensión cero.
Si los vectores b0 y b1 son afı́nmente independientes, ninguno es combinación
afı́n del otro, o sea, no pueden ser iguales. Determinarán una recta afı́n formada
por los vectores que dependan afı́nmente de ellos. Si x ∈<< b0 , b1 >> se dice
que está alineado con b0 y b1 .
Si los vectores b0 , b1 , b2 son afı́nmente independientes, por no ser ninguno combinación afı́n de los dos restantes, no pueden estar alineados. Determinan un
plano afı́n constituı́do por las combinaciones afines de ellos. Si
x ∈<< b0 , b1 , b2 >>, se dice que es coplanario con b0 , b1 , b2 .
10.8.
Ecuaciones paramétricas de subespacios
afines
Sea V un espacio de dimensión finita n ≥ 1 sobre un cuerpo conmutativo IK y
sea B = {v1 , v2 , . . . , vn } una base de V. Sea U ≤ V un subespacio vectorial de
dimensión r ≥ 1 y sea A = {u1 , u2 , . . . , up } una base de U. Dado b ∈ V, para
cada x ∈ b + U, tendremos una relación
x = b + λ1 u1 + λ2 u2 + . . . + λp up .
Esta es la llamada ecuación paramétrico-vectorial del subespacio b + U.
A la vez, el mismo vector x ∈ b + U se escribirá como
x = x1 v1 + x2 v2 + . . . + xn vn .
Para calcular las coordenadas xi a partir de los parámetros λj , basta conocer
las coordenadas bi de b y las coordenadas αij de cada uj ∈ A en la base B de
10.9.
Imagen inversa de un vector en una aplicación lineal
149
V. Entonces, al operar, llegamos a que
x=
n
X
bi vi +
i=1
p
X
j=1
λj uj =
p
p
n
X
X
X
(bi +
λj αij )vi ⇒ xi = bi +
λj αij ,
i=1
j=1
j=1
para cada i ∈ [1, n]. Detallando, se obtiene
x1 = b1 + λ11 α1 + λ12 α2 + . . . + λ1p αp
x2 = b2 + λ21 α1 + λ22 α2 + . . . + λ2p αp
..
.
xn = bn + λn1 α1 + λn2 α2 + . . . + λnp αp
que son las ecuaciones paramétricas del subespacio afı́n b + U respecto
de las bases A de U y B de V.
Si U es una recta vectorial, generada por un vector no nulo
u = α1 v1 + α2 v2 + . . . + αn vn ,
éste se nombra como el vector director de la recta afı́n b + U. Las ecuaciones
serán
x1 = b1 + λα1
x2 = b2 + λα2
x = b + λu,
..
.
xn = bn + λαn
Si U es un plano vectorial, generado por dos vectores independientes
u = α1 v1 + α2 v2 + . . . + αn vn , v = β1 v1 + β2 v2 + . . . + βn vn ,
éstos son los vectores directores del plano afı́n b + U. Sus ecuaciones son
x1 = b1 + λα1 + µβ1
x2 = b2 + λα2 + µβ2
x = b + λu + µv,
..
.
xn = bn + λαn + µβn
10.9.
Imagen inversa de un vector en una aplicación lineal
Proposición 127 Dada una aplicación lineal f : V → V0 y un vector b0 de
V0 , su imagen inversa es un subespacio afı́n de V. Si no es vacı́o, el subespacio
vectorial que lo dirige es Ker f .
Demostracion:
Si b0 6∈ Im f , su imagen inversa es el subespacio afı́n vacı́o de V. Si b0 ∈
Im f , hay al menos un b ∈ V tal que f (b) = b0 , luego
f −1 (b0 ) = {x ∈ V/f (x) = b0 } = {x ∈ V/f (x) = f (b)} = b + Ker f,
que es el subespacio afı́n de V que pasa por b y está dirigido por Ker f .
2
150
Capı́tulo 10. Subespacios y Aplicaciones Afines
10.10.
Traslaciones en un espacio vectorial
Siendo u ∈ V, llamamos traslación según el vector u a la aplicación
Tu : V → V, de ley Tu (x) = x + u.
Proposición 128 La composición de dos traslaciones conmuta y es otra traslación.
La identidad es una traslación. Toda traslación es biyectiva y su inversa es otra
traslación. Además,
∀u, v ∈ V ⇒ Tv ◦ Tu = Tu+v , I = T0 , (Tu )−1 = T−u .
Demostracion:
Sea x ∈ V.
a) Tu+v (x) = x + (u + v) = (x + u) + v =
= Tv (x + u) = Tv (Tu (x)) = (Tv ◦ Tu )(x) ⇒ Tu+v = Tv ◦ Tu .
Como la suma de vectores es conmutativa, se tiene
Tv ◦ Tu = Tu+v = Tv+u = Tu ◦ Tv .
b) T0 (x) = x + 0 = x = I(x) ⇒ T0 = I.
c) Aplicando los dos resultados anteriores, obtenemos
T−u ◦ Tu = T−u+u = T0 = I ⇒ T−u = (Tu )−1 .
2
Proposición 129 Si una traslación Tu admite al menos un vector doble x, se
cumple que u = 0. Por tanto, Tu = T0 = I.
Demostracion:
Si Tu (x) = x, se tiene x = x + u, luego u = 0.
2
El conjunto de todas las traslaciones de V se denotará como
T (V, IK).
Proposición 130 El conjunto T (V, IK) es un subgrupo conmutativo del grupo
simétrico S(V), isomorfo al grupo aditivo del espacio vectorial V.
10.11.
Aplicaciones afines
151
Demostracion:
La primera afirmación es consecuencia inmediata de la proposición 128. Considerando la aplicación T : V → S(V), de ley T : u → Tu , esa misma proposición
permite escribir
T (u + v) = Tu+v = Tv ◦ Tu = T (v) ◦ T (u),
lo que prueba que T es un morfismo de grupos. Habida cuenta de que la identidad
posee vectores dobles (de hecho, todos), aplicando la proposición 129, tenemos
u ∈ Ker T ⇒ T (u) = Tu = IV ⇒ u = 0 ⇒ Ker T = {0},
o sea, T es inyectiva y establece un isomorfismo de V sobre Im T . Pero, de la
definición de T , se obtiene que Im T = T (V, IK), luego V ≃ T (V, IK).
2
10.11.
Aplicaciones afines
Sea f : V → V0 una aplicación entre dos espacios sobre el cuerpo conmutativo
IK. En caso de existir un morfismo lineal h : V → V0 tal que
∀x, y ∈ V ⇒ f (y) − f (x) = h(y − x),
se razona que es único, pues de haber otro k : V → V0 con la misma propiedad,
particularizando en los vectores x y 0, tenemos
k(x) = k(x − 0) = f (x) − f (0) = h(x − 0) = h(x) ⇒ k = h.
Se dice que f : V → V0 es una aplicación afı́n (o un morfismo afı́n) si existe
una aplicación lineal fe : V → V0 tal que
∀x, y ∈ V ⇒ f (y) − f (x) = fe(y − x).
La aplicación fe, única, según acabamos de ver, se conoce como la aplicación
lineal asociada de la aplicación afı́n f .
Proposición 131 Toda aplicación lineal f es afı́n y fe = f .
Demostracion:
Basta observar que f (y) − f (x) = f (y − x).
2
fu = I. Recı́procamente, si una
Proposición 132 Toda traslación Tu es afı́n y T
e
aplicación afı́n f : V → V cumple que f = I, se trata de una traslación. La
única traslación que es lineal es la nula.
Demostracion:
152
Capı́tulo 10. Subespacios y Aplicaciones Afines
a) La primera afirmación se obtiene de que I es lineal y de la relación
Tu (y) − Tu (x) = (y + u) − (x + u) = y − x = I(y − x).
b) Si Te = I, se tiene
f (y) − f (x) = I(y − x) = y − x, ∀x, y ⇒
⇒ f (x) − f (0) = x − 0 ⇒ f (x) = x + f (0) = Tf (0) (x), ∀x ⇒ f = Tf (0) .
c) Si Tu es lineal, el vector 0 es doble, luego u = 0 (proposición 129).
2
Proposición 133 Una aplicación f : V → V0 es afı́n si y sólo si la aplicación
h(x) = f (x) − f (0) es lineal.
Demostracion:
Si h es lineal, f es afı́n y fe = h ya que
f (y) − f (x) = h(y) + f (0) − h(x) − f (0) = h(y) − h(x) = h(y − x).
Si f es afı́n, h es lineal porque
h(x) = f (x) − f (0) = fe(x − 0) = fe(x) ⇒ h = fe.
2
Ası́, la ligazón entre f y fe queda de manifiesto en la ecuación
fe(x) = f (x) − f (0).
Proposición 134 Toda aplicación afı́n f : V → V0 es compuesta de su aplicación lineal asociada y la traslación en V0 de vector u0 = f (0).
Demostracion:
Basta ver que
f (x) = fe(x) + f (0) = Tf (0) (fe(x)) = (Tf (0) ◦ fe)(x) ⇒ f = Tf (0) ◦ fe.
2
Proposición 135 Una aplicación afı́n es inyectiva, suprayectiva o biyectiva a
la vez que su aplicación lineal asociada.
10.12.
Morfismos y combinaciones afines
153
Demostracion:
Como la inyectividad, suprayectividad y biyectividad de los datos implica
la misma propiedad en la compuesta, y como las traslaciones son biyectivas,
cualquiera de estas propiedades se transfiere de fe a f porque f = Tf (0) ◦ fe, y
de f a fe porque fe = T−f (0) ◦ f .
2
Proposición 136 Dadas dos aplicaciones f : V → V0 , g : V0 → V00 afines, su
compuesta g ◦ f : V → V00 es afı́n; la identidad I : V → V de todo espacio es
afı́n: la inversa f −1 : V0 → V de una aplicación afı́n y biyectiva f : V → V0 ,
es afı́n. Además,
−1 ) = (fe)−1 .
(gg
◦ f ) = ge ◦ fe, Ie = I, (fg
Demostracion:
a) Dados x, y ∈ V, y habida cuenta que fe ◦ ge es lineal, se tiene
(g ◦ f )(y) − (g ◦ f )(x) = g(f (y)) − g(f (x)) = ge(f (y) − f (x)) =
= ge(fe(y − x)) = (e
g ◦ fe)(y − x) ⇒ (gg
◦ f ) = ge ◦ fe.
b) Como I es lineal, será afı́n y se cumple Ie = I.
c) Si f es biyectiva, su aplicación lineal asociada lo es, luego la aplicación
(fe)−1 existe y es lineal. Dados x0 , y0 ∈ V0 , sean x, y ∈ V tales que
f (x) = x0 , f (y) = y0 .
Entonces,
f −1 (y0 ) − f −1 (x0 ) = y − x = ((fe)−1 ◦ fe)(y − x) =
−1 ) = (fe)−1 .
= (fe)−1 (fe(y−x)) = (fe)−1 (f (y)−f (x)) = (fe)−1 (y0 −x0 ) ⇒ (fg
2
10.12.
Morfismos y combinaciones afines
Se dice que f : V → V0 conserva las combinaciones afines cuando
∀a0 , a1 , a2 , . . . , ar ∈ IK/
r
X
ai = 1, ∀x0 , x1 , x2 , . . . , xr ∈ V ⇒
i=0
⇒ f(
r
X
i=0
ai xi ) =
r
X
i=0
ai f (xi ).
154
Capı́tulo 10. Subespacios y Aplicaciones Afines
Proposición 137 La aplicación f : V → V0 es afı́n si y sólo si conserva las
combinaciones afines.
Demostracion:
Si f conserva las combinaciones afines, se cumple que
fe(x + y) = f (x + y) − f (0) = f (x − 0 + y) − f (0) =
= f (x) − f (0) + f (y) − f (0) = fe(x) + fe(y),
fe(ax) = f (ax) − f (0) = f (ax + (1 − a)0) − f (0) =
= af (x) + (1 − a)f (0) − f (0) = af (x) − af (0) = afe(x),
luego fe es lineal y f es afı́n.
Dada una combinación afı́n en V, se cumple
f(
r
X
r
X
ai xi ) = f (0) + fe(
ai xi ) =
i=0
=(
r
X
ai )f (0) +
i=0
r
X
i=0
ai fe(xi ) =
i=0
r
X
i=0
ai (f (0) + fe(xi )) =
r
X
ai f (xi ).
i=0
2
En particular, toda traslación conserva las combinaciones afines.
Proposición 138 Si IK es de caracterı́stica distinta de dos, f es afı́n si y sólo
si
∀a, b ∈ IK/a + b = 1, ∀x, y ∈ V ⇒ f (ax + by) = af (x) + bf (y).
Demostracion:
Si f conserva las combinaciones afines de dos vectores, se tiene
x+y
fe(x + y) = f (x + y) − f (0) = f (2
− 0) − f (0) =
2
= 2f (
x+y
f (x) + f (y)
) − f (0) − f (0) = 2
− f (0) − f (0) =
2
2
= f (x) + f (y) − f (0) − f (0) = fe(x) + fe(y).
La relación fe(ax) = afe(x) se prueba como en la anterior proposición.
Si f es afı́n, conserva las combinaciones afines de cualquier cantidad de vectores, y, en particular, de dos.
2
Proposición 139 Toda aplicación afı́n conserva la dependencia afı́n. La independencia afı́n se conserva si y sólo si f es inyectiva.
10.12.
Morfismos y combinaciones afines
155
Demostracion:
a) Para un solo vector, no hay nada que probar. Si hay más, se expresa uno
como combinación afı́n de los otros. Su imagen será combinación afı́n de
las imágenes, luego éstas son afı́nmente dependientes.
b) Sean a0 , a1 , a2 , . . . , ar ∈ IK tales que a0 + a1 + a2 + . . . + ar = 0, y sean
x0 , x1 , x2 , . . . , xr ∈ V. Si se tiene una relación
0 = a0 f (x0 ) + a1 f (x1 ) + a2 f (x2 ) + . . . + ar f (xr ),
sumando f (0) en ambos miembros, los coeficientes del nuevo segundo
miembro suman 1, luego, por ser f afı́n, tenemos
f (0) =
r
X
i=0
ai f (xi ) + f (0) = f (
r
X
ai xr + 0) = f (
i=0
r
X
ai xr ).
i=0
Si f es inyectiva, de aquı́ deducimos que
0 = a0 x0 + a1 x1 + a2 x2 + . . . + ar xr .
Si los vectores dados son afı́nmente independientes, todos los coeficientes
son nulos, luego sus imágenes también son afı́nmente independientes.
c) Si f conserva la independencia afı́n, como dos vectores x 6= y son afı́nmente
independientes, sus imágenes f (x) y f (y) lo serán. Esto implica que f (x) 6=
f (y), luego f es inyectiva.
2
Las traslaciones, por ser biyectivas, conservan tanto la dependencia como la
independencia afı́n.
Proposición 140 Si f : V → V0 es afı́n, para todo c ∈ V y todo W ≤ V, se
tiene
f (c + W) = f (c) + fe(W).
Demostracion:
Siendo w un vector genérico de W, se tiene
f (c + w) − f (c) = f (0) + fe(c + w) − f (0) − fe(c) =
= fe(c) + fe(w) − fe(c) = fe(w) ⇒ f (c + W) − f (c) = fe(W).
Como fe es lineal, fe(W) es un subespacio vectorial, luego f (c + W) es un
subespacio afı́n y se cumple f (c + W) = f (c) + fe(W).
2
Ası́, los morfismos afines transforman subespacios afines en subespacios afines.
En particular, las traslaciones cumplirán
Tu (c + W) = Tu (c) + W,
es decir, cambian un subespacio afı́n en otro paralelo a él.
156
Capı́tulo 10. Subespacios y Aplicaciones Afines
10.13.
El grupo afı́n
Una aplicación f : V → V afı́n y biyectiva se llama una afinidad de V.
De acuerdo con la proposición 136, podremos afirmar que todas ellas forman un
grupo, subgrupo del S(V). Se nombra como el grupo afı́n del espacio V y se
denota
Af (V, IK).
Tanto GL(V, IK) como T (V, IK) son subgrupos de Af (V, IK). También la
proposición 136 asegura que la correspondencia f 7→ fe es un morfismo de
Af (V, IK) en GL(V, IK), suprayectivo además pues mediante él un automorfismo lineal procede al menos de sı́ mismo (proposición 131).
Proposición 141 T (V, IK) es un subgrupo normal de Af (V, IK).
Demostracion:
fu = I, ∀u ∈ V, asegura que T (V, IK) está dentro del núcleo
La relación T
del epimorfismo f 7→ fe. Recı́procamente, en la proposición 132 se ha visto que
fe = I ⇒ f = Tf (0) , lo que significa que dicho núcleo está contenido en T (V, IK).
Entonces, T (V, IK) es normal por ser el núcleo de un morfismo entre grupos.
2
Proposición 142 Para el grupo afı́n se cumple que
Af (V, IK) = GL(V, IK)T (V, IK), {I} = GL(V, IK) ∩ T (V, IK).
Demostracion:
a) Por las proposiciones 134 y 135, toda afinidad se compone de un automorfismo lineal y una traslación, luego Af (V, IK) = GL(V, IK)T (V, IK).
b) Si Tu es lineal, en la proposición 132 se ha visto que Tu = T0 = I, luego
GL(V, IK) ∩ T (V, IK) = {I}.
2
10.14.
Complementos / Ejercicios
1. Dentro del espacio IK3 [ξ] se considera el conjunto
F = {ξ 3 + aξ 2 + bξ + c/a, b, c ∈ IK}.
Véase que es un subespacio afı́n. ¿Qué subespacio vectorial lo dirige?
10.14.
Complementos / Ejercicios
157
2. Sea c el espacio de las sucesiones convergentes de números reales o complejos. Fijado un número L, sea F el subconjunto de c formado por todas
las sucesiones de lı́mite L. Razonar que se trata de un subespacio afı́n
dirigido por el subespacio c0 de las sucesiones infinitésimas.
3. Dados x, x0 ∈ V, existe una única traslación Tu tal que Tu (x) = x0 .
4. Razonar el isomorfismo de grupos Af (V, IK)/T (V, IK) ≃ GL(V, IK).
5. Razonar que cada aplicación afı́n f : V → V0 se descompone en una lineal
seguida de una traslación (proposición 134) sólo de una manera.
6. Si u ∈ V y g : V → V0 es lineal, razonar que g ◦ Tu = Tg(u) ◦ g.
7. Como T (V, IK) es un subgrupo normal de Af (V, IK), dado un vector u
y una afinidad f , f −1 Tu f será otra traslación. ¿Qué vector la define?
158
Capı́tulo 10. Subespacios y Aplicaciones Afines
159
Capı́tulo 11
Matrices y sus Operaciones
11.1.
Definiciones
Dados dos enteros m, n ≥ 1 y un cuerpo conmutativo IK, llamamos matriz de
m filas y n columnas con coeficientes en IK a un conjunto ordenado de n
vectores
C1 = (a11 , a21 , . . . , am1 ), C2 = (a12 , a22 , . . . , am2 ), . . . ,
Cn = (a1n , a2n , . . . , amn ),
m
del espacio IK .
Las matrices se escriben en forma de cuadro rectangular, encerrado entre corchetes,
colocando las componentes de los vectores C1 , C2 , . . . , Cn en vertical, unas a
continuación de las del otro:
a11 a12 . . . a1n
a21 a22 . . . a2n
.
..
..
..
.
.
am1
am2
...
amn
Los vectores dato se denominan columnas de la matriz. La propia manera
de presentar una matriz sugiere la consideración de m vectores
F1 = (a11 , a12 , . . . , a1n ), F2 = (a21 , a22 , . . . , a2n ), . . . ,
Fm = (am1 , am2 , . . . , amn ),
n
del espacio IK , los cuales reciben el nombre de filas de la matriz. Con ellos
como dato se podrı́a haber dado una definición alternativa de matriz: serı́a un
conjunto ordenado de m vectores del espacio IK n .
Cada una de las componentes de cada uno de los vectores datos se conoce como
un coeficiente de la matriz. Su doble ı́ndice indica que aij es el coeficiente
situado en la fila i-ésima y en la columna j-ésima. En total hay mn coeficientes.
160
Capı́tulo 11. Matrices y sus Operaciones
Con frecuencia usaremos la escritura abreviada
(aij ),
sobreentendiendo que i ∈ [1, m] y j ∈ [1, n]. Incluso, se aluda o no a los coeficientes, la matriz se escribe con una sola letra mayúscula, tal como A, B, M ,
N , etc. En estos casos, Fi (A) indicará la fila i-ésima en la matriz A y Cj (A) la
columna j-ésima; a veces pondremos eij (A) para indicar el coeficiente ubicado
en el cruce de Fi (A) con Cj (A).
El conjunto de todas las matrices de m filas, n columnas y coeficientes en IK se
denota por el sı́mbolo
M(m, n, IK).
11.2.
Igualdad de matrices
Por haber definido la matriz como un conjunto ordenado de n vectores, es claro
que dadas dos matrices
A, B ∈ M(m, n, IK)
se cumple
A = B ⇒ Cj (A) = Cj (B), ∀j ∈ [1, n].
Si A = (aij ), B = (bij ), como cada columna es, a su vez, una m-upla ordenada
de elementos de IK, cada una de las igualdades vectoriales de antes equivale a m
igualdades escalares referidas a sus componentes. Es decir, la igualdad matricial
equivale a mn igualdades escalares:
A = B ⇒ aij = bij , ∀i ∈ [1, m], ∀j ∈ [1, n].
Estas igualdades conducen a otra equivalencia, ahora por filas:
A = B ⇒ Fi (A) = Fi (B), ∀i ∈ [1, m].
11.3.
Tipos particulares de matrices
Hay algunas matrices que reciben nombres propios. Entre ellas vamos a destacar
las siguientes:
a) Matrices columna: Corresponden al caso en que m es arbitrario pero
n = 1. Sus coeficientes se escriben con un solo ı́ndice,
a1
a2
A=
... ,
am
y cada una de sus filas es un escalar.
11.3.
Tipos particulares de matrices
161
b) Matrices fila: Ahora es m = 1 y n cualquiera. También se escriben con
un solo ı́ndice,
A = ( a1 a2 . . . an ) ,
siendo escalares cada una de sus columnas.
c) Matrices cuadradas: Se llaman ası́ aquellas en que m = n:
a11 a12 . . . a1n
a21 a22 . . . a2n
A=
.
..
..
...
.
.
an1
an2
...
ann
Tanto sus filas como sus columnas serán vectores de un mismo espacio
IK n . El conjunto de todas ellas se escribe como
M(n, IK).
d) Matrices triangulares: Una matriz cuadrada recibe el nombre de supratriangular cuando
a11 a12 . . . a1n
0 a22 . . . a2n
A=
⇒ aij = 0, ∀i > j.
..
..
...
.
.
0
0
...
ann
En cambio, se llamará infratriangular si
a11
0 ...
0
0
a21 a22 . . .
A=
⇒ aij = 0, ∀i < j.
..
..
...
.
.
an1
an2
. . . ann
Unas y otras se nombran como triangulares.
e) Matrices diagonales: En toda matriz cuadrada A = (aij ), se llama
diagonal al vector
(a11 , a22 , . . . , ann ) ∈ IK n .
Se dirá que esta matriz es diagonal cuando sean nulos todos los coeficientes
situados fuera de la diagonal, es decir, cuando
aij = 0, ∀i 6= j.
Estas matrices son a la vez supra e infratriangulares. A veces sus coeficientes se presentan con un solo ı́ndice, usándose las escrituras
a1 0 . . . 0
0 a2 . . . 0
A=
= Diag.(a1 , a2 , . . . , an ).
..
..
...
.
.
0
0
...
an
162
Capı́tulo 11. Matrices y sus Operaciones
1. Matrices escalares: Damos este nombre a las matrices diagonales
A = Diag.(a, a, . . . , a) ∈ M(n, IK)
cuyos coeficientes en la diagonal son todos iguales. Si n = 1, todas las
matrices son escalares y el conjunto de ellas se confunde con IK.
2. Matrices unidad: Para cada n ≥ 1, se llama ası́ a la matriz escalar
1 0 ... 0
0 1 ... 0
= Diag.(1, 1, . . . , 1).
In =
..
... ...
.
0
0
...
1
Cuando no haya lugar a confusión, escribiremos simplemente I. Usando
las deltas de Kronecker (sección 5.11) puede escribirse
In = [δij ]
11.4.
Espacios vectoriales de matrices
Dadas dos matrices A, B ∈ M(m, n, IK) y dado un número a ∈ IK, las reglas
Cj (A + B) = Cj (A) + Cj (B), Cj (aA) = aCj (A), ∀j ∈ [1, n],
definen nuevas matrices A+B, aA ∈ M(m, n, IK), llamadas matriz suma de A
con B y matriz producto del número a por la matriz A, respectivamente.
Proposición 143 La adición de matrices y la multiplicación de números por
matrices hacen de M(m, n, IK) un espacio vectorial sobre IK.
Demostracion:
Aplicando a las columnas las respectivas propiedades del espacio IK m , resulta que la adición de matrices es asociativa y conmutativa, ası́ como que la
multiplicación de números por matrices tiene la propiedad modular, la asociativa
mixta, la distributiva para la suma de matrices y la distributiva para la suma de
escalares. Denotando por 0 la matriz de M(m, n, IK) tal que Cj (0) = 0 ∈ IK m
para cada j ∈ [1, n], es obvio que
A + 0 = 0 + A = A, ∀A ∈ M(m, n, IK)
con lo que la matriz 0 es elemento neutro en la adición, y será nombrada como
matriz nula de m filas y n columnas. Fijada A ∈ M(m, n, IK), construı́mos
otra matriz, denotada como −A, de manera que Cj (−A) = −Cj (A) para cada
j ∈ [1, n]. Entonces,
A + (−A) = (−A) + A = 0,
11.5.
Dimensión del espacio de matrices
163
es decir, −A es el elemento simétrico de A en la adición de matrices, razón por
que −A se llamará matriz opuesta de la matriz A.
2
Estas operaciones se definirı́an con los coeficientes mediante las reglas
eij (A + B) = eij (A) + eij (B), eij (aA) = aeij (A),
∀i ∈ [1, m], ∀j ∈ [1, n].
También podrı́amos haberlo hecho con las filas:
Fi (A + B) = Fi (A) + Fi (B), Fi (aA) = aFi (A), ∀i ∈ [1, m].
11.5.
Dimensión del espacio de matrices
Para cada h ∈ [1, m], k ∈ [1, n], sea Ehk ∈ M(m, n, IK) la matriz tal que
½
0 si j 6= k
Cj (Ehk ) =
eh si j = k
o sea, la matriz de columnas todas nulas excepto la k-ésima, ocupada por el
vector h-ésimo del sistema canónico de IK m . Sus coeficientes serán nulos salvo
el situado en la fila h-ésima y en la columna k-ésima que vale 1. Las filas son
nulas salvo la h-ésima, donde estará el vector k- ésimo del sistema canónico de
IK n . Habrá mn matrices de este tipo.
Proposición 144 El conjunto {Ehk /h ∈ [1, m], k ∈ [1, n]} forma una base del
espacio M(m, n, IK). Por tanto,
dim(M(m, n, IK)) = mn.
Demostracion:
De acuerdo con las operaciones vectoriales entre matrices, se tendrá
a11 a12 . . . a1n
m X
n
a21 a22 . . . a2n X
.
=
ahk Ehk,
.
.
..
..
..
am1
am2
...
h=1 k=1
amn
lo que prueba que el conjunto {Ehk } es un sistema generador de M(m, n, IK).
Por otra parte,
a11 a12 . . . a1m
m
n
XX
a21 a22 . . . a2m
ahk Ehk = 0 ⇒
=0⇒
..
..
...
.
.
h=1 k=1
an1
an2
. . . anm
⇒ ahk = 0, ∀h ∈ [1, m], ∀k ∈ [1, n],
es decir, se trata de un conjunto libre.
2
Esta base se conoce como la base canónica de M(m, n, IK). Para cada matriz
A, sus coeficientes coinciden con las coordenadas en esta base.
164
Capı́tulo 11. Matrices y sus Operaciones
11.6.
Multiplicación de matrices
Sean tres números enteros m, r, n ≥ 1 y sean dos matrices
A = (aih ) ∈ M(m, r, IK), B = (bhj ) ∈ M(r, n, IK).
Que la cantidad r de columnas de A coincida con la cantidad de filas de B, y,
por tanto, con la cantidad de componentes numéricas de cada columna en B,
permite construir una nueva matriz
A × B ∈ M(m, n, IK),
mediante la regla
r
X
Cj (A × B) =
bhj Ch (A), ∀j ∈ [1, n].
h=1
Se llama matriz producto de A por B, debiéndose insistir en que su existencia
es imposible si la cantidad de columnas de A difiere de la de filas de B.
Suponiendo que A × B = (cij ), se tendrá
Cj (A × B) = (c1j , c2j , . . . , cmj ) =
r
X
bhj (a1h , a2h , . . . , amh ) =
h=1
=
r
X
(a1h bhj , a2h bhj , . . . , amh bhj ) =
h=1
=(
r
X
a1h bhj ,
h=1
r
X
a2h bhj , . . . ,
h=1
⇒ cij = eij (A × B) =
r
X
r
X
amh bhj ) ⇒
h=1
aih bhj , ∀i ∈ [1, m], ∀j ∈ [1, n],
h=1
que es la forma en que usualmente se define el producto.
Por otra parte,
(ci1 , ci2 , . . . , cin ) = (
r
X
aih bh1 ,
h=1
=
r
X
r
X
aih bh2 , . . . ,
h=1
(aih bh1 , aih bh2 , . . . , aih bhn ) =
h=1
r
X
r
X
aih bhn ) =
h=1
aih (bh1 , bh2 , . . . , bhn ) ⇒
h=1
⇒ Fi (A × B) =
r
X
aih Fh (B), ∀i ∈ [1, m],
h=1
que serı́a la forma de definir el producto usando las filas.
11.7.
Propiedades de la multiplicación de matrices
11.7.
165
Propiedades de la multiplicación de matrices
Comprobando la igualdad entre los vectores columna de cada miembro de la
igualdad propuesta, y nombrando los coeficientes de cada matriz con las mismas
letras, pero en minúscula, indiquemos las propiedades de esta nueva operación.
Proposición 145 La multiplicación de matrices cumple las propiedades
a) Asociativa:
A ∈ M(m, r, IK), B ∈ M(r, s, IK), C ∈ M(s, n, IK) ⇒
⇒ (A × B) × C = A × (B × C).
b) Distributiva:
A, B ∈ M(m, r, IK), C ∈ M(r, n, IK) ⇒ (A + B) × C = A × C + B × C,
A ∈ M(m, r, IK), B, C ∈ M(r, n, IK) ⇒ A × (B + C) = A × B + A × C.
c) De neutralidad:
A =∈ M(m, n, IK) ⇒ Im × A = A = A × In
d) Asociativa mixta:
A ∈ M(m, r, IK), B ∈ M(r, n, IK), a ∈ IK ⇒
⇒ (aA) × B = a(A × B) = A × (aB).
Demostracion:
a) Cj ((A × B) × C) =
=
Ps
k=1 ckj Ck (A × B) =
Pr
Ps
k=1 ckj (
h=1 bhk Ch (A)) =
r X
s
r
X
X
(
bhk ckj )Ch (A) =
ehj (B × C)Ch (A) = Cj (A × (B × C)).
h=1 k=1
b) Cj ((A + B) × C) =
=
r
X
h=1
Pr
h=1 chj Ch (A + B) =
(chj Ch (A) + chj Ch (B)) =
h=1
r
X
Pr
h=1 chj (Ch (A) + Ch (B)) =
chj Ch (A) +
h=1
r
X
chj Ch (B) =
h=1
= Cj (A × C) + Cj (B × C) = Cj (A × C + B × C),
r
r
X
X
Cj (Ax(B + C)) =
ehj (B + C)Ch (A) =
(bhj + chj )Ch (A) =
h=1
=
r
X
(bhj Ch (A) + chj Ch (A)) =
h=1
h=1
r
X
h=1
bhj Ch (A) +
r
X
chj Ch (A) =
h=1
= Cj (A × B) + Cj (A × C) = Cj (A × B + A × C).
166
Capı́tulo 11. Matrices y sus Operaciones
c) Cj (Im × A) =
Pr
h=1 ahj Ch (In ) =
= Cj (A) =
r
X
Pr
h=1 ahj eh = (a1j , a2j , . . . , amj ) =
δhj Ch (A) = Cj (A × In ).
h=1
d) Cj ((aA) × B) =
=
r
X
Pr
h=1 bhj Ch (aA) =
(bhj a)Ch (A) =
h=1
r
X
Pr
h=1 bhj (aCh (A)) =
(abhj )Ch (A) =
h=1
=a
r
X
r
X
a(bhj Ch (A)) =
h=1
bhj Ch (A) = aCj (AxB) = Cj (a(AxB)) =
h=1
= aCj (AxB) = a
r
X
bhj Ch (A) =
h=1
=
r
X
h=1
(abhj )Ch (A) =
r
X
r
X
a(bhj Ch (A)) =
h=1
ehj (aB)Ch (A) = Cj (A × (aB)).
h=1
Para la propiedad conmutativa, se observa que B ×A no siempre existe. Lo
hace si y sólo si n = m, pero, como A×B ∈ M(n, IK) y B ×A ∈ M(r, IK),
no son comparables en igualdad salvo que r = n y sólo entonces. Es decir,
A×B y B ×A existen y pueden compararse si y sólo si se trata de matrices
cuadradas con igual cantidad de filas y columnas. Aún ası́, los ejemplos
muestran que la conmutatividad no siempre está asegurada:
µ
¶ µ
¶ µ
¶ µ
¶ µ
¶ µ
¶
2 1
1 1
2 3
5 2
1 1
2 1
×
=
6=
=
×
.
3 1
0 1
3 4
3 1
0 1
3 1
2
11.8.
El álgebra de las matrices cuadradas
Si A, B ∈ M(n, IK) también A × B ∈ M(n, IK), luego la multiplicación es una
operación interna de M(n, IK). Según las propiedades anteriores, es asociativa
y distributiva respecto de la adición. Ası́, M(n, IK) es un anillo unitario, actuando la matriz In como elemento unidad, pero no conmutativo. Como era
un espacio vectorial sobre IK, y observando que las dos multiplicaciones están
ligadas por una propiedad asociativa mixta, se concluye que M(n, IK) es un
álgebra asociativa, unitaria y no conmutativa sobre IK.
Si dos matrices A, B ∈ M(n, IK) cumplen que
A × B = B × A,
se dirá que son matrices permutables.
11.9.
El grupo lineal de grado n
167
De acuerdo con la definición del producto de números por matrices, se entiende
que para una matriz escalar se tenga
Diag.(a, a, . . . , a) = aI.
Entonces, se comprueba que la aplicación
IK → M(n, IK), de ley a 7→ aI
es un monomorfismo de anillos que hace aIK isomorfo con el subcuerpo (conmutativo) de M(n, IK) formado por todas las matrices escalares. Por otra parte es
de fácil demostración que una matriz escalar conmuta con cualquier otra matriz
cuadrada, y puede probarse el resultado recı́proco: Si una matriz conmuta con
cualquier otra, es una matriz escalar.
11.9.
El grupo lineal de grado n
Por ser M(n, IK) un anillo unitario, pueden existir elementos invertibles. En lo
sucesivo los llamaremos matrices invertibles o inversibles. Es decir,
A ∈ M(n, IK) será invertible si existe otra B ∈ M(n, IK) tal que
A × B = B × A = In .
Esta matriz B, recibe el nombre de inversa de A y se denota A−1 .
Como en todo anillo unitario, el conjunto de matrices invertibles será un grupo
multiplicativo. Se denota por
GL(n, IK)
y se conoce como grupo lineal de grado n.
Como en todo anillo unitario, se tiene que
∀A, B ∈ GL(n, IK) ⇒ (A × B)−1 = B −1 × A−1 , (A−1 )−1 = A.
Si la aplicación a 7→ aI de IK en M(n, IK) la restringimos al grupo multiplicativo
IK ∗ , éste se hace isomorfo al subgrupo (abeliano) de GL(n, IK) formado por las
matrices escalares no nulas. Estas conmutan con cualquier matriz invertible y
puede probarse que, recı́procamente, una matriz invertible que conmute con las
restantes matrices invertibles es escalar y no nula.
11.10.
Traza de una matriz cuadrada
Dada una matriz cuadrada A = [aij ] ∈ M(n, IK), la suma de los coeficientes
situados en la diagonal, es decir, el número
tr(A) = a11 + a22 + . . . + ann ,
se conoce como traza de A.
168
Capı́tulo 11. Matrices y sus Operaciones
Proposición 146 Cualesquiera que sean A, B ∈ M(n, IK), a ∈ IK, se cumple
tr(A + B) = tr(A) + tr(B), tr(aA) = atr(A).
Demostracion:
Basta unir las reglas operativas y la definición de traza.
2
Este teorema indica que la traza es una forma lineal del espacio M(n, IK).
Proposición 147 Dadas A, B ∈ M(n, IK), se cumple
tr(A × B) = tr(B × A).
Demostracion:
tr(A × B) =
n
X
eii (A × B) =
i=1
=
r X
n
X
(
h=1 i=1
bhi aih ) =
n X
r
X
(
aih bhi ) =
i=1 h=1
r
X
ehh (B × A) = tr(B × A).
h=1
2
11.11.
Trasposición de matrices
Dada una matriz A ∈ M(m, n, IK) llamaremos traspuesta de A a una nueva
matriz At ∈ M(n, m, IK) definida por cualquiera de las reglas equivalentes
Ci (At ) = Fi (A), ∀i ∈ [1, m],
eji (At ) = eij (A), ∀i ∈ [1, m] y ∀j ∈ [1, n],
Fj (At ) = Cj (A), ∀j ∈ [1, n].
Proposición 148 Cualesquiera que sean A, B ∈ M(m, n, IK), a ∈ IK, se
cumple
(A + B)t = At + B t , (aA)t = aAt , (At )t = A.
Demostracion:
1. Ci ((A + B)t ) = Fi (A + B) = Fi (A) + Fi (B) =
= Ci (At ) + Ci (B t ) = Ci (At + B t ), ∀i ∈ [1, n] ⇒ (A + B)t = At + B t .
2. Ci ((aA)t ) = Fi (aA) = aFi (A) = aCi (At ) =
= Ci (aAt ), ∀i ∈ [1, n] ⇒ (aA)t = aAt .
11.11.
Trasposición de matrices
169
3. Ci ((At )t ) = Fi (At ) = Ci (A), ∀i ∈ [1, n] ⇒ (At )t = A.
2
La aplicación
t
: M(m, n, IK) → M(n, m, IK), de ley A 7→ At ,
se nombra como proceso de trasposición. De las dos primeras propiedades
se sigue que se trata de una aplicación lineal. De la última se desprende que es
una biyección y que su inversa es la trasposición
t
: M(n, m, IK) → M(m, n, IK).
Por tanto, la trasposición es un isomorfismo lineal de M(m, n, IK) sobre M(n, m, IK).
En el caso m = n (matrices cuadradas) se trata de un automorfismo inverso de
sı́ mismo.
Proposición 149 Dadas matrices A ∈ M(m, r, IK), B ∈ M(r, n, IK), se cumple
(A × B)t = B t × At .
Demostracion:
Basta ver que, para todo i ∈ [1, n], se cumple
Ci ((A × B)t ) = Fi (A × B) = ei1 (A)F1 (B) + . . . + ein (A)Fn (B) =
= e1i (At )C1 (B t ) + . . . + eni (At )Cn (B t ) = Ci (B t × At ).
2
Proposición 150 Si A ∈ M(n, IK) es invertible, su traspuesta también lo es y
la inversa de la traspuesta es la traspuesta de la inversa.
Demostracion:
Trasponiendo en A × A−1 = A−1 × A = I, y observando que I t = I porque
la diagonal no se altera por trasposición, se obtiene
(A × A−1 )t = (A−1 )t × At = I t = I = (A−1 × A)t = At × (A−1 )t ⇒
⇒ (At )−1 = (A−1 )t .
2
170
Capı́tulo 11. Matrices y sus Operaciones
11.12.
Matrices simétricas y antisimétricas
Si A ∈ M(n, IK), también At ∈ M(n, IK). Entonces, pueden compararse en
igualdad y surgen dos conceptos importantes (simetrı́a y antisimetrı́a) del álgebra matricial. Para su estudio será preciso suponer que IK sea un cuerpo conmutativo de caracterı́stica distinta de 2.
Se dice que A = [aij ] ∈ M(n, IK) es una matriz simétrica cuando
At = A ⇔ Ci (A) = Fi (A), ∀i ∈ [1, n] ⇔ aji = aij , ∀i, j ∈ [1, n].
Si A es simétrica, los elementos de la diagonal no se alteran por trasposición,
luego toman valores arbitrarios. También lo hacen los elementos aij , con i < j,
situados por encima de la diagonal, mientras que cada aji situado abajo se iguala
al aij . Entonces, el aspecto de A será
a11 a12 . . . a1n
a12 a22 . . . a2n
.
.
..
..
..
.
.
a1n
a2n
. . . ann
Proposición 151 Las matrices simétricas constituyen un subespacio vectorial
del M(n, IK).
Demostracion:
Si A y B son simétricas y a ∈ IK, se tiene
(A + B)t = At + B t = A + B, (aA)t = aAt = aA.
2
Se denota por S(n, IK) y no se trata de un subanillo pues en general
(A × B)t = B t × At = B × A 6= A × B.
Se dice que A es una matriz antisimétrica (o hemisimétrica) cuando
At = −A ⇔ Ci (A) = −Fi (A), ∀i ∈ [1, n] ⇔ aji = −aij , ∀i, j ∈ [1, n].
Si A es antisimétrica los elementos diagonales, por coincidir con sus opuestos,
son nulos. Para i < j, aji se iguala a −aij , luego sólo toman valores arbitrarios
los situados encima de la diagonal. La matriz, pues, se presenta ası́:
0
a12 . . . a1n
0
. . . a2n
−a12
.
.
..
..
..
.
.
−a1n
−a2n
...
0
11.13.
Parte simétrica y parte antisimétrica de una matriz cuadrada
171
Proposición 152 Las matrices antisimétricas constituyen un subespacio vectorial del M(n, IK).
Demostracion:
Si A y B son antisimétricas y a ∈ IK, se tiene
(A + B)t = At + B t = (−A) + (−B) = −(A + B),
(aA)t = aAt = a(−A) = −(aA).
Se denota por A(n, IK) y tampoco se trata de un subanillo porque
(A × B)t = B t × At = (−B) × (−A) = B × A 6= −(A × B).
2
11.13.
Parte simétrica y parte antisimétrica de
una matriz cuadrada
Sea IK un cuerpo conmutativo de caracterı́stica distinta de 2. Sea n ≥ 1 un
número entero. En el espacio M(n, IK) la trasposición se comporta como un
automorfismo involutivo (proposición 148), es decir, como una simetrı́a. Si lo
denotamos como t, es decir,
t(A) = At ,
su proyector asociado, esta vez denotado como s, será el endomorfismo
s = (I + t)/2,
que a una matriz cuadrada A le asocia la matriz
s(A) = (
I +t
A + At
)(A) =
.
2
2
El otro endomorfismo proyector, denotado como h, será el
h = I − s = (I − t)/2,
que a una matriz cuadrada A le asocia la matriz
h(A) = (
A − At
I −t
)(A) =
.
2
2
Proposición 153 Se cumple
Im s = S(n, IK), Ker s = A(n, IK), M(n, IK) = S(n, IK) ⊕ A(n, IK).
172
Capı́tulo 11. Matrices y sus Operaciones
Demostracion:
Por la definición de matriz simétrica, cada una de ellas es un elemento doble
en el proceso de trasposición. Análogamente, por la definición de las antisimétricas, resulta que éstas se cambian por trasposición en su opuesta. Entonces, de
la proposición 102 se sigue que
Ims = S(n, IK), Ker s = A(n, IK).
La suma directa procede de aplicar que, siendo s un proyector, V es suma directa
de Im s y Ker s (proposición 101).
2
En la descomposición
A + At
A − At
+
2
2
de una matriz cuadrada como suma de una simétrica y otra antisimétrica, el
primer sumando recibe el nombre de parte simétrica de A y el segundo el de
parte antisimétrica de A.
A=
11.14.
Matrices hermı́ticas y antihermı́ticas
Matrices simétricas y antisimétricas son importantes en la Geometrı́a de los
espacios reales. Sin embargo, en Análisis Superior y en Fı́sica Teórica, los espacios más usuales lo son sobre los números complejos, apareciendo otros conceptos (matrices hermı́ticas y antihermı́ticas) que ocupan el sitio de las matrices
simétricas y antisimétricas reales.
Empecemos por recordar que en los complejos, cada escalar
a = R(a) + iI(a)
tiene un conjugado
a = R(a) − iI(a),
cumpliéndose que
a + b = a + b, ab = ab, a = a,
o sea, que la conjugación es un automorfismo involutivo del cuerpo C.
I
Este concepto se extiende a vectores: para cada
x = (x1 , x2 , . . . , xn ) ∈ C
I n,
su vector conjugado se define mediante la regla
x = (x1 , x2 , . . . , xn ),
e inmediatamente a matrices: si A = (aij ) ∈ M(m, n,C),
I su matriz conjugada
se define por cualquiera de las leyes equivalentes
Cj (A) = Cj (A), ∀j ∈ [1, n],
11.15.
Complementos / Ejercicios
173
Fi (A) = Fi (A), ∀i ∈ [1, m],
A = (aij ), ∀i ∈ [1, m]y∀j ∈ [1, n].
Entonces, una matriz cuadrada A ∈ M(n,C)
I se dice hermı́tica cuando
t
At = A ⇒ A = A ,
y antihermı́tica cuando
t
At = −A ⇒ −A = A .
11.15.
Complementos / Ejercicios
1. Dentro del espacio M(2, IR), dilucidar qué subconjuntos U forman subespacio vectorial
¶
µ
a b
a) U = {
/a = d = 1}
c d
µ
¶
a b
b) U = {
/b = c}
c d
µ
¶
a b
c) U = {
/ad − bc 6= 0}
c d
µ
¶
a b
d) U = {
/a = d = 0}
c d
2. Decidir si las cuatro siguientes matrices
µ
¶
µ
¶
µ
¶
µ
1 1
0 0
1 0
0
A1 =
, A2 =
, A3 =
, A4 =
1 1
1 0
1 1
0
1
0
¶
,
forman o no una base del espacio M(2, IR).
3. Dilucidar si las cuatro siguientes matrices
µ
¶
µ
¶
µ
1 1
−1 0
−1
A1 =
, A2 =
, A3 =
1 1
0 −1
0
1
−1
¶
µ
, A4 =
−1 2
1 1
¶
,
forman o no una base del espacio M(2, IR).
4. Comprobar que en el espacio M(2,C),
I las cuatro matrices
µ
¶
µ
¶
µ
¶
µ
1 0
0 1
0 −i
1
I=
, P1 =
, P2 =
, P3 =
0 1
1 0
i 0
0
0
−1
¶
,
forman una base (las matrices Pj se conocen como matrices de Pauli).
¿Qué coordenadas tiene en ella una matriz genérica?
174
Capı́tulo 11. Matrices y sus Operaciones
5. Toda matriz A ∈ M(2,C)
I es suma de una matriz escalar y otra de traza
nula. Obtener esta descomposición y razonar que es única. Por tanto,
M(2,C)
I =C
I ⊕ P,
donde P es el subespacio generado por las matrices de Pauli.
6. Si A, B son simétricas y permutables, véase que A × B es simétrica.
7. Sea A ∈ M(n, IK) y sea h ∈ IN . Razonar que (At )h = (Ah )t
8. Si A es antisimétrica, ¿cómo son sus potencias?
9. Dentro de M(3, IK) se considera el conjunto de matrices de la forma
1 a b
0 1 c.
0 0 1
Razonar que forman grupo para la multiplicación, indicando la matriz
inversa de cada una de ellas.
10. Razonar que dentro del álgebra M(n, IK) las matrices supratriangulares,
las infratriangulares, las diagonales y las escalares forman en cada caso
una subálgebra unitaria.
11. Una matriz A = [aij ] ∈ M(n, IK) se llama estrictamente supratriangular cuando sea supratriangular y tenga nulos todos sus coeficientes
diagonales, o sea, cuando aij = 0 siempre i ≥ j. Razonar que el conjunto
de todas ellas es un subespacio de M(n, IK). ¿Es subanillo? ¿Es unitario?
12. Una matriz A = (aij ) ∈ M(n, IK) se llama estrictamente infratriangular cuando sea infratriangular y tenga nulos todos sus coeficientes
diagonales, o sea, cuando aij = 0 siempre i ≤ j. Razonar que el conjunto
de todas ellas es un subespacio de M(n, IK). ¿Es subanillo? ¿Es unitario?
13. Encontrar una base e indicar la dimensión de los siguientes subespacios
de M(n, IK):
a) ST (n, IK) = {A/A es supratriangular}
b) IT (n, IK) = {A/A es infratriangular}
c) ST E(n, IK) = {A/A es supratriangular estricta}
d ) IT E(n, IK) = {A/A es infratriangular estricta}
e) D(n, IK) = {A/A es diagonal}
f ) E(n, IK) = {A/A es escalar}
14. Dentro del espacio M(n, IK), se considera el subespacio S(n, IK) de las
matrices simétricas. Encontrar una base del mismo, razonando que
dim(S(n, IK)) = (n2 + n)/2.
11.15.
Complementos / Ejercicios
175
15. Dentro del espacio M(n, IK), se considera el subespacio A(n, IK) de las
matrices antisimétricas. Encontrar una base del mismo, razonando que
dim(A(n, IK)) = (n2 − n)/2.
16. Sea {Ehk } la base canónica de M(m, n, IK). Razonar que
Cj (Ehk ) = δjk eh , Fi (Ehk ) = δih ek , eij (Ehk ) = δih δjk .
17. Sean Ehk , Epq dos matrices básicas de M(n, IK). Razonar que
Ehk × Epq = δpk Ehq , Ehk × Ehk = δhk Ehk .
18. Sea C ∈ M(n, IK). Razonar que las tres siguientes afirmaciones equivalen
entre sı́:
a) C conmuta con toda matriz A ∈ M(n, IK)
b) C conmuta con toda matriz básica Ehk
c) Existe un escalar λ tal que C = λI
19. Sea Ehk una matriz básica de M(n, IK), con h 6= k. Razonar que la matriz
I + Ehk es invertible y que (I + Ehk )−1 = I − Ehk .
20. Demostrar que una matriz C ∈ GL(n, IK) conmuta con toda matriz
A ∈ GL(n, IK) si y sólo si es una matriz escalar no nula (Esto significa que
el centro del grupo lineal lo forman las matrices escalares no nulas).
21. Sea n ≥ 2, sean h, k dos ı́ndices tales que h 6= k. La matriz cuadrada
Chk ∈ M(n, IK) de columnas
Ch (Chk ) = ek , Ck (Chk ) = eh , Cj (Chk ) = ej si j 6= h, j 6= k,
se conoce como una matriz elemental de trasposición. ¿Cómo son sus
filas? Razonar que Chk es invertible y que (Chk )−1 = Chk .
22. Dadas las matrices A ∈ M(m, n, IK), Chk ∈ M(n, IK), razonar que
A × Chk se obtiene aplicando a la matriz A la operación Ch (A) ↔ Ck (A).
23. Dadas las matrices Chk ∈ M(m, IK), A ∈ M(m, n, IK), razonar que Chk ×
A se obtiene aplicando a la matriz A la operación Fh (A) ↔ Fk (A).
24. Sea n ≥ 2, sea 1 ≤ h ≤ n, sea λ 6= 0. La matriz
h
z}|{
Dh (λ) = Diag.(1, . . . , λ , . . . , 1) ∈ M(n, IK)
se conoce como una matriz elemental de deformación. Razonar que
es invertible y que (Dh (λ))−1 = Dh (λ−1 ).
176
Capı́tulo 11. Matrices y sus Operaciones
25. Dadas las matrices A ∈ M(m, n, IK), Dh (λ) ∈ M(n, IK), ver que
A × Dh (λ) se obtiene aplicando sobre A la operación elemental
Ch (A) ↔ λCh (A).
26. Dadas las matrices Dh (λ) ∈ M(m, IK), A ∈ M(m, n, IK), ver que
Dh (λ) × A se obtiene aplicando sobre A la operación elemental
Fh (A) ↔ λFh (A).
27. Sea n ≥ 2, sean h, k dos ı́ndices tales que h 6= k. La matriz cuadrada
Thk (λ) = I + λEhk ∈ M(n, IK),
se conoce como una matriz elemental de transvección. Razonar que
es invertible y que (Thk (λ))−1 = Thk (−λ).
28. Dadas las matrices A ∈ M(m, n, IK), Thk (λ) ∈ M(n, IK), razonar que la
matriz A × Thk (λ) ∈ M(m, n, IK) se obtiene aplicando a la matriz A la
operación elemental Ck (A) ↔ Ck (A) + λCh (A).
29. Dadas las matrices Thk (λ) ∈ M(m, IK), A ∈ M(m, n, IK), razonar que la
matriz Thk (λ) × A ∈ M(m, n, IK) se obtiene aplicando a la matriz A la
operación elemental Fh (A) ↔ Fh (A) + λFk (A).
177
Capı́tulo 12
Rango de una Matriz
12.1.
Rango de una matriz
Dada una matriz A ∈ M(m, n, IK) se llama rango por columnas de A
al rango s de los vectores Cj (A) del espacio IK m . Coincidirá con la cantidad
máxima de columnas linealmente independientes y se podrán elegir s columnas
independientes tales que las otras n − s sean combinación lineal de ellas.
El rango por filas de A es el rango r de los vectores Fi (A) del espacio IK n .
Coincide con la cantidad máxima de filas linealmente independientes y se podrán
fijar r filas independientes tales que las m − r restantes sean combinación lineal
de ellas.
Proposición 154 Si A = (aij ) ∈ M(m, n, IK), su rango por columnas y por
filas coinciden.
Demostracion:
a) Sea s el rango por columnas. Habrá s columnas independientes, y las
restantes q = n − s serán combinación lineal de ellas. Suponiendo, por
ejemplo, que las columnas independientes sean las s primeras, existirán
unos números αhj , con h ∈ [1, s], j ∈ [1, q], de manera que
Cs+j (A) =
s
X
αhj Ch (A), ∀j ∈ [1, q].
h=1
Pasando a componentes la anterior igualdad, tenemos
(a1s+j , a2s+j , . . . , ams+j ) =
s
X
αhj (a1h , a2h , . . . , amh ) =
h=1
=
s
X
h=1
(αhj a1h , αhj a2h , . . . , αhj amh ) =
178
Capı́tulo 12. Rango de una Matriz
=(
s
X
αhj a1h ,
h=1
s
X
αhj a2h , . . . ,
h=1
⇒ ais+j =
s
X
s
X
αhj amh ) ⇒
h=1
αhj aih , ∀i ∈ [1, m].
h=1
Entonces, para cada fila de la matriz, y usando la base canónica {e1 , e2 , . . . , en }
de IK n , tenemos
Fi (A) = (ai1 , ai2 , . . . , ain ) = ai1 e1 + ai2 e2 + . . . + ain en =
= (ai1 e1 + ai2 e2 + . . . + ais es )+
+(ais+1 es+1 + ais+2 es+2 + . . . + ais+q es+q ) =
=
s
X
aih eh +
h=1
q X
q
s
s
s
X
X
X
X
(
αhj aih )es+j =
aih eh +
aih (
αhj es+j ) =
j=1 h=1
=
s
X
h=1
aih (eh +
h=1
s
X
αhj es+j ) =
h=1
h=1
s
X
j=1
aih uh ,
h=1
donde los vectores
uh = eh +
q
X
αhj es+j , h ∈ [1, s],
j=1
son iguales para todas las filas por no depender del lugar i de las mismas.
Pero esto quiere decir que
Fi (A) ∈< u1 , u2 , . . . , us >, ∀i ∈ [1, m],
con lo cual la cantidad máxima posible de filas independientes, es decir
el rango r por filas, de acuerdo con el Teorema de Steinitz, no supera al
cardinal s. Ası́ queda probado que el rango por filas es menor o igual que
el rango por columnas.
b) Un razonamiento similar, cambiando filas por columnas, asegura la desigualdad contraria, llegando, pues, a la igualdad de los rangos.
2
Demostrado esto, el valor común de los rangos por columnas y filas se conoce
como rango de la matriz A, y se anota por rang.(A). En todo caso, se
cumplirá que rang.(A) ≤ mı́n.(m, n).
Proposición 155 Cualquiera que sea la matriz A ∈ M(m, n, IK), se cumple
rang(At ) = rang(A)
Demostracion:
Es consecuencia inmediata de la proposición 154.
2
12.2. Matrices cuadradas regulares
12.2.
179
Matrices cuadradas regulares
Una matriz A ∈ M(n, IK) se dirá matriz regular cuando
rang(A) = n.
En caso contrario, se dirá que A es una matriz singular.
Una matriz cuadrada regular tendrá, pues, independientes tanto sus n columnas
como sus n filas. Siendo unas y otras vectores de IK n y estando en cantidad igual
a la dimensión, de hecho constituirán una base de IK n .
La matriz unidad I, cuyas columnas son los vectores ej de la base canónica de
IK n , será el primer ejemplo de matriz regular.
Proposición 156 Una matriz A ∈ M(n, IK) es regular si y sólo si admite una
inversa B por la derecha.
Demostracion:
Si I = A × B ⇒ ej = b1j C1 (A) + b2j C2 (A) + . . . + bnj Cn (A), para todo
j ∈ [1, n]. Entonces, las columnas de A, por generar a los vectores de la base
canónica, generan a IK n . Como su cardinal es igual a la dimensión, formarán
otra base, luego son independientes y A es regular.
Si A es regular, sus columnas son base de IK n , luego existen coeficientes bhj
tales que
ej = b1j C1 (A) + b2j C2 (A) + . . . + bnj Cn (A), ∀j ∈ [1, n].
Siendo B = [bhj ], estas igualdades significan que I = A × B.
2
Proposición 157 Si A ∈ M(n, IK) es regular, su traspuesta también lo es.
Demostracion:
En la trasposición se intercambian filas y columnas. Entonces, basta aplicar
que el rango de unas y otras coincide (proposición 155).
2
Proposición 158 Una matriz A ∈ M(n, IK) es regular si y sólo si admite una
inversa C por la izquierda.
Demostracion:
Si I = C × A ⇒ I = I t = (C × A)t = At × C t , luego At es regular porque
admite a C t como inversa a la derecha. Entonces, A = (At )t también es regular.
Si A es regular, At lo es y tiene una inversa B a la derecha:
I = At × B ⇒ I = I t = (At × B)t = B t × (At )t = B t × A,
luego A admite a C = B t como inversa por la izquierda.
2
180
Capı́tulo 12. Rango de una Matriz
Proposición 159 Una matriz A ∈ M(n, IK) es regular si y sólo si es invertible.
Demostracion:
Si A es invertible, tiene inversa a cualquier lado, luego es regular.
Si A es regular, existen matrices B y C tales que
I = A × B = C × A.
Ahora bien, aplicando la propiedad asociativa, se obtiene
C = C × I = C × (A × B) = (C × A) × B = I × B = B,
luego la matriz B cumple I = A × B = B × A, y será la inversa de A.
2
Las matrices regulares se igualan, pues, a las invertibles. Pero, por las proposiciones 156 y 158, para saber que una matriz es la inversa de otra, bastará comprobar que es inversa por sólo uno de los dos lados.
12.3.
Caracterización del rango mediante submatrices principales
Dada A ∈ M(m, n, IK) se llaman submatrices de A a las matrices obtenidas
mediante supresión de una o varias lı́neas (columnas o filas) de A. En particular,
nos interesa considerar aquellas submatrices de A que sean cuadradas.
Proposición 160 Toda matriz A ∈ M(m, n, IK) admite submatrices cuadradas
regulares B ∈ M(p, IK), para todo entero positivo p ≤ rang(A).
Demostracion:
Siendo r = rang(A), existen r columnas independientes. Tomando p ≤ r
columnas de entre ellas, siguen siendo independientes. Al suprimir las n − p
restantes, tenemos una submatriz C ∈ M(m, p, IK) con todas sus columnas
independientes, cuyo rango (evaluado por columnas) será p. Entonces, en C
hay también p filas independientes. Al suprimir las m − p restantes, queda una
submatriz B ∈ M(p, IK), con rango (evaluado por filas) igual a p. Por tanto, B
es regular.
2
Proposición 161 Si A ∈ M(m, n, IK) admite una submatriz regular
B ∈ M(p, IK), se deduce que p ≤ rang(A).
Demostracion:
De B podemos pasar a otra submatriz C ∈ M(m, p, IK) formada por las p
columnas de A que intervenı́an en B. Como C mantiene las p filas de B, que
eran independientes, el rango de C (evaluado por filas) es mayor o igual que
p; en realidad no puede ser estrictamente mayor que p porque C sólo tiene p
12.4. Método del orlado para el cálculo del rango
181
columnas, luego rang(C) = p. Pasando, ahora de C a la matriz A, ésta tiene p
columnas coincidentes con las de C, las cuales son linealmente independientes.
Ası́, el rango de A (evaluado por columnas) es mayor o igual que p.
2
Una submatriz P ∈ M(r, IK) se llama submatriz principal de A ∈ M(m, n, IK)
cuando sea regular y todas las submatrices B ∈ M(p, IK), donde r < p, sean no
regulares.
Proposición 162 El rango de A vale r si y sólo si A admite una submatriz
principal P ∈ M(r, IK).
Demostracion:
Supongamos que la matriz A, de rango s, admita una submatriz principal
P ∈ M(r, IK). Por ser P regular, la proposición 161 nos asegura que r ≤ s. Y
no puede ser r < s, pues la proposición 160 nos llevarı́a a tener submatrices
regulares de M(s, IK), en contra de que P sea principal. Por tanto, s = r.
Si rang(A) = r, admite una submatriz regular P ∈ M(r, IK). Si tomamos
cualquier submatriz B ∈ M(p, IK), donde r < p, la proposición 161 impide que
sea regular. Por tanto, P es principal.
2
12.4.
Método del orlado para el cálculo del rango
Fijada una submatriz B ∈ M(p, IK), podemos añadirle una columna con los coeficientes de una de A, no perteneciente a B, situados en las filas que intervengan
en B. Ası́, obtenemos una submatriz de M(p, p + 1, IK). A continuación añadimos una nueva fila con los coeficientes situados en las p + 1 columnas anteriores,
tomados de una fila de A que no estén en B. La submatriz C ∈ M(p + 1, IK)
ası́ construı́da, se dice que es una orla de B.
Proposición 163 Si una submatriz cuadrada regular B ∈ M(p, IK) se orla de todas las maneras posibles con una columna de A ∈ M(m, n, IK) no
perteneciente a B, dando lugar a m−p submatrices de M(p+1, IK) que sean no
regulares, se deduce que dicha columna es combinación lineal de las p columnas
que intervienen en B.
Demostracion:
Como en la proposición 161, sea C ∈ M(m, p, IK) la submatriz de A formada
con las p columnas que intervienen en B. Sabemos que su rango es p. Si a C
le añadimos una nueva columna cogida fuera de B, pasamos a una submatriz
D ∈ M(m, p + 1, IK). Dentro de ella podemos formar m − p orlas de B, cada
una de las cuales tendrá rango mayor o igual que p; ahora bien, por suponerlas
singulares, el rango no puede ser p + 1, luego vale exactamente p. O sea, cada
una de las m − p filas de D que no están en B, es combinación lineal de las p
182
Capı́tulo 12. Rango de una Matriz
filas de B. Ası́ se obtiene que el rango de D (evaluado por filas) es p. Entonces,
D admite como máximo p columnas independientes. De hecho, las p columnas
que intervienen en B son linealmente independientes porque C, que está dentro
de D, tiene rango p. Entonces, la restante columna de D, es decir, la añadida,
es combinación lineal de ellas.
2
Proposición 164 Una submatriz cuadrada P ∈ M(r, IK) de A ∈ M(m, n, IK)
es principal si y sólo si P es regular, pero las submatrices cuadradas de
M(r + 1, IK) obtenidas al orlar P de todas las maneras posibles con coeficientes
de las columnas de A que no intervengan en P son singulares.
Demostracion:
Si P es regular, lo mismo que en la proposición 161, deducimos que las columnas de A que intervienen en P son linealmente independientes. Y, si las orlas de
P formadas con las restantes columnas son singulares, éstas serán combinación
lineal de las que intervienen en B. Ası́ resulta que el rango de A (calculado
por columnas) es r. Entonces, ninguna submatriz cuadrada B ∈ M(p, IK), con
p > r, puede ser regular, pues al aplicar la proposición 161, el rango de A
aumentarı́a. Por tanto, P es principal.
Si P es principal, es regular y son singulares todas las submatrices cuadradas
con cantidad de filas y columnas mayor que r, siéndolo en particular las de r + 1
filas y columnas construı́das al orlar con las restantes columnas.
2
Razonamientos similares, intercambiando los papeles de columnas y filas, permitirı́an demostrar enunciados análogos a los dos últimos en términos de filas.
Por otro lado, señalemos que las proposiciones 162 y 164 fundamentan el llamado
método del orlado para el cálculo del rango de una matriz. Se trata de
un método ascendente cuyos primeros pasos serı́an ası́:
a) Si todos los coeficientes son nulos, el rango es cero. En caso contrario,
fijamos un elemento no nulo y lo orlamos con columnas para obtener submatrices de dos filas y columnas.
b) Si todas fuesen singulares, el rango es uno. En caso contrario, fijamos una
submatriz regular de M(2, IK) y la orlamos con columnas para obtener
submatrices de tres filas y columnas.
Este proceso, además de reiterativo, es finito por serlo la cantidad de filas y
columnas de la matriz, luego nos conducirá a encontrar una submatriz principal
y, por tanto, a conocer el rango.
12.5.
Complementos / Ejercicios
1. Sea una matriz A = M(m, n, IK). Razonar que, efectuando operaciones
elementales con sus filas y eventualmente algún cambio de columnas, puede
pasarse a otra de igual rango en la cual
12.5. Complementos / Ejercicios
183
a) eii = 1 o bien eii = 0
b) eij = 0 si i > j ¿Cuál será el rango de A? (Este proceso se nombra
como triangularización de una matriz por filas).
2. Triangularizar mediante filas e indicar el rango de las siguientes matrices:
µ
¶
2 4
2 3 1
a)
b) 1 2
1 5 4
2 6
0
c) 1
1
1
2
e) 0
2
1
2
2
6
2
1
5
0
0
0
0
0
0
2
3
1
2
1 2
d) 3 2
2 1
5
7
4
12 4
16 4
9 2
2
1
1.
0
2
3. Obtener mediante operaciones elementales el rango y una base del subespacio que generan los vectores columna de la matriz
3
1
a)
0
1
−1 3 4
0 2 5
1 3 11
1 5 16
3
6
,
15
21
4
−2
b) 6
8
4
−1 2
4 15
0
9 .
1 40
1
0
−1 0
15
2
5
1
3 −2
11
3
4. Calcular el rango y señalar una submatriz principal de la matriz
3
2
a) A =
−1
1
10
2
−4
0
12
1
−5
−1
−11
2
,
5
3
1
1
b) B =
1
1
5. Siendo n ≥ 2, establecer que
0 0 ...
0
0 0 ...
0
. .
..
.. .. . . .
rang
.
0 0 ...
0
1 2 ... n − 1
1
2
..
.
0
1
2
1
1
2
3
1
3
6
9
3
−2
0
.
2
2
= 2.
n − 1
n
6. Si A es simétrica y regular, razonar que A−1 también es simétrica.
184
Capı́tulo 12. Rango de una Matriz
7. Si A es regular, razonar que −A también lo es. ¿Cuál es su inversa?
8. Si A es antisimétrica y regular, razonar que su inversa A−1 también es
antisimétrica.
9. Sea A = [aij ] ∈ M(n, IK) una matriz supratriangular. Razonar que es
regular si y sólo si aii 6= 0, ∀i. En tal caso, A−1 también es supratriangular.
10. Para cada vector u = (x1 , x2 , x3 , . . . , xn−2 , xn−1 , xn ) ∈ IK n , sea
x
0
0
A(u) =
.
.
.
x2
x1
0
..
.
x3
x2
x1
..
.
...
...
...
0
0
0
...
1
xn
xn−1
xn−2
..
.
x1
Razonar que la aplicación IK n → M(n, IK), de ley u 7→ A(u), es un
monomorfismo que hace isomorfo aIK n con el subespacio
{A(u)/u ∈ IK n } ⊆ M(n, IK). Describir una base de tal subespacio. ¿En
qué casos es invertible A(u)?
11. Razonar que una matriz cuadrada triangular estricta A no puede ser invertible. Razonar que es nilpotente.
12. Razonar que la matriz
0
1
1
A=
...
1
1
0
1
..
.
1
1
0
..
.
...
...
...
1 1
1 1 1
...
...
1 1
1 1
1 1
∈ M (n, IR)
.. ..
. .
0 1
1 0
es regular siempre que n ≥ 2. Calcular su inversa.
13. Una matriz A ∈ M(m, n, IK) tiene rango 1 si y sólo si existen vectores
a = (a1 , a2 , . . . , am ) 6= 0, b = (b1 , b2 , . . . , bn ) 6= 0,
tales que
a1 bn
a2 bn
.
..
.
a1 b1
a2 b1
A = a × bt =
...
a1 b2
a2 b2
..
.
...
...
am b1
am b2
. . . am bn
14. Sea A ∈ M(n, IK) una matriz con rango 1. Razonar que
A2 = tr(A)A.
12.5. Complementos / Ejercicios
185
15. Sea A ∈ M(n, IK) una matriz con rango 1 y traza distinta de -1. Razonar
que A + I es regular y admite una inversa de la forma αA + I.
16. Comprobar que las matrices A y B son regulares. Calcular la inversa en
cada caso.
1
0
A=
2
2
0
1
0
−1
3 1
3 2
,
3 3
1 1
0
2
B=
0
2
17. Determinar el valor de λ para que la matriz
3 1 1 4
λ 4 10 1
A=
1 7 17 3
2 2 4 3
tenga rango mı́nimo.
0
4
0
6
−1
−13
−1
−6
1
0
0
0
186
Capı́tulo 12. Rango de una Matriz
187
Capı́tulo 13
Determinantes
13.1.
Aplicaciones multilineales
Sea IK un cuerpo conmutativo de caracterı́stica nula. Supongamos que tenemos
p + 1 espacios V1 , V2 , . . . , Vp , V0 sobre IK y una aplicación
t : V1 × V2 × . . . × Vp → V 0 .
Fijado un ı́ndice j ∈ [1, p], se dice que t es lineal en su j-ésima variable
cuando, para cualesquiera datos
x1 ∈ V1 , . . . , xj , yj ∈ Vj , . . . , xp ∈ Vp , a ∈ IK,
se cumpla
t(x1 , . . . , xj + yj , . . . , xp ) = t(x1 , . . . , xj , . . . , xp ) + t(x1 , . . . , yj , . . . , xp ),
t(x1 , . . . , axj , . . . , xp ) = at(x1 , . . . , xj , . . . , xp ).
Si t es lineal en todas sus variables se dice que es una aplicación multilineal
o p-lineal si se quiere aludir a p. Si p = 1,2,3, se habla de aplicaciones lineales, bilineales o trilineales. En general, este tipo de aplicaciones también
se conocen con el nombre de tensores.
Por ejemplo, la función t : V∗ × V → IK, de ley t(σ, x) = σ(x) es bilineal. De
sus estudios anteriores, el lector debe conocer estos otros ejemplos:
a) El producto escalar de vectores libres, tanto del plano como del espacio
geométrico es una aplicación V × V → IR bilineal.
b) El producto mixto de tres vectores libres del espacio es una aplicación
V × V × V → IR trilineal.
c) El producto vectorial de vectores libres del espacio geométrico es una
aplicación V × V → V bilineal.
188
Capı́tulo 13. Determinantes
13.2.
Aplicaciones multilineales alternadas
Sea un entero p ≥ 2, sean V, V0 espacios sobre IK y sea
p
z}|{
t : V × · · · ×V → V0
una aplicación p-lineal. Se dice que t es alternada (o antisimétrica) si, para
cualesquiera i, j tales que 1 ≤ i < j ≤ p, y cualesquiera x1 , . . . , xi , . . . , xj , . . . , xp ∈
V, se cumple
t(x1 , . . . , xj , . . . , xi , . . . , xp ) = −t(x1 , . . . , xi , . . . , xj , . . . , xp ).
O sea, si hacemos una trasposición con los ı́ndices 1, 2, . . . , p del conjunto ordenado de vectores x1 , x2 , . . . , xp , la imagen mediante t cambia de signo. Si p = 1,
toda aplicación lineal se considera alternada.
Fijemos una aplicación p-lineal alternada t de V en V0 y sea Sp el grupo de
permutaciones del conjunto {1, 2, . . . , p} de ı́ndices.
Proposición 165 Si x1 , x2 , . . . , xp se someten a una permutación β ∈ Sp , se
tiene
t(xβ(1) , xβ(2) , . . . , xβ(p) ) = (−1)β t(x1 , x2 , . . . , xp ).
Basta recordar que toda permutación se descompone en trasposiciones y que
cada una de éstas provoca un cambio de signo en la imagen mediante t.
Proposición 166 Si entre x1 , x2 , . . . , xp hay dos vectores iguales, se tiene
t(x1 , x2 , . . . , xp ) = 0.
Demostracion:
Si xi = xj , con 1 ≤ i < j ≤ p, tenemos
t(x1 , . . . , xi , . . . , xj , . . . , xp ) = −t(x1 , . . . , xi , . . . , xj , . . . , xp ) ⇒
⇒ 2t(x1 , . . . , xi , . . . , xj , . . . , xp ) = 0 ⇒ t(x1 , . . . , xi , . . . , xj , . . . , xp ) = 0,
porque IK es de caracterı́stica nula.
2
Proposición 167 Si a uno de los vectores x1 , x2 , . . . , xp se le suma el producto
de un número λ por otro, el valor de t no cambia.
Demostracion:
Si a xi se le suma λxj , se tiene
t(x1 , . . . , xi + λxj , . . . , xj , . . . , xp ) =
13.3.
Formas multilineales y multilineales alternadas
189
= t(x1 , . . . , xi , . . . , xj , . . . , xp ) + λt(x1 , . . . , xj , . . . , xj , . . . , xp ) =
= t(x1 , . . . , xi , . . . , xj , . . . , xp ) + 0 = t(x1 , . . . , xi , . . . , xj , . . . , xp ).
2
Reiterando este enunciado, podrı́amos decir que si a un vector se le suma una
combinación lineal de los restantes, el valor de t no se altera.
Proposición 168 Si los vectores x1 , x2 , . . . , xp son dependientes, se cumple
t(x1 , x2 , . . . , xp ) = 0.
Demostracion:
Si son linealmente dependientes, uno es combinación lineal de los restantes.
Si, por ejemplo, x1 = a2 x2 + . . . + ap xp , se tendrá
t(x1 , x2 , . . . , xp ) = t(a2 x2 + . . . + ap xp , x2 , . . . , xp ) =
= a2 t(x2 , x2 , . . . , xp ) + . . . + ap t(xp , x2 , . . . , xp ) = 0,
pues en cada sumando t actúa sobre vectores en los que hay dos iguales.
2
Proposición 169 Si t(x1 , x2 , . . . , xp ) 6= 0, los vectores x1 , x2 , . . . , xp son linealmente independientes.
Demostracion:
Si fuesen dependientes, al aplicarles t saldrı́a 0 en contra de la hipótesis.
13.3.
2
Formas multilineales y multilineales alternadas
Una aplicación multilineal t cuyo espacio final V0 sea el cuerpo IK, se llama
forma multilineal (o forma p-lineal). Si los espacios iniciales son todos iguales
entre sı́ e iguales a V, también se nombran como tensores p veces covariantes
del espacio V.
Los productos escalar y mixto son formas, pero el vectorial no.
Igualmente una aplicación multilineal alternada en la que las imágenes sean
números, se llamará forma multilineal alternada.
El producto mixto es una forma alternada, pero el escalar no lo es.
190
Capı́tulo 13. Determinantes
13.4.
Formas n-lineales alternadas de un espacio n- dimensional
Sea V un espacio de dimensión finita n ≥ 1 sobre el cuerpo conmutativo IK de
caracterı́stica nula. Sea t una forma n-lineal alternada de V y fijemos una base
B = {v1 , v2 , . . . , vn } del espacio.
Dados n vectores x1 , x2 , . . . , xn , si suponemos que
xj =
n
X
aij j vij , ∀j ∈ [1, n],
ij =1
aplicando la linealidad en cada lugar, tendremos
t(x1 , x2 , . . . , xn ) = t(
n
X
ai1 1 vi1 ,
i1 =1
=
n X
n
X
i1 =1 i2 =1
n
X
...
n
X
ai2 2 vi2 , . . . ,
i2 =1
n
X
ain n vin ) =
in =1
ai1 1 ai2 2 . . . ain n t(vi1 , vi2 , . . . , vin ).
in =1
En esta expresión habrá nn sumandos correspondientes a todas las posibles
variaciones con repetición (i1 , i2 , . . . , in ) que podemos efectuar con los ı́ndices
1, 2, . . . , n. Si ahora aplicamos que t es alternada, cada vez que haya dos ı́ndices
repetidos el valor de t va a ser nulo. Por tanto, esta suma queda reducida a
la de los sumandos con todos sus ı́ndices distintos. Es decir, queda reducida a
las posibles permutaciones, de las cuales hay exactamente n!. Si β indica una
permutación genérica, podremos, entonces, escribir
X
aβ(1)1 aβ(2)2 . . . aβ(n)n t(vβ(1) , vβ(2) , . . . , vβ(n) ) =
t(x1 , x2 , . . . , xn ) =
β∈Sp
=
X
aβ(1)1 aβ(2)2 . . . aβ(n)n (−1)β t(v1 , v2 , . . . , vn ) =
β∈Sp
= t(v1 , v2 , . . . , vn )
X
(−1)β aβ(1)1 aβ(2)2 . . . aβ(n)n .
β∈Sp
Esta es la expresión analı́tica de t en la base B. Como las coordenadas serán
conocidas, nos indica que la forma n-lineal alternada t quedará determinada
cuando se conozca su valor t(v1 , v2 , . . . , vn ) al actuar sobre los vectores de la
base colocados en su orden natural. A la vez nos sugiere la manera de construir
formas n-lineales alternadas:
Proposición 170 Fijada una base B = {v1 , v2 , . . . , vn } de V y un escalar γ,
existe una forma n-lineal alternada t y sólo una tal que
t(v1 , v2 , . . . , vn ) = γ.
13.4.
Formas n-lineales alternadas de un espacio n- dimensional
191
Demostracion:
a) Suponiendo que para cada j ∈ [1, n] sea
xj = a1j v1 + a2j v2 + . . . + anj vn ,
n
z}|{
definimos una aplicación t : V × · · · ×V → IK mediante la ley
X
t(x1 , x2 , . . . , xn ) = γ
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n .
β∈Sp
Fijado un ı́ndice j ∈ [1, n] y dado otro vector
yj = b1j v1 + b2j v2 + . . . + bnj vn ,
ası́ como un número a ∈ IK, se tiene
t(x1 , . . . , xj + yj , . . . , xn ) =
=γ
X
(−1)β aβ(1)1 · · · (aβ(j)j + bβ(j)j ) · · · aβ(n)n =
β∈Sp
=γ
X
((−1)β aβ(1)1 · · · aβ(j)j · · · aβ(n)n +(−1)β aβ(1)1 · · · bβ(j)j · · · aβ(n)n ) =
β∈Sp
X
=γ
(−1)β aβ(1)1 · · · aβ(j)j · · · aβ(n)n +
β∈Sp
+γ
X
(−1)β aβ(1)1 · · · bβ(j)j · · · aβ(n)n
β∈Sp
= t(x1 , . . . , xj , . . . , xn ) + t(x1 , . . . , yj , . . . , xn ),
t(x1 , . . . , axj , . . . , xn ) =
=γ
X
(−1)β aβ(1)1 · · · (aaβ(j)j ) · · · aβ(n)n =
β∈Sp
= γ(a
X
(−1)β aβ(1)1 · · · aβ(j)j · · · aβ(n)n ) =
β∈Sp
= a(γ
X
(−1)β aβ(1)1 · · · aβ(j)j · · · aβ(n)n ) =
β∈Sp
= at(x1 , . . . , xj , . . . , xn ).
Ası́ se prueba que t es lineal en la componente j. Como este ı́ndice es
arbitrario, en realidad t es n-lineal.
192
Capı́tulo 13. Determinantes
Si n = 1, t es sin más alternada. Si n ≥ 2 y tomamos ı́ndices i, j tales que
1 ≤ i < j ≤ n, se tiene
t(x1 , . . . , xj , . . . , xi , . . . , xn ) =
=γ
X
(−1)β aβ(1)1 · · · aβ(i)j · · · aβ(j)i · · · aβ(n)n .
β∈Sp
Fijando una permutación β, sea µ = (i, j) ◦ β . Entonces, como
µ(i) = (i, j)(β(i)) = β(j), µ(j) = (i, j)(β(j)) = β(i)
µ(k) = β(k) si k 6= i y k 6= j,
(−1)µ = −(−1)β ,
en el correspondiente sumando podemos escribir
(−1)β aβ(1)1 . . . aβ(i)j . . . aβ(j)i . . . aβ(n)n =
= −(−1)µ aµ(1)1 . . . aµ(j)j . . . aµ(i)i . . . aµ(n)n=
= −(−1)µ aµ(1)1 . . . aµ(i)i . . . aµ(j)j . . . aµ(n)n ,
donde al final hemos permutado los factores aµ(j)j y aµ(i)i . Ahora bien,
por ser Sn un grupo, cuando β lo recorre, también µ lo hace. Por tanto,
t(x1 , . . . , xj , . . . , xi , . . . , xn ) =
X
=γ
(−1)β aβ(1)1 · · · aβ(i)j · · · aβ(j)i · · · aβ(n)n
β∈Sp
= −γ
X
(−1)µ aµ(1)1 · · · aµ(i)i · · · aµ(j)j · · · aµ(n)n
µ∈Sp
= −t(x1 , . . . , xi , . . . , xj , . . . , xn ),
quedando probado que t es alternada.
Usando las deltas de Kronecker, obtenemos
vj = δ1j v1 + δ2j v2 + . . . + δnj vn ,
con lo cual
t(v1 , v2 , . . . , vn ) = γ
X
(−1)β δβ(1)1 δβ(2)2 · · · δβ(n)n = γ,
β∈Sp
ya que, en todo sumando donde no esté la permutación identidad, habrá un
factor nulo y para ésta todos ellos, lo mismo que su signo, valen 1.
Esta aplicación t cumple, pues, todos los requisitos del enunciado.
13.5.
La función determinante del espacio IK n
193
b) Si imaginamos otra forma n-lineal alternada s tal que
s(v1 , v2 , . . . , vn ) = γ,
usando su expresión analı́tica, tendremos
s(x1 , x2 , . . . , xn ) = s(v1 , v2 , . . . , vn )
X
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n =
β∈Sp
=γ
X
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n = t(x1 , x2 , . . . , xn ),
β∈Sp
luego s coincide con la aplicación t antes construida.
2
13.5.
La función determinante del espacio IK n
Se llama función determinante del espacio IK n a la forma n-lineal alternada
(n)
z}|{
det : IK n × · · · ×IK n → IK
que toma valor 1 en la base canónica {e1 , e2 , . . . , en } del mismo. La imagen
mediante esta aplicación de una n-upla de vectores (x1 , x2 , . . . , xn ) del espacio
IK n se llama determinante de x1 , x2 , . . . , xn y se denota
det(x1 , x2 , . . . , xn ).
Su existencia y unicidad está garantizada por la proposición 170. La expresión
analı́tica del determinante de n vectores será
X
det(x1 , x2 , . . . , xn ) =
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n ,
β∈Sp
supuesto que para cada j ∈ [1, n] sea
xj = (a1j , a2j , . . . , anj ) = a1j e1 + a2j e2 + . . . + anj en .
Uniendo la definición y las proposiciones probados para las aplicaciones multilineales alternadas (sección 13.2), resulta la siguiente lista de propiedades para
la función determinante:
1. El determinante es lineal en cada una de sus variables:
det(x1 , . . . , xj + yj , . . . , xn ) =
= det(x1 , . . . , xj , . . . , xn ) + det(x1 , . . . , yj , . . . , xn ),
det(x1 , . . . , axj , . . . , xn ) = a det(x1 , . . . , xj , . . . , xn ).
194
Capı́tulo 13. Determinantes
2. El determinante es alternado:
det(x1 , . . . , xj , . . . , xi , . . . , xn ) = − det(x1 , . . . , xi , . . . , xj , . . . , xn ).
3. El determinante vale 1 en la base canónica:
det(e1 , e2 , . . . , en ) = 1.
4. Para cualquier permutación β ∈ Sn se tiene
det(xβ(1) , xβ(2) , . . . , xβ(n) ) = (−1)β det(x1 , x2 , . . . , xn ).
5. Si en x1 , x2 , . . . , xn hay dos vectores repetidos, se cumple
det(x1 , . . . , xi , . . . , xi , . . . , xn ) = 0.
6. Si a uno de los vectores x1 , x2 , . . . , xn se le suma el producto de un número
λ por otro, el determinante no cambia:
det(x1 , . . . , xi + λxj , . . . , xj , . . . , xn ) = det(x1 , . . . , xi , . . . , xj , . . . , xn ).
7. Si los vectores x1 , x2 , . . . , xn son dependientes, se cumple
det(x1 , x2 , . . . , xn ) = 0.
8. Si det(x1 , x2 , . . . , xn ) 6= 0, los vectores x1 , x2 , . . . , xn son linealmente independientes.
13.6.
Determinante de una matriz cuadrada
Dada una matriz A = (aij ) ∈ M(n, IK) el número
det(C1 (A), C2 (A), . . . , Cn (A)) =
X
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n
β∈Sp
se conoce como determinante de A por columnas. Análogamente,
det(F1 (A), F2 (A), . . . , Fn (A)) =
X
(−1)β a1β(1) a2β(2) · · · anβ(n)
β∈Sp
se nombra como determinante de A por filas.
Proposición 171 En toda matriz cuadrada, los determinantes por columnas y
por filas coinciden.
13.6.
Determinante de una matriz cuadrada
195
Demostracion:
Fijada una permutación β, sea µ = β −1 . Para cada ı́ndice j, sea i = β(j) ⇒
j = µ(i). Entonces, en el sumando correspondiente a β en el determinante
por columnas, el factor aβ(j)j se iguala al aiµ(i) que aparecerı́a en el sumando
correspondiente a µ en el determinante por filas, de manera que permutando
adecuadamente estos últimos y habida cuenta de que β y su inversa tienen igual
signo, se obtiene
(−1)β aβ(1)1 aβ(2)2 . . . aβ(n)n = (−1)µ a1µ(1) a2µ(2) . . . anµ(n) .
Ahora bien, si β toma todos los valores posibles en Sn , también lo hace µ = β −1 ,
porque Sn es un grupo. Por tanto,
X
det(C1 (A), C2 (A), . . . , Cn (A)) =
(−1)β aβ(1)1 aβ(2)2 · · · aβ(n)n =
β∈Sp
=
X
(−1)µ a1µ(1) a2µ(2) · · · anµ(n) = det(F1 (A), F2 (A), . . . , Fn (A)).
β∈Sp
2
El valor común del determinante por columnas y por filas se llama determinante de la matriz cuadrada A.
Como expresión analı́tica se puede adoptar cualquiera de las dos, pero en ambos
casos debemos observar que en ella aparecen n! sumandos, la mitad de ellos con
signo positivo y la otra mitad con signo negativo. En cada sumando aparece uno
y sólo un factor por cada columna de la matriz, ası́ como por cada una de sus
filas.
Siendo A = (aij ) ∈ M(n, IK), se suele decir que su determinante es de orden
n. Para ellos se adoptan las notaciones
a11 a12 . . . a1n
a21 a22 . . . a2n
det(A) = det(aij ) = det
=
..
..
...
.
.
an1
¯
¯ a11
¯
¯ a21
=| A |=| aij |= ¯¯ ..
¯ .
¯
an1
a12
a22
..
.
an2
an2
. . . ann
¯
. . . a1n ¯
¯
. . . a2n ¯
.. ¯¯ .
. ¯
¯
. . . ann
En lo que se refiere a sus propiedades, ya conocemos todas las referidas en la
sección 13.5. Adaptadas al lenguaje matricial y entendiendo por lı́nea cualquiera
de las palabras columna o fila, se resumen ası́:
1. 1) El determinante de una matriz cuadrada es lineal en cada una de sus
lı́neas.
196
Capı́tulo 13. Determinantes
2. El determinante cambia de signo si se trasponen entre sı́dos lı́neas.
3. El determinante de la matriz unidad vale 1.
4. Si las lı́neas de una matriz se someten a una permutación, el determinante
se multiplica por el signo de dicha permutación.
5. Si hay dos lı́neas repetidas, el determinante vale 0.
6. Si a una lı́nea se le suma el producto de un número por otra lı́nea, el
determinante no cambia.
7. Si las lı́neas de una matriz son dependientes (esto es, si la matriz es singular), el determinante es nulo.
8. Si el determinante no es nulo, tanto sus columnas como sus filas, son
linealmente independientes (es decir, la matriz es regular).
Otras propiedades elementales son las siguientes:
Proposición 172 El determinante de una matriz diagonal es el producto de
sus coeficientes diagonales.
Demostracion:
Por ser lineal en cada columna, se tiene
det(Diag.(a1 , a2 , . . . , an )) = a1 a2 · · · an det(In ) = a1 a2 · · · an .
2
Proposición 173 Dado λ ∈ IK, siempre existen matrices A ∈ M(n, IK) tales
que det(A) = λ.
Demostracion:
Basta tomar, por ejemplo, A = Diag.(λ, 1, . . . , 1).
13.7.
2
Determinantes y trasposición
Proposición 174 Para toda matriz A ∈ M(n, IK) se cumple
det(At ) = det(A).
Demostracion:
Es consecuencia de la definición de traspuesta y de la proposición 171.
2
13.8.
Determinante de un producto
13.8.
197
Determinante de un producto
Proposición 175 Dadas A, B ∈ M(n, IK) se cumple
det(A × B) = det(A) det(B).
Demostracion:
Sea B = (bij ). De acuerdo con la expresión de las columnas del producto, y
aplicando la linealidad, se tiene
det(A × B) = det(C1 (A × B), C2 (A × B), · · · , Cn (A × B)) =
= det(
n
X
bi1 1 Ci1 (A),
i1 =1
=
n X
n
X
i1 =1 i2 =1
···
n
X
bi2 2 Ci2 (A), · · · ,
i2 =1
n
X
n
X
bin n Cin (A)) =
in =1
bi1 1 bi2 2 · · · bin n det(Ci1 (A), Ci2 (A), . . . , Cin (A)).
in =1
Aquı́ hay nn sumandos correspondientes a las variaciones con repetición (i1 , i2 , . . . , in )
de los ı́ndices 1, 2, · · · , n. Aplicando la propiedad de ser alternado, sólo quedan
los sumandos de las permutaciones, luego
det(A × B) =
X
=
bβ(1)1 bβ(2)2 · · · bβ(n)n det(Cβ(1) (A), Cβ(2) (A), . . . , Cβ(n) (A)) =
β∈Sp
=
X
(−1)β bβ(1)1 bβ(2)2 · · · bβ(n)n det(C1 (A), C2 (A), . . . , Cn (A)) =
β∈Sp
= det(C1 (A), C2 (A), . . . , Cn (A))
X
(−1)β bβ(1)1 bβ(2)2 · · · bβ(n)n =
β∈Sp
= det(A) det(B).
2
13.9.
Determinantes y regularidad
Proposición 176 La matriz A ∈ M(n, IK) es regular si y sólo si
det(A) 6= 0.
Demostracion:
Si det(A) 6= 0, A es regular según una de las propiedades de los determinantes.
Si A es regular, es inversible, luego existe otra matriz A−1 tal que A×A−1 =
I. Aplicando la última proposición a esta igualdad se obtiene
det(A × A−1 ) = det(A) det(A−1 ) = det(I) = 1 ⇒ det(A) 6= 0.
2
198
Capı́tulo 13. Determinantes
Proposición 177 La matriz A ∈ M(n, IK) es singular si y sólo si
det(A) = 0.
Demostracion:
Se obtiene por negación del anterior enunciado.
13.10.
2
El grupo lineal especial de grado n
La fórmula det(A × B) = det(A) det(B) y la proposición 173 aplicado a un
escalar λ 6= 0, indican que la asignación A 7→ det(A) es un epimorfismo del
grupo GL(n, IK) sobre el grupo multiplicativo IK ∗ . Su núcleo, formado por las
matrices cuadradas de determinante 1, será un subgrupo normal del grupo lineal.
Se denomina grupo lineal especial de grado n y se denota
SL(n, IK).
Proposición 178 Si A ∈ M(n, IK) es regular, se cumple
det(A−1 ) = (det(A))−1 .
Demostracion:
Es consecuencia inmediata de que det actúe como morfismo.
13.11.
2
Adjuntos y menores complementarios
Dada una matriz A = (aij ) ∈ M(n, IK), fijemos dos ı́ndices h, k ∈ [1, n]. En el
desarrollo del determinante de A los sumandos en que aparezca ahk corresponderán a las permutaciones β tales que β(k) = h. De ellas hay tantas como biyecciones del conjunto {1, . . . , k −1, k +1, . . . , n} sobre el {1, . . . , h−1, h+1, . . . , n},
ambos de cardinal n − 1, es decir, habrá (n − 1)!. Si las seleccionamos y sacamos
ahk como factor común, el número por el que queda multiplicado será el
Ahk =
X
(−1)β aβ(1)1 · · · aβ(k−1)(k−1) aβ(k+1)(k+1) ...aβ(n)n .
β∈Sp ,βk =h
Recibe el nombre de adjunto de lugares h y k o adjunto del elemento ahk .
Proposición 179 Fijado un ı́ndice k ∈ [1, n], se cumple
det(A) = a1k A1k + a2k A2k + . . . + ank Ank .
13.11.
Adjuntos y menores complementarios
199
Demostracion:
Puesto que en cada sumando de det(A) aparece un elemento y sólo uno de la
columna de lugar k, podemos clasificar los n! sumandos de det(A) en n bloques,
cada uno de (n − 1)! sumandos, según el elemento ahk de Ck (A) que intervenga
en él. Sacándolo en su bloque como factor común, se llega a la fórmula propuesta.
2
Esta fórmula se conoce como desarrollo del determinante por los elementos de una columna. Con un razonamiento similar, se establece un resultado
análogo para filas que nos limitamos a enunciar:
Proposición 180 Fijado un ı́ndice h ∈ [1, n], se cumple
det(A) = ah1 Ah1 + ah2 Ah2 + . . . + ahn Ahn .
Supongamos que n ≥ 2 y que en la matriz A ∈ M(n, IK) suprimimos la fila de
lugar h y la columna de lugar k. Ası́ obtenemos una submatriz de n − 1 filas y
columnas y se podrá calcular el número
a11 . . . a|1k . . . a1n
..
..
..
.
.|
.
Dhk (A) = det −
ah1
− −. .−. −
a| hk
−
−. .−. −
ahn
−
.
..
..
..
.|
.
an1 . . . −
a| nk
−. . . ann
conocido como menor complementario de lugares h y k o menor del
elemento ahk . Si la alusión a la matriz A se sobreentiene escribiremos Dhk en
lugar de Dhk (A). Tal como trataremos de ver, este número está muy ligado con
el adjunto Ahk :
Proposición 181 En una matriz A = [aij ] ∈ M(n, IK), se cumple
A11 = D11 .
Demostracion:
Siendo T = {β ∈ Sn /β(1) = 1}, sabemos que
X
A11 =
(−1)β aβ(2)2 aβ(3)3 · · · aβ(n)n .
β∈T
Por otra parte, cada β ∈ T se puede igualar biyectivamente a una permutación µ
del conjunto de ı́ndices Sn−1 = {2, 3, . . . , n} sin más que poner µ(i) = β(i), para
cada i ≥ 2, conservándose el signo ya que, al estar 1 fijo en β, las trasposiciones
en que se descomponga son las mismas en que se descomponga µ. Pero
(−1)β aβ(2)2 aβ(3)3 . . . aβ(n)n = (−1)µ aµ(2)2 aµ(3)3 . . . aµ(n)n
200
Capı́tulo 13. Determinantes
no es sino el sumando genérico del desarrollo de
a12
a22
D11 = det
...
a13
a23
..
.
...
...
an2
an3
...
a1n
a2n
..
.
ann
de manera que, efectivamente, A11 = D11 .
2
Proposición 182 En una matriz A = (aij ) ∈ M(n, IK), se cumple
Ahk = (−1)h+k Dhk , ∀h, k ∈ [1, n].
Demostracion:
Sea B una nueva matriz obtenida aplicando a A h−1 trasposiciones consecutivas que lleven la fila h al lugar de la primera fila, seguidas de k−1 trasposiciones
también consecutivas que lleven la columna k a ocupar el lugar de la primera
columna. Entonces,
det(B) = (−1)h−1 (−1)k−1 det(A) =
= (−1)h+k−2 det(A) = (−1)h+k det(A);
si b11 = ahk se saca factor común en det(B) lo serı́a de B11 , mientras que si se
saca en (−1)h+k det(A) lo es de (−1)h+k Ahk . Esto prueba que
B11 = (−1)h+k Ahk .
Por otra parte, la fila y la columna que se suprimen al calcular el menor D11 (B)
son las mismas que se suprimen al calcular Dhk en A. O sea,
D11 (B) = Dhk .
Según la última proposición, para B se cumple B11 = D11 (B), luego
(−1)h+k Ahk = Dhk ⇒ Ahk = (−1)h+k Dhk .
2
Esta fórmula indica que cada adjunto en un determinante de orden n es, a su vez,
un determinante de orden n − 1. En cuanto a los desarrollos de las proposiciones
179 y 180, adoptarán la forma
∀h, k ∈ [1, n] ⇒ det(A) =
= (−1)1+k a1k D1k + (−1)2+k a2k D2k + . . . + (−1)n+k ank Dnk =
= (−1)h+1 ah1 Dh1 + (−1)h+2 ah2 Dh2 + . . . + (−1)h+n ahn Dhn ,
permitiendo en ambos casos reducir el cálculo de un determinante de orden n
al cálculo de n determinantes de orden n − 1.
13.12.
Cálculo de determinantes
13.12.
201
Cálculo de determinantes
El rápido crecimiento de los números factoriales, pone de manifiesto la dificultad
práctica a la hora de calcular un determinante si solamente usáremos la expresión
analı́tica deducida de su definición. En un determinante de cuarto orden, por
ejemplo, aparecerı́an 4! = 24 sumandos cada uno con cuatro factores; en uno
de orden 10 habrı́a 10! = 3,628,800 sumandos de 10 factores. De hecho, tal
expresión sólo se suele usar para los tres primeros órdenes:
µ
det
a11
det a21
a31
a12
a22
a32
det(a11 ) = a11 ,
¶
a11 a12
= a11 a22 − a21 a12 ,
a21 a22
a13
a23 = (a11 a22 a33 + a21 a32 a13 + a31 a12 a23 )−
a33
−(a31 a22 a13 + a21 a12 a33 + a11 a32 a23 ),
y aún los de tercer orden se auxilian de un recurso nemotécnico conocido como
Regla de Sarrus.
Para órdenes mayores la vı́a que se suele seguir consiste en el uso del desarrollo
de un determinante por los elementos de una lı́nea (columna o fila), ya que,
como hemos señalado en el apartado anterior, reduce un determinante de orden
n a n determinantes de orden n − 1. Esta idea se ve frecuentemente plasmada en
determinantes de orden cuatro, pero aún ası́ se complica al subir de orden: por
ejemplo, un determinante de orden 6 se reducirı́a a 6 de orden 5, y por tanto a
30 de orden 4 y a 120 de orden 3.
Proposición 183 Dada A = (aij ) ∈ M(n, IK), existe otra B = (bij ) ∈ M(n, IK)
tal que
C1 (B) = (b11 , 0, . . . , 0), det(A) = det(B).
Demostracion:
En la matriz de partida se presentan dos opciones:
1. C1 (A) = 0. En este caso basta tomar B = A y se tiene det(A) = 0.
2. C1 (A) 6= 0. Ahora existe algún ı́ndice i para el cual ai1 6= 0, y dentro de
este caso volveremos a distinguir dos posibilidades:
a) El coeficiente a11 6= 0. Definiendo B por las reglas
F1 (B) = F1 (A), F2 (B) = F2 (A) −
. . . , Fn (B) = Fn (A) −
a21
F1 (A), . . .
a11
an1
F1 (A)
a11
202
Capı́tulo 13. Determinantes
por propia construcción se tiene
b11 = a11 , b21 = a21 −
a21
an1
a11 = 0, . . . , bn1 = an1 −
a11 = 0,
a11
a11
de manera que
C1 (B) = (b11 , 0, . . . , 0).
Además, det(B) = det(A) porque los determinantes no cambian su
valor cuando a una fila se le suma otra multiplicada por un número.
b) El coeficiente a11 = 0. Buscando el primer lugar h tal que ah1 6= 0,
definimos una matriz C de manera que
F1 (C) = −Fh (A), Fh (C) = F1 (A),
y las restantes filas de C iguales a las de A. Entonces,
det(C) = det(A)
porque hay dos cambios de signo, el primero por trasponer las filas
primera y h-ésima, el segundo (en virtud de la linealidad) porque
hemos tomado la opuesta de una de ellas. Además, c11 = −ah1 6= 0,
luego la matriz C está en la posibilidad anterior y de ella podemos
pasar a la matriz B del enunciado.
2
Este teorema constituye el fundamento del llamado Método de reducción de
Gauss-Jordan. Puesto que
¯
¯
¯
¯
¯ b11 b12 . . . b1n ¯
¯ b22 b23 . . . b2n ¯
¯
¯
¯
¯
¯ 0 b22 . . . b2n ¯
¯ b32 b33 . . . b3n ¯
det(A) = det(B) = ¯¯ ..
..
.. ¯¯ = b11 ¯¯ ..
..
.. ¯¯ ,
.
. ¯
.
. ¯
¯ .
¯ .
¯
¯
¯
¯
0 bn2 . . . bnn
bn2 bn3 . . . bnn
donde hemos hecho el desarrollo de det(B) mediante los elementos de su primera
columna, este método permite reducir un determinante de orden n a otro de
orden n − 1, y será el más indicado en la práctica.
13.13.
Triangularización de determinantes
Si a la matriz B de la última proposición le suprimimos C1 (B) y F1 (B), queda
la matriz
b22 b23 . . . b2n
b32 b33 . . . b3n
.
∈ M(n − 1, IK),
..
..
..
.
.
bn2
bn3
. . . bnn
a la que podrı́amos volverle a aplicar la proposición para pasar a otra
13.14.
Matriz adjunta de una matriz cuadrada
c22
0
.
..
c23
c33
..
.
...
...
0
cn3
...
203
c2n
c3n
,
..
.
cnn
cumpliéndose
¯
¯ b22
¯
¯ b32
¯ .
¯ .
¯ .
¯
bn2
b23
b33
..
.
...
...
bn3
...
¯ ¯
b2n ¯ ¯ c22
¯ ¯
b3n ¯ ¯ 0
.. ¯¯ = ¯¯ ..
. ¯ ¯ .
¯ ¯
0
bnn
c23
c33
..
.
...
...
cn3
...
¯
¯
c2n ¯
¯ c33
¯
¯
c3n ¯
¯ c43
¯
.. ¯ = c22 ¯¯ ..
. ¯
¯ .
¯
¯
cnn
cn3
c34
c44
..
.
...
...
cn4
...
¯
c3n ¯
¯
c4n ¯
.. ¯¯ .
. ¯
¯
cnn
Enlazando los dos pasos, podemos considerar una matriz C ∈ M(n, IK) cuya
primera fila y primera columna sean las de B y los restantes coeficientes los de
la matriz de M(n − 1, IK) que acabamos de construir. Entonces,
¯
¯ c11
¯
¯ 0
det(A) = ¯¯ ..
¯ .
¯
0
c12
c22
..
.
...
...
0
...
¯
¯
c1n ¯
¯ c33
¯
¯
c2n ¯
¯ c43
¯
.. ¯ = c11 c22 ¯¯ ..
. ¯
¯ .
¯
¯
cnn
cn3
c34
c44
..
.
cn4
¯
c3n ¯
¯
c4n ¯
.. ¯¯ ,
. ¯
¯
. . . cnn
...
...
es decir, el cálculo del determinante de orden n se ha reducido al de otro de
orden n − 2.
Se comprende que la reiteración del método de Gauss-Jordan, llevada hasta sus
últimas consecuencias, desemboca en el siguiente enunciado:
Proposición 184 Dada una matriz cuadrada A ∈ M(n, IK), existe una matriz
supratriangular
d11
0
0
D=
.
..
d12
d22
0
..
.
d13
d23
d33
..
.
...
...
...
0
0
0
...
d1n
d2n
d3n ∈ M(n, IK)
..
.
dnn
de manera que
det(A) = det(D) = d11 d22 d33 · · · dnn .
13.14.
Matriz adjunta de una matriz cuadrada
El desarrollo de un determinante por los elementos de una lı́nea no sólo tiene
interés práctico como acabamos de poner de manifiesto, sino que permite avanzar
en las cuestiones teóricas.
204
Capı́tulo 13. Determinantes
Sean b = (b1 , b2 , . . . , bn ) ∈ IK n y A = (aij ) ∈ M(n, IK). Entonces, el número
b1 A1k + b2 A2k + . . . + bn Ank ,
coincide con el determinante de una matriz que tiene todas sus columnas iguales
que las de A, salvo la de lugar k que se ha sustituı́do por el vector b. De la misma
manera,
b1 Ah1 + b2 Ah2 + . . . + bn Ahn
es el determinante de una matriz con todas las filas iguales a las de A, salvo la
de lugar h que se ha cambiado por b.
Calculando todos los adjuntos de una matriz A y situándolos en los lugares
correspondientes, podemos formar una nueva matriz
Adj(A) = (Aij ),
a la que se llama matriz adjunta de A. Puesto que cada adjunto, con el signo
correspondiente, es un determinante de orden n−1, el cálculo de Adj(A) equivale
al de n2 determinantes.
Proposición 185 Para toda matriz cuadrada A se verifica que
A × (Adj(A))t = det(A)I.
Demostracion:
Observemos que
ehk (A × (Adj(A))t ) = ah1 Ak1 + ah2 Ak2 + . . . + ahn Akn .
a) Si h = k, el segundo miembro es el desarrollo de det(A) mediante los
elementos de su fila h-ésima, por lo que la matriz producto tiene todos sus
elementos diagonales iguales a det(A).
b) Por el contrario, si h 6= k, se trata del determinante de una matriz con
todas las filas iguales a las de A, salvo la de lugar k que se ha sustituı́do
por el vector (ah1 , ah2 , . . . , ahn ) que no es otro que la fila h-ésima de A. Su
valor, por tener dos filas repetidas, será 0. Es decir, en la matriz producto
son nulos todos los coeficientes que están fuera de la diagonal.
Estos dos hechos prueban la igualdad propuesta.
2
13.15.
Cálculo de la matriz inversa
Proposición 186 Si A ∈ M(n, IK) es regular, se tiene la fórmula
A−1 =
(Adj(A))t
.
det(A)
Demostracion:
Como las matrices regulares tienen determinante no nulo, se trata de una
consecuencia de la anterior proposición.
2
13.16.
Determinantes y rango de una matriz
13.16.
205
Determinantes y rango de una matriz
Para finalizar, señalemos la utilidad de los determinantes en el cálculo del rango
de una matriz rectangular cualquiera A = [aij ] ∈ M(m, n, IK).
Una vez sabido que una matriz cuadrada es regular o singular según que su
determinante sea no nulo o nulo, respectivamente, podemos reformular algunas
definiciones y resultados de las secciones 12.3 y 12.4, relativos a las submatrices
principales y al método del orlado.
Ası́, podrı́amos decir que una submatriz P ∈ M(r, IK) es submatriz principal de
A ∈ M(m, n, IK) cuando tenga determinante no nulo y todas las submatrices
B ∈ M(p, IK), donde r < p, lo tengan nulo.
La proposición 164, admitirı́a este otro enunciado:
Una submatriz cuadrada P ∈ M(r, IK) es principal en A ∈ M(m, n, IK) si y
sólo si su determinante es no nulo y las submatrices cuadradas de
M(r + 1, IK) obtenidas al orlar P de todas las maneras posibles con coeficientes
de las columnas de A que no intervengan en P tengan determinante nulo.
El rango que, como se sabe, coincide con la cantidad de filas y columnas de
una submatriz principal, podrá buscarse determinando una submatriz principal
ascendentemente mediante el cálculo de determinantes.
13.17.
Complementos / Ejercicios
1. Consideremos la aplicación
ϕ : IR2 [ξ] × IR3 [ξ] → IR, de ley ϕ(p, q) = p(1)q 0 (1)
Razonar que ϕ es bilineal. Recoger en una matriz de tres filas y cuatro
columnas su efecto sobre las parejas de polinomios canónicos.
2. En el espacio V = C 1 ([a, b]) de las funciones reales derivables con derivada
continua en el intervalo [a, b] se considera la aplicación
Z b
ϕ : V × V → IR, de ley ϕ(f, g) =
f (x)g 0 (x)dx.
a
Comprobar que es bilineal. Expresar ϕ(g, f ) a partir de ϕ(f, g) y constatar
que ϕ no posee la propiedad de simetrı́a.
3. Sean U, V, W tres espacios sobre un cuerpo conmutativo de caracterı́stica
distinta de 2. Sea F : U × V → W una aplicación que es a la vez lineal y
bilineal. Demostrar que necesariamente f es la aplicación nula.
4. De entre las siguientes funciones F : IR3 × IR3 × IR3 → IR, determinar
cuáles son lineales en una o más de una de sus variables. Entre las que
sean trilineales, ¿alguna es alternada?
206
Capı́tulo 13. Determinantes
a) F (x1 , x2 , x3 ) = a11 a22 a33 .
b) F (x1 , x2 , x3 ) = a11 a22 − a12 a21 .
c) F (x1 , x2 , x3 ) = a11 a12 a13 + a21 a22 a23 + a31 a32 a33 .
d ) F (x1 , x2 , x3 ) = a11 a22 a33 − a12 a21 a33 .
5. Razonar que, como grupos, se tiene GL(n, IK)/SL(n, IK) ≃ IK ∗ .
6. Para las matrices elementales, establecer las igualdades
det(Chk ) = −1, det(Dh (λ)) = λ, det(Thk (λ)) = 1.
7. Siendo A ∈ M(n, IK) y λ ∈ IK, calcular det(λA).
8. Sea A ∈ M(n, IK) una matriz antisimétrica. Si n es impar, razonar que
su determinante es nulo.
9. Sean A, B ∈ M(n, IK) no nulas. Probar que
A × B = 0 ⇒ det(A) = det(B) = 0.
10. Calcular det(Adj(A)) en función de det(A).
11. Sea A ∈ GL(n, IR) tal que A−1 = At . Razonar que det(A) = ±1.
12. Sea A ∈ M(2, IR) una matriz no nula tal que A = Adj(A). Razonar que
es regular.
13. Sea A ∈ M(n, IR) una matriz regular tal que A = Adj(A). Si n ≥ 3 es
impar, razonar que det(A) = 1.
14. Si A es singular, el rango de Adj(A) es menor o igual que 1.
15. Sea A ∈ M(n,C).
I Razonar que det(A) = det(A).
t
16. Sea A ∈ M(n,C)
I tal que A = A. Razonar que det(A) es real.
t
17. Sea A ∈ M(n,C)
I tal que A = −A. Razonar que det(A) es real si n es par
e imaginario puro si n es impar.
t
18. Sea A ∈ GL(n,C)
I tal que A = A−1 . Razonar que | det(A) |= 1.
19. Sabiendo que 299, 468 y 741 son múltiplos de 13, razonar que lo es
¯
¯
¯2 9 9¯
¯
¯
¯4 6 8¯.
¯
¯
¯7 4 1¯
13.17.
Complementos / Ejercicios
207
20. Descomponer en producto de factores primos los números
¯
¯1 2
¯
¯ 1 23
a=¯
¯ 1 25
¯
1 27
3
33
35
37
¯
¯
4¯
¯1
¯
3¯
4 ¯
¯1
5 ¯,b = ¯
4 ¯
¯1
¯
¯
1
47
22
24
26
28
32
34
36
38
¯
42 ¯
4¯
4 ¯
¯.
46 ¯
8¯
4
21. Realizar los cálculos
√
√
√
(+5√ 3 + 8)/18 (−4√3 + 5)/18 (−2 √3 + 10)/18
det (−4 √3 + 11)/18 (+5√ 3 + 8)/18 (−2√ 3 − 2)/18 = 1
(−2 3 − 2)/18 (−2 3 + 10)/18
(8 3 + 2)/18
√
√
√
√
√
1/√5 −2/√10 1/ √6
2/ √30
1/ 10
0√
1/√5 −1/ 10 −2/√ 6 −1/√30
det 1/√5
0
1/
6
−4/
30
−1/
10 = 1
√
√
√
1/√5 1/√10
0
3/ 30 −2/√ 10
1/ 5 2/ 10
0
0
2/ 10
22. Obtener que det(A) = 1 para la matriz (aij ) = (mı́n(i, j)) ∈ M(n, IR).
23. Calcular el determinante de la matriz (aij ) = (máx(i, j)) ∈ M(n, IK).
24. Sea A = (| i − j |) ∈ M(n, IR). Razonar que
det(A) = (−1)n−1 (n − 1)2n−2 .
25. Sea A = [i + j] ∈ M(n, IR). Calcúlese det(A).
26. Sean a, b, c tres números no nulos. Razonar que
¯
¯ ¯
¯
¯ bc a2 a2 ¯ ¯ bc ba ca ¯
¯ 2
¯
¯
¯
¯ b ca b2 ¯ = ¯ ab ca cb ¯
¯ 2
¯
¯
¯
¯ c c2 ab ¯ ¯ ac bc ab ¯
27. Desarrollando por los elementos de la primera columna, obtener que
¯
¯ a
¯
¯ −b
¯
¯ −c
¯
−d
b
a
−d
c
c
d
a
−b
¯
d ¯
¯
−c ¯
¯ = (a2 + b2 + c2 + d2 )2 .
b ¯
¯
a
28. Sean a, b, c ∈ IR. Obtener la igualdad
¯
1
¯1
¯
1
¯1
¯
¯ 1 cos a
¯
1 cos b
¯
1
1 ¯
¯
cos a cos b ¯
¯ = −16 sen2 (a/2) sen2 (b/2) sen2 (c/2).
1
cos c ¯
¯
cos c
1
208
Capı́tulo 13. Determinantes
29. Establecer la igualdad
¯ 2
¯
¯ a a 1 bcd ¯
¯ 2
¯
b 1 acd ¯
¯b
¯ 2
¯ = (b − a)(c − a)(d − a)(c − b)(d − b)(d − c).
c 1 abd ¯
¯c
¯ 2
¯
d d 1 abc
30. Dados n nmeros a1 , a2 , a3 , . . . , an (n ≥ 2), el número
¯
n−1 ¯
¯ 1 a1 a21 . . . a1 ¯
¯
n−1 ¯
2
¯ 1 a2 a2 . . . a2 ¯
¯
n−1 ¯
2
Vn = ¯¯ 1 a3 a3 . . . a3 ¯¯ .
..
..
.. ¯
¯ ..
.
.
. ¯
¯.
¯
¯
1 an a2n . . . an−1
n
se llama determinante de Vandermonde. Calcular V2 y V3 . Razonar
que
Y
Vn =
(aj − ai ).
j>i
Dedúzcase que Vn 6= 0 si los números dados son distintos dos a dos.
31. Siendo a, b, c distintos dos a dos, resolver la ecuación polinómica
¯
¯
¯ 1 x x2 x 3 ¯
¯
¯
¯ 1 a a2 a3 ¯
¯
¯ = 0.
¯ 1 b b2 b3 ¯
¯
¯
1 c c2 c3
32. Obtener las raı́ces del polinomio
¯
¯ξ
¯
¯3
¯
¯2
¯
ξ
3 2
ξ ξ
ξ ξ
2 3
¯
ξ¯
¯
2¯
¯.
3¯
¯
ξ
0
1
2ξ
1
0
0
0
1
2ξ
1
33. Obtener las raı́ces del polinomio
¯
¯ 2ξ
¯
¯ 1
¯
¯ 0
¯
¯ 0
¯
0
1
2ξ
1
0
0
34. Resolver la ecuación polinómica
¯
¯1
1
1
¯
¯1 1 − x
1
¯
1
2−x
f (x) = ¯¯ 1
..
..
¯ ...
.
.
¯
¯1
1
1
¯
0 ¯
¯
0 ¯
¯
0 ¯.
¯
1 ¯
¯
2ξ
¯
¯
¯
¯
¯
¯ = 0.
¯
¯
¯
... n − x¯
...
...
...
1
1
1
..
.
13.17.
Complementos / Ejercicios
209
35. Obtener la igualdad
¯
¯1
¯
¯ b1
¯
¯ b1
¯
¯ b1
¯ .
¯ .
¯ .
¯
¯ b1
¯
b1
1
a1
b2
b2
..
.
1
a1
a2
b3
..
.
1
a1
a2
a3
..
.
...
...
...
...
b2
b2
b3
b3
b4
b4
. . . an−1
...
bn
¯
¯
¯
¯
¯
¯
¯
¯=
¯
¯
¯
¯
an−1 ¯
¯
an
1
a1
a2
a3
..
.
1
a1
a2
a3
..
.
= (a1 − b1 )(a2 − b2 )(a3 − b3 ) . . . (an−1 − bn−1 )(an − bn ).
para el determinante de orden n + 1 del primer miembro.
36. Para la siguiente matriz de n filas y columnas, razonar que
1+x
1
.
.
det
.
1
1
1
...
1 + x ...
..
.
1
1
...
...
1
1
..
.
1
1
..
.
1+x
1
1
1+x
= xn−1 (n + x).
37. Calcular el siguiente determinante de orden 2n:
¯
¯ 1+x
x
¯
¯ x
1+x
¯ .
..
¯ .
.
¯ .
¯
x
¯ x
f (x) = ¯
x
¯ x
¯ .
..
¯ ..
.
¯
¯ x
1
+
2x
¯
¯ 1 + 2x
x
38. Siendo
¯
...
x
1 + x¯
¯
... 1 + x
x ¯
..
.. ¯¯
.
. ¯
¯
... 1 + x 1 + x ...
x
x ¯
¯.
. . . 1 + 2x 1 + x . . .
x
x ¯
..
..
..
.. ¯¯
.
.
.
. ¯
...
x
x
... 1 + x
x ¯¯
...
x
x
...
x
1 + x¯
...
...
0
1
1
A=
...
1
1
x
x
..
.
x
x
..
.
1
0
1
..
.
1
1
0
..
.
...
...
...
1
1
1
..
.
1
1
1
1
...
...
0
1
1
1
1
..
.
1
0
una matriz de n filas y n columnas, obtener que
det(A) = (−1)n−1 (n − 1).
210
Capı́tulo 13. Determinantes
39. Establecer la igualdad
1+x
x
x
x
2+x
x
x
x
3+x
det
.
..
..
..
.
.
x
x
x
...
...
...
x
x
x
..
.
= n!(1 + x + x/2 + . . . + x/n).
... n + x
40. Razonar que, para n ≥ 3, se tiene
¯
¯
1
2
¯
¯
n+1
n+2
dn = ¯¯
..
..
.
.
¯
¯ n(n − 1) + 1 n(n − 1) + 2
...
41. Calcular en función de n el número
0 1 0 0
1 0 1 0
0 1 0 1
0 0 1 0
dn = det
. . . .
.. .. .. ..
0 0 0 0
0 0 0 0
0
0
0
0.
..
.
0 1
1 0
...
...
...
...
...
...
¯
n ¯
¯
2n ¯
.. ¯¯ = 0.
. ¯
n2 ¯
...
...
0
0
0
0
..
.
42. Para cada n ≥ 3, establecer una fórmula para calcular
5
2
0
dn = det
0
0
0
2 0
5 2
2 5
0
0
2
...
...
...
0 0
0 0
0 0
0
0
0
2 5
0 2
0 0
2
5
2
...
0 0 0
0 0 0
0 0 0
...
...
...
en función de dn−1 y dn−2 . ¿Cuánto vale d5 ?
0
0
0
0
2
5
211
Capı́tulo 14
Aplicaciones Lineales en
Dimensión Finita
14.1.
Aplicaciones lineales de rango finito
Sean V y V0 dos espacios vectoriales sobre el cuerpo conmutativo IK. Una
aplicación lineal f : V → V0 se dice que es de rango finito cuando el subespacio
Im f sea finito-dimensional. Entonces, el número
rang(f ) = dim(Im f )
se conoce como rango de f .
Proposición 187 Una aplicación lineal f : V → V0 es de rango finito si y sólo
si Ker f tiene codimensión finita. En ambos supuestos,
dim(Im f ) = codim(Ker f ).
Demostracion:
Por el Primer Teorema de Isomorfı́a (proposición 114) se sabe que V/Ker
f ≃ Im f . Entonces, Im f es finito-dimensional si y sólo si el cociente V/Ker f
lo es, cumpliéndose en ambos casos que
dim(Im f ) = dim(V/Ker f ).
Por otra parte, según la proposición 116, V/Ker f es de dimensión finita si y
sólo si Ker f es de codimensión finita, y se cumple la fórmula
dim(V/Ker f ) = codim(Ker f ).
Enlazando ambos razonamientos, queda demostrado nuestro enunciado y la
fórmula propuesta.
2
212
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
Este resultado se conoce como el Teorema fundamental de las aplicaciones
lineales de rango finito.
Hay dos casos en que toda aplicación lineal es de rango finito:
1. Morfismos lineales que empiezan en un espacio finito-dimensional
Si V es de dimensión finita, Ker f tiene codimensión finita
codim(Ker f ) = dim(V) − dim(Ker f ),
luego rang(f ) es finito. La fórmula fundamental se escribe en este caso
dim(V) = dim(Ker f ) + dim(Imf ).
De ella se sigue enseguida que
rang(f ) ≤ dim(V).
2. Morfismos lineales que acaban en un espacio finito-dimensional
Si V0 es de dimensión finita, Im f también lo será, luego f es de rango
finito y, además,
rang(f ) ≤ dim(V0 ).
También será finita la codimención de Im f , y la fórmula fundamental
permite escribir
dim(V0 ) = codim(Ker f ) + codim(Im f ).
Las aplicaciones lineales entre dos espacios finito-dimensionales serán, por uno
u otro motivo, de rango finito y el valor de éste no supera a ninguna de las
dimensiones. Es decir,
rang(f ) ≤ mı́n(dim(V), dim(V0 )).
14.2.
Endomorfismos de un espacio finito-dimensional
Si el espacio V es de dimensión finita n ≥ 1, todo elemento
f ∈ End(V, IK) = AL(V, V, IK)
será de rango finito. Ahora, tanto Im f como Ker f son subespacios de V y se
cumplen las igualdades
dim(V) = dim(Ker f ) + dim(Imf ) = codim(Ker f ) + codim(Imf ).
14.3.
Automorfismos de un espacio finito-dimensional
14.3.
213
Automorfismos de un espacio finito-dimensional
Proposición 188 Sea f un endomorfismo lineal f de un espacio V de dimensión finita. Entonces, las tres siguientes afirmaciones son equivalentes entre sı́:
1. f es biyectivo,
2. f es inyectivo,
3. f es suprayectivo.
Demostracion:
a) Por la definición de aplicación biyectiva, es claro que del primer aserto se
siguen los otros dos.
b) Teniendo en cuenta la fórmula fundamental, se tiene
f es inyectivo ⇒ Ker f = {0} ⇒ dim(Ker f ) = dim({0}) = 0 ⇒
⇒ dim(V) = dim(Imf ) ⇒ V = Im f ⇒ f es suprayectivo,
es decir, las afirmaciones segunda y tercera son equivalentes entre sı́.
c) Si de una cualquiera de ellas dos se sigue la otra, al conjuntarse ambas,
de una cualquiera de las dos se sigue que f es biyectivo.
2
14.4.
Igualdad de dos morfismos que empiezan
en dimensión finita
Proposición 189 Supongamos fijada una base B = {v1 , v2 , . . . , vn } en espacio
de dimensión finita n ≥ 1. Sean f : V → V0 , g : V → V0 dos aplicaciones
lineales. Entonces, f = g si y sólo si
f (vj ) = g(vj ), ∀j ∈ [1, n].
Demostracion:
Basta ver que
x=
n
X
j=1
xj vj ⇒ f (x) =
n
X
j=1
xj f (vj ) =
n
X
xj g(vj ) = g(x), ∀x ∈ V ⇒ f = g.
j=1
Si f = g, en particular se cumplen las igualdades del enunciado.
2
214
14.5.
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
Matriz de un morfismo lineal entre espacios finito-dimensionales
En lo que resta de este capı́tulo, V y V0 serán dos espacios de dimensión finita
sobre un mismo cuerpo conmutativo IK, con
n = dim(V), m = dim(V0 ).
Supondremos fijadas bases
0
B = {v1 , v2 , . . . , vn } de V, B 0 = {v10 , v20 , . . . , vm
} de V0 .
Sea f : V → V0 un morfismo lineal. De la implicación
x=
n
X
xj vj ⇒ f (x) =
j=1
n
X
xj f (vj ),
j=1
se sigue que f queda conocida cuando se conozcan los vectores
f (v1 ), f (v2 ), . . . , f (vn ).
Pero esto, a su vez, requiere, para cada j ∈ [1, n], conocer las coordenadas de
f (vj ) en la base B 0 del segundo espacio. Denotaremos tales coordenadas con
dos subı́ndices (el primero i ∈ [1, m] para indicar el lugar de la coordenada y el
segundo j para señalar a qué transformado de la primera base corresponde) .
Ası́, deberemos conocer n igualdades
f (vj ) =
m
X
aij vi0 .
i=1
Tomando en la columna j-ésima las coordenadas de f (vj ), obtenemos una matriz
a11 a12 . . . a1n
a21 a22 . . . a2n
A=
∈ M(m, n, IK),
..
..
...
.
.
am1
am2
...
amn
la cual se nombra como matriz de la aplicación lineal f respecto de la
bases B y B 0 . Para significar que A depende de f y las bases fijadas, se escribe
A = M (f, B, B 0 ),
pero, si la alusión a las bases se sobreentiende, pondremos simplemente
A = M (f ).
14.6.
Ecuaciones de una aplicación lineal
14.6.
215
Ecuaciones de una aplicación lineal
Si para cada vector x ∈ V ponemos
x=
n
X
xj vj , f (x) =
j=1
m
X
x0i vi0 ,
i=1
se tendrá
m
X
x0i vi0 = f (x) = f (
i=1
=
n
X
j=1
n
X
j=1
x j vj ) =
n
X
xj f (vj ) =
j=1
m
m X
n
n
X
X
X
xj (
aij vi0 ) =
(
aij xj )vi0 ⇒ x0i =
aij xj , ∀i ∈ [1, m],
i=1
i=1 j=1
j=1
ya que las coordenadas de f (x) son únicas en la base B0 . Desarrollando los
sumatorios y detallando para cada ı́ndice, tenemos las igualdades
0
x = a11 x1 + a12 x2 + . . . + a1n x
10
x2 = a21 x1 + a22 x2 + . . . + a2n x
...
0
xm = am1 x1 + am2 x2 + . . . + amn x
que se reducen a una sola de tipo matricial:
x0
a11 a12 . . . a1n
x1
1
0
x2 a21 a22 . . . a2n x2
. = .
× . , donde (aij ) = A = M (f, B, B 0 )
..
..
. ..
.
. ..
.
am1 am2 . . . amn
xn
x0m
Las primeras se nombran como ecuaciones de la aplicación lineal f en las
bases B y B 0 , por cuanto expresan las coordenadas de f (x) en B0 a partir de
las coordenadas de x en B. La segunda es la llamada ecuación matricial de f
respecto de B y B0 . Si adoptamos el convenio de igualar cada vector a la matriz
columna de sus coordenadas en la base respectiva, esta ecuación se abrevia en
la escritura
f (x) = A × x.
14.7.
Matriz de un endomorfismo
La matriz M (f, B, B 0 ) será cuadrada cuando y sólo cuando se tenga que dim(V) =
dim(V0 ). En particular, lo será para los endomorfismos de un espacio V. En este
caso, además, puede tomarse B 0 = B, de manera que los coeficientes de la matriz
procederán de las igualdades
f (vj ) =
m
X
i=1
aij vi , j ∈ [1, n].
216
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
La matriz se denota como A = M (f, B), o, simplemente, A = M (f ) si la alusión
a la base se presupone.
14.8.
Matriz de una homotecia
Dado µ ∈ IK, consideremos la homotecia Hµ = µ I. Puesto que
Hµ (vj ) = µvj ,
la columna j-ésima de su matriz será nula en todos los lugares salvo el de la fila
j que lo ocupa el número µ . Se tiene, por tanto,
M (Hµ , B) = µI.
Ası́, las homotecias se corresponden con las matrices escalares. Además, se comprende que la matriz es la misma en cualquier base que se prefije.
En particular, f0 (homotecia de razón 0) se corresponde con la matriz nula, e I
(homotecia de razón 1) se corresponde con la matriz unidad.
14.9.
Matriz de una forma lineal
Dada una forma lineal σ : V → IK, su matriz en la base B de V y en la base
{1} de IK estará en M(1, n, IK), es decir, es una matriz fila
M (σ) = ( a1
14.10.
a2
...
an ) , donde aj = σ(vj ).
Determinación de aplicaciones lineales
mediante matrices
Proposición 190 Dada la matriz A = (aij ) ∈ M(m, n, IK), existe una aplicación lineal f : V → V0 y sólo una que cumple
M (f, B, B 0 ) = A.
Demostracion:
Definiendo f mediante la regla
x=
n
X
xj vj ⇒ f (x) =
j=1
m X
n
X
(
aij xj )vi0
i=1 j=1
se trata de una aplicación lineal porque dados
x=
n
X
j=1
xj vj , y =
n
X
j=1
yj vj , a ∈ IK,
14.11. El isomorfismo lineal
M (B, B0 ) : AL(V, V0 , IK) → M(m, n, IK)
217
se verifica que
f (x + y) = f (
n
n
m X
X
X
aij (xj + yj ))vi0
(
(xj + yj )vj ) =
j=1
=
i=1 j=1
m X
n
m X
n
X
X
(
aij xj )vi0 +
(
aij yj )vi0 = f (x) + f (y),
i=1 j=1
i=1 j=1
n
X
f (ax) = f (
(axj )vj ) =
j=1
=a
m X
n
X
(
aij (axj ))vi0 =
i=1 j=1
m X
n
X
(
aij xj )vi0 = af (x).
i=1 j=1
En particular, para los vectores básicos se tiene
f (vj ) =
m X
n
m
X
X
(
aih δhj )vi0 =
aij vi0 ,
i=1 h=1
i=1
0
luego M (f, B, B ) = A. Si g es otro morfismo lineal tal que M (g, B, B0 ) = A,
cumplirá que
m
X
g(vj ) =
aij vi0 = f (vj ),
i=1
de donde se concluye (proposición 189) que g = f .
14.11.
2
El isomorfismo lineal
M (B, B 0 ) : AL(V, V0 , IK) → M(m, n, IK)
Proposición 191 Dados f, g ∈ AL(V, V0 , IK), a ∈ IK, se cumple que
M (f + g, B, B0 ) = M (f, B, B 0 ) + M (g, B, B0 ), M (af, B, B0 ) = aM (f, B, B0 ).
Demostracion:
M (f ) = (aij ), M (g) = (bij ),
se tiene
(f + g)(vj ) = f (vj ) + g(vj ) =
m
X
i=1
aij vi0 +
m
X
bij vi0 =
i=1
m
m
X
X
=
(aij vi0 + bij vi0 ) =
(aij + bij )vi0 ⇒ M (f + g) = M (f ) + M (g),
i=1
i=1
(af )(vj ) = af (vj ) = a
m
X
i=1
0
aij vi =
m
X
i=1
a(aij vi0 ) =
m
X
(aaij )vi0 ⇒
i=1
218
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
⇒ M (af ) = aM (f ).
2
Considerando la aplicación
M (B, B0 ) : AL(V, V0 , IK) → M(m, n, IK), de ley M (B, B 0 )(f ) = M (f, B, B0 ),
el anterior teorema indica que es lineal. Más aún:
Proposición 192 La aplicación lineal
M (B, B 0 )(f ) = M (f, B, B 0 )
establece un isomorfismo de AL(V, V0 , IK) sobre M(m, n, IK).
Demostracion:
Sabemos (proposición 190) que dada una matriz A ∈ M(m, n, IK), existe
un morfismo lineal f : V → V0 tal que M (f, B, B 0 ) = A, lo que significa que
el operador M (B, B0 ) es suprayectivo. El mismo teorema decı́a que esta f era
única, luego M (B, B0 ) es inyectivo.
2
14.12.
Dimensión del espacio de aplicaciones
lineales
Proposición 193 Si V y V0 son espacios de dimensión finita, se cumple
dim(AL.(V, V0 , IK)) = dim(V) dim(V0 ).
Demostracion:
Después del isomorfismo M (B, B0 ), la dimensión de AL(V, V0 , IK) se iguala
a la de M(m, n, IK), la cual vale mn (proposición 144).
2
En particular, se tendrá
dim(End(V, IK)) = dim(AL(V, V, IK)) = (dim(V))2 ,
ası́ como
dim(V∗ ) = dim(AL.(V, IK, IK)) = dim(V),
Después del anterior isomorfismo podemos describir una base del espacio
AL(V, V0 , IK): estará formada por las aplicaciones lineales Fhk determinadas
por las matrices básicas Ehk de M(m, n, IK) que introdujimos en la seccioń 11.5.
Puesto que esta matriz tenı́a nulas todas las columnas excepto la de lugar k,
que es ocupada por el vector h-ésimo de la base canónica de IK m , resulta de
Fhk queda definida por las igualdades
½
0 si j 6= k
Fhk (vj ) = δjk vh0 =
vh0 si j = k
14.13.
Matriz de una compuesta
14.13.
219
Matriz de una compuesta
Sean dos aplicaciones lineales f : V → V0 , g : V0 → V00 entre espacios de
dimensiones finitas
n = dim(V), r = dim(V0 ), m = dim(V00 ),
dotados de bases respectivas
00
B = {v1 , v2 , . . . , vn }, B0 = {v10 , v20 , . . . , vr0 }, B 00 = {v100 , v200 , . . . , vm
}.
Si consideramos la aplicación lineal compuesta
g ◦ f : V → V00 ,
cada una de las tres aplicaciones tendrá asignada una matriz:
(ahj ) = M (f ) ∈ M (r, n, IK) ⇔ f (vj ) =
r
X
ahj vh0 ,
h=1
0
(bih ) = M (g) ∈ M (m, r, IK) ⇔ g(v ) =
m
X
bih vi00 ,
i=1
(cij ) = M (g ◦ f ) ∈ M (m, n, IK) ⇔ (g ◦ f )(vj ) =
m
X
cij vi00 .
i=1
Proposición 194 Dados dos morfismos lineales f : V → V0 , g : V0 → V00 ,
entre espacios finito-dimensionales, con bases B, B0 y B00 , se tiene que
M (g ◦ f ) = M (g) × M (f ).
Demostracion:
Basta ver que
(g ◦ f )(vj ) = g(f (vj )) = g(
r
X
ahj vh0 ) =
h=1
=
r
X
ahj g(vh0 ) =
h=1
m
m X
r
X
X
ahj (
bih vi00 ) =
(
bih ahj )vi00 ⇒
i=1
h=1
⇒ cij =
r
X
r
X
i=1 h=1
bih ahj ⇒ M (g ◦ f ) = M (g) × M (f ).
h=1
2
220
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
14.14.
Matriz de la inversa de un isomorfismo
lineal
Proposición 195 Un morfismo lineal f : V → V0 es un isomorfismo si y sólo
si M (f ) es cuadrada e invertible. Además
M (f −1 ) = M (f )−1 .
Demostracion:
Si A = M (f, B, B 0 ) es invertible, existe A−1 . Determinando un morfismo
lineal g : V0 → V tal que M (g, B0 , B) = A−1 , se tiene
M (IV ) = In = A−1 × A = M (g) × M (f ) = M (g ◦ f ) ⇒ IV = g ◦ f
M (IV 0 ) = In = A × A−1 = M (f ) × M (g) = M (f ◦ g) ⇒ IV 0 = f ◦ g
Esto prueba que g = f −1 , luego f es un isomorfismo.
Si f es un isomorfismo, las dimensiones de V y V0 coinciden y existe la
aplicación lineal inversa f −1 : V0 → V. Entonces,
f −1 ◦ f = IV ⇒ M (f −1 ◦ f ) = M (f −1 ) × M (f ) = M (IV ) = In
f ◦ f −1 = IV 0 ⇒ M (f ◦ f −1 ) = M (f ) × M (f −1 ) = M (IV 0 ) = In
Esto prueba que M (f ) es invertible.
En ambos supuestos, la matriz de f −1 es la inversa de la de f .
14.15.
2
EL isomorfismo de álgebras unitarias
M t (B) : End(V, IK) → M(n, IK)
Sea V de dimensión finita n y sea B una base de V. Como en el caso general, la aplicación f → M (f, B) establecerá un isomorfismo entre End(V, IK) y
M(n, IK). Para la composición de endomorfismos, la fórmula ya conocida
M (g ◦ f ) = M (g) × M (f )
nos indica que M no es un morfismo de anillos porque hay una alteración en el
orden de los factores del segundo miembro. Sin embargo, combinando la asignación de una matriz con el proceso de trasposición, vamos a establecer un
isomorfismo entre las álgebras End(V, IK) y M(n, IK).
Proposición 196 La aplicación
M t (B) : End(V, IK) → M(n, IK), de ley M t (B)(f ) = M (f, B)t ,
es un isomorfismo de álgebras asociativas y unitarias.
14.16. El isomorfismo de grupos
M t (B) : GL(V, IK) → GL(n, IK)
221
Demostracion:
Presuponiendo la alusión a B, escribimos simplemente M t y empezamos por
observar que se trata de la compuesta de M con el operador de trasposición (sección 11.11), el cual establecı́a un isomorfismo entre M(m, n, IK) y M(n, m, IK)
y en particular un automorfismo lineal de M(n, IK). Al ser compuesta de dos
isomorfismos, es otro isomorfismo lineal. Además, es morfismo de anillos, pues
enlazando las fórmulas de las proposiciones 149 y 194 se tiene
M t (g ◦ f ) = M (g ◦ f )t = (M (g) × M (f ))t =
= M (f )t × M (g)t = M t (f ) × M t (g).
Finalmente, puesto M t (I) = (In )t = In , M t aplica entre sı́ los elementos unidad
de ambos anillos.
2
14.16.
El isomorfismo de grupos
M t (B) : GL(V, IK) → GL(n, IK)
Proposición 197 Fijada una base B del espacio n-dimensional V sobre IK,
M t (B) establece un isomorfismo entre los grupos GL(V, IK) y GL(n, IK).
Demostracion:
Ya sabemos que M t es una biyección de End(V, IK) y que, en virtud de la
fórmula M t (g ◦ f ) = M t (f ) × M t (g), actúa como un morfismo de grupos. Sólo
hará falta ver que las imágenes de los automorfismos están en GL(n, IK) y que
todo elemento de este grupo procede de un automorfismo:
a) Mediante M a un automorfismo f le asignamos una matriz regular (proposición 195) y por trasposicición de una matriz regular se obtiene otra regular
(proposición 150), que por ello es invertible. Es decir,
f ∈ GL(V, IK) ⇒ M t (f ) ∈ GL(n, IK).
b) Si A es invertible, es regular y lo mismo le pasa a At . Con ella se construye
un endomorfismo f tal que M (f ) = At , el cual será un automorfismo en
virtud de la proposición 195. Entonces, M t (f ) = M (f )t = (At )t = A,
luego
A ∈ GL(n, IK) ⇒ ∃f ∈ GL(V, IK)/M t (f ) = A.
2
14.17.
Dimensión y una base de la imagen
En este apartado y los restantes del capı́tulo, describiremos los diversos cálculos que proceden en una aplicación lineal f : V → V0 entre espacios finitodimensionales.
222
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
La primera cuestión es el cálculo de la dimensión de Im f , o rango de f , ası́ como
la búsqueda de una base de dicho subespacio. Siendo B la base de V, por ser
f (B) un sistema generador de Im f , se tendrá
dim(Im f ) = rang(f ) = rang{f (v1 ), f (v2 ), . . . , f (vn )}.
Por tanto, podemos aplicar a los vectores f (vj ) alguno de los métodos descendente o ascendente (sección 5.9). Por otra parte, si A es la matriz de f , los
vectores f (vj ) y Cj (A) se corresponden en un isomorfismo de Descartes, el cual
conservará el rango (proposición 77), luego
dim(Im f ) = rang(f ) = rang{f (v1 ), f (v2 ), . . . , f (vn )} =
= rang{C1 (A), C2 (A), . . . , Cn (A)} = rang(A).
Por ello, si se prefiere, el rango de f puede calcularse con técnicas matriciales y
de determinantes, como, por ejemplo, el método del orlado.
Sea como fuere, una vez obtenido el número
r = rang(f ) = dim(Imf ),
habremos seleccionado r vectores entre los f (vj ) que sean base de Im f . Salvo
reordenación si fuese precisa, no hay inconveniente en suponer que
{f (v1 ), f (v2 ), . . . , f (vr )}
sea tal base. Siendo p = n − r, los p vectores restantes serán combinación lineal
de éstos, o sea, contaremos con unas relaciones de la forma
f (vr+j ) =
r
X
βhj f (vh ), j ∈ [1, p].
h=1
14.18.
Coordenadas de un vector imagen
Para cada vector x ∈ V, su imagen puede conocerse por sus coordenadas en la
base B0 o por sus coordenadas en la base de Im f . En el primer caso, usando
las ecuaciones de f obtenidas en la sección 14.6, basta con efectuar el cálculo
A × x = f (x)
y la columna de resultados son las coordenadas de f (x) en B0 . En el segundo,
fijada como en el apartado anterior, la base
{f (v1 ), f (v2 ), . . . , f (vr )}
de Im f , se tendrá
x=
n
X
j=1
xj vj ⇒ f (x) =
n
X
j=1
xj f (vj ) =
r
X
h=1
xh f (vh ) +
n
X
j=1
xr+j f (vr+j ) =
14.19.
Dimensión y una base del núcleo
=
r
X
xh f (vh ) +
r
X
xh f (vh ) +
n
X
xr+j (
j=1
h=1
=
223
r
X
r
n
r X
n
X
X
X
xr+j βhj )f (vh ),
xr+j βhj )f (vh ) =
(xh +
(
h=1 j=1
h=1
βhj f (vh )) =
h=1
j=1
h=1
de manera que si α1 , α2 , . . . , αr fuesen las coordenadas de f (x) en la base de la
imagen, queda
n
X
αh = xh +
xr+j βhj , ∀h ∈ [1, r].
j=1
14.19.
Dimensión y una base del núcleo
Según el teorema fundamental, se tendrá
dim(Ker f ) = n − r = p.
Un vector x estará en el núcleo si y sólo si las coordenadas de f (x), por ejemplo
en la base de Im f , son todas nulas. Entonces,
αh = xh +
n
X
xr+j βhj = 0 ⇒ xh = −
j=1
n
X
xr+j βhj , ∀h ∈ [1, r].
j=1
Tomando cada una de las coordenadas xr+j = λj (j = 1, 2, . . . p) como parámetro
y dando a éstos los sucesivos valores canónicos, obtenemos en el núcleo de f los
p siguientes vectores:
u1 = (−β11 , −β21 , . . . , −βr1 , 1, 0, . . . , 0)
u2 = (−β12 , −β22 , . . . , −βr2 , 0, 1, . . . , 0)
......
up = (−β1p , −β2p , . . . , −βrp , 0, 0, . . . , 1)
Formando una matriz de n filas y p columnas, las cuales sean las coordenadas
de estos vectores, es evidente que sus p últimas filas son independientes. El
rango (por filas), pues, será mayor o igual que p. En realidad, debe ser p ya que
coincidirá con el rango por columnas y sólo contamos con p de éstas. De ello, se
concluye que los p vectores mostrados son linealmente independientes y, al estar
en igual cantidad que la dimensión de Ker f , constituyen una base del mismo.
224
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
14.20.
Imagen inversa
Proposición 198 Un vector v0 ∈ V0 pertenece a Im f si y sólo si
rang{f (v1 ), f (v2 ), . . . , f (vn )} = rang{f (v1 ), f (v2 ), . . . , f (vn ), v0 }.
Demostracion:
Sea, como en los apartados anteriores, r = rang(f ) y {f (v1 ), f (v2 ), . . . , f (vr )}
una base de Im f . Entonces,
rang{f (v1 ), f (v2 ), . . . , f (vn )} = rang{f (v1 ), f (v2 ), . . . , f (vr )}
y la demostración puede hacerse sustituyendo r por n: Puesto que f (v1 ), f (v2 ), . . . , f (vr )
son independientes y el rango no aumenta al añadir el vector v0 , éste debe ser
combinación lineal de ellos, luego está en Im f .
Recı́procamente, si v0 ∈ Im f , al calcular el rango del conjunto ampliado
{f (v1 ), f (v2 ), . . . , f (vr ), v0 } podemos prescindir del último vector y el rango
se iguala al de {f (v1 ), f (v2 ), . . . , f (vr )} de nuevo por la independencia de sus
miembros.
2
La existencia o no de vectores que se aplican en v0 se corresponderá, pues, con
la alternativa de que el rango del conjunto ampliado valga r o r + 1, respectivamente.
En el caso de que v0 ∈ Im f , al verificar el anterior test, existirán unos números
α1 , α2 , . . . , αr tales que
v0 = α1 f (v1 ) + α2 f (v2 ) + . . . + αr f (vr ).
Entonces, usando la linealidad de f , tenemos
0
v =
r
X
h=1
αh f (vh ) =
r
X
f (αh vh ) = f (
h=1
r
X
αh vh ),
h=1
de manera que hemos encontrado un vector particular, el
v=
r
X
αh vh .
h=1
tal que f (v) = v0 .
Los restantes vectores x de f −1 (v0 ) (véase la proposición 127) son de la forma
x = v + Ker f.
Supuesto que Ker f ya esté determinado, podremos escribir las ecuaciones
paramétricas del subespacio afı́n f −1 (v0 ).
14.21.
Complementos / Ejercicios
14.21.
225
Complementos / Ejercicios
1. Comprobar que en la base canónica de IR3 , el endomorfismo f representado
por la siguiente matriz A es un automorfismo:
1 3 2
A = 2 1 3.
3 2 1
Encontrar el vector v tal que f (v) = (3, −3, 0).
2. Indicar las matrices en las bases canónicas respectivas de las siguientes
aplicaciones lineales
a) f : IR3 → IR2 , f (x, y, z) = (6x − 3y + 6z, −4x − z).
b) f : IR3 → IR3 , f (x, y, z) = (x − y + 2z, 3x + 4y − z, z − y).
c) f : IR3 → IR5 , f (x, y, z) =
= (x − y + 2z, 3x + 5y − z, z − y, y − x, x + z).
d ) f : IR4 → IR5 , f (x, y, z, t) =
= (x − z, y − t, z − x, t − y, x + y, x + y − z − t).
En cada caso determinar bases en el núcleo y en la imagen.
3. Determinar bases de Ker f e Im f para el endomorfismo de ecuaciones
x0 = 2x + y − z, y 0 = −x + 2y + 3z, z 0 = y + z.
4. Dada la aplicación lineal f : IR4 → IR5 tal que
f (x, y, z, t) = (x − 3y + 2z, −4x − z, 3y − x − 2z, t − z, 4x + t),
estudiar su núcleo y su imagen. Obtener la imagen inversa del vector
v0 = (−1, 0, 1, 1, 1).
5. Sea f la aplicación lineal cuya matriz en las bases canónicas de IR4 y IR5
es la
1 −2 3
2
1
2
−1 2
A = 1 −2 4
3 .
4 −8 −1 −5
−1 2 −2 −1
Se pide:
a) Dimensión y una base de la imagen.
226
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
b) Dimensión y una base del núcleo.
c) Calcular las coordenadas de f (u) en la base total de IR5 y en la base
de Im f , siendo u = (2, 1, −3, 5).
d ) Estudiar si el vector u0 = (5, 0, 0, 3, −1) ∈ Im f y en caso afirmativo
buscar todos los vectores que se transforman en él.
e) Idéntica cuestión para el vector v0 = (15, 1, 19, 8, −11).
6. Sea f la aplicación lineal cuya matriz en las bases canónicas de IR5 y IR4
es la
1 2 3 −4 −2
3
1
0 1 4
A=
.
−4 2 5
2
0
−2 7 15 −3 −3
Se pide:
a) Dimensión y una base de la imagen.
b) Dimensión y una base del núcleo.
c) Calcular las coordenadas de f (u) en la base total de IR5 y en la base
de Im f , siendo u = (0, 1, −3, 5, 3).
d ) Estudiar si u0 = (1, 9, 1, 12) ∈ Im f y, en caso afirmativo, buscar
todos los vectores del espacio inicial que se transforman en él.
e) Idéntica cuestión para el vector v0 = (0, 1, 2, 3).
7. Dada la aplicación lineal
f : IR3 → IR2 , de ley f (x, y, z) = (x − y, y − z),
hallar las dimensiones y una base para
Ker f, Imf, IR3 /Ker (f ).
8. Dada la aplicación lineal
f : IR4 → IR2 , de ley f (x, y, z, t) = (x − y + z + t, x + y − z − t),
hallar las dimensiones y una base para
Ker f, Im f, IR4 /Ker (f ).
9. Dada la aplicación lineal f : IR4 → IR3 , representada en las bases canónicas
por la matriz
1 −1 3 −3
A = 0 −5 1
2 ,
−1 −4 −2 5
hallar las dimensiones y una base para
Ker f, Im f, IR4 /Ker (f ).
14.21.
Complementos / Ejercicios
227
10. Sean V y V0 espacios vectoriales reales con bases
B = {v1 , v2 , v3 }, B0 = v10 , v20 , v30 , v40 ,
y sea f : V → V0 la aplicación lineal tal que
f (v1 ) = λv10 + v20 , f (v2 ) = v30 + v40 , f (v3 ) = v10 + v20 + v30 + v40 .
Hallar:
a) La matriz y las ecuaciones de f en las bases dadas.
b) El núcleo y la imagen de f , analizando cuándo es inyectiva.
11. Bases de Ker f e Im f para el endomorfismo de IR9 representado en la
base canónica por la matriz
3 0 0 −1 0
0 −3 0
0
0 −3 0
0 3 0 0 −1 0
0 −3 0
0
3 0 0 −1 0
0 −3 0
0
3 0 0 −1 0
A = 0 3 0 0 −1 0
0 −3 0
0 −3 0
0 3 0 0 −1 0
0 −1 0
0 −3
0 −1 3 0
0 0 0 0
1
0
0
0
0
0 0 3 0
0 −1 0 −1 −3
12. Encontrar y describir todos los endomorfismos lineales de IR2 que aplican
la recta y = 0 en la recta x = 0.
13. Encontrar un endomorfismo lineal f de IR3 tal que
Im f = {(x, y, z)/3x − y + 5z = 0}.
Encontrar otro endomorfismo g tal que Ker g = Im f . ¿Cuál es el endomorfismo g ◦ f ?.
14. Sea a ∈ IR un número fijo. Escribir la matriz del endomorfismo de derivación
en el espacio IRn [ξ] en las bases
{1, ξ, ξ 2 , . . . , ξ n }, {1, ξ − a,
(ξ − a)2
(ξ − a)n
,...,
}.
2!
n!
15. Sea λ 6= 0 un número real, sea H ∈ M(4, IR) una matriz antisimétrica.
Razonar que la matriz A define un automorfismo de IR4 :
A = λI + H.
16. Sea V un espacio vectorial de dimensión par n = 2p sobre un cuerpo
conmutativo IK de caracterı́stica distinta de 2. Sea f un endomorfismo no
nulo de V. Razonar que
Ker(f ) = Im f ⇒ rang(f ) = p, f 2 = f0 .
228
Capı́tulo 14. Aplicaciones Lineales en Dimensión Finita
17. Dos operadores f y g de un espacio V se dicen permutables si
g ◦ f = f ◦ g.
Si V es de dimensión finita n ≥ 1 y B = {v1 , v2 , . . . , vn } es una base de
V, razonar la equivalencia de las tres siguientes afirmaciones:
a) f y g son permutables
b) M (g, B) × M (f, B) = M (f, B) × M (g, B).
c) (g ◦ f )(vj ) = (f ◦ g)(vj ), ∀j ∈ [1, n].
Razonar que un operador h conmuta con todos los demás si y sólo si se
trata de una homotecia.
18. Supongamos que V es un espacio de dimensión finita n ≥ 1 y V0 un espacio cualquiera sobre el mismo cuerpo conmutativo IK. Sea f : V → V0
una aplicación lineal en la cual dim(Ker f ) = p. Siendo W un complementario de Ker f , razonar que W es isomorfo a Im f . (Ası́, obtenemos
una demostración directa (o sea, sin utilizar el Teorema de Isomorfı́a) de
la fórmula
dim(V) = dim(Ker f ) + dim(Im f )).
19. Sea f : V → V0 de rango finito r. Dada una base {v10 , v20 , . . . , vr0 } de
Im f , razonar que W =< v1 , v2 , . . . , vr >, donde f (vj ) = vj0 , es un
complemento de Ker f .
20. Sea p un proyector del espacio V de dimensión finita n ≥ 2. Sea B una base
de V. ¿Qué condición debe cumplir la matriz P de p en B? Comprobar
que la matriz
2 0 −2 −2
0
0
0 1
P =
0 1
0
0
1 −1 −1 −1
corresponde a un proyector de IR4 . Determinar su eje y dirección. Indicar
las matrices de q = I − p, s = 2p − I, t = 2q − I.
21. Sea s un automorfismo involutivo (simetrı́a) del espacio V de dimensión
finita n ≥ 2. Sea B una base de V. ¿Qué condición debe cumplir la matriz
S de s en B? Comprobar que la matriz
1
4
S=
2
0
2
3
2
0
−4
−8
−5
0
0
0
0
−1
corresponde a una simetrı́a de IR4 . Determinar su eje y dirección.
229
Capı́tulo 15
Sistemas Lineales
15.1.
Ecuaciones lineales
Una ecuación como la
a1 x1 + a2 x2 + . . . + an xn = b,
donde a1 , a2 , . . . , an , b son números dados en un cuerpo conmutativo IK, recibe
el nombre de ecuación lineal de n incógnitas x1 , x2 , . . . , xn . Los escalares
a1 , a2 , . . . , an se nombran como coeficientes de la ecuación y el b como
término independiente. Si b = 0, la ecuación se dice homogénea, mientras que si b 6= 0 se dice que es completa.
Una solución de la ecuación es un conjunto ordenado de números ξ1 , ξ2 , . . . , ξn ,
tales que al tomar xj = ξj , la ecuación se convierte en una igualdad verdadera.
15.2.
Sistemas lineales
En general, podemos tener varias ecuaciones, digamos que m, y hablar de sistemas de m ecuaciones lineales con n incógnitas. Se escriben como
a x
11 1
a21 x1
...
am1 x1
+a12 x2
+a22 x2
...
+am2 x2
+...
+...
...
+...
+a1n xn
+a2n xn
...
+amn xn
= b1
= b2
...
= bm
donde los coeficientes se numeran con dos ı́ndices, el primero para indicar la
ecuación y el segundo para señalar el lugar que ocupa en ella; cada término
independiente lleva un ı́ndice que alude a la ecuación en que aparece. El sistema
se dirá homogéneo si son nulos todos los términos independientes y completo
si es no nulo al menos uno de ellos. Usando la regla de multiplicar matrices, el
230
Capı́tulo 15. Sistemas Lineales
sistema se presenta en la forma
a11
a21
.
..
a12
a22
..
.
...
...
am1
am2
...
a1n
x1
b1
a2n x2 b2
× . = .
..
. .. ..
amn
xn
bm
La matriz A = (aij ) ∈ M(m, n, IK) se conoce como matriz de coeficientes o
matriz del sistema. Junto a ella es bueno considerar otra
a11 a12 . . . a1n b1
a21 a22 . . . a2n b2
..
..
..
.. ∈ M(m, n + 1, IK),
.
.
.
.
am1
am2
...
amn
bm
obtenida al añadir la columna de términos independientes, la cual se conoce
como matriz ampliada.
Una solución del sistema es un conjunto ordenado de números ξ1 , ξ2 , . . . , ξn
que sea solución de todas sus ecuaciones. Un sistema se llama compatible si
posee al menos una solución e incompatible si carece de soluciones. Un sistema
compatible de solución única se dice determinado, mientras que si posee más
de una solución se llama indeterminado.
Los sistemas homogéneos siempre son compatibles, pues cuando menos admiten
la solución
ξ1 = ξ2 = . . . = ξn = 0.
Esta se conoce como solución trivial o nula.
Dos sistemas lineales en las mismas incógnitas, e independientemente de sus
números de ecuaciones, se dicen equivalentes si admiten el mismo conjunto
de soluciones. Los sistemas incompatibles son todos ellos, de manera trivial,
equivalentes entre sı́.
Proposición 199 Si una fila de la matriz ampliada es combinación lineal de
las restantes, el sistema obtenido al suprimir la ecuación correspondiente a la
misma es equivalente al dado.
Demostracion:
Salvo renumeración, supongamos que se trata de la última fila. Entonces,
existen unos números γ1 , γ2 , . . . , γm−1 tales que
amj =
m−1
X
i=1
γi aij , bm =
m−1
X
i=1
γi b i .
15.3. Interpretación geométrica de un sistema lineal
231
a) Si (ξ1 , ξ2 , . . . , ξn ) es una solución del sistema de las m − 1 primeras ecuaciones, se tendrá
n
X
j=1
amj ξj =
n m−1
m−1
n
m−1
X
X
X
X
X
(
γi aij )ξj =
γi (
aij ξj ) =
γi b i = b m ,
j=1 i=1
i=1
j=1
i=1
es decir, también es solución de la última.
b) Si se tratara de una solución del sistema dado, también lo es del sistema
obtenido al suprimir una ecuación.
2
Este serı́a el Lema de reducción de los sistemas lineales y se empleará en
el estudio y resolución, cuando proceda, de los mismos.
15.3.
Interpretación geométrica de un sistema
lineal
Dado un sistema lineal de m ecuaciones y n incógnitas con coeficientes en el
cuerpo conmutativo IK, fijemos dos espacios V y V0 sobre IK, con dimensiones
respectivas n y m, a la vez que dos bases
0
B = {v1 , v2 , . . . , vn }, B0 = {v10 , v20 , . . . , vm
}.
Con la matriz A de coeficientes podemos construir una aplicación lineal f : V →
V0 tal que A = M (f, B, B 0 ).
Interpretando las incógnitas x1 , x2 , . . . , xn como coordenadas de un vector
x ∈ V en B y los términos independientes como coordenadas en B0 de un vector
b ∈ V0 , el estudio de la compatibilidad del sistema equivale a estudiar la pertenencia de b al subespacio Im f . En el caso homogéneo, se trata de estudiar el
núcleo de f .
15.4.
La condición de Rouché Frobenius
Proposición 200 Un sistema lineal
a11 a12 . . . a1n
x1
b1
a21 a22 . . . a2n x2 b2
.
× . = .
..
..
..
.
. .. ..
am1
am2
...
amn
a11
a21
rang
...
a12
a22
..
.
...
...
am1
am2
...
xn
es compatible si y sólo si
a1n
a2n
=
..
.
amn
bm
232
Capı́tulo 15. Sistemas Lineales
a11
a21
= rang .
..
a12
a22
..
.
...
...
a1n
a2n
..
.
b1
b2
..
.
am1
am2
...
amn
bm
.
Demostracion:
Interpretado el sistema en términos geométricos, la compatibilidad equivale
a la relación b ∈ Im f . Ya hemos probado (proposición 198) que ésta equivale
a la igualdad
rang{f (v1 ), f (v2 ), . . . , f (vn )} = rang{f (v1 ), f (v2 ), . . . , f (vn ), b},
la cual, expresada matricialmente, no es sino la del enunciado.
2
Esta caracterización de la compatibilidad en términos matriciales se conoce
como la condición de Rouché-Frobenius. De ella se desprende trivialmente
que los sistemas homogéneos siempre son compatibles, hecho que ya hemos
señalado como cierto.
15.5.
Sistemas y regla de Cramer
Un sistema lineal se llama sistema de Cramer cuando tenga igual número n
de ecuaciones que de incógnitas y la matriz del sistema sea regular.
En su interpretación geométrica, basta tomar un solo espacio V, de dimensión n,
y una sola base B en él. Por ser A regular, la aplicación f será un automorfismo.
Por ello, es suprayectiva, con lo que b siempre está en Im f , o sea, el sistema es
compatible; pero también es inyectiva, con lo cual la imagen inversa consta de
un solo vector x y el sistema es determinado. Su solución única vendrá dada por
x = f −1 (b). Pero, siendo A−1 la matriz de f −1 , la solución también se expresa
como
−1
x1
a11 a12 . . . a1n
b1
x
a
a
.
.
.
a
b
2
22
2n
= 21
× .2 .
x = A−1 × b ⇔
.
.
.
.
.. ..
..
..
..
xn
an1
an2
...
ann
bn
Entonces, de acuerdo con la fórmula
A−1 =
1
(Adj(A))t
det .(A)
probada en la proposición 186, se tendrá
xj =
1
(A1j b1 + A2j b2 + . . . + Anj bn ), ∀j ∈ [1, n],
det .(A)
pero, como señalamos en la sección 13.14, el último paréntesis se iguala a un
determinante con todas sus columnas iguales a las de A salvo la de lugar j que
15.6. Estudio y resolución de los sistemas homogéneos
233
se ha sustituı́do por el vector b. Ası́, cada incógnita xj se expresa como cociente
de dos determinantes:
xj =
det(C1 (A), . . . , Cj−1 (A), b, Cj+1 (A), . . . , Cn (A))
.
det(A)
Esta manera de resolver cada incógnita de un sistema de Cramer como cociente
de dos determinantes, se conoce como la regla de Cramer.
15.6.
Estudio y resolución de los sistemas homogéneos
Siendo f una aplicación lineal que interpreta el sistema, que éste sea homogéneo
significa que sus soluciones son los vectores de Ker f . Si el rango de A vale r,
se tratará de un subespacio de dimensión p = n − r.
Salvo reordenación, como otras veces, supongamos que las r primeras columnas
de A son independientes y las restantes son combinación lineal de ellas. Es igual
que decir que f (v1 ), f (v2 ), . . . , f (vr ) es una base de Im f . En la sección 14.19
hemos señalado una manera de obtener una base de Ker f , lo cual equivale a
resolver el sistema pues las restantes soluciones son las combinaciones lineales
de los vectores de tal base. La vı́a que seguı́amos presuponı́a conocer cada vector
f (vr+j ) como combinación lineal de la base de Im f . Ahora describiremos otra
forma de proceder sin usar tales combinaciones (Pensemos que la base de Im f
puede conocerse si a la matriz A le aplicamos por ejemplo el método del orlado
y que éste no informa sobre las combinaciones de las restantes columnas sino
únicamente de que éstas dependen de las r seleccionadas).
Se comienza por calcular el número r = rang(A), determinando una submatriz
principal P ∈ GL(r, IK) de A. Las r filas y columnas afectadas por la submatriz
P se nombran como filas principales y columnas principales. Las restantes
lı́neas se llaman filas secundarias y columnas secundarias. Entonces,
1. Llamamos ecuaciones principales a las r ecuaciones del sistema correspondientes a las filas principales y ecuaciones secundarias a las p
restantes. Como los coeficientes de éstas son combinación lineal de los de
las principales, se prescinde de ellas, pasando a un sistema equivalente de
sólo r ecuaciones.
2. Llamamos incógnitas principales a las r correspondientes a las columnas principales e incógnitas secundarias a las p restantes. Pasando a
segundo miembro todos los sumandos que afecten a las secundarias queda
un sistema de r ecuaciones con sólo r incógnitas (las principales en ambos
casos) que serı́a completo porque los sumandos de las secundarias hacen
las veces de términos independientes.
234
Capı́tulo 15. Sistemas Lineales
3. Este sistema se llama sistema principal y es de Cramer pues su matriz de coeficientes es la submatriz regular P . Si aplicamos la regla de
Cramer, y a cada una de las p incógnitas secundarias los renombramos como parámetros, obtenemos las ecuaciones paramétricas de Ker f , es decir,
obtenemos todas las soluciones del sistema.
Si, a modo de ilustración, suponemos que en la submatriz principal P de A
intervienen las r primeras filas y columnas, del sistema de partida suprimimos
las ecuaciones desde el lugar r + 1 hasta el m. A continuación tomamos
xr+1 = λ1 , xr+1 = λ2 , . . . , xn = xr+p = λp ,
y pasamos al segundo miembro los sumandos desde el lugar r + 1 hasta el n.
Ası́, llegamos al sistema principal
a x
11 1
a21 x1
...
ar1 x1
+a12 x2
+a22 x2
+...
+...
+a1r xr
+a2r xr
= −a1,r+1 λ1
= −a2,r+1 λ1
−...
−...
−a1,r+p λp
−a2,r+p λp
+ar2 x2
+...
+arr xr
= −ar,r+1 λ1
−...
−ar,r+p λp
que serı́a al que aplicarı́amos la regla de Cramer para obtener las soluciones
expresadas a partir de los parámetros λ1 , . . . , λp .
15.7.
Estudio resolución de los sistemas completos
Junto a un sistema lineal completo consideraremos el llamado sistema homogéneo asociado, formado con la misma matriz de coeficientes y términos independientes todos nulos. Geométricamente esto significa que junto a la
ecuación vectorial
f (x) = b ⇒ x ∈ f −1 (b),
consideramos la
f (x) = 0 ⇔ x ∈ Ker f.
Comenzamos, como antes, calculando el rango r de A, mediante la búsqueda
de una submatriz principal P . Volvemos a usar la nomenclatura de principales
y secundarias tanto para las filas y columnas de A como para las ecuaciones e
incógnitas del sistema. Convendremos, de nuevo, en que P afecta a las r primeras
filas y columnas de A.
A continuación orlamos de las m − r maneras posibles la submatriz P con
elementos de la columna de términos independientes. Al hacerlo, caben dos
posibilidades:
15.7. Estudio resolución de los sistemas completos
235
1. al menos una orla tiene determinante no nulo. Entonces,
rang(B) = r + 1 > r = rang(A).
El sistema será incompatible y no hay nada más que hacer.
2. todas las orlas tienen determinante 0. Entonces,
rang(B) = r = rang(A),
y estamos en el caso de compatibilidad.
Siendo compatible, b ∈ Im f y sabemos que f −1 (b) es un subespacio afı́n de
V dirigido por Ker f , de manera que, conocido un vector p tal que f (p) = b,
se tiene f −1 (b) = p+ Ker f . O sea, las soluciones del sistema completo forman
un subespacio afı́n dirigido por el subespacio vectorial de las soluciones de su
sistema homogéneo asociado y, conocida una solución particular, las restantes
se obtienen sumando ésta con una genérica del sistema homogéneo. Por ello, se
procede de la siguiente manera:
1. Como b ∈ Im f , existen unos únicos α1 , α2 , . . . , αr ∈ IK tales que
α1 f (v1 ) + α2 f (v2 ) + . . . + αr f (vr ) = b.
Pasando a coordenadas, tendremos el sistema
a α
+a12 α2 + . . . +a1r αr = b1
11 1
a21 α1 +a22 α2 + . . . +a2r αr = b2
...
am1 α1 +am2 α2 + . . . +amr αr = br
de m ecuaciones en las r incógnitas α1 , α2 , . . . , αr del que previamente
sabemos que es compatible y determinado. Como la matriz ampliada B
también es de rango r y tiene la misma submatriz principal que A, sus
filas secundarias corresponden a ecuaciones que pueden suprimirse. O sea,
el anterior sistema es equivalente al
a α +a12 α2 + . . . +a1r αr = b1
11 1
a21 α1 +a22 α2 + . . . +a2r αr = b2
...
ar1 α1 +ar2 α2 + . . . +αr arr = br
que es de Cramer y puede resolverse con su regla. Una vez hecho esto,
puesto que
b = α1 f (v1 ) + α2 f (v2 ) + . . . + αr f (vr ) = f (α1 v1 + α2 v2 + . . . + αr vr ),
el vector p = α1 v1 + α2 v2 + . . . + αr vr , o, si se quiere, la n-upla
(α1 , α2 , . . . , αr , 0, . . . , 0)
es una solución particular del sistema completo.
236
Capı́tulo 15. Sistemas Lineales
2. Siguiendo los pasos del anterior apartado, se resuelve el sistema homogéneo
asociado.
3. Sumando la solución particular del completo con la general del homogéneo,
obtenemos las soluciones del completo en forma paramétrica.
En realidad, y puesto que, como hemos señalado, la matriz B es de rango r y
tiene la misma submatriz principal que A, podrı́amos haber procedido, como
en el caso de los sistemas homogéneos, a suprimir las ecuaciones secundarias y
a continuación pasar a segundo miembro, para añadirlos a los términos independientes preexistentes, todos los sumandos correspondientes a las incógnitas
secundarias. Obtendrı́amos un sistema de Cramer, con las r ecuaciones y r
incógnitas principales, cuya resolución conduce a la general del sistema de partida. Esta serı́a la forma de proceder más directa y adecuada en sistemas cuyo
planteamiento concreto e interpretación posterior no estén ligados a cuestiones
geométricas. Sin embargo, por su clara interpretación geométrica, la vı́a señalada en tres pasos es conveniente en sistemas procedentes de la propia teorı́a de
espacios vectoriales y aplicaciones lineales; incluso puede ocurrir que el sistema a
resolver esté ligado a otras cuestiones que hayan obligado previamente a resolver
el homogéneo asociado, en cuyo caso uno de nuestros pasos ya está efectuado.
Por otra parte, la consideración de estos tres pasos deja preparado el terreno
para situaciones similares que aparecen en Análisis como, por ejemplo, las ecuaciones (o sistemas de ecuaciones) diferenciales lineales, de gran presencia en la
Matemática y en la Fı́sica.
15.8.
Complementos / Ejercicios
1. Supongamos un sistema lineal A × x = b de m ecuaciones y n incógnitas.
Si la primera ecuación se redujese a la igualdad 0 = 0, la suprimimos y
pasamos a observar la segunda. En cambio, si 0 = b1 , con b1 6= 0, el sistema
es incompatible y el estudio ha acabado. Si el primer miembro no es nulo,
existe un coeficiente a1j 6= 0, lo cual permite despejar la incógnita xj y
llevar su valor a las restantes m − 1 ecuaciones, quedando en éstas n − 1
incógnitas. Esto es lo que se llama eliminación de incógnitas. La reiteración
de esta idea nos lleva a que en algún paso, el sistema sea incompatible, o,
a la larga, a obtener todas sus soluciones.
a) Por ejemplo, sea el sistema
x + y + 2z = 0, 2x − y + z = 4, 3x − 2y + z = −4.
De la primera ecuación obtenemos
x = −y − 2z.
Llevado este valor a las otras, queda
3y + 3z = −4, 5y + 5z = 4.
15.8. Complementos / Ejercicios
237
Despejando y en una y llevado a la otra, obtenemos
y = −4/3 − z, −20/3 − 5z + 5z = 4 ⇔ 0 = 32.
Esta igualdad es absurda, luego el sistema es incompatible.
b) Sea ahora
x − y + z = 1, 5x + 13y − 25z = 5, 2x + y − 3z = 2.
Entonces,
x = 1 + y − z ⇒ 3y − 5z = 0.
Si tomamos z = 3t, obtenemos como solución la recta
x = 1 + 2t, y = 5t, z = 3t.
Resolver los siguientes sistemas lineales mediante eliminación de incógnitas:
a) 2x + 3y − z = x − 2y + z = 2x − y + 4z = −x + y + 3z = 0.
b) 3x + y = x + 12y − 5z = 2x + 3y − z = x − 2y + z = 0.
c) y + z + 2t = x + 2y − z = x + 4y + z + 4t = −x − y + 2z + 2t = 0.
12x + 14y − 15z + 23s + 27t = 5
16x + 18y − 22z + 29s + 37t = 8
d)
.
18x + 20y − 21z + 32s + 41t = 9
10x + 12y − 16z + 20s + 23t = 4
2x + 3y + z + 2t = 4
4x + 3y + z + t = 5
5x + 11y + 3z + 2t = 2 .
e)
2x + 5y + z + t = 1
x − 7y − z + 2t = 7
24x + 14y + 30z + 40s + 41t = 28
36x + 21y + 45z + 61s + 62t = 43
.
f)
48x + 28y + 60z + 82s + 83t = 58
60x + 35y + 75z + 99s + 102t = 69
2. Discutir según los valores de a ∈ Q
I el siguiente sistema:
x+y+z+t=1
−ax + y + z + t = 2
x − ay + z + t = 3
x + y − az + t = 4
x + y + z − at = 5
I Discutir según los valores de a el siguiente sistema:
3. Sea a ∈ Q.
(a − 2)x + 2y − z = a + 2
2x + ay + 2z = a2 + 3
2ax + 2(a + 1)y + (a + 1)z = 2a3 − (a2 /2) − (a/2) + 5
238
Capı́tulo 15. Sistemas Lineales
4. Estudiar y resolver los casos de compatibilidad del sistema
1 1 2
x
0
a 1 −1 × y = a − 2
3 a 1
z
a−2
5. Estudiar, según los valores de a y b, el sistema lineal
by+
2z = 1
ax+
ax+ (2b − 1)y+
3z = 1
ax+
by+ (b + 3)z = 1
6. Estudiar, según los valores de a de b y de c, el sistema
−x+
z−
t=4
y− z+ at = 1
x− y+
t=b
ax+ y−
z
=c
7. Dado el sistema lineal de coeficientes reales
λx + a12 y + a13 z + a14 t = 0
−a12 x + λy + a23 z + a24 t = 0
−a13 x − a23 y + λz + a34 t = 0
−a14 x − a24 y − a34 z + λt = 0
¿bajo qué condiciones para sus coeficientes posee solución no trivial?
8. Resolver el sistema
ax + by + cz + dt = p
−bx + ay + dz − ct = q
−cx − dy + az + bt = r
−dx + cy − bz + at = s
9. Dados r números reales β1 , β2 , . . . , βr , distintos dos a dos, véase que las
funciones reales
eβ1 , eβ2 , . . . , eβr
son linealmente independientes.
239
Capı́tulo 16
Dualidad
16.1.
Espacio dual de uno dado. Bases duales
Dado un espacio vectorial V sobre un cuerpo conmutativo IK, recordemos que
AL(V, IK, IK), cuyos elementos son las formas lineales de V, se nombra como
el espacio dual (o conjugado) del espacio V y se denota por
V∗ .
Fijada una base B = {v1 , v2 , . . . , vn } en V, de dimensión finita n ≥ 1, y presuponiendo que en IK trabajamos con su base canónica {1}, cada forma lineal
σ tiene asignada una matriz
S = ( a1
a2
...
an ) ∈ M(1, n, IK), donde aj = σ(vj ),
y, recı́procamente, si la matriz S es un dato, construı́mos una forma σ cuya
matriz es S: basta poner σ(vj ) = aj , con lo cual
x=
n
X
j=1
xj vj ⇒ σ(x) =
n
X
j=1
xj σ(vj ) =
n
X
aj xj = S × x.
j=1
Esta asignación forma 7→ matriz fila establece un isomorfismo entre V∗ y
M(1, n, IK), de donde se sigue, como habı́amos adelantado, que la dimensión
del dual se iguala a la del espacio de partida.
Proposición 201 Dada una base B = {v1 , v2 , . . . , vn } de V, existe una base
{ϕ1 , ϕ2 , . . . , ϕn } de V∗ y sólo una tal que
ϕi (vj ) = δij , ∀i, j ∈ [1, n].
Demostracion:
240
Capı́tulo 16. Dualidad
a) Existencia: Para cada ı́ndice i, usamos la matriz básica-canónica
Ei = ( 0
0
...
1
...
0 ) = (δij ) ∈ M(1, n, IK)
para definir una forma ϕi cuya matriz sea Ei . Por tanto, se cumplirá
ϕi (vj ) = δij .
Estas formas constituyen una base en V∗ porque se corresponden en el
isomorfismo forma 7→ matriz fila con la base de M(1, n, IK).
b) Unicidad: Si otra base {ψ1 , ψ2 , . . . , ψn } de V∗ cumpliese las relaciones
ψi (vj ) = δij , al formar sus matrices en las bases B y {1}, se obtiene las
Ei anteriores. De nuevo por el isomorfismo aludido, es ψi = ϕi .
2
La base ası́ construı́da se llama base dual de la base B y se denota como
B∗ .
Extendiendo cada forma ϕi a vectores cualesquiera, se tiene
x=
n
X
xj vj ⇒ ϕi (x) =
j=1
n
X
xj ϕi (vj ) =
j=1
n
X
δij xj = xi .
j=1
Esto da una interpretación geométrica para ϕi : es la forma lineal que a cada
vector x le asigna su coordenada de lugar i en la base B. Por eso, tal función
suele llamarse proyección i-ésima de V relativa a la base B.
Proposición 202 Para cada forma lineal σ se cumple
σ=
n
X
σ(vi )ϕi .
i=1
Demostracion:
En efecto,
n
n
n
n
X
X
X
X
σ(x) = σ(
xi vi ) =
xi σ(vi ) =
σ(vi )ϕi (x) = (
σ(vi )ϕi )(x) ⇒
i=1
i=1
i=1
⇒σ=
n
X
i=1
σ(vi )ϕi .
i=1
2
16.2. El espacio bidual
241
Esto indica que las coordenadas de una forma en la base B ∗ son las imágenes
mediante ella de los vectores de la base B.
La base B ∗ cambiará al cambiar la B. Para indicar esta dependencia, escribiremos en lo sucesivo vj en lugar de ϕj . Por tanto, la base dual de la B =
{v1 , v2 , . . . , vn } se escribirá como
B∗ = {v1 , v2 , . . . , vn }.
Para acabar, señalemos que la igualdad dim(V∗ ) = dim(V) no se mantiene en
espacios de dimensión infinita. Se prueba, en efecto, que si V es de dimensión
infinita, V∗ también lo es, pero la dimensión de V∗ es un infinito estrictamente
mayor que la dimensión de V.
16.2.
El espacio bidual
Igual que se construye el espacio V∗ a partir de V, podemos construir el V∗∗ =
(V∗ )∗ a partir de V∗ . Este espacio se conoce como el bidual de V.
Si V es de dimensión finita, V∗ también también lo es, y, por igual razón, vuelve
a serlo V∗∗ . Bajo este supuesto, veremos seguidamente que hay una manera
natural de igualar V con V∗∗ .
Proposición 203 Si x 6= 0, existe al menos una forma σ tal que σ(x) 6= 0.
Demostracion:
Si x 6= 0, x es libre y forma parte de una base B de V. Si en ella ocupa el
lugar j, la forma σ = vj cumple que σ(x) = 1 6= 0.
2
Proposición 204 Fijado un vector x ∈ V, la aplicación
ιx : V∗ → IK, de ley ιx (σ) = σ(x),
es lineal y, por tanto, pertenece a V∗∗ .
Demostracion:
De acuerdo con las operaciones entre formas, se tiene
ιx (σ + τ ) = (σ + τ )(x) = σ(x) + τ (x) = ιx (σ) + ιx (τ ),
ιx (aσ) = (aσ)(x) = aσ(x) = aιx (σ).
2
Proposición 205 La aplicación
ι : V → V∗∗ , de ley ι(x) = ιx ,
es un isomorfismo lineal.
242
Capı́tulo 16. Dualidad
Demostracion:
Dados a ∈ IK, x, y ∈ V, para cualquier σ ∈ V∗ , se tiene
ι(x + y)(σ) = ιx+y (σ) = σ(x + y) = σ(x) + σ(y) =
= ιx (σ) + ιy (σ) = (ιx + ιy )(σ) = (ι(x) + ι(y))(σ) ⇒
⇒ ι(x + y) = ι(x) + ι(y),
ι(ax)(σ) = ιax (σ) = σ(ax) = aσ(x) =
= aιx (σ) = (aιx )(σ) = (aι(x)(σ) ⇒ ι(ax) = aι(x).
Si x 6= 0, por la proposición 203, hay al menos una forma σ tal que
σ(x) = ιx (σ) 6= 0,
luego ιx no puede ser la aplicación nula. De aquı́ se desprende que
Ker ι = {0}.
Por tanto, ι es inyectiva y, de hecho, biyectiva porque V y V∗∗ son de la misma
dimensión.
2
16.3.
Hiperplanos y formas lineales
Proposición 206 Dado un hiperplano H, existe al menos una forma no nula
σ tal que H = Ker σ.
Demostracion:
Existirá una recta vectorial R de manera que
V = H ⊕ R.
Fijando u 6= 0 como base de R, para cada vector x ∈ V existen un h ∈ H y un
α ∈ IK (únicos) de manera que x = h + αu. La función
σ : V → IK, de ley σ(x) = σ(h + αu) = α,
es una forma lineal porque σ = d ◦ q, donde q es la proyección de V sobre R
paralelamente a H, y d es el isomorfismo de Descartes correspondiente a la base
{w} de R. Esta forma no es nula porque σ(u) = 1. En su núcleo están los
vectores x en los que α = 0, o sea, coincide con H.
2
Proposición 207 Dada una forma lineal no nula σ, su núcleo es un hiperplano
H de V.
16.3. Hiperplanos y formas lineales
243
Demostracion:
Por hipótesis, existe cuando menos un v ∈ V tal que σ(v) 6= 0. Poniendo
u = v/σ(v), se tendrá σ(u) = 1. Pongamos
H = Ker σ, R =< u > .
Para cada vector x ∈ V sea h = x − σ(x)u. Observando que
σ(h) = σ(x − σ(x)u) = σ(x) − σ(x)σ(u) = σ(x) − σ(x) = 0,
concluı́mos que h ∈ H. Despejando x, se tendrá
x = h + σ(x)u ∈ H + R ⇒ V = H + R.
Si un vector x = αu ∈ R a la vez perteneciera a H, tendrı́amos
0 = σ(x) = σ(αu) = ασ(u) = α ⇒ x = 0,
y queda probado que
H ∩ R = {0}.
Ası́ se llega a que V = H⊕R, y, como R =< w > es una recta, su complemento
H = Ker σ será un hiperplano.
2
Proposición 208 Dadas dos formas lineales no nulas σ y τ , se tiene
< σ >=< τ >⇔ Ker σ = Ker τ.
Demostracion:
a) Si < τ >=< σ >, existe un número λ 6= 0, tal que τ = λσ. Entonces,
τ (x) = (λσ)(x) = λσ(x),
de manera que la anulación de σ(x) implica la de τ (x), lo mismo que la
de τ (x) implica la de σ(x), ya que λ es no nulo.
b) Como en la proposición anterior, puede encontrarse un vector u tal que
σ(u) = 1, y para cada vector x ∈ V podrá escribirse
x = h + σ(x)u, donde h ∈ Ker σ.
Si Ker σ = Ker τ , para cada h ∈ Ker σ, será τ (h) = 0. Entonces,
τ (x) = τ (h + σ(x)u) = τ (h) + σ(x)τ (u) = 0 + σ(x)τ (u) =
= σ(x)τ (u) = (τ (u)σ)(x) ⇒ τ = τ (u)σ.
Ahora bien,
σ(u) = 1 ⇒ u 6∈ Ker σ = Ker τ ⇒ τ (u) 6= 0,
luego, por ser no nulo el factor de proporcionalidad entre τ y σ, se tiene
que < σ >=< τ > y la proposición queda demostrada.
244
Capı́tulo 16. Dualidad
2
Estos teoremas ponen de manifiesto la estrecha relación entre hiperplanos y
formas lineales no nulas: todo hiperplano se iguala al núcleo de una forma no
nula y, recı́procamente, el núcleo de una forma no nula es un hiperplano. Ahora
bien, dos formas distintas pueden conducir a un mismo hiperplano siempre y
cuando generen la misma recta en V∗ , esto es, cuando una sea proporcional a
la otra según un factor no nulo.
16.4.
Ecuación implı́cita de un hiperplano
Dado un hiperplano H sea σ una forma lineal tal que H = Ker σ. Entonces, la
igualdad
σ(x) = 0
la cumplen los vectores de H y sólo ellos. Por eso se dice que define implicı́tamente al hiperplano H o que es una ecuación implı́cita de H.
Fijada una base B = {v1 , v2 , . . . , vn } y siendo aj = σ(vj ), de acuerdo con
la expresión analı́tica de σ, la ecuación implı́cita de H escrita en coordenadas
será la
a1 x1 + a2 x2 + . . . + an xn = 0,
es decir, resulta una ecuación lineal homogénea en las n incógnitas x1 , x2 , . . . , xn ,
con coeficientes los números a1 , a2 , . . . , an .
Si el dato fuese una ecuación como la anterior, con al menos un coeficiente
aj 6= 0, construı́mos una forma σ por las condiciones σ(vj ) = aj , y entonces la
ecuación es la del hiperplano H = Ker σ. O sea, un hiperplano se representa
por una ecuación lineal homogénea con algún coeficiente no nulo y recı́procamente toda ecuación lineal homogénea en la que la que no se anulen todos los
coeficientes lo es de un hiperplano. Esta es la interpretación en coordenadas de
las proposciciones 206 y 207.
Si, junto a la ecuación anterior, consideramos una segunda
b1 x1 + b2 x2 + . . . + bn xn = 0,
donde también haya un bj 6= 0, con ella construı́mos la forma lineal τ tal que
τ (vj ) = bj y será la ecuación del hiperplano Ker τ . Según la proposición 208
ambas representan al mismo hiperplano si y sólo si existe un λ 6= 0 tal que
τ = λσ ⇒ b1 = λa1 , b2 = λa2 , . . . , bn = λan .
Estas son las condiciones para que ambas ecuaciones sean equivalentes en el
sentido de tener el mismo conjunto de soluciones.
16.5. Proyecciones sobre hiperplanos y rectas. Ecuaciones
16.5.
245
Proyecciones sobre hiperplanos y rectas.
Ecuaciones
Supongamos que se tiene una descomposición
V =H⊕R
donde H es un hiperplano y R una recta complementaria del mismo. Sea σ una
forma lineal no nula tal que
x ∈ H ⇔ σ(x) = 0.
La recta R se conocerá mediante un vector suyo u 6= 0, de manera que
R =< u > .
Que H y R sean efectivamente complementarios se traduce en la condición
σ(u) 6= 0.
Sea pH la proyección sobre H paralelamente a R. Para cada vector x existirá un
escalar t de manera que
x = pH (x) + tu.
Ahora bien, como pH (x) ∈ H, se tendrá
σ(pH (x)) = σ(x − tu) = σ(x) − tσ(u) = 0 ⇒ t = σ(x)/σ(u) ⇒
σ(x)
u.
σ(u)
Esta es la ecuación de pH . Siendo pR la proyección sobre R paralelemente a H,
de la igualdad pR = I − pH , se obtiene como ecuación para pR la
⇒ pH (x) = x −
pR (x) =
16.6.
σ(x)
u.
σ(u)
Simetrı́as especulares axiales. Ecuaciones
Una simetrı́a se llama especular cuando su eje sea un hiperplano H. Su dirección, entonces, será una recta R. En estos casos, es habitual el término espejo
en lugar de eje. En cambio, se llama axial cuando su eje sea una recta R. Su
dirección necesariamente será un hiperplano H.
Partiendo como antes de una descomposición
V = H ⊕ R,
y anotando por SH la simetrı́a de espejo H y por SR la de eje R, puesto que
SH = 2pH − I y SR = 2pR − I, usando las ecuaciones ya conocidas de las
proyecciones, se obtienen las igualdades
SH (x) = x − 2
σ(x)
σ(x)
u, SR (x) = 2
u − x,
σ(u)
σ(u)
que serán las ecuaciones de una y otra simetrı́a.
246
Capı́tulo 16. Dualidad
16.7.
Ecuaciones implı́citas de un subespacio
Proposición 209 Sea V un espacio de dimensión finita n ≥ 1. Sea U un
subespacio de dimensión p tal que 0 ≤ p < n y sea r = n − p. Entonces, existen
r formas σ1 , σ2 , . . . , σr linealmente independientes de manera que
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr .
Demostracion:
Partiendo de una base {u1 , u2 , . . . , up } de U, la ampliamos hasta una C del
espacio total mediante otra {w1 , w2 , . . . , wr } de un complemento W de U. Sea,
entonces,
C ∗ = {ρ1 , ρ2 , . . . , ρp , σ1 , σ2 , . . . , σr }
su base dual. Entonces, para cada vector x de V, podemos escribir
x=
n
X
j=1
ρj (x)uj +
n
X
σj (x)wj ,
j=1
donde el primer sumando está en U y el segundo en su complemento W. Entonces, puesto que w1 , w2 , . . . , wr son linealmente independientes, se tiene
x∈U⇔
n
X
σj (x)wj = 0 ⇔ σ1 (x) = σ2 (x) = . . . = σr (x) = 0 ⇔
j=1
⇔ x ∈ Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr .
Esto prueba la igualdad propuesta para U. Que las formas σ1 , σ2 , . . . , σr son
independientes se deduce de que forman parte de una base.
2
Al ser las formas σj independientes, son no nulas y cada Ker σj es un hiperplano.
La anterior proposición prueba que un subespacio U de dimensión p siempre se
obtiene como corte de r = n − p hiperplanos.
Después de este teorema sabemos que las ecuaciones
σ1 (x) = σ2 (x) = . . . = σr (x) = 0,
las satisfacen los vectores de U y sólo ellos. Por eso se dice que este sistema
de igualdades define implicı́tamente al subespacio U o que constituye sus
ecuaciones implı́citas.
En la prueba del teorema hemos usado una base de U, lo que es tanto como tener
sus ecuaciones paramétricas. Ası́, queda justificado lo que podemos nombrar
como paso de las ecuaciones paramétricas a las implı́citas.
Si en una base previa B = {v1 , v2 , . . . , vn } de V tomamos los números
aij = σi (vj ),
16.8. Paso de las ecuaciones implı́citas a las paramétricas
247
el anterior sistema adopta la forma
a x
11 1
a21 x1
...
ar1 x1
+a12 x2
+a22 x2
+...
+...
+a1n xn
+a2n xn
=0
=0
+ar2 x2
+...
+arn xn
=0
donde en cada ecuación hay al menos un aij 6= 0. Se trata, pues, de un sistema lineal homogénea de r ecuaciones en las n incógnitas x1 , x2 , . . . , xn , con
coeficientes los números aij .
16.8.
Paso de las ecuaciones implı́citas a las paramétricas
Dadas m formas lineales σ1 , σ2 , . . . , σm de un espacio V, el conjunto
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm ,
por ser intersección de subespacios, es otro subespacio. Generalizando el lenguaje
introducido en el apartado anterior, se dirá que U está definido implı́citamente
por el sistema {σ1 , σ2 , . . . , σm } o bien que
σ1 (x) = σ2 (x) = . . . = σm (x) = 0
constituyen un sistema de ecuaciones implı́citas de U.
Nos planteamos las dos siguientes cuestiones:
1. Dado un sistema que defina a U, pasar a otro que también lo haga y tenga
cardinal mı́nimo.
2. ¿Cuándo dos sistemas definen a un mismo subespacio?
Responderemos a estas preguntas al menos en el caso en que V sea un espacio
de dimensión finita.
Proposición 210 Dado un conjunto finito {σ1 , σ2 , . . . , σm } de formas lineales
en un espacio V de dimensión finita n ≥ 1, el subespacio
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm
es de dimensión p = n − r, donde r = rang{σ1 , σ2 , . . . , σm }.
Demostracion:
Si en una base B = {v1 , v2 , . . . , vn } de V tomemos
aij = σi (vj ),
248
Capı́tulo 16. Dualidad
U coincide con el conjunto de soluciones del siguiente sistema lineal homogéneo
de m ecuaciones y n incógnitas
a x
+a12 x2 + . . . +a1n xn = 0
11 1
a21 x1 +a22 x2 + . . . +a2n xn = 0
...
am1 x1 +am2 x2 + . . . +amn xn = 0
A su vez, este sistema define el núcleo de la aplicación lineal f entre IK n y IK m
construı́da con la matriz del sistema. Puesto que cada fila son las coordenadas
de una de las formas lineales, su rango será r. Ası́, f tiene rango r y su núcleo
dimensión n − r.
2
Resolviendo este sistema, se obtiene una base de U y, a partir de ella, se pueden
escribir sus ecuaciones paramétricas. Es decir, este teorema justifica lo que podemos llamar el paso de las ecuaciones implı́citas a las paramétricas.
Proposición 211 Dadas varias formas lineales σ1 , σ2 , . . . , σm , σ, se cumple
σ ∈< σ1 , σ2 , . . . , σm >⇔ Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm ⊆ Ker σ.
Demostracion:
⇒) Si σ ∈< σ1 , σ2 , . . . , σm >, existen unos escalares γi tales que
σ = γ1 σ1 + γ2 σ2 + . . . + γm σm ,
en cuyo caso
x ∈ Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm ⇒ σ1 (x) = σ2 (x) = σm (x) = 0 ⇒
n
n
n
X
X
X
⇒ σ(x) = (
γi σi )(x) =
γi σi (x) =
γi 0 = 0 ⇒ x ∈ Ker σ.
i=1
i=1
i=1
⇐) Si Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm ⊆ Ker σ, toda solución de
σ1 (x) = σ2 (x) = . . . = σm (x) = 0
lo es de la ecuación σ(x) = 0, y, por tanto, del sistema
σ1 (x) = σ2 (x) = . . . = σm (x) = σ(x) = 0.
Recı́procamente, toda solución del segundo sistema lo es, en particular, del
primero, luego ambos sistemas son equivalentes. Al tener el mismo subespacio de soluciones, comparten el rango r. Ahora bien, como en el primer
bloque hay r formas independientes, que también están en el segundo, σ
será combinación lineal de ellas.
2
16.8. Paso de las ecuaciones implı́citas a las paramétricas
249
Proposición 212 Sean {σ1 , σ2 , . . . , σm }, {τ1 , τ2 , . . . , τp } dos sistemas de formas lineales y sean
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm , W = Ker τ1 ∩ Ker τ2 ∩ . . . ∩ Ker τp .
Entonces,
U = W ⇔< σ1 , σ2 , . . . , σm >=< τ1 , τ2 , . . . , τp > .
Demostracion:
Cualquiera que sea la forma τj , de acuerdo con la segunda implicación de la
proposición 211, se tiene
U = W ⊆ Ker τj ⇒ τj ∈< σ1 , σ2 , . . . , σm >,
luego < τ1 , τ2 , . . . , τp >⊆< σ1 , σ2 , . . . , σm >. Análogamente, para cualquier forma σi , se tiene
W = U ⊆ Ker σi ⇒ σi ∈< τ1 , τ2 , . . . , τp >,
de donde < σ1 , σ2 , . . . , σm >⊆< τ1 , τ2 , . . . , τp >.
De la igualdad < σ1 , σ2 , . . . , σm >=< τ1 , τ2 , . . . , τp > se sigue que cada forma
τj está en < σ1 , σ2 , . . . , σm >, por lo que, al aplicarle la primera implicación de
la proposcición 211, resulta
U ⊆ Ker τj , ∀j ⇒ U ⊆ W,
Análogamente cada σi está en < τ1 , τ2 , . . . , τs >, luego
W ⊆ Ker σi , ∀i ⇒ W ⊆ U.
2
Esta proposición responde a la pregunta de cuándo dos sistemas definen a un
mismo subespacio. En cuanto a la depuración de un sistema para quedarnos
con un número mı́nimo de formas, la respuesta se desprende de la proposición
211: calculado el rango r del conjunto {σ1 , σ2 , . . . , σm } y seleccionadas r formas
independientes, por ejemplo las r primeras, cada forma σr+h es combinación
lineal de ellas, con lo cual
Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr ⊆ Ker σr+h ⇒
⇒ Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr ∩ Ker σr+h =
= Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr ,
es decir, la forma σr+h es supérflua. Visto esto para cada uno de los posibles
valores de h, queda que los sistemas
{σ1 , σ2 , . . . , σm }, {σ1 , σ2 , . . . , σr }
definen el mismo subespacio solución. Además, el segundo no puede depurarse
más: Si, por ejemplo. σ1 pudiera suprimirse serı́a porque
σ ∈< σ1 , σ2 , . . . , σm >⇒ Ker σ2 ∩ . . . ∩ Ker σr ⊆ Ker σ1 ,
lo cual implicarı́a σ1 ∈< σ2 , . . . , σr >, en contra de que las formas sean independientes.
250
Capı́tulo 16. Dualidad
16.9.
Complementos / Ejercicios
1. Razonar que, con la excepción correspondiente a dim(V) = 1, las formas
lineales de V nunca son inyectivas. Razonar que en todo caso, salvo para
la forma nula, siempre son suprayectivas.
2. En el plano vectorial IR2 se pide una forma lineal σ tal que
σ(1, 1) = 5, σ(−1, 1) = 3.
Se pide la ecuación implı́cita de Ker σ y un vector que lo dirija.
3. Dada una base D de V∗ , razonar que existe otra B de V de la que D es
su base dual. Véase que las formas lineales σ = (2, 1), τ = (−1, 2) son una
base de (IR2 )∗ . Buscar una base de IR2 cuya dual sea la anterior.
4. Encontrar una forma lineal no nula σ tal que
σ(1, 1, 1) = σ(1, 1. − 1) = 0.
5. Los vectores v1 = (1, 1, 1), v2 = (1, 1, −1), v3 = (1, −1, −1) forman una
base de IR3 . Sin necesidad de determinar su base dual, calcular los números
v1 (x), v2 (x), v3 (x) siendo x = (0, 1, 0).
6. Dada la forma lineal σ(x, y, z) = x + y + z de IR3 , encontrar una base del
plano H = Ker σ.
7. En el espacio IK n se da una base B = {v1 , v2 , . . . , vn }. Sea P la matriz
(regular) cuyas columna j-ésima son las coordenadas de vj en la base
canónica. Razonar que la fila i-ésima de la matriz P −1 son las coordenadas
de vi en la base dual de la canónica.
8. Comprobar que los vectores
w1 = (1, −1, 0), w2 = (1, 1, −1), w3 = (0, −1, 1)
forman una base B de IR3 . Encontrar la base B∗ del espacio (IR3 )∗ .
9. Siendo V = IR3 , comprobar que las formas lineales
σ1 (x, y, x) = 2x − y + 2z
σ2 (x, y, z) = 3x − 3y + 3z
σ3 (x, y, z) = 4x + 7y + 3z
∗
son base de V . Encontrar la base de V de la cual ésta es la dual.
10. Sea B = {v1 , v2 , v3 } una base de IR3 . Sea σ la forma lineal tal que
σ(v1 + v2 ) = 1, σ(v2 − v3 ) = 2, σ(−v1 + v3 ) = 3.
Se pide:
16.9. Complementos / Ejercicios
251
a) La matriz y las ecuaciones de σ en la base B de V.
b) Coordenadas de σ en la base B∗ , dual de B.
11. Ecuación del plano H = Ker σ de IR3 sabiendo que
σ(1, 1, 1) = 0, σ(1, 1, 0) = 1, σ(1, 0, 0) = 2.
12. Ecuaciones implı́citas de la recta R de ecuación x = λ(4, 3, 2, 1).
13. Ecuaciones implı́citas del plano P de IR4 de ecuación paramétrica
x = λ(1, 0, 1, 0) + µ(1, 2, 0, −1).
14. Sea σ una forma no nula, sea a un número no nulo. ¿Qué tipo de subespacio
representa la ecuación σ(x) = a?
15. Ecuación implı́cita del plano afı́n que pasa por b = (1, 0, 1), cuyo plano
director est generado por u1 = (1, 2, 0), u2 = (0, 2, 1).
16. Ecuaciones de la simetrı́a SH,R donde
H : x = 6y, R : x + 2y = 0.
Obtener la imagen de la recta afı́n x + y = 1.
17. Sean u y v dos vectores independientes de un plano vectorial V, sobre un
cuerpo IK de caracterı́stica distinta de 2. Razonar que siempre existe una
simetrı́a oblı́cua f tal que f (u) = v. Encontrar una simetrı́a oblı́cua del
plano IR2 que intercambie los vectores u = (3, 4) y v = (2, 1).
18. Sean H y R el plano y la recta de IR3 tales que
R =< (2, 1, 1) >, H : x + y − 2z = 0.
Comprobar que H y R son complementarios. Ecuaciones de las proyecciones pH,R y pR,H . Imagen mediante pH,R del plano P de ecuación
x − 2z = 0.
19. Ecuaciones de la simetrı́a de espejo el plano H de ecuación
2x − y + z = 0,
según la dirección de la recta R de ecuaciones paramétricas (λ, 2λ, λ).
20. Simétrico del vector v = (1, 0, 1) respecto al espejo H
x − y + 3z = 0,
según la dirección de la recta R =< (1, 2, 0) >.
252
Capı́tulo 16. Dualidad
21. Ecuaciones de la simetrı́a cuyo espejo H tiene la ecuación
x + y + z = 0,
y cuya recta de dirección es la R de ecuaciones x = y = z.
22. Obtener la recta simétrica de la S en la simetrı́a SR,H , siendo
S : x + y = y + z = 0, R =< (1, 2, 3) >, H : x + 2y + 3z = 0.
23. Comprobar que la recta R y el hiperplano H, donde
R =< (1, −2, 0, 1) >, H : 2x + z + t = 0
son complementarios. Obtener las ecuaciones de SR,H .
24. Comprobar que la recta R y el hiperplano H, donde
R =< (0, 0, 1, 1) >, H =< (1, 0, 1, 0), (0, 1, 1, 1), (0, 1, 1, 2) >,
son complementarios. Obtener las ecuaciones de la simetrı́a SH,R .
25. Situándonos en el espacio IRn referido a su base canónica, sea
a1 x1 + a2 x2 + . . . + an xn = 0
la ecuación de un hiperplano H, Sea R la recta generada por
u = (a1 , a2 , . . . , an ).
Razonar que V = R ⊕ H y escribir la ecuación de SH,R .
26. Sea V un espacio de dimensión finita n ≥ 2. Dados dos vectores independientes u y v, ası́ como dos formas independientes σ y τ . Caracterizar
estos datos para que se tenga
V =< u, v > ⊕(Ker σ ∩ Ker τ ).
27. En IR4 se dan los planos
P : x − y + t = y + z = 0, K : y + z + t = x − t = 0.
Comprobar que son complementarios. Obtener las ecuaciones de SP,K
28. En IR5 se dan los subespacios
P =< (1, 0, 1, 0, 0), (0, 1, 1, 0, 1) >, K : x1 − x5 = x2 − x4 = 0.
Comprobar que se complementan. Obtener las ecuaciones de SP,K
16.9. Complementos / Ejercicios
253
29. Sea H = Ker σ un hiperplano, sea R =< u > una recta de manera que
σ(u) 6= 0, sea µ 6= 0 un número, sea el deslizamiento f = DH,R,µ . Deducir
que
σ(x)
f (x) = x + (µ − 1)
u.
σ(u)
Siendo µ 6= 1, razonar que un hiperplano K 6= Hesf -invariante si y sólo
si u ∈ K. Bajo el mismo supuesto, razonar que existe un único vector no
nulo d ∈ R de manera que
f (x) = x + σ(x)d.
30. Comprobar que en la base canónica de IR3 el operador f de matriz
3
1 −1
A = −4 −1 2
−2 −1 2
es un deslizamiento. Determinar sus datos.
31. Sean u, v dos vectores independientes de un espacio V de dimensión finita
n ≥ 2. Sea µ 6= 1 un número no nulo. Encontrar un deslizamiento oblı́cuo
de razón µ que cambien u en v. ¿Es único? Efectuar los cálculos para los
vectores u = (0, 1, 1), v = (3, 1, 2) de IR3 y µ = 5.
32. Con los datos del ejercicio 24, obtener las imágenes mediante el deslizamiento DH,R,2 de los hiperplanos
K : x + 2y − z + t = 0, L : x − t = 0.
33. Sea σ una forma lineal no nula y sea d un vector. Véase que
x 7→ σ(x)d
es un operador de V. ¿Cuál es su núcleo? ¿Cuál es su imagen?
34. Sea V un espacio vectorial real de dimensión finita n ≥ 2. Sea σ una forma
lineal no nula de V y sea H = Ker σ. Sea d ∈ H. La aplicación
TH,d : V → V, de ley x → x + σ(x)d,
recibe el nombre de deslizamiento horizontal (o transvección) de
espejo (o eje si n = 2) H y vector director d. Interpretar geométricamente este concepto. Si σ(x) = 0 se cambia por otra ecuación τ (x) = 0 de
H, ¿qué debe hacerse con el vector d? Razonar que
a) Toda transvección es un automorfismo y su inverso es otra transvección. ¿Cuál?
b) Si d 6= 0, los vectores de H y sólo ellos son dobles. Igualmente, un
hiperplano K es invariante si y sólo si d ∈ K.
254
Capı́tulo 16. Dualidad
35. Comprobar que el conjunto {TH,d /d ∈ H} es un subgrupo de GL(V, IK),
isomorfo al grupo aditivo H.
36. Razonar que el operador
f (x, y, z) = (3x + y + z, −2x − z, −2x − y)
es una transvección. Determinar su espejo y vector director.
37. Sean u y v dos vectores independientes de un espacio V de dimensión
finita n ≥ 2. Razonar que existe al menos una transvección f que cambia
u en v. ¿En qué caso es única?
38. Determinar una transvección f del plano IR2 tal que f (2, 3) = (3, 5).
39. Obtener una transvección f de IR3 tal que f (0, 1, 1) = (3, 1, 2).
40. En el espacio M(2,C)
I la traza es una forma lineal. Su núcleo ser un hiperplano (subespacio de dimensión 3, en este caso). Comprobar que las tres
matrices de Pauli
µ
¶
µ
¶
µ
¶
0 1
0 −i
1 0
P1 =
, P2 =
, P3 =
01
i 0
0 −1
son base del mismo. ¿Qué coordenadas tiene en tal base una matriz genérica de traza nula?
41. Independientemente de que V sea de dimensión finita o infinita, admitiremos en este ejercicio y los sucesivos que todo subespacio U de V tiene al
menos un complementario. Razonar que
a) Si U es propio y w 6∈ U, existe un hiperplano H tal que
U ⊆ H, w 6∈ H.
b) Un subespacio propio U coincide con el corte de los hiperplanos que
pasan por él.
42. Demostrar que en dimensión infinita sigue siendo cierto que, para cada
vector x 6= 0, existe al menos una forma lineal σ tal que σ(x) 6= 0.
43. Razonar que en dimensión infinita la aplicación ι : V → V∗∗ , que asigna a
cada vector la forma ιx (σ) = σ(x) de V∗ , sigue siendo un monomorfismo
lineal. Por tanto, todo espacio V puede considerarse subespacio de su
bidual mediante el isomorfismo V ≃ ι(V) ⊆ V∗∗ .
44. Razonar este nuevo criterio de finito-dimensionalidad: Un espacio V es de
dimensión finita si y sólo si lo es su dual.
16.9. Complementos / Ejercicios
255
45. Sea f el espacio de las sucesiones reales casi nulas. Sea (en ) su base
canónica. Para cada forma σ ∈ f ∗ construı́mos la sucesión σ
e de término general σ(en ), a la vez que la aplicación
e : f ∗ → s, de ley σ 7→ σ
e.
Razonar que se trata de un isomorfismo. (Puesto que f no es isomorfo a
s, este ejemplo prueba que la isomorfı́a entre V y V∗ deja de ser cierta en
dimensión infinita).
46. Sea V un espacio de dimensión infinita sobre IK y sea B = {vj }j∈J (donde
J es un conjunto de cardinal infinito) una base de V. Para cada i, sea
vi : V → IK la función (lineal) que a cada vector x le asigna su coordenada
xi , o sea, el coeficiente del vector vi en la expresión de x como combinación
lineal de vectores de B. Probar que B∗ = {vi }i∈J es libre, pero no genera
a V∗ . Aún ası́, se conoce como base dual de la B.
47. Un espacio V es de dimensión finita si y sólo si el monomorfismo canónico
ι : V → V∗∗ es un isomorfismo.
48. Sea C =
6 ∅ un conjunto de vectores de V. Sea
C 0 = {σ ∈ V∗ /σ(x) = 0, ∀x ∈ C}
el conjunto de formas de V que anulan a todos los vectores de C. Razonar
que C 0 es un subespacio de V∗ . (Lo llamaremos subespacio anulador o
subespacio ortogonal del conjunto de vectores C). Comprobar que
σ ∈ C 0 ⇔ C ⊆ Ker σ.
49. Sea S 6= ∅ un conjunto de formas lineales. Su anulador S 0 (haciendo V∗ las
veces de espacio inicial y V∗∗ las de su dual) es el conjunto de elementos
ϕ ∈ V∗∗ tales que ϕ(σ) = 0, ∀σ ∈ S. Sin embargo, reservaremos esta
escritura para su corte con el subespacio ι(V) al que se iguala V, con lo
cual S 0 = {x ∈ V/σ(x) = 0, ∀σ ∈ S}. Razonar que S 0 es un subespacio
de V. (Lo llamaremos subespacio anulador o subespacio ortogonal
del conjunto de formas S). Comprobar que
\
S0 =
Ker σ.
σ∈S
50. Dados dos conjuntos C y D no vacı́os de vectores, razonar que
C ⊆ D ⇒ D0 ⊆ C 0 .
51. Dados dos conjuntos S y T no vacı́os de formas, razonar que
S ⊆ T ⇒ T 0 ⊆ S 0.
256
Capı́tulo 16. Dualidad
52. Si C es un conjunto no vacı́o de vectores, razonar que C 0 =< C >0 . (Esta
fórmula pone de manifiesto que si U es un subespacio de V, para que una
forma σ esté en su anulador es necesario y basta que σ anule a los vectores
de un sistema generador de U).
53. Si S es un conjunto no vacı́o de formas, razonar que S 0 =< S >0 . (Esta
fórmula pone de manifiesto que si S es un subespacio de V∗ , para que un
vector x esté en su anulador es necesario y basta que x sea anulado por
las formas pertenecientes a un sistema generador de S).
54. Si V es de dimensión finita n y U es un subespacio de V, con dimensión
p, razonar que
dim(U0 ) = n − p = codim (U).
55. Si V es de dimensión finita n y S es un subespacio de V∗ , con dimensión
r, razonar que
dim(S0 ) = n − r = codim (S).
56. Sea U un subespacio de V. Demostrar que
U0 = V∗ ⇔ U = {0}.
57. Sea S un subespacio de V∗ . Demostrar que
S0 = V ⇔ S = {σ0 }.
58. Sea U un subespacio de V. Demostrar que
U0 = {σ0 } ⇔ U = V.
59. Sea S un subespacio de V∗ . Si V es finito-dimensional, razonar que
S0 = {0} ⇔ S = V∗ .
Para dimensión infinita, sólo se razona que S0 = {0} ⇐ S = V∗ . (Para
ver que la contraria es falsa, tómese V = f . Siendo B ∗ la base dual de su
base canónica B, tómese el subespacio S =< B∗ >, el cual es propio en
f ∗ , y razónese que S0 = {0}).
60. Sean U y W dos subespacios de V. Razonar que (U + W)0 = U0 ∩ W0 .
61. Sean S y T dos subespacios de V∗ . Razonar que (S + T)0 = S0 ∩ T0 .
62. Sea U un subespacio de V. Razonar que (U0 )0 = U.
63. Sea S un subespacio de V∗ . Si V es finito-dimensional, razonar que S =
(S0 )0 . Sin embargo, en dimensión infinita, sólo puede razonarse que S ⊆
(S0 )0 . En cualquier caso, razonar que S0 = ((S0 )0 )0 .
16.9. Complementos / Ejercicios
257
64. Sean U y W dos subespacios de un espacio V de dimensión finita. Razonar
que (U ∩ W)0 = U0 + W0 . (Esta igualdad puede probarse también en
dimensión infinita).
65. Sean S y T dos subespacios de V∗ . Si V es de dimensión finita, razonar
que (S ∩ T)0 = S0 + T0 . Sin embargo, en dimensión infinita, sólo puede
razonarse que (S ∩ T)0 ⊇ S0 + T0 .
66. Supongamos que V = U ⊕ W, donde V es de dimensión finita. Razonar
que V∗ = U0 ⊕ W0 . (Esta igualdad también vale en dimensión infinita).
67. Sea U un subespacio de dimensión p < n = dim(V). Sea r = n − p y sea
σ1 , σ2 , ..., σr un conjunto de formas independientes tales que
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr .
Dado un vector b ∈ V, obtener unas ecuaciones implı́citas para el subespacio afı́n b + U. Pasando a coordenadas, ¿qué tipo de sistema resulta?
En particular, ¿qué ocurre si U es un hiperplano H?
68. Todo subespacio afı́n de dimensión p < n se obtiene como corte de una
cantidad r = n − p de hiperplanos afines que pasan por él.
258
Capı́tulo 16. Dualidad
259
Capı́tulo 17
Trasposición de
Aplicaciones Lineales
17.1.
Trasposición de una aplicación lineal
Proposición 213 Dado un morfismo lineal f : V → V0 , la aplicación
f t : V0∗ → V∗ , de ley f t (σ 0 ) = σ 0 ◦ f
es lineal.
Demostracion:
Aplicando las propiedades de la composición de morfismos lineales (proposición 80), se tiene
f t (σ 0 + τ 0 ) = (σ 0 + τ 0 ) ◦ f = (σ 0 ◦ f ) + (τ 0 ◦ f ) = f t (σ 0 ) + f t (τ 0 ),
f t (aσ 0 ) = (aσ 0 ) ◦ f = a(σ 0 ◦ f ) = af t (σ 0 ).
2
Para cada f , f t recibe el nombre de aplicación lineal traspuesta de la aplicación f . Se establece entre los respectivos duales, si bien en orden cambiado.
A su vez, el proceso de trasposición de aplicaciones lineales establece una aplicación
t
: AL(V, V0 , IK) → AL(V0∗ , V∗ , IK), de ley f 7→ f t .
Recogemos a continuación sus propiedades más importantes:
Proposición 214 La trasposición es lineal.
260
Capı́tulo 17. Trasposición de Aplicaciones Lineales
Demostracion:
Dados a ∈ IK y f, g ∈ AL(V, V0 , IK), se tiene
(f + g)t (σ 0 ) = σ 0 ◦ (f + g) = σ 0 ◦ f + σ 0 ◦ g =
= f t (σ 0 ) + g t (σ 0 ) = (f t + g t )(σ 0 ) ⇒ (f + g)t = f t + g t ,
(af )t (σ 0 ) = σ 0 ◦ (af ) = a(σ 0 ◦ f ) = af t (σ 0 ) =
= (af t )(σ 0 ) ⇒ (af )t = af t .
2
Proposición 215 La trasposición de una compuesta, es la composición de sus
traspuestas en orden contrario.
Demostracion:
Dadas f ∈ AL(V, V0 , IK), g ∈ AL(V0 , V00 , IK), para cada forma σ 00 de V00 ,
se tiene
(g ◦ f )t (σ 00 ) = σ 00 ◦ (g ◦ f ) = (σ 00 ◦ g) ◦ f = g t (σ 00 ) ◦ f =
= f t (g t (σ 00 )) = (f t ◦ g t )(σ 00 ) ⇒ (g ◦ f )t = f t ◦ g t .
2
Proposición 216 La traspuesta de la identidad de un espacio, es la identidad
de su dual.
Demostracion:
Si I es la identidad de V e I ∗ es la de V∗ , se tiene
I t (σ) = σ ◦ I = σ = I ∗ (σ) ⇒ I t = I ∗ .
2
Proposición 217 La traspuesta de un isomorfismo, es otro isomorfismo y,
además, el inverso de la traspuesta es la traspuesta del inverso.
Demostracion:
Si f ∈ AL(V, V0 , IK) es un isomorfismo, se tiene
¾
f −1 ◦ f = I ⇒ f t ◦ (f −1 )t = I t = I ∗
⇒ (f −1 )t = (f t )−1 .
f ◦ f −1 = I ⇒ (f −1 )t ◦ f t = I t = I ∗
2
17.2. Traspuesta de una traspuesta
17.2.
261
Traspuesta de una traspuesta
La aplicación f tt = (f t )t se establece entre los biduales V∗∗ y V0∗∗ , de V y V0 ,
respectivamente.
Para espacios finito-dimensionales, veremos que f tt puede igualarse a una aplicación entre V y V0 : precisamente a la propia f .
17.3.
Trasposición entre espacios finito-dimensionales
Si V y V0 son espacios de dimensión finita, sus duales lo son y se tiene
dim(V∗ ) = dim(V), dim(V0∗ ) = dim(V0 ).
También serán finito-dimensionales tanto AL(V, V0 , IK) como AL(V0∗ , V∗ , IK)
y se cumplirá
dim(AL(V0∗ , V∗ , IK)) = dim(V0∗ ) dim(V∗ ) =
= dim(V0 ) dim(V) = dim(AL(V, V0 , IK)),
de manera que AL(V, V0 , IK) y AL(V0∗ , V∗ , IK) serán isomorfos por tener igual
dimensión. Un isomorfismo entre ellos se obtendrı́a mediante los llamados de
Descartes. Sin embargo, vamos a establecer que, de manera natural, la isomorfı́a
puede conseguirse a partir del proceso de trasposición.
Proposición 218 El operador t : AL(V, V0 , IK) → AL(V0∗ , V∗ , IK) es inyectivo siempre que V0 sea finito-dimensional.
Demostracion:
Si f no es nula, existe al menos un vector x tal que f (x) 6= 0. Entonces
existe al menos una forma σ 0 no nula de V0 tal que
σ 0 (f (x)) = f t (σ 0 )(x) 6= 0,
lo cual significa que f t no puede ser nula. Por tanto, el núcleo de t se reduce a
la aplicación lineal nula.
2
(Puede probarse que este teorema sigue vigente en dimensión infinita).
Proposición 219 Dada una aplicación lineal f : V → V0 , sean
ι : V → V∗∗ , ι0 : V0 → V0∗∗
las aplicaciones tales que
ι(x)(σ) = σ(x), ι0 (x0 )(σ 0 ) = σ 0 (x0 ), ∀x ∈ V, x0 ∈ V0 , σ ∈ V∗ , σ 0 ∈ V0∗ .
Probaremos que
f tt ◦ ι = ι0 ◦ f.
262
Capı́tulo 17. Trasposición de Aplicaciones Lineales
Demostracion:
Dados x ∈ V, σ 0 ∈ V0∗ , se tiene
f tt (ι(x))(σ 0 ) = (ι(x) ◦ f t )(σ 0 ) = ι(x)(f t (σ 0 )) =
= ι(x)(σ 0 ◦ f ) = (σ 0 ◦ f )(x) = σ 0 (f (x)) = ι0 (f (x))(σ 0 ).
Por la arbitrariedad de σ 0 , de aquı́ se sigue
f tt (ι(x)) = ι0 (f (x)) ⇒ (f tt ◦ ι)(x) = (ι0 ◦ f )(x),
y por la arbitrariedad, ahora de x, resulta
f tt ◦ ι = ι0 ◦ f.
2
En particular, si V y V0 son los dos finito-dimensionales, cada uno se iguala a
su bidual mediante ι e ι0 , respectivamente, y resulta que
f tt = f.
Proposición 220 Si V y V0 son finito-dimensionales la trasposición es un
isomorfismo de AL(V, V0 , IK) sobre AL(V0∗ , V∗ , IK).
Demostracion:
Si g : V0∗ → V∗ es lineal, su traspuesta g t es una aplicación lineal entre
V = ι(V) y V0∗∗ = ι0 (V0 ), igualable a una aplicación entre V y V0 , cuya
traspuesta es g tt = g. Esto prueba que el operador
t
: AL(V, V0 , IK) → AL(V0∗ , V∗ , IK), es suprayectivo.
2
∗∗
El último teorema es falso en espacios infinito-dimensionales. En el caso finitodimensional, tomando V0 = V, asegura que la trasposición es un isomorfismo
del espacio End(V, IK) sobre el End(V∗ , IK).
17.4.
Matriz y rango de la aplicación lineal
traspuesta
Sean V y V0 dos espacios de dimensión finita sobre un mismo cuerpo conmutativo IK. Sean n = dim(V), m = dim(V0 ). Sean
0
B = {v1 , v2 , . . . , vn }, B 0 = {v10 , v20 , . . . , vm
},
bases respectivas en estos espacios y sean
B ∗ = {v1 , v2 , . . . , vn }, B 0∗ = {v01 , v02 , . . . , v0m }
17.4. Matriz y rango de la aplicación lineal
traspuesta
263
las correspondientes bases duales. Ası́ como f tiene una matriz A en las bases B
y B0 , cuyas columnas son las coordenadas de los vectores f (vj ) expresadas en la
base B0 , f t tendrá una matriz cuyas columnas son las cordenadas de las formas
f t (v0i ) expresadas en la base B ∗ . Veamos la relación entre ambas matrices:
Proposición 221 Dada f ∈ AL(V, V0 , IK), se cumple que
M (f t , B0∗ , B ∗ ) = M (f, B, B 0 )t .
Demostracion:
Supongamos que
M (f, B, B0 ) = [aij ] ∈ M(m, n, IK), M (f t , B 0∗ , B∗ ) = [bhk ] ∈ M(n, m, IK),
lo que significa que
f (vj ) =
m
X
akj vk0 , f t (v0i ) =
n
X
bhi vh .
h=1
k=1
Por una parte, se tiene
f t (v0i )(vj ) = (v0i ◦ f )(vj ) = v0i (f (vj )) = v0i (
m
X
akj vk0 ) = aij ,
k=1
mientras que por otra resulta
f t (v0i )(vj ) = (
n
X
h=1
bhi vh )(vj ) =
n
X
bhi vh (vj ) =
h=1
Por tanto, aij = bji , y el teorema queda probado.
n
X
bhi δhj = bji .
h=1
2
Proposición 222 La traspuesta f t de una aplicación lineal f entre espacios de
dimensión finita tiene igual rango que f .
Demostracion:
Basta tomar matrices como las de antes y aplicar que dos matrices traspuestas entre sı́ son de igual rango.
2
Después de estos teoremas, las filas de A = M (f ), coincidentes con las columnas
de M (f )t = M (f t ), quedan interpretadas como las coordenadas en B∗ de las
formas transformadas f t (v0i ) mediante f t de las de la base B 0∗ . Si al calcular
el rango r de f quedan seleccionadas r columnas como base de Im f , también
quedarán seleccionadas r filas correspondientes a una base de Im f t .
264
Capı́tulo 17. Trasposición de Aplicaciones Lineales
17.5.
Complementos / Ejercicios
1. Sea f : V → V0 un morfismo lineal, donde V es dimensión finita n y
V0 de dimensión finita m. Si ignorásemos que una matriz y su traspuesta
tienen igual rango, dar una demostración directa (utilizando la técnica de
ampliación de bases) de la fórmula rang(f t ) = rang(f ).
0
2. Si V0 es de dimensión finita m ≥ 1 y B 0 = {v10 , v20 , . . . , vm
} es una base de
0
0
V , para cualquier aplicación lineal f : V → V que acabe en V0 , y para
cada i ∈ [1, m], puede considerarse la función
fi = f t (v0i ) = v0i ◦ f,
la cual, a cada x ∈ V, le asignará la coordenada i-ésima x0i de f (x) en B 0 .
Entonces, f1 , f2 , . . . , fm son elementos del espacio V∗ , los cuales reciben
el nombre de formas componentes de f en la base B0 . Razonar que
< f1 , f2 , . . . , fm >= Im f t , Ker f = (Im f t )0 .
0
} de V0 y m formas
3. Razonar que, fijada una base B 0 = {v10 , v20 , . . . , vm
lineales σ1 , σ2 , ..., σm de V, existe una aplicación lineal f : V → V0 y sólo
una que cumple fi = σi .
4. Si V y V0 son isomorfos, también lo son V∗ y V0∗ .
5. Razonar que la aplicación lineal
t
: AL(V, V0 , IK) → AL(V0∗ , V∗ , IK)
es inyectiva incluso aunque V0 no sea finito-dimensional.
6. En particular, la trasposición ser un monomorfismo lineal entre los espacios
End(V, IK) y End(V∗ , IK). ¿Es un monomorfismo de álgebras?
7. Si f : V → V0 es un isomorfismo lineal, la aplicación
f˘ = (f −1 )t : V∗ → V0∗ .
se llama isomorfismo contragradiente de f . Razonar que
a) f˘ = (f t )−1 .
b) ∀x ∈ V, ∀σ ∈ V∗ ⇒ fˇ(σ)(f (x)) = σ(x).
c) Si f y g son isomorfismos, se cumple (g ◦˘ f ) = ğ ◦ f˘.
Si, en particular, f es un automorfismo de V, f˘ lo es de V∗ . Razonar,
entonces, que la aplicación
GL(V, IK) → GL(V∗ , IK), de ley f 7→ f˘,
es un monomorfismo de grupos (isomorfismo si V es de dimensión finita).
17.5. Complementos / Ejercicios
265
8. Sea f : V → V0 una aplicación lineal. Razonar que Ker f t = (Im f )0 .
9. Sea f : V → V0 una aplicación lineal. Razonar que Im f = (Ker f t )0 .
10. Siendo f lineal razonar que f : V → V0 es un epimorfismo si y sólo si
f t : V0∗ → V∗ es un monomorfismo.
11. Sea f : V → V0 una aplicación lineal. Razonar que Im f t = (Ker f )0 .
12. Sea f : V → V0 una aplicación lineal. Razonar que Ker f = (Im f t )0 .
13. Siendo f lineal razonar que f : V → V0 es un monomorfismo si y sólo si
f t : V0∗ → V∗ es un epimorfismo.
14. Sea U un subespacio de V. Sea π : V → V/U la proyección canónica.
Razonar que, mediante la traspuesta de π, se obtiene
(V/U)∗ ≃ U0 .
15. Sea U un subespacio de V. Sea ι : U → V la inyección canónica. Razonar
que, aplicando el teorema de isomorfı́a a ιt , se obtiene
V∗ /U0 ≃ U∗ .
16. Si p es un proyector de V, razonar que pt lo es en V∗ . ¿Qué descomposición
en suma directa tiene asociada?
17. Razonar que la implicación
V = U ⊕ W ⇒ V ∗ = U0 ⊕ W 0
es independiente de la dimensión de V. ¿Cuáles son los proyectores de la
descomposición de V∗ ?
18. Supuesto que V = U ⊕ W, razonar que U∗ ≃ W0 . Comprobar que este
isomorfismo lo establece la traspuesta pt de la proyección p : V → U sobre
U paralelamente a W.
19. Si se tiene una descomposición V = U ⊕ W, razonar que
V∗ ≃ U∗ × W∗ .
20. Dada una aplicación lineal f : V → V0 , establecer que
a) (Ker f )∗ ≃ V∗ /Imf t .
b) (V0 /Im f )∗ ≃ Ker f t .
c) (Im f )∗ ≃ Imf t .
d ) (V/Ker f )∗ ≃ Imf t .
21. Sea U un subespacio de V. Entonces,
266
Capı́tulo 17. Trasposición de Aplicaciones Lineales
a) U es de dimensión finita r si y sólo si U0 es de codimensión finita r.
b) U es de codimensión finita r si y sólo si U0 es de dimensión finita r.
22. Sea f : V → V0 una aplicación lineal. Si V0 es de dimensión finita, razonar
que f t es de rango finito y que
rang(f t ) = rang(f ).
23. De manera más general: Una aplicación lineal f : V → V0 es de rango
finito si y sólo si f t lo es. En ambos casos,
rang(f t ) = rang(f ).
24. Un subespacio U de V es de codimensión finita r ≥ 1 si y sólo si existen
r formas linealmente independientes σ1 , σ2 , . . . , σr tales que
U = Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σr .
25. Sea S un subespacio de dimensión finita dentro de V∗ . Razonar que
S00 = S.
26. Dado un conjunto {σ1 , σ2 , . . . , σr } de r formas independientes, existen r
vectores w1 , w2 , . . . , wr ∈ V tales que
σi (wj ) = δij , ∀i, j ∈ [1, r].
27. Dadas las formas lineales σ1 , σ2 , ..., σm , σ, razonar que
σ ∈< σ1 , σ2 , . . . , σm >⇒ Ker σ1 ∩ Ker σ2 ∩ . . . ∩ Ker σm ⊆ Ker σ.
267
Capı́tulo 18
Cambios de Base
18.1.
Matriz de un cambio de bases
Sea IK un cuerpo conmutativo y sea V un espacio vectorial de dimensión finita
n ≥ 1 sobre IK. Sea B = {v1 , v2 , . . . , vn } una base de V, y supongamos una
nueva base C = {w1 , w2 , . . . , wn }. Conocer esta segunda requerirá conocer las
coordenadas de cada uno de sus vectores expresadas en la primera, es decir,
tener unas igualdades
n
X
wj =
cij vi , ∀j ∈ [1, n].
i=1
A partir de ellas, podemos construir una matriz
P ∈ M(n, IK),
colocando en sus columnas las coordenadas en B de cada wj ∈ C. La nombraremos como matriz del cambio de B a C, y para resaltar la dependencia
de las bases usadas escribiremos
P = M (B, C).
18.2.
Cambios de bases y matrices regulares
Puesto que las columnas de P se corresponden con los vectores de C a través
del isomorfismo de Descartes asociado a la base B, serán independientes. O sea,
toda matriz de un cambio de bases es regular.
Recı́procamente, fijada B, tomando como dato una matriz P = (cij ) que sea
regular, podemos construir los vectores
wj =
n
X
i=1
cij vi , ∀j ∈ [1, n],
268
Capı́tulo 18. Cambios de Base
que serán linealmente independientes por serlo las columnas de P . Entonces,
forman una base C y, por la manera en que se han elegido sus vectores, se tiene
P = M (B, C).
Esto nos da idea de que, fijada una base B en V, hay tantas otras posibles bases
C como matrices regulares P .
18.3.
Cambios de bases y automorfismos lineales
Fijada la base B = {v1 , v2 , . . . , vn } de V, cada vez que pasemos a otra base
C = {w1 , w2 , . . . , wn }, la matriz P = (cij ) = M (B, C) del cambio sirve para
definir un endomorfismo f de V tal que
M (f, B) = M (B, C) ⇒ f (vj ) =
n
X
cij vi = wj , ∀j ∈ [1, n],
i=1
el cual es un automorfismo puesto que P es regular.
Si f es un automorfismo f con matriz P = (cij ) = M (f, B), los vectores
wj = f (vj ) =
n
X
cij vi = wj , ∀j ∈ [1, n],
i=1
forman una nueva base C y, por propia construcción, se cumple
M (B, C) = M (f, B).
De esta forma, se establece una biyección entre cambios de base y automorfismos
de V.
18.4.
Composición de dos cambios
Proposición 223 Si en V tenemos tres bases
A = {u1 , u2 , . . . , un }, B = {v1 , v2 , . . . , vn }, C = {w1 , w2 , . . . , wn },
se cumple que
M (A, C) = M (A, B) × M (B, C).
Demostracion:
M (A, B) = (cih ), M (B, C) = (dhj ), M (A, C) = (eij ) ⇒
⇒ vh =
n
X
i=1
cih ui , wj =
n
X
h=1
dhj vh =
n
X
i=1
eij ui ⇒
18.5. Cambio idéntico y cambio recı́proco
⇒ wj =
n
X
dhj vh =
h=1
⇒ eij =
n
X
h=1
n
X
269
n
n X
n
X
X
dhj (
cih ui ) =
(
cih dhj )ui ⇒
i=1
i=1 h=1
cih dhj ⇒ M (A, C) = M (A, B) × M (B, C).
h=1
2
18.5.
Cambio idéntico y cambio recı́proco
Proposición 224 Si B = {v1 , v2 , . . . , vn } es una base de V, se tiene
M (B, B) = I.
Demostracion:
Puesto que vj =
Pn
i=1 δij vi , la fórmula es trivial.
2
Proposición 225 Si B = {v1 , v2 , . . . , vn } y C = {w1 , w2 , . . . , wn } son dos
bases de V, se cumple
M (C, B) = (M (B, C))−1 .
Demostracion:
Tomando A = C en la proposición 223, según lo anterior, es
I = M (C, C) = M (C, B) × M (B, C) ⇒ M (C, B) = (M (B, C))−1 .
2
18.6.
Orientación de bases en espacios vectoriales reales
Sea V un espacio de dimensión finita n ≥ 1 sobre el cuerpo IR. Dadas dos bases
B y C decimos que C tiene la misma orientación que B si
det(M (B, C)) > 0.
En esta definición las bases se suponen como conjuntos ordenados de vectores. Es
decir, si permutamos los vectores de una base, se supondrá que la base obtenida
es distinta de la original. Pues bien,
Proposición 226 La cualidad de tener la misma orientación es una relación
de equivalencia en el conjunto de todas las bases ordenadas de V.
270
Capı́tulo 18. Cambios de Base
Demostracion:
1. Toda base B tiene la misma orientación que ella misma ya que
det(M (B, B)) = det(I) = 1 > 0.
2. Si C tiene la misma orientación que B, también B tiene igual orientación
que C ya que
det(M (B, C)) > 0 ⇒ det(M (C, B)) = det(M (B, C))−1 =
= (det(M (B, C)))−1 > 0.
3. Si C tiene la misma orientación que B y B la misma que A, C tiene igual
orientación que A ya que
det(M (A, B)) > 0, det(M (B, C)) > 0 ⇒
⇒ det(M (A, C)) = det(M (A, B) × M (B, C)) =
= det(M (A, B)) det(M (B, C)) > 0.
2
Puesto que en todo caso se tiene det(M (B, C)) 6= 0, sólo caben dos alternativas: el determinante es positivo y ambas bases tienen igual orientación, o bien
el determinante es negativo y las bases tienen distinta orientación. O sea, en
esta relación sólo hay dos clases de equivalencia. Conviniendo en asignar orientación positiva a una base B prefijada, se dirá que las de su misma clase
también están orientadas positivamente y que las de la otra están orientadas negativamente.
En los espacios IRn se asigna la orientación positiva a la base canónica
{e1 , e2 , . . . , en }.
Entonces, para cualquier base
vj = (c1j , c2j , . . . , cnj ), j ∈ [1, n],
su orientación dependerá del signo positivo o negativo que tenga el determinante
de la matriz cuyas columnas sean los vectores dados.
18.7.
Cambio entre bases duales
Fijado un espacio V, sean
B = {v1 , v2 , . . . , vn }, C = {w1 , w2 , . . . , wn },
18.8. Cambio de coordenadas
271
B∗ = {v1 , v2 , . . . , vn }, C ∗ = {w1 , w2 , . . . , wn },
dos bases y sus respectivas duales. Suponiendo que
i
w =
n
X
dij vj , ∀i ∈ [1, n],
j=1
formaremos una matriz
Q = (dij ) ∈ M(n, IK),
en cuyas filas están las coordenadas de cada nueva forma wi en la base B ∗ . La
llamaremos matriz del cambio de B ∗ a C ∗ , y la denotamos como
Q = M (B∗ , C ∗ ).
Proposición 227 Dadas las bases B, C, B∗ y C ∗ , se cumple
M (B∗ , C ∗ ) = M (B, C)−1 , M (C ∗ , B∗ ) = M (B, C).
Demostracion:
Siendo (cij ) = M (B, C), (dij ) = M (B∗ , C ∗ ), se tiene
δij = wi (wj ) = (
n
X
dih vh )(
h=1
=
n
X
dih (
h=1
n
X
n
X
ckj vk ) =
k=1
ckj vh (vk )) =
k=1
n
X
h=1
n
X
dih vh (
h=1
dih (
n
X
ckj δhk ) =
k=1
n
X
ckj vk ) =
k=1
n
X
dih chj ⇒
h=1
⇒ I = (dij ) × (cij ) ⇒ (dij ) = (cij )−1 ,
lo que prueba la primera fórmula. Para la segunda, basta observar que
M (C ∗ , B∗ ) = M (B ∗ , C ∗ )−1 = (dij )−1 = (cij ).
2
18.8.
Cambio de coordenadas
Cada vector x ∈ V tendrá un sistema de coordenadas en cada una de las bases
B y C. Suponiendo que
x = x1 v1 + x2 v2 + . . . + xn vn = y1 w1 + y2 w2 + . . . + yn wn ,
y siendo P = (cij ) = M (B, C), se tiene
x=
n
X
j=1
yj wj =
n
X
j=1
n
n X
n
n
X
X
X
yj (
cij vi ) =
(
yj cij )vi =
xi vi ⇒
i=1
i=1 j=1
i=1
272
Capı́tulo 18. Cambios de Base
⇒ xi =
n
X
cij yj , ∀i ∈ [1, n],
j=1
igualdades que permiten conocer las coordenadas en la primera base, a partir de
las coordenadas en la segunda, y que se resumen en una sola igualdad matricial
y1
x1
x2
y2
. =P × .
..
.
.
xn
yn
conocida como ecuación matricial del cambio de coordenadas de C a B.
Multiplicando, a la izquierda de ambos miembros, por la matriz P −1 , se obtiene
la ecuación matricial del cambio de coordenadas de B a C, que no es otra
que la
y1
x1
x
y2
. = P −1 × .2 .
.
..
.
xn
yn
En cuanto a las formas lineales, si
σ = a1 v1 + a2 v2 + . . . + an vn = b1 w1 + b2 w2 + . . . + bn wn ,
los cambios de coordenadas que se obtienen son los
18.9.
( a1
a2
...
a n ) = ( b1
b2
. . . bn ) × P −1 ,
( b1
b2
. . . b n ) = ( a1
a2
. . . an ) × P.
Complementos / Ejercicios
1. Sea B = {v1 , v2 } una base de IR2 . Comprobar que los vectores
w1 = 3v1 + 5v2 , w2 = v1 + 2v2
forman una nueva base C. Calcular las coordenadas en C de y = v1 − 4v2 ,
ası́ como las coordenadas en B de z = w1 − 4w2 .
2. Sea B = {v1 , v2 , v3 } una base de IR3 . Razonar que los vectores
w1 = v1 , w2 = v1 − v2 , w3 = v1 + v2 − v3 .
forman una nueva base C. Hallar las coordenadas en B de u = w1 + w2 .
3. Sea B = {v1 , v2 , v3 } una base de IR3 . Comprobar que los vectores
w1 = v1 + 2v2 , w2 = 2v1 − v2 , w3 = v3 ,
forman una nueva base C. Obtener las matrices de cambio y las coordenadas en C del vector u = 5v1 − 5v2 + 3v3 .
18.9. Complementos / Ejercicios
273
4. Dadas dos bases B = {v1 , v2 }, C = {w1 , w2 } de IR2 , se sabe que
a) una recta tiene las ecuaciones
x1 + 2x2 = 0, y1 − y2 = 0,
en B y C, respectivamente.
b) v1 + 3v2 = w1 + 2w2 .
Encontrar las matrices de cambio.
5. Dadas dos bases B = {v1 , v2 }, C = {w1 , w2 } de IR2 , se sabe que
y = v1 + v2 = w2 , z = 3v1 + 2v2 = w1 + 3w2 .
Encontrar la matriz M (B, C) y expresar los cambios de coordenadas.
6. Dadas las tres bases
A = {(1, 0, 0), (0, 1, 0), (0, 0, 1)},
B = {(1, 1, 0), (1, 0, 1), (1, 1, 1)},
C = {(1, 1, 2), (2, 2, 1), (1, 2, 2)},
3
del espacio IR , obtener las matrices M (A, B), M (A, C), M (B, C) y M (C, B).
7. Dadas las cuatro bases
A = {(1, 0, 0), (0, 1, 0), (0, 0, 1)},
B = {(1, −1, 1), (1, 0, 1), (2, 1, 0)},
C = {(−1, −1, 0), (0, −1, −1), (1, 1, 1)},
D = {(1, 0, 0), (1, 1, 0), (1, 1, 1)},
3
del espacio IR , obtener las matrices M (A, B), M (A, C), M (A, D), M (B, C),
M (B, D) y M (C, D).
8. En el espacio IR3 se dan las bases
B = {v1 = (1, 1, −1), v2 = (2, 1, 0), v3 = (0, 1, 1)},
C = {w1 = (1, 0, 0), w2 = (3, 1, 2), w3 = (1, 1, 1)}.
a) Encontrar las matrices de cambio M (B, C) y M (C, B)
b) Hallar las coordenadas de x = 5v1 − v2 + 7v3 en la base C
c) Hallar las coordenadas de y = −2w1 + w2 − 4w3 en la base B
d ) Buscar un vector w3 que, junto a los w1 = (1, −1, 0), w2 = (0, 1, 1),
formen una base de IR3 en la cual x = (3, 2, 1) tenga coordenadas
(1,1,1).
274
Capı́tulo 18. Cambios de Base
9. Dada la base de IR3 formada por los vectores
v1 = (1, 1, 1), v2 = (0, 1, 1), v3 = (1, 0, 1).
Hallar la base C = {w1 , w2 , w3 } tal que las ecuaciones del cambio de
coordenadas vengan dadas por:
x0 = x − 2z, y 0 = −y + 5z, z 0 = x − 3z.
10. Consideramos las dos siguientes bases de IR3 :
B = {(1, 1, 1), (1, 1, 0), (0, 1, 1)}, C = {(1, 0, 1), (0, 0, 1), (−1, 1, 0)}.
Sea H el plano de ecuación implı́cita x0 + y 0 + z 0 = 0 en la base C. Obtener
la ecuación de H en B.
11. Estudiar si los vectores
v1 = (0, 1, −2, 1), v2 = (1, 1, 2, 1), v3 = (1, 0, 0, 1), v4 = (2, 2, 0, −1),
forman una base de IR4 . En caso afirmativo, calcular las coordenadas en
dicha base del vector x = (1, 1, 1, 0).
12. Demostrar que los vectores
v1 = (1, 1, 1), v2 = (0, 1, 1), v3 = (1, 0, 1)
forman una base B de IK 3 , siendo IK = Z/7I
I Z. Encontrar otra base C de
manera que las fórmulas del cambio de coordenadas sean
x = x0 − 2z 0 , y = −y 0 + 5z 0 , z = x0 − z 0 .
13. Razonar que los polinomios
p1 (x) = 1 − x, p2 (x) = x2 + x3 , p3 (x) = 1 + x2 , p4 (x) = x + x3 ,
forman una base del espacio IR3 [x]. Encontrar la matriz de cambio entre
la base canónica y la nueva. Expresar en ella el polinomio
p(x) = 3 + 3x2 − 4x3 .
14. Obtener la matriz de cambio desde la base canónica {1, x, x2 , x3 } de IR3 [x]
hasta la base de Taylor {1, x − 1, (x − 1)2 /2!, (x − 1)3 /3!}.
15. Sean B = {e1 , e2 , e3 } y B∗ = {e1 , e2 , e3 } la base canónica de IR3 y su base
dual. Comprobar que los vectores
w1 = (3, −3, 2), w2 = (3, −2, 2), w3 = (1, −1, 1)
son una nueva base C. Encontrar su dual y las matrices M (C, B) y M (C ∗ , B ∗ )
18.9. Complementos / Ejercicios
275
16. Siendo V = IR3 , se dan las formas lineales
σ1 (x) = 2x − 2y + z, σ2 (x) = 3x − 3y + z, σ3 (x) = 4x + 4y + z.
¿Forman una base de V∗ ? En caso afirmativo, determinar las coordenadas
en dicha base de la forma σ(x) = x + y + z. Encontrar la base de V de la
cual, ésta es la dual.
17. Sea H un hiperplano de IR4 con ecuación implı́cita x + y + z + t = 0 en una
cierta base B = {v1 , v2 , v3 , v4 }. Determinar otra C = {w1 , w2 , w3 , w4 } en
la que H tenga la ecuación t0 = 0.
276
Capı́tulo 18. Cambios de Base
277
Capı́tulo 19
Equivalencia y Semejanza
de Matrices
19.1.
Matriz de una aplicación lineal al cambiar
de bases
Sea V un espacio n-dimensional sobre IK y sean
B = {v1 , v2 , . . . , vn }, C = {w1 , w2 , . . . , wn },
dos bases de V. Sabemos que existe una matriz M (B, C) ∈ GL(n, IK) tal que
x=
n
X
xi vi =
i=1
n
X
j=1
y1
x1
x2
y2
yj wj ⇒
... = M (B, C) × .. .
.
xn
yn
De igual forma, si en un espacio m-dimensional V0 sobre IKse fijan bases
0
0
B 0 = {v10 , v20 , . . . , vm
}, C 0 = {w10 , w20 , . . . , wm
},
existe una matriz M (B 0 , C 0 ) ∈ GL(m, IK) para la cual
x0
0
x =
m
X
i=1
x0i vi =
m
X
j=1
1
x02
yj0 wj ⇒
y0
1
y20
. .
=
M
(B
,
C
)
×
..
.
.
.
0
x0m
ym
0
0
Si tenemos una aplicación lineal f : V → V0 , existirán matrices
M (f, B, B 0 ), M (f, C, C 0 ) ∈ M(m, n, IK),
278
Capı́tulo 19. Equivalencia y Semejanza de Matrices
de manera que, poniendo x0 = f (x), para cada x ∈ V, se tiene
x0
y0
y1
x1
1
y20
y
x
2
. = M (f, B, B0 ) × . , . = M (f, C, C 0 ) × .2 .
.
.. .
.
.
.
.
0
xn
yn
x0m
ym
1
x02
Llevando a la primera ecuación los cambios de coordenadas, se tiene
y1
y
= M (f, B, B0 ) × M (B, C) × .2 ⇒
M (B0 , C 0 ) ×
.
.
.
.
.
0
yn
ym
y0
1
y20
y0
y1
y2
0
0 −1
0
⇒
.. = M (B , C ) × M (f, B, B ) × M (B, C) × .. ,
.
.
1
y20
0
ym
yn
que comparado con la segunda nos asegura que
M (f, C, C 0 ) = M (B 0 , C 0 )−1 × M (f, B, B 0 ) × M (B, C).
Ası́, conocida la matriz de f en las primeras bases B y B0 , se obtiene la matriz
de f en las segundas C y C 0 , usando las dos matrices de cambio. Nótese que
M (B 0 , C 0 )−1 = M (C 0 , B 0 ), de manera que si tomamos
P = M (B, C) ∈ GL(n, IK), Q = M (C 0 , B0 ) ∈ GL(m, IK),
A = M (f, B, B 0 ) ∈ M(m, n, IK), B = M (f, C, C 0 ) ∈ M(m, n, IK),
la fórmula de antes se expresa en la forma
B = Q × A × P.
19.2.
Matrices equivalentes
Dadas A, B ∈ M(m, n, IK), se dice que A es equivalente a B, y escribiremos
A ≡ B, si existen matrices regulares P ∈ GL(n, IK) y Q ∈ GL(m, IK) tales que
B = Q × A × P.
Proposición 228 La equivalencia de matrices es una relación de igualdad en
el conjunto M(m, n, IK).
19.3.
Interpretación geométrica de la equivalencia de matrices
279
Demostracion:
1. ∀A ∈ M(m, n, IK) ⇒ A ≡ A.
Basta ver que
A = Im × A × In ⇒ A ≡ A,
donde In e Im son las respectivas matrices unidad, que son regulares.
2. (∀A, B ∈ M(m, n, IK)/A ≡ B) ⇒ B ≡ A.
Si existen matrices regulares P ∈ GL(n, IK), Q ∈ GL(m, IK) tales que
B = Q × A × P,
despejando A queda
A = Q−1 × B × P −1 ⇒ B ≡ A,
ya que también P −1 , Q−1 son regulares.
3. (∀A, B, C ∈ M(m, n, IK)/A ≡ B, B ≡ C) ⇒ A ≡ C.
Si existen matrices regulares P, R ∈ GL(n, IK) y Q, S ∈ GL(m, IK) tales
que
B = Q × A × P, C = S × B × R,
llevando el valor de B a la segunda igualdad, queda
C = S × (Q × A × P ) × R = (S × Q) × A × (P × R) ⇒ A ≡ C,
ya que el producto de matrices regulares es regular.
2
19.3.
Interpretación geométrica de la equivalencia de matrices
Proposición 229 Si dos matrices A y B representan a una misma aplicación
lineal f : V → V0 en distintas parejas de bases (B, B 0 ) y (C, C 0 ), entonces son
equivalentes.
Demostracion:
Es la conclusión de la sección 19.1.
2
Proposición 230 Supongamos que A, B ∈ M(m, n, IK) son equivalentes. Fijados dos espacios sobre IK, uno V de dimensión n y otro V0 de dimensión m, y
0
fijadas bases B = {v1 , v2 , . . . , vn } en V y B 0 = {v10 , v20 , . . . , vm
} en V0 , existen
0
0
0
0
otras bases C = {w1 , w2 , . . . , wn } y C = {w1 , w2 , . . . , wm } de manera que el
morfismo f : V → V0 , determinado por la condición A = M (f, B, B0 ), cumple
que B = M (f, C, C 0 ).
280
Capı́tulo 19. Equivalencia y Semejanza de Matrices
Demostracion:
La existencia de la aplicación f del enunciado está garantizada por la proposición 190. Por otra parte, de A ≡ B se sigue que existe una pareja de matrices
P = (αij ) ∈ GL(n, IK), Q ∈ GL(m, IK) tales que
B = Q × A × P.
Según lo indicado en la sección 18.2, los vectores
wj = α1j v1 + α2j v2 + . . . + αnj vn
forman una base C de V para la cual se cumple P = M (B, C). De la misma
forma, los vectores
0
wj0 = γ1j v10 + γ2j v20 + . . . + γmj vm
,
donde (γij ) = Q−1 , formarán una base C 0 en V0 tal que Q−1 = M (B 0 , C 0 ).
Entonces,
B = Q × A × P = (Q−1 )−1 × A × P =
= M (B0 , C 0 )−1 × M (f, B, B0 ) × M (B, C) = (M (f, C, C 0 ),
2
En resumen se llega a que, fijado V de dimensión n con una base B, ası́ como
un V0 de dimensión m con una base B 0 , cada aplicación lineal f de V en V0
se iguala a una clase de equivalencia de las matrices de M(m, n, IK), quedando
interpretado este concepto en términos geométricos.
19.4.
Equivalencia y rango. Matriz canónica de
una clase
Proposición 231 Si A, B ∈ M(m, n, IK) son equivalentes, se cumple
rang(A) = rang(B).
Demostracion:
Puesto que dos matrices equivalentes pueden representar a una misma aplicación lineal f entre un espacio de dimensión n y otro de dimensión m, cada
una de ellas tiene el mismo rango que f , luego los dos rangos son iguales entre
sı́.
2
Dentro de M(m, n, IK), por cada número r ≤ mı́n(m, n), se considera la matriz
Cr = (cij ) de coeficientes todos nulos salvo los cii , donde i ≤ r, que se toman
iguales a 1. Es decir, la submatriz cuadrada que afecta a las r primeras filas y
columnas es la matriz unidad Ir , y fuera de ella todos los coeficientes son nulos.
Por ello suele escribirse como
µ
¶
Ir 0
Cr =
.
0 0
19.5.
Matriz de un endomorfismo lineal al cambiar de base
281
Esta matriz trivialmente tiene rango r, siendo Ir una submatriz principal, y es
la más sencilla entre todas las de tal rango. Por eso se llama matriz canónica
de rango r.
Proposición 232 Toda matriz A ∈ M(m, n, IK) de rango r es equivalente a la
matriz canónica Cr .
Demostracion:
Como otras veces fijamos espacios V y V0 , con bases respectivas B y B0 , y
consideramos la aplicación lineal f : V → V0 tal que A = M (f, B, B 0 ). Esto
obliga a que rang(f ) = rang(A) = r, luego su núcleo tiene dimensión p = n − r.
Construimos, entonces, una base
C = {w1 , w2 , . . . , wr , u1 , u2 , . . . , up }
de V donde los p últimos vectores sean base de Ker f y los r primeros se
obtengan por el proceso de ampliación de bases. En f (C) podemos suprimir los
vectores f (uj ) por ser nulos; los r restantes no sólo generan a la imagen, sino
que son una base de la misma porque ésta tiene dimensión r.
Tomando wj0 = f (wj ), sea
C 0 = {w10 , w20 , . . . , wr0 , u01 , u02 , . . . , u0q },
donde q = m − r, una base de V0 obtenida por ampliación de la de Im f .
Por la manera en que se han definido C y C 0 es evidente que
M (f, C, C 0 ) = Cr
luego, aplicando la proposición 229, A y Cr son equivalentes.
2
Proposición 233 Sean A, B ∈ M(m, n, IK). Entonces,
rang(A) = rang(B) ⇒ A ≡ B.
Demostracion:
Siendo ambas equivalentes a una misma matriz canónica, la afirmación se
sigue de las propiedades simétrica y transitiva de la relación.
2
19.5.
Matriz de un endomorfismo lineal al cambiar de base
Sea V un espacio n-dimensional sobre IK y sea f : V → V un endomorfismo.
Si hacemos un cambio entre las bases
B = {v1 , v2 , . . . , vn }, C = {w1 , w2 , . . . , wn },
282
Capı́tulo 19. Equivalencia y Semejanza de Matrices
sabremos cómo cambia la matriz de f tomando B 0 = B, C 0 = C en el caso de
aplicaciones lineales. Entonces, la fórmula general se presenta como
M (f, C) = M (B, C)−1 × M (f, B) × M (B, C) ⇔ B = P −1 × A × P,
si tomamos
P = M (B, C) ∈ GL(n, IK), A = M (f, B) ∈ M(n, IK), B = M (f, C) ∈ M(n, IK).
19.6.
Semejanza de matrices cuadradas
Dadas dos matrices A, B ∈ M(n, IK), se dice que A es semejante a B, y
escribiremos A ∼ B, si existe una matriz regular P ∈ GL(n, IK) tal que
B = P −1 × A × P.
Dos matrices semejantes son equivalentes sin más que tomar Q = P −1 , pero dos
matrices cuadradas equivalentes no tienen por qué ser semejantes.
Proposición 234 La semejanza de matrices es una relación de igualdad en el
conjunto M(n, IK).
Demostracion:
a) ∀A ∈ M(n, IK) ⇒ A ∼ A.
Basta ver que
A = I −1 × A × I ⇒ A ∼ A,
donde I es la matriz unidad, pues I es regular e I −1 = I.
b) (∀A, B ∈ M(n, IK)/A ∼ B) ⇒ B ∼ A.
Si existe una matriz regular P ∈ GL(n, IK) tal que
B = P −1 × A × P,
despejando A se obtiene
P × B × P −1 = A ⇒ B ∼ A,
ya que también P −1 es regular y, además, (P −1 )−1 = P .
c) (∀A, B, C ∈ M(n, IK)/A ∼ B, B ∼ C) ⇒ A ∼ C.
Si existen matrices regulares P, Q ∈ GL(n, IK) tales que
B = P −1 × A × P, C = Q−1 × B × Q,
llevando el valor de B a la segunda igualdad, queda
C = Q−1 × (P −1 × A × P ) × Q = (P × Q)−1 × A × (P × Q) ⇒ A ∼ C,
ya que el producto de matrices regulares es regular y la inversa del producto es el producto de las inversas en orden contrario.
19.7.
Interpretación geométrica de la semejanza de matrices
283
2
Cada una de las clases asociadas a esta relación se nombrará como una clase
de semejanza dentro del álgebra M(n, IK).
19.7.
Interpretación geométrica de la semejanza de matrices
Proposición 235 Si dos matrices A y B ∈ M(n, IK) representan a un mismo
endomorfismo f de un espacio n-dimensional V sobre IK en distintas bases B
y C, son semejantes.
Demostracion:
Ya se ha razonado en la sección 19.5.
2
Proposición 236 Supongamos que A, B ∈ M(n, IK) sean semejantes. Fijado
un espacio n-dimensional V sobre IK, y fijada una base B = {v1 , v2 , . . . , vn },
existe otra base C = {w1 , w2 , . . . , wn } de manera que el endomorfismo f , determinado por la condición A = M (f, B), cumple que B = M (f, C).
Demostracion:
Por hipótesis existe P = (αij ) ∈ GL(n, IK) tal que
B = P −1 × A × P.
Los vectores
wj = α1j v1 + α2j v2 + . . . + αnj vn
forman una base C de V para la cual se cumple P = M (B, C). Entonces,
B = P −1 × A × P = M (B, C)−1 × M (f, B) × M (B, C) = M (f, C).
2
En resumen: Fijado V de dimensión n y una base B de V, cada endomorfismo
de V se iguala a una clase de semejanza de las matrices de M(n, IK).
19.8.
Traza y determinante de un endomorfismo
Ya sabemos que las matrices equivalentes entre sı́ tienen igual rango. Por eso
se dice que el rango es un invariante por equivalencia. De la misma forma
un invariante por semejanza será una propiedad común a las matrices semejantes entre sı́. El primer ejemplo es el propio rango pues se ha señalado que las
matrices semejantes son equivalentes. Hay otros y entre ellos señalaremos dos
de gran importancia:
284
Capı́tulo 19. Equivalencia y Semejanza de Matrices
Proposición 237 Dos matrices semejantes poseen igual traza.
Demostracion:
Aplicando la proposición 147 a los factores P −1 × A y P , obtenemos
tr(B) = tr(P −1 × A × P ) = tr((P −1 × A) × P ) =
= tr(P × (P −1 × A)) = tr((P × P −1 ) × A) = tr(I × A) = tr(A).
2
Proposición 238 Dos matrices semejantes poseen igual determinante.
Demostracion:
Aplicando que el determinante de un producto es producto de determinantes
(proposición 175) y que el determinante de una inversa es el inverso del determinante (proposición 178), se tiene
B = P −1 × A × P ⇒ det(B) = det(P −1 × A × P ) =
= det(P −1 ) det(A) det(P ) = (det(P ))−1 det(A) det(P ) = det(A).
2
Según la interpretación geométrica de las clases de semejanza, los invariantes
son únicos para cada endomorfismo de un espacio, por lo que también se llaman
invariantes lineales del endomorfismo asociado a la clase. Por ello, podremos
hablar de la traza o del determinante de un endomorfismo f , haciendo
su cálculo mediante una matriz asociada a f en una cualquiera de las bases del
espacio. Se anotan como tr(f ) y det(f ).
19.9.
El grupo lineal especial de un espacio finitodimensional
Proposición 239 La asignación f → det(f ) es un epimorfismo de GL(V, IK)
sobre el grupo multiplicativo IK ∗ .
Demostracion:
Tomando una base cualquiera B de V, se tiene
det(g ◦ f ) = det(M (g ◦ f )) = det(M (g) × M (f )) =
= det(M (g)) det(M (f )) = det(g) det(f ) = det(f ) det(g).
Esta fórmula es válida para dos endomorfismos cualesquiera. Si tomamos dos
automorfismos, queda establecido el morfismo del enunciado. Por otra parte,
19.10.
Paridad o imparidad de un automorfismo de un espacio real
285
dado λ 6= 0, el endomorfismo f de matriz Diag(λ, 1, . . . , 1) es un automorfismo
y se cumple det(f ) = λ.
2
El núcleo de este morfismo, formado por todos los automorfismos lineales f con
det(f ) = 1, es un subgrupo normal de GL(V, IK), que se denota por
SL(V, IK)
y se llama grupo lineal especial del espacio V.
19.10.
Paridad o imparidad de un automorfismo de un espacio real
Sea f un automorfismo de un espacio real V. Se dice que f es un automorfismo
par (directo o positivo) cuando det(f ) > 0. Si det(f ) < 0, se dice que es un
automorfismo impar (inverso o negativo).
Proposición 240 Los automorfismos pares forman un subgrupo de GL(V, IR).
Demostracion:
Se trata de la imagen inversa mediante la función determinante del subgrupo
IR+ de IR∗ .
2
Como la matriz de cambio de una base dada B a la base imagen f (B) es la
matriz de f en B, los automorfismos pares conservan la orientación de las bases,
mientras que los impares la alteran. Esta es la interpretación geométrica de la
paridad o imparidad.
19.11.
Complementos / Ejercicios
1. Sea f : IR2 → IR3 la aplicación lineal que viene representada en las bases
canónicas por la matriz
−1 2
A = 0 4 .
−1 4
Obtener su matriz en las bases
C = {(−1, 1), (2, 3)} y C 0 = {(1, 0, 1), (0, −1, 0), (−1, 0, 1)}.
2. Sea f : IR3 → IR2 la aplicación lineal que viene representada en las bases
canónicas por la matriz
µ
¶
5 −3
6
A=
.
−4
0 −1
286
Capı́tulo 19. Equivalencia y Semejanza de Matrices
Obtener su matriz en las bases
C = {(1, −1, 0), (2, 1, −1), (−3, 0, 1)} de IR3 ,
C 0 = {(2, 1), (−1, −1)} de IR2 .
3. Sea IK = Z/5I
I Z y sea la aplicación lineal
f : IK 3 → IK 2 , de ley f (x, y, z) = (x + y + 4z, 4y + z).
Obtener su matriz en las respectivas bases canónicas B y B 0 . Obtener la
matriz de f en las bases
C = {(1, 2, 1), (1, 0, 1), (3, 0, 0)} de IK 3 ,
C 0 = {(4, 3), (1, 0)} de IK 2 .
4. Sea f la aplicación lineal cuya matriz en las bases canónicas de IR4 y IR5
es la
1 −2
3
2
−1
2
1
2
4
3
A = 1 −2
.
4 −8 −1 −5
−1
2 −2 −1
Cambiar las bases de ambos espacios para que f se represente por la matriz
más sencilla posible.
5. Dado el operador lineal
f (x, y) = (x − y, −2x + y),
obtener su matriz en la base
C = {(1, 1), (1, −1)}.
6. Encontrar la matriz del operador
f (x, y, z) = (x − y + 2z, 3x + 4y − z, z − y).
en la base
C = {(1, 0, 1), (1, 1, 0), (1, 1, 1)}.
7. Dado el operador f de IR3 definido mediante la matriz
1 1 0
A = 0 1 1
1 0 1
en la base B = {(0, −1, 2), (4, 1, 0), (−2, 0, −4)}, hallar la matriz M (f, C),
siendo C = {(1, −1, 1), (1, 0, −1), (1, 2, 1)}.
19.11.
Complementos / Ejercicios
287
8. En el espacio IR3 se dan las bases
B = {v1 = (1, 1, −1), v2 = (2, 1, 0), v3 = (0, 1, 1)},
C = {w1 = (1, 0, 0), w2 = (3, 1, 2), w3 = (1, 1, 1)}.
Encontrar la matriz M (f, C), siendo f el operador tal que
f (v1 ) = v1 + v2 + 3v3 , f (v2 ) = 7v1 − v3 , f (v3 ) = −v1 + v2 .
9. Consideremos los endomorfismos lineales de IR3
a) f (x, y, z) = (x − y, y + z, −x + y − z),
b) g(x, y, z) = (x − y + 2z, 3x + 5y − z, −y + z),
y las bases
A = {e1 , e2 , e3 }, B = {e3 , e2 , e1 }, C = {e1 + e3 , e3 − e1 , e2 }.
a) Obtener sus matrices en las bases dadas.
b) Obtener la matriz de g ◦ f en B.
c) Obtener la matriz de f ◦ g en C.
10. Si f está representado en la base canónica de IR4 por la matriz
1 2
0 1
3 0 −1 2
,
A=
2 5
3 1
1 2
1 3
obtener sus matrices en cada una de las siguientes bases:
{e1 , e3 , e2 , e4 }, {e1 , e1 + e2 , e1 + e2 + e3 , e1 + e2 + e3 + e4 }.
11. Si una matriz A ∈ M(m, n, IK) se somete a cualquier operación elemental,
bien de sus columnas, bien de sus filas, se obtiene otra matriz B equivalente
a ella.
12. Sea A ∈ M(m, n, IK) con rango r. Realizando operaciones elementales con
sus columnas y sus filas, llegar a su equivalente canónica Cr .
13. Obtener la matriz canónica equivalente a la
1 3 −1
0 1 −1
A=
.
1 2 0
2 0 4
14. Sea A ∈ GL(n, IK). Entonces, A ≡ I. Razonar que el paso de A a I puede
hacerse usando solamente operaciones elementales con sus columnas.
288
Capı́tulo 19. Equivalencia y Semejanza de Matrices
15. Deducir del ejercicio anterior un procedimiento para calcular A−1 como
producto de matrices elementales.
16. Calcular A−1 por operaciones elementales, siendo
2 1 0
a) A = 1 3 1 .
2 1 1
−4
9 −7
9
6 −14 11 −14
.
b) A =
−1
3 −2
3
12 −24 21 −27
17. Sea V un espacio de dimensión finita n ≥ 1 sobre IK. Razonar que, para
todo proyector p 6= I de V se cumple det(p) = 0.
18. Sea V un espacio de dimensión finita n ≥ 1 sobre IK. Razonar que, para
toda simetrı́a s de V se cumple det(s) = ±1. Dilucidar el signo en función
de n y la dimensión p del eje. Si s es especular, obtener que
det(s) = −1.
19. Dada una descomposición V = U ⊕ W de V en dos subespacios propios,
se supone que V es de dimensión n ≥ 2 y W de dimensión q. Dado un
escalar µ 6= 0, sea f = DU,W,µ . Obtener que det(f ) = µq .
20. Razonar que toda transvección tiene determinante igual a 1.
21. Sea f 6= I un automorfismo con un hiperplano H de vectores dobles.
Razonar que es un deslizamiento oblı́cuo de espejo H, si det(f ) 6= 1, o
bien una transvección si det(f ) = 1.
22. De un automorfismo f de IR3 se sabe que los vectores del plano
x + 3y − z = 0,
son dobles y que f (1, 0, 0) = (−1, 1, 0). Comprobar que se trata de una
deformación, obteniendo su razón y dirección. Encontrar su matriz.
23. Comprobar que el operador
f (x, y, z) = (4x − 3y + 6z, x + 2z, −x + y − z)
es una transvección. Determinar su espejo y dirección.
24. Sean A, B ∈ M(n, IK), P ∈ GL(n, IK) tales que B = P −1 × A × P .
Cualquiera que sea el número natural m, razonar que B m = P −1 ×Am ×P
(Es decir, A ∼ B ⇒ Am ∼ B m , y la semejanza la establece la matriz
regular P ).
19.11.
Complementos / Ejercicios
289
25. Si un espacio vectorial real V admite un operador f tal que
f 2 = −I,
probar que f es un automorfismo y que la dimensión de V es par.
26. Un automorfismo f de un plano vectorial real V cumple la condición
f 2 = −I, si y sólo si puede representarse por la matriz
¶
µ
0 −1
.
1 0
27. Fijemos una matriz P ∈ GL(n, IK). Comprobar que la aplicación
ϕ : A → P −1 × A × P
es un automorfismo del álgebra M(n, IK).
28. Si ϕ es un automorfismo del álgebra M(n, IK), comprobar que es de los
descritos en el ejercicio anterior. En otras palabras: razonar que existe una
matriz regular P tal que
ϕ(A) = P −1 × A × P.
¿Es única la matriz P ?
290
Capı́tulo 19. Equivalencia y Semejanza de Matrices
291
Capı́tulo 20
Espacios Afines
20.1.
El concepto de espacio afı́n. Dimensión
Sea IK un cuerpo conmutativo. Sea V un espacio vectorial sobre IK. Sea E
un conjunto no vacı́o, cuyos elementos denominaremos puntos. Una aplicación
ϕ : E × E → V, para la que adoptaremos la notación
ϕ(X, Y ) = XY,
se dice que define a E como espacio afı́n sobre V, si se cumple que
1. ∀X, Y, Z ∈ E ⇒ XZ = XY + YZ.
2. Para cada punto O ∈ E, la aplicación
ϕO : E → V, de ley ϕO (X) = OX,
es una biyección de E sobre V.
Una pareja ordenada (X, Y ) de puntos se denomina vector fijo de origen X y
extremo Y , aunque no se trata en sentido estricto de un vector (o sea, elemento
de un espacio vectorial). En cambio, sı́ lo es XY, imagen de la pareja (X, Y ),
que se nombra como vector libre representado por el vector fijo. Por ello,
V se denomina espacio de los vectores libres del espacio afı́n E. También
se usa el término espacio director del espacio afı́n E.
Llamaremos dimensión del espacio afı́n E a la misma (finita o infinita) que
tenga el espacio vectorial V. Para indicarla se escribe dim(E).
20.2.
Los espacios vectoriales como espacios afines
Tomando E = V, la aplicación
ϕ : V × V → V, de ley ϕ(x, y) = y − x,
292
Capı́tulo 20. Espacios Afines
cumple que
ϕ(x, z) = z − x = y − x + z − y = ϕ(x, y) + ϕ(y, z).
Por otro lado, fijado b ∈ V, la aplicación x → ϕ(b, x) = x − b es biyectiva por
ser la traslación según −b. Ası́, todo espacio vectorial es un espacio afı́n dirigido
por sı́ mismo.
20.3.
Primeras propiedades de los espacios afines
Proposición 241 Sean X, Y, P, Q ∈ E. Entonces,
a) X = Y ⇒ XY = 0.
b) YX = −XY.
c) XY = PQ ⇒ XP = YQ.
Demostracion:
a) De la primera condición de la definición de espacio afı́n se obtiene
XZ = XX + XZ ⇒ XX = 0.
Si XY = 0, se tiene XX = XY. Tomando O = X en la segunda, queda
X =Y.
b) De nuevo por la primera condición, obtenemos
XY + YX = XX = 0 ⇒ YX = −XY.
c) Suponiendo XY = PQ, se tiene
XY = XP + PQ + QY = PQ ⇒ XP + QY = 0 ⇒ XP = −QY = YQ.
Aplicando este mismo razonamiento a la igualdad XP = YQ, resulta
XY = PQ.
2
20.4.
Vector de posición de un punto
Cuando fijamos un punto O como origen fijo de vectores para establecer la biyección ϕO entre puntos y vectores, el vector OX se denomina vector de posición
del punto X respecto del origen O y, si la fijación de O se sobreentiende,
escribiremos simplemente X en lugar de OX. Que la correspondencia punto 7→
vector de posición sea biyectiva significa que
20.5.
Subespacios afines
293
a) OX = OY ⇒ X = Y (inyectividad).
b) Dado x ∈ V, existe un X ∈ E tal que x = OX (suprayectividad).
Puesto que
XY = XO + OY = −OX + OY = OY − OX,
resulta que el vector asociado a la pareja (X, Y ) se obtiene restando al vector
de posición del extremo el vector de posición del origen.
20.5.
Subespacios afines
Dado un subconjunto F 6= ∅ del espacio afı́n E denotemos por
V (F) = {XY/X, Y ∈ F}
el subconjunto de V formado por todos los vectores asociados a parejas de
puntos de F. Diremos que F es un subespacio afı́n de E cuando
1. V (F) sea un subespacio vectorial de V.
2. ∀A, B, P ∈ F, ∀X ∈ E/AB = PX ⇒ X ∈ F.
Esta definición equivale a decir que F se convierte en un espacio afı́n cuando la
aplicación ϕ se restringe a F. En efecto, ϕ(F × F) = V (F) es por la definición
un espacio vectorial, el cual hará las veces de espacio director para F. Además,
la terna
F, V (F), ϕ : F × F → V (F)
deberá cumplir las dos condiciones de espacio afı́n: Con la primera no hay problema porque, al ser universal en E, la hereda el subconjunto F. Para la segunda,
hay que ver si, para cada P ∈ F, la aplicación X 7→ PX es una biyección de F
sobre V (F). Inyectiva lo es pues se trata de la restricción de ϕP a F, y ésta es
inyectiva. Que sea suprayectiva, significa que dado un vector x = AB ∈ V (F),
el punto X tal que AB = PX, debe estar en F, hecho que ha sido postulado
en la definición.
Se dirá que V (F) es el subespacio director del subespacio F. Como en el
caso del espacio E, la dimensión del subespacio afı́n F será la de V (F).
Para cada P ∈ E es claro que {P } es un subespacio afı́n dirigido por {0}; igualando {P } con P , diremos que los puntos son subespacios afines de dimensión
0. Un subespacio afı́n de dimensión 1, se nombra como recta afı́n; cualquier
vector no nulo de su recta vectorial directora, se nombra su vector director.
Un plano afı́n será un subespacio de dimensión 2; cada dos vectores independientes de su plano vectorial director, se dice que son los vectores directores
del plano afı́n. Los subespacios afines dirigidos por hiperplanos vectoriales, se
llamarán hiperplanos afines y su dimensión será n − 1 si E es n-dimensional.
Finalmente, el espacio total es subespacio afı́n, siendo V su subespacio director.
294
Capı́tulo 20. Espacios Afines
Por razones que más adelante se comprenderán, admitiremos que el subconjunto
vacı́o ∅ de E también es un subespacio afı́n. Para este caso, carente de subespacio
director, se toma dim(∅) = −1.
20.6.
Caracterización de los subespacios afines
Sea F un subconjunto no vacı́o de un espacio afı́n E. Para cada punto P de F,
escribiremos como V (P, F) = {PX/X ∈ F} el subconjunto de V formado por
los vectores libres de origen P y extremo un punto genérico de F.
Proposición 242 Si existe un punto P ∈ F tal que V (P, F) sea un subespacio vectorial, para cualquier otro Q ∈ F se cumplirá que V (Q, F) también es
subespacio vectorial y que V (Q, F) = V (P, F).
Demostracion:
Como Q ∈ F, se sabe que PQ ∈ V (P, F). Entonces, si X está en F, se tiene
QX = PX − PQ ∈ V (P, F), pues PX, PQ ∈ V (P, F) y éste es un subespacio
vectorial. Esto prueba que V (Q, F) ⊆ V (P, F).
Por otro lado, la suma PX + PQ también pertenece a V (P, F), luego existe
un punto Y ∈ F tal que PX + PQ = PY. Por tanto,
PX = PY − PQ = QY ∈ V (Q, F) ⇒ V (P, F) ⊆ V (Q, F).
2
Proposición 243 Si existe un punto P ∈ F tal que V (P, F) sea un subespacio
vectorial, F es un subespacio afı́n para el cual V (F) = V (P, F).
Demostracion:
Trivialmente se tiene V (P, F) ⊆ V (F). Por otra parte,
∀X, Y ∈ F ⇒ XY = PY − PX ∈ V (P, F) ⇒ V (F) ⊆ V (P, F),
luego V (F) = V (P, F).
Dados A, B, Q ∈ F , sea X ∈ E tal que AB = QX. Por la proposición
anterior y por la igualdad que acabamos de probar, se tendrá
QX = AB ∈ V (F) = V (P, F) = V (Q, F) ⇒ X ∈ F.
Por tanto, F es un subespacio afı́n y V (F) = V (P, F).
2
Proposición 244 Si F es un subespacio afı́n de E, para todo P ∈ F, se cumple
que V (P, F) es un subespacio vectorial y que V (P, F) = V (F).
20.7.
Subespacios afines de un espacio vectorial
295
Demostracion:
Por las definiciones se tiene que V (P, F) ⊆ V (F).
Dado un vector x ∈ V(F), existen A, B ∈ F tales que x = AB; por otro
lado, el punto X ∈ E tal que AB = PX está en F, luego
x = AB = PX ∈ V (P, F) ⇒ V (F) ⊆ V (P, F).
2
Proposición 245 El subconjunto F es un subespacio afı́n de E si y sólo si
existe un punto P ∈ F tal que V (P, F) sea un subespacio vectorial. En ambos
casos, V (F) = V (P, F).
Demostracion:
Basta unir los dos resultados anteriores.
20.7.
2
Subespacios afines de un espacio vectorial
Sea F 6= ∅ un subconjunto de un espacio vectorial V considerado como espacio
afı́n sobre sı́ mismo. Según acabamos de ver, será subespacio afı́n si para algún
b ∈ FV (b, F) = {x−b/x ∈ F} = F −b es un subespacio vectorial. Pero, según
la proposición 117, esto mismo caracterizaba a lo que en la sección 10.2 habı́amos
llamado subespacios afines de un espacio vectorial. Queda ası́ claro que ambas
definiciones coinciden. Más aún: los vectores de posición de los puntos X de un
subespacio afı́n F de E, respecto de un origen O, cumplen que X = P + PX,
donde PX recorre V (P, F) = V (F), luego constituyen un subespacio afı́n del
espacio vectorial V que dirige a F.
20.8.
Determinación de subespacios afines
Proposición 246 Dado un punto P ∈ E y un subespacio vectorial U, existe un
único subespacio afı́n F tal que
P ∈ F , V (F) = U.
Demostracion:
a) Existencia: Para cada vector u ∈ U existe un punto X ∈ E tal que PX =
u, lo que permite considerar el conjunto
F = {X ∈ E/PX ∈ U}.
Por propia construcción se tiene V (P, F) = U, luego F es un subespacio
afı́n dirigido por U. Además, tomando u = 0 = PP, resulta que P ∈ F.
296
Capı́tulo 20. Espacios Afines
b) Unicidad: Sea G un subespacio afı́n tal que P ∈ G y V (F) = U. Dado un
punto X ∈ G, el vector PX está en U, luego, X ∈ F. Recı́procamente, si
X ∈ F, es PX ∈ U = V (F), luego existe un Y ∈ G tal que PY = PX,
de donde se obtiene que X = Y ∈ G. Por tanto, G = F.
2
20.9.
Contenido entre subespacios afines
La relación de pertenencia P ∈ F se expresa con la frase el subespacio afı́n F
pasa por P . De manera más general, se dice que un subespacio afı́n G pasa
por otro F cuando F ⊆ G.
Proposición 247 Si G pasa por F 6= ∅, se cumple V (F) ⊆ V (G).
Demostracion:
Sea P ∈ F y sea x ∈ V (F). Existe un punto X ∈ F tal que x = PX. Como
F ⊆ G, tanto P como X están en G, luego PX = x ∈ V (G).
2
Sin embargo, veremos que hay subespacios afines F y G, en los que incluso
V (F) = V (G), que son disjuntos, con lo que ninguno pasa por el otro.
Proposición 248 Si G pasa por F 6= ∅ y los subespacios V (F) y V (G) son de
dimensión finita, se cumple que dim(F) ≤ dim(G). Si las dimensiones coinciden,
necesariamente F = G.
Demostracion:
La desigualdad dim(F) ≤ dim(G) se sigue del contenido V (F) ⊆ V (G). Si
dim(V (F)) = dim(V (G)), también V (F) = V (G), y, aplicando la proposición
246 con cualquier punto P de F, resulta que F = G.
2
20.10.
Incidencia de subespacios afines
Proposición 249 La intersección de dos subespacios afines F y G es no vacı́a
si y sólo si
∀X ∈ F, ∀Y ∈ F ⇒ XY ∈ V (F) + V (G).
Demostracion:
Si A ∈ F, B ∈ G, existen vectores u ∈ V (F), w ∈ V (G) tales que
AB = u + w ⇔ A + u = B − w,
en cuyo caso el punto P tal que
P=A+u=B−w
20.11.
Subespacios afines complementarios
297
está tanto en F como en G. Por ello, F ∩ G 6= ∅
Si existe al menos un P ∈ F ∩ G, dados X ∈ F , Y ∈ G, existen vectores
u ∈ V (F ), w ∈ V (G) tales que X = P + u, Y = P + w, en cuyo caso
XY = (P + w) − (P + u) = −u + w ∈ V (F) + V (G).
2
Proposición 250 La intersección de dos subespacios afines F y G es otro subespacio afı́n. Si éste no es vacı́o, está dirigido por V (F) ∩ V (G).
Demostracion:
Si F ∩ G = ∅, se trata de un subespacio afı́n. En caso contrario, sea P un
punto de F ∩ G. Usándolo como origen, podemos tomar
V (F) = {PX/X ∈ F}, V (G) = {PX/X ∈ G}, V (F ∩ G) = {PX/X ∈ F ∩ G}.
Entonces,
a) x ∈ V (F ∩ G) ⇒ ∃X ∈ F ∩ G/x = PX ⇒ x ∈ V (F), x ∈ V (G) ⇒
⇒ x ∈ V (F) ∩ V (G).
b) x ∈ V (F) ∩ V (G) ⇒ x ∈ V (F), x ∈ V (G) ⇒
⇒ ∃X ∈ F/x = PX, ∃Y ∈ G/x = PY.
Igualando los dos valores de x, debe ser X = Y , es decir, tenemos un punto
X ∈ F ∩ G tal que x = PX, por lo que x ∈ V (F ∩ G).
2
Dos subespacios afines F y G no disjuntos se dice que son incidentes, o, que
inciden en F ∩ G. La intersección se nombra como su corte.
20.11.
Subespacios afines complementarios
Dos subespacios afines F y G de E se dicen complementarios si lo son los
subespacios vectoriales V (F) y V (G), o sea, cuando V = V (F) ⊕ V (G).
Proposición 251 El corte de dos subespacios afines complementarios consta
de un punto y sólo uno.
Demostracion:
Puesto que V = V (F) + V (G), todo vector XY, con X ∈ F , Y ∈ G, está en
la suma V (F) + V (G), luego F ∩ G 6= ∅.
Siendo F ∩ G =
6 ∅, sabemos que V (F ∩ G) = V (F) ∩ V (G). Como ésta es
nula, F ∩ G tiene dimensión cero, luego es un punto.
2
Usando las proyecciones p y q (sección 7.6) de V sobre V (F) y V (G), esta
proposición prueba que el punto de corte C cumple
C = A + p(AB) = B − q(AB).
298
20.12.
Capı́tulo 20. Espacios Afines
Paralelismo de subespacios afines
Sea E un espacio afı́n y sean F, G dos subespacios afines no vacı́os de E. Se dice
que F es paralelo a G cuando V (F) ⊆ V (G).
Proposición 252 Sea p ≥ 1 un entero y sea E un espacio afı́n. La relación de
paralelismo entre los subespacios afines de dimensión p es de equivalencia.
Demostracion:
Si son de igual dimensión el contenido V (F) ⊆ V (G) de la definición se
convierte en igualdad. Entonces, el paralelismo hereda las propiedades reflexiva,
simétrica y transitiva de dicha igualdad.
2
Un subespacio p-dimensional F, junto a todos sus paralelos, define una dirección p-dimensional.
Proposición 253 Si F 6= ∅ es paralelo a G, entonces F ∩ G = ∅ o bien F ⊆ G.
Demostracion:
Si F ∩ G = ∅, no hay nada que probar. Si tienen un punto común P , F ∩ G
pasa por P y está dirigido por V (F) ∩ V (G) = V (F). Como también F pasa
por P y está dirigido por V (F), de la proposición 246 se sigue que F ∩ G = F,
lo que implica F ⊆ G.
2
El enunciado contrario es falso al menos en su primera alternativa. En efecto, si
G pasa por F, de la proposición 247 se sigue que F es paralelo a G. Pero puede
ser F ∩ G = ∅ sin que los subespacios sean paralelos como ocurre, por ejemplo,
con algunas aristas de un paralelepı́pedo del espacio tridimensional ordinario.
Cuando esto ocurre (subespacios disjuntos que no son paralelos) se dice que F
se cruza con G. Sin embargo, hay un caso particular en el que el enunciado
contrario es cierto:
Proposición 254 Si F es disjunto con un hiperplano G, entonces F es paralelo
a G.
Demostracion:
Probaremos que V (F) ⊆ V (G) por reducción al absurdo. Sea P un punto de
F y sea Q un punto de G. Si existe un vector u ∈ V (F) tal que u 6∈ V (G), por
ser V (G) un hiperplano, se tiene V =< u > ⊕V (G). Esto significa que la recta
que pasa por P y está dirigida por u (contenida en F) es un complemento de
G. Por tanto, esta recta (y también F) tiene un punto común con G, en contra
de que F ∩ G = ∅.
2
Proposición 255 Dos hiperplanos afines F y G son paralelos si y sólo si son
disjunto o coinciden.
20.13.
Proyecciones paralelas
299
Demostracion:
Si F ∩ G = ∅, son paralelos según la proposición 254; si F = G, son paralelos
por la propiedad reflexiva del paralelismo.
Si F es paralelo a G, según la proposición 253, o bien son disjuntos o bien G
pasa por F, pero por ser de la misma dimensión en realidad coinciden.
2
20.13.
Proyecciones paralelas
Proposición 256 Dado un subespacio afı́n G =
6 ∅, por cada punto X ∈ E pasa
un subespacio G(X) y sólo uno paralelo a G y de su misma dimensión.
Demostracion:
Sea G(X) el subespacio que pasa por X y está dirigido por V (G). Por construcción es paralelo a G y tiene su misma dimensión. Cualquier otro con estas
propiedades coincide con G(X) por la proposción 246.
2
Sean F y G dos subespacios complementarios. Dado un punto X ∈ E, sea G(X)
el subespacio de la proposición 256. Como G(X) también es complementario de
F, existe un único punto X 0 en F ∩ G(X). Ası́, la asociación X 7→ X 0 es una
aplicación de E sobre F. Se llama proyección de E sobre F paralelamente
a G. De acuerdo con lo indicado en la sección 20.11, se tendrá
X0 = A + p(AX),
donde A ∈ F y p es la proyección de V sobre V (F) paralelamente a V (G).
Ya que en la demostración de la proposición 256 sólo interviene V (G), la proyección sobre F no se altera si G se cambia por otro subespacio afı́n de su misma
dirección. Por eso, podemos usar también la expresión proyección de E sobre
F según la dirección de G. De igual forma se define la proyección sobre G
según la dirección de F.
20.14.
Combinaciones afines
Dados a0 , a1 , a2 , . . . , ar ∈ IK, P0 , P1 , P2 , . . . , Pr ∈ E, fijado un origen O ∈ E,
existirá un punto X tal que
OX = a0 OP0 + a1 OP1 + a2 OP2 + . . . + ar OPr .
Usando otro origen P 6= O, también habrá un punto Y ∈ E tal que
PY = a0 PP0 + a1 PP1 + a2 PP2 + . . . + ar PPr .
Ahora bien,
PO + OY = PY =
r
X
i=0
ai PPi =
r
X
i=0
ai (PO + OPi ) =
300
= PO
Capı́tulo 20. Espacios Afines
r
X
i=0
ai +
r
X
i=0
ai OPi = PO
r
X
r
X
ai + OX ⇒ OY = 0X + (
ai − 1)P0.
i=0
i=0
Ası́, al combinar linealmente los datos ai y Pi , pueden resultar puntos diferentes
si se cambia de origen. Pero también se observa que
X = Y ⇔ OX = OY ⇔ a0 + a1 + a2 + . . . + ar = 1,
es decir, que el punto X no varı́a cuando y sólo cuando la suma de los coeficientes
sea 1. Este hecho da entrada a la siguiente definición:
Dados a0 , a1 , a2 , . . . , ar ∈ IK tales que a0 + a1 + a2 + . . . + ar = 1, y dados
P0 , P1 , P2 , . . . , Pr ∈ E, el punto X tal que
X = a0 P0 + a1 P1 + a2 P2 + . . . + ar Pr ,
donde los vectores de posición se toman respecto de cualquier origen O prefijado, se dice que es combinación afı́n de P0 , P1 , P2 , . . . , Pr o que depende
afı́nmente de los puntos dados.
Si hay un solo punto dato P0 la propia definición obliga a que a0 = 1, o sea, la
única combinación afı́n posible es la X = P0 . Si hay más un punto, despejando
uno de los coeficientes, por ejemplo el a0 , las combinaciones afines se presentan
en la forma
X = P0 + a1 (P1 − P0 ) + a2 (P2 − P0 ) + . . . + ar (Pr − P0 ) =
= P0 + a1 P0 P1 + a2 P0 P2 + . . . + ar P0 Pr ⇔
⇔ P0 X = a1 P0 P1 + a2 P0 P2 + . . . + ar P0 Pr ,
donde ahora a1 , a2 , . . . , ar toman valores arbitrarios. Recı́procamente, si se parte
de una combinación lineal como ésta, tomando
a0 = 1 − a1 − a2 − . . . − ar .
se reconstruye una afı́n. Por tanto, el conjunto de combinaciones afines de
P0 , P1 , P2 , . . . , Pr ,se iguala con el conjunto de puntos X tales que
P0 X ∈< P0 P1 , P0 P2 , . . . , P0 Pr > .
Proposición 257 Dados los puntos P0 , P1 , P2 , . . . , Pr ∈ E, el conjunto
F = {X ∈ E/P0 X ∈< P0 P1 , P0 P2 , . . . , P0 Pr >}
de sus combinaciones afines es un subespacio afı́n, el cual pasa por los puntos
dados y está contenido en cualquier otro subespacio afı́n G que pase por ellos.
Demostracion:
Si r = 0, se tiene F = {P0 } que es un subespacio afı́n. Este, está trivialmente
contenido en cualquier subespacio G que pase por P0 .
20.14.
Combinaciones afines
301
Si r ≥ 1, hemos señalado que el conjunto de combinaciones afines de los
puntos dados es el
F = {X ∈ E/P0 X ∈ U}, donde U =< P0 P1 , P0 P2 , . . . , P0 Pr >
Tomando X = P0 , aparece el vector nulo de U, luego este punto está en F.
Entonces, según la proposición 245, F es un subespacio afı́n dirigido por U.
Como cada vector P0 Pi , donde i ≥ 1, pertenece a U, resulta que Pi ∈ F. Por
otra parte, si G es otro subespacio afı́n que pase por estos puntos, se cumple que
todos los vectores P0 Pi están en V (G). Por tanto,
V (F) =< P0 P1 , P0 P2 , . . . , P0 Pr >⊆ V (G) ⇒ F ⊆ G.
2
El subespacio F de las combinaciones afines de P0 , P1 , P2 , . . . , Pr se denota
< P0 , P1 , P2 , . . . , Pr >
y se nombra como subespacio afı́n generado por P0 , P1 , P2 , . . . , Pr .
Proposición 258 Un conjunto F 6= ∅ de puntos es un subespacio afı́n si y sólo
si cualquier combinación afı́n de puntos de F está en F.
Demostracion:
Fijemos un P ∈ F y sea U = {PX/X ∈ F}. Probaremos que U ≤ V:
Dados x, y ∈ U, existen puntos X, Y ∈ F tales que x = PX, y = PY. Entonces,
el punto Z tal que
PZ = PX + PY = PX + PY − PP
está en F por ser combinación afı́n de X, Y, P ∈ F. Por tanto,
x + y = PX + PY = PZ ∈ U,
luego la suma de vectores de U está en U.
Dados a ∈ IK y x ∈ U, existe X ∈ F tal que x = PX. Entonces, el punto Z
tal que
PZ = aPX = aPX + (1 − a)PP
está en F porque es combinación afı́n de X, P ∈ F . Por tanto,
ax = aPX = PZ ∈ U,
luego el producto de un escalar por un elemento de U está en U.
Recı́procamente Sea F 6= ∅ un subespacio afı́n y sean
P0 , P1 , P2 , . . . , Pr ∈ F. Como F pasa por sus propios puntos, de la proposición
257 se sigue que < P0 , P1 , P2 , . . . , Pr >⊆ F, luego cualquier combinación afı́n
de elementos de F está en F.
2
302
Capı́tulo 20. Espacios Afines
Proposición 259 Sea IK un cuerpo conmutativo de caracterı́stica distinta de
dos. Un subconjunto F 6= ∅ de E es un subespacio afı́n si y sólo si cualquier
combinación afı́n de dos puntos de F está en F.
Demostracion:
Fijemos un P ∈ F y sea U = {PX/X ∈ F}. Probaremos que U ≤ V.
Dados x, y ∈ U, existen puntos X, Y ∈ F tales que
x = PX, y = PY.
Entonces, el punto S tal que
PS = (PX + PY)/2
está en F porque es combinación afı́n de dos de sus puntos. También lo está,
por igual razón, el punto Z tal que
PZ = 2PS = 2PS − PP,
luego
x + y = PX + PY = 2PS = PZ ∈ U.
Dados a ∈ IK y x ∈ U, se observa que a x ∈ U de la misma manera que en
la proposición 258, pues en ella se ha usado una combinación de dos puntos.
Si F es subespacio afı́n, en la proposición 258 se ha probado que las combinaciones afines de puntos de F están en F. En particular, las de dos puntos lo
estarán.
2
20.15.
Dependencia e independencia afı́n
Dados a0 , a1 , a2 , . . . , ar ∈ IK, P0 , P1 , P2 , . . . , Pr ∈ E, si fijamos como en la sección anterior dos orı́genes O y P , podemos formar las combinaciones
a0 OP0 + a1 OP1 + a2 OP2 + . . . + ar OPr ,
a0 PP0 + a1 PP1 + a2 PP2 + . . . + ar PPr ,
obteniéndose
r
X
i=0
ai PPi =
r
X
i=0
ai (PO + OPi ) = PO
r
X
i=0
ai +
r
X
ai OPi .
i=0
En esta igualdad se observa que la anulación de una de las combinaciones lineales
no implica la de la otra. Esto ocurrirá si y sólo si la suma de los coeficientes, a
su vez, también es nula.
Los puntos P0 , P1 , P2 , . . . , Pr se dicen afı́nmente dependientes si existe una
combinación lineal
a0 P0 + a1 P1 + a2 P2 + . . . + ar Pr = 0, a0 + a1 + a2 + . . . + ar = 0,
20.15.
Dependencia e independencia afı́n
303
donde los vectores de posición se toman respecto de cualquier origen O prefijado,
en la cual haya al menos un coeficiente ai 6= 0.
En caso contrario, es decir, cuando la única combinación lineal
a0 P0 + a1 P1 + a2 P2 + . . . + ar Pr = 0, a0 + a1 + a2 + . . . + ar = 0,
es la que tiene todos sus coeficientes ai nulos, se dice que los puntos P0 , P1 , P2 , . . . , Pr
son afı́nmente independientes.
De la definición se deduce que un solo punto es afı́nmente independiente.
Proposición 260 Si r ≥ 1, los puntos P0 , P1 , P2 , . . . , Pr son afı́nmente dependientes o independientes a la vez que los vectores P0 P1 , P0 P2 , . . . , P0 Pr sean
linealmente dependientes o independientes.
Demostracion:
Si partimos de una combinación afı́n nula, como la suma de todos los coeficientes debe valer cero, tenemos
a0 = −a1 − a2 − . . . − ar ⇒ 0 = a0 P0 + a1 P1 + a2 P2 + . . . + ar Pr =
= a1 (P1 − P0 ) + a2 (P2 − P0 ) + . . . + ar (Pr − P0 ) =
= a1 P0 P1 + a2 P0 P2 + . . . + ar P0 Pr .
Si los vectores son dependientes, hay un i ≥ 1 para el que ai 6= 0, lo que implica
que P0 , P1 , P2 , . . . , Pr son afı́nmente dependientes. Recı́procamente, si se parte
de la dependencia afı́n, hay un ai 6= 0, con i ≥ 0; necesariamente debe ser i ≥ 1,
pues a1 = a2 = . . . = ar = 0 conllevarı́a que también a0 = 0; siendo ası́, esto
significa que P0 P1 , P0 P2 , . . . , P0 Pr son dependientes. Las implicaciones entre
la independencia lineal y la afı́n, se obtienen ahora por lo anterior.
2
Proposición 261 Si r ≥ 1, los puntos P0 , P1 , P2 , . . . , Pr , son afı́nmente dependientes si y sólo si uno de ellos es combinación afı́n de los demás.
Demostracion:
Si, por ejemplo, P0 es combinación de P1 , P2 , . . . , Pr , se tiene
P0 = a1 P1 + a2 P2 + . . . + ar Pr , a1 + a2 + . . . + ar = 1 ⇒
⇒ −P0 + a1 P1 + a2 P2 + . . . + ar Pr = 0, −1 + a1 + a2 + . . . + ar = 0,
luego se trata de puntos afı́nmente dependientes.
Si son afı́nmente dependientes, en la combinación
a0 P0 + a1 P1 + a2 P2 + . . . + ar Pr = 0,
304
Capı́tulo 20. Espacios Afines
hay al menos un ai 6= 0; si, por ejemplo, es a0 6= 0, podemos tomar
P0 = (−a1 /a0 )P1 + (−a2 /a0 )P2 + . . . + (−ar /a0 )Pr .
Ahora bien, como a0 + a1 + a2 + . . . + ar = 0, se tiene
(−a1 /a0 ) + (−a2 /a0 ) + . . . + (−ar /a0 ) = a0 /a0 = 1,
luego P0 es combinación afı́n de los restantes puntos.
2
Proposición 262 Si r ≥ 1, los vectores P0 , P1 , P2 , . . . , Pr , son afı́nmente independientes si y sólo si ninguno es combinación afı́n de los demás.
Demostracion:
Se obtiene por negación de la anterior proposición.
2
Proposición 263 Si P0 , P1 , P2 , . . . , Pr son afı́nmente independientes, existe un
subespacio afı́n r-dimensional y sólo uno que pasa por ellos.
Demostracion:
Si r = 0 basta tomar el subespacio {P0 }. Si r ≥ 1, el subespacio
F =< P0 , P1 , P2 , . . . , Pr >, dirigido por < P0 P1 , P0 P2 , . . . , P0 Pr >, pasa por
los puntos dados y, por la proposición 260, su dimensión será r. Si G es otro
subespacio que pasa por P0 , P1 , P2 , . . . , Pr , sabemos que F ⊆ G; si dim(G) = r,
según la proposición 248, es F = G.
2
Un punto P0 es afı́nmente independiente. Se determina a sı́ mismo en cuanto
subespacio afı́n de dimensión cero.
Si P0 y P1 son afı́nmente independientes, ninguno es combinación afı́n del otro,
luego son distintos. Sus combinaciones afines determinan una recta. Si
X ∈< P0 , P1 > se dice que está alineado con P0 y P1 .
Si P0 , P1 , P2 son independientes, por no ser ninguno combinación de los otros,
no pueden estar alineados. Sus combinaciones afines determinan un plano. Si
X ∈< P0 , P1 , P2 > se dice que es coplanario con P0 , P1 , P2 .
20.16.
Puntos medios y baricentros
Sea IK un cuerpo de caracterı́stica nula. Con dos puntos X, Y del espacio afı́n E
siempre podremos formar la combinación afı́n (X+Y)/2, la cual determinará un
punto único M tal que
M = (X + Y)/2.
Este recibe el nombre de punto medio de X e Y . Si X = Y , se tiene M = X.
Si X 6= Y , su punto medio está en la recta que determinan, y, en general, en
todo subespacio afı́n que pase por ellos.
20.17.
Complementos / Ejercicios
305
De igual manera, dados X1 , X2 , . . . , Xr ∈ E, existe un solo punto M tal que
M = (X1 + X2 + . . . + Xr )/r,
llamado baricentro de los puntos X1 , X2 , . . . , Xr . Por ser una combinación
afı́n, pertenece al subespacio < X1 , X2 , . . . , Xr > y a todo subespacio que pase
por los puntos dados.
En general, dados X1 , X2 , . . . , Xr ∈ E y dados a1 , a2 , . . . , ar ∈ IK, con la restricción a1 + a2 + . . . + ar 6= 0, existe un punto único M tal que
M = (a1 X1 + a2 X2 + . . . + ar Xr )/(a1 + a2 + . . . + ar ),
llamado baricentro de los puntos X1 , X2 , . . . , Xr dotados de las masas
a1 , a2 , . . . , ar , el cual tiene la propiedad de estar en todo subespacio que pase
por los puntos dados. En espacios afines reales, y tomando escalares ai > 0 (con
lo cual su suma es no nula), este concepto coincide con el centro de masas tal
como se define en la Mecánica.
20.17.
Complementos / Ejercicios
1. Se considera el cuerpo conmutativo IK = ZZ/5I
I
Z. Sean
c0 , c1 , c2 , c3 , c4
las funciones constantes de IK en sı́ mismo. En el conjunto V de pares
ordenados (ci , cj ) se definen las operaciones
(ci , cj ) + (ch , ck ) = (ci+h , cj+k ), a(ci , cj ) = (cai , caj ).
Comprobar que V se convierte en un espacio sobre IK. Sea E el conjunto
de pares (fi , fj ) de funciones, donde
fi (x) = x + i, i = 0, 1, 2, 3, 4.
Comprobar que la aplicación
E × E → V, de ley ϕ((fi , fj ), (fh , fk )) = (ch−i , ck−j )
convierte a E en un espacio afı́n sobre V.
2. Sea E un espacio afı́n. Sea (X1 , X2 , X3 ) una terna ordenada de puntos
alineados, para la cual sea X1 6= X3 . Si A es un punto de la recta R
que los contiene y u 6= 0 es un vector en la dirección de R, supuesto que
hayamos fijado un origen O para tomar vectores de posición, la ecuación
X = A + λu
ser una parametrización de R. Si para cada i = 1, 2, 3 es λi el parámetro correspondiente al punto Xi , llamamos razón simple de la terna (X1 , X2 , X3 )
al número
306
Capı́tulo 20. Espacios Afines
[X1 , X2 , X3 ] =
λ2 − λ1
.
λ3 − λ1
Razonar que este número es independiente del origen O e independiente
del punto A y el vector u usados. Interpretar este concepto en el caso de
espacios afines reales.
3. Sean A 6= B dos puntos. Sea X ∈< A, B >. Razonar que AX = [A, X, B]AB.
4. Sea E un espacio afı́n de dimensión n ≥ 2. Supongamos tres puntos no
alineados A, B, C ∈ E. Sea, dentro del plano < A, B, C >, R una recta
paralela a la < A, B >. Sean
M =< A, C > ∩R, N =< B, C > ∩R.
En estas condiciones, existen números α, β, γ tales que
CM = αCA, CN = βCB, MN = γAB.
Razonar que α = β = γ. (Este resultado es el clásico Teorema de Thales,
puesto en forma vectorial. Tomando módulos y quitado el caso en que R
se trace por C, se establece que el triángulo CAB es semejante al CM N ,
que es la forma habitual de presentarlo. El enunciado vectorial es mucho
más rico: puesto que podrı́amos escribir
M = C + γCA, N = C + γCB,
queda, bajo nuestras hipótesis, directamente establecido que
[C, M, A] = [C, N, B].
5. Un conjunto F 6= ∅ de E es un subespacio afı́n si y sólo si contiene a
cualquier baricentro de puntos de F.
6. Dado un triángulo de vértices A, B, C, comprobar que la recta que pasa
por los puntos medios de los lados AB y BC es paralela al lado CA.
7. Sea E un espacio afı́n real de dimensión finita n ≥ 2. Una cuaterna ordenada (A, B, C, D) de puntos coplanarios, distintos dos a dos, se dice
que define un cuadrilátero cuando no exista ninguna recta que contenga
a tres de ellos. Dado un cuadrilátero, y fijado cualquier origen O para
los vectores de posición, razonar que las cuatro siguientes condiciones son
equivalentes entre sı́:
a) AB = DC.
b) AD = BC.
c) A + C = B + D.
d ) (A + C)/2 = (B + D)/2.
20.17.
Complementos / Ejercicios
307
(En tal caso, se dice que el cuadrilátero es un paralelogramo). Interpretar
en términos geométricos cada una de estas relaciones.
8. Sea ABCD un cuadrilátero. Sea KLM N el cuadrilátero de sus puntos
medios. Razonar que éste es un paralelogramo.
9. Demostrar que las rectas trazadas desde el vértice de un paralelogramo a
los puntos medios de los lados opuestos, dividen una de las diagonales en
tres partes iguales.
308
Capı́tulo 20. Espacios Afines
309
Capı́tulo 21
Coordenadas en Espacios
Afines
21.1.
Sistemas de referencia. Coordenadas
Sea E un espacio afı́n de dimensión n ≥ 1. Un sistema de referencia (o
sistema de ejes) en E es un conjunto
S = {O; v1 , v2 , . . . , vn }
donde O ∈ E se conoce como origen del sistema y B = {v1 , v2 , . . . , vn }, base
de V, se conoce como base del sistema. Para cada i ∈ [1, n], la recta que pasa
por O y está dirigida por vi , se llama eje i-ésimo del sistema.
En cada eje puede buscarse un punto Ei tal que E0 Ei = vi , donde se ha puesto
E0 = O. Por su construcción, E0 , E1 , E2 , . . . , En son afı́nmente independientes. Recı́procamente, partiendo de n + 1 puntos E0 , E1 , E2 , . . . , En afı́nmente
independientes, se construye una referencia sin más que tomar
O = E0 , vi = E0 Ei , ∀i ∈ [1, n].
Dado un punto X, se llaman coordenadas de X en el sistema S a las coordenadas de su vector de posición X, respecto de O, en la base B. Es decir, serán
n números x1 , x2 , . . . , xn tales que
X = x1 v1 + x2 v2 + . . . + xn vn .
Si se dan dos puntos X e Y , puesto que XY = Y − X, las coordenadas de XY
se obtienen restando lugar a lugar las de su extremo y las de su origen.
Si un espacio vectorial se considera espacio afı́n sobre sı́ mismo, la forma más
simple de construir un sistema de referencia consiste en tomar una base cualquiera
y añadirle como origen el vector nulo.
310
Capı́tulo 21. Coordenadas en Espacios Afines
Si esto lo hacemos en los espacios cartesianos, tomando como base la canónica,
obtenemos el llamdo sistema de referencia canónico
{0 = (0, 0, . . . , 0); e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1)}
En este sistema de referencia el vector de posición de cada x coincide consigo mismo ya que x − 0 = x. Por tanto, las coordenadas de cada punto
x = (x1 , x2 , . . . , xn ) en él, como pasaba en tanto que espacios vectoriales, son
las propias componentes de la n-upla ordenada.
21.2.
Ecuaciones paramétricas de un subespacio
afı́n
Si F es un subespacio afı́n de dimensión finita p ≥ 1, los vectores de una base
A = {u1 , u2 , . . . , up } de V (F) se llaman vectores directores de F. Fijado
un origen O y un punto P ∈ F, para cada X ∈ F, es X = P + PX, y, como
PX ∈ V (F), este vector es combinación lineal de los vectores directores, luego,
existen unos parámetros λ1 , λ2 , . . . , λp tales que
X = P + λ1 u1 + λ2 u2 + . . . + λp up .
Esta es la ecuación paramétrico-vectorial del subespacio afı́n F.
Fijado una referencia S = {O; v1 , v2 , . . . , vn } en E y tomando vectores de posición respecto de O, para cada punto X ∈ F , se tiene
X = x1 v1 + x2 v2 + . . . + xn vn .
Para calcular cada xi a partir de los parámetros λj , basta conocer las coordenadas pi de P y las coordenadas αij de cada uj en S. Entonces,
X=
n
X
i=1
pi vi +
p
X
λj u j =
j=1
⇒ xi = pi +
n
X
(pi +
i=1
p
X
p
X
λj αij )vi =
j=1
n
X
xi vi ⇒
i=1
λj αij , ∀i ∈ [1, n].
j=1
Desarrollando estas igualdades, se obtienen las siguientes ecuaciones paramétricas del subespacio afı́n F en el sistema de referencia S:
x
= p1 +λ1 α11 +λ2 α12 + . . . +λp α1p
1
x2 = p2 +λ1 α21 +λ2 α22 + . . . +λp α2p
...
xn = pn +λ1 αn1 +λ2 αn2 + . . . +λp αnp
Tomando P0 = P y determinando unos Pj ∈ F tales que P0 Pj = uj , los
puntos serán independientes y se cumplirá F =< P0 , P1 , P2 , . . . , Pp >. Si,
21.2. Ecuaciones paramétricas de un subespacio afı́n
311
recı́procamente, partimos de p + 1 puntos independientes, cuando pongamos
P = P0 , uj = P0 Pj , la ecuación de F =< P0 , P1 , P2 , . . . , Pp > será la
X = P 0 + λ1 P 0 P 1 + λ2 P 0 P 2 + . . . + λp P 0 P p .
Para pasar a coordenadas se precisan unas igualdades
Pj = β1j v1 + β2j v2 + . . . + βnj vn , j ∈ [0, p],
a partir de las cuales obtenemos
x
1
x2
...
xn
= β10
= β20
+λ1 (β11 − β10 )
+λ1 (β21 − β20 )
+λ2 (β12 − β10 )
+λ2 (β22 − β20 )
+...
+...
+λp (β1p − β10 )
+λp (β2p − β20 )
= βn0
+λ1 (βn1 − βn0 ) +λ2 (βn2 − βn0 )
+...
+λp (βnp − βn0 )
Si F es una recta, dirigida por un vector no nulo
u = α1 v1 + α2 v2 + . . . + αn vn ,
las ecuaciones serán
x
1
x2
X = P + λu,
.
..
xn
= p1
= p2
+λ1 α
+λ2 α
= pn
+λn α
Si partimos de dos puntos P0 , P1 que sean afı́nmente independientes (es decir,
distintos), la recta que generan serı́a
x
= β10 +λ(β11 − β10 )
1
x2 = β20 +λ(β21 − β20 )
X = P0 + λP0 P1 ,
...
xn = βn0 +λ(βn1 − βn0 )
Si F es un plano afı́n, dirigido por dos vectores independientes
u = α1 v1 + α2 v2 + . . . + αn vn , v = β1 v1 + β2 v2 + . . . + βn vn ,
las ecuaciones son
x
1
x2
X = P + λu + µv,
.
..
xn
= p1
= p2
+λ1 α
+λ2 α
+µ1 β
+µ2 β
= pn
+λn α
+µn β
Si los datos son tres puntos P0 , P1 y P2 independientes (o sea, no alineados),
las ecuaciones del plano que generan son
x1 = β10 +λ(β11 − β10 ) +µ(β12 − β10 )
x2 = β20 +λ(β21 − β20 ) +µ(β22 − β20 )
X = P0 + λP0 P1 + µP0 P2 ,
...
xn = βn0 +λ(βn1 − βn0 ) +µ(βn2 − βn0 )
312
21.3.
Capı́tulo 21. Coordenadas en Espacios Afines
Ecuaciones implı́citas de un subespacio afı́n
Sea E un espacio afı́n de dimensión finita n ≥ 1. Sea F un subespacio afı́n de
dimensión p tal que 0 ≤ p < n y sea r = n − p. Entonces, existen r formas
σ1 , σ2 , . . . , σr linealmente independientes las cuales definen implı́citamente al
subespacio vectorial V (F). Dado P ∈ F, sabemos que
X ∈ F ⇔ PX ∈ V (F).
Esto quiere decir que
σ1 (PX) = σ2 (PX) = . . . = σr (PX) = 0
es un sistema de ecuaciones implı́citas del subespacio afı́n F. Tomando
vectores de posición respecto de cualquier origen O, se tiene
0 = σi (PX) = σi (X − P) = σi (X) − σi (P) ⇔ σi (X) = σi (P),
de manera que el sistema también puede presentarse en la forma
σ1 (X) = σ1 (P), σ2 (X) = σ2 (P), . . . , σr (X) = σr (P).
Si, para un sistema de referencia S de E, tomamos
aij = σi (vj ), bi = σi (P),
aparece un sistema lineal completo de r ecuaciones con n incógnitas:
a x
11 1
a21 x1
...
ar1 x1
+a12 x2
+a22 x2
+...
+...
+a1n xn
+a2n xn
= b1
= b2
+ar2 x2
+...
+arn xn
= br
En el caso p = n − 1, será r = 1. Es decir, un hiperplano afı́n H se define
mediante una sola ecuación σ(X) = σ(P), donde σ 6= σ0 es una forma tal que
Ker σ = V (H).
Volviendo a F, al ser las formas σj independientes, son no nulas y cada ecuación
σj (X) = σj (P) define un hiperplano que pasa por F. Ası́, F, de dimensión p,
se obtiene como corte de r = n − p hiperplanos que pasan por él.
Recı́procamente, el conjunto de puntos cuyas coordenadas verifiquen un determinado sistema lineal completo, será un subespacio afı́n, eventualmente vacı́o
si el sistema fuese incompatible. En caso contrario, resolviendo el sistema se
obtiene una parametrización del subespacio.
21.4. Incidencia en dimensión finita
21.4.
313
Incidencia en dimensión finita
Sean F y G dos subespacios afines, de dimensiones p y q, dentro de un espacio
afı́n E de dimensión finita n, en el que suponemos fijado un sistema de referencia
S. Sean P ∈ F , Q ∈ G y sean r = n − p, s = n − q.
La forma habitual para determinar el corte F ∩ G de estos dos subespacios
consiste en tomar un sistema de ecuaciones implı́citas
σ1 (X) = σ1 (P), σ2 (X) = σ2 (P), . . . , σr (X) = σr (P)
para F y otro
τ1 (X) = τ1 (Q), τ2 (X) = τ2 (Q), . . . , τs (X) = τs (Q)
para G. Juntándolos, tenemos un sistema de r + s ecuaciones lineales con n
incógnitas, que define implı́citamente al corte. Su estudio nos dirá si es vacı́o
o no, y, de no serlo, cuál su dimensión, a la vez que por resolución tendremos
unas ecuaciones paramétricas para el subespacio F ∩ G.
Este método tiene validez para más de dos subespacios: todos se pasan a ecuaciones implı́citas y se juntan las ecuaciones en un solo sistema. También se
podrı́a estudiar el corte de los dos primeros, a continuación el de éste con el tercero, y ası́ sucesivamente, de manera que en cada paso vamos cortando sólo dos
subespacios. Este proceder tendrı́a la ventaja de que si en algún paso se obtiene
un sistema incompatible, no hay que usar los restantes pues la intersección de
todos ellos necesariamente va a ser vacı́a. O que si en un determinado paso la
solución es un solo punto, basta comprobar si éste verifica o no los restantes
sistemas.
No obstante, señalemos un camino aún más corto de estudiar su corte. Consiste en tomar uno de los subespacios, por ejemplo el primero, en ecuaciones
paramétricas:
X = P + λ1 u1 + λ2 u2 + . . . + λp up
y obligar a que sus puntos verifiquen cada una de las ecuaciones implı́citas del
otro. Por la linealidad de cada τi se llega a que
λ τ (u ) +λ2 τ1 (u2 ) + . . . +λp τ1 (up ) = τ1 (PQ)
1 1 1
λ1 τ2 (u1 ) +λ2 τ2 (u2 ) + . . . +λp τ2 (up ) = τ2 (PQ)
...
λ1 τs (u1 ) +λ2 τs (u2 ) + . . . +λp τs (up ) = τs (PQ)
Ası́ tenemos un nuevo sistema en el que las incógnitas serán los parámetros, o
sea, un sistema con menos ecuaciones (porque no usamos las implı́citas primer
subespacio) y menos incógnitas (porque en cada subespacio hay menos parámetros que coordenadas) que el que obtendrı́amos por el procedimiento anterior.
Estudiado el sistema, si es compatible y obtenemos sus soluciones, retornamos
al subespacio dejado en paramétricas y al sustituir sus parámetros por las soluciones se tienen todos los puntos de corte. Se comprende que el subespacio
indicado para dejarlo en paramétricas es el de menor dimensión de los dos, por
aportar menos incógnitas, a la vez que el segundo menos ecuaciones.
314
Capı́tulo 21. Coordenadas en Espacios Afines
21.5.
Paralelismo en dimensión finita
Sigamos con dos subespacios F y G como los del apartado anterior y supongamos
que p = dim(F) ≤ dim(G) = q. Si tenemos ecuaciones paramétricas
X = P + λ1 u1 + λ2 u2 + . . . + λp up
X = Q + µ1 w1 + µ2 w2 + . . . + µq wq
en cada uno de ellos, la condición de paralelismo V (F) ⊆ V (G), se traduce de
manera general en que cada uno de los vectores ui directores de F ha de ser
combinación lineal de los vectores directores wj de G. Es decir, se ha de cumplir
que
rang{ui , w1 , w2 , . . . , wq } = q, ∀i ∈ [1, p].
Sin embargo, una vez más, es preferible dejar F en paramétricas y G en implı́citas. En efecto, como G se obtiene cortando todos los hiperplanos afines
τj (X) = τj (Q), cada uno de ellos dirigido por el hiperplano vectorial Ker τj ,
resulta que V (G) queda definido por
τ1 (x) = τ2 (x) = . . . = τs (x) = 0.
Entonces, la condición de paralelismo equivale a que
τ1 (ui ) = τ2 (ui ) = . . . = τs (ui ) = 0, ∀i ∈ [1, p].
En los casos de paralelismo, pues, el sistema en los parámetros de F planteado
en el apartado anterior para buscar F ∩ G se reduce a que
0 = τ1 (PQ), 0 = τ2 (PQ), . . . , 0 = τs (PQ)
y se comprende que si el sistema es compatible es porque
PQ ∈ V (G) ⇔ P ∈ G,
en cuyo caso (proposición 253), F está contenido en G. En cambio, si es incompatible, es decir, algún τj (PQ) 6= 0, los subespacios serán paralelos disjuntos.
Incluso, si G es un hiperplano, puede ser conveniente tomar también ecuaciones
implı́citas en F y estudiar el sistema
σ1 (X) = σ1 (P), σ2 (X) = σ2 (P), . . . , σr (X) = σr (P), τ (X) = τ (Q),
obtenido al juntar las ecuaciones de F con la τ (X) = τ (Q) del hiperplano. Se
trata de un sistema lineal completo de r +1 ecuaciones y n incógnitas. Entonces,
la condición de paralelismo se plasma en que
rang{σ1 , σ2 , . . . , σr , τ } = r,
es decir, en que la matriz del sistema sea de rango r. En efecto, si la matriz
ampliada también tiene rango r, el sistema es compatible y para la resolución la
última ecuación es superflua, con lo cual el corte vuelve a ser F y estamos en el
caso de subespacios paralelos incidentes. Por el contrario, si la matriz ampliada
tuviese rango r + 1 el corte es vacı́o y, según la proposición 254, se tratará de
subespacios paralelos disjuntos.
21.6. Posiciones relativas
21.6.
315
Posiciones relativas
Dados varios subespacios afines, estudiar su posición relativa es tanto como
buscar los cortes de cada dos de ellos o, en el caso de ser disjuntos, averiguar si
son paralelos o se cruzan. Este objetivo, pues, se auxilia de lo expuesto en los
dos últimos apartados. Por nuestra parte, tratataremos en detalle tres casos de
posiciones relativas:
1. Posición relativa de dos rectas Si tomamos las dos rectas en ecuaciones
paramétricas
X = P + λu, X = Q + µw,
los posibles puntos de corte, si los hay, deben verificar
P + λu = Q + µw ⇔ PQ = λu − µw,
que es un sistema de n ecuaciones y dos incógnitas. La matriz de coeficientes tiene como columnas a u y −w, mientras que la matriz ampliada
añade como columna el vector PQ. Entonces, caben cuatro opciones:
a) rang{u, w} = rang{u, w, PQ} = 1.
Por ser rang{u, w} = 1, las rectas son paralelas. La otra condición
indica que hay soluciones, luego las rectas coinciden.
b) rang{u, w} = 1, rang{u, w, PQ} = 2.
Las rectas son paralelas disjuntas. No hay inconveniente en tomar
w = u, y, puesto que u y PQ son independientes, podemos considerar
el plano
X = P + αu + βPQ,
que contiene a la primera recta (si β = 0) y a la segunda (si β = 1),
luego dos rectas paralelas disjuntas son coplanarias.
c) rang{u, w} = rang{u, w, PQ} = 2.
Las rectas inciden en un punto A, que se obtendrá resolviendo el
sistema. Como u y w son independientes, construı́mos el plano
X = A + αu + βw,
que contiene a ambas rectas, luego también las rectas incidentes son
coplanarias.
d ) rang{u, w} = 2, rang{PQ, u, w} = 3.
Las rectas no son paralelas porque u y v son independientes y son
disjuntas porque el sistema es incompatible. Por tanto, se cruzan.
2. Posición relativa de recta e hiperplano. Tomando la recta en paramétricas y el hiperplano en implı́citas,
X = P + λu, τ (X) = τ (Q),
316
Capı́tulo 21. Coordenadas en Espacios Afines
llevando los puntos de la recta a la ecuación del hiperplano se obtiene
λτ (u) = τ (PQ),
sistema de n ecuaciones con una sola incógnita. Caben tres opciones:
a) τ (u) = τ (PQ) = 0.
La ecuación se verifica independientemente del valor de λ, luego son
paralelos y la recta está está contenida en el hiperplano.
b) τ (u) = 0, τ (PQ) 6= 0.
La recta es paralela y disjunta al hiperplano, pues el sistema es incompatible.
c) τ (u) 6= 0.
El sistema es compatible con una solución λ = τ (PQ)/τ (u). Es decir,
la recta incide en un A punto del hiperplano, siendo
A=P+
τ (PQ)
u.
τ (u)
3. Posición relativa de dos hiperplanos Usando sus ecuaciones implı́citas,
hay que estudiar el sistema
σ(X) = σ(P), τ (X) = τ (Q)
de dos ecuaciones y n incógnitas. Su matriz tiene como filas a σ y τ , y la
matriz ampliada añade como columna el vector (σ(P), τ (Q)). Entonces,
se presentan tres posibilidades:
a) rang{σ, τ } = rang{[σ, σ(P )], [τ, τ (Q)]} = 1.
Es compatible con soluciones de dimensión n−1, luego los hiperplanos
coinciden.
b) rang{σ, τ } = 1, rang{[σ, σ(P )], [τ, τ (Q)]} = 2.
Los hiperplanos son paralelos porque rang{σ, τ } = 1, pero son disjuntos porque el sistema es incompatible.
c) rang{σ, τ } = 2.
Los hiperplanos no son paralelos y se cortan en un subespacio afı́n
de dimensión n − 2, definido implı́citamente por el propio sistema.
21.7.
Dependencia e independencia afı́n en dimensión finita
Sean P0 , P1 , P2 , . . . , Pr ∈ E, donde E es un espacio afı́n de dimensión finita n
con un sistema de referencia S. Si r = 0, sabemos que el punto es independiente
21.7. Dependencia e independencia afı́n en dimensión finita
317
y que la única combinación afı́n posible es la X = P0 . Por ello, supondremos
que r ≥ 1. Siendo,
Pj = β1j v1 + β2j v2 + . . . + βnj vn , j ∈ [0, r],
X = x1 v1 + x2 v2 + . . . + xn vn
queremos estudiar la dependencia o independencia los puntos Pj , ası́ como saber
cuándo X es combinación afı́n de ellos.
La primera cuestión, según la proposición 260, se reduce a la dependencia o
independencia lineal de P0 P1 , P0 P2 , . . . , P0 Pr . Para ello formamos la matriz
β11 − β 10 β12 − β 10 . . . β1r − β 10
β21 − β 20 β22 − β 20 . . . β2r − β 20
..
..
..
.
.
.
βn1 − β n0 βn2 − β n0 . . . βnr − β n0
y calculamos su rango. Si obtenemos r, todos los puntos son independientes. Si es
un número s < r, seleccionamos s columnas independientes. Si por ejemplo son
las s primeras, los puntos P0 , P1 , P2 , . . . , Ps serán independientes. Cada una de
las columnas restantes, con lugar s + j, es combinación lineal de las s primeras,
luego P0 Ps+j depende de los vectores P0 P1 , P0 P2 , . . . , P0 Ps , lo que equivale
a que Ps+j sea combinación afı́n de P0 , P1 , P2 , . . . , Ps . Es decir, a efectos de
generación, se tendrá que
< P0 , P1 , P2 , . . . , Pr >=< P0 , P1 , P2 , . . . , Ps > .
Para la segunda, supondremos que los puntos son independientes, pues de lo
contrario les aplicarı́amos el proceso de depuración que acabamos de indicar.
Decir que X depende de P0 , P1 , P2 , . . . , Pr es igual que decir que P0 X depende
de P0 P1 , P0 P2 , . . . , P0 Pr , luego la matriz
β11 − β 10 β12 − β 10 . . . β1r − β 10 x1 − β 10
β21 − β 20 β22 − β 20 . . . β2r − β 20 x2 − β 20
..
..
..
..
.
.
.
.
βn1 − β n0 βn2 − β n0 . . . βnr − β n0 xn − β n0
debe seguir teniendo rango r.
En algunos textos estas cuestiones se abordan directamente con las definiciones
de estos conceptos. La dependencia o independencia equivale a estudiar las soluciones del sistema homogéneo
ξ0 P0 + ξ1 P1 + ξ2 P2 + . . . + ξr Pr = 0, ξ0 + ξ1 + ξ2 + . . . + ξr = 0,
de n + 1 ecuaciones con r + 1 incógnitas y matriz igual a
1
1
1
...
1
β 10 β 11 β 12 . . . β 1r
β 20 β 21 β 22 . . . β 2r .
.
.
.
.
.
..
..
..
.
β n0 β n1 β n2 . . . β nr
318
Capı́tulo 21. Coordenadas en Espacios Afines
Es fácil ver que su rango es una unidad mayor que el de la matriz de columnas
P0 P1 , P0 P2 , . . . , P0 Pr y que las conclusiones que se deriven de una u otra son
equivalentes.
En el caso r = n, la matriz es cuadrada y entonces la condición
¯
¯ 1
¯
¯ β 10
¯
¯ β 20
¯ .
¯ .
¯ .
¯
β n0
1
β 11
β 21
..
.
1
β 12
β 22
..
.
β n1
β n2
¯
1 ¯
¯
β 1n ¯
¯
β 2n ¯ 6= 0
.. ¯¯
. ¯
¯
. . . β nn
...
...
...
aparece como criterio para asegurar que P0 , P1 , P2 , . . . , Pn sean n puntos afı́nmente
independientes, o sea, definan un sistema de referencia del espacio E. La anulación del determinante asegurarı́a que al menos un punto es combinación afı́n
de los otros.
En particular, si tenemos n puntos independientes P1 , P2 , . . . , Pn , éstos determinan un hiperplano formado por sus combinaciones afines de ellos, es decir,
por los puntos X tales que
¯
¯ 1
¯
¯ x1
¯
¯ x2
¯ .
¯ .
¯ .
¯
xn
1
β 11
β 21
..
.
1
β 12
β 22
..
.
β n1
β n2
¯
1 ¯
¯
β 1n ¯
¯
β 2n ¯ = 0
.. ¯¯
. ¯
¯
. . . β nn
...
...
...
Esta es la llamada ecuación de un hiperplano en forma de determinante,
que sirve para la ecuación de la recta que pasa por dos punto distintos de un
espacio bidimensional, o para el plano que pasa por tres puntos no alineados de
un espacio tridimensional.
21.8.
Complementos / Ejercicios
1. Fijada una referencia S = {O; v1 , v2 , . . . , vn } en E, sea
a1 x1 + a2 x2 + . . . + an xn = b
la ecuación de un hiperplano afı́n H. Precisar el significado geométrico
de cada una de las siguientes relaciones ai = 0, ai 6= 0, b = 0, b 6= 0.
Suponiendo que a1 6= 0, a2 6= 0, . . . , an 6= 0, b 6= 0, comprobar que existen
unos números αi de manera que
x1 /α1 + x2 /α2 + . . . + xn /αn = 1
es una ecuación de H (Se conoce como ecuación canónica en el sistema
S). ‘?Qué significado geométrico tiene cada número αi ?
21.8. Complementos / Ejercicios
319
2. Sea E un espacio afı́n de dimensión n ≥ 2. Sea F un subespacio afı́n de
dimensión n − 2. Se llama haz de hiperplanos de arista (o vértice en
el caso n = 2) F al conjunto de todos los hiperplanos que pasan por F.
Obtener la ecuación del haz a partir de las ecuaciones de dos de ellos H y
K que sean distintos.
3. El plano afı́n IR2 se supone referido a su sistema canónico de ejes. Resolver
los siguientes ejercicios:
a) Ecuación canónica de la recta que pasa por (2, 3) y (5, −1).
b) Ecuación de la recta que pasa por el punto (5, −1) y es paralela a la
determinada por los puntos (2, 0) y (0, 3).
c) Ecuación de la recta que pasa por (2/3, 8/3) y por el punto de corte
de las rectas 3x − 5y = 11, 4x + y = 7.
d ) Ecuación del haz de rectas de vértice P = (3, 2). ¿Qué recta del haz
pasa por (2, 3)? ¿Cuál es paralela a la recta 4x − 5y = 2?
e) Calcular el número a con la condición de que las tres rectas
3x + ay = 7, 3x + y = 14, 8x + 2y = 28
pasen por un mismo punto.
f ) Se sabe que el punto A = (3, 2) es vértice de un paralelogramo, dos
de cuyos lados se apoyan en las rectas
2x + 3y − 6 = 0, x − 3y + 6 == 0.
Obtener las ecuaciones de los otros dos lados y las coordenadas de
los restantes vértices.
g) Los puntos (1, 1) y (2, 3) se unen, respectivamente, con los puntos
(0, t) y ((t − 1)/t, 0). Las rectas obtenidas se cortan en el punto X.
Hallar las ecuaciones del lugar geométrico descrito por X al dar distintos valores al parámetro t. ¿Qué ocurre si t tiende a 0? ¿Qué valores
de t debieran descartarse?
4. El espacio afı́n IR3 se supone referido a su sistema canónico de ejes. Resolver los siguientes ejercicios:
a) Ecuación canónica del plano determinado por el punto (1, 1, 2) y el
par de vectores (1, 2, 1) y (1, 3, 2).
b) Obtener un plano que sea paralelo a la recta
x + y − 2z + 1 = 0, 2x + y + z + 2 = 0,
y pase por los puntos (2, 0, 4), (1, 2, 5).
c) Ecuaciones de la recta que pasa por el punto (4, 2, −1) y es paralela
a cada uno de los siguientes planos:
5x + 4y + 2z + 5 = 0, 2x + 3y + 5z − 1 = 0.
320
Capı́tulo 21. Coordenadas en Espacios Afines
d ) Dada la recta que pasa por el punto (1, 0, −1) y tiene la dirección
del vector (0, 1, 5), obtener la ecuación de su haz de planos. De todos
ellos, encontrar el que pasa por el punto (1, 1, 1) y el que sea paralelo
al plano 2x − 5y + z + 2 = 0.
e) Estudiar la intersección de la recta
x = 1 + 2t, y = 2 − t, z = 3 + t
con el plano 2x+y −z +1 = 0, calculando las coordenadas del posible
punto de corte.
f ) Comprobar que la recta
x = 1 + γ, y = −1 − γ, z = 3
es paralela al plano
x = 1 + α − β, y = 2 − α + β, z = 3 + α − 2β.
g) Estudiar la posición relativa de las rectas
x + 2y − z + 5 = 0, x − 3y + z + 2 = 0,
x − y + z = 0, x + y − z + 5 = 0.
h) Comprobar que la recta R y el plano P, de ecuaciones
X(t) = (1 − t, 2 + t, 1 + 2t),
X(λ, µ) = (2λ − µ, 1 + λ, 2 + λ + µ),
son complementarios. Obtener su corte. Dado el punto M = (2, −1, 5),
buscar su proyectado sobre el plano paralelamente a la recta y su
proyectado sobre la recta paralelamente al plano.
5. El espacio afı́n IR4 se supone referido a su sistema canónico de ejes. Resolver los siguientes ejercicios:
a) Ecuación canónica del hiperplano que pasa por (1, 0, 1, 0) y es paralelo
al de ecuación 2x − y + z − 2t = 5.
b) Obtener las ecuaciones implı́citas del plano afı́n
x = 1 + α − β, y = 2α + 3β, z = 2 − α, t = −1 − α + 2β.
c) Obtener las ecuaciones paramétricas del subespacio afı́n F dado como
corte de los hiperplanos
x + y − z + t = 0, 2x − y + t + 1 = 0, x − 2y + z + 1 = 0,
razonando previamente que es de dimensión 2. Estudiar si algún
hiperplano del haz de arista F pasa por la recta
(1 + 3λ, 2λ, −2 + λ, λ).
En caso afirmativo, obtenerlo.
21.8. Complementos / Ejercicios
321
d ) Ecuaciones paramétricas e implı́citas del subespacio afı́n F que pasa
por los puntos
A0 = (0, 1, 2, 3),
A1 = (2, 1, −1, 0), A2 = (0, 1, −1, 0), A3 = (1, 1, 1, −1), A4 = (3, 1, −1, 0).
Estudiar su corte con el hiperplano H
x−y−z+t=0
y obtener las ecuaciones paramétricas de la intersección.
6. El espacio afı́n IR4 se supone referido a su sistema canónico de ejes. Estudiar la posición relativa de la recta
R : x = 1 + λ, y = 2 − λ, z = λ, t = λ
con cada uno de los siguientes planos P:
a) 2x + z − 3t = 2, y + z = 2.
b) x = 2α − β, y = 3 − α, z = −1 + α + β, t = −1 + β.
c) 3x + 3y + 4z − 4t = 6, y + z = 0.
d ) 3x + 3y + 4z − 4t = 6, 2x + 2y + 3z = 0.
322
Capı́tulo 21. Coordenadas en Espacios Afines
323
Capı́tulo 22
Aplicaciones Afines
22.1.
Traslaciones en un espacio afı́n
Sea E un espacio afı́n sobre el espacio vectorial V y sea u un vector fijo de V.
La aplicación
Tu : E → E, de ley X 7→ X 0 /XX0 = u,
recibe el nombre de traslación según el vector u. La imagen X 0 = Tu (X)
se nombra como el punto trasladado de X según el vector u. Si se fija un
origen de vectores de posición, de la igualdad XX0 = u se pasa a la
X0 = X + u,
que se conoce como ecuación vectorial de la traslación. El conjunto de todas
las traslaciones de E se denotará como
T (E, IK).
Proposición 264 La composición de dos traslaciones conmuta y es otra traslación.
La identidad es una traslación. Toda traslación es biyectiva y su inversa es otra
traslación. Además,
∀u, v ∈ V ⇒ Tv ◦ Tu = Tu+v , IE = T0 , (Tu )−1 = T−u .
Demostracion:
Sea X ∈ E.
a) Sean X 0 = Tu (X) y X 00 = Tv (X 0 ). Entonces
XX00 = XX0 + X0 X00 = u + v ⇒
⇒ Tu+v (X) = X 00 = Tv (X 0 ) = Tv (Tu (X)) = (Tv ◦ Tu )(X) ⇒
324
Capı́tulo 22. Aplicaciones Afines
⇒ Tu+v = Tv ◦ Tu .
Como la suma de vectores es conmutativa, se tiene
Tv ◦ Tu = Tu+v = Tv+u = Tu ◦ Tv .
b) XX = 0 ⇒ T0 (X) = X = IE (X) ⇒ T0 = IE .
c) Aplicando los dos resultados anteriores, tenemos
T−u ◦ Tu = T−u+u = T0 = I ⇒ T−u = (Tu )−1 .
2
Proposición 265 Si una traslación Tu admite al menos un punto doble X, se
cumple que u = 0. Por tanto, Tu = T0 = IE .
Demostracion:
Si Tu (X) = X, se tiene u = XX = 0.
2
Proposición 266 El conjunto T (E, IK) es un subgrupo conmutativo del grupo
simétrico S(E), isomorfo al grupo aditivo del espacio vectorial V.
Demostracion:
La primera afirmación es consecuencia inmediata de la proposición 264. Considerando la aplicación T : V → S(E), de ley T : u → Tu , esa misma proposición
permite escribir
T (u + v) = Tu+v = Tv ◦ Tu = T (v) ◦ T (u),
lo que prueba que T es un morfismo de grupos. Habida cuenta de que la identidad
posee puntos dobles (de hecho, todos), aplicando la proposición 265, obtenemos
u ∈ Ker T ⇒ T (u) = Tu = IE ⇒ u = 0 ⇒ Ker T = {0},
o sea, T es inyectiva y establece un isomorfismo de V sobre Im T . Pero, de la
definición de T , se tiene que Im T = T (E, IK), luego V ≃ T (E, IK).
2
Proposición 267 Dados dos puntos X, X 0 ∈ E, existe una traslación Tu y sólo
una tal que Tu (X) = X 0 .
Demostracion:
Siendo u = XX0 , por propia construcción se cumple Tu (X) = X 0 . Si v es un
vector tal que Tv (X) = X 0 , por la definición de traslación, se tiene v = XX0 = u.
2
22.2.
El concepto de aplicación afı́n
22.2.
325
El concepto de aplicación afı́n
Sean E y E 0 dos espacios afines, dirigidos respectivamente por los espacios vectoriales V y V0 , ambos sobre el mismo cuerpo conmutativo IK. Sea una aplicación
f : E → E 0.
Para cada vector x ∈ V podemos tomar diversas parejas de puntos X, Y ∈ E
tales que x = XY y con cada una formar el vector x0 = X0 Y0 ∈ V0 , donde
X 0 = f (X), Y 0 = f (Y ). La asociación de x con x0 establece una correspondencia
h entre V y V0 . Esta, no tiene por qué ser ni siquiera una aplicación, y aún
siéndolo pudiera no ser lineal.
Supongamos que sı́ sea una aplicación h : V → V0 y que sea lineal. Entonces,
tendrı́amos
x0 = ϕ0 (f (X), f (Y )),
donde ϕ0 : E 0 × E 0 → V0 es la aplicación que define a E 0 como espacio afı́n sobre
V0 , mientras que por otro lado
x0 = h(x) = h(ϕ(X, Y )),
donde ϕ : E × E → V es la aplicación que define a E como espacio afı́n sobre V.
Tomando como datos los puntos X, Y ∈ E, esto querrı́a decir que
ϕ0 (f (X), f (Y )) = h(ϕ(X, Y )), o bien, f (X)f (Y) = h(XY),
si presuponemos la alusión a ϕ y ϕ0 . Esta igualdad cabe interpretarla en el
sentido de que f es compatible con las estructuras afines de E y E 0 por cuanto es
indiferente pasar los puntos X e Y al segundo espacio y en éste formar el vector
libre X0 Y0 que formar previamente el vector libre XY y pasarlo después a V0
mediante una aplicación, la h, que es compatible con las estructuras vectoriales.
Además, esta h es única, pues de haber otra aplicación lineal k : V → V0 con
la misma propiedad, tomando un vector genérico x ∈ V, determinamos puntos
X, Y ∈ E tales que x = XY y resulta
k(x) = k(XY) = f (X)f (Y) = h(XY) = h(x) ⇒ k = h.
Se dice que f : E → E 0 es un morfismo afı́n o una aplicación afı́n si existe
una aplicación lineal fe : V → V0 tal que
∀X, Y ∈ E ⇒ f (X)f (Y) = fe(XY).
La aplicación fe, única, según acabamos de ver, se conoce como la aplicación
lineal asociada de la aplicación afı́n f .
Siendo f un morfismo afı́n, usaremos la siguiente terminologı́a: monomorfismo
afı́n si f es inyectiva, epimorfismo afı́n si f es suprayectiva, isomorfismo afı́n
si f es biyectiva, endomorfismo afı́n de E si E 0 = E, automorfismo afı́n de
E cuando E 0 = E y f es isomorfismo afı́n, forma afı́n en E cuando f : E →
IK. Los automorfismos afines también reciben el nombre de transformaciones
afines, o afinidades del espacio E. El conjunto de todas ellas se anotará como
Af (E, IK).
326
Capı́tulo 22. Aplicaciones Afines
22.3.
Aplicaciones afines entre espacios vectoriales
Sean V y V0 dos espacios vectoriales sobre IK. Si cada uno de ellos lo consideramos como espacio afı́n, una aplicación f : V → V0 será afı́n cuando exista una
aplicación lineal fe : V → V0 tal que
∀x, y ∈ V ⇒ f (y) − f (x) = fe(y − x).
Esta definición fue adelantada en la sección 10.11 para las aplicaciones afines
entre espacios vectoriales.
22.4.
Ejemplos de morfismos afines
Proposición 268 Toda aplicación constante entre espacios afines es afı́n y su
aplicación lineal asociada es la aplicación lineal nula entre sus espacios vectoriales directores. Recı́procamente, toda aplicación afı́n que admita a ésta como
aplicación lineal asociada, es constante.
Demostracion:
Sea P 0 ∈ E 0 y sea f : E → E 0 la aplicación constante f (X) = P 0 . Sea h0 la
aplicación lineal nula entre V y V0 . Entonces, la relación
f (X)f (Y) = P0 P0 = 0 = h0 (XY),
prueba que f es afı́n y que fe = h0 .
Si f es una aplicación afı́n tal que fe = h0 , se tiene
f (X)f (Y) = h0 (XY) = 0 ⇒ f (X) = f (Y ) ⇒ f es constante.
2
fu = IV . Recı́procaProposición 269 Toda traslación Tu es una afinidad y T
mente, si una afinidad f : E → E cumple que Te = IV , se trata de una traslación.
Demostracion:
Dados dos puntos X, Y ∈ E, sus imagenes X 0 , Y 0 mediante Tu cumplen
XX0 = u = YY0 ⇒ X0 Y0 = XY = IV (XY).
Esto prueba que Tu es afı́n y que Te = IV . Como es biyectiva (proposición 264),
se trata de una afinidad del espacio E.
Sea f una aplicación afı́n tal que fe = IV . Fijado un punto O ∈ E, sea Tu , la
traslación que cambia O en f (O), es decir, de acuerdo con la proposición 264,
u = Of (O). Entonces,
f (O)f (X) = fe(OX) = IV (OX) = OX ⇒ u = Of (O) = Xf (X) ⇒
22.5.
Composición e inversión de aplicaciones afines
327
⇒ f (X) = Tu (X) ⇒ f = Tu .
2
Proposición 270 Sean F y G dos subespacios afines de E complementarios.
Sea p : E → F la proyección sobre F paralelamente a G y sea pe : V → V (F)
el proyector lineal sobre V (F) paralelamente a V (G). Entonces, p es afı́n y su
aplicación lineal asociada es pe.
Demostracion:
Fijemos un origen O ∈ E y un punto A ∈ F. Dado un punto arbitrario X,
sabemos (sección 20.13) que su imagen X 0 = p(X) viene dada por la fórmula
X0 = A + pe(AX). Entonces, por ser pe lineal, se tiene
X0 Y0 = Y0 − X0 = A + pe(AY) − A − pe(AX) =
pe(AY) − pe(AX) = pe(AY − AX) = pe(XY).
2
22.5.
Composición e inversión de aplicaciones
afines
Proposición 271 Dadas dos aplicaciones afines f : E → E 0 , g : E 0 → E 00 , su
compuesta g ◦ f : E → E 00 es afı́n y se cumple gg
◦ f = ge ◦ fe
Demostracion:
Dados X, Y ∈ E, por ser ge ◦ fe lineal, se tiene
(g ◦ f )(X)(g ◦ f )(Y) = g(f (X))g(f (Y)) = ge(f (X)f (Y)) =
ge(fe(XY)) = (e
g ◦ fe)(XY) ⇒ gg
◦ f = ge ◦ fe.
2
Proposición 272 La identidad IE : E → E es afı́n y se cumple IeE = IV .
Demostracion:
Dados X, Y ∈ E, por ser IV lineal, se tiene
IE (X)IE (Y) = XY = IV (XY) ⇒ IeE = IV .
2
Proposición 273 Una aplicación afı́n f : E → E 0 es inyectiva si y sólo si lo es
su aplicación lineal asociada.
328
Capı́tulo 22. Aplicaciones Afines
Demostracion:
Sea fe inyectiva y sean X, Y ∈ E tales que f (X) = f (Y ). Entonces,
0 = f (X)f (Y) = fe(XY) ⇒ XY = 0 ⇒ X = Y,
lo que prueba que f es inyectiva.
Sea f inyectiva y sea x ∈ V tal que fe(x) = 0. Tomando puntos X e Y de E
para los cuales x = XY, se tiene
O = fe(XY) = f (X)f (Y) ⇒ f (X) = f (Y ) ⇒ X = Y ⇒ x = XY = 0,
luego fe es inyectiva.
2
Proposición 274 Una aplicación afı́n f : E → E 0 es suprayectiva si y sólo si
lo es su aplicación lineal asociada.
Demostracion:
Fijemos un origen O ∈ V.
Dado X 0 ∈ E 0 , sea x0 = f (O)X0 ∈ V0 . Por ser fe suprayectiva, existe x ∈ V
tal que fe(x) = x0 . También existirá un punto X ∈ E para el cual x = OX.
Entonces, f es suprayectiva porque
f (O)X0 = x0 = fe(x) = fe(OX) = f (O)f (X) ⇒ X 0 = f (X).
Dado x0 ∈ V0 , existe un punto X 0 ∈ E 0 para el cual x0 = f (O)X0 . Por ser f
suprayectiva, existe también un X ∈ E tal que f (X) = X 0 . Siendo x = OX ∈ V,
fe es suprayectiva porque
x0 = f (O)X0 = f (O)f (X) = fe(OX) = fe(x).
2
Proposición 275 Una aplicación afı́n f : E → E 0 es biyectiva si y sólo si lo es
su aplicación lineal asociada.
Demostracion:
Basta unir las dos proposiciones anteriores.
2
Proposición 276 La inversa f −1 : E 0 → E de una aplicación afı́n biyectiva
−1 ) = (fe)−1 .
f : E → E 0 es afı́n y se cumple (fg
Demostracion:
Si f es biyectiva, su aplicación lineal asociada lo es, luego la aplicación
(fe)−1 existe y es lineal. Dados X 0 , Y 0 ∈ E 0 , sean X, Y ∈ E tales que f (X) = X 0 ,
f (Y ) = Y 0 . Entonces,
f −1 (X0 )f −1 (Y0 ) = XY = ((fe)−1 ◦ fe)(XY) = (fe)−1 (fe(XY)) =
−1 ) = (fe)−1 .
= (fe)−1 (f (X)f (Y)) = (fe)−1 (X0 Y0 ) ⇒ (fg
2
22.6.
Ecuación vectorial de una aplicación afı́n
22.6.
329
Ecuación vectorial de una aplicación afı́n
Fijando dos orı́genes O ∈ E y O0 ∈ E 0 para vectores de posición, resulta
fe(X) = fe(OX) = f (O)f (X) = O0 f (X) − O0 f (O) = f (X) − f (O) ⇒
⇒ f (X) = fe(X) + f (O).
Esta igualdad se conoce como ecuación vectorial de la aplicación afı́n f
respecto de los orı́genes O y O0 .
Proposición 277 Dadas dos aplicaciones afines f : E → E 0 , g : E 0 → E 00 ,
fijando orı́genes O ∈ E, O0 ∈ E 0 y O00 ∈ E 00 , se cumple
g(f (X)) = ge(fe(X)) + ge(f (O)) + g(O0 ).
Demostracion:
Para los orı́genes O y O00 , la ecuación de g ◦ f serı́a
g(f (X)) = (gg
◦ f )(X) + g(f (O)).
De la proposición 271 sabemos que
(gg
◦ f )(X) = (e
g ◦ fe)(X) = ge(fe(X)).
Aplicando al punto f (O) la ecuación g(X0 ) = ge(X0 ) + g(O0 ) de g, se obtiene
g(f (O)) = ge(f (O)) + g(O0 ).
2
Proposición 278 Fijando orı́genes O ∈ E y O0 ∈ E 0 , la aplicación inversa
f −1 : E 0 → E de una afı́n y biyectiva f : E → E 0 verifica que
f −1 (X0 ) = (fe)−1 (X0 ) − (fe)−1 (f (O)).
Demostracion:
Para los orı́genes O y O0 , la ecuación de f −1 serı́a
−1 )(X0 ) + f −1 (O0 ).
f −1 (X0 ) = (fg
−1 )(X0 ) = (fe)−1 (X0 ). Aplicando la fórmuDe la proposición 276 sabemos que (fg
la de la proposición 277 a la composición f −1 ◦ f = IE , tenemos
f −1 (f (O)) = (fe)−1 (f (O)) + f −1 (O0 ) = IE (O) = 0 ⇒ f −1 (O0 ) = −(fe)−1 (f (O)).
2
330
Capı́tulo 22. Aplicaciones Afines
22.7.
Determinación y descomposición de aplicaciones afines
Proposición 279 Dada una aplicación lineal h : V → V0 y dados dos puntos
O ∈ E y P 0 ∈ E 0 , existe un morfismo afı́n f : E → E 0 y sólo uno tal que
fe = h, f (O) = P 0 .
Demostracion:
Dado X ∈ E, hay un único x ∈ V tal que x = OX y un único X 0 ∈ E 0 tal
que P0 X0 = h(x). Ası́ se establece una aplicación f : X → X 0 entre E y E 0 ,
la cual, por su definición, cumple que P0 f (X) = h(OX). Tomando dos puntos
X, Y ∈ E, se tiene
f (X)f (Y) = P0 f (Y) − P0 f (X) = h(OY) − h(OX) = h(OY − OX) = h(XY),
luego f es afı́n y fe = h. Por otra parte, tomando X = O, es
P0 f (O) = h(OO) = h(0) = 0 ⇒ P 0 = f (O).
Dado un morfismo g : E → E 0 tal que ge = h, g(O) = P 0 , se cumple
P0 g(X) = g(O)g(X) = h(OX) = P0 f (X) ⇒ g(X) = f (X) ⇒ g = f.
2
Si el conjunto de todas las aplicaciones afines de E en E 0 se denota por
AA(E, E 0 , IK),
la correspondencia f 7→ fe es una aplicacióne: AA(E, E 0 , IK) → AL(V, V0 , IK).
La última proposición nos dice que esta aplicación es suprayectiva. A la vez
pone de manifiesto que no es inyectiva, pues con una misma aplicación lineal h
se pueden construir tantas aplicaciones afines que la tengan por asociada como
puntos tenga el espacio final E 0 , bastando para ello fijar un punto O ∈ E e
ir moviendo P 0 en E 0 . Si tomamos vectores de posición en E respecto de O y
fijamos otro origen O0 en E 0 , la ecuación vectorial de todas ellas será de la forma
f (X) = h(X) + f (O).
Entre ellas, la más simple se obtiene cuando f (O) = O0 , quedando
f (X) = h(X).
Esta última f cambia origen en origen. Denotemos por AAO,O0 (E, E 0 , IK) el
conjunto de todas los morfismos afines con tal propiedad.
Proposición 280 La aplicación f 7→ fe es una biyección de AAO,O0 (E, E 0 , IK)
sobre AL(V, V0 , IK).
22.7.
Determinación y descomposición de aplicaciones afines
331
Demostracion:
Si f, g ∈ AAO,O0 (E, E 0 , IK) cumplieran fe = ge, llamando h a este morfismo
lineal, puesto que f (O) = O0 = g(O), según la proposición 279, se cumple f = g.
Esto prueba la inyectividad.
La suprayectividad sale al construir a partir de uno lineal dado h, el morfismo
afı́n f tal que f (O) = O0 y fe = h.
2
Proposición 281 Dos morfismos afines f y g tienen el mismo morfismo lineal
asociado si y sólo si existe un vector u0 ∈ V0 tal que f = Tu0 ◦ g. Fijado un
origen O ∈ E dicho vector es el u0 = g(O)f (O).
Demostracion:
Si f = Tu0 ◦ g, se tiene f (O) = Tu0 (g(O)), luego g(O)f (O) = u0 . Por otro
lado, aplicando las proposiciones 271 y 269, resulta
f
0 ◦ g) = T
fe = (Tug
e = IV 0 ◦ ge = ge.
u0 ◦ g
Si fe = ge, tomando u0 = g(O)f (O), obtenemos
f (O)f (X) = fe(OX) = ge(OX) = g(O)g(X) ⇒ g(X)f (X) = g(O)f (O) ⇒
⇒ f (X) = Tu0 (g(X)) = (Tu0 ◦ g)(X) ⇒ f = Tu0 ◦ g.
2
El método de la proposición 279 permite obtener todas los posibles morfismos
afines de E en E 0 , pues cada f se reconstruye a sı́ mismo si lo aplicamos a
los datos h = fe y P 0 = f (O). Ası́, el conjunto AA(E, E 0 , IK) se clasifica con
el criterio de poner en cada clase todas las aplicaciones afines obtenidas de
una misma lineal. Respecto de orı́genes O en E y O0 en E 0 , podemos tomar
como representante canónico de la clase el morfismo g tal que g(O) = O0 . El
conjunto de estos representantes es igualable, en virtud de la biyección de la
proposición 280, con el conjunto de aplicaciones lineales. Por otra parte, de
acuerdo con la proposición 281, los restantes morfismos de una clase se obtienen
por composición de g con las traslaciones Tu0 de E 0 , donde u0 coincide con el
vector g(O)f (O) = O0 f (O) = f (O).
En resumen, queda demostrado lo siguiente:
Proposición 282 Fijados O ∈ E y O0 ∈ E 0 , cada aplicación afı́n f : E → E 0
admite la descomposición
f = Tu0 ◦ g,
donde g (igualable a fe ) cumple g(O) = O0 y u0 = f (O).
332
Capı́tulo 22. Aplicaciones Afines
22.8.
Isomorfı́a de espacios afines
Se dice que el espacio afı́n E es isomorfo al E 0 si existe una aplicación biyectiva
y afı́n f : E → E 0 .
Proposición 283 El espacio afı́n es isomorfo al E 0 si y sólo si su espacio vectorial director V es isomorfo al espacio director V0 de E 0 .
Demostracion:
Es consecuencia inmediata de la proposición 275.
2
La isomorfı́a entre espacios afines es reflexiva, simétrica y transitiva en virtud
de las proposiciones 272, 276 y 271. Por ello se puede hablar de espacios afines
abstractos, como la clase de un espacio afı́n junto a todos los isomorfos con él.
Si E es de dimensión finita e isomorfo a E 0 , éste también será de dimensión finita y
coincidente con la de E. Recı́procamente, si ambos son de igual dimensión finita,
existe un isomorfismo lineal entre V y V0 , usando el cual en la proposición 279,
se construye otro afı́n entre E y E 0 . En resumen, sobre un cuerpo conmutativo
IK prefijado y para cada entero n ≥ 0, sólo hay un espacio afı́n abstracto. Su
representación canónica será el espacio cartesiano IK n considerado espacio afı́n
dirigido por sı́ mismo.
22.9.
Aplicaciones afines y dependencia afı́n
Proposición 284 La aplicación f : E → E 0 es afı́n si y sólo si conserva las
combinaciones afines.
Demostracion:
Usando vectores de posición en ambos espacios, consideremos la aplicación
fO : V → V0 de ley
fO (X) = f (X) − f (O).
Puesto que f conserva las combinaciones afines, se tiene
fO (X + Y) = f (X + Y) − f (O) = f (X − O + Y) − f (O) =
= f (X) − f (O) + f (Y) − f (O) = fO (X) + fO (Y),
fO (aX) = f (aX) − f (O) = f (aX+(1 − a)O) − f (O) =
= af (X) + (1 − a)f (O) − f (O) = af (X) − af (O) = afO (X).
Es decir, fO es lineal. Por ello, para cualesquiera X, Y ∈ E, se cumple
fO (XY) = fO (OY−OX) = fO (OY)−fO (OX) = f (O)f (Y)−f (O)f (X) = f (X)f (Y),
luego f es afı́n y fe = fO .
22.9.
Aplicaciones afines y dependencia afı́n
333
Si f es afı́n, dada una combinación afı́n en E, se cumple
r
r
X
X
f(
ai Xi ) = fe(
ai Xi ) + f (O) =
i=0
=
r
X
ai fe(Xi ) + (
i=0
r
X
i=0
i=0
ai )f (O) =
r
X
ai (fe(Xi ) + f (O)) =
i=0
r
X
ai f (Xi ).
i=0
2
Proposición 285 Si IK es de caracterı́stica distinta de dos, f es afı́n si y sólo
si
∀a, b ∈ IK/a + b = 1, ∀X, Y ∈ E ⇒ f (aX + bY) = af (X) + bf (Y).
Demostracion:
Considerando la aplicación fO definida anteriormente, tenemos
fO (X + Y) = f (X + Y) − f (O) = f (2
= 2f (
X+Y
− O) − f (O) =
2
X+Y
f (X) + f (Y)
) − f (O) − f (O) = 2
− f (O) − f (O) =
2
2
= f (X) + f (Y) − f (O) − f (O) = fO (X) + fO (Y).
La relación fO (aX) = afO (X) se prueba análogamente a como se hizo en la
proposición 284, luego fO es lineal, y, de nuevo como en la proposición 284, esto
implica que f sea afı́n y que fe = fO .
Si f es afı́n, conserva las combinaciones afines de cualquier cantidad de puntos, y, en particular, de dos.
2
Proposición 286 Toda aplicación afı́n conserva la dependencia afı́n. La independencia afı́n se conserva si y sólo si f es inyectiva.
Demostracion:
Para un solo punto, no hay nada que probar. Si hay más, se expresa uno
como combinación afı́n de los otros. Su imagen será combinación afı́n de las
imágenes, luego éstas son afı́nmente dependientes.
Sean a0 , a1 , a2 , . . . , ar ∈ IK tales que a0 + a1 + a2 + . . . + ar = 0, y sean
X0 , X1 , X2 , . . . , Xr ∈ E. Si se tiene una relación
0 = a0 f (X0 ) + a1 f (X1 ) + a2 f (X2 ) + . . . + ar f (Xr ),
sumando f (O) en ambos miembros, los coeficientes del nuevo segundo miembro
suman 1, luego, por ser f afı́n, tenemos
f (O) =
r
X
i=0
ai f (Xi ) + f (O) = f (
r
X
i=0
r
X
ai Xr + O) = f (
ai Xr ).
i=0
334
Capı́tulo 22. Aplicaciones Afines
Si f es inyectiva, de aquı́ deducimos que
0 = a0 X0 + a1 X1 + a2 X2 + . . . + ar Xr .
Si los puntos dados son afı́nmente independientes, todos los coeficientes son
nulos, luego sus imágenes también son afı́nmente independientes.
Si f conserva la independencia, como dos puntos X 6= Y son independientes,
f (X) y f (Y ) lo serán, luego f (X) 6= f (Y ) y f es inyectiva.
2
22.10.
Aplicaciones afines y subespacios afines
Proposición 287 Si f : E → E 0 es afı́n y F 6= ∅ es un subespacio afı́n de E, su
imagen f (F) es un subespacio afı́n de E 0 y se cumple que
V (f (F)) = fe(V (F)).
Demostracion:
Si P ∈ F, de acuerdo con la proposición 245, para que f (F) sea subespacio
afı́n bastará ver que {f (P)f (X)/X ∈ F} es subespacio vectorial de V0 . Ahora
bien, f (P)f (X) = fe(PX) porque f es afı́n. Entonces, como PX recorre V (F), el
anterior conjunto coincide con fe(V (F)), que es subespacio vectorial en V0 por
ser imagen de uno de V mediante una aplicación lineal. También la proposición
245 asegura que V (f (F)) = fe(V (F)).
2
Proposición 288 Si f : E → E 0 es afı́n y F 0 6= ∅ es un subespacio afı́n de E 0 ,
f −1 (F 0 ) es un subespacio afı́n de E. Si no es vacı́o, se cumple que
V (f −1 (F 0 )) = fe−1 (V (F 0 )).
Demostracion:
Si la imagen inversa es vacı́a, no hay nada que probar. En caso contrario,
existe al menos un punto P tal que f (P ) ∈ F 0 , y tendremos que probar que
{PX/f (X) ∈ F 0 } es subespacio de V. Pero, como fe(PX) = f (P)f (X) ∈ V (F 0 ),
el anterior conjunto es la imagen inversa mediante fe de V (F 0 ), la cual es un
subespacio de V porque fe es lineal. Además, queda claro que
V (f −1 (F 0 )) = fe−1 (V (F 0 )).
2
En el caso de las traslaciones, por tener como aplicación lineal asociada la identidad, tanto la imagen directa como la inversa de un subespacio afı́n será otro
subespacio afı́n paralelo al dado.
22.11.
Aplicaciones afines y paralelismo
Proposición 289 Las aplicaciones afines conservan el paralelismo entre subespacios afines.
22.12.
Puntos dobles de un endomorfismo afı́n
335
Demostracion:
Si F es paralelo a G es porque V (F) ⊆ V (G), en cuyo caso
V (f (F)) = fe(V (F)) ⊆ fe(V (G)) = V (f (G)),
prueba que f (F) es paralelo a f (G).
22.12.
2
Puntos dobles de un endomorfismo afı́n
Un elemento X ∈ E es un punto doble en un endomorfismo afı́n f de E si
f (X) = X.
El conjunto de todos los puntos dobles se anotará como D, pudiendo ser vacı́o
tal como ocurre, por ejemplo, con las traslaciones no nulas.
Proposición 290 El conjunto D de puntos dobles del endomorfismo afı́n f es
un subespacio afı́n de E. Si no es vacı́o, se cumple V (D) = D, donde D es el
subespacio de vectores dobles de su endomorfismo lineal asociado.
Demostracion:
Si D = ∅, el enunciado es trivial. En caso contrario, existe cuando menos un
punto P ∈ D y podemos formar el conjunto
V (P, D) = {PX/X ∈ D} ⊆ V.
Entonces,
PX ∈ V (P, D) ⇒ fe(PX) = f (P)f (X) = PX ⇒ PX ∈ D,
PX ∈ D ⇒ PX = fe(PX) = f (P)f (X) = Pf (X) ⇒
⇒ X = f (X) ⇒ X ∈ D ⇒ PX ∈ V (P, D),
es decir, V (P, D) = D. Como el segundo es un subespacio vectorial (proposición
91), el primero lo es y el teorema queda probado.
2
Fijado un origen O en el espacio afı́n E, podemos tomar (proposición 282)
f = Tu ◦ g, con u = f (O),
donde g, igualable a fe, es un endomorfismo afı́n que cumple g(O) = O. Entonces,
los vectores de posición de los puntos dobles verifican que
X = f (X) = g(X) + u ⇔ (g − I)(X) = −u ⇔ X ∈ (g − I)−1 (−u).
Proposición 291 El conjunto D de puntos dobles de un endomorfismo afı́n f
es no vacı́o si y sólo si u ∈ Im(g − I).
336
Capı́tulo 22. Aplicaciones Afines
Demostracion:
Después de lo anterior, la existencia de puntos dobles equivale a que −u ∈
Im(g − I). Como éste es un subespacio vectorial, esta relación equivale, a su
vez, a la u ∈ Im(g − I).
2
Proposición 292 Un endomorfismo afı́n f de un espacio finito-dimensional E
admite un único punto doble si y sólo si
D = Ker(g − I) = {0}.
Demostracion:
Si Ker(g − I) = {0}, g − I es inyectiva y de hecho biyectiva por estar en
dimensión finita. Entonces, la ecuación X = (g − I)−1 (−u) admite solución y,
además, única.
Si D consta de un único punto, debe estar dirigido por el vector nulo, luego
D = {0}.
2
22.13.
Matriz de una aplicación afı́n
Sean E y E 0 dos espacios afines de dimensiones finitas n y m. Sean
0
S = {O; B} = {O; v1 , v2 , . . . , vn }, S 0 = {O0 ; B 0 } = {O0 ; v10 , v20 , . . . , vm
}
sistemas de referencia fijados en ambos espacios.
Dado un morfismo afı́n f : E → E 0 , queremos obtener las coordenadas (x01 , x02 , . . . , x0m )
de f (X) en S 0 a partir de las (x1 , x2 , . . . , xn ) de X en S. Se trata, en definitiva,
de pasar a coordenadas la ecuación vectorial f (X) = fe(X) + f (O) de f respecto
de los orı́genes O y O0 . El primer sumando se conocerá, según vimos al estudiar
las aplicaciones lineales, si se conocen las coordenadas de cada vector fe(vj ) en
la base B0 , es decir, cuando se tengan unas igualdades
fe(vj ) =
m
X
aij vi0 , ∀j ∈ [1, n].
i=1
Con ellas (sección 14.5) podemos construir la matriz M (fe) de fe respecto de las
bases B y B0 y escribir fe(X) = M (fe) × X, donde X y fe(X) se han igualado a
las matrices columnas de sus coordenadas en la base respectiva. En cuanto al
segundo sumando, bastará conocer las coordenadas de f (O) en S 0 , o sea, tener
una igualdad como la
m
X
f (O) =
pi vi0 .
i=1
Igualando también f (X) y f (O) a las columnas de sus coordenadas, resulta
f (X) = M (fe) × X + f (O) ⇔
22.13.
Matriz de una aplicación afı́n
x0
a11
a21
⇔
.. = ...
.
1
x02
x0m
am1
337
a12
a22
..
.
...
...
am2
...
p1
a1n
x1
a2n x2 p2
× . + . ,
..
. .. ..
amn
xn
pm
que es la ecuación matricial de la aplicación afı́n f en los sistemas de
referencia S y S 0 .
Esta ecuación traduce la descomposición f = Tu0 ◦ g obtenida en la proposición
282: (aij ) representa a g (que por cambiar O en O0 es igualable a la aplicación
lineal asociada) y (pi ) representa a Tu0 , donde u0 = f (O).
Se suele sintetizar más aún escribiendo
1
1
0
0
0
x
p
a
a
1 1
11
12
0
x2 = p2 a21 a22
. .
..
..
. .
.
.
.
.
x0m
pm
am1
am2
...
...
...
...
0
1
a1n x1
a2n × x2 ,
..
...
.
xn
amn
donde las dos matrices (aij ) y (pi ) se funden en una sola A, de m + 1 filas y
n + 1 columnas, llamada matriz de la aplicación afı́n f en los sistemas de
referencia S y S 0 .
Para indicar su dependencia de estos datos, se escribe A = M (f, S, S 0 ), o sólo
A = M (f ) presuponiendo la alusión a los sistemas. Una matriz de este tipo
será nombrada como matriz afı́n. En ella se destacan las cuatro siguientes
submatrices
1. (1) = 1 ∈ M(1, 1, IK).
2. (0, 0, .., 0) = 0 ∈ M(1, n, IK).
3. (pi ) = f (O) ∈ M(m, 1, IK).
4. (aij ) = M (fe) ∈ M(m, n, IK).
hecho que se recoge con la escritura en bloques
µ
¶ µ
1
0
1
M (f ) =
=
pi aij
f (0)
0
M (fe)
¶
.
Una matriz afı́n no sólo representa a una aplicación afı́n, sino que, recı́procamente, si se parte de una de ellas
µ
¶
1
0
A=
∈ M(m + 1, n + 1, IK)
pi aij
como dato, se determina un morfismo afı́n f tal que A = M (f ). En efecto, con
los datos de la submatriz (aij ) se define una aplicación lineal entre V y V0 tal
como se indicó en el la sección 14.10; a continuación, como en la proposición 279,
338
Capı́tulo 22. Aplicaciones Afines
construı́mos una afı́n f : E → E 0 tomando f (O) como el punto de coordenadas
iguales a los términos de la submatriz (pi ).
Efectuando las operaciones indicadas en la ecuación matricial, se obtiene
0
x1
x02
..
.
x0m
= p1
= p2
+x1 a11
+x1 a21
+x2 a12
+x2 a22
+...
+...
+xn a1n
+xn a2n
= pm
+x1 am1
+x2 am2
+...
+xn amn
que son las ecuaciones de f en forma escalar.
Veamos ahora qué ocurre en los procesos de composición e inversión:
1. Usando la fórmula de la proposición 277 para una composición, se tiene
g(f (X)) = ge(fe(X)) + ge(f (O)) + g(00 ) = (M (e
g ) × M (fe)) × X+
+M (e
g ) × f (O) + g(00 ) = M (e
g ◦ fe) × X + M (e
g ) × f (O) + g(00 ) =
= M (gg
◦ f ) × X + M (e
g ) × f (O) + g(00 ) ⇒
µ
¶ µ
¶
1
0
1
0
M (g) × M (f ) =
×
=
g(0) M (e
g)
f (0) M (fe)
µ
¶ µ
¶
1
0
1
0
=
=
= M (g◦f ).
M (e
g ) × f (0) + g(00 ) M (e
g ) × M (fe)
g(f (0)) M (gg
◦ f)
2. Con la fórmula de la proposición 278 para una inversión, obtenemos
f −1 (X0 ) = (fe)−1 (X0 ) − (fe)−1 (f (O)) = M (fe)−1 × X0 − M (fe)−1 × f (O) =
−1 )×X0 −M ((fe)−1 )×f (O) ⇒
= M ((fe)−1 )×X0 −M ((fe)−1 )×f (O) = M (fg
µ
⇒ M (f )−1 =
¶−1 µ
¶
1
0
1
0
=
=
f (0) M (fe)
−M ((fe)−1 ) × f (0) M ((fe)−1 )
µ
¶
1
0
=
= M (f −1 ).
−1 )
f −1 (00 ) M (fg
Es decir, las matrices de morfismos afines se rigen por las mismas reglas que los
lineales (secciones 14.13 y 14.14). Además, puesto que IE (O) = 0 y M (IeE ) =
M (IV ) = In , se tiene
µ
In+1 =
1
0
0
In
¶
µ
=
1
0
IE (0) M (IeE )
¶
= M (IE ).
22.14.
Complementos / Ejercicios
22.14.
339
Complementos / Ejercicios
1. Comprobar que la aplicación
f : IR2 → IR2 , de ley f (x, y) = (x2 − y 2 , 2xy),
no es afı́n.
2. Dada una aplicación f : E → E 0 entre espacios afines sobre el mismo
cuerpo IK (de caracterı́stica distinta de 2), razonar que es afı́n si y sólo si
X = A + λAB ⇒ f (X) = f (A) + λf (A)f (B).
(Este enunciado significa que las aplicaciones afines se caracterizan por
conservar la alineación de puntos y la razón simple de los mismos).
3. Determinar el subespacio afı́n imagen mediante el endomorfismo afı́n f de
IR3 cuya ecuación matricial es la
0
1 0 1
x
1
x
y0 = 2 1 0 × y + 3 .
1 −1 3
z
0
z0
Comprobar que posee un solo punto doble y determinar la imagen inversa
del mismo.
340
Capı́tulo 22. Aplicaciones Afines
341
Capı́tulo 23
El Grupo Afı́n. Cambio de
Coordenadas
23.1.
El grupo afı́n de un espacio afı́n
Proposición 293 El conjunto Af (E, IK) de las afinidades de E es un grupo
para la composición. La correspondencia f 7→ fe es un epimorfismo de este
Af (E, IK) sobre el grupo GL(V, IK).
Demostracion:
Que forman grupo se sigue de las proposiciones 271, 272 y 276. Que la
aplicación f 7→ fe es un morfismo de grupos, se deriva de la fórmula (gg
◦ f ) = ge◦fe
(proposición 271). Que es suprayectivo se sigue de que, dado fe en GL(V, IK),
cualquiera de los morfismos afines f construı́dos a partir de él (proposición 279)
se aplica en fe y es biyectivo (proposición 275).
2
Este grupo se conoce como grupo afı́n del espacio afı́n E.
Proposición 294 El grupo T (E, IK) es un subgrupo normal de Af (E, IK).
Demostracion:
Como las traslaciones forman grupo (proposición 266) y son afinidades (proposición 269), T (E, IK) es subgrupo de Af (E, IK). Es normal porque se iguala al
núcleo del epimorfismoe: Af (E, IK) 7→ GL(V, IK), ya que T (E, IK) coincide con
el conjunto de afinidades f tales que fe = IV .
2
Proposición 295 Para cada afinidad f y cada vector u ∈ V se cumple
f ◦ Tu ◦ f −1 = Tfe(u) .
342
Capı́tulo 23. El Grupo Afı́n. Cambio de Coordenadas
Demostracion:
Por ser T (E, IK) subgrupo normal de Af (E, IK) se sabe que f ◦ Tu ◦ f −1 es
una traslación, luego existirá un vector v tal que
f ◦ Tu ◦ f −1 = Tv ⇔ f ◦ Tu = Tv ◦ f.
Fijado un origen O ∈ E, sea P = Tu (O) y sea Q = Tv (f (O)). Entonces,
Q = Tv (f (O)) = (Tv ◦ f )(O) = (f ◦ Tu )(O) = f (Tu (O)) = f (P ) ⇒
⇒ v = f (O)Q = f (O)f (P) = fe(OP) = fe(u).
2
Proposición 296 Una afinidad f conmuta con una traslación Tu si y sólo si
u es un vector doble de su automorfismo lineal asociado.
Demostracion:
Aplicando la última fórmula se tiene
Tu ◦ f = f ◦ Tu ⇔ Tu = f ◦ Tu ◦ f −1 = Tfe(u) ⇔ u = fe(u).
2
23.2.
Grupo de las afinidades que tienen como
doble un punto dado
Si f es un endomorfismo de E, al escribir su ecuación vectorial se tomará O0 = O.
Entonces, los endomorfismos f que cambian origen en origen cumplen que
f (O) = O, o sea, admiten el origen como punto doble. Si denotamos por
AAO (E, IK) el conjunto de ellos, la asociación f 7→ fe es una biyección de
AAO (E, IK) sobre End(V, IK). Seleccionando en AAO (E, IK) las afinidades, tendremos un nuevo conjunto, que denotaremos por AfO (E, IK).
Proposición 297 El conjunto AfO (E, IK) es un subgrupo del grupo afı́n Af (E, IK),
isomorfo al grupo GL(V, IK).
Demostracion:
Si f, g ∈ AfO (E, IK), es inmediato que
a) (g ◦ f )(O) = g(f (O)) = g(O) = O ⇒ g ◦ f ∈ AfO (E, IK).
b) IE (O) = O ⇒ IE ∈ AfO (E, IK).
c) f (O) = O ⇒ f −1 (O) = O ⇒ f −1 ∈ AfO (E, IK).
Además, la restricción a AfO (E, IK) del epimorfismo e: Af (E, IK) → GL(V, IK)
será biyectivo.
2
23.3. Descomposición semidirecta del grupo afı́n
23.3.
343
Descomposición semidirecta del grupo afı́n
Proposición 298 Fijado un punto O del espacio afı́n E, se cumple
Af (E, IK) = AfO (E, IK)T (E, IK), {IE } = AfO (E, IK) ∩ T (V, IK).
Demostracion:
Si f ∈ Af (E, IK), se ha probado (proposición 282) que
f = Tu ◦ g, donde g(O) = O y u = f (O).
Como f y Tu son biyectivas, g lo es, luego g ∈ AfO (E, IK).
Si f ∈ AfO (E, IK)∩T (V, IK), de la proposición 265 se sigue que f = T0 = IE .
2
Si a esto unimos que T (E, IK) es normal, estamos en la situación de lo que en
Teorı́a de Grupos llamaremos un producto semidirecto. Salvo isomorfismos,
Af (E, IK) será producto del grupo GL(V, IK) por el (V, +).
23.4.
Matriz de una afinidad
En el caso de endomorfismos de un espacio E, se toma S 0 = S y la matriz
0
a1n
a2n
..
.
1
p1
p
A = M (f, S) = M (f ) =
.2
.
.
0
a11
a21
..
.
0
a12
a22
..
.
...
...
...
pn
an1
an2
. . . ann
está en M(n + 1, IK) siendo n = dim(E).
Proposición 299 El endomorfismo f es una afinidad si y sólo si M (f ) es una
matriz afı́n regular.
Demostracion:
Basta ver que, calculado por los elementos de la primera fila, se tiene det(M (f )) =
det(M (fe)). Entonces,
M (f ) es regular ⇔ det(M (f )) 6= 0 ⇔ det(M (fe)) 6= 0 ⇔
⇔ fe es automorfismo lineal ⇔ f es una afinidad.
2
344
Capı́tulo 23. El Grupo Afı́n. Cambio de Coordenadas
23.5.
Cambio de coordenadas en un espacio afı́n
Sea E de dimensión finita n ≥ 1. Sean S = {O; B}, T = {P ; C} dos sistemas
de referencia en E. Supondremos conocidas las coordenadas de los datos de T
expresadas en el sistema S mediante igualdades como las
wj = α1j v1 + α2j v2 + . . . + αnj vn , ∀j ∈ [1, n],
OP = γ1 v1 + γ2 v2 + . . . + γn vn .
Un mismo punto X tiene coordenadas xi en S y otras yj en T . Ahora bien,
n
X
xi vi = OX = OP + PX =
i=1
=
n
X
γi vi +
i=1
γi vi +
i=1
=
n
X
n
X
yj wj =
j=1
n
n
n X
n
X
X
X
yj (
αij vi ) =
γi vi +
(
yj αij )vi =
j=1
n
X
n
X
i=1
j=1
(γi +
n
X
i=1
i=1
yj αij )vi ⇒ xi = γi +
i=1 j=1
n
X
yj αij , ∀i ∈ [1, n],
j=1
ecuaciones que permiten calcular las coordenadas xi a partir de las yj , y que
matricialmente admite la escritura
1
0
0
...
0
1
1
x1 γ 1 α11 α12 . . . α1n y 1
x2 = γ 2 α21 α22 . . . α2n × y 2 .
. .
..
..
..
.. .
..
.
.
.
.
.
xn
γ n αn1 αn2 . . . αnn
yn
La matriz que aparece es una matriz afı́n cuadrada de n + 1 filas y columnas,
que denotaremos por M (S, T ), y llamaremos matriz del cambio de S a T .
La igualdad matricial se conoce como ecuación matricial del cambio de
coordenadas de T a S.
La submatriz columna (γi ) se refiere al cambio de origen, mientras que la submatriz cuadrada (αij ) alude al cambio de base. Esta, por tanto, será regular,
lo mismo que lo es M (S, T ) pues, desarrollando el primero por los elementos de
su primera fila, trivialmente se tiene
det(M (S, T )) = det(αij ).
Al igual que vimos en las secciones 18.4 y 18.5, podremos hablar de composición
de dos cambios, del cambio idéntico y del cambio recı́proco, obteniendo para ellos
fórmulas como las
M (R, T ) = M (R, S) × M (S, T ), M (S, S) = I, M (T , S) = (M (S, T ))−1 .
Dentro de los cambios de sistemas de ejes hay dos casos simples:
23.6. Orientación de sistemas de referencia en espacios afines reales
345
C = B. Sólo hay cambio de origen, por lo que la submatriz (αij ) será la
unidad. Se conoce como traslación del sistema de ejes.
P = O. El origen permanece inmóvil, de manera que la submatriz (γi ) es
nula. Se habla de cambio de base sin más.
Multiplicando las respectivas matrices, se comprueba enseguida que
µ
1
γi
0
In
¶
µ
×
1
0
0
αij
¶
µ
=
1
γi
0
αij
¶
,
igualdad cuyo significado es que todo cambio de ejes se obtiene haciendo una
traslación del viejo al nuevo origen seguida de un cambio de base.
Si la matriz M (S, T ) de un cambio de referencia, la usamos para construir un
endomorfismo afı́n f tomando M (f, S) = M (S, T ), se tratará de una afinidad
ya que la matriz es regular. Recı́procamente, una afinidad f tiene asociada
una matriz afı́n M (f, S) regular. Los vectores wj = f (vj ), forman una nueva
base C, mientras que P = f (O) puede tomarse como un nuevo origen P . Ası́,
construı́mos el sistema T = {P ; C} y se cumple M (S, T ) y M (f, B) son iguales.
De esta forma, fijado un sistema de ejes S, los cambios de referencia, las matrices
afines regulares y las afinidades de E se corresponden biyectivamente.
23.6.
Orientación de sistemas de referencia en
espacios afines reales
Sea E un espacio afı́n de dimensión n ≥ 1, dirigido por un espacio vectorial V
sobre el cuerpo IR. Dados dos referencias S = {O; B}, T = {P ; C}, decimos que
T tiene la misma orientación que S si
det(M (S, T )) > 0.
De acuerdo con la definición dada en la sección 18.6, y puesto que
det(M (S, T )) = det(M (B, C)),
es lo mismo que decir que la base C de T tenga la misma orientación que la base
B de S. Por ello, la cualidad de tener igual orientación clasifica a los sistemas
de referencia en dos únicas categorı́as.
Asignando orientación positiva a un sistema S prefijado, se dirá que los de
su misma clase están orientados positivamente y que las de la otra están
orientados negativamente.
346
Capı́tulo 23. El Grupo Afı́n. Cambio de Coordenadas
23.7.
Paridad e imparidad de las afinidades de
un espacio real
Como en el caso lineal (sección 19.5), en los endomorfismos de E se tiene
M (f, T ) = M (S, T )−1 × M (f, S) × M (S, T )
para la matriz de f al cambiar de ejes. De ella se sigue que el determinante de
M (f, S) no cambia y podremos hablar del determinante de un endomorfismo afı́n f , haciendo su cálculo mediante su matriz en cualquier sistema S,
y denotándolo por det(f ). Además, para una composición, se tiene
det(g ◦ f ) = det(g) det(f ),
y se cumple, como en la proposición 239, que f 7→ det(f ) establece un epimorfismo de Af (E, IK) sobre IK ∗ .
Si f es una afinidad de un espacio real E de dimensión finita, se dice que es una
afinidad par (directa o positiva) cuando det(f ) > 0. Si det(f ) < 0, se dice
que es una afinidad impar (inversa o negativa). Como en el caso de automorfismos lineales (sección 19.10), las afinidades pares conservan la orientación
y las impares la alteran.
Proposición 300 Las afinidades pares forman un subgrupo del grupo afı́n de
E, dentro del cual las traslaciones son un subgrupo normal.
Demostracion:
Se trata de la imagen inversa mediante la función determinante del subgrupo
IR+ de IR∗ . Las traslaciones son pares porque
det(Tu ) = det(M (Tu )) = det(M (Teu )) = det(M (IV )) = det(In ) = 1 > 0,
luego están dentro de este grupo, siendo un subgrupo normal porque lo son en
el grupo total Af (E, IK).
2
23.8.
Complementos / Ejercicios
1. En un espacio afı́n E se fijan dos puntos P y Q. Razonar que los grupos
AfP (E, IK) y AfQ (E, IK) son isomorfos. Indicar una correspondencia entre
ellos que establezca tal isomorfismo.
2. Encontrar las ecuaciones del endomorfismo afı́n de IR2 tal que
f (0, 0) = (1, 2), f (1, 0) = (3, 1), f (0, 1) = (1, 3).
¿En qué curva se cambia la circunferencia x2 + y 2 = 1?
23.8. Complementos / Ejercicios
347
3. Coordenadas en el sistema canónico de IR2 de un punto X que tiene coordenadas 2 y −2 en la referencia formada por los puntos
(1, 1), (2, 1), (1, 2).
4. Estudiar si los puntos
P0 = (0, 1, 1), P1 = (1, 0, 1), P2 = (1, 1, 0), P3 = (0, 0, 1)
forman un sistema de referencia del espacio afı́n IR3 . En caso de serlo,
obtener las ecuaciones que permitan calcular las coordenadas de un punto
cualquiera en dicho sistema.
348
Capı́tulo 23. El Grupo Afı́n. Cambio de Coordenadas
349
Capı́tulo 24
Simetrı́as, Traslaciones y
Homotecias
24.1.
Simetrı́as centrales
En el capı́tulo anterior hemos definido el grupo afı́n de un espacio E, fijando su
estructura como producto semidirecto del subgrupo de afinidades con un punto
fijo por el subgrupo normal de las traslaciones.
En éste se estudiarán algunos tipos particulares de afinidades de gran interés
geométrico: las simetrı́as (centrales y oblı́cuas en general) y las homotecias,
aunque aprovecharemos para ampliar resultados en las traslaciones ya conocidas
e incluso en las proyecciones paralelas que, aunque no sean afinidades, están
fuertemente ligadas con las simetrı́as.
Este estudio puede hacerse sobre cualquier cuerpo IK de caracterı́stica distinta
de 2, si bien su interés se centra en los espacios reales.
Fijado un punto P ∈ E, llamamos simetrı́a de centro P a la aplicación
SP : E → E
que a cada punto X le asocia otro X 0 tal que
PX0 = −PX.
Usando vectores de posición, puede escribirse
X0 = P − PX = 2P − X ⇔ (X + X0 )/2 = P.
De la primera ecuación se concluye que P, X, X 0 están alineados siempre que
X 6= P . De la última se sigue que P es punto medio de X y X 0 .
Proposición 301 El único punto doble en SP es su centro P .
350
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
Demostracion:
Basta ver que
X0 = X ⇔ X = 2P − X ⇔ 2X = 2P ⇔ X = P.
2
Proposición 302 Las simetrı́as centrales son involutivas. Es decir,
SP2 = IE .
Por tanto, son biyectivas e inversas de sı́ misma.
Demostracion:
Basta ver que, para todo X ∈ E, se cumple
SP2 (X) = SP (2P − X) = 2P − (2P − X) = X = IE (X).
2
Proposición 303 Una afinidad f : E → E es una simetrı́a central si y sólo si
fe = −IV .
Demostracion:
Siendo O un origen, sea P el punto medio entre O y O0 . Entonces, cualquiera
que sea X ∈ E, se cumple
O0 X0 = −OX = −X ⇒ X0 = O0 − X ⇒ 2P − X,
lo que significa que f tiene la misma ecuación que SP . Por tanto, f = SP
Sea f = SP . Dados dos puntos X, Y se tiene
X0 Y0 = 2P − Y − 2P + X = −XY = (−IV )(XY).
Esto prueba que SP es afı́n y que SeP = −IV .
24.2.
2
El grupo T C(E, IK)
Además de las señaladas en la sección anterior, más adelante daremos nuevas
propiedades de las simetrı́as centrales. De momento recordemos que la aplicación
e : Af (E, IK) → GL(V, IK) es un epimorfismo de grupos. La imagen inversa
mediante el mismo del subgrupo
{IV , −IV }
del grupo lineal, será un subgrupo del afı́n. Ahora bien, las afinidades que se
aplican en IV son las traslaciones (proposición 269), mientras que las se aplican
en −IV son las simetrı́as centrales (proposición 301). Ası́, llegamos a que la
unión de todas las traslaciones y todas las simetrı́as centrales constituye un
subgrupo del grupo afı́n. Lo denotaremos como
T C(E, IK).
24.3.
Homotecias afines
24.3.
351
Homotecias afines
Fijados un punto P ∈ E y un número µ, llamamos homotecia de centro P y
razón µ a la aplicación
HP,µ : E → E
que a cada punto X le asocia otro X 0 tal que
PX0 = µPX.
Usando vectores de posición, puede escribirse
X0 = P + µPX = (1 − µ)P + µX.
De esta ecuación se sigue que la homotecia de centro P y razón nula es el
morfismo afı́n constante X 7→ P . En los demás casos, prueba que los puntos
P, X, X 0 están alineados siempre que X 6= P .
Usando la ecuación de una homotecia, es inmediato que la identidad y las
simetrı́as centrales son casos particulares de homotecias. En concreto:
HP,1 = IE , HP,−1 = SP
Proposición 304 Si µ 6= 1, P es punto doble en la homotecia HP,µ y, además,
el único.
Demostracion:
El centro siempre es doble. Si, µ 6= 1, se tiene
X0 = X ⇔ X = (1 − µ)P + µX ⇔ (1 − µ)X = (1 − µ)P ⇔ X = P.
2
Proposición 305 Las homotecias de razón µ 6= 0 son biyectivas y se cumple
(HP,µ )−1 = HP,µ−1
Demostracion:
Si Y = X 0 = HP,µ (X), se tiene
Y = (1 − µ)P + µX ⇒ X = −
1−µ
1
1
1
P + Y = (1 − )P + Y,
µ
µ
µ
µ
luego HP,µ es una aplicación invertible y su inversa es HP,µ−1 .
2
Proposición 306 Toda homotecia HP,µ es una afinidad y su aplicación lineal
asociada es la homotecia vectorial de igual razón.
352
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
Demostracion:
Dados X, Y ∈ E, se tiene
X0 Y0 = (1 − µ)P + µY − (1 − µ)P − µX = µ(Y − X) = µXY = Hµ (XY),
e P,µ = Hµ .
lo que prueba que HP,µ es afı́n y que H
2
Proposición 307 Sea HP,µ una homotecia no nula. Sea F =
6 ∅ un subespacio
afı́n de E. Entonces, F 0 = HP,µ (F) es paralelo a F. Si µ 6= 1, se cumple
P ∈ F ⇔ F 0 = F.
Demostracion:
Si F está dirigido por U, su imagen F 0 está dirigida por Hµ (U) (proposición
287). Puesto que Hµ (U) = U (proposición 87), F y F 0 son paralelos.
Si P ∈ F, como este punto es doble en HP,µ , también está en F 0 . Siendo F
y F 0 paralelos e incidentes, deben coincidir.
Fijado un punto A ∈ F, cualquier otro punto X ∈ F cumple que
X = A + u, donde u ∈ U.
Si F 0 = F, A0 estará en F, luego existe un vector u ∈ U tal que
A0 = (1 − µ)P + µA = A + u ⇒ (1 − µ)P = (1 − µ)A + u.
Si no se trata de la homotecia idéntica, es decir, si µ 6= 1, obtenemos
P=A+
1
1
u, con
u ∈ U,
1−µ
1−µ
lo que prueba que P ∈ F.
2
Proposición 308 Sea SP una simetrı́a central. Sea F 6= ∅ un subespacio afı́n
de E. Entonces, F 0 = SP (F) es paralelo a F. Además,
P ∈ F ⇔ F 0 = F.
Demostracion:
Basta adaptar el anterior teorema al caso µ = −1.
24.4.
2
El grupo HP∗ (E, IK) de las homotecias concéntricas
Proposición 309 Dados dos números no nulos µ1 , µ2 , se cumple
HP,µ2 ◦ HP,µ1 = HP,µ1 µ2
24.5.
El grupo T H∗ (E, IK)
353
Demostracion:
Basta ver que
(HP,µ2 ◦ HP,µ1 )(X) = HP,µ2 (HP,µ1 (X)) = HP,µ2 ((1 − µ1 )P + µ1 X) =
= (1 − µ2 )P + µ2 ((1 − µ1 )P + µ1 X) =
= (1 − µ1 µ2 )P + µ1 µ2 X = HP,µ1 µ2 (X) ⇒ HP,µ2 ◦ HP,µ1 = HP,µ1 µ2 .
2
El conjunto de las homotecias de centro P y razón no nula se denotará por
HP∗ (E, IK).
Proposición 310 El conjunto HP∗ (E, IK) es un subgrupo conmutativo del grupo
AfP (E, IK), isomorfo al grupo multiplicativo numérico IK ∗ .
Demostracion:
Considerando la aplicación
IK ∗ → Af (E, IK), de ley µ 7→ HP,µ ,
según la proposición 235, se trata de un morfismo de grupos. Su imagen, que
no es otra que HP∗ (E, IK), será un subgrupo de Af (E, IK), conmutativo porque
IK ∗ lo es. Como los elementos de HP∗ (E, IK) dejan fijo al punto P , también
será subgrupo de AfP (E, IK). Además, la anterior aplicación es inyectiva pues
si HP,µ = IE , no puede ser µ 6= 1 porque en tal caso el único punto fijo serı́a el
P . Ası́ esta aplicación es un isomorfismo de IK ∗ sobre HP∗ (E, IK).
2
24.5.
El grupo T H∗ (E, IK)
Las traslaciones cumplen un teorema en todo análogo al probado en la prposición
307 para las homotecias afines:
Proposición 311 Sea Tu una traslación. Sea F =
6 ∅ un subespacio afı́n de E.
Entonces, F 0 = Tu (F) es paralelo a F. Además,
u ∈ V (F) ⇔ F 0 = F.
Demostracion:
Si F está dirigido por U, su imagen F 0 está dirigida por Te(U) = IV (U) = U,
luego F y F 0 son paralelos.
Sea A ∈ F. Si u ∈ U, puesto que A0 = A + u, se cumple que A’ también está en F. Entonces, F 0 = F porque se trata de subespacios paralelos e
incidentes.
354
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
Si F = F 0 , en particular A0 ∈ F . Entonces,
A0 = A + u ⇒ u ∈ U.
2
Un automorfismo afı́n f : E → E se dice que es una afinidad autoparalela
cuando cada subespacio afı́n F y su transformado F 0 sean paralelos. El conjunto
de todas ellas lo denotaremos como
T H∗ (E, IK).
Proposición 312 El conjunto T H∗ (E, IK) es un subgrupo del grupo afı́n.
Demostracion:
La propiedad reflexiva del paralelismo nos dice que la identidad es una
afinidad autoparalela; la propiedad simétrica, indica que la inversa de una
afinidad autoparalela también es autoparalela; la propiedad transitiva, por fin,
permite asegurar que la composición de dos afinidades autoparalelas es autoparalela.
2
La principal propiedad de este grupo es la conservación de la dirección. Por lo
probado en la proposición 311, las traslaciones están en él; también las homotecias (proposición 307) y, en particular, las simetrı́as centrales (proposición 308).
Por contener a las traslaciones y a las simetrı́as centrales, contendrá al grupo
T C(E, IK) presentado en la sección 24.2.
Proposición 313 Si f ∈ T H∗ (E, IK), existe un número µ 6= 0 tal que fe = Hµ .
Demostracion:
Cada vector u 6= 0, se puede considerar como director de una recta; su
transformado u0 dirige a la recta transformada, y, como ésta es paralela a la
original, resulta que u0 es proporcional a u, es decir, existirá un escalar µ 6= 0
tal que
u0 = µu.
En principio, este número podrı́a depender de la elección de u, pero veremos que
no es ası́: dado cualquier otro vector no nulo v, supongamos que sea v0 = βv;
cabe ahora distinguir dos posibilidades:
1. v y u son dependientes. Esto significa que v = au, para algún escalar a.
Entonces,
βv = v0 = (au)0 = au0 = a(µu) = µ(au) = µv ⇒ β = µ.
24.5.
El grupo T H∗ (E, IK)
355
2. v y u son independientes. De aquı́ se sigue que u + v no es nulo, luego
existe un tercer número γ tal que (u + v)0 = γ(u + v). Entonces,
γu + γv = γ(u + v) = (u + v)0 = u0 + v0 = µu + βv ⇒
⇒ (γ − µ)u + (γ − β)v = 0 ⇒ γ − µ = γ − β = 0 ⇒ β = µ.
Si observamos que para el vector nulo es trivialmente cierta la igualdad
00 = µ0, la proposición queda demostrada.
2
Proposición 314 Si f ∈ T H∗ (E, IK), se cumple que f es, o bien una traslación,
o bien una homotecia.
Demostracion:
Sea µ la razón de su homotecia vectorial asociada. Según su valor, surgen
dos alternativas:
1. µ = 1. Siendo la transformación lineal asociada igual a la identidad, f
necesariamente es una traslación.
2. µ 6= 1. Veremos que f admite al menos un punto doble. Para ello, partimos
de un punto, por ejemplo el O fijado como origen. Si O0 = O, no hay nada
que probar. En caso contrario, consideremos la recta
X = tO0
que pasa por O y O0 . Su tranformada será
X0 = fe(tO0 ) + O0 = µtO0 + O0 = (µt + 1)O0 ,
en cuyo caso se tiene
X0 = X ⇔ (µt + 1)O0 = tO0 ⇔ µt + 1 = t ⇔ t = t =
es decir, el punto
P=
1
,
1−µ
1
O0
1−µ
es doble. Una vez obtenido este punto, para cualquier X ∈ E se cumple
P0 X0 = PX0 = µPX ⇒ X0 = P + µPX,
lo que significa que f = HP,µ .
2
Ahora es claro que T H∗ (E, IK) consta únicamente de traslaciones y homotecias
no nulas, lo que justifica la notación usada para este grupo.
356
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
24.6.
Composición de traslaciones con homotecias y simetrı́as centrales
Estudiaremos ahora las composiciones posibles en el grupo T H∗ (E, IK):
1. Tv ◦ Tu (traslación seguida de traslación): Sabemos que
Tv ◦ Tu = Tu+v
y que esta composición es conmutativa.
2. HP,µ ◦ Tu (traslación seguida de homotecia de razón µ 6= 1):
La transformación lineal asociada tendrá razón 1·µ = µ, lo que prueba que
se trata de una homotecia de razón µ. El centro R se obtiene resolviendo
la ecuación
R = (HP,µ ◦Tu )(R) = HP,µ (Tu (R)) = HP,µ (R+u) = (1−µ)P+µ(R+u),
resultando que
HP,µ ◦ Tu = HR,µ , con R = P +
µ
u.
1−µ
3. Tu ◦ HP,µ (homotecia de razón µ 6= 1 seguida de traslación):
La transformación lineal asociada tendrá razón µ · 1 = µ, luego se trata
de una homotecia de razón µ. Si S es su centro, se tiene
S = (Tu ◦ HP,µ )(S) = Tu (HP,µ (S)) = Tu ((1 − µ)P + µS) =
= (1 − µ)P + µS + u ⇒ S = P +
1
u, Tu ◦ HP,µ = HS,µ ,
1−µ
4. HQ,µ2 ◦ HP,µ1 (homotecia seguida de homotecia):
Cabe distinguir dos posibilidades en función de los centros:
a) Homotecias concéntricas (P = Q):
Sabemos que
HP,µ2 ◦ HP,µ1 = HP,µ1 µ2
y que esta composición es conmutativa.
b) Homotecias no concéntricas (P 6= Q):
La transformación lineal asociada tendrá razón µ1 µ2 , por lo que
caben dos posibles resultados:
1) µ1 µ2 = 1.
Se trata de una traslación cuyo vector u puede obtenerse transformando un sólo punto, por ejemplo el P , obteniéndose
P0 = (HQ,µ −1◦HP,µ )(P) = HQ,µ −1(HP,µ (P)) = HQ,µ −1(P) =
24.6.
Composición de traslaciones con homotecias y simetrı́as centrales
357
= (1 − µ−1 )Q + µ−1 P,
de forma que
u = PP0 = (1−µ−1 )Q+µ−1 P−P = (1−µ−1 )PQ =
⇒ HQ,µ−1 ◦ HP,µ = Tu , con u =
µ−1
PQ ⇒
µ
µ−1
PQ,
µ
donde hemos puesto µ = µ1 , µ−1 = µ2 . Esta composición no
conmuta, sino que se obtiene
HP,µ ◦ HQ,µ−1 = Tv , con v = (µ − 1)PQ.
2) µ1 µ2 6= 1.
La compuesta es una homotecia de razón µ1 µ2 y centro U tal
que
U = (HQ,µ2 ◦HP,µ1 )(U) = HQ,µ2 (HP,µ1 (U)) = HQ,µ2 ((1−µ1 )P+µ1 U) =
= (1 − µ2 )Q + µ2 ((1 − µ1 )P + µ1 U),
llegándose a que
HQ,µ2 ◦ HP,µ1 = HU,µ1 µ2 , con U = P +
1 − µ2
PQ;
1 − µ1 µ2
esta composición no conmuta, sino que se obtiene
HP,µ1 ◦ HQ,µ2 = HV,µ1 µ2 , con V = P +
µ1 (1 − µ2 )
PQ,
1 − µ1 µ2
observándose que en ambos casos el nuevo centro queda alineado
con los centros P y Q de los datos.
Particularizando en el grupo T C(E, IK), se obtiene:
1. Tv ◦ Tu (traslación seguida de traslación):
Tv ◦ Tu = Tu+v .
2. SP ◦ Tu (traslación seguida de simetrı́a central):
SP ◦ Tu = SR , con R = P − u/2
3. Tu ◦ SP (simetrı́a central seguida de traslación):
Tu ◦ SP = SS , con S = P + u/2
4. SQ ◦ SP (simetrı́a central seguida de simetrı́a central):
SP ◦ SP = IE ,
SQ ◦ SP = Tu , con u = 2PQ,
SP ◦ SQ = Tv , con v = −2PQ.
358
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
24.7.
Estructura de los grupos T H∗ (E, IK) y T C(E, IK)
∗
Proposición 315 Fijado un punto O ∈ E, consideremos los subgrupos HO
(E, IK)
∗
y T (E, IK) de T H (E, IK). Entonces,
∗
1. HO
(E, IK) ∩ T (E, IK) = {IE }.
∗
2. HO
(E, IK)T (E, IK) = T H∗ (E, IK).
3. T (E, IK) es normal en T H∗ (IK).
Demostracion:
1. Las traslaciones carecen de puntos fijos, salvo la T0 = IE , mientras que
los elementos del primer grupo tienen a O como doble. Por tanto, su
intersección se reduce a IE .
2. Si f ∈ T H∗ (E, IK), podemos tomar (proposición 282) f = Tu ◦ g, donde g
es afı́n, g(O) = O y u = f (O). Entonces,
f, Tu ∈ T H∗ (E, IK) ⇒ T−u ◦ f = g ∈ T H∗ (E, IK),
y, puesto que g tiene a O como punto doble, g debe ser una homotecia de
centro O. Ası́, todo elemento del grupo T H∗ (E, IK) se obtiene operando
una homotecia de centro O con una traslación.
3. Siendo T (E, IK) normal en el grupo total Af (E, IK), lo es en cualquier
subgrupo.
2
∗
Este teorema indica que T H∗ (E, IK) es producto semidirecto de HO
(E, IK) (iso∗
morfo al grupo multiplicativo IK ) por T (E, IK) (isomorfo al grupo aditivo V).
Fijado O ∈ E, tenemos el grupo {SO , IE } de orden 2, subgrupo de T C(E, IK).
Razonando análogamente a la proposición anterior, obtenemos
Proposición 316 Fijado un punto O ∈ E, consideremos los subgrupos {SO , IE }
y T (E, IK) de T C(E, IK). Entonces,
1. {SO , IE } ∩ T (E, IK) = {IE }.
2. {SO , IE }T (E, IK) = T C(E, IK).
3. T (E, IK) es normal en T H(IK).
Por ello, T C(E, IK) es producto semidirecto de {SO , IE } (isomorfo al grupo multiplicativo {−1, 1}) por T (E, IK) (isomorfo al grupo aditivo V).
24.8.
Proyecciones paralelas y simetrı́as oblı́cuas
24.8.
359
Proyecciones paralelas y simetrı́as oblı́cuas
Sea F un subespacio afı́n de E dirigido por el subespacio U de V. Sea W un
complemento de U y sea G cualquier subespacio afı́n dirigido por W. Ya hemos
definido la proyección p sobre F paralelamente a G (sección 20.13) y hemos
probado (proposición 270) que se trata de un endomorfismo afı́n cuya aplicación
lineal asociada es el endomorfismo proyector pe de V sobre U paralelamente a
W. Si A es un punto de F, se ha obtenido que
p(X) = A + pe(AX),
donde los vectores de posición se toman respecto de un origen O prefijado.
Precisamente para él, se tiene
p(0) = A + pe(AO) = A − pe(A).
Usando este valor, puede escribirse
p(X) = p(O) + pe(X),
que es la forma habitual de la ecuación de un endomorfismo afı́n.
Proposición 317 Sea p la proyección sobre F paralelamente a G. Entonces,
1. X ∈ F ⇔ p(X) = X.
2. Para cada P ∈ F, se cumple X ∈ G(P ) ⇔ p(X) = P.
3. p2 = p.
4. pe2 = pe.
5. ∀X ∈ E ⇒ pe(Xp(X)) = 0.
Demostracion:
1. Si X ∈ F , el corte de F con G(X), por ser un solo punto, no puede ser
otro que X, luego p(X) = X. Recı́procamente, si p(X) = X, puesto que
p(X) ∈ F, se tiene X ∈ F.
2. Basta ver que
X ∈ G(P ) ⇒ G(X) = G(P ) ⇒ p(X) = F ∩ G(X) = F ∩ G(P ) = p(P ) = P
3. Puesto que p(X) ∈ F, según la primera propiedad, se cumple
p2 (X) = p(p(X)) = p(X),
luego p2 = p.
360
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
4. Toda proyección lineal goza de esta propiedad y pe lo es.
5. Puesto que X, p(X) ∈ G(X), por ser W = Ker pe , resulta
Xp(X) ∈ W ⇒ pe(Xp(X)) = 0.
2
Si bien la aplicación lineal asociada a una proyección afı́n es una proyección
lineal, no es cierto que todo endomorfismo afı́n f , para el cual pe sea un proyector,
sea una proyección afı́n. Sı́ va a serlo cuando la quinta propiedad de antes la
cumpla algún punto del espacio.
Proposición 318 Un endomorfismo afı́n f es una proyección si y sólo si fe es
un proyector lineal y, para algún O ∈ E, se cumple que fe(Of (O)) = 0.
Demostracion:
Siendo fe un proyector lineal, será la proyección sobre U = Im fe paralelemente a W = Ker fe . Si F = Im f , según la proposición 279, se tendrá
V (F) = V (f (E)) = fe(V (E)) = fe(V) = Im fe = U.
Entonces, puede considerarse la proyección afı́n p sobre F según la dirección de
W. Su endomorfismo lineal asociado pe coincide con la proyección de V sobre U
paralelamente a W, luego pe = fe. Por otra parte, como f (O) ∈ F, se tiene
fe(Of (O)) = 0 ⇒ Of(O) ∈ W ⇒ O ∈ G(f (O)) ⇒ p(O) = f (O).
De las igualdades
pe = fe, p(O) = f (O),
y considerando a O como origen, se sigue que
p(X) = pe(X) + p(O) = fe(X) + f (O) = f (X) ⇒ p = f.
Si f es una proyección, según la proposición 317, cumple los requisitos del
enunciado.
2
Proposición 319 Un endomorfismo afı́n f es una proyección si y sólo si
f 2 = f.
Demostracion:
Para un origen prefijado O se tendrá
f (X) = fe(X) + f (O) ⇒ f 2 = f ⇒
⇒ f 2 (X) = f (f (X)) = f (fe(X) + f (O)) = fe(fe(X) + f (O)) + f (O) =
24.8.
Proyecciones paralelas y simetrı́as oblı́cuas
361
= fe(fe(X)) + fe(f (O)) + f (O) = f (X) = fe(X) + f (O) ⇒
⇒ fe2 = fe, fe(f (O)) = 0.
Ahora basta aplicar la proposición 318 para asegurar que f es una proyección.
Si f es una proyección, según la proposición 317, cumple la condición del
enunciado.
2
En general, U será un subespacio propio, en cuyo caso p nunca será biyectiva ya
que Im pe = U y Ker pe = W son propios. Sin embargo, en los casos impropios,
se tiene
a) Si U = V, W = {0}, es p = IE , pe = IV .
b) Si U = {0}, W = V, p es constante y pe es el endomorfismo nulo.
Es decir, la identidad es una proyección, pero también lo son todas las aplicaciones constantes.
Sean F y G dos subespacios complementarios de E. Sea p la proyección sobre F
paralelamente a G. Buscando un punto s(X) tal que p(X) sea punto medio de
X y s(X), se tiene una aplicación s : E → E conocida como simetrı́a oblı́cua
de eje F paralemente a G.
Proposición 320 Sea s una simetrı́a oblı́cua asociada a la proyección p. Entonces, s es afı́n y se es la simetrı́a vectorial asociada a pe.
Demostracion:
De la propia definición se sigue la ecuación
s(X) = 2p(X) − X = 2e
p(X) − X + 2p(O).
En particular, es s(O) = 2p(O), luego podemos escribir
s(X) = 2e
p(X) − X + s(O) = (2e
p − IV )(X) + s(O).
Puesto que 2e
p − IV es lineal, según la proposición 279, s es afı́n y su aplicación
lineal asociada es la se = 2e
p − IV , o sea, la simetrı́a vectorial asociada a pe.
2
Proposición 321 Sea s la simetrı́a de eje F y dirección G. Entonces,
1. X ∈ F ⇔ s(X) = X.
2. Para cada P ∈ F, se cumple X ∈ G(P ) ⇔ s(X) = SP (X).
3. p ◦ s = p.
4. s2 = IE .
5. se2 = IV .
362
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
6. ∀X ∈ E ⇒ se(Xs(X)) + Xs(X) = 0.
Demostracion:
1. De acuerdo con la definición de s, se tiene
s(X) = X ⇔ 2p(X) = X + s(X) = 2X ⇔ p(X) = X ⇔ X ∈ F.
2. Basta ver que
s(X) = SP (X) ⇔ 2P = X + s(X) = 2p(X) ⇔ P = p(X) ⇔ X ∈ G(P ).
3. Aplicando la fórmula de la proposición 277, se tiene
(p ◦ s)(X) = (e
p ◦ se)(X) + pe(s(O)) + p(O) = pe(X) + p(O) = p(X),
porque pe ◦ se = pe (proposición 102) y porque
pe(s(O)) = pe(2p(O)) = 2e
p(p(O)) = 0.
4. Aplicando la anterior propiedad y simplificando, se tiene
s(X) + s2 (X) = 2p(s(X)) = 2p(X) = X + s(X) ⇒ s2 (X) = X ⇒ s2 = IE .
5. Toda simetrı́a lineal goza de esta propiedad y se lo es.
6. Puesto que s(X) = 2p(X) − X, s(X) está en G(X) por ser combinación
afı́n de X, p(X) ∈ G(X). Entonces,
Xs(X) ∈ W ⇒ se(Xs(X)) = −Xs(X) ⇒ se(Xs(X)) + Xs(X) = 0,
porque la restricción de se a W es −IV (proposición 102).
2
De manera similar a la proposición 318, tenemos el siguiente:
Proposición 322 Una afinidad f es una simetrı́a si y sólo si fe es una simetrı́a
lineal y, para algún O ∈ E, se cumple que fe(Of (O)) + Of (O) = 0.
Demostracion:
Si fe es una simetrı́a lineal, pe = (fe + IV )/2 es un proyector. Con él como
aplicación lineal asociada y tomando p(O) como el punto medio de O y f (O),
construı́mos un endomorfismo afı́n p. Tomando O como origen para los vectores
de posición, se tendrá
pe(Op(O)) = pe(p(O)) = pe(2f (O)) = 2e
p(f (O)) = (fe + IV )(f (O)) =
24.8.
Proyecciones paralelas y simetrı́as oblı́cuas
363
= fe(f (O)) + f (O) = 0.
Aplicando la proposición 318, p es una proyección afı́n. Con ella construı́mos la
simetrı́a s y se tiene
se = 2e
p − IV = (fe + IV ) − IV = fe, s(O) = 2p(O) = f (O).
Estas dos igualdades permiten establecer que s y f tienen la misma ecuación,
luego s = f .
Si f es una simetrı́a, según la proposición 321, cumple los requisitos del
enunciado.
2
Proposición 323 Una afinidad f es una simetrı́a si y sólo si
f 2 = IE .
Demostracion:
Para un origen prefijado O se tendrá la ecuación
f (X) = fe(X) + f (O).
Entonces,
f 2 = IE ⇒ f 2 (X) = f (f (X)) = f (fe(X) + f (O)) = fe(fe(X) + f (O)) + f (O) =
= fe(fe(X)) + fe(f (O)) + f (O) = IE (X) = X ⇒
⇒ fe2 = IV , fe(f (O)) + f (O) = 0.
Ahora basta aplicar la proposición 322 para asegurar que f es una simetrı́a.
Si f es una simetrı́a, cumple la condición del enunciado (321).
2
Señalemos, para finalizar, cómo son las simetrı́as asociadas a los proyectores
impropios:
1. Si p = IE , tenemos
X + s(X) = 2p(X) = 2X ⇒ s(X) = X,
o sea, su simetrı́a asociada también es la identidad.
2. Si p(X) = P , tenemos
X + s(X) = 2p(X) = 2P,
es decir, su simetrı́a asociada es la de centro P .
364
24.9.
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
Simetrı́as especulares y simetrı́as axiales
Una simetrı́a cuyo eje sea un hiperplano H se nombra como simetrı́a especular. Supongamos que H pasa por A y está dirigido por el hiperplano vectorial
H, de ecuación σ(x) = 0 para una cierta forma lineal σ. Su ecuación será
σ(X − A) = 0.
Sea u 6= 0 un vector tal que σ(u) 6= 0. Entonces, < u > es un complemento
de H y podremos considerar la proyección pH sobre H según la dirección de
< u >. Para un punto P ∈ E, la recta determinada por P y u es la
X = P + tu = 0.
Buscando su punto de corte con H, obtenemos
σ(P + tu − A) = σ(AP + tu) = σ(AP) + tσ(u) = 0 ⇒ t = −σ(AP)/σ(u).
Llevando este valor de t a la ecuación de la recta, obtenemos el proyectado de
P . Tomando X en lugar de P , llegamos a la ecuación
pH (X) = X −
σ(AX)
u.
σ(u)
En particular, pH (O) = (σ(A)/σ(u))u. Sustituyendo A por este punto, también
podremos escribir
σ(X)
pH (X) = pH (O) + X −
u.
σ(u)
La simetrı́a especular asociada a esta proyección admitirá las ecuaciones
SH (X) = X − 2
σ(X)
σ(AX)
u, SH (X) = SH (O) + X − 2
u.
σ(u)
σ(u)
Una simetrı́a cuyo eje sea una recta R se nombra como simetrı́a axial. Si R
está determinada por un punto A y un vector u 6= 0, su ecuación será
X = A + tu.
Sea σ una forma lineal tal que σ(u) 6= 0. Entonces, H = Ker σ es un hiperplano
vectorial complementario de la recta < u > y podremos considerar la proyección
pR sobre la recta R según la dirección de H. Para un punto P ∈ E, el hiperplano
afı́n que pasa por P y está dirigido por H tiene la ecuación
σ(X − P) = 0.
Buscando su punto de corte con R, obtenemos
σ(A + tu − P) = σ(−AP + tu) = −σ(AP) + tσ(u) = 0 ⇒ t = σ(AP)/σ(u).
24.10.
Complementos / Ejercicios
365
Llevando este valor de t a la ecuación de la recta, nos obtenemos el proyectado
de P . Poniendo X en lugar de P para indicar un punto genérico, llegamos a la
ecuación
σ(AX)
u.
pR (X) = A +
σ(u)
En particular, se obtiene pR (O) = A − (σ(A)/σ(u))u. Sustituyendo A por este
punto, también podremos escribir
pR (X) = pR (O) +
σ(X)
u.
σ(u)
La simetrı́a axial asociada a esta proyección admitirá las ecuaciones
SR (X) = 2A − X + 2
24.10.
σ(AX)
σ(X)
u, SR (X) = SR (O) − X + 2
u.
σ(u)
σ(u)
Complementos / Ejercicios
1. Sea X 0 el simétrico de X en la simetrı́a de centro P . Entonces,
[P, X 0 , X] = −1, ∀X 6= P.
2. Sea X 0 el punto homotético de X en la homotecia de centro P y razón µ.
Entonces,
[P, X 0 , X] = µ, ∀X 6= P.
3. El espacio afı́n IR3 se supone referido a su sistema canónico de ejes. Resolver los siguientes ejercicios:
a) Sean H y R el plano y la recta de ecuaciones respectivas
3x − y + z = 3,
x = λ, y = 1, z = 3 − 2λ.
Comprobar que inciden en un punto A. Obtener las ecuaciones de
pH,R y SH,R .
b) Comprobar que el endomorfismo afı́n f de ecuaciones
1
0
0 0
1
1
−6 −1 −2 4 x x0
× = 0
−3 −1
0 2
y
y
−3 −1 −1 3
z
z0
es un proyector. Determinar su eje y dirección, ası́ como las ecuaciones
de la simetrı́a que subordina.
366
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
c) Comprobar que el endomorfismo afı́n f de ecuaciones
1 0
0
0
1
1
−6 3
x x0
0
−4
−4 2 −1 −2 × y = y 0
−6 2
0 −3
z
z0
es una simetrı́a. Determinar su eje y dirección.
d ) Comprobar que el operador afı́n f de ecuaciones
x0 = −5x + 3y − 12z − 6
y 0 = −2x + 2y − 4z − 2
z 0 = 2x − y + 5z + 2
es un proyector especular. ¿Qué recta lo dirige?
4. Sea un número µ ∈ IR∗ . Sea E un espacio afı́n real de dimensión finita
n ≥ 2. Sean un hiperplano H y una recta R incidentes en un punto A.
Dado un punto X, sea Y su proyección sobre H paralelamente a R y sea
X 0 un nuevo punto tal que
YX0 = µYX.
La aplicación
DH,R,µ : E → E, de ley X 7→ X 0 ,
recibe el nombre de deslizamiento oblı́cuo o deformación de espejo
(o eje si n = 2) H, directriz R y razón µ. Suponiendo que
H : σ(AX) = 0, R : X = A + tu,
obtener la ecuación de f = DH,R,µ . Comprobar que se trata de una
afinidad e indicar su automorfismo lineal asociado. ¿Cuál es su afinidad
inversa? ¿Cuánto vale su determinante?
5. La identidad y la simetrı́a oblı́cua SH,R son casos particulares de deformaciones. ¿A qué razones corresponde cada una de ellas?
6. Obtener las ecuaciones del deslizamiento de razón 7 sobre el plano
2(x − 1) + y − 2(z − 2) = 0,
según la dirección de la recta
x = 1 + λ, y = 2λ, z = 2 − λ.
7. Sea f una afinidad con det(f ) 6= 1 y un hiperplano H de puntos dobles.
Razonar que se trata de un deslizamiento oblı́cuo de espejo H.
24.10.
Complementos / Ejercicios
367
8. Comprobar que la afinidad de ecuaciones
x0 = 6x + 2y − z + 1
y 0 = −5x − y + z − 1
z 0 = 5x + 2y
+1
es un deslizamiento oblı́cuo. Determinar su espejo, su dirección y su razón.
9. Una afinidad f con determinante igual a 1 y un hiperplano de puntos
dobles se conoce como transvección o deslizamiento horizontal. ¿Cuál
es su automorfismo lineal asociado? Véase que las ecuaciones
x0 = 7x − 4y + 4z + 2
y 0 = 3x − y + 2z + 1
z 0 = −6x + 4y − 3z − 2
definen una transvección. ¿Cuál es su espejo y vector director?
10. Sea f una afinidad tal que fe sea un deslizamiento lineal (oblicuo u horizontal). ¿Se trata necesariamente de un deslizamiento afı́n? Véase que f
se descompone en un deslizamiento seguido de una traslación con vector
paralelo al espejo.
11. Estudiar y descomponer las siguientes afinidades:
0
x
2
3 −2 2
x
a) y 0 = 1 0 1 × y + 2 .
z
2
2 −2 3
z0
0
x
1
5
1
2
x
b) y 0 = −8 −1 −4 × y + 3 .
z
0
z0
−4 −1 −1
12. Sean H y K dos hiperplanos afines paralelos entre sı́ y sea R una recta
incidente con ellos. Componer las simetrı́as especulares SH y SK según
la dirección de R, comprobando que resulta una traslación. ¿Cuál es su
vector?
13. Dada una traslación, comprobar que se descompone de infinitas maneras
en dos simetrı́as de espejos paralelos entre sı́ y no paralelos al vector de
traslación.
14. Hemos visto que el grupo T H∗ (E, IK) de las afinidades autoparalelas
está formado por homotecias de razón no nula y por traslaciones. Fijado un
origen O, también hemos visto que toda transformación f ∈ T H∗ (E, IK)
se descompone en una homotecia de centro O seguida de una traslación.
368
Capı́tulo 24. Simetrı́as, Traslaciones y Homotecias
De esta forma, dadas f, g ∈ T H∗ (E, IK), existen números no nulos λ, µ y
vectores u, v de manera que
f = Hλ Tu , g = Hµ Tv
(aunque no lo indiquemos, las homotecias se suponen de centro 0). Aplicando que h−1 Tu h = Th(u) (proposición 295), cualquiera que sea la afinidad
h, obtener la descomposición en homotecia seguida de traslación para las
afinidades f , g y f −1 .
369
Capı́tulo 25
Clasificación de
Endomorfismos Lineales.
Preliminares
25.1.
Semejanza de matrices y endomorfismos
lineales
Recordemos que, dadas dos matrices A, B ∈ M(n, IK), se dice que A es semejante a B si existe una matriz regular P ∈ GL(n, IK) tal que
B = P −1 × A × P,
y que la semejanza de matrices es una relación de equivalencia en el conjunto
M(n, IK).
Fijado V de dimensión n y una base B de V, si A es la matriz de un cierto
endomorfismo f de V en B, cada matriz B semejante a la A representa al
mismo endomorfismo en otra base C de V. Es decir, cada endomorfismo de V
se iguala a una clase de semejanza de las matrices de M(n, IK).
25.2.
El problema de la diagonalización
Como ocurre siempre que se forman las clases asociadas a una relación de equivalencia, debemos centrar nuestro interés en la búsqueda, para cada clase de
semejanza de matrices cuadradas, de representantes de la forma más simple
posible. Geométricamente, esto será equivalente a buscar una base B en la que
un endomorfismo dado se pueda estudiar canónicamente.
Sin duda, los endomorfismos f más simples de todo espacio son las homotecias
370
Capı́tulo 25. Clasificación de Endomorfismos Lineales. Preliminares
vectoriales, es decir, los de ley
x 7→ λx,
donde λ es un número fijo (razón de la homotecia). En estos casos, la matriz
de f , en cualquier base, tendrá la forma λI, siendo I la matriz unidad de n
filas y n columnas, o sea, se trata de una matriz escalar, a su vez, el tipo
más simple de matrices cuadradas. Pero, el coincidir en todas las bases, nos
indica que su clase de semejanza se reduce a la propia matriz λI, por lo que
ningún endomorfismo que no sea una homotecia podrá alcanzar esta forma de
representación.
El siguiente paso de sencillez consistirı́a en endomorfismos para los cuales exista
una descomposición
V = V1 ⊕ V2 ⊕ . . . ⊕ Vr
de V en suma directa de subespacios de manera que la restricción de f a cada uno de ellos se convierta en una homotecia del mismo. Esto requerirı́a la
existencia de unos escalares λ1 , λ2 , . . . , λr tales que
∀x ∈ Vi ⇒ f (x) = λi x.
Estos coeficientes se definirán como los autovalores de f , siendo cada vector
x ∈ Vi (x 6= 0) un autovector asociado al autovalor. Uniendo bases de cada uno de estos subespacios, se obtiene una base de V para la cual la matriz
será diagonal. Por eso la consecución de este objetivo se planteará como la
diagonalización de un endomorfismo. Cuando sea posible, se dirá que f
es diagonalizable. Partiendo de una matriz A que represente a f , esto significará que A sea semejante a una matriz diagonal.
Como veremos más adelante, la diagonalización, no solamente no es posible
en todo caso, sino que su consecución va a resultar muy restrictiva. Por eso,
habrá que buscar otras formas de simplicidad que sean menos exigentes, o, si se
quiere, que sean más asequibles.
25.3.
El problema de la triangularización
Pensemos en un endomorfismo f para el que exista una base
B = {v1 , v2 , . . . , vn }
de manera que, si consideramos la escalera de subespacios
V1 =< v1 >, V2 =< v1 , v2 >, . . . , Vn =< v1 , v2 , . . . , vn >= V,
cada Vi sea invariante por f , en el sentido de que su imagen esté contenida
en el propio subespacio. Al formar la matriz de f en esta base, nos va a salir una
supratriangular (o triangular, sin más, como convendremos en nombrarla).
25.4. Las formas canónicas de Jordan
371
Este será el problema de triangularización. Si partimos de una matriz A, esto
equivaldrá a que sea semejante a una matriz triangular.
El problema de la triangularización, que incluye como caso particular al de la
diagonalización, tendrá respuesta positiva en muchos más casos que ésta. Aún
ası́, tampoco va a ser posible en todo endomorfismo, si bien probaremos que lo
es en el caso de espacios sobre cuerpos, como el C
I de los números complejos,
que sean algebraicamente cerrados.
25.4.
Las formas canónicas de Jordan
Un endomorfismo triangularizable, puede admitir diversas matrices triangulares,
y dentro de ellas son de especial sencillez (con un amplio campo de aplicaciones)
las llamadas matrices (o formas) canónicas normales de Jordan. Su aspecto va a ser
λ1 ²1 0 . . .
0
0
0
0
0 λ2 ² 2 . . .
0 λ3 . . .
0
0
0
.
,
.
.
.
.
.
..
..
..
..
.
..
.
0
0
0 ... λ
²
0
0
0
...
n−1
n−1
0
λn
es decir, sobre la diagonal sólo hay posibles términos no nulos en la lı́nea paralela
superior inmediata, con la pecualiaridad, además, de que cada ²i puede tomar
únicamente valores iguales a 0 o a 1, debiendo ser λi+1 = λi en los casos en
que ²i = 1. Una base en la que f se represente por una matriz de este tipo se
nombrará como base de Jordan.
Ahora bien, bueno es señalarlo desde ahora, tanto su obtención como su descripción en términos geométricos, requerirá un nivel de teorı́a sensiblemente
superior al que habitualmente se presenta en otros tópicos de un primer curso
de Algebra y Geometrı́a.
372
Capı́tulo 25. Clasificación de Endomorfismos Lineales. Preliminares
373
Capı́tulo 26
Autovalores y Autovectores
de un Endomorfismo Lineal
26.1.
Autovalores y autovectores
Sea f un endomorfismo de V. Un escalar λ se dice que es autovalor, valor
propio o raı́z caracterı́stica de f si existe un vector u 6= 0 tal que
f (u) = λu.
El vector u recibe el nombre de autovector, vector propio o vector caracterı́stico asociado al autovalor λ.
El conjunto de todos los autovalores se conoce como espectro de f .
26.2.
Subespacios invariantes por un endomorfismo
Sabemos que un subespacio U de V se dice que es f -invariante (o invariante
por f ) cuando
∀x ∈ U ⇒ f (x) ∈ U,
y que, entonces, la restricción de f a U es un endomorfismo de U. Por ejemplo,
cualquier subespacio U es invariante por una homotecia λI; los subespacios
impropios {0} y V son invariantes para todo operador f .
Se prueba fácilmente (sección 6.18) que Ker f e Im f son invariantes por f ,
que U + W y U ∩ W son invariantes si U y W lo son, y que U es invariante
por f + g, af y g ◦ f siempre que lo sea por f y por g. Añadimos ahora otros
resultados:
374
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
Proposición 324 Sea {u1 , u2 , . . . , up } una base de un subespacio U de V que
tenga dimensión finita p ≥ 1. Entonces, U es f -invariante si y sólo si
f (uj ) ∈ U, ∀j ∈ [1, p].
Demostracion:
Si x ∈ U, entonces
x=
p
X
j=1
aj uj ⇒ f (x) =
p
X
aj f (uj ) ∈ U
j=1
porque f (uj ) ∈ U y U es un subespacio.
Si U es f -invariante, como uj ∈ U, se tiene f (uj ) ∈ U.
2
Proposición 325 Si u es un autovector del autovalor λ de f , la recta < u >
es f -invariante y cada vector no nulo x ∈< u > vuelve a ser autovector.
Demostracion:
Basta observar que
x ∈< u >⇒ ∃a ∈ IK/x = au ⇒ f (x) = f (au) = af (u) = a(λu) =
= (aλ)u = (λa)u = λ(au) = λx ∈< u > .
2
Proposición 326 Sea U un subespacio de dimensión finita de V y sea f un
automorfismo. Si U es invariante por f , también lo es por f −1 .
Demostracion:
Siendo f biyectiva y f (U) ⊆ U, se tiene
dim(f (U)) = dim(U) ⇒ f (U) = U ⇒ U = f −1 (U).
2
26.3.
Autoespacio asociado a un autovalor
Proposición 327 El número λ es un autovalor del endomorfismo f si y sólo
si f − λI es un endomorfismo no inyectivo.
Demostracion:
Por definición, λ es autovalor de f cuando existan soluciones no nulas de la
ecuación vectorial f (x) = λx. Ahora bien,
f (x) = λx ⇔ f (x) − λx = f (x) − λI(x) = (f − λI)(x) = 0 ⇔
⇔ x ∈ Ker(f − λI) ⇔ Ker(f − λI) 6= {0},
condición equivalente a la no inyectividad de f − λI.
2
26.4. Caso finito-dimensional. Polinomio caracterı́stico
375
Proposición 328 Si λ es un autovalor de f , el conjunto Ker (f − λI) es un
subespacio f -invariante de V.
Demostracion:
Es un subespacio por ser el núcleo de una aplicación lineal. Además, es
f -invariante porque
x ∈ Ker(f − λI) ⇒ f (x) = λx ∈ Ker(f − λI).
2
El conjunto Ker(f −λI), resultado de unir el vector 0 con todos los autovectores
de λ, se conoce como autoespacio de f para el autovalor λ.
Proposición 329 Si dos endomorfismos f y g de V son conmutables, los posibles autoespacios de uno de ellos son invariantes por el otro.
Demostracion:
Supongamos, por ejemplo, que λ es un autovalor de f y sea U = Ker(f −λI).
Entonces,
x ∈ U ⇒ f (g(x)) = g(f (x)) = g(λx) = λg(x) ⇒ g(x) ∈ U,
luego también U es invariante por g.
26.4.
2
Caso finito-dimensional. Polinomio caracterı́stico
Siendo V de dimensión finita n ≥ 1, sea B = {v1 , v2 , . . . , vn } una base de
V y sea A = M (f, B). En la condición dada para que λ sea un autovalor se
podrá sustituir la no inyectividad de f −λI por la anulación de su determinante.
Ahora bien,
det(λI − A) = (−1)n det(A − λI),
de manera que la anulación de estos dos determinantes es simultánea.
Usando el primero, podremos afirmar que λ es un autovalor si y sólo si
¯
¯ λ − a11
¯
¯ −a21
det(λI − A) = ¯¯
..
.
¯
¯
−an1
−a12
λ − a22
..
.
...
...
−a1n
−a2n
..
.
−an2
...
λ − ann
¯
¯
¯
¯
¯ = 0.
¯
¯
¯
El desarrollo de este determinante es claramente una expresión polinómica de
grado n en el número λ. Introduciendo una indeterminada o variable ξ, esto
376
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
sugiere la consideración del polinomio
¯
¯ ξ − a11
¯
¯ −a21
det(ξI − A) = ¯¯
..
.
¯
¯
−an1
−a12
ξ − a22
..
.
...
...
−a1n
−a2n
..
.
−an2
...
ξ − ann
¯
¯
¯
¯
¯,
¯
¯
¯
del cual λ será una raı́z. Ası́, la búsqueda de autovalores se reduce a la de
las raı́ces de tal polinomio. Ahora bien, para la unicidad del proceso, debemos
probar que el polinomio no depende de la matriz A. O sea, que debe ser un
invariante de cada clase de semejanza. En efecto,
Proposición 330 Dadas dos matrices A, B ∈ M(n, IK), se tiene que
A ∼ B ⇒ det(ξI − B) = det(ξI − A).
Demostracion:
Si A es semejante a B, existe una matriz regular P tal que B = P −1 ×A×P .
Entonces,
P −1 × (ξI) × P = ξ(P −1 × I × P ) = ξI ⇒
⇒ ξI − B = P −1 × (ξI) × P − P −1 × A × P = P −1 × (ξI − A) × P ⇒
⇒ det(ξI − B) = det(P −1 × (ξI − A) × P ) =
= det(P −1 ) det(ξI − A) det(P ) = (det(P ))−1 det(ξI − A) det(P ) =
= det(ξI − A).
2
Vista su independencia respecto de la base que se fije, el polinomio
det(ξI − A)
se nombra como el polinomio caracterı́stico del endomorfismo f y se denota por Cf (ξ), o C(ξ) si la alusión a f se sobreentiende. La proposición 327 se
puede reformular en los siguientes términos:
Proposición 331 Siendo V de dimensión finita n ≥ 1, λ es un autovalor del
endomorfismo f si y sólo si es raı́z de su polinomio caracterı́stico.
Que muchos polinomios carezcan de raı́ces en el propio cuerpo IK, o las tengan
en cantidad inferior a su grado, justifica que la existencia de autovalores dependa
cada vez de los datos f , V y IK.
Para terminar, observemos que en el desarrollo de
C(ξ) = det(ξI − A) =
26.5. Restricción de un endomorfismo a un subespacio invariante
377
= αn ξ n + αn−1 ξ n−1 + . . . + α2 ξ 2 + α1 ξ + α0 ,
todos los términos de grado superior al primero proceden del producto
(ξ − a11 )(ξ − a22 ) . . . (ξ − ann ) = ξ n − (a11 + a22 + . . . + ann )ξ n−1 + . . .
de los elementos diagonales, obteniendo que
αn = 1, αn−1 = −tr.(A).
Por otra parte,
α0 = C(0) = det(−A) = (−1)n det(A).
Al ser C(ξ) un invariante lineal, lo son sus coeficientes y ası́ tenemos una prueba
alternativa de que el determinante y la traza son intrı́nsecos a f . Además, ahora
debe entenderse que hayamos escrito det(ξI − A) en lugar de det(A − ξI) con el
fin de asegurar que en el desarrollo de este determinante la potencia ξ n aparezca
siempre con coeficiente 1.
26.5.
Restricción de un endomorfismo a un subespacio invariante
Sea U un subespacio invariante y propio de f . Como la restricción de f a U es
un endomorfismo de U, tendrá un polinomio caracterı́stico que en lo sucesivo
anotaremos por CU (ξ). Tratamos de ver que es un divisor de C.
Sea dim(U) = p, donde 0 < p < n y sea q = n − p. Siendo W un complemento
de U, consideremos una base de V,
A = {u1 , u2 , . . . , up ; w1 , w2 , . . . , wq }
obtenida por unión de una de U con otra de W. Como U es f -invariante, cada
vector f (uj ) depende sólo de la base de U. Esto es, se tendrá
f (uj ) = a1j u1 + a2j u2 + . . . + apj uj .
Sin embargo, W no tiene por qué ser f -invariante, luego cada imagen f (wj )
tendrá un bloque de sumandos donde estén los ui y otro donde aparezcan los
wi . Es decir,
f (wj ) = b1j u1 + b2j u2 + . . . + bpj up + c1j w1 + c2j w2 + . . . + cqj wj .
Siendo q la proyección paralela de V sobre W y g la restricción a W de la
composición q ◦ f , se tiene
g(wj ) = q(f (wj )) = c1j w1 + c2j w2 + . . . + cqj wj ,
378
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
lo que nos indica (proposición 324) que W sı́ es invariante por g. Con estos
datos, se forma la matriz
a11
a21
..
.
ap1
M =
0
0
.
..
a12
a22
..
.
...
...
a1p
a2p
..
.
b11
b21
..
.
b12
b22
..
.
ap2
0
0
..
.
. . . app
... 0
... 0
..
.
bp1
c11
c21
..
.
bp2
c12
c22
..
.
b1q
b2q
..
.
. . . bpq
. . . c1q
. . . c2q
..
.
0
0
...
cq1
cq2
...
0
...
...
cqq
de f en la base A. En ella se distinguen cuatro bloques:
1. la submatriz cuadrada A = (aij ) ∈ M(p, IK),
2. la submatriz rectangular B = (bij ) ∈ M(p, q, IK),
3. la submatriz rectangular nula 0 ∈ M(q, p, IK),
4. la submatriz cuadrada C = (cij ) ∈ M(q, IK).
Además, A es la matriz de la restricción de f al subespacio U respecto de su base
{u1 , u2 , . . . , up }, mientras que C es la matriz de g en la base {w1 , w2 , . . . , wq }
de W.
Una matriz cuadrada M como ésta se dice es una matriz semidescompuesta
o matriz triangular por bloques. Abreviadamente, podemos escribir
µ
M=
A B
0 C
¶
.
Proposición 332 Para una matriz semidescompuesta se cumple que
µ
det
A
0
B
C
¶
= det(A) det(C).
Demostracion:
Aplicando el método de Gauss-Jordan para (aij ), obtenemos una matriz
triangular (αij ) tal que det(aij ) = det(αij ). Si cada uno de los pasos para
conseguirla se efectúa a la vez con las p primeras filas de M , las restantes no se
26.5. Restricción de un endomorfismo a un subespacio invariante
379
alteran, con lo cual
α11
0
..
.
0
det(M ) = det
0
0
.
..
α12
α22
..
.
...
...
α1p
α2p
..
.
β 11
β 21
..
.
β 12
β 22
..
.
0
0
0
..
.
. . . αpp
...
0
..
0
..
.
β p1
c11
c21
..
.
β p2
c12
c22
..
.
0
0
...
cq1
cq2
0
β 1q
β 2q
..
.
. . . β pq
. . . c1q
. . . c2q
..
.
... cqq
...
...
Si lo desarrollamos sucesivamente por sus p primeras columnas, queda
c
11
c21
det(M ) = α11 α22 · · · αpp det
..
.
cq1
c12
c22
..
.
cq2
. . . c1q
. . . c2q
..
=
.
. . . cqq
= det(αij ) det(C) = det(A) det(C).
2
Proposición 333 Si U es subespacio f -invariante propio, se cumple
CU (ξ) | C(ξ), 0 < grad(CU ) < grad(C).
Demostracion:
Volviendo a M como matriz de f , se tiene
µ
¶
ξIp − A
B
ξIn − M =
.
0
ξIq − C
Aplicando el anterior resultado y observando que A es la matriz de la restricción
de f a U, se obtiene
C(ξ) = det(ξIn − M ) =
= det(ξIp − A) det(ξIq − C) = CU (ξ) det(ξIq − C) ⇒ CU (ξ) | C(ξ).
Como grad(CU ) = dim(U) y 0 < dim(U) < n = grad(C), quedan probadas las
desigualdades propuestas.
2
Recordando el significado de la matriz C, el cociente
C(ξ)/CU (ξ) = det(ξIq − C)
queda interpretado como el polinomio caracterı́stico de la restricción g al complemento W de la composición q ◦ f .
380
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
26.6.
Una cota para la dimensión del autoespacio de un autovalor
Llamaremos orden de multiplicidad de un autovalor λ al que posea en
tanto que raı́z de su polinomio caracterı́stico.
Proposición 334 Si λ es un autovalor del endomorfismo f con orden de multiplicidad s, se cumple
dim(Ker (f − λI)) ≤ s.
Demostracion:
Siendo p = dim(Ker(f − λI)), sea
A = {u1 , u2 , . . . , up ; w1 , . . . , wq }, donde p + q = n = dim(V),
una base de V obtenida al ampliar otra {u1 , u2 , . . . , up } del subespacio f - invariante Ker(f − λI). La matriz de f en A es la
λ 0 . . . 0 b11 b12 . . . b1q
0 λ . . . 0 b21 b22 . . . b2q
.. ..
..
..
..
..
. .
.
.
.
.
0 0 . . . λ bp1 bp2 . . . bpq
,
M =
0 0 . . . 0 c11 c12 . . . c1q
0 0 . . . 0 c21 c22 . . . c2q
. .
..
..
..
..
.. ..
.
.
.
.
0 0 . . . 0 cq1 cq2 ... cqq
que es triangular por bloques. Según las proposiciones 332 y 333, tendremos
C(ξ) = (ξ − λ)p det(ξIq − C).
Esto nos muestra que λ, en tanto que raı́z caracterı́stica, va a aparecer cuando
menos p veces en la factorización del polinomio C(ξ). Si su orden es s, claramente
queda p ≤ s, que es lo que se trataba de demostrar.
Frente a s que da la mutiplicidad algebraica, el número
dim(Ker(f − λI))
es nombrado por algunos autores como orden de multiplicidad geométrica.
2
26.7.
Suma directa de subespacios invariantes
Si el subespacio f -invariante U admite un complemento W que también sea
f -invariante, el bloque B de la matriz M será nulo y la matriz C es la del
endomorfismo restricción de f a W.
26.8. Autovectores asociados a autovalores distintos
381
Como consecuencia, entonces, de la fórmula probada en la proposición 333,
queda demostrado lo siguiente:
Proposición 335 Si se tiene una descomposición V = U ⊕ W, donde U y W
sean subespacios f -invariantes propios, se cumple que
C(ξ) = CU (ξ)CW (ξ).
En este caso, se dice que M es una matriz descompuesta, matriz diagonal
por bloques y también que M es suma directa de A y C. Su aspecto será
a11 a12 . . . a1p 0
0 ... 0
a21 a22 . . . a2p 0
0 ... 0
..
..
..
..
..
..
.
.
.
.
.
.
¶
µ
ap1 ap2 . . . app 0
A 0
0
.
.
.
0
=
M=
0 C
0
0
.
.
.
0
c
c
.
.
.
c
11
12
1q
0
0
.
.
.
0
c
c
.
.
.
c
21
22
2q
.
.
.
.
.
.
..
..
..
..
..
..
0
0 . . . 0 cq1 cq2 . . . cqq
Acorde con el nombre de suma directa, a veces se escribe
M = A ⊕ C.
26.8.
Autovectores asociados a autovalores distintos
Proposición 336 Sean u1 , u2 , . . . , ur autovectores de f asociados, respectivamente a los autovalores
λ1 , λ2 , . . . , λr ,
distintos dos a dos. Entonces,
{u1 , u2 , . . . , ur }
es un sistema libre.
Demostracion:
La haremos por inducción en r.
Si r = 1, {u1 } es libre pues un autovector es no nulo.
Sean r autovectores u1 , u2 , . . . , ur , asociados a los autovalores λ1 , λ2 , . . . , λr ,
distintos dos a dos. Dada una relación
α1 u1 + α2 u2 + . . . + αr ur = 0,
382
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
aplicando a ambos miembros el morfismo f − λ1 I, obtenemos
α1 (λ1 − λ1 )u1 + α2 (λ2 − λ1 )u2 + . . . + αr (λr − λ1 )ur = 0.
Como el primer sumando del primer miembro es nulo, queda una combinación
lineal nula de r − 1 autovectores. Por la hipótesis de inducción, éstos serán
independientes, luego
α2 (λ2 − λ1 ) = . . . = αr (λr − λ1 ) = 0.
Más aún, como los autovalores son distintos entre sı́, nos queda
α2 = . . . = αr = 0.
Llevados estos valores a la relación original, ésta queda en la forma
α1 u1 = 0 ⇒ α1 = 0,
pues u1 6= 0. En resumen, {u1 , u2 , . . . , ur } también será un sistema libre.
2
Proposición 337 Si λ1 , λ2 , . . . , λr son autovalores de f , distintos dos a dos,
el subespacio
U = Ker(f − λ1 I) + Ker(f − λ2 I) + . . . + Ker(f − λr I),
es f -invariante y se trata de una suma directa.
Demostracion:
Como cada Ker(f − λi I) es un subespacio, se tiene
x=
r
X
i=1
r
r
r
X
X
X
xi ⇒ f (x) = f (
xi ) =
f (xi ) =
λi xi ∈ U,
i=1
i=1
i=1
luego U es f -invariante. Si un vector x de dicha suma tuviese dos descomposiciones
x = x1 + x2 + . . . + xr = y1 + y2 + . . . + yr ,
con xi , yi ∈ Ker(f − λi I), para cada i ∈ [1, r], obtendrı́amos
(x1 − y1 ) + (x2 − y2 ) + . . . + (xr − yr ) = 0,
con xi − yi ∈ Ker(f − λi I) para cada i ∈ [1, r]. Si algunos de estos sumandos
fuesen no nulos, se tratarı́a de autovectores y tendrı́amos una combinación lineal
nula con ellos, en contra de que sean linealmente independientes. Por tanto, para
cada i se tiene
xi − yi = 0 ⇒ xi = yi ,
2
es decir, se trata de una suma directa.
26.9. Complementos / Ejercicios
26.9.
383
Complementos / Ejercicios
1. Dado el operador f de IR3 que en la base canónica tiene la matriz
1 2 2
A = 0 2 1,
−1 2 2
comprobar que u = (1, 1, −1) y v = (2, 1, 0) son autovectores. Indicar sus
correspondientes autovalores.
2. Sea f el endomorfismo de IR3 dado en la base canónica por la matriz
1 0 −1
A = 1 2 1 .
2 2 3
Comprobar que los vectores
u1 = (1, −1, 0), u2 = (2, −1, −2), u3 = (1, −1, −2),
son autovectores de f y que son linealmente independientes. Obtener la
matriz de f en la base {u1 , u2 , u3 }.
3. Repetir el ejercicio anterior con los datos
2 2 1
A = 1 3 1 , u1 = (1, 1, 1), u2 = (1, 0, −1), u3 = (2, −1, 0).
1 2 2
4. Razonar que un operador f es singular si y sólo si admite al número λ = 0
como autovalor.
5. Sea f un endomorfismo singular. Entonces, el orden de multiplicidad del
autovalor λ = 0 es mayor o igual que dim(Ker f ).
6. Razonar que el operador f es un automorfismo si y sólo si el número 0 no
figura entre sus autovalores.
7. Sea f un automorfismo de V y sea λ un autovalor de f . Razonar que λ−1
es autovalor de f −1 .
8. Sea f un endomorfismo de V. Razonar que si U es un subespacio
f - invariante, también lo son f (U) y f −1 (U).
9. Sea U un subespacio de dimensión finita de V y sea f un automorfismo.
Si U es invariante por f −1 , también lo es por f .
384
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
10. En el espacio IR4 se considera el operador f de matriz
8
8
A=
20
12
−18
−18
−36
−20
17
14
32
20
−21
−18
−42
−26
en la base canónica. Comprobar que el plano U de ecuaciones
x2 = 2x1 − x4 , x3 = 2x1 ,
es f -invariante. Obtener una base {w1 , w2 } de U y ampliarla hasta una
base C = {w1 , w2 , w3 , w4 } de IR4 . Obtener la matriz de f en C. ¿Cuánto
vale det(A)?
11. Comprobar que el endomorfismo f de IR3 , representado por la matriz
5
0 −1
A = −10 2 3 ,
4
0 1
admite como invariantes a la recta R de ecuaciones x = z = 0 y al plano H
de ecuación 2x + y + z = 0. Compruébese que IR3 = R ⊕ H. Obtener bases
en estos subespacios y la matriz de f en la base que resulte de unirlas.
12. Comprobar que el endomorfismo f de IR4 , representado por la matriz
9
5
A=
4
1
−6
−2
−3
−1
−4
−4
−1
0
−12
−6
,
−6
−1
admite como invariantes a la recta R de ecuaciones
x1 = 6x4 , x2 = 3x4 , x3 = 3x4
y al hiperplano H de ecuación
x1 − x2 − 2x4 = 0.
Compruébese que IR4 = R ⊕ H. Obtener bases en estos subespacios y la
matriz de f en la base que resulte de unirlas.
13. Sabemos que dos matrices semejantes tienen el mismo polinomio caracterı́stico. ¿Es cierta la afirmación contraria?
14. Sea f un endomorfismo de un plano vectorial V, representado por una
matriz A en una cierta base. Comprobar que
C(ξ) = ξ 2 − tr.(A)ξ + det(A).
26.9. Complementos / Ejercicios
385
15. Caracterizar los endomorfismos de un plano vectorial real que posean un
autovalor real doble.
16. Sea f un endomorfismo de un plano vectorial real que admite dos autovalores imaginarios conjugados. Razonar que se trata de un automorfismo
par.
17. Sea f un endomorfismo de IR2 representado en su base canónica por la
matriz A. Calcular su polinomio caracterı́stico, indicando los posibles autovalores reales y su orden de multiplicidad:
¶
¶
µ
µ
2 1
3
4
b) A =
a) A =
1 2
−2 −3
µ
c) A =
19
−4
µ
e) A =
9
31
−1 10
−2 7
¶
µ
d) A =
¶
µ
f) A =
23
3
−108
−13
cos ω
sen ω
¶
-sen ω
cos ω
¶
18. Sea f un endomorfismo de un espacio tridimensional V. Comprobar que
C(ξ) = ξ 3 − tr(f )ξ 2 + tr(Adj(f ))ξ − det(f ).
19. Sea f un operador de IR3 representado en su base canónica por la matriz
A. Calcular su polinomio caracterı́stico, indicando los posibles autovalores
reales y su orden de multiplicidad:
−14 −8 12
−2 0 0
8 −6
a) A = 18 2 −1 b) A = 10
−10 0 3
−10 −6 8
1 1
c) A = 1 1
1 1
2
2
2
1 2 7
e) A = −1 6 1
−1 2 5
5
0
d) A = −10 2
4
0
5
f ) A = −1
−2
6
−1
−8
−1
3
1
−1
1
5
20. Sea f un endomorfismo de IRn representado en su base canónica por la
matriz A. Calcular su polinomio caracterı́stico y sus autovalores, indicando
los que son reales y los que son complejos, ası́ como, para unos y otros, su
orden de multiplicidad.
386
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
15
0 0
−156 2 0
a) A =
72
0 3
−10 0 0
7
1
c) A =
1
−1
3
0
e) A =
0
0
1
2
g) A =
0
−1
3
2
i) A = 1
2
2
4
0
−20
k) A =
0
−4
4
−2
1
0
l) A =
0
0
0
1
0
0
m) A = 1
0
0
0
1
7
−1
1
1
3
0
−1
−1
1
1
7
52 −38
−29 25
−92 79
−20 20
−1
0
0
3
−1
1
3
−1
0
0
1
0
0
−19
14
d) A =
44
12
7
1
f) A =
−1
3
−1 0
−1 0
0 0
0 0
−1 1
0
0
−2
0
−2
2
−1
2
−1
1
−1
0
2
1
−4
6
−40
4
−8
8
−5
2
0
0
0
0
1
2
−2
−1
1
−1
7
1
−1
0
−4
−1
−1
0
−1
−1
−1
15
2
−180
4
b) A =
90
−6
−10
−3
−6
−13
h) A =
−5
−18
1
0
j) A = 0
0
0
2
0 0
−1 0 0
0 10 0
2
0 0
0
6 0
0
6 3
−2
1
0
1
0
0
−1
0
−1
0
0
0
0
0
−1
1
−1
2
0 −1
4 −2
5 −2
−5 3
0
0
0
0
0
0
−1
0
0
1
0
0
0
0
0
0
0
3
0
0
1
7
−3
1
0
0
−1
0
−1
1
−6
0
0
−6
3
2
0
−5
0
0
−5
2
0
2
1
3
−3
−1
1
3
−2
1
−2
3
1
7
−1
1
0
−2
−2
49
−32
−98
−23
−1
−3
−1
7
0 10 0
2 20 −1
0 8
0
2 24 0
0
1
1
1
0
0
−2
2
0
2
0
0
−2
−1
0
26.9. Complementos / Ejercicios
2
0
0
n) A = 0
0
0
0
−2
1
−1
0
0
0
0
2
1
3
0
0
0
0
1
0
0
2
0
0
0
387
0
0
0
2
1
3
−4
6
0
0
5
−4
12
−13
5
0
0
3
−3
7
−7
21. Sea f el endomorfismo de IR6 representado en la base canónica por la
matriz
1 −2 1
0 0 0
0 −1 1 0 0
2
2 −2 1 0
−1 2
A=
.
2
3 −1 0 1
2
−3 −2 0
0 4 −2
−4 1
0 −1 4 0
Encontrar su polinomio caracterı́stico y razonar que no posee autovalores
reales. Calcular sus autovalores en el cuerpo C
I de los números complejos,
indicando su orden de multiplicidad.
22. Calcular el polinomio caracterı́stico del endomorfismo f que en la base
canónica de IRn se representa por la matriz
a1 b1
a2 b1
A=
...
a1 b2
a2 b2
..
.
...
...
an b1
an b2
...
a1 bn
a2 bn
,
..
.
a n bn
sabiendo que
a = (a1 , a2 , . . . , an ) 6= 0, b = (b1 , b2 , . . . , bn ) 6= 0.
Razonar que tr(A) es un autovalor de f .
23. Véase que los autovalores de la matriz
0 1 0 ...
0 0 1 ...
0 0 0 ...
. . .
.. .. ..
0 0 0 ...
1 0
0
...
0 0
0 0
0 0
.. ..
. .
0 1
0 0
son las raı́ces n-ésimas (complejas) de la unidad.
24. La matriz B se ha obtenido a partir de la A mediante las operaciones
elementales
C1 ↔ C3 , F1 ↔ F3 .
388
Capı́tulo 26. Autovalores y Autovectores de un Endomorfismo Lineal
Comprobar que ambas son semejantes.
1 0 1
4 3
A = 2 2 1, B = 1 2
0 3 4
1 0
0
2.
1
25. A partir del ejercicio anterior, pensemos en una matriz cuadrada arbitraria
A ∈ M(n, IK) y sea B la obtenida por trasposición de la columna j-ésima
y la k-ésima, seguida de la trasposición de la fila j-ésima y la k-ésima.
Razonar que A y B son matrices semejantes. Si C se obtiene por una
permutación de las columnas de A, seguida de la misma permutación en
las filas, ¿son A y C matrices semejantes?
26. Si f y g se representan en una misma base por matrices traspuestas entre
sı́, razonar que poseen el mismo polinomio caracterı́stico.
27. Razonar que las matrices A y B son semejantes, siendo
6 20 −34
3 2 −5
A = 2 6 −10 , B = 6 32 −51 .
4 20 −32
1 2 −3
28. Estudiar si las siguientes matrices A y B son semejantes:
6 6 −15
37 −20 −4
A = 1 5 −5 , B = 34 −17 −4 .
1 2 −2
119 −70 −11
29. Comprobar que las matrices A, B, C comparten el polinomio caracterı́stico. Razonar que A y B no son semejantes, pero A y C sı́ lo son. ¿Qué ocurre
con B y C?
4 6 −15
1 −3 3
−13 −70 119
A = 1 3 −5 , B = −2 −6 13 , C = −4 −19 34 .
1 2 −4
−1 −4 8
−4 −20 35
389
Capı́tulo 27
Triangularización y
Diagonalización de
Endomorfismos
27.1.
Endomorfismos triangularizables y diagonalizables
Un endomorfismo f de V se dirá triangularizable cuando exista una base Z
del espacio respecto de la cual se represente por una matriz
D = (dij ) tal que dij = 0, siempre que i > j,
esto es, por una matriz supratriangular.
Por otra parte, se dirá diagonalizable cuando exista una base Z del espacio
respecto de la cual se represente por una matriz
D = (dij ) tal que dij = 0, siempre que i 6= j,
es decir, por una matriz diagonal.
Como una matriz diagonal es triangular, todo endomorfismo diagonalizable
será triangularizable. La afirmación contraria, en general, es falsa.
27.2.
Una condición necesaria
Proposición 338 Dado un endomorfismo f en un espacio vectorial V de dimensión finita n ≥ 1 sobre el cuerpo conmutativo IK, es condición necesaria
tanto para la triangularización como para la diagonalización de f , que su polinomio caracterı́stico admita en IK un número de raı́ces igual a la dimensión del
espacio.
390
Capı́tulo 27. Triangularización y Diagonalización de Endomorfismos
Demostracion:
Tanto si f se puede trianguralizar como si se pudiera diagonalizar, expresando el polinomio caracterı́stico mediante la nueva matriz D, se obtiene
C(ξ) = det .(ξI − D) = (ξ − d11 )(ξ − d22 ) . . . (ξ − dnn ),
de manera que los coeficientes de la diagonal de D necesariamente han de ser
autovalores del endomorfismo. Al haber tantos como la dimensión n de V, el
teorema queda probado.
2
27.3.
Caracterización de la triangularización
Proposición 339 Todo endomorfismo f de un espacio vectorial V de dimensión finita n ≥ 1, que admita n autovalores sobre el cuerpo IK, se puede representar, para una cierta base, en forma triangular.
Demostracion:
Se hará por inducción respecto a la dimensión:
Si n = 1, la matriz de f es triangular en toda base que se fije.
En el caso general, tomando uno de los autovalores λ de f , podemos considerar el subespacio f -invariante U = Ker(f − λI). Siendo p su dimensión y
{u1 , u2 , . . . , up } una base, se abren dos alternativas:
1. p = n. Entonces, no hay nada que probar porque en la base {u1 , u2 , . . . , up },
f se representa por Diag(λ, λ, . . . , λ) que es triangular.
2. p < n. Sea, en este caso, W, de dimensión q = n − p < n, un complemento
de U y {w1 , w2 , . . . , wq } una base de W. Igual que en la proposición 334,
en la base A = {u1 , u2 , . . . , up ; w1 , . . . , wq } de V, f admite la matriz
λ 0 . . . 0 b11 b12 . . . b1q
0 λ . . . 0 b21 b22 . . . b2q
.. ..
..
..
..
..
. .
.
.
.
.
0 0 . . . λ bp1 bp2 . . . bpq
M =
0 0 . . . 0 c11 c12 . . . c1q
0 0 . . . 0 c21 c22 . . . c2q
. .
..
..
..
..
.. ..
.
.
.
.
0 0 . . . 0 cq1 cq2 ... cqq
y se tiene
C(ξ) = (ξ − λ)p det .(ξIq − C).
Como C(ξ) posee n raı́ces en IK y en el primer factor ya figuran p, en
el segundo deben estar las n − p = q restantes. Ahora bien, en la sección 26.5 se indicó que det(ξIq − C) era el polinomio caracterı́stico del
27.3. Caracterización de la triangularización
391
endomorfismo g, restricción a W de la composición de f con la proyección paralela sobre W. Entonces, dicho polinomio tiene tantas raı́ces en
IK como su dimensión, y, como ésta es menor que n, por la hipótesis de
inducción, el endomorfismo g de W es triangularizable. Por ello existe una
base {z1 , z2 , . . . , zq } de W en la que g se representa por
γ
γ
... γ
11
12
0
.
.
.
0
γ 22
..
.
...
γ 2q
..
.
.
1q
0
...
γ qq
Entonces, en la base Z = {u1 , u2 , . . . , up ; z1 , z2 , . . . , zq } de V, la matriz
semidescompuesta de f será de la forma
λ 0 . . . 0 β 11 β 12 . . . β 1q
0 λ . . . 0 β 21 β 22 . . . β 2q
.. ..
..
..
..
..
. .
.
.
.
.
0 0 . . . λ β p1 β p2 . . . β pq
N =
0 0 . . . 0 γ 11 γ 12 . . . γ 1q
0 0 ... 0
0
γ 22 . . . γ 2q
. .
.
.
.
.
.
.
.
.
.
.
. .
.
.
.
.
0
0
...
0
0
0
...
γ qq
que es triangular.
2
Proposición 340 Un endomorfismo f de un espacio vectorial V, de dimensión
finita n ≥ 1 sobre IK, es triangularizable si y sólo si su polinomio caracterı́stico
admite n raı́ces en dicho cuerpo.
Demostracion:
Se sigue de la anterior proposición y de la proposioción 338.
2
Ya se ha señalado que un polinomio puede no tener n raı́ces en IK, luego,
en general, no todo endomorfismo se va a triangularizar. Sı́ lo va a ser en los
cuerpos algebraicamente cerrados, de los que el prototipo es el cuerpo C
I de
los números complejos, en los cuales (a semejanza con éste) todo polinomio de
grado n admite exactamente n raı́ces.
La proposición 339 que acabamos de presentar, por basarse en argumentos de
recurrencia, podrı́a dar lugar a un método práctico de triangularización en los
casos en que f tenga n autovalores en IK. Su aplicación, no obstante, resulta
laboriosa y hasta farragosa. Más adelante los triangulizaremos de una manera más breve y natural mediante las formas canónicas normales de Jordan, y
quedará claro que la importancia de este teorema radica en demostrar la existencia de dicha triangularización, sirviendo de punto de partida para la obtención
de dichas formas.
392
Capı́tulo 27. Triangularización y Diagonalización de Endomorfismos
27.4.
Diagonalización en el caso de espectro simple
Proposición 341 Sea V un espacio vectorial de dimensión finita n ≥ 1 sobre
el cuerpo conmutativo IK. Sea f un endomorfismo lineal de V. Si f admite
n autovalores λ1 , λ2 , . . . , λn , distintos dos a dos, se puede encontrar una base
Z = {z1 , z2 , . . . , zn }, formada por autovectores de f , en la cual f se representa
por la matriz Diag(λ1 , λ2 , . . . , λn ).
Demostracion:
Para cada j ∈ [1, n], sea zj un autovector asociado a λj . Según la proposición
336 el sistema {z1 , z2 , . . . , zn } es libre, siendo de hecho una base porque su
cardinal coincide con la dimensión del espacio. Como f (zj ) = λj zj , la columna
j-ésima de la matriz de f para esta base tiene ceros en todos sus lugares, salvo
en el j donde está el escalar λj . Por tanto, la matriz de f en Z = {z1 , z2 , . . . , zn }
es la diagonal anunciada.
2
Estos endomorfismos se llaman de espectro simple y constituyen el caso más
sencillo de diagonalización.
27.5.
Caracterización de la diagonalización
Proposición 342 Sea f un endomorfismo diagonalizable del espacio V, y sea
λ un autovalor con orden de multiplicidad s. Entonces,
dim(Ker (f − λI)) = s.
Demostracion:
Por hipótesis existe una base
Z = {z1 , z2 , . . . , zn }
en la cual f se representa por una matriz
D = Diag(d1 , d2 , . . . , dn ).
Entre los coeficientes di debe aparecer el autovalor λ, y además s veces. Cambiando el orden de los vectores si fuese preciso, no hay inconveniente en suponer
que λ = d1 = d2 = . . . = ds . Entonces, los vectores z1 , z2 , . . . , zs están todos en Ker(f − λI) y, por estar extraı́dos de una base, son independientes.
De aquı́ se obtiene que s ≤ dim(Ker(f − λI)). Según la proposición 334, es
dim(Ker(f − λI)) ≤ s, luego queda probada la igualdad.
2
Proposición 343 Sea V de dimensión finita n ≥ 1 sobre IK y sea f un endomorfismo de V. Supongamos que
27.5. Caracterización de la diagonalización
393
1. Su polinomio caracterı́stico posea n raı́ces en IK.
2. Cada autoespacio tiene dimensión igual al orden de multiplicidad del correspondiente autovalor.
En estas condiciones, f es diagonalizable.
Demostracion:
Sean λ1 , λ2 , . . . , λr los autovalores distintos de f , y, para cada ı́ndice i, sea
si el orden de multiplicidad y Ker(f − λi I) el autoespacio coorrespondiente a
λi ; por hipótesis será
s1 + s2 + . . . + sr = n, dim(Ker(f − λi I)) = si .
Según la proposición 337, el subespacio
U = Ker(f − λ1 I) + Ker(f − λ2 I) + . . . + Ker(f − λr I)
es suma directa de sus sumandos, por lo cual
dim(U) =
r
X
i=1
dim(Ker(f − λi I)) =
r
X
si = n ⇒ U = V.
i=1
Ahora basta tomar bases en cada autoespacio para que, al unirlas, salga una
base de V formada por autovectores. Justamente en ella, f se representará por
una matriz diagonal.
2
Proposición 344 Sea V de dimensión finita n ≥ 1 sobre IK. El endomorfismo
f de V es diagonalizable si y sólo si se cumplen las condiciones
1. Su polinomio caracterı́stico posea n raı́ces en IK.
2. Cada autoespacio tiene dimensión igual al orden de multiplicidad del correspondiente autovalor.
Demostracion:
Se obtiene de unir las proposiciones 342 y 343 con la proposición 338.
2
Proposición 345 Sea V de dimensión finita n ≥ 1 sobre IK. Un endomorfismo
f de V es diagonalizable si y sólo si se cumplen las condiciones
1. Su polinomio caracterı́stico posee n raı́ces en IK.
2. El espacio total es suma directa de sus diversos autoespacios.
394
Capı́tulo 27. Triangularización y Diagonalización de Endomorfismos
Demostracion:
Basta ver la equivalencia entre la segunda afirmación y la segunda de la
anterior proposición:
Suponiendo que
V = Ker(f − λ1 I) ⊕ Ker(f − λ2 I) ⊕ . . . ⊕ Ker(f − λr I)
se obtiene, aplicando la proposición 334 y que f posee n autovalores en IK,
n = dim(V) =
r
X
dim(Ker(f − λ1 I)) ≤
i=1
⇒
r
X
dim(Ker(f − λi I)) =
i=1
r
X
si = n ⇒
i=1
r
X
si .
i=1
Ahora, como cada sumando del primer miembro no supera al del mismo lugar
en el segundo, esta igualdad obliga a que
dim(Ker(f − λi I)) = si , para cada i ∈ [1, r].
En la demostración de la proposición 344 queda implı́cito que si cada autoespacio tiene dimensión igual al orden de multiplicidad del respectivo autovalor,
se cumple
V = Ker(f − λ1 I) ⊕ Ker(f − λ2 I) ⊕ . . . ⊕ Ker(f − λr I).
2
27.6.
Complementos / Ejercicios
1. Restringiéndonos a operadores en dimensión n = 2, 3, 4, hay 10 casos de
diagonalización. Excluyendo los casos triviales (homotecias), quedan 7.
a) Uno en dimensión 2:
1) Diag(α, β).
b) Dos en dimensión 3:
1) Diag(α, β, γ).
2) Diag(α, β, β).
c) Cuatro en dimensión 4:
1) Diag(α, β, γ, δ).
2) Diag(α, β, γ, γ).
3) Diag(α, β, β, β).
4) Diag(α, α, β, β).
27.6. Complementos / Ejercicios
395
En los siguientes ejercicios se suponen operadores de IRn dados en la base
canónica por marices. Se pide razonar que f es diagonalizable, encontrando
una base Z en la que f se representa por una matriz diagonal J, ası́ como
las matrices P y P −1 para los cambios de base.
µ
a)
1
2
3
c) 4
4
2
4
e)
−6
−3
10
0
g)
−6
78
3
i) −1
1
−4
−3
k)
−3
0
2
1
¶
−2 0
b) 18 2
−10 0
−2 2
−3 2
−2 1
1
2
−2
−1
15
−156
d)
72
−10
1
3
−3
−1
1
2
0
0
f)
−2
0
−2
0
−8
5
−8
0
0
0
4
−10
5
−8
0 6
3 2
0 5
0 0
2
3
3
−2
0
5
0
2
1 1
1 1
m)
1 −1
1 −1
5
0
−1
65
1
−1
1
−1
1
−1
−1
1
µ
h)
0
2
0
0
2 1
3 4
2 2
j) 0 3
0 0
2
4
l)
6
2
3
0
n)
0
0
0 0
2 0
0 3
0 0
15
−180
90
−10
36
−18
8
3
−108
54
−18
−7
¶
0
−1
3
−1
0
3
0
−3
−6
−2
−1
1
3
1
0
−3
−6
−2
1
3
1
0
−1
0
2
0
−1
0
0
2
2. En los siguientes ejercicios se suponen endomorfismos de IRn dados en la
base canónica por matrices. Se pide decidir si es o no triangularizable,
obteniendo cuantos autovectores linealmente independientes sea posible.
En los casos en que f sea diagonalizable, se pide obtener la correspondiente
matriz diagonal, encontrando una base Z en la que f se representa por
dicha matriz J, ası́ como las matrices P y P −1 para los cambios de base.
396
Capı́tulo 27. Triangularización y Diagonalización de Endomorfismos
µ
a)
4 4
−1 0
¶
µ
b)
0
0
−1
−4
c) 3
−3
−6
5
−6
−1 0
1 3
1 0
−3 1
0 0
1 0
2
e) 0
0
3
g) 1
0
2
0
i)
0
0
0
2
0
0
−2
1
2
3
9
3
k)
−1
−1
1
2
m)
0
−1
−1
0
−4
−1
2
0
s)
0
0
2
0
u)
0
0
−1 1
1 1
0 2
−4
−3
h)
−3
0
0
0
0
2
−1 −1
0
2
2 −1
1
1
2
1
1
1
2
3
0
4
o)
−6 −2 −3 −2
−3 −1 −1 −2
2
0
q)
1
0
0 0
8 1
−4 4
2
d) 0
0
¶
3
f) 1
0
1 0 0
11 0 0
−1 8 0
−1 0 8
2 1
1 2
1
0
0
1
1
2
2
0
0
0
1
0
0
2
1
0
−1
0
1
0
−1
0
0
1
0
2
0
−1
0
0
2
1
−1
1
1
2
7
1
j)
−1
3
0
−1
l)
−1
0
−1
0
n)
0
0
9
5
p)
4
1
0
0
r)
0
1
4
0
t)
0
1
5
0
v)
0
0
2
3
3
−2
0 6
3 2
0 5
0 0
−1
−3
−1
7
1
7
−3
1
3
1
7
−1
−1
2
0
−1
3 3
1 2
3 2
1 2
−3
2
0
1
−4
0
3
1
−6
−2
−3
−1
0
0
1
0
−4
−4
−1
0
0
1
0
0
0
0
0
3
−12
−6
−6
−1
1
0
0
0
−2
3
−1
−3
2 3
1 2
5 3
1 4
0
5
0
−1
1 0
0 0
5 0
1 5
27.6. Complementos / Ejercicios
397
3. Sea f un endomorfismo de IR3 . Se pide su matriz A en la base canónica
sabiendo que
a) (1, 1, 1) es un vector propio.
b) {(x, y, z)/x + y + z = 0} es autoespacio.
c) f (1, −1, 1) = (5, −7, 5).
4. Sea f un endomorfismo triangularizable de un espacio n-dimensional. Razonar que tr(f ) es la suma de sus n autovalores y que det(f ) es el producto
de los mismos.
5. Sean f y g dos operadores de espectro simple. Razonar que conmutan si
y sólo si f y g tienen los mismos vectores propios.
6. Para cada número real r, razonar la diagonalización de la matriz
r 1 1
Ar = 1 r 1 .
1 1 r
7. Estudiar los casos de diagonalización de la matriz real
p 1 q
A = 1 p p.
0 0 2
8. Sea r 6= 0. Razonar la diagonalización del endomorfismo fr de matriz
0
r
r2
Ar = 1/r
0
r
1/r2 1/r 0
9. Razonar que los proyectores y las simetrı́as son diagonalizables.
10. Sea V un espacio real con dim(V) = 2. Caracterizar los endomorfismos f
de V cuyos autovalores sean 1 y −1. Sea f un endomorfismo triangularizable de un espacio V de dimensión n ≥ 2 cuyo polinomio caracterı́stico
sea
C(ξ) = (ξ − 1)r (ξ + 1)n−r , 1 ≤ r < n.
¿Se trata de una simetrı́a?
11. Razonar la diagonalización del endomorfismo f de matriz
0 0 ... 0 1
0 0 ... 1 0
. .
..
.. ..
. .
A=
.
. .
. .
0 1 ... 0 0
1 0 ... 0 0
Indicar su matriz diagonal y una base en la que se alcanza.
398
Capı́tulo 27. Triangularización y Diagonalización de Endomorfismos
399
Capı́tulo 28
Polinomio Mı́nimo de un
Endomorfiso
28.1.
Potencias naturales de un endomorfismo
Sea f un endomorfismo de un espacio vectorial V sobre un cuerpo conmutativo
IK. Mediante la ley recurrente
½ 0
f
=I
f m+1 = f m ◦ f, ∀m ∈ IN
se definen las potencias naturales del polinomio f.
Proposición 346 Cualesquiera que sean los números m, n ∈ IN , se cumple
f m+n = f m ◦ f n .
Demostracion:
Fijemos m y hagamos inducción en n:
Si n = 0, se tiene
f m+0 = f m = f m ◦ I = f m ◦ f 0 .
Suponiendo cierto que f m+n = f m ◦ f n , se deduce que
f m+(n+1) = f (m+n)+1 = f m+n ◦ f =
= (f m ◦ f n ) ◦ f = f m ◦ (f n ◦ f ) = f m ◦ f n+1 .
2
400
Capı́tulo 28. Polinomio Mı́nimo de un Endomorfiso
28.2.
Polinomios en un endomorfismo
Multiplicando escalares por potencias se obtienen monomios am f m en f , incluı́dos los de grado cero, a0 f 0 = a0 I. Sumando monomios, se llegan a obtener
polinomios
p(f ) = a0 I + a1 f + a2 f 2 + . . . + ar f r ,
en los que el grado se define como el mayor de los exponentes que aparezcan en
el mismo. El conjunto de todos los endomorfismos obtenidos como polinomios
en f se denotará por IK[f ].
28.3.
El álgebra IK[f ]
Sea IK[ξ] el álgebra de los polinomios sobre el cuerpo conmutativo IK. Fijado
un endomorfismo f de V, se establece una aplicación
ϕ : IK[ξ] → End.(V, IK), de ley ϕ(p(ξ)) = p(f ).
Es decir, mediante ϕ, al polinomio
p(ξ) = a0 + a1 ξ + a2 ξ 2 + . . . + ar ξ r ,
le asociamos el endomorfismo
p(f ) = a0 I + a1 f + a2 f 2 + . . . + ar f r .
Proposición 347 Dados p, q ∈ IK[ξ], y a ∈ IK, se cumple
ϕ(p(ξ) + q(ξ)) = ϕ(p(ξ)) + ϕ(q(ξ)),
ϕ(ap(ξ)) = aϕ(p(ξ)),
ϕ(p(ξ)q(ξ)) = ϕ(q(ξ)) ◦ ϕ(p(ξ)) = ϕ(p(ξ)) ◦ ϕ(q(ξ)).
Demostracion:
Si r es el grado mayor de ambos polinomios, añadiendo sumandos nulos en
uno de ellos, si fuera preciso, podemos suponer que
p(ξ) =
r
X
ai ξ i , q(ξ) =
i=0
r
X
bi ξ i .
i=0
Entonces,
r
r
r
X
X
X
ϕ(p(ξ) + q(ξ)) = ϕ(
ai ξ i +
bi ξ i ) = ϕ( (ai + bi )ξ i ) =
=
r
X
i=0
(ai + bi )f i =
i=0
i=0
r
X
r
X
i=0
ai f i +
i=0
i=0
bi f i = ϕ(p(ξ)) + ϕ(q(ξ)),
28.4.
Caso finito - dimensional. Polinomio mı́nimo de un endomorfismo
ϕ(ap(ξ)) = ϕ(a
r
X
ai ξ i ) = ϕ(
i=0
=
r
X
r
X
(aai )ξ i ) =
i=0
(aai )f i = a
i=0
401
r
X
ai f i = aϕ(p(ξ)),
i=0
r
r
r
X
X
X
bj ξ j ) = ϕ(
ai bj ξ i+j ) =
ϕ(p(ξ)q(ξ)) = ϕ(
ai ξ i
j=0
i=0
r
X
=
ai bj f i+j =
i,j=0
=(
r
X
i=0
ai f i ) ◦ (
i,j=0
r
X
ai bj f i ◦ f j =
i,j=0
r
X
bj f j ) = ϕ(p(ξ)) ◦ ϕ(q(ξ)).
j=0
Como la multiplicación de polinomios es conmutativa, tendremos
ϕ(p(ξ)) ◦ ϕ(q(ξ)) = ϕ(p(ξ)q(ξ)) = ϕ(q(ξ)p(ξ)) = ϕ(q(ξ)) ◦ ϕ(p(ξ)),
es decir, la composición de elementos de IK[f ] también lo es.
2
Esta proposición indica que ϕ es un morfismo de álgebras asociativas, cuya
imagen, igual a IK[f ], será un subálgebra conmutativa de la End.(V, IK).
Puesto que ϕ(a) = aI, el cuerpo IK (igualado por un lado a los polinomios
constantes y por otro a las homotecias a I) se conserva elemento a elemento
mediante ϕ. Finalmente, es interesante denotar que
ϕ(0) = f0 , ϕ(1) = I, ϕ(ξ) = f, ϕ(ξ m ) = f m .
28.4.
Caso finito - dimensional. Polinomio mı́nimo de un endomorfismo
Proposición 348 Sea f un endomorfismo de un espacio V de dimensión finita
n ≥ 1. El núcleo del morfismo ϕ : p(ξ) 7→ p(f ) es un ideal propio del anillo IK[ξ].
Demostracion:
Puesto que ϕ(1) = I, el morfismo ϕ no puede ser nulo, luego Ker ϕ 6= IK[ξ].
También se tiene Ker ϕ 6= {0} porque la igualdad implicarı́a la inyectividad de ϕ,
cosa imposible ya que IK[ξ], en cuanto espacio vectorial, es infinito-dimensional
mientras que End(V, IK) es de dimensión finita n2 .
2
Tratándose de un ideal propio, IK[ξ] no contiene ninguna constante, salvo la
nula. Además, coincide con el conjunto de múltiplos de cualquiera de los polinomios de grado mı́nimo pertenecientes a dicho ideal.
402
Capı́tulo 28. Polinomio Mı́nimo de un Endomorfiso
Tomando entre tales polinomios el que esté normalizado, queda determinado el
que llamaremos polinomio mı́nimo del endomorfismo f . Se denotará como
Mf (ξ) o bien M(ξ)
si la alusión a f se presupone.
De los polinomios c ∈ Ker ϕ, caracterizados por la igualdad
c(f ) = f0 ,
se dice que se anulan por el endomorfismo f , o bien que f es una raı́z del
polinomio c. Entonces, M es el polinomio normalizado de grado mı́nimo que
admite a f como raı́z. Por su elección se cumplirá
c(ξ) se anula por f ⇔ M(ξ) | c(ξ).
28.5.
Teorema de Hamilton - Cayley
Un hecho relevante, indicado para casos particulares en 1853 por Hamilton y
generalizado más tarde por Cayley, es que entre los polinomios anulados por un
endomorfismo está su propio polinomio caracterı́stico:
Proposición 349 Dado el polinomio caracterı́stico
C(ξ) = α0 + α1 ξ + α2 ξ 2 + . . . + αn−1 ξ n−1 + ξ n
de un endomorfismo f de V, se cumple que
C(f ) = α0 I + α1 f + α2 f 2 + . . . + αn−1 f n−1 + f n = f0 .
Demostracion:
Fijada una base B de V, sea A la matriz de f en dicha base. Pongamos
e = (βij ) la matriz traspuesta de la adjunta de B, la cual
B = ξI − A y sea B
cumple, como es sabido, la fórmula
e × B = det(B)I = C(ξ)I.
B
e un determinante de n − 1 filas y columnas extraido
Al ser cada elemento de B
de ξI − A, se trata de un polinomio de grado a lo sumo n − 1 en la variable ξ.
Sea, pues,
0)
1)
2)
n−1)
βij = βij + βij ξ + βij ξ 2 + ... + βij ξ n−1 ,
y construyamos las matrices auxiliares
k)
B k) = (βij ), para cada k ∈ [0, n − 1],
28.6.
Raı́ces del polinomio mı́nimo
403
que permiten obtener
e = B 0) + B 1) ξ + B 2) ξ 2 + . . . + B n−1) ξ −1 .
B
Entonces, la fórmula anterior se escribe como
(B 0) + B 1) ξ + B 2) ξ 2 + . . . + B n−1) ξ n−1 ) × (ξI − A) =
= (α0 + α1 ξ + α2 ξ 2 + . . . + αn−1 ξ n−1 + ξ n )I.
Desarrollando e igualando término a término, queda
−B 0) × A
= α0 I
1)
0)
−B
×
A
+
B
= α1 I
−B 2) × A + B 1)
= α2 I
.
.
.
.
..
n−1)
n−2)
−B
×
A
+
B
=
αn−1 I
n−1)
B
=I
Multiplicando cada igualdad, respectivamente, por
I, A, A2 , . . . , An−1 , An ,
y sumando todas ellas, llegamos a
α0 I + α1 A + α2 A2 + . . . + αn−1 An−1 + An = 0,
donde la matriz nula 0 representa a f0 . Como A representa a f , el primer
miembro de esta igualdad representa a C(f ).
2
28.6.
Raı́ces del polinomio mı́nimo
Una primera consecuencia del Teorema de Hamilton-Cayley es que
M(ξ) | C(ξ),
luego toda raı́z de M lo es de C y, por ello, debe ser un autovalor. La afirmación
recı́proca también es cierta. Para establecerla, probemos que
Proposición 350 Si λ es autovalor de f y p(ξ) es un polinomio, entonces p(λ)
es autovalor de p(f ) y todo autovector de f relativo a λ lo es de p(f ) respecto a
p(λ).
Demostracion:
Si p(ξ) = ξ m , se prueba por recurrencia:
Para m = 1, p(ξ) = ξ, es p(f ) = f y p(λ) = λ, luego no hay nada que probar.
404
Capı́tulo 28. Polinomio Mı́nimo de un Endomorfiso
Sea x un autovector de λ. Si suponemos cierto que f m (x) = λm x, aplicando
f a ambos miembros resulta
f (f m (x)) = f m+1 (x) = f m (f (x)) = f m (λx) = λf m (x) = λλm x = λm+1 x.
En general, se tendrá
p(ξ) =
r
X
r
r
X
X
ai ξ i ⇒ p(f )(x) = (
ai f i )(x) =
ai f i (x) =
i=0
i=0
=
r
X
a i λi x = (
i=0
r
X
i=0
ai λi )x = p(λ)x,
i=0
lo que prueba nuestra afirmación.
2
Proposición 351 Toda raı́z λ de C, lo es de M.
Demostracion:
Sea λ un autovalor y sea x un autovector de λ. Entonces, aplicando a M la
proposición 350, se cumplirá
0 = M(f )(x) = M(λ)x ⇒ M(λ) = 0,
pues x 6= 0.
2
Proposición 352 Los polinomios C(ξ) y M(ξ) tienen las mismas raı́ces en IK.
Si λ es una de ellas, con orden de multiplicidad s en C(ξ), en M(ξ) tendrá una
multiplicidad de orden m, donde 1 ≤ m ≤ s.
Demostracion:
Se obtiene de la relación M(ξ) | C(ξ) y de la proposición 351.
28.7.
2
Polinomio mı́nimo en un subespacio invariante
En la sección 26.5 vimos que el polinomio caracterı́stico subordinado en un
subespacio f -invariante propio U de V era un divisor de C. Denotando por MU
el polinomio mı́nimo del endomorfismo f restringido a U, se tiene igualmente:
Proposición 353 Si U es subespacio f -invariante propio, se cumple
MU (ξ) | M(ξ).
Demostracion:
Puesto que M(f )(x) = 0, para todo x ∈ V, esta misma igualdad la cumplen
los vectores de U. Entonces, de la definición de polinomio mı́nimo se sigue que
MU | M.
2
28.8.
Polinomio mı́nimo y suma directa
28.8.
405
Polinomio mı́nimo y suma directa
Proposición 354 Si V admite una descomposición
V = U1 ⊕ U2 ⊕ . . . ⊕ Ur ,
en suma directa de subespacios f -invariantes propios, el polinomio mı́nimo de
f se obtiene como mı́nimo común múltiplo de los polinomios mı́nimos de las
restricciones de f a cada sumando.
Demostracion:
Sea Mi el polinomio mı́nimo de la restricción de f a Ui , y sea m el mı́nimo
común múltiplo de estos polinomios. Entonces,
Mi | M, ∀i ∈ [1, r] ⇒ m | M.
Por otra parte, como m es múltiplo de cada Mi , anula a cada vector del
subespacio Ui . Ası́, para todo vector x ∈ V se tendrá
x=
r
X
xi , con xi ∈ Ui ⇒
i=0
r
r
r
X
X
X
⇒ m(f )(x) = m(f )(
xi ) =
m(f )(xi ) =
0 = 0.
i=0
i=0
i=0
Pero, si m(f ) anula a todo vector de V, se concluye que M | m.
De ambas relaciones, se obtiene la igualdad m(ξ) = M(ξ).
28.9.
2
Espacios indescomponibles
Proposición 355 Sea f un endomorfismo cuyo polinomio mı́nimo sea de grado
n y potencia, a su vez, de un cierto polinomio a(ξ) primo en IK[ξ]. Probaremos
que V no puede ser suma directa de dos subespacios propios e invariantes por
f.
Demostracion:
Supongamos que
M = am , con m ≥ 1 y n = m grad(a).
Si tuviésemos una descomposición
V = U ⊕ W,
con U y W f -invariantes y ambos subespacios no nulos, considerando los endomorfismos restricción de f a cada uno de ellos, para sus polinomios mı́nimos
MU y MW se verifica
½
MU | M ⇒ (∃p ≥ 1/MU = ap )
⇒
MW | M ⇒ (∃q ≥ 1/MW = aq )
406
Capı́tulo 28. Polinomio Mı́nimo de un Endomorfiso
⇒ M = m.c.m.(MU , MW ) = as , donde s = Máx.(p, q).
De aquı́ se concluye que s = m, luego uno al menos (por ejemplo U) de los subespacios tiene polinomio mı́nimo igual al del espacio total. Como la dimensión
de U es mayor o igual que el grado de su polinomio mı́nimo, necesariamente es
dim(U) = n y se tiene
½
U=V
W = {0}
con lo que llegamos a una contradicción. Esta procede de haber supuesto que
V era suma directa de subespacios f -invariantes y propios. Por tanto, esta
descomposición es inalcanzable.
2
Un espacio vectorial V que se pueda descomponer en suma directa de dos subespacios propios y f -invariantes, se dice que es f -descomponible. En caso
contrario, se dice que es f -indescomponible. La anterior proposición da una
condición suficiente para la indescomponibilidad.
28.10.
Complementos / Ejercicios
1. Probar por cálculo directo el Teorema de Hamilton-Cayley en el caso de
dimensión igual a 2.
2. Sea p(ξ) un polinomio arbitrario y sea M(ξ) el polinomio mı́nimo de un
endomorfismo f . Razonar que existe un polinomio r de grado menor que
el de M, de manera que p(f ) = r(f ).
3. Sea f un automorfismo de V. Obtener su inverso como una expresión
polinómica en el propio f .
4. Determinar las matrices A−1 y A−2 , siendo
1 1 2
A = 3 1 1.
2 3 1
5. El número λ es autovalor de f con autovector x si y sólo si −λ lo es de
−f con igual autovector.
6. Obtener el polinomio mı́nimo de un endomorfismo proyector.
7. Obtener el polinomio mı́nimo de una simetrı́a.
8. Un espacio V 6= {0} se dice que es f -simple o f -irreducible si carece
de subespacios f -invariantes propios. Razonar que un espacio f -simple
es f -indescomponible, aunque no a la inversa. Razonar que un espacio
unidimensional es f -simple para cualquiera de sus operadores f .
9. Supongamos un endomorfismo f de V cuyo polinomio caracterı́stico C(ξ)
sea primo. Razonar que V es f -simple.
28.10.
Complementos / Ejercicios
407
10. Sea f un endomorfismo de un espacio V de dimensión finita n ≥ 2. Si V
es f -simple, f carece de autovalores en IK.
408
Capı́tulo 28. Polinomio Mı́nimo de un Endomorfiso
409
Capı́tulo 29
Escomposición Primaria
29.1.
Núcleo de un polinomio respecto de un endomorfismo
Para cada polinomio p(ξ) se puede considerar el núcleo del endomorfismo p(f ),
que nombraremos como núcleo del polinomio p (respecto de f ).
Proposición 356 Si p es un polinomio, U = Ker p(f ) es f -invariante. Además,
si MU es el polinomio mı́nimo de la restricción de f a U, se tiene
MU | p.
Demostracion:
Por ser conmutativa el álgebra IK[f ], se tendrá
x ∈ Ker p(f ) ⇒ p(f )(x) = 0 ⇒ p(f )(f (x)) = f (p(f )(x)) = f (0) = 0 ⇒
⇒ f (x) ∈ Ker p(f ).
Por construcción de U, p(f ) anula a todos sus vectores, luego MU | p.
2
Proposición 357 Dados dos polinomios p y q, se cumple que
q | p ⇒ Ker q(f ) ≤ Ker p(f ).
Demostracion:
Por hipótesis, existe un polinomio c tal que p = qc, lo que implica p(f ) =
c(f ) ◦ q(f ). Entonces,
x ∈ Ker q(f ) ⇒ p(f )(x) = c(f )(q(f )(x)) = c(f )(0) = 0 ⇒ x ∈ Ker p(f ).
2
410
Capı́tulo 29. Escomposición Primaria
Proposición 358 Si m = m.c.m.(p, q), se cumple
Ker p(f ) + Ker q(f ) = Ker m(f ).
Demostracion:
Aplicando la anterior proposición, tenemos
½
p | m ⇒ Ker p(f ) ≤ Ker m(f )
⇒ Ker p(f ) ∪ Ker q(f ) ≤ Ker m(f ) ⇒
q | m ⇒ Ker q(f ) ≤ Ker m(f )
⇒ Ker p(f ) + Ker q(f ) ≤ Ker m(f ).
Consideremos los polinomios
½
h = m/p ⇔ ph = m ⇒ p(f ) ◦ h(f ) = m(f )
k = m/q ⇔ qk = m ⇒ q(f ) ◦ k(f ) = m(f )
Como m = m.c.m.(p, q), h y k son primos entre sı́. Por ello (Teorema de Bezout),
existen otros polinomios α, β tales que
αh + βk = 1 ⇒ α(f ) ◦ h(f ) + β(f ) ◦ k(f ) = I.
Aplicando ambos miembros de esta igualdad a un vector x ∈ Ker m(f ), se
obtiene
½
u = (α(f ) ◦ h(f ))(x)
.
x = u + w, donde
w = (β(f ) ◦ k(f ))(x)
Entonces, como la composición es conmutativa dentro de IK[f ], se tiene
p(f )(u) = p(f )((α(f ) ◦ h(f ))(x)) = (α(f ) ◦ p(f ) ◦ h(f ))(x) =
= (α(f ) ◦ m(f ))(x) = α(f )(m(f )(x)) = α(f )(0) = 0 ⇒ u ∈ Ker p(f ),
q(f )(w) = q(f )((β(f ) ◦ k(f ))(x)) = (β(f ) ◦ q(f ) ◦ k(f ))(x) =
= (β(f ) ◦ m(f ))(x) = β(f )(m(f )(x)) = β(f )(0) = 0 ⇒ w ∈ Ker q(f ).
Ası́ queda probado que Ker m(f ) ≤ Ker p(f )+ Ker q(f ).
Proposición 359 Si d = m.c.d.(p, q), se cumple
Ker p(f )∩ Ker q(f ) = Ker d(f ).
Demostracion:
Por el Teorema de Bezout, existen polinomios α, β tales que
αp + βq = d ⇒ α(f ) ◦ p(f ) + β(f ) ◦ q(f ) = d(f ).
Entonces,
x ∈ Ker p(f ) ∩ Ker q(f ) ⇒ d(f )(x) = α(f )(p(f )(x)) + β(f )(q(f )(x))) =
2
29.2. Existencia de subespacios f -invariantes propios
411
= α(f )(0) + β(f )(0) = 0 + 0 = 0 ⇒ x ∈ Ker d(f ) ⇒
⇒ Ker p(f )∩ Ker q(f ) ≤ Ker d(f ).
Aplicando la proposición 357, tenemos
½
d | p ⇒ Ker d(f ) ≤ Ker q(f )
⇒ Ker d(f ) ≤ Ker p(f ) ∩ Ker q(f ).
d | q ⇒ Ker d(f ) ≤ Ker q(f )
2
Proposición 360 Si m.c.d.(p, q) = 1, se cumple
Ker p(f ) ⊕ Ker q(f ) = Ker (q(f ) ◦ p(f )).
Demostracion:
En efecto, de d = m.c.d.(p, q) = 1 se sigue que
m = m.c.m.(p, q) = pq, luego, aplicando la proposición 358, resulta
Ker p(f ) + Ker q(f ) = Ker m(f ) = Ker (p(f ) ◦ q(f )).
A la vez que, aplicando la proposición 359, resulta
Ker p(f )∩ Ker q(f ) = Ker d(f ) = Ker I = {0}.
2
29.2.
Existencia de subespacios f -invariantes propios
Según vimos en la sección 26.5, la existencia de un subespacio f -invariante propio U de V permite una primera simplificación de la matriz de f : tomando una
base de U y ampliándola hasta una del total V, la nueva matriz era semidescompuesta. Siendo deseable, pues, la construcción de subespacios f -invariantes, la
proposición 356 parece abrir una vı́a para hacerlo: basta tomar un polinomio
arbitrario p(ξ) y considerar el subespacio Ker p(f ). Ahora bien, ¿se va a tratar
de un subespacio propio? O mejor, ¿qué polinomios p conducen a subespacios
Ker p(f ) que sean propios?
Proposición 361 Siendo p un polinomio y f un endomorfismo, se cumple
Ker p(f ) = V ⇔ M | p.
Demostracion:
Por la definición del polinomio mı́nimo sabemos que la relación M | p equivale a la p(f ) = f0 , y basta observar que Ker f0 = V.
2
412
Capı́tulo 29. Escomposición Primaria
Proposición 362 Dados dos polinomios p y q tales que
q | p | M, grad(q) < grad(p),
se cumple
Ker q(f ) < Ker p(f ).
Demostracion:
Tomando M = pc, p = qd, se tendrá
grad(q) < grad(p) ⇒ grad(d) ≥ 1 ⇒ M = (qd)c = (qc)d ⇒
⇒ grad(qc) < grad(M) ⇒ (qc)(f ) = q(f ) ◦ c(f ) 6= f0 ,
luego existe cuando menos un vector x ∈ V tal que
q(f )(c(f )(x)) 6= 0 ⇒ c(f )(x) 6∈ Ker q(f ).
Sin embargo
p(f )(c(f )(x)) = M(f )(x) = 0 ⇒ c(f )(x) ∈ Ker p(f ).
Esto prueba que Ker q(f ) 6= Ker p(f ). Por otro lado, según la proposición 357,
se tiene Ker q(f ) ≤ Ker p(f ), luego Ker q(f ) < Ker p(f ).
2
Proposición 363 Dado un polinomio p, se cumple
Ker p(f ) = Ker d(f ), donde d = m.c.d.(p, M).
Demostracion:
Siendo Ker M(f ) = V, se aplica la proposición 359 con q = M:
Ker d(f ) = Ker p(f )∩ Ker M(f ) = Ker p(f ) ∩ V = Ker p(f ).
2
Proposición 364 Siendo p un polinomio y f un endomorfismo, se cumple
Ker p(f ) = {0} ⇔ m.c.d.(p, M) = 1.
Demostracion:
Si Ker p(f ) = {0}, no puede ser d = m.c.d.(p, M) 6= 1, pues en este supuesto
las relaciones 1 | d | M conducirı́an, según las proposiciones 362 y 363, a que
{0} < Ker d(f ) = Ker p(f ).
Aplicando la proposición 363 se tiene
d = m.c.d.(p, M) = 1 ⇒ d(f ) = I ⇒ Ker p(f ) = Ker d(f ) = Ker I = {0}.
29.3. Descomposición primaria
413
2
Ası́, la respuesta a nuestra primera pregunta es negativa: M y todos sus múltiplos conducen al subespacio impropio V, mientras que cualquier polinomio primo con M construye el subespacio impropio {0}. Por otra parte, como d =
m.c.d.(p, M) es un divisor de M, la proposición 363 reduce todo núcleo al de
un divisor del polinomio mı́nimo. Centremos, pues, nuestra atención en tales
divisores para obtener la respuesta a nuestra segunda pregunta:
Proposición 365 Sea p un divisor de M. Entonces,
{0} < Ker p(f ) < V ⇔ 0 < grad(p) < grad(M).
Demostracion:
Si Ker p(f ) es un subespacio propio, p no puede ser constante, porque entonces Ker p(f ) = {0}, ni puede ser de igual grado que M porque esto implicarı́a
Ker p(f ) = V.
En la relación 1 | p | M hay desigualdad estricta entre los grados, luego,
según la proposición 362, tendremos
{0} = Ker I < Ker p(f ) < Ker M(f ) = V.
2
29.3.
Descomposición primaria
Proposición 366 Sea c(ξ) un polinomio tal que c(f ) = f0 . Si en el cuerpo IK
este polinomio se descompone en la forma
c = pq, con m.c.d.(p, q) = 1,
se prueba que
V = Ker p(f ) ⊕ Ker q(f ).
Demostracion:
Según la proposición 360, se tendrá
Ker p(f ) ⊕ Ker q(f ) = Ker (p(f ) ◦ q(f )) = Ker c(f ) = Ker f0 = V.
2
En la sección 29.2 se ha recordado que la existencia de un subespacio f -invariante
propio simplifica la matriz de f pasando a una semidescompuesta. En la sección
26.7 vimos que si V era suma directa de dos subespacios U y W, f -invariantes
y propios, se conseguı́a una mayor simplificación obteniendo para f una matriz
descompuesta o diagonal por bloques. Este teorema nos ofrece una vı́a para
construir descomposiciones de este tipo. A su vez, p y q podrı́an descomponerse
en otros divisores y, consecuentemente, cada subespacio en otros. En última
instancia llegarı́amos a la factorización prima de c y tendrı́amos el siguiente
enunciado:
414
Capı́tulo 29. Escomposición Primaria
Proposición 367 Si c(f ) = f0 y el polinomio c admite la descomposición
c(ξ) = as11 (ξ)as22 (ξ) . . . asrr (ξ)
cuyos factores sean potencias de polinomios primos, se prueba que
V = Ker as11 (f ) ⊕ Ker as22 (f ) ⊕ . . . ⊕ Ker asrr (f ).
Demostracion:
Se hará por recurrencia en la cantidad r de divisores primos del polinomio
c:
Para r = 1 es trivial:
c = as11 ⇒ f0 = c(f ) = as11 (f ) ⇒ Ker as11 (f ) = V.
Para r ≥ 2, tomemos
c1 (ξ) = a2 (ξ)s2 . . . ar (ξ)sr .
De aquı́ se obtiene
c = as11 c1 , m.c.d.(as11 , c1 ) = 1 ⇒ V = Ker as11 (f ) ⊕ W, con W = Ker c1 (f ).
Por la construcción de W se cumple
∀x ∈ W ⇒ c1 (f )(x) = 0,
lo que significa que c1 (ξ) se anula por la restricción de f a W. Como su factorización admite r − 1 factores, por la hipótesis de inducción será
W = Ker as22 (f ) ⊕ . . . ⊕ Ker asrr (f ) ⇒
⇒ V = Ker as11 (f ) ⊕ Ker as22 (f ) ⊕ . . . ⊕ Ker asrr (f ).
2
Este es el teorema de la descomposición primaria del espacio V mediante f . En particular, y son los casos que interesan, puede efectuarse usando
su polinomio caracterı́stico C o su polinomio mı́nimo M.
Sea con el polinomio c que sea, tomando una base en cada sumando y uniéndolas
todas, se obtiene una base B de V, en la cual f tendrá una matriz de la forma
A1
A2
A=
,
.
..
Ar
donde cada Ai es la matriz de la restricción de f a Ker asi i (f ) en la base del
mismo. Se tratará de una matriz cuadrada de orden igual a dim(Ker asi i (f )),
situada en torno a la diagonal, cuyas lı́neas en A se completarán con ceros. Ası́,
A será, como era de esperar, una matriz descompuesta o matriz diagonal por
bloques.
29.4. Descomposición primaria para un endomorfismo triangularizable
29.4.
415
Descomposición primaria para un endomorfismo triangularizable
Proposición 368 Si f es un endomorfismo triangularizable de V, con autovalores λ1 , λ2 , . . . , λr de órdenes de multiplicidad s1 , s2 , . . . , sr , respectivamente,
se tiene la descomposición
V = Ker(f − λ1 I)s1 ⊕ Ker(f − λ2 I)s2 ⊕ Ker(f − λr I)sr ,
en la cual, para cada i ∈ [1, r], se cumple que
a) si = dim(Ker(f − λi I)si ).
b) El polinomio caracterı́stico de la restricción de f al subespacio
Ker (f − λi I)si es (ξ − λi )si .
Demostracion:
Si f es triangularizable, la factorización prima de su polinomio caracterı́stico
serı́a la
C(ξ) = (ξ − λ1 )s1 (ξ − λ2 )s2 . . . (ξ − λr )sr
y basta con hacer la correspondiente descomposición primaria para asegurar que
V = Ker(f − λ1 I)s1 ⊕ Ker(f − λ2 I)s2 ⊕ Ker(f − λr I)sr .
Sean Ci y Mi , para cada i ∈ [1, r], los polinomios caracterı́stico y mı́nimo de la
restricción de f al subespacio Ker(f − λi I)si , y sea di su dimensión. Puesto que
el polinomio
(ξ − λi )si
por propia construcción, anula a su núcleo, se tratará de un múltiplo de Mi ,
por lo que existe un entero mi , tal que 1 ≤ mi ≤ si , para el cual
Mi (ξ) = (ξ − λi )mi .
Puesto que Ci y Mi comparten sus raı́ces, necesariamente será
Ci (ξ) = (ξ − λi )di .
Según la proposición 333, Ci divide a C. Como es primo con los factores de lugar
distinto de i, en realidad divide a (ξ − λi )si , luego
di ≤ si , ∀i ∈ [1, r].
Cada una de estas desigualdades es una igualdad pues, si suponemos que para
algún i se cumpliera di < si , llegarı́amos al absurdo
n = d1 + d2 + . . . + di + . . . + dn < s1 + s2 + . . . + si + . . . + sr = n.
Por tanto, di = si y Ci (ξ) = (ξ − λi )si .
2
416
29.5.
Capı́tulo 29. Escomposición Primaria
Cálculo del polinomio mı́nimo de un endomorfismo triangularizable
Proposición 369 Si f es un endomorfismo triangularizable de V, con autovalores λ1 , λ2 , . . . , λr de órdenes de multiplicidad s1 , s2 , . . . , sr , respectivamente,
se tiene
M(ξ) = M1 (ξ)M2 (ξ) · · · Mr (ξ),
donde, para cada i ∈ [1, r], Mi es el polinomio mı́nimo de la restricción de f al
subespacio Ker(f − λi I)si .
Demostracion:
De acuerdo con la anterior descomposición primaria, sabemos (proposición
354) que M es el mı́nimo común múltiplo de los polinomios
Mi (ξ) = (ξ − λi )mi , donde mi ∈ [1, si ].
Para i 6= j, es λi 6= λj , luego Mi y Mj son primos entre sı́. Por ello,
M = m.c.m.(M1 , M2 , . . . , Mr ) = M1 M2 · · · Mr .
2
Proposición 370 Sea λ un autovalor de orden s de un endomorfismo triangularizable f , sea U = Ker(f − λI)s y sea MU el polinomio mı́nimo de la
restricción de f a U. Entonces,
MU (ξ) = (ξ − λ)m ,
donde m ∈ [1, s] es el mı́nimo exponente entero positivo tal que
dim(Ker (f − λI)m ) = s.
Demostracion:
De la descomposición primaria obtenida para C (proposición 368) se sabe que
el polinomio caracterı́stico CU (ξ) de la restricción de f a U es CU (ξ) = (ξ − λ)s
y que
MU (ξ) = (ξ − λ)m , para algún m ∈ [1, s].
Que MU (f ) anule a todos los vectores de U significa que su núcleo coincide con
U, de donde se sigue que
dim(Ker(f − λI)m ) = dim(U) = s.
Por otro lado que MU sea el polinomio de grado mı́nimo con tal propiedad se
traduce en que m sea el mı́nimo exponente para el cual se cumpla la última
fórmula.
2
29.6. Caracterización de la diagonalización mediante el polinomio mı́nimo
417
El primero de estos teoremas indica que el cálculo del polinomio mı́nimo se
reduce al cálculo de sus factores, cada uno de los cuales, a su vez, es el polinomio
mı́nimo de la restricción a un subespacio invariante que posee un solo factor
primo. El segundo nos dice como obtener tales polinomios mı́nimos: basta ir
calculando las sucesivas dimensiones de
Ker(f − λI), Ker(f − λI)2 , . . .
hasta llegar a un exponente m en que esta dimensión sea igual a s. En la práctica
f se conocerá a través de su matriz A en una cierta base B de V, por lo que la
dimensión de cada subespacio Ker(f − λI)h se obtendrá resolviendo el sistema
lineal homogéneo que tenga como matriz de coeficientes a la
(A − λI)h .
29.6.
Caracterización de la diagonalización mediante el polinomio mı́nimo
Proposición 371 Sea V de dimensión finita n ≥ 1 sobre IK. Un endomorfismo triangularizable f de V es diagonalizable si y sólo si su polinomio mı́nimo
únicamente admite factores de primer grado.
Demostracion:
Supongamos que
C(ξ) = (ξ − λ1 )s1 (ξ − λ2 )s2 · · · (ξ − λr )sr ,
M(ξ) = (ξ − λ1 )m1 (ξ − λ2 )m2 · · · (ξ − λr )mr .
Si en el polinomio mı́nimo se cumpliese
m1 = m2 = . . . = mr = 1,
haciendo la descomposición primaria correspondiente a M(ξ) saldrı́a
V = Ker(f − λ1 I) ⊕ Ker(f − λ2 I) ⊕ . . . ⊕ Ker(f − λr I).
Esto indica que V es suma directa de todos los autoespacios relativos a f , luego,
según la proposición 345, f es diagonalizable.
Si partimos de que f sea diagonalizable, aplicando las proposiciones 344 y
368 a cada i ∈ [1, r], tenemos
dim(Ker(f − λi I)) = si = dim(Ker(f − λi I)si ) ⇒
⇒ Ker(f − λi I) = Ker(f − λi I)si .
Como f − λi I anula a todos los vectores de Ker(f − λi I)si , se cumple
(ξ − λi )mi | ξ − λi ⇒ mi = 1.
2
418
Capı́tulo 29. Escomposición Primaria
29.7.
Complementos / Ejercicios
1. Polinomio mı́nimo y método práctico de triangularización.
Sea f un operador triangularizable. La proposición 369 reduce el cálculo
de su polinomio mı́nimo al cálculo de los polinomios mı́nimos MU de la
restricción de f a cada sumando primario U = Ker(f − λI)s , donde λ
es un autovalor y s su orden de multiplicidad. Después, en la proposición
370 hemos visto que MU (ξ) = (ξ − λ)m donde m ∈ [1, s] es el mı́nimo
exponente entero positivo tal que
dim(Ker (f − λI)m ) = s.
Para el cálculo de este m, partiremos de la matriz A de f en una base
prefijada B. La determinación de cada núcleo Ker(f − λI)h se hará resolviendo el sistema lineal homogéneo que tenga a (A − λI)h como matriz
de coeficientes. Las soluciones obtenidas nos informarán de la dimensión de
Ker(f − λI)h , de manera que bastará con ir tomando los valores sucesivos
de h = 1, 2, . . ., hasta conseguir que la dimensión se iguale a s.
Lo mismo que la solución de los sucesivos sistemas homogéneos nos permiten conocer la dimensión de cada núcleo, también permiten construir
una base del mismo. Ahora bien, puesto que
{0} < Ker(f − λI) < Ker(A − λI)2 < . . . < Ker(f − λI)m−1 < U,
estas bases deben calcularse cada una por ampliación de la del núcleo
anterior. Se empieza por la base de Ker(f − λI) hasta acabar con la de
U = Ker(f − λI)m . Veamos cómo es la matriz de la restricción de f a U
en la base ası́ construı́da. El primer bloque, por tratarse de autovectores,
será diagonal. Supongamos, ahora, h ≥ 2 y sea z uno de los vectores de la
base de Ker(f − λI)h usados para ampliar la de Ker(f − λI)h−1 . Puesto
que
0 = (f − λI)h (z) = (f − λI)h−1 ((f − λI)(z))
resulta que
y = (f − λI)(z) = f (z) − λz ∈ Ker(f − λI)h−1 ,
es decir,
f (z) = y + λz,
donde y depende de los vectores básicos en el núcleo inmediato, los cuales
(por la forma en que hemos ido construyendo las bases), ocuparn lugares
anteriores en la base de U al que ocupe z. Esto nos asegura que la matriz
que buscamos tiene forma triangular.
A continuación se plantéan 13 ejercı́cios correspondientes a los 13 casos
de triangularización , pero no diagonalización, que aparecen en dimensión
n = 2, 3, 4.
29.7. Complementos / Ejercicios
419
Triangularizar los endomorfismos (sobre el cuerpo IR) dados por las siguientes matrices referidas a las bases canónicas de la dimensión correspondiente.
¶
µ
−8 −9 14
−10 −7
a)
b) 0
1 −2
7
4
−3 −3 4
11 11
c) 7 7
9 9
6
0
e)
1
0
3
0
g)
3
0
3
0
i)
0
0
4
0
k)
0
0
7
0
m)
0
0
−21
−15
−18
1
6
1
0
0
0
5
0
4
0
−1
2
1
3
4
0
0
0
0
0
0
0
3
3
8
d) 0
3
−1 3 3
2 1 2
0 3 2
−1 1 2
0
−1
f)
−1
0
6
0
h)
2
0
−1 1 1
4 −1 0
0
3 0
−1 1 4
−3
0
2
−1
5
−1
1
6
3
0
0
0
4
0
2
0
1
4
4
0
j)
0
0
0
4
0
−1
1 1
0 1
4 1
1 4
−1 1
4 0
0 4
−1 1
−1
3
0
1
l)
0
0
4
0
−1
1
0
0
−1 1
0 1
2 0
1 2
1
7
1
0
0
0
0
7
0
0
7
0
2. Sea p un divisor normalizado y no constante de M. Sea U = Ker p(f ).
Razonar que
MU = p.
3. Sea V un espacio vectorial complejo de dimensión finita y f un endomorfismo tal que f 3 = I. Razonar que f es diagonalizable.
4. Sea m un entero positivo y sea f un automorfismo de orden finito m, esto
es, un automorfismo tal que
f m = I, f h 6= I si 1 ≤ h < m,
420
Capı́tulo 29. Escomposición Primaria
de un espacio vectorial complejo. Razonar que es diagonalizable. ¿Cómo
son sus autovalores?.
5. Sea V un espacio vectorial complejo de dimensión finita y f un operador
tal que f 2 = −I. Razonar que f es diagonalizable.
6. Se considera el automorfismo f de C
I 3 definido por la matriz
√
√
0
−5 − √
i 3 −6 − 2i√ 3
1
3 + i √3
A=
4 + 2i√3
0√
2
6 + 2i 3
6 + 2i 3 1 + i 3
Comprobar por cálculo directo que f 3 = −I. Razonar que f es diagonalizable. Obtener sus autovalores y su determinante.
7. Sea V un espacio vectorial complejo de dimensión finita y f un endomorfismo tal que f 3 = −I. Razonar que f es diagonalizable.
8. En el espacio IR6 , referido a su base canónica, encontrar el polinomio
mı́nimo y una matriz triangular para los endomorfismos f definidos por
las matrices
3 1 2 2 0 0
0 3 −1 0 0 0
0 0 3 0 0 0
a)
.
0 0 3 3 −1 0
0 0 0 0 1 1
0 0 0 0 −4 5
2 0 0 0 −6 20
0 2 0 −1 −2 4
0
0
0 0 3 0
b)
.
0
0
0 0 0 2
0 0 0 0
4
0
0 0 0 0
1
4
421
Capı́tulo 30
Introducción a las Formas
de Jordan
Este capı́tulo es superfluo en nuestro desarrollo. Queremos decir que para un
matemático profesional e incluso para un alumno por encima de la media, la
lectura lógica continuarı́a en el siguiente.
En él se establece la existencia de una matriz canónica normal de Jordan
para los endomorfismos triangularizables en espacios de dimensiones 2, 3 y 4.
Esto mismo será demostrado en los capı́tulos posteriores para una dimensión
finita pero arbitraria n. ¿Por qué razón, pues, hemos decidido su redacción?
Ya habı́amos advertido que el tema de las matrices de Jordan conlleva dificultades que obligan a una elevación del nivel habitual en un curso de Algebra y
Geometrı́a. Esto ya ha debido quedar de manifiesto en los capı́tulos previos, en
los que aparecı́an conceptos como el de polinomio que se anula por un endomorfismo y descomposición primaria del espacio mediante uno de estos polinomios,
cuestiones necesarias para llegar a las formas canónicas que perseguimos.
Pensamos que esta subida de nivel puede facilitarse si aprendemos a colocar
directamente los primeros escalones. Ası́, la concreción con la que trabajaremos
en este capı́tulo preparará el terreno a la buena comprensión de la abstracción
que aparecerá en los siguientes.
Pero, además, en algún caso (alumnos para los que la Matemática sea un instrumento de aplicación más que un objeto de estudio en sı́) este capı́tulo (con
algún añadido, relativo a autovalores imaginarios de un endomorfismo real, que
veremos en la sección 26.6) puede ser suficiente para cerrar el tema. En tal
supuesto, podrı́a eludirse la demostración general, limitándose el profesor a indicar la generalización de los procesos operativos que aquı́ estableceremos.
De cualquier manera, deberá ser el profesor concreto que dirija este curso (en
función del nivel de sus alumnos y del tiempo disponible) quien tenga la última
palabra a la hora de decidir una u otra opción. Por nuestra parte, nos limitamos
al ofrecimiento de este doble camino.
422
30.1.
Capı́tulo 30. Introducción a las Formas de Jordan
El Problema
Sea V un espacio vectorial de dimensión finita n = 2, 3, 4 sobre un cuerpo
conmutativo IK. Sea f un endomorfismo triangularizable de V. Esto equivale a
decir f tiene n autovalores enIK, con lo cual
C(ξ) = (ξ − λ1 )s1 (ξ − λ2 )s2 . . . (ξ − λr )sr ,
y para el espacio V se tendrá una descomposición
V = Ker(f − λ1 I)s1 ⊕ Ker(f − λ2 I)s2 ⊕ Ker(f − λr I)sr ,
de manera que
dim(Ker(f − λi I)si ) = si
y el polinomio
(ξ − λi )si
será el caracterı́stico de la restricción de f a cada uno de los subespacios f invariantes
Ker (f − λi I)si .
Estableciendo una casuı́stica en función de la multiplicidad de los autovalores y
las dimensiones de los autoespacios, tratamos de obtener una base
Z = {z1 , z2 , . . . , zn },
que nombraremos como base de Jordan, en la cual f se represente por una
matriz canónica normal de Jordan, es decir, por una matriz triangular
α1
0
0
J =
..
.
0
0
²1
α2
0
..
.
0
²2
α3
..
.
...
...
...
..
.
0
0
0
..
.
0
0
0
0
. . . αn−1
...
0
0
0
0
..
.
²n−1
αn
,
donde cada αi será un autovalor, y los términos ²i pueden tomar sólo valores
iguales a 0 o a 1, debiendo ser αi+1 = αi siempre que ²i = 1.
En particular, si todos los ²i son nulos, se trata de endomorfismos diagonalizables. La novedad, pues, aparecerá en los casos no diagonalizables, es decir,
en aquellos endomorfismos donde algún autoespacio tenga dimensión inferior al
orden de multiplicidad de su respectivo autovalor.
30.2.
Matrices de Jordan en dimensión 2
1. Dos autovalores simples.
30.2. Matrices de Jordan en dimensión 2
423
Si f admite dos autovalores simples α y β, se busca una base
Z = {z1 ; z2 },
sin más que determinar dos vectores
½
z1 ∈ Ker(f − αI), z1 6= 0
z2 ∈ Ker(f − βI), z2 6= 0
En ella el endomorfismo se representa por la matriz diagonal
¶
µ
α 0
J=
.
0 β
2. Un autovalor doble.
Si f admite un autovalor doble α, tendremos
C(ξ) = (ξ − α)2 ⇒ V = Ker(f − αI)2 .
La dimensión de Ker(f − αI) puede ser uno o dos.
a) dim(Ker (f − αI)) = 1.
Proposición 372 Sea f un endomorfismo en un espacio V de dimensión 2 con un autovalor doble α para el cual
dim(Ker(f − αI)) = 1.
Entonces,
1) M(ξ) = (ξ − α)2 = C(ξ).
2) Dado cualquier vector z2 ∈ V tal que
z2 6∈ Ker(f − αI),
el vector
z1 = (f − αI)(z2 )
es un autovector de α.
3) El conjunto Z = {z1 , z2 } es una base y en ella se cumple
f (z1 ) = αz1 , f (z2 ) = z1 + αz2 .
Demostracion:
1) Como dim(Ker (f − αI)) = 1, la primera potencia de f − αI que
se anula es la segunda.
424
Capı́tulo 30. Introducción a las Formas de Jordan
2) Puesto que Ker(f − αI)2 = V, se tiene
0 = (f − αI)2 (z2 ) = (f − αI)((f − αI)(z2 )) = (f − αI)(z1 ) ⇒
⇒ z1 ∈ Ker(f − αI).
Por otra parte,
z2 6∈ Ker(f − αI) ⇒ z1 = (f − αI)(z2 ) 6= 0.
3) Supongamos una relación
a1 z1 + a2 z2 = 0.
Aplicando f − αI a ambos miembros queda
a2 z1 = 0 ⇒ a2 = 0,
porque z1 6= 0. Anulado a2 , la relación es
a1 z1 = 0 ⇒ a1 = 0,
donde hemos vuelto a aplicar que z1 6= 0. Ası́, {z1 , z2 } es una
base de V. Como z1 es un autovector, se tiene f (z1 ) = αz1 ,
mientras que de la fórmula usada para obtener z1 se sigue que
f (z2 ) = z1 + αz2 .
2
En resumen, hemos encontrado una base
Z = {z1 , z2 },
cuyos elementos se determinan por las condiciones
½
z2 ∈ V, z2 6∈ Ker(f − αI)
z1 = (f − αI)(z2 )
En ella, de acuerdo con la proposición 372, f se representa por la
matriz de Jordan
µ
¶
α 1
J=
.
0 α
b) dim(Ker (f − αI)) = 2.
Ahora f es la homotecia de razón α , y en cualquier base
Z = {z1 ; z2 }
de V, el endomorfismo se representa por la matriz diagonal
µ
¶
α 0
J=
.
0 α
30.3. Matrices de Jordan en dimensión 3
30.3.
425
Matrices de Jordan en dimensión 3
1. Tres autovalores simples.
Si f admite tres autovalores simples α, β y γ, se busca una base
Z = {z1 ; z2 ; z3 },
sin más que determinar tres vectores
z1 ∈ Ker(f − αI), z1 6= 0
z ∈ Ker(f − βI), z2 6= 0
2
z3 ∈ Ker(f − γI), z3 6= 0
En ella el endomorfismo se representa por la matriz diagonal
α 0 0
J = 0 β 0.
0 0 γ
2. Un autovalor simple y otro doble.
Si f admite un autovalor simple α y otro doble β, su polinomio caracterı́stico será
C(ξ) = (ξ − α)(ξ − β)2 ,
y se tiene la descomposición primaria:
V = Ker(f − αI) ⊕ Ker(f − βI)2 .
En el primer sumando directo se tiene una base tomando cualquier autovector z1 asociado al autovalor α. Para los vectores x del segundo se
cumplirá
(f − βI)2 (x) = 0,
pero la dimensión del autoespacio Ker (f − βI) podrá ser uno o dos.
a) dim(Ker (f − βI)) = 1.
La restricción de f al plano Ker(f − βI)2 , tendrá un autovalor doble
con una recta de autovectores. Entonces, podemos aplicarle la proposición 372 para obtener una base {z2 , z3 } del mismo. Uniendo las bases
de ambos sumandos, se llega a una base
Z = {z1 ; z2 , z3 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z3 ∈ Ker(f − βI)2 , z3 6∈ Ker(f − βI)
z2 = (f − βI)(z3 )
426
Capı́tulo 30. Introducción a las Formas de Jordan
en la cual f se representa por la matriz de Jordan
α 0 0
J = 0 β 1 .
0 0 β
b) dim(Ker(f − βI)) = 2.
En este supuesto, la base {z2 , z3 } del plano Ker(f − βI) se construye con dos autovectores de β que sean linealmente independientes.
Uniendo las bases de ambos sumandos, se llega a una base
Z = {z1 ; z2 ; z3 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z3 ∈ Ker(f − βI), z3 6= 0
z2 ∈ Ker(f − βI), independiente con z3
en la cual f se representa por la matriz diagonal
α 0 0
J = 0 β 0 .
0 0 β
3. Un autovalor triple.
Si f admite un autovalor triple α, tendremos
C(ξ) = (ξ − α)3 ⇒ V = Ker(f − αI)3 .
Siempre existe una base B = {v1 , v2 , v3 } en la cual f se representa por
una matriz triangular
α a12 a13
A = 0 α a23 .
0
0
α
El endomorfismo f − αI se representará por
0 a12 a13
A − αI = 0 0 a23
0 0
0
La dimensión de Ker(f − αI) puede ser uno, dos o tres.
a) dim(Ker f − αI) = 1.
30.3. Matrices de Jordan en dimensión 3
427
Proposición 373 Sea f un endomorfismo en un espacio V de dimensión 3 con un autovalor triple α para el cual
dim(Ker(f − αI)) = 1.
Entonces,
1) M(ξ) = (ξ − α)3 = C(ξ).
2) Dado cualquier vector z3 ∈ V tal que
z3 6∈ Ker(f − αI)2 ,
si calculamos los vectores
z2 = (f − αI)(z3 ),
z1 = (f − αI)2 (z3 ) = (f − αI)(z2 ).
se prueba que z1 es un autovector de α.
3) El conjunto Z = {z1 , z2 , z3 } es una base y en ella se cumple
f (z1 ) = αz1 , f (z2 ) = z1 + αz2 , f (z3 ) = z2 + αz3 .
Demostracion:
1) Empezamos por observar que
dim(Ker(f − αI)) = 1 ⇒ rang(A − αI) = 2 ⇒ a12 a23 6= 0.
Entonces, en
0 0
(A − αI)2 = 0 0
0 0
a12 a23
0
0
el elemento de la primera fila y tercera columna cumple
a12 a23 6= 0 ⇒ rang((f − αI)2 ) = 1 ⇒ dim(Ker(f − αI)2 ) = 2.
Ası́, la primera potencia de f − αI que se anula es la tercera.
2) Puesto que Ker(f − αI)3 = V, se tiene
0 = (f − αI)3 (z3 ) = (f − αI)((f − αI)2 (z3 )) = (f − αI)(z1 ) ⇒
⇒ z1 ∈ Ker(f − αI)
Por otra parte,
z3 6∈ Ker(f − αI)2 ⇒ z1 = (f − αI)2 (z3 ) 6= 0.
428
Capı́tulo 30. Introducción a las Formas de Jordan
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 = 0
Aplicando (f − αI)2 a ambos miembros queda
a3 z1 = 0 ⇒ a3 = 0
porque z1 6= 0. Anulado a3 , la relación es
a1 z1 + a2 z2 = 0.
Aplicando f − αI a ambos miembros queda
a2 z1 = 0 ⇒ a2 = 0,
porque z1 6= 0. Anulados a3 y a2 , la relación es
a1 z1 = 0 ⇒ a1 = 0
donde hemos vuelto a aplicar que z1 6= 0. Ası́, {z1 , z2 , z3 } es
una base de V. Como z1 es un autovector, se tiene f (z1 ) = αz1 ,
mientras que de las fórmulas usadas para obtener z1 y z2 se sigue
que f (z2 ) = z1 + αz2 y f (z3 ) = z2 + αz3 .
2
En resumen, hemos encontrado una base
Z = {z1 , z2 , z3 },
cuyos elementos se determinan por las condiciones
z3 ∈ V, z3 6∈ Ker(f − αI)2
z2 = (f − αI)(z3 )
z1 = (f − αI)2 (z3 )
En ella, de acuerdo con la proposición 373, f se representa por la
matriz de Jordan
α 1 0
J = 0 α 1 .
0 0 α
b) dim(Ker(f − αI)) = 2.
Proposición 374 Sea f un endomorfismo en un espacio V de dimensión 3 con un autovalor triple α tal que
dim(Ker(f − αI)) = 2.
Entonces,
30.3. Matrices de Jordan en dimensión 3
429
1) M(ξ) = (ξ − α)2 .
2) Dado cualquier vector z3 ∈ V tal que
z3 6∈ Ker(f − αI),
el vector
z2 = (f − αI)(z3 )
es un autovector de α.
3) Dada una base {z1 ; z2 } de Ker(f −αI), de la que z2 forme parte,
el conjunto Z = {z1 ; z2 , z3 } es una base de V. En ella se cumple
f (z1 ) = αz1 , f (z2 ) = αz2 , f (z3 ) = z2 + αz3 .
Demostracion:
1) Ahora se tendrá v1 , v2 ∈ Ker(f − αI) de manera que
0 0 a13
A − αI = 0 0 a23 6= 0,
0 0 0
porque su rango es 1, pero (A − αI)2 = 0, de manera que la
primera potencia de f − αI que se ha anulado es la segunda.
2) Puesto que Ker(f − αI)2 = V, se tiene
0 = (f − αI)2 (z3 ) = (f − αI)((f − αI)(z3 )) = (f − αI)(z2 ) ⇒
⇒ z2 ∈ Ker(f − αI)
Por otra parte,
z3 6∈ Ker(f − αI) ⇒ z2 = (f − αI)(z3 ) 6= 0
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 = 0
Aplicando (f − αI) a ambos miembros queda
a3 z2 = 0 ⇒ a3 = 0
porque z2 6= 0. Anulado a3 , la relación es
a1 z1 + a2 z2 = 0 ⇒ a1 = a2 = 0
pues {z1 , z2 } es una base de Ker(f − αI). Ası́, {z1 , z2 , z3 } es
una base de V. Como z1 y z2 son autovectores, será f (z1 ) =
αz1 , f (z2 ) = αz2 . De la fórmula para definir z2 se sigue sin más
que f (z3 ) = z2 + αz3 .
430
Capı́tulo 30. Introducción a las Formas de Jordan
2
En resumen, hemos encontrado una base
Z = {z1 ; z2 , z3 },
cuyos elementos se determinan por las condiciones
z3 ∈ V, z3 6∈ Ker(f − αI)
z2 = (f − αI)(z3 )
z1 ∈ Ker(f − αI), independiente con z2 .
En ella, de acuerdo con la proposición 374, f se representa por la
matriz de Jordan
α 0 0
J = 0 α 1 .
0 0 α
c) dim(Ker(f − αI)) = 3.
Ahora f es la homotecia de razón α, y en cualquier base
Z = {z1 ; z2 ; z3 }
de V, el endomorfismo se representa por la matriz diagonal
α 0 0
J = 0 α 0 .
0 0 α
30.4.
Matrices de Jordan en dimensión 4
1. Cuatro autovalores simples.
Si f admite cuatro autovalores simples α, β, γ y δ , se busca una base
Z = {z1 ; z2 ; z3 ; z4 }
sin más que determinar cuatro vectores
z ∈ Ker(f − αI), z1 6= 0
1
z2 ∈ Ker(f − βI), z2 6= 0
z3 ∈ Ker(f − γI), z3 6= 0
z4 ∈ Ker(f − δI), z4 6= 0
En ella el endomorfismo se representa por la matriz diagonal
α 0 0 0
0 β 0 0
J =
.
0 0 γ 0
0 0 0 δ
30.4. Matrices de Jordan en dimensión 4
431
2. Dos autovalores simples y uno doble.
Si f admite dos autovalores simples α y β, y otro doble γ, su polinomio
caracterı́stico será
C(ξ) = (ξ − α)(ξ − β)(ξ − γ)2 ,
y se tiene la descomposición primaria:
V = Ker(f − αI) ⊕ Ker(f − βI) ⊕ Ker(f − γI)2 .
Los dos primeros sumandos directos son unidimensionales, lo que permite
calcular un autovector z1 de α y otro z2 de β . Para los vectores x del
tercero se cumplirá
(f − γI)2 (x) = 0,
pero el autoespacio Ker(f − γI), podrá tener dimensión uno o dos.
a) dim(Ker(f − γI)) = 1.
La restricción de f al plano Ker(f − γI)2 , tendrá un autovalor doble
con una recta de autovectores. Entonces, podemos obtener una base
{z3 , z4 } del mismo aplicando el procedimiento de la proposición 372.
Uniendo las bases de los tres sumandos directos de V, se llega a una
base
Z = {z1 ; z2 ; z3 , z4 }
cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z2 ∈ Ker(f − βI), z2 6= 0
z4 ∈ Ker(f − γI)2 , z4 6∈ Ker(f − γI)
z3 = (f − γI)(z4 )
en la cual f se representa por la matriz de Jordan
α 0 0 0
0 β 0 0
J =
.
0 0 γ 1
0 0 0 γ
b) dim(Ker(f − γI)) = 2.
En este supuesto, la base {z3 , z4 } del plano Ker(f − γI) se construye con dos autovectores de γ que sean linealmente independientes.
Uniendo las bases de los tres sumandos, se llega a una base
Z = {z1 ; z2 ; z3 ; z4 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z2 ∈ Ker(f − βI), z2 6= 0
z3 ∈ Ker(f − γI), z3 6= 0
z4 ∈ Ker(f − γI), independiente con z3
432
Capı́tulo 30. Introducción a las Formas de Jordan
en la cual f se representa por la matriz diagonal
α
0
J =
0
0
0
β
0
0
0
0
γ
0
0
0
.
0
γ
3. Un autovalor simple y otro triple.
Si f admite un autovalor simple α y otro triple β, su polinomio caracterı́stico será
C(ξ) = (ξ − α)(ξ − β)3 ,
y se tiene la descomposición primaria:
V = Ker(f − αI) ⊕ Ker(f − βI)3 .
En el primer sumando directo se puede tomar un autovector z1 . Para los
vectores x del segundo se cumplirá
(f − βI)3 (x) = 0,
pero se presentarán tres alternativas según Ker(f − βI) tenga dimensión
uno, dos o tres.
a) dim(Ker(f − βI)) = 1.
En este caso, el endomorfismo restricción de f al subespacio tridimensional Ker(f − βI)3 , tiene un autovalor triple con una recta de
autovectores. Entonces, la proposición 373 permite obtener una base
{z2 , z3 , z4 } de este espacio. Uniendo las de los dos sumandos directos,
llegamos a una base
Z = {z1 ; z2 , z3 , z4 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z4 ∈ Ker(f − βI)3 , z4 6∈ Ker(f − βI)2
z3 = (f − βI)(z4 )
z2 = (f − βI)2 (z4 )
en la cual f se representa por la matriz de Jordan
α
0
J =
0
0
0
β
0
0
0
1
β
0
0
0
.
1
β
30.4. Matrices de Jordan en dimensión 4
433
b) dim(Ker(f − βI)) = 2,
La restricción de f al espacio Ker(f − βI)3 , tendrá un autovalor
triple con un plano de autovectores. Entonces, su base {z2 ; z3 , z4 } se
determina de acuerdo con la proposición 374. Uniéndola con la del
otro sumando directo, se llega a una base
Z = {z1 ; z2 ; z3 , z4 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z4 ∈ Ker(f − βI)2 , z4 6∈ Ker(f − βI)
z3 = (f − βI)(z4 )
z2 ∈ Ker(f − βI), independiente con z3
en la cual f se representa por la matriz de Jordan
α
β
J =
.
β 1
β
c) dim(Ker(f − βI)) = 3.
Para la base {z2 ; z3 ; z4 } del segundo sumando bastará buscar tres
autovectores de β que sean linealmente independientes. Uniendo las
de los dos sumandos, se llega a una base
Z = {z1 ; z2 ; z3 ; z4 }
de V, cuyos elementos se determinan por las condiciones
z1 ∈ Ker(f − αI), z1 6= 0
z4 ∈ Ker(f − βI), z4 6= 0
z3 ∈ Ker(f − βI), independiente con z4
z2 ∈ Ker(f − βI), independiente con z4 y z3
en la cual f se representa por la matriz diagonal
α 0 0 0
0 β 0 0
J =
.
0 0 β 0
0 0 0 β
4. Dos autovalores dobles.
Si f admite dos autovalores dobles α y β, se tendrá
C(ξ) = (ξ − α)2 (ξ − β)2 ,
434
Capı́tulo 30. Introducción a las Formas de Jordan
a la vez que la descomposición primaria:
V = Ker(f − αI)2 ⊕ Ker(f − βI)2 .
En cuanto a sus autoespacios, ambos pueden ser unidimensionales, uno
tener dimensión dos y el otro uno, o ambos ser bidimensionales
a) dim(Ker(f − αI)) = dim(Ker(f − βI)) = 1.
Cada una de las restricciones de f a los planos
Ker(f − αI)2 , Ker(f − βI)2 ,
posee un autovalor doble con una recta de autovectores. Aplicando
la proposición 372, podemos construir una base {z1 , z2 } del primero
y otra {z3 , z4 } del segundo. Uniéndolas, obtenemos una base
Z = {z1 , z2 ; z3 , z4 }
de V, cuyos elementos se determinan por las condiciones
z2 ∈ Ker(f − αI)2 , z2 6∈ Ker(f − αI)
z1 = (f − αI)(z2 )
z4 ∈ Ker(f − βI)2 , z4 6∈ Ker(f − βI)
z3 = (f − βI)(z4 )
en la cual f se representa por la matriz de Jordan
α 1 0 0
0 α 0 0
J =
.
0 0 β 1
0 0 0 β
b) dim(Ker(f − αI)) = 2, dim(Ker(f − βI)) = 1.
La base {z1 ; z2 } del primer plano se forma con dos autovectores independientes de α, mientras que la {z3 , z4 } del segundo se obtiene
por el método usado en la proposición 372. Uniéndolas, llegamos a la
base
Z = {z1 ; z2 ; z3 , z4 }
de V, cuyos elementos se determinan por las condiciones
z2 ∈ Ker(f − αI), z2 6= 0
z1 ∈ Ker(f − αI), independiente con z2
2
z
4 ∈ Ker(f − βI) , z4 6∈ Ker(f − βI)
z3 = (f − βI)(z4 )
en la cual f se representa por la matriz de Jordan
α 0 0 0
0 α 0 0
J =
.
0 0 β 1
0 0 0 β
30.4. Matrices de Jordan en dimensión 4
435
c) dim(Ker(f − αI)) = dim(Ker(f − βI)) = 2.
Ambas bases se forman con parejas {z1 ; z2 } y {z3 ; z4 } de autovectores
independientes de α para una y de β para la otra. Al unirlas, se
obtiene la base
Z = {z1 ; z2 ; z3 ; z4 }
de V, cuyos elementos se determinan por las condiciones
z2 ∈ Ker(f − αI), z2 6= 0
z1 ∈ Ker(f − αI), independiente con z2
z
4 ∈ Ker(f − βI), z4 6= 0
z3 ∈ Ker(f − βI), independiente con z4
el endomorfismo se representa por la matriz diagonal
α 0 0 0
0 α 0 0
J =
.
0 0 β 0
0 0 0 β
5. Un autovalor cuádruple.
Si f admite un autovalor cuádruple α, tendremos
C(ξ) = (ξ − α)4 ⇒ V= Ker(f − αI)4 .
Siempre existe una base B = {v1 , v2 , v3 , v4 } en la cual f se representa
por una matriz triangular
α a12 a13 a14
0 α a23 a24
A=
.
0
0
α a34
0
0
0
α
El endomorfismo f − αI se representará por
0 a12 a13
0 0 a23
A − αI =
0 0
0
0 0
0
a14
a24
.
a34
0
La dimensión de Ker(f − αI) puede ser uno, dos, tres o cuatro.
a) dim(Ker f − αI) = 1.
Proposición 375 Sea f un endomorfismo en un espacio V de dimensión 4 con un autovalor cuádruple α para el cual
dim(Ker(f − αI)) = 1.
Entonces,
436
Capı́tulo 30. Introducción a las Formas de Jordan
1) M(ξ) = (ξ − α)4 = C(ξ).
2) Dado cualquier vector z4 ∈ V tal que
z4 6∈ Ker(f − αI)3 ,
si calculamos los vectores
z3 = (f − αI)(z4 ),
z2 = (f − αI)2 (z4 ) = (f − αI)(z3 ),
z1 = (f − αI)3 (z3 ) = (f − αI)(z2 ),
se prueba que z1 es un autovector de α.
3) El conjunto Z = {z1 , z2 , z3 , z4 } es una base y en ella se cumple
f (z1 ) = αz1 , f (z2 ) = z1 +αz2 , f (z3 ) = z2 +αz3 , f (z4 ) = z3 +αz4 .
Demostracion:
1) Empezamos por observar que
dim(Ker(f − αI)) = 1 ⇒ rang(A − αI) = 3 ⇒ a12 a23 a34 6= 0.
Entonces, en
0
0
2
(A − αI) =
0
0
0
0
0
0
a12 a23
0
0
0
a12 a24 +34 a13 a
a23 a34
0
0
la submatriz de las dos primeras filas y las dos últimas columnas
tiene determinante
a12 (a23 )2 a34 6= 0 ⇒ rang((f −αI)2 ) = 2 ⇒ dim(Ker(f −αI)2 ) = 2.
Haciendo un nuevo cálculo, tenemos
0 0 0 a12 a23 a34
0
0 0 0
(A − αI)3 =
⇒
0 0 0
0
0 0 0
0
⇒ rang((f − αI)3 ) = 1 ⇒ dim(Ker(f − αI)3 ) = 3.
Ası́, la primera potencia de f −αI que se anula es la de exponente
4.
2) Puesto que Ker(f − αI)4 = V, se tiene
0 = (f − αI)4 (z4 ) = (f − αI)((f − αI)3 (z4 )) = (f − αI)(z1 ) ⇒
⇒ z1 ∈ Ker(f − αI)
Por otra parte,
z4 6∈ Ker(f − αI)3 ⇒ z1 = (f − αI)3 (z4 ) 6= 0.
30.4. Matrices de Jordan en dimensión 4
437
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 + a4 z4 = 0
Aplicando (f − αI)3 a ambos miembros queda
a4 z1 = 0 ⇒ a4 = 0
porque z1 6= 0. Anulado a4 , la relación es
a1 z1 + a2 z2 + a3 z3 = 0.
2
Aplicando (f − αI) a ambos miembros queda
a3 z1 = 0 ⇒ a3 = 0
porque z1 6= 0. Anulados a4 y a3 , la relación es
a1 z1 + a2 z2 = 0.
Aplicando f − αI a ambos miembros queda
a2 z1 = 0 ⇒ a2 = 0,
porque z1 6= 0. Anulados a4 , a3 y a2 , la relación es
a1 z1 = 0 ⇒ a1 = 0
donde hemos vuelto a aplicar que z1 6= 0. Ası́, {z1 , z2 , z3 , z4 } es
una base de V. Se tiene f (z1 ) = αz1 porque z1 es un autovector,
mientras que de las fórmulas usadas para obtener z1 , z2 y z3 se
sigue que
f (z2 ) = z1 + αz2 , f (z3 ) = z2 + αz3 , f (z4 ) = z3 + αz4 .
2
En resumen, hemos encontrado una base
Z = {z1 , z2 , z3 , z4 },
cuyos elementos se determinan por las condiciones
z4 ∈ V, z4 6∈ Ker(f − αI)3
z3 = (f − αI)(z4 )
2
z
2 = (f − αI) (z4 )
z1 = (f − αI)3 (z4 )
En ella, de acuerdo con la proposcición 375, f se representa por la
matriz de Jordan
α 1 0 0
0 α 1 0
J =
.
0 0 α 1
0 0 0 α
438
Capı́tulo 30. Introducción a las Formas de Jordan
b) dim(Ker(f − αI)) = 2.
Podemos suponer que v1 , v2 ∈ Ker(f − αI), por lo cual
0
0
A − αI =
0
0
0
0
0
0
a13
a23
0
0
a14
a24
,
a34
0
0 0 0 a13 a34
0 0 0 a23 a34
(A − αI)2 =
,
0 0 0
0
0 0 0
0
(A − αI)3 = 0.
Por hipótesis A − αI tiene rango 2 y, por ello, su tercera columna no
puede ser nula, o sea, al menos uno de los números a13 y a23 es no
nulo. En cambio, el rango de (A − αI)2 , y, por tanto, la dimensión
del subespacio Ker(f − αI)2 no están determinados. Por eso, hay que
abrir dos opciones.
c) dim(Ker(f − αI)2 ) = 3.
Proposición 376 Sea f un endomorfismo en un espacio V de dimensión 4 con un autovalor cuádruple α para el cual
dim(Ker(f − αI)) = 2, dim(Ker(f − αI)2 ) = 3.
Entonces,
1) M(ξ) = (ξ − α)3 .
2) Dado cualquier vector z4 ∈ V tal que
z4 6∈ Ker(f − αI)2 ,
si calculamos los vectores
z3 = (f − αI)(z4 ),
z2 = (f − αI)2 (z4 ) = (f − αI)(z3 ),
se prueba que z2 es un autovector de α.
3) Siendo {z1 ; z2 } una base de Ker(f − αI) de la que z2 forme
parte, el conjunto Z = {z1 ; z2 , z3 , z4 } es una base de V y en ella
se cumple
f (z1 ) = αz1 , f (z2 ) = αz2 , f (z3 ) = z2 + αz3 , f (z4 ) = z3 + αz4 .
30.4. Matrices de Jordan en dimensión 4
439
Demostracion:
1) Esta opción, que se corresponde con la condición a34 6= 0, pues
se ha señalado que uno de los números a13 o a23 es no nulo, pone
de manifiesto que la primera potencia de f − αI que se anula es
la tercera.
2) Puesto que Ker(f − αI)3 = V, se tiene
0 = (f − αI)3 (z4 ) = (f − αI)((f − αI)2 (z4 )) = (f − αI)(z2 ) ⇒
⇒ z2 ∈ Ker(f − αI)
Por otra parte,
z4 6∈ Ker(f − αI)2 ⇒ z2 = (f − αI)2 (z4 ) 6= 0.
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 + a4 z4 = 0
Aplicando (f − αI)2 a ambos miembros queda
a4 z2 = 0 ⇒ a4 = 0
porque z2 6= 0. Anulado a4 , la relación es
a1 z1 + a2 z2 + a3 z3 = 0.
Aplicando f − αI a ambos miembros queda
a3 z2 = 0 ⇒ a3 = 0
porque z2 6= 0. Anulados a4 y a3 , la relación es
a1 z1 + a2 z2 = 0 ⇒ a1 = a2 = 0
pues {z1 ; z2 } es una base de Ker(f − αI). Ası́, {z1 ; z2 , z3 , z4 } es
una base de V. Se tiene f (z1 ) = αz1 , f (z2 ) = αz2 por tratarse de
autovectores, mientras que de las fórmulas usadas para obtener
z2 , y z3 se sigue que f (z3 ) = z2 + αz3 , f (z4 ) = z3 + αz4 .
2
En resumen, hemos llegado a una base
Z = {z1 ; z2 , z3 , z4 },
cuyos elementos se determinan por las condiciones
z4 ∈ V, z4 6∈ Ker(f − αI)2
z3 = (f − αI)(z4 )
z2 = (f − αI)2 (z4 )
z1 ∈ Ker(f − αI), independiente con z2
440
Capı́tulo 30. Introducción a las Formas de Jordan
En ella, de acuerdo con la proposición 376, f se representa por la
matriz de Jordan
α 0 0 0
0 α 1 0
J =
.
0 0 α 1
0 0 0 α
d ) dim(Ker(f − αI)2 ) = 4.
Proposición 377 Sea f un endomorfismo en un espacio V de dimensión 4 con un autovalor cuádruple α tal que
dim(Ker(f − αI)) = 2, dim(Ker(f − αI)2 ) = 4.
Entonces,
1) M(ξ) = (ξ − α)2 .
2) Dados dos vectores independientes z4 , z2 ∈ V tales que
Ker(f − αI)⊕ < z4 , z2 >= V,
los vectores
z3 = (f − αI)(z4 ), z1 = (f − αI)2 (z2 ),
son autovectores de α, independientes entre sı́.
3) El conjunto Z = {z1 , z2 ; z3 , z4 } es una base de V y en ella se
cumple
f (z1 ) = αz1 , f (z2 ) = z1 + αz2 , f (z3 ) = αz3 , f (z4 ) = z3 + αz4 .
Demostracion:
1) En esta opción, que corresponde a la condición a34 = 0, es claro
que la primera potencia de f −αI que se anula es la de exponente
2.
2) Puesto que Ker(f − αI)2 = V, se tiene
0 = (f − αI)2 (z4 ) = (f − αI)((f − αI)(z4 )) = (f − αI)(z3 ) ⇒
⇒ z3 ∈ Ker(f − αI),
z4 6∈ Ker(f − αI) ⇒ z3 = (f − αI)(z4 ) 6= 0,
0 = (f − αI)2 (z2 ) = (f − αI)((f − αI)(z1 )) = (f − αI)(z1 ) ⇒
⇒ z1 ∈ Ker(f − αI),
z2 6∈ Ker(f − αI) ⇒ z1 = (f − αI)(z2 ) 6= 0,
30.4. Matrices de Jordan en dimensión 4
441
luego, efectivamente, z3 y z1 son autovectores. Una relación como
la
a1 z1 + a3 z3 = 0,
se puede reescribir en la forma
(f − αI)(a1 z2 + a3 z4 ) = 0 ⇒ a1 z2 + a3 z4 ∈ Ker(f − αI).
Este vector también pertenece al subespacio < z2 , z4 >, complementario del autoespacio, luego debe ser
a1 z2 + a3 z4 = 0 ⇒ a1 = a3 = 0,
pues z2 y z4 son independientes. Esto prueba que también z1 y
z3 lo son.
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 + a4 z4 = 0
Aplicando (f − αI) a ambos miembros queda
a2 z1 + a4 z3 = 0 ⇒ a2 = a4 = 0
porque z1 y z3 son independientes. Anulados a4 y a2 , la relación
es
a1 z1 + a3 z3 = 0 ⇒ a1 = a3 = 0
por igual razón. Ası́, {z1 , z2 ; z3 , z4 } es base de V. Por ser autovectores, se tiene f (z1 ) = αz1 , f (z3 ) = αz2 , mientras que
de las fórmulas que definen az1 , y z3 se sigue que f (z2 ) =
z1 + αz2 , f (z4 ) = z3 + αz4 .
2
En resumen, se ha construido una base
Z = {z1 , z2 ; z3 , z4 },
cuyos elementos se determinan por las condiciones
z4 , z2 ∈ V, z4 , z2 6∈ Ker(f − αI)
Ker(f − αI)⊕ < z4 , z2 >= V
z
3 = (f − αI)(z4 )
z1 = (f − αI)(z2 )
En ella, de acuerdo con la proposición 377, f se representa por la
matriz de Jordan
α 1 0 0
0 α 0 0
J =
.
0 0 α 1
0 0 0 α
442
Capı́tulo 30. Introducción a las Formas de Jordan
e) dim(Ker(f − αI)) = 3.
Proposición 378 Sea f un endomorfismo en un espacio V de dimensión 4 con un autovalor cuádruple α tal que
dim(Ker(f − αI)) = 3.
Entonces,
1) M(ξ) = (ξ − α)2 .
2) Dado cualquier vector z4 ∈ V tal que
z4 6∈ Ker(f − αI),
el vector
z3 = (f − αI)(z4 )
es un autovector de α.
3) Dada una base {z1 ; z2 ; z3 } de Ker(f − αI), de la que z3 forme
parte, el conjunto Z = {z1 ; z2 ; z3 , z4 } es una base de V. En ella
se cumple
f (z1 ) = αz1 , f (z2 ) = αz2 , f (z3 ) = αz3 , f (z4 ) = z3 + αz4 .
Demostracion:
1) Ahora se tendrá v1 , v2 , v3 ∈ Ker(f − αI) de manera que
0
0
A − αI =
0
0
0
0
0
0
0
0
0
0
a14
a24
6= 0,
a34
0
porque su rango es 1, pero (A − αI)2 = 0, de manera que la
primera potencia de f − αI que se ha anulado es la de exponente
2.
2) Puesto que Ker(f − αI)2 = V, se tiene
0 = (f − αI)2 (z4 ) = (f − αI)((f − αI)(z4 )) = (f − αI)(z3 ) ⇒
⇒ z3 ∈ Ker(f − αI)
Por otra parte,
z4 6∈ Ker(f − αI) ⇒ z3 = (f − αI)(z4 ) 6= 0
3) Supongamos una relación
a1 z1 + a2 z2 + a3 z3 + a4 z4 = 0
30.5. Comentarios finales
443
Aplicando (f − αI) a ambos miembros queda
a4 z3 = 0 ⇒ a4 = 0
porque z3 6= 0. Anulado a4 , la relación es
a1 z1 + a2 z2 + a3 z3 = 0 ⇒ a1 = a2 = a3 = 0
pues {z1 ; z2 ; z3 } es una base de Ker(f − αI). Ası́, {z1 ; z2 ; z3 , z4 }
es una base de V. Como los tres primeros son autovectores,
será f (z1 ) = αz1 , f (z2 ) = αz2 , f (z3 ) = αz3 . De la fórmula para
definir z3 se sigue sin más que f (z4 ) = z3 + αz4 .
2
En resumen, hemos encontrado una base
Z = {z1 ; z2 ; , z3 , z4 },
cuyos elementos se determinan por las condiciones
z4 ∈ V, z4 6∈ Ker(f − αI)
z3 = (f − αI)(z4 )
z2 ∈ Ker(f − αI), independiente con z3
z1 ∈ Ker(f − αI), independiente con z3 y z2
En ella, de acuerdo con la proposición 378, f se representa por la
matriz de Jordan
α 0 0 0
0 α 0 0
J =
.
0 0 α 1
0 0 0 α
f ) dim(Ker(f − αI)) = 4.
Ahora f es la homotecia de razón α, y en cualquier base
Z = {z1 ; z2 ; z3 ; z4 }
de V, el endomorfismo se representa por la matriz diagonal
α 0 0 0
0 α 0 0
J =
.
0 0 α 0
0 0 0 α
30.5.
Comentarios finales
Una vez conseguido el objetivo planteado para este capı́tulo, bueno será insertar
una serie de comentarios:
444
Capı́tulo 30. Introducción a las Formas de Jordan
Recuento de casos posibles por dimensión:
Repasando lo hecho en cada una de las dimensiones n = 2, 3, 4 resultan 23
formas diferentes de Jordan para endomorfismos triangularizables.
Cabe pensar en algún tipo de efecto expansivo al subir de dimensión y de hecho
ası́ ocurre.
Los métodos son contructivos:
Aseguramos esto en el sentido de que, para cada una de las posibles formas
de Jordan, en cada una de las dimensiones tratadas, no solamente se ha indicado el tipo de matriz canónica que se consigue sino que se ha señalado cómo
obtener una base en la que el endomorfismo en cuestión se representa por tal
matriz. En muchas de las aplicaciones, el conocimiento de esta base de Jordan
es imprescindible. Existen otras formas (más algebraicas que geométricas y que
intencionadamente no hemos querido desarrollar) de llegar al conocimiento de
la matriz de Jordan que eluden la construcción de tal base.
Importancia de la descomposición primaria:
El primer paso para llegar a la forma de Jordan ha sido la descomposición
primaria asociada al polinomio caracterı́stico. Reduce cada endomorfismo a sus
restricciones a subespacios con un solo autovalor. Como la dimensión de estos
subespacios (cuando haya al menos dos sumandos directos, o sea, dos autovalores
diferentes) es menor que la de partida, nos podemos apoyar (y ası́ lo hemos
hecho) en el conocimiento de las formas de Jordan en dimensión más pequeña
que la que estemos tratando.
Endomorfismos con un solo autovalor:
Ası́, la novedad en cada dimensión está en los automorfismos con un solo autovalor. Si el lector repasa este capı́tulo, verá que en ellos es donde hemos precisado
de algún tipo de teorema para demostrar la existencia de una matriz y una base
de Jordan.
Algunas de estas demostraciones son calcadas unas de otras. Por ejemplo, las
proposiciones 372, 373 y 375, relativas al caso en que
dim(Ker(f − αI)) = 1,
son la misma, pero cada vez con un escalón más. Cabe pensar que haya un
enunciado en dimensión arbitraria que las englobe y ası́ se presentará en el
proximo capı́tulo. Otro tanto ocurre con los enunciados 374 y 378, en los que
dim(Ker(f − αI)) = n − 1.
Y, por supuesto, con los casos triviales, en los que no hemos ni planteado teorema
alguno, donde
dim(Ker(f − αI)) = n,
correspondientes a las homotecias, cuya validez en cualquier dimensión es obvia.
Estas tres generalizaciones agotan las posibilidades en dimensión 3, pero el lector
habrá observado como, intercalándose entre ellas, aparecen otras opciones al
subir a la cuarta dimensión (proposiciones 376 y 377). Naturalmente, la cuestión
30.5. Comentarios finales
445
se complica en dimensiones mayores y el efecto expansivo de que hablábamos
antes es manifiesto.
Los autoespacios no determinan la forma de Jordan:
Parece que el conocimiento de las dimensiones de los diversos autoespacios determina de manera única la forma de Jordan. Ası́ ocurre en un plano y en un
espacio ordinario. Y en un espacio tetradimensional, salvo un caso, aquél en
que hay un solo autovalor y la dimensión de su autoespacio es 2: aparecen dos
posibles matrices de Jordan y el dilucidar de cuál se trata depende del valor de
dim(Ker(f − αI)2 ).
El lector debe creernos si le aseguramos que esta única singularidad que se aprecia al limitarnos a dimensiones menores o iguales que 4, desaparece al elevarnos
dimensionalmente hablando. No sólo no va a ser excepción, sino que la presencia de casos similares se convierte casi en norma. Casos habrá en que haya que
recurrir a la dimensión de Ker(f − αI)3 y de otras potencias superiores.
Construcción de la base de Jordan:
Decı́amos que nuestras demostraciones son constructivas. En ellas (limitándonos
siempre a endomorfismos con un solo autovalor) hemos tenido que establecer las
sucesivas dimensiones de
Ker(f − αI), Ker(f − αI)2 , Ker(f − αI)3 , . . .
hasta llegar a una coincidente con la dimensión total. Esto, además de para detectar la excepción que acabamos de comentar, lo hemos usado para la construcción en cada uno de los casos estudiados de la base de Jordan correspondiente.
La idea general (que por ello será la que se use en los siguientes capı́tulos) ha
sido comenzar por tomar vectores en el subespacio más alto, o sea en el primer
Ker(f − αI)m que coincida con V, que no estén en el escalón inmediato anterior
Ker(f − αI)m−1 . Con ellos, mediante sucesivas aplicaciones del endomorfismo
f − αI, vamos construyendo otros vectores de la base de Jordan hasta llegar
a uno que resulta ser autovector, todo ello auxiliado, si es menester, de alguna
técnica de ampliación de bases.
¿Vectores asociados?
Este proceso de final a principio, o mejor de iniciar la casa por el tejado, es
el verdaderamente sistemático y generalizable. Por tanto, el bueno, el canónico.
Comentamos esto porque aún en bibliografı́a reciente (de autores españoles)
encontramos alusiones a un llamado método de vectores asociados que parte de
cuantos autovectores sea posible (es decir, de una cantidad de ellos igual a la
dimensión del autoespacio e independientes entre sı́) y luego se va completando
hasta una base con unos asociados que hay que determinar como soluciones de
sistemas del tipo
(f − αI)(x) = v,
donde x es el asociado incógnita y v es un autovector o bien otro asociado
previamente construido. El método funciona en dimensión 2 y en algún caso de
446
Capı́tulo 30. Introducción a las Formas de Jordan
dimensión tres. Pero, en esta dimensión, cuando f tiene un autovalor triple con
un plano de autovectores, el único asociado que falta ¿con qué autovector dato
de los dos prefijados se calcula? Se tome el que se tome lo más probable es que el
sistema en cuestión sea incompatible y cuando no lo es se trata de que la flauta
del burro sonó por casualidad. Se habla, entonces, de casos de ambigüedad y se
resuelven (como no podı́a ser de otro modo) tomando un autovector genérico (o
sea una combinación lineal de los dos prefijados) como término independiente
del sistema. Ası́, la excepción se regulariza. Lo malo de este proceder es que se
convierte en algo impracticable al pasar a otras dimensiones donde las susodichas
ambigüedades van a aparecer por doquier. En Matemáticas, ya se sabe, lo que
no sea sistema y canon queda reducido a la categorı́a de pura anécdota. Este
pretendido método lo es.
30.6.
Complementos / Ejercicios
1. En nuestro desarrollo teórico hemos encontrado 23 formas diferentes de
Jordan para endomorfismos triangularizables en las dimensiones 2, 3, 4: 3
en dimensión 2, 6 en dimensión 3 y 14 en dimensión 4. Si excluı́mos los
casos diagonalizables (2 en dimensión 2, 3 en dimensión 3 y 5 en dimensión
4), quedan 13 formas de Jordan propiamente dichas (es decir, donde J no
es diagonal). A continuación se dan 4 ejemplos de operadores f para cada
uno de estos 13 casos. Se supone que los espacios son cartesianos reales y
que las matrices representan a f en la base canónica del espacio respectivo.
Se pide, naturalmente, obtener la matriz J de Jordan, la base Z en que
se alcanza y las matrices P y P −1 de los cambios de base.
30.6. Complementos / Ejercicios
µ
23
3
−108
−13
5
3) −1
−2
6
−1
−8
1)
447
¶
5
0
2) −10 2
4
0
−1
1
5
−2
4) 0
0
10 −17 15 −18
−8 10 −12
4
5)
14 −31 30 −33
10 −21 18 −19
−16
8
7)
−3
−1
−17
9
−3
−1
12 −15
12
−21
9)
18 −30
6
−6
2
0
11)
0
0
2
1
13)
1
0
87
−42
16
6
15
21
33
9
−18
−27
−36
−6
−1 1 1
2 0 1
0 2 1
−1 1 2
0
1
0
0
−1
−1
0
0
−108
54
−18
−8
−1
−1
−1
1
1
−2
6)
−2
0
−19
14
8)
44
12
−1
3
1
−2
−1
−1
−2
1
−3
−1
5
0
−1
5 5
2 3
7 3
1 5
52 −38
−29 25
−92 79
−20 20
49
−32
−98
−23
1
3
0
−1
−1
1
3
−1
−1
0
0
3
3 1
−1 1
12)
0 0
0 0
−1
2
2
1
−1
1
0
2
3
0
10)
0
0
448
Capı́tulo 30. Introducción a las Formas de Jordan
µ
14)
19
−4
9
31
¶
−1 1
0 1
−1 2
−1 1
1 1
0 2
3
15) 2
1
3
17) 1
0
−4
10
0
−2
−5
11
0
−2
4
9
21)
4
0
−2
−1
23)
−1
0
−4
−3
25)
−3
0
−7
9
6
0
5
10
5
0
9
16) 1
0
−1
4
18)
0
3
0
0
0
6
−9
−19
−9
0
7
−2
2
5
−1 5 3
0 2 2
0 2 2
−1 1 0
−3
2
0
−3
−3 1
6 0
1 6
15 6
6 3
8 3
3 2
3
1
20)
1
0
8
8
22)
20
12
4
0
24
0
0
4
0
26)
0
0
−2
5
0
3
−3
4
3
1
−1
1
0
−1
−1
−1
0
1
−18
−18
−36
−20
17
14
32
20
0
0
0
0
−2
−1
−1
1
−21
−18
−42
−26
−1
1
0
3
−1
5
0
−1
0
0
4
1
−3
4
0
1
3
0
4
−1
0
0
0
4
30.6. Complementos / Ejercicios
µ
27)
−10
7
−7
4
6
0
31)
1
0
3
0
33)
3
0
3
0
35)
0
0
4
0
37)
0
0
7
0
39)
0
0
¶
−8
28 0
−3
−21
−15
−18
11 11
29) 7 7
9 9
1
6
1
0
0
0
5
0
4
0
−1
2
1
3
4
0
0
0
0
0
0
0
3
3
−1
4
0
−1
0
0
7
0
8
30) 0
3
−9
1
−3
14
−2
4
−1
5
−1
−3
0
2
0
−1
32)
−1
0
6
0
34)
2
0
3
1
3
1
0
0
4
0
2
0
1
4
1
6
3
0
0
4
0
−1
1
0
4
1
−1
3
0
1
38)
0
0
4
0
−1
1
0
0
−1
0
2
1
0
0
0
7
3
2
2
2
−1
2
0
−1
1 1
4
−1 0
0
36)
3 0
0
1 4
0
−1 1
4 0
0 4
−1 1
1
7
1
0
449
1
1
1
4
1
1
0
2
450
Capı́tulo 30. Introducción a las Formas de Jordan
µ
40)
4
−3
3
−2
4 0
1 0
−4 2
−3
41) −1
5
6
43) 1
0
−4 2
2 1
0 4
5
0
45)
0
−2
2
0
47)
1
0
9
0
49)
0
−1
5
0
51)
0
0
¶
1
4
0
−2
1
2
2
0
0
0
1
0
1 0
8 0
1 8
0 0
0
5
0
−1
3
42) 1
0
−3 1
0 0
1 0
−1
0
44)
0
0
−3
2
0
1
0
0
0
3
−4
0
3
1
−1 1
9
1 1
5
46)
3 0
4
2 1
1
−6
−2
−3
−1
1
0
0
1
0
2
1
0
−1
0
1
0
−1
0
0
1
0
2
0
−1
0
0
2
1
−1
1
1
2
0
2
0
0
−2
1
2
3
0
0
0
2
1
0
−1
7
1 0
0 0
5 0
1 5
2
0
48)
0
0
2
0
50)
0
0
2
0
52)
0
0
−4
−4
−1
0
−12
−6
−6
−1
451
Capı́tulo 31
Endomorfismos Nilpotentes
31.1.
Endomorfismos nilpotentes
Sea V un espacio vectorial de dimensión finita n ≥ 2 sobre el cuerpo conmutativo
IK. Un endomorfismo g de V se llama nilpotente (o nihilpotente) si existe
un entero h ≥ 1 tal que
g h = f0 .
El menor exponente m que verifique esta condición se llama ı́ndice (u orden)
de nilpotencia de g.
El endomorfismo nulo f0 es trivialmente nilpotente de ı́ndice 1. En los demás
casos, g 6= f0 , el ı́ndice m cumplirá que m ≥ 2.
31.2.
Polinomio caracterı́stico y mı́nimo de un
endomorfismo nilpotente
Proposición 379 Un endomorfismo g de un espacio V de dimensión n es
nilpotente con ı́ndice m si y sólo si
C(ξ) = ξ n , M(ξ) = ξ m .
Demostracion:
Según el Teorema de Hamilton-Cayley, de C(ξ) = ξ n se sigue que g n = f0 ,
luego g es nilpotente. Si M(ξ) = ξ m , para todo exponente h tal que g h = f0 se
cumplirá
ξ m | ξ h ⇒ m ≤ h,
con lo cual el ı́ndice de nilpotencia es m.
Si g es nilpotente de ı́ndice m, de las definiciones se sigue que su polinomio
mı́nimo es M(ξ) = ξ m . Como el caracterı́stico es múltiplo suyo y no puede tener
otras raı́ces, necesariamente es C(ξ) = ξ n .
2
452
Capı́tulo 31. Endomorfismos Nilpotentes
De aquı́ se sigue que el único autovalor de un endomorfismo nilpotente es el
λ = 0, con orden de multiplicidad n. En todo caso, pues, los endomorfismos
nilpotentes serán triangularizables. Sin embargo, la dimensión de su autoespacio, que no es otro que Ker g, nunca será n, salvo que g = f0 . O sea, los
endomorfismos nilpotentes no nulos nunca alcanzan la forma diagonal.
31.3.
Restricción a un subespacio invariante
Si g es nilpotente, con ı́ndice m de nilpotencia, para cada subespacio g- invariante U, la restricción de g a U es trivialmente nilpotente. En cuanto a su ı́ndice,
puesto que
g m (x) = 0, ∀x ∈ U,
nunca superará al ı́ndice de g.
31.4.
Subespacios anuladores
Si g es nilpotente, de C(ξ) = ξ n se sigue que det(g) = 0, luego g es singular y
dim(Ker g) ≥ 1. Este subespacio, ası́ como los núcleos de las potencias de g, se
nombran como los subespacios anuladores del endomorfismo nilpotente
g. Entre ellos están los subespacios impropios
{0} = Ker I = Ker g 0 , V = Ker f0 = Ker g m .
Proposición 380 Si g 6= f0 es nilpotente de ı́ndice m, se cumple
{0} = Ker g 0 < Ker g < Ker g 2 < . . . < Ker g m−1 < Ker g m = V.
Demostracion:
Como ξ i−1 | ξ i , ∀i ∈ [1, m], de la proposición 357 se obtiene que
Ker g i−1 ≤ Ker g i
Como, además, grad(ξ i−1 ) = i − 1 < i = grad(ξ i ), y estos polinomios dividen a
M(ξ) = ξ m , de la proposición 362, resulta que el contenido es estricto.
2
Proposición 381 Para cada i ∈ [1, m], se cumple
g(Ker g i ) ≤ Ker g i−1 .
Demostracion:
Basta ver que
x ∈ Ker g i ⇒ g i−1 (g(x)) = g i (x) = 0 ⇒ g(x) ∈ Ker g i−1 .
2
31.5.
Descomposición por complementación de un endomorfismo nilpotente
453
Proposición 382 Si para un i ∈ [1, m] existe un subespacio U tal que
Ker g i ∩ U = {0},
entonces
Ker g i−1 ∩ g(U) = {0}.
Demostracion:
Si tomamos un vector
y ∈ Ker g i−1 ∩ g(U),
existirá un x ∈ U tal que y = g(x). Entonces,
g i (x) = g i−1 (g(x)) = g i−1 (y) = 0 ⇒ x ∈ Ker g i ⇒
⇒ x ∈ Ker g i ∩ U ⇒ x = 0 ⇒ y = g(0) = 0,
lo que prueba la igualdad Ker g i−1 ∩ g(U) = {0}.
2
Proposición 383 Si para un i ∈ [1, m] existe un subespacio U tal que
Ker g i ∩ U = {0},
se demuestra que g aplica isomórficamente U sobre g(U).
Demostracion:
Sea x ∈ U tal que g(x) = 0. Por ser nulo, se tiene
g(x) ∈ Ker g i−1 ⇒ g i−1 (g(x)) = g i (x) = 0 ⇒ x ∈ Ker g i ,
y por ser x ∈ U, se tiene x = 0. Esto significa que la restricción de g a U actúa
inyectivamente, luego g aplica isomórficamente U sobre g(U).
2
31.5.
Descomposición por complementación de
un endomorfismo nilpotente
Proposición 384 Sea g 6= f0 un endomorfismo nilpotente de ı́ndice m. Entonces, existen subespacios Um , Um−1 , . . . , U2 , U1 tales que
½
Ker g i = Ker g i−1 ⊕ Ui
∀i ∈ [1, m] ⇒
g(Ui ) ≤ Kerg i−1
Además, U1 = Ker g.
454
Capı́tulo 31. Endomorfismos Nilpotentes
Demostracion:
Veamos la existencia de Um .
Por ser g 6= f0 es m ≥ 2 y el subespacio Ker g m−1 será propio. Por ello, existe
un complemento suyo, es decir, un subespacio Um tal que
V = Ker g m = Ker g m−1 ⊕ Um .
Puesto que Um ≤ Ker g m , según la proposición 381, se tendrá
⇒ g(Um ) ≤ g(Ker g m ) ≤ Ker g m−1 .
Construcción de Ui−1 a partir de Ui .
Supongamos que para un i ≥ 2 exista un subespacio Ui tal que
Ker g i = Ker g i−1 ⊕ Ui , g(Ui ) ≤ Ker g i−1 .
Aplicando la proposición 382, se tiene
Ker g i = Ker g i−1 ⊕ Ui ⇒ Ker g i−1 ∩ Ui = {0} ⇒ Ker g i−2 ∩ g(Ui ) = {0}
con lo cual el subespacio Ker g i−2 +g(Ui ) será una suma directa. Por otra parte,
de la proposición 380 sabemos que Ker g i−2 < Ker g i−1 , de manera que, por
estar ambos sumandos en Ker g i−1 , resulta
Ker g i−2 ⊕ g(Ui ) ≤ Ker g i−1 .
Si este contenido fuese una igualdad, tomamos Ui−1 = g(Ui ). En caso contrario,
existe un complemento Ti−1 de Ker g i−2 ⊕g(Ui ) en Ker g i−1 y podemos escribir
Ui−1 = g(Ui ) ⊕ Ti−1 . En ambas posibilidades, resulta que
Ker g i−1 = Ker g i−2 ⊕ Ui−1 .
Puesto que Ui−1 ≤ Ker g i−1 , se tiene (proposición 381)
g(Ui−1 ) ≤ g(Ker g i−1 ) ≤ Ker g i−2 .
Después de las dos demostraciones anteriores, la existencia de todos estos subespacios queda probada haciendo una recurrencia descendente.
Tomando i = 1, la igualdad Ker g 1 = Ker g 0 ⊕ U1 se reduce a la
Ker g = U1 .
2
Proposición 385 Sea g 6= f0 un endomorfismo nilpotente de ı́ndice m y sean
Um , Um−1 , . . . , U2 , U1 los subespacios del teorema anterior. Entonces,
1. El endomorfismo g aplica inyectivamente Ui en Ui−1 , ∀i ∈ [2, m].
31.6.
Base asociada a la descomposición por complementación
455
2. 1 ≤ dim(Um ) ≤ dim(Um−1 ) ≤ . . . ≤ dim(U2 ) ≤ dim(U1 ).
Demostracion:
1. De acuerdo con la proposición 383, g aplica isomórficamente Ui sobre
g(Ui ). Nuestra afirmación entonces resulta del contenido g(Ui ) ≤ Ui−1 .
2. Es consecuencia inmediata de lo anterior.
2
Enlazando las igualdades Ker g i = Ker g i−1 ⊕ Ui de la proposición 380, desde
la V = Ker g m = Ker g m−1 ⊕ Um hasta la Ker g = U1 , se llega a la igualdad
V = U1 ⊕ U2 ⊕ . . . ⊕ Um−1 ⊕ Um ,
conocida como descomposición por complementación. Por propia construcción se cumple que g(Ui ) ⊆ Ui−1 , ∀i ∈ [2, m], de manera que estos subespacios
no son g-invariantes. Su consideración, sin embargo, nos llevará más adelante a
otra descomposición cuyos sumandos sı́ lo sean.
31.6.
Base asociada a la descomposición por
complementación
Dado un endomorfismo nilpotente g 6= f0 , consideremos la correspondiente descomposición por complementación V = U1 ⊕ U2 ⊕ . . . ⊕ Um−1 ⊕ Um , y sean
u(i) = dim(Ui ) = dim(Ker g i ) − dim(Ker g i−1 ), i ∈ [1, m].
Proposición 386 Siendo i ∈ [2, m], supongamos conocida una base
{v1,i , v2,i , . . . , vu(i),i }
de Ui . Entonces, existe una base de Ui−1 que incluye a los vectores
g(v1,i ), g(v2,i ), . . . , g(vu(i),i ).
Demostracion:
Como g aplica inyectivamente Ui en Ui−1 (proposición 385), tenemos asegurada la independencia lineal de los vectores
g(v1i ), g(v2i ), . . . , g(vu(i)i ).
Si u(i) = u(i − 1), o sea si Ui−1 = g(Ui ), serán base de Ui−1 y la proposición
queda demostrada. En caso contrario, podemos buscar u(i − 1) − u(i) vectores
vu(i)+1,i−1 , vu(i)+2,i−1 , . . . , vu(i−1),i−1
456
Capı́tulo 31. Endomorfismos Nilpotentes
que generen un complemento Ti−1 de Ker g i−2 ⊕ g(Ui ) dentro de Ker g i−1 ,
con lo cual Ui−1 = g(Ui ) ⊕ Ti−1 admite como base la unión de los dos bloques
anteriores.
2
Buscando u(m) vectores
v1,m , v2,m , . . . , vu(m),m ,
que generen un complemento Um de Ker g m−1 dentro de Ker g m = V, la
anterior proposición permite, paso a paso, construir una base en cada de los
restantes complementos. Ası́, de la base
{v1,m , v2,m , . . . , vu(m),m }
de Um , pasamos a la
{g(v1,m ), g(v2,m ), . . . , g(vu(m),m )}∪
∪{vu(m)+1,m−1 , vu(m)+2,m−1 , . . . , vu(m−1),m−1 }
de Um−1 , y de ésta a la
{g 2 (v1,m ), g(v2,m ), . . . , g 2 (vu(m),m }∪
∪{g(vu(m)+1,m−1 ), g(vu(m)+2,m−1 ), . . . , g(vu(m−1),m−1 )}∪
∪{vu(m−1)+1,m−2 , vu(m−1)+2,m−2 , . . . , vu(m−2),m−2 }
de Um−2 . Si continuamos descendiendo, llegaremos, finalmente a la base
{g m−1 (v1,m ), g m−1 (v2,m ), . . . , g m−1 (vu(m),m )}∪
∪{g m−2 (vu(m)+1,m−1 ), g m−2 (vu(m−1)+2,m−2 ), . . . , g m−2 (vu(m−1),m−1 )}∪
∪...∪
∪{g(vu(3)+1,2 , g(vu(3)+2,2 , . . . , g(vu(2),2 }∪
∪{vu(2)+1,1 , vu(2)+2,1 , . . . , vu(1),1 }
de U1 , formada por las imágenes de todos los vectores de la base de U2 y un
último bloque, constituido por u(1) − u(2) vectores de U1 , generadores de un
complemento T1 de g(U2 ) dentro de Ker g.
Uniendo las bases de los m complementos, saldrá una base de V a la que nombraremos como base asociada a la descomposición por complementación.
Puesto que U1 = Ker g, los u(1) vectores de U1 tienen imagen nula. Por ello,
al formar la matriz de g en esta base, las respectivas columnas son nulas. Las
imágenes de los restantes vectores, es decir, los de Ui con i ≥ 2, tienen su imagen
en la base de Ui−1 , luego su columna es nula salvo en un lugar (colocado por
encima de la diagonal) en la que aparecerá un 1.
31.7.
Espacios cı́clicos respecto de un endomorfismo
31.7.
457
Espacios cı́clicos respecto de un endomorfismo
Sea V un espacio vectorial de dimensión finita n ≥ 1 sobre IK. Se dice que V
es f -cı́clico si existe un vector no nulo u en V tal que
{f n−1 (u), f n−2 (u), . . . , f (u), u}
sea una base de V.
Cada vector de x ∈ V se va a escribir como
x = a1 f n−1 (u) + a2 f n−2 (u) + . . . + an−1 f (u) + an u =
= (a1 f n−1 + a2 f n−2 + . . . + an−1 f + an I)(u),
lo que es tanto como decir que cada vector se obtiene como resultado de aplicar
un elemento de IK[f ] sobre u.
En cierta forma esto significa que todo el espacio se genera por un solo vector,
por supuesto no en la acepción habitual de este verbo sino mediante la multiplicación de elementos de IK[f ] por vectores. Esto justifica el nombre de espacio
f -cı́clico.
31.8.
Espacios cı́clicos respecto de un endomorfismo nilpotente
Aunque hay toda una teorı́a sobre espacios cı́clicos respecto de un endomorfismo,
limitaremos nuestro estudio al caso en que sea nilpotente.
Proposición 387 Sea g un endomorfismo nilpotente de V. El espacio es gcı́clico si y sólo si
M(ξ) = ξ n = C(ξ).
Demostracion:
Si M(ξ) = ξ n , la sucesión de subespacios anuladores es
{0} = Ker g 0 < Ker g < Ker g 2 < . . . < Ker g n−1 < Ker g n = V,
lo que obliga a la fórmula dim(Ker g i ) = i, o sea, los subespacios propios empiezan con la recta Ker g y acaban con el hiperplano Ker g n−1 . Tomando un
vector u 6∈ Ker g n−1 , los complementos son
Un =< u >, Un−1 =< g(u) >, . . . , U2 =< g n−2 (u) >, U1 =< g n−1 (u) >
(todos de dimensión 1) y la base asociada a ellos es la
{v1 = g n−1 (u), v2 = g n−2 (u), . . . , vn−1 = g(u), vn = u}.
458
Capı́tulo 31. Endomorfismos Nilpotentes
Esto prueba que V es g-cı́clico.
Supongamos que existe un vector u ∈ V tal que
{g n−1 (u), g n−2 (u), . . . , g(u), u}
sea base. Si M(ξ) = ξ m , se cumple g m (u) = 0. Si m < n, el vector 0 forma
parte de una base, lo cual es absurdo. Por tanto, m = n.
2
Proposición 388 Sea g un endomorfismo nilpotente de V. El espacio es gcı́clico si y sólo si
dim(Ker g) = 1.
Demostracion:
Sea V = U1 ⊕ U2 ⊕ . . . ⊕ Um−1 ⊕ Um la descomposición por complementos.
Entonces, aplicando la proposición 385, tenemos
1 ≤ dim(Um ) ≤ dim(Um−1 ) ≤ . . . ≤ dim(U2 ) ≤ dim(U1 ) = dim(Ker g) = 1 ⇒
⇒ dim(Ui ) = 1, ∀i ∈ [1, m] ⇒ dim(U1 ⊕ U2 ⊕ . . . ⊕ Um−1 ⊕ Um ) = m ⇒
⇒ m = n ⇒ M = C,
y, según la proposición anterior, V será g-cı́clico.
Si V es g-cı́clico, la misma proposición asegura que M(ξ) = ξ n , en cuyo caso,
todos los complementos Ui son de dimensión 1. En particular, Ker g = U1 , lo
será.
2
Proposición 389 Sea V un espacio g-cı́clico. Entonces, V no puede ser suma
directa de subespacios g-invariantes propios.
Demostracion:
Como M(ξ) = ξ n , puede aplicarse la proposición 355.
31.9.
2
Matriz de un endomorfismo nilpotente de
un espacio cı́clico
Si g es un endomorfismo nilpotente de V y el espacio es g-cı́clico, existe un
vector u ∈ V tal que
{v1 = g n−1 (u), v2 = g n−2 (u), . . . , vn−1 = g(u), vn = u}
es una base. En ella se cumple
½
g(v1 ) = g n (u) = 0
vi = g n−i (u) ⇒
1+n−i
g(vi ) = g
= g n−(i−1) (u) = vi−1 , ∀i ∈ [2, n]
y la matriz correspondiente será la
31.10.
Subespacios cı́clicos respecto de un endomorfismo nilpotente
0
0
0
.
.
J =
.
0
0
1
0
0
..
.
0 ...
1 ...
0 ...
..
.
0
0
0
..
.
0
0
0
..
.
0
0
0 0
0 ...
0 ...
0 ...
0
0
0
1
0
0
459
0
0
0
..
.
.
0
1
0
De acuerdo con la proposición 389, no podrá descomponerse en bloques diagonales de menor orden. De aquı́, el nombre de matriz celular (nilpotente) de
Jordan con el que se la nombra.
31.10.
Subespacios cı́clicos respecto de un endomorfismo nilpotente
Diremos que un subespacio g-invariante U es g-cı́clico si U es cı́clico para la
restrición de g a U. Si dim(U) = r, esto equivale a la existencia de un vector
u ∈ U de manera que
{g r−1 (u), g r−2 (u), . . . , g(u), u}
sea una base de U.
Según la proposición 389, cada subespacio g-cı́clico será celular en el sentido
de ser g-indescomponible, es decir, no poder descomponerse en suma directa de
otros de menor dimensión.
31.11.
Descomposición canónica de un endomorfismo nilpotente
Probada la existencia de una descomposición por complementación, consideremos la correspondiente base.
Fijado un vector
vi,m , 1 ≤ i ≤ u(m)
de la base {v1,m , v2,m , . . . , vu(m),m } de Um , construı́mos el subespacio
Wi,m =< g m−1 (vi,m ), g m−2 (vi,m ), . . . , g(vi,m ), vi,m > .
Puesto que todos estos vectores están extraı́dos de una base, son linealmente
independientes. Esto permite asegurar que dim(Wi,m ) = m. Se trata de un
subespacio g-invariante ya que
x=
m
X
j=1
aj g m−j (vi,m ) ∈ Wi,m ⇒
460
Capı́tulo 31. Endomorfismos Nilpotentes
⇒ g(x) =
m
X
aj g m−j+1 (vi,m ) =
m
X
j=1
aj g m−j+1 (vi,m ) ∈ Wi,m
j=2
Además, la restricción de g a tal subespacio lo hace g-cı́clico.
Hecha esta construcción con cada vector de la base de Um , pasamos al subespacio Um−1 . De su base ya hemos tomado u(m) vectores, uno en cada subespacio
de los construı́dos anteriormente. Con los restantes (si los hay), esto es, con cada
vector
vi,m−1 , u(m) + 1 ≤ i ≤ u(m − 1),
formamos el subespacio.
Wi,m−1 =< g m−2 (vi,m−1 ), g m−3 (vi,m−1 ), . . . , g(vi,m−1 ), vi,m−1 >,
para el cual se razona como antes que dim(Wi,m−1 ) = m − 1, que es un subespacio g-invariante y que es g-cı́clico.
De esta forma, vamos descendiendo hasta llegar al subespacio U2 , de cuya base
ya hemos tomado u(3) vectores. Con los restantes (si los hay), esto es, con cada
vector
vi,2 , u(3) + 1 ≤ i ≤ u(2)
se construye
Wi,2 =< g(vi,2 ), vi,2 >,
cumpliéndose que dim(Wi,2 ) = 2 y que es g-invariante y g-cı́clico.
Ası́llegaremos, finalmente, a U1 . Si aún quedaran vectores no incluı́dos en los
subespacios ya construı́dos, con ellos, es decir con los vectores
vi,1 , u(2) + 1 ≤ i ≤ u(1),
formamos los subespacios
Wi,1 =< vi,1 >,
unidimensionales, g-invariantes y g-cı́clicos.
Uniéndolos todos se llega a la descomposición
V
= W1,m
⊕Wu(m)+1,m−1
⊕Wu(3)+1,2
⊕Wu(2)+1,1
⊕...
⊕...
⊕...
⊕...
⊕...
⊕Wu(m),m
⊕Wu(m−1),m−1
⊕
⊕Wu(2),2
⊕Wu(1),1
⊕
⊕
⊕
siendo cada sumando un subespacio celular de Jordan. Observando que hay
u(m)
u(m − 1) − u(m)
...
u(2) − u(3)
u(1) − u(2)
de dimensión m
de dimensión (m − 1)
...
de dimensión 2
de dimensión 1
31.11.
Descomposición canónica de un endomorfismo nilpotente
461
llegamos a la conclusión de que la cantidad sumandos es igual a
u(1) = dim(Ker g),
lo que concuerda con el hecho de que el primer vector de la base de cada uno
de ellos es un autovector. Ası́, queda probado lo siguiente:
Proposición 390 Sea g un endomorfismo nilpotente de ı́ndice m en un espacio
V de dimensión finita n ≥ 2. Sea d = dim(Ker g). Entonces, V se descompone
en suma directa de d subespacios g-invariantes y g-cı́clicos, cuyas dimensiones
no superan a m.
Esta es la descomposición canónica de V mediante el endomorfismo
nilpotente g. La base obtenida se llamará base de Jordan y convendremos en
ordenarla de forma que en primer lugar estén los bloques de la menor dimensión
posible para acabar en los de dimensión máxima e igual a m. La correspondiente
matriz se compone de d bloques celulares como los indicados en la sección 31.9
y se nombra como matriz canónica normal de Jordan para g.
Debe observarse que no sólo está determinada la cantidad d = u(1) de subespacios celulares, sino también sus dimensiones. En efecto, recordando que, para
cada i ∈ [1, m], es
u(i) = dim(Ker g i ) − dim(Ker g i−1 )
y que Ker g m = V, tendremos
u(m) = dim(V) − dim(Ker g m−1 )
subespacios celulares de dimensión m,
u(m − 1) − u(m) = 2 dim(Ker g m−1 ) − dim(V) − dim(Ker g m−2 )
suebspacios celulares de dimensión m − 1,
...,
u(2) − u(3) = 2 dim(Ker g 2 ) − dim(Ker g 3 ) − dim(Ker g)
subespacios celulares de dimensión 2, y, finalmente,
u(1) − u(2) = 2 dim(Ker g) − dim(Ker g 2 )
subespacios celulares de dimensión 1.
462
Capı́tulo 31. Endomorfismos Nilpotentes
31.12.
Complementos / Ejercicios
1. Razonar que la traza de todo operador nilpotente es nula.
2. Sea A ∈ M(n, IK). Se dice que A es una matriz nilpotente si existe un
entero positivo h tal que Ah = 0. El mı́nimo entero positivo m para el cual
Am = 0 es el ı́ndice de nilpotencia de A. Sea V un espacio de dimensión
finita n ≥ 1, sea B = {v1 , v2 , . . . , vn } una base de V y sea A la matriz de
g en B. Razonar que las tres siguientes afirmaciones son equivalentes:
a) g es nilpotente con ı́ndice m de nilpotencia.
b) m es el mı́nimo entero positivo tal que
g m (vj ) = 0, ∀j ∈ [1, n].
c) A es nilpotente con ı́ndice m de nilpotencia.
3. Siendo A ∈ M(n, IK), razonar que A es nilpotente de ı́ndice m si y sólo si
At lo es.
4. Siendo f ∈ End(V, IK), razonar que f es nilpotente de ı́ndice m si y sólo
si f t ∈ End(V∗ , IK) lo es.
5. Sea una matriz A = (aij ) con aij = 0 siempre que i ≥ j (matriz supratriangular estricta). Probar que es nilpotente.
6. Sea una matriz A = (aij ) con aij = 0 siempre que i ≤ j (matriz infratriangular estricta). Probar que es nilpotente.
7. Razonar que la suma de dos operadores nilpotentes, en general, no es
nilpotente.
8. Determinar el ı́ndice de nilpotencia de las siguientes matrices triangulares
0 5 −1 2
0 0 0
0 0 1 4
estrictas: A = 0 0 0 B =
0 0 0 3
2 1 0
0 0 0 0
9. Sea V = IRn [ξ] y sea D el endomorfismo de derivación. Razonar que D es
nilpotente y que el espacio es D-indescomponible. ¿En qué base se obtiene
su matriz de Jordan?
10. En el espacio V = IRn , referido a su base canónica, se dan las siguientes matrices correspondientes a diferentes operadores. Comprobar que son
nilpotentes, indicando su grado de nilpotencia. Obtener su matriz de Jordan y una base en la que se alcance. Calcular las matrices de cambio.
31.12.
Complementos / Ejercicios
µ
a)
2
−1
4
−2
−11 8
c) 4
2
9
0
−17
8
e)
−3
−1
−1
−13
g)
−1
−6
0
0
i) 0
0
0
0
0
0
k)
0
0
0
0
0
m)
0
0
0
0
0
0
o) 0
0
0
0
¶
6
b) −4
−12
18
−12
−36
−3
2
6
0
0
0
0
8
120
12
88
−15
3
9
−12
−180
d)
−18
−132
24
−12
4
2
−5 75
2 −36
−1 13
0
5
463
−54
14
f)
−4
−4
0
0
h) 0
0
0
1 0
0 0
−1 2
−1 1
−1 1
0
0
1
1
1
0
0
0
0
0
1
0
0
0
0
0
2
−1
0
3
0
0
2 0 0
0 0 0
0 0 0
0 −1 0
0 −2 1
0 −4 2
0
0
0
0
0
0
0
2
0
−1
0
0
0
0
0
0
0
0
0
0
0
0
1
−1
0
0
0
0
1
−1
1 0
0 0
0 0
2 0
0 1
0 6
0 −4
0
0
0
0
0
0
0
0
0
0
0
0
4
1
0
0
0
0
0
1
0
1
2
0
0
−1 −2
1
1
−1 1
−1
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
−1
1
0
0
0
2
0
1
2
0
0 1 0
0 0 0
0 0 0
l)
0 0 0
0 0 0
0 0 0
2
−1
0
0
0
0
0
0
−1
0
1
−1
0
0
j) 0
0
0
0
0
0
0
0
0
0
−162 159 0
42
−41 0
−12
12 0
−12
12 0
0
1 0
−1 16 1
0
1 0
−1 7 1
0
0
0
0
0
1
0
n)
0
−5
0
0
0
0
p 0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
−1
0
0
0
0
−2
4
0 0
0 −1
0 0
0 0
0 5
0 0
0
0
0
0
2
−4
0
0
0
0
1
−2
0
0
0
0
0
0
0
0
0
0
−6
4
1
0
0
0
0
−40
24
6
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
464
Capı́tulo 31. Endomorfismos Nilpotentes
11. Describir todos los modelos posibles de endomorfismos nilpotentes en dimensión 5 y en dimensión 6.
12. ¿Es posible que un operador nilpotente de IK 10 cumpla que
dim(Ker g) = 4, dim(Ker g 2 ) = 7, dim(Ker g 3 ) = 8, dim(Ker g 4 ) = 10?
Repetir el ejercicio con las condiciones
dim(Ker g) = 4, dim(Ker g 2 ) = 6, dim(Ker g 3 ) = 8, dim(Ker g 4 ) = 10.
13. Un endomorfismo nilpotente de IK 10 cumple las condiciones
dim(Ker g) = 5, dim(Ker g 3 ) = 10.
¿Qué posibilidades hay para la dimensión de Ker g 2 ?
14. Sean f y g dos endomorfismos nilpotentes que se representan en una misma
base por matrices traspuestas entre sı́. Razonar que las dimensiones de los
subespacios anuladores son las mismas. Por tanto, ambos tienen la misma
matriz canónica de Jordan.
15. Si A es nilpotente, su traspuesta es semejante a ella.
31.12.
Complementos / Ejercicios
%include macrolatexfinal
465
466
Capı́tulo 31. Endomorfismos Nilpotentes
467
Capı́tulo 32
El Teorema de Jordan
32.1.
Endomorfismos triangularizables con un solo autovalor
Proposición 391 Sea U un subespacio de V invariante mediante dos endomorfismos f y g, sea a ∈ IK y sea p(ξ) ∈ IK[ξ]. Entonces, U es invariante
mediante los endomorfismos
f + g, af, g ◦ f, p(f ).
Demostracion:
Si x ∈ U, se tiene
(f + g)(x) = f (x) + g(x) ∈ U, porque f (x), g(x) ∈ U.
(af )(x) = af (x) ∈ U, porque f (x) ∈ U.
(g ◦ f )(x) = g(f (x)) ∈ U, por ser imagen mediante g del vector f (x) que
está en U.
Que U es invariante por p(f ) se obtiene de observar que este endomorfismo
resulta a partir de f mediante operaciones de los tres tipos anteriores.
2
Proposición 392 Sea λ un autovalor del endomorfismo f . Un subespacio U
es f -invariante si y sólo si es (f − λI)-invariante.
Demostracion:
Sea g = f − λI. Ya que g es un polinomio en f , al igual que f = g + λI lo
es en g, basta aplicar la proposición 391 dos veces.
2
Proposición 393 Sea f un endomorfismo de V que admita un solo autovalor
λ en IK con orden de multiplicidad igual a la dimensión n del espacio. Entonces,
f − λI es nilpotente con ı́ndice m igual al grado del polinomio mı́nimo de f .
468
Capı́tulo 32. El Teorema de Jordan
Demostracion:
Puesto que C(ξ) = (ξ − λ)n , se cumplirá
(f − λI)n = f0 ,
luego f − λI es nilpotente. Además, si M(ξ) = (ξ − λ)m , resultará que
(f − λI)m = f0 , (f − λI)h 6= f0 si h < m,
es decir, el ı́ndice de nilpotencia será m.
2
Proposición 394 Sea f un endomorfismo de V que admita un solo autovalor
λ en IK con orden de multiplicidad igual a la dimensión n del espacio. Sea d =
dim(Ker(f −λI)). Entonces, V se descompone en suma directa de d subespacios
f -invariantes y (f − λI)-cı́clicos, cuyas dimensiones no superan al grado m del
polinomio mı́nimo de f .
Demostracion:
Puesto que f − λI, según la proposición 393, es nilpotente, basta aplicarle el
la proposición 390. Los sumandos directos, de acuerdo con la proposición 392,
serán f -invariantes.
2
Cada sumando se seguirá nombrando como subespacio celular de Jordan.
Por abuso de lenguaje diremos que estos subespacios son f -cı́clicos. Si W, con
dimensión s, es uno de ellos, partiendo de un cierto vector u de Ker(f − λI)s ,
tendremos la siguiente base de W:
v1 = (f − λI)s−1 (u), v2 = (f − λI)s−2 (u), . . . ,
vs−1 = (f − λI)(u), vs = u,
Puesto que las relaciones
(f − λI)(vj ) = vj−1 , j ∈ [2, s], (f − λI)(v1 ) = 0
equivalen a las
f (vj ) = vj−1 + λvj , j ∈ [2, s], f (v1 ) = λv1
la matriz de la restricción de f a W será de la forma
λ 1 0 ... 0 0 0
0 λ 1 ... 0 0 0
0 0 λ ... 0 0 0
. . .
.
.
.
.. .. ..
.. .. ..
0 0 0 ... λ 1 0
0 0 0 ... 0 λ 1
0
0
0
...
0
0
λ
32.2. Teorema de Jordan para endomorfismos triangularizables
469
Este tipo de matrices se conocen como matrices celulares de Jordan. Ordenando los subespacios celulares de menor a mayor dimensión y uniendo sus
bases, sale una de V que nombraremos como base de Jordan. La matriz de f
en esta base tendrá una forma como la
J1
J2
,
J =
..
.
Jd
donde cada Ji es una matriz celular.
Igual que en los operadores nilpotentes, no sólo va a estar determinada la cantidad de subespacios celulares, sino también sus dimensiones.
32.2.
Teorema de Jordan para endomorfismos
triangularizables
Si f es un endomorfismo triangularizable de V con autovalores λ1 , λ2 , . . . , λr de
órdenes de multiplicidad respectivos s1 , s2 , . . . , sr , como probamos en la proposición 368, tenemos la descomposición primaria
V = Ker(f − λ1 I)s1 ⊕ Ker(f − λ2 I)s2 ⊕ Ker(f − λr I)sr ,
cumpliéndose, para cada i ∈ [1, r], que
a) si = dim(Ker(f − λi I)si ),
b) El polinomio caracterı́stico de la restricción de f al subespacio
Ker (f − λi I)si es (ξ − λi )si .
La restricción de f a cada sumando primario verifica las hipótesis de la proposición 394, luego puede descomponerse a su vez en subespacios f -invariantes y
f -cı́clicos. Uniendo todas éstos, quedará descompuesto V. Como en cada sumando primario va a haber una cantidad de subespacios celulares igual a la dimensión del correspondiente autoespacio, la cantidad total de sumandos cı́clicos sólo
depende de f , pues será el número
dim(Ker(f − λ1 I)) + dim(Ker(f − λ2 I)) + . . . + dim(Ker(f − λr I)).
De esta manera, queda demostrado el llamado Teorema de Jordan:
Proposición 395 Sea V un espacio de dimensión finita n ≥ 2 sobre el cuerpo conmutativo IK. Sea f un endomorfismo que admita n autovalores en IK.
Entonces, V se descompone en suma directa de subespacios cada uno de ellos
f -invariantes y f -cı́clicos, siendo fija la cantidad de sumandos directos.
470
Capı́tulo 32. El Teorema de Jordan
Este teorema lo cumplirá todo operador de un espacio complejo y en general en
un espacio sobre un cuerpo algebraicamente cerrado.
La descomposición primaria suele tomarse en sentido ascendente de los órdenes
de multiplicidad. A su vez, como ya se ha dicho, los sumandos celulares de cada
sumando primario se ordenan en sentido ascendente por sus dimensiones.
La base obtenida al unir las de cada subespacio celular se llama base de Jordan
para f , mientras que de la matriz en dicha base se dice que es la matriz (o que
tiene la forma) canónica normal de Jordan.
Una vez más señalamos que no sólo está determinada la cantidad de sumandos
cı́clicos sino que f determina las dimensiones de cada uno de ellos.
32.3.
Complementos / Ejercicios
1. En el espacio IRn , referido a su base canónica, se dan operadores mediante
matrices. Comprobar que poseen un solo autovalor con orden de multiplicidad n. Obtener su matriz de Jordan y una base en la que se alcance.
Calcular las matrices de cambio.
2
0
a) 0
0
0
3
2
c) 1
2
2
4
0
0
e)
0
0
0
3
0
0
g)
0
0
0
0
2
0
0
0
−2
1
4
−1
1
−2
2
2
1
1
2
0
−2
1
1
−1
0
−1
−1
−1
0
0
1
0
0
−1
−1
0
0
−1
0
0
0
0
1
1
4
0
0
0
0
2
0
4
0
0
0
2
0
0
4
0
0
1 2 2
3 −1 0
0 3 0
0 3 3
0 0 0
0 0 0
0
2
0
−1
4
0
0
0
0
−1
1
−4
3
0
b) 0
0
0
2
0
d) 0
0
0
0
0
0
0
0
4
0
0
0
0
1
5
4
0
0
f)
0
2
0
−3
−2
0
h)
0
1
0
0
3
1
1
1
0
0
3
0
0
1
0
−1
2
−1
0
0
2
1
4
2
0
4
1
4
6
2
12
3
6
0
0
2
0
0
−4
0
−8
0
−4
0
4
0
0
0
0
1
0
3
0
1
0
0 −1
0 0
0 1
7 0
0 5
1 0
0
5
0
0
0
0
0
0
5
0
0
0
0
−1
0
5
0
0
0
0
0
−9
0
1
−64
−16
0
0
13
0
80
20
1
0
−10
5
32.3. Complementos / Ejercicios
6
−1
−5
i) 0
0
0
0
−9
1
2
j) 0
0
0
0
5
0
0
k) 0
0
0
0
4
2
−10
0
0
0
0
0
0
4
0
0
0
0
3
−14
−11
0
0
0
0
−1 0
4
0
−1 0
0 −8
0
0
0
0
0
0
0 0 0
5 0 0
0 5 0
0 0 5
0 0 0
0 0 0
0 0 0
1 −2 2
0 0 1
0 −1 2
l) 0 0 0
0 0 0
0 0 0
0 0 0
−1
1
3
4
0
0
0
471
−1
1
3
6
0
−1
2
0
0
0
2
−9
3
−4
−1 4
−1 4
−3 11
5 13
5
0
0
5
0
0
1
0
0
1
0
0
0
0
0
0
2
0
3
−4
−2
2
6
−24
16
8
−9
0
0
0
0
0
0
4
0
0
0
1
−4
2
−13
0
0
0
0
−3
7
−17
0
0
0
1
0
0
5
5
0
0
3
−3
7
−8
6
0
0
5
−4
11
−13
2. Un endomorfismo f de IR7 admite en la base canónica la matriz
4
0
0
A = 0
0
0
0
0
4
0
0
0
0
0
0
0
4
0
0
0
0
0
0
0
4
0
0
0
0
0
0
1
4
0
0
1
0
0
−4
0
4
0
0
0
1
0
0
0
4
Obtener su forma canónica normal de Jordan sin necesidad de resolver sus
subespacios anuladores.
3. En el correspondiente espacio IRn , referido a su base canónica, se dan endomorfismos mediante la matrices. Comprobar que son triangularizables.
472
Capı́tulo 32. El Teorema de Jordan
Obtener su descomposición primaria, su matriz canónica normal de Jordan
y una base en la que se alcance. Indicar las matrices de cambio.
5
0
a) 0
0
0
2
0
0
c)
0
0
0
3
0
0
e) 0
0
0
1
0
0
2
1
0
3
0
b) 0
0
0
−12 −6
5
0
1
−1
7
0
1
0
13
0
−1
−2
−1
0
2
0
0
0
0
0
0
3
0
0
0
0
−1
0
2
0
0
−6 20
−2 4
0
0
0
0
4
0
1
4
2
2
0
0
0
0
2
−2
1
2
0
0
0
0
0
0
0
4
0
0
0
0
0
0
0
4
0
0
1
0
0
6
−4
3
0
1
0
0
d)
0
0
0
0
0
0
0
0
0
3
3
0
0
f) 2
0
0
0
0
2
0
0
0
−1
1
4
−1
1
−2
2
2
1
1
2
0
−2
1
1
2
1
0
0
0
0
4
−4
3
0
0
0
4
−2
0
1
0
0
0
0
0
0
1
0
1
3
0
2
0
0
0
0
0
4
0
1
6
−4
0
0
0
2
0
0
0
0
0
0
0
4
0
1
0
−2
1
0
0
3
0
0
0
0
0
4
0
0
0
0
0
0
0
4
4. Se sabe que el polinomio caracterı́stico de un operador triangularizable en
dimensión 7 es
C(ξ) = (ξ − α)3 (ξ − β)4 , con α 6= β.
¿Cuántas formas de Jordan distintas puede admitir?
5. Sea f un operador triangularizable. Probar que se tiene la descomposición
f = d + n, donde d es diagonalizable, n es nilpotente y se cumple d ◦ n =
n ◦ d.
6. Sean A, B ∈ M(n, IK) dos matrices tales que A × B = B × A. Razonar
que
k
(A + B) =
k µ ¶
X
k
i=1
i
Ak−i B i , ∀k ∈ IN.
(Esta es una extensión de la fórmula del binomio de Newton. Siempre que
los dos sumandos conmuten entre sı́, sigue valiendo en cualquier anillo
unitario).
7. Sea A la matriz correspondiente a un operador triangularizable f en una
cierta base B. Sea J la matriz de Jordan, sea J = D+N su descomposición
32.3. Complementos / Ejercicios
473
en una matriz diagonal y una nilpotente, y sea P la matriz regular de
cambio. Entonces, para todo exponente natural k, se tendrá
Ak = (P × J × P −1 )k = P × J k × P −1 = P × (D + N )k × P −1
Ya que las potencias de D son inmediatas y las de N se anulan a partir
de un cierto lugar, esto facilita el cálculo de Ak para exponentes altos.
Ejecutar tal cálculo en los casos
¶
¶
µ
µ
1 1
0 2
.
, b) A50 , A =
a) A100 , A =
−1 3
−3 5
8. Encontrar las matrices B tales que tales que B 2 = A, siendo
µ
¶
µ
¶
3 1
6 2
a) A =
, b) A =
.
−1 5
3 7
9. Dada una matriz AP= (aP
ij ), real o compleja, de m filas y n columnas,
m
n
el número k A k= i=1 j=1 | aij | recibe el nombre de norma de la
matriz A. Se puede demostrar que
k A + B k≤k A k + k B k, k αA k=| α |k A k, k A × B k≤k A kk B k .
Dejamos para el lector la comprobación de las dos primeras relaciones. En
cuanto a la tercera, si A = (aih ) ∈ M(m, p, IK), B = (bhj ) ∈ M(p, n, IK),
se tendrá
p
p
m X
n X
m X
n
X
X
X
| aih bhj |=
aih bhj |≤
k A × B k=
|
i=1 i=1
=
p
m X
n X
X
| aih || bhj |=
i=1 j=1 h=1
≤
p
m X
X
i=1 j=1 h=1
h=1
p
m X
X
| aih |
i=1 h=1
n
X
| bhj |≤
j=1
| aih |k B k=k A kk B k .
i=1 h=1
10. Sea (Ak ) una sucesión en M(m, n, IK), donde IK = IR o IK = C.
I Para
k)
cada pareja de ı́ndices i, j denotemos por aij el número que ocupa dichos
lugares en la matriz Ak . Decimos que la sucesión (Ak ) es convergente
k)
cuando lo sean todas las sucesiones numéricas (aij ). Si el número lij es el
k)
lı́mite de aij , se dice que la matriz L = ((lij )) es el lı́mite de la sucesión
de matrices (Ak ). Es decir,
k)
k)
lı́m Ak = lı́m (aij ) = ( lı́m aij ).
k→∞
k→∞
k→∞
Copiando el lenguaje y la notación del caso numérico, a cada sucesión de
matrices se asociar una serie, la cual se dirá convergente cuando lo sea
la sucesión de sumas parciales (A0 + A1 + A2 + . . . + Ak ). O sea, decir
474
Capı́tulo 32. El Teorema de Jordan
P∞
P∞ k)
que k=0 Ak es convergente equivale a que lo sean las series k=0 aij
teniéndose la igualdad
∞
X
k=0
Ak =
∞
X
k)
(aij ) = (
k=0
∞
X
k)
aij ).
k=0
Razonaremos una condición
P∞ suficiente para la convergencia de una serie
de
matrices:
La
serie
k=0 Ak es convergente si lo es la serie numérica
P∞
k
A
k.
k
k=0
En efecto, de la definición de norma de una matriz se sigue que, para cada
pareja de ı́ndices i, j, se tiene
k)
| aij |≤k Ak k,
lo que asegura la convergencia absoluta (y, por tanto, la ordinaria) de cada
P∞ k)
serie k=0 aij .
11. Dada una matriz cuadrada A, real o compleja, razonar que la serie
∞
X
Ak
k=0
k!
es convergente. Su suma se llama exponencial de la matriz A y sea
denota como eA . Razonar que
a) e0 = I.
b) Si las matrices A, B conmutan, entonces eA × eB = eA+B = eB × eA .
c) La matriz eA siempre es regular. ¿Cuál es su inversa?
d ) Si B = P −1 × A × P , también eB = P −1 × eA × P .
e) det(eA ) = etr(A) .
12. Calcular la matriz eA en los siguientes casos
µ
¶
µ
¶
4 2
4 −2
3 −1
a) A =
, b) A =
, c) A = 6 4
6 −3
1 1
5 3
−5
−9 .
−7
475
Capı́tulo 33
Espacios Vectoriales
Complejos
33.1.
Motivación
Salvo en cuestiones del Algebra Superior o de la Geometrı́a Algebraica, tanto
en Análisis, como en Geometrı́a Diferencial o en Fı́sica Teórica, los operadores
que interesan lo son de espacios reales o complejos.
En el cuerpo complejo C,
I ya se ha señalado en algún momento anterior, todo
polinomio de grado n admite exactamente n raı́ces (suponiendo que cada raı́z
múltiple se cuenta tantas veces como su orden de multiplicidad). Este resultado es consecuencia inmediata del Teorema Fundamental del Algebra, que
afirma que todo polinomio de coeficientes complejos admite cuando menos una
raı́z compleja. Su demostración mas clásica requiere técnicas de Análisis y suele
desarrollarse en cursos de tal materia. Admitido por nosotros sin más, basta
aplicarlo al polinomio caracterı́stico de un operador de espacios complejos para
asegurar que tal endomorfismo es siempre triangularizable. Por tanto, como se
ha señalado al final del capı́tulo anterior, todo endomorfismo complejo puede
llevarse a su forma canónica normal de Jordan.
No ocurre lo mismo en el caso real. Trasformaciones lineales tan usuales como
la de matriz
µ
¶
0 −1
1
0
(giro de noventa grados en torno al origen) tienen un polinomio caracterı́stico,
en este caso el C(ξ) = ξ 2 + 1, que carece de raı́ces en el propio cuerpo IR.
¿Qué hacer en casos como éste?
No responderemos a tal pregunta en el presente capı́tulo, sino que lo haremos en
el siguiente. Digamos, a modo de adelanto, que, siendo IR subcuerpo de C,
I todo
polinomio en IR también lo es en C,
I por lo que posee n raı́ces complejas (contando
476
Capı́tulo 33. Espacios Vectoriales Complejos
entre ellas las posibles reales). En particular, el polinomio caracterı́stico de un
endomorfismo real, tendrá n autovalores en C.
I Si, por otra parte, hacemos ver
que todo espacio real va a estar contenido en otro sobre C,
I será en éste donde
debamos obtener su forma de Jordan. Pero, tras de este avance hacia lo complejo,
habrá que buscar algún tipo de retorno a lo real, usando matrices reales que
hagan las veces de las canónicas complejas.
Preparando el terreno para el objetivo que acabamos de plantear, y porque los
espacios complejos tienen interés per se, en este capı́tulo desarrollaremos ciertas
cuestiones especı́ficas de tales espacios, todas ellas ligadas de alguna forma al
concepto de conjugación.
33.2.
Conjugación en el cuerpo de los números
complejos
Todo elemento z ∈ C
I se escribe en la forma
z = x + iy, donde x, y ∈ IR, i2 = −1.
Los números x e y reciben, respectivamente, los nombres de parte real y parte
imaginaria de z, usándose las escrituras
x = R(z), y = I(z).
Según las reglas operativas de C,
I dados dos complejos z y w, se cumple
R(z + w) = R(z) + R(w), I(z + w) = I(z) + I(w),
R(zw) = R(z)R(w) − I(z)I(w), I(zw) = R(z)I(w) + I(z)R(w).
Un número complejo z con I(z) = 0 se dice que es real (en realidad, se iguala
a un número real). En caso contrario, o sea, cuando I(z) 6= 0, se dice que z es
imaginario. Si, z = iy, con y ∈ IR, se dice que z es imaginario puro. Entre
ellos está el 0, pero los restantes serán números imaginarios en los que R(z) = 0.
Dado z = R(z) + iI(z), se llama conjugado de z al número
z = R(z) − iI(z).
Los números reales quedan caracterizados por la condición z = z, mientras que
los imaginarios lo hacen por la z 6= z. Sumando y restando las descomposiciones
de z y z, se obtienen las relaciones
z+z
z−z
R(z) =
, I(z) =
2
2i
Las siguientes propiedades son fundamentales en la conjugación:
z + w = z + w, zw = zw, z = z.
Las dos primeras dicen que la conjugación es un endomorfismo del cuerpo C.
I De
la tercera se sigue que biyectivo e inverso de sı́ mismo. En resumen, se trata de
un automorfismo involutivo del cuerpo C.
I
33.3. Aplicaciones semilineales
33.3.
477
Aplicaciones semilineales
Una aplicación f : Z → Z0 entre dos espacios vectoriales complejos Z y Z0 se
llama semilineal cuando
∀z, w ∈ Z ⇒ f (z + w) = f (z) + f (w),
∀a ∈ C,
I ∀z ∈ Z ⇒ f (az) = af (z).
Al igual que las aplicaciones lineales, se trata de morfismos entre los grupos
aditivos de Z y Z0 . Por ello, los conjuntos
Ker f = {z ∈ Z/f (z) = 0}, Im f = {f (z)/z ∈ Z}
son, respectivamente, subgrupos de Z y Z0 . Puede probarse que también son
subespacios vectoriales: dado a ∈ C,
I
a) de z ∈ Ker f se deduce que az ∈ Ker f porque
f (az) = af (z) = a0 = 0
b) Si z 0 = f (z) es un elemento de Im f , también az 0 ∈ Im f porque
f (az) = af (z) = az0 .
Cambiando el adjetivo lineal por semilineal, mantenemos toda la terminologı́a
de morfismos, monomorfismos, epimorfismos, isomorfismos, endomorfismos y
automorfismos. Una aplicación semilineal será un monomorfismo semilineal si y
sólo si Ker f = {0}, y será un epimorfismo semilineal si y sólo si Im f = Z0 .
Las aplicaciones semilineales conservan las combinaciones lineales pues
z = a1 w1 + a2 w2 + . . . + ar wr ⇒
f (z) = a1 f (w1 ) + a2 f (w2 ) + . . . + ar f (wr ),
y, en consecuencia la dependencia lineal de vectores. Como en el caso lineal, la
independencia se conserva si y sólo si f es monomorfismo:
a) De una relación
a1 f (w1 ) + a2 f (w2 ) + . . . + ar f (wr ) = 0
se pasa, aplicando la semilinealidad, a la
f (a1 w1 + a2 w2 + . . . + ar wr ) = 0.
Como también f (0) = 0, si f es inyectivo, se obtiene
a1 w1 + a2 w2 + . . . + ar wr = 0.
Si los vectores w1 , w2 , . . . , wr son independientes, serán nulos todos los
coeficientes. Pero de aj = 0 se sigue que aj = 0. Por tanto, sus imágenes
también serán independientes.
478
Capı́tulo 33. Espacios Vectoriales Complejos
b) Tomando dos vectores z 6= w de Z, el vector z − w 6= 0 por sı́ solo es
independiente. Si f conserva la independencia lineal, también será independiente el vector f (z − w) = f (z) − f (w). Por ello, no puede ser nulo,
luego f (z) 6= f (w) y f es inyectiva.
Los monomorfismos semilineales, pues, conservarán el rango de un sistema de
vectores.
33.4.
Conjugación de vectores complejos
Sea Z un espacio vectorial complejo de dimensión finita n ≥ 1. Siendo
C = {w1 , w2 , . . . , wn }
una base prefijada en Z, el isomorfismo de Descartes permite igualar cada vector
z con la n-upla ordenada de sus coordenadas (z1 , z2 , . . . , zn ) en C. En tal caso,
los vectores
R(z) = (R(z1 ), R(z2 ), . . . , R(zn )), I(z) = (I(z1 ), I(z2 ), . . . , I(zn ))
se conocen como parte real y parte imaginaria, respectivamente de z, observándose que uno y otro tienen todas sus coordenadas reales. Además, puesto
que
(z1 , z2 , . . . , zn ) = (R(z1 ) + iI(z1 ), R(z2 ) + iI(z2 ), . . . , R(zn ) + iI(zn )) =
= (R(z1 ), R(z2 ), . . . , R(zn )) + i(I(z1 ), I(z2 ), . . . , I(zn )),
se tiene la descomposición
z = R(z) + iI(z).
Siendo z, w ∈ Z y a ∈ C,
I se comprueba de manera inmediata que
R(z + w) = R(z) + R(w), I(z + w) = I(z) + I(w),
R(az) = R(a)R(z) − I(a)I(z), I(az) = R(a)I(z) + I(a)R(z).
Un vector complejo z se dice que es real cuando I(z) = 0. En caso contrario,
o sea, si I(z) 6= 0, se dice que z es imaginario. Si, además, R(z) = 0, o bien
z = 0, se habla de vector imaginario puro.
Se llama vector conjugado del vector z = R(z) + iI(z), al definido por la
igualdad
z = R(z) − iI(z).
Los vectores reales se caracterizan por la condición z = z. Los imaginarios lo
hacen por la z 6= z. Como en el caso numérico, se obtienen las relaciones
R(z) =
z+z
z−z
, I(z) =
.
2
2i
33.4. Conjugación de vectores complejos
479
Por otra parte, observando que
z = R(z) − iI(z) =
= (R(z1 ), R(z2 ), . . . , R(zn )) − i(I(z1 ), I(z2 ), . . . , I(zn )) =
= (R(z1 ) − iI(z1 ), R(z2 ) − iI(z2 ), . . . , R(zn ) − iI(zn )) = (z 1 , z 2 , . . . , z n ),
se concluye que las coordenadas del vector conjugado son las conjugadas de las
coordenadas del vector dado.
Proposición 396 Para cualesquiera z, w ∈ Z y para cualquier a ∈ C,
I se
cumplen las propiedades
z + w = z + w, az = az, z = z.
Demostracion:
Basta aplicar las mismas propiedades en la conjugación de números.
a) z + w = (z1 + w1 , z2 + w2 , . . . , zn + wn ) =
= (z 1 + w1 , z 2 + w2 , . . . , z n + wn ) = z + w.
b) az = (a1 z, a2 z, . . . , an z) = (az 1 , az 2 , . . . , az n ) = az.
c) z = (z 1 , z 2 , . . . , z n ) = (z1 , z2 , . . . , zn ) = z.
2
Estas propiedades indican que la conjugación es un automorfismo semilineal e
involutivo de Z.
Proposición 397 Los sistemas de vectores z1 , z2 , . . . , zr y z1 , z2 , . . . , zr tienen
igual rango.
Demostracion:
Se obtiene por ser la conjugación un automorfismo semi-lineal.
2
Proposición 398 Si los vectores imaginarios z y z son independientes, también
lo son los vectores reales R(z) e I(z).
Demostracion:
Sean a, b ∈ IR. Entonces,
0 = aR(z) + bI(z) = a
⇒
z+z
z−z
a − ib
a + ib
+b
=
z+
z⇒
2
2i
2
2
a + ib
a − ib
=
= 0 ⇒ a = b = 0,
2
2
2
480
Capı́tulo 33. Espacios Vectoriales Complejos
33.5.
Conjugación de matrices complejas
Dada una matriz A = (aij ) ∈ M(m, n,C),
I la ley
Cj (A) = Cj (A), ∀j ∈ [1, n],
define una nueva matriz A ∈ M(m, n,C)
I (cuyas columnas son los vectores conjugados de las columnas de A) a la que llamaremos matriz conjugada de la
matriz A.
Puesto que las coordenadas de cada vector columna Cj (A) son los números
conjugados de las coordenadas de Cj (A), se llega a que
A = (aij ).
Igual que en números y en vectores se comprueban las propiedades
A + B = A + B, aA = aA, A = A,
estableciéndose un automorfismo semilineal e involutivo del espacio M(m, n,C).
I
Por lo indicado para el rango de vectores (proposición 397), se obtendrá que A
y A comparten rango y, en particular, la cualidad de regularidad.
I B = [bhj ] ∈ M(r, n,C),
I se
Proposición 399 Dadas A = (aih ) ∈ M(m, r,C),
cumple
A × B = A × B.
Demostracion:
Basta aplicar las propiedades de la conjugación entre números para ver que
r
X
h=1
aih bhj =
r
X
aih bhj =
h=1
r
X
aih bhj .
h=1
2
33.6.
Conjugación de endomorfismos lineales complejos
Sea f un operador de Z representado, respecto de la base C prefijada, por la
matriz cuadrada A ∈ M(n,C).
I Llamaremos conjugado de f , y lo denotamos
por f , al operador que en la misma base se representa por A.
Visto ya en matrices, podemos asegurar sin más que la conjugación es un automorfismo semilineal e involutivo del espacio End(Z,C).
I En realidad es un
automorfismo de álgebras pues, según la proposición 399, se va a tener
g ◦ f = g ◦ f.
33.7. Dimensión real de un espacio vectorial complejo
481
Otra consecuencia de la proposición 399 es la fórmula
f (z) = f (z),
pues basta tomar conjugados para tener
f (z) = A × z ⇒ f (z) = A × z = A × z = f (z).
33.7.
Dimensión real de un espacio vectorial complejo
Sea Z un espacio vectorial complejo. Puesto que IR es un subcuerpo de C,
I podemos restringir la multiplicación por escalares a IR. Con esto conseguimos que Z
se convierta en un IR-espacio vectorial. Ahora bien, si Z como espacio complejo
es de dimensión finita n ≥ 1 y en él fijamos una base C = {w1 , w2 , . . . , wn },
¿qué dimensión tendrá el propio Z como espacio real y qué base podrı́amos
mostrar para el mismo?
La fijación de la base C nos permite hablar, como ya hemos hecho en la sección
33.4, de parte real y parte imaginaria de un vector, ası́ como de vectores reales
y de vectores imaginarios puros.
Proposición 400 En un espacio vectorial complejo Z, de dimensión finita
n ≥ 1, los subconjuntos
ZR = {z ∈ Z/I(z) = 0}, ZI = {z ∈ Z/R(z) = 0},
son subgrupos del grupo (Z, +) y se cumple
Z = ZR ⊕ ZI
Demostracion:
Si z, w ∈ ZR , también z + w ∈ ZR ya que
I(z + w) = I(z) + I(w) = 0 + 0 = 0.
Igualmente, de z, w ∈ ZI , se deduce que z + w ∈ ZI aplicando que
R(z + w) = R(z) + R(w) = 0 + 0 = 0.
De sus definiciones se sigue que ZR ∩ ZI = {0}. Por otra parte, cualquiera
que sea z ∈ Z, es trivial que
I(R(z)) = 0, R(iI(z)) = 0,
lo que significa que R(z) ∈ ZR , iI(z) ∈ ZI . Entonces, la descomposición
z = R(z) + iI(z) permite afirmar que Z = ZR + ZI .
2
482
Capı́tulo 33. Espacios Vectoriales Complejos
Se comprende que ZR y ZI son los conjuntos de vectores, respectivamente,
reales e imaginarios puros. Este teorema asegura que todo vector es suma de
uno real con otro imaginario puro y que tal descomposición es única. Por tanto,
generaliza a lo que ocurre con los propios números complejos.
Siendo a ∈ C,
I se tienen las implicaciones
z ∈ ZR ⇒ I(az) = R(a)I(z) + I(a)R(z) = I(a)R(z) = I(a)z,
z ∈ ZI ⇒ R(az) = R(a)R(z) − I(a)I(z) = −I(a)I(z) = iI(a)z
Si a es imaginario y z 6= 0, ninguno de estos resultados es nulo, luego ni ZR ni
ZI son subespacios vectoriales complejos de Z. En cambio, si a es real, ambos
son nulos. Esto significa que tanto ZR como ZI son subespacios reales de Z. Por
ello, la anterior suma directa lo es de IR-espacios y se tendrá
dim(Z) = dim(ZR ) + dim(ZI ).
Puesto que las coordenadas de los vectores de C en la propia base C son las
n-uplas canónicas, tales vectores están en ZR . Además todo vector de coordenadas reales es combinación lineal de ellos, luego forman una base de ZR en
tanto que IR-subespacio. Esto nos permite asegurar que su dimensión real es n.
Otro tanto ocurre con ZI : en efecto, se comprueba trivialmente que el sistema
{iw1 , iw2 , . . . , iwn } es libre, que sus elementos son vectores imaginarios puros
y que sus combinaciones lineales reales cubren todo ZI . Con esto, se llega a que
dim(Z) = dim(ZR ⊕ ZI ) = dim(ZR ) + dim(ZI ) = n + n = 2n.
Subindicando el cuerpo sobre el que se considera Z como espacio vectorial, esta
fórmula se presenta como
dimIR (Z) = 2 dimCI (Z).
Finalmente, la base de Z como IR-espacio es la
{w1 , w2 , . . . , wn ; iw1 , iw2 , . . . , iwn }
33.8.
Complexificación de un espacio vectorial
real
Sean V y Z dos espacios de dimensión finita n ≥ 1, el primero real y el segundo
complejo. Sean
B = {v1 , v2 , . . . , vn } y C = {w1 , w2 , . . . , wn }
bases en V y Z. Se comprende que la aplicación ϕ : V → Z tal que
ϕ(vj ) = wj , ∀j ∈ [1, n],
33.8. Complexificación de un espacio vectorial real
483
extendida por linealidad a todo V, establece un isomorfismo IR-lineal de V sobre
ZR . Igualando, pues, estos espacios, podemos considerar a V como subespacio
(real) de Z. En este sentido, se dice que Z es una complexificación del espacio
V.
En realidad, todo espacio Z de la misma dimensión compleja que V tenga como
real, es un complexificado suyo. En la bibliografı́a es frecuente partir de V como
dato y construir un espacio Z que lo complexifica.
Se comienza por considerar el conjunto
VC = V × V
que se convierte en un nuevo IR-espacio vectorial para las operaciones
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ),
a(x, y) = (ax, ay),
donde el elemento neutro es la pareja (0, 0) y para los opuestos se tiene la regla
−(x, y) = (−x, −y). Dentro de este espacio cabe considerar los subconjuntos
X = {(x, y) ∈ VC /y = 0}, Y = {(x, y) ∈ VC /x = 0}.
Se comprueba que ambos son subespacios vectoriales de VC , cada uno isomorfo
a V, y que
VC = X ⊕ Y.
Esto último permite afirmar que dim(VC ) = 2 dim(V).
En segundo lugar se define una multiplicación externa
C
I × VC → VC , de ley a(x, y) = (R(a)x − I(a)y, R(a)y + I(a)x),
comprobando enseguida que VC se convierte en un espacio sobre C.
I
Usando el isomorfismo entre V y X = {(x, 0)/x ∈ V}, en lo sucesivo escribiremos x en lugar de (x, 0). Tomando, entonces, un y ∈ V, obtenemos
iy = i(y, 0) = (0, y),
lo que permite para un vector arbitrario z = (x, y) ∈ VC escribir
z = (x, 0) + (0, y) = x + iy,
de manera que este espacio complejo que acabamos de construir es
R(x, y) = x, I(x, y) = y,
o, si se quiere,
(VC )R = X ≃ V, (VC )I = Y.
Proposición 401 La dimensión del espacio complejo VC es la misma que la
del espacio real V.
484
Capı́tulo 33. Espacios Vectoriales Complejos
Demostracion:
Sea B = {v1 , v2 , . . . , vn } una base del espacio real V. Tratamos de ver que
B también es base de VC .
Consideremos una relación lineal
c1 v1 + c2 v2 + . . . + cn vn = 0
donde cada cj ∈ C.
I Entonces,
0=
n
X
cj vj =
j=1
=(
n
X
n
X
(R(cj ) + iI(cj ))vj =
j=1
n
X
(R(cj )vj + iI(cj )vj ) =
j=1
n
n
n
X
X
X
R(cj )vj ) + i(
I(cj )vj ) ⇒
R(cj )vj =
I(cj )vj = 0 ⇒
j=1
j=1
j=1
j=1
⇒ R(cj ) = I(cj ) = 0 ⇒ cj = 0, ∀j ∈ [1, n].
Esto prueba que, como elementos de VC , los vectores de B siguen siendo linealmente independientes.
Sea z = (x, y) = x + iy un vector cualquiera de VC . Puesto que x, y ∈ V,
existen números aj , bj ∈ IR de manera que
x=
n
X
aj vj , y =
j=1
n
X
bj vj ,
j=1
en cuyo caso, siendo aj + ibj = cj ∈ C,
I obtenemos
z = x + iy =
n
X
j=1
aj vj + i
n
X
bj vj =
j=1
n
X
(aj + ibj )vj =
j=1
lo que prueba que B genera a todo el espacio VC .
n
X
cj vj ,
j=1
2
Ası́, VC es una complexificación de V, en la que V se iguala X. En lo sucesivo, cuando hablemos del complexificado de V, nos referiremos a este modelo
concreto.
33.9.
Complementos / Ejercicios
1. Fijada una base C = {w1 , w2 , . . . , wn } del espacio complejo Z cada endomorfismo semilineal f tiene asignada (como en el caso lineal) una matriz
cuadrada
A = (aij ) ∈ M(n,C),
I
cuyos coeficientes estn tomados de las igualdades
f (wj ) =
n
X
i=1
aij wi , j ∈ [1, n].
33.9. Complementos / Ejercicios
485
Razonar que
f (z) = A × z,
donde z es la columna formada con los conjugados de las coordenadas del
vector z en C.
2. Sea f un endomorfismo semilineal de Z. ¿Sigue siendo válida la igualdad
dim(Z) = dim(Ker f ) + dim(Im f )?
486
Capı́tulo 33. Espacios Vectoriales Complejos
487
Capı́tulo 34
Endomorfismos de Espacios
Reales
34.1.
Raı́ces imaginarias de un polinomio de coeficientes reales
Puesto que IR es subcuerpo de C,
I todo polinomio p(ξ) de coeficientes reales
pertenece al anillo C[ξ]
I
y por tanto posee en C
I tantas raı́ces como indique su
grado. Algunas de ellas podrán ser reales y las restantes serán imaginarias.
Ahora bien,
Proposición 402 Si λ es una raı́z imaginaria del polinomio p(ξ) ∈ IR[ξ], también lo es λ.
Demostracion:
Que λ sea raı́z de p significa que
p(λ) = a0 + a1 λ + a2 λ2 + . . . + an−1 λn−1 + an λn = 0.
Tomando conjugados en ambos miembros y teniendo en cuenta que la conjugación es un automorfismo de C,
I ası́ como que el conjugado de un número real
es el propio número, se obtiene
0 = 0 = p(λ) = a0 + a1 λ + a2 λ2 + . . . + an−1 λn−1 +n an λ =
2
= a0 + a1 λ + a2 λ + . . . + an−1 λ
2
= a0 + a1 λ + a2 λ + . . . + an−1 λ
n−1
n−1
n
+ an λ =
n
+ an λ = p(λ).
2
488
Capı́tulo 34. Endomorfismos de Espacios Reales
Proposición 403 Si λ y λ son raı́ces imaginarias conjugadas de un polinomio
p de coeficientes reales, entonces
d(ξ) = (ξ − λ)(ξ − λ)
es un divisor de p, con coeficientes reales e irreducible en IR.
Demostracion:
Que d(ξ) divida a p es consecuencia de que sus factores lo hagan. Por otra
parte, siendo λ = α + iβ, se tiene
d(ξ) = (ξ − α − iβ)(ξ − α + iβ) = ξ 2 − 2αξ + (α2 + β)2
cuyos coeficientes son reales. Precisamente por ser imaginarias sus dos raı́ces,
este polinomio es primo en IR.
2
Proposición 404 Si λ es una raı́z imaginaria del polinomio p(ξ) ∈ IR[ξ], los
órdenes de multiplicidad de λ y λ coinciden.
Demostracion:
Sea d(ξ) = (ξ − λ)(ξ − λ) y sea r el orden de multiplicidad de λ. Dividiendo
llegamos a que
p(ξ) = d(ξ)q1 (ξ),
donde el cociente q1 tiene coeficientes reales porque p y d los tienen. Si r > 1,
puesto que (ξ − λ)2 no divide a d(ξ), λ es raı́z de q1 (ξ). También lo será λ y q1
será divisible por d(ξ), llegando a que
p(ξ) = d2 (ξ)q2 (ξ),
donde q2 será de coeficientes reales. Si r > 2, reiteramos el razonamiento y
ası́ tantas veces como sea necesario hasta alcanzar el orden de multiplicidad de
λ. En ese punto, tendremos
p(ξ) = dr (ξ)qr (ξ), donde qr (λ) 6= 0,
en cuyo caso λ no puede ser raı́z del último cociente porque de serlo también lo
serı́a λ = λ. Ası́ queda probado que λ tiene orden r.
2
Proposición 405 Si p(ξ) ∈ IR[ξ] es un polinomio de grado impar, siempre
admite al menos una raı́z real y, en todo caso, una cantidad impar de raı́ces
reales.
Demostracion:
Si n es el grado de p, existirán n raı́ces en C.
I Según la proposición 404, la
cantidad total de raı́ces imaginarias es par. Restándolas del impar n, la diferencia
(igual a la cantidad de raı́ces reales) será impar.
2
Después de estos resultados es claro que la factorización prima de un polinomio
real consta de potencias de binomios ξ − a y potencias de trinomios ξ 2 + bξ + c,
con b2 − 4c < 0. Los primeros corresponden a raı́ces reales y los segundos a
parejas de raı́ces complejas imaginarias.
34.2. Extensión de los endomorfismos reales al campo complejo
34.2.
489
Extensión de los endomorfismos reales al
campo complejo
Sea f un endomorfismo del espacio real n-dimensional V y sea VC el complexificado de V. Extenderemos f a otro endomorfismo de VC :
Proposición 406 Dado un morfismo f , IR-lineal de V, la aplicación
fC : VC → VC , de ley fC (z) = f (R(z)) + if (I(z)),
es un morfismo C-lineal
I
de VC .
Demostracion:
Sean z, z ∈ VC ,
fC (z + w) = f (R(z + w)) + if (I(z + z)) =
= f (R(z) + R(w)) + if (I(z) + I(z)) =
= f (R(z)) + f (R(w)) + i(f (I(z)) + f (I(w))) =
= (f (R(z)) + if (I(z))) + (f (R(w)) + if (I(w))) = fC (z) + fC (w)
Tomemos ahora a ∈ C,
I
fC (az) = f (R(az)) + if (I(az)) =
= f (R(a)R(z) − I(a)I(z)) + if (R(a)I(z) + I(a)R(z)) =
= R(a)f (R(z)) − I(a)f (I(z)) + iR(a)f (I(z)) + iI(a)f (R(z)) =
= R(a)R(fC (z)) − I(a)I(fC (z)) + iR(a)I(fC (z)) + iI(a)R(fC (z)) =
= R(afC (z)) + iI(afC (z)) = afC (z)
2
De esta forma, tenemos una aplicación f → fC , entre las álgebras End(V, IR) y
End(VC ,C).
I
Proposición 407 Sean f, g ∈ End(V, IR), sea a ∈ IR y p(ξ) ∈ IR[ξ]. Entonces,
se verifica que
1. (f + g)C = fC +C g.
2. (af )C = aC f .
3. f = f0 ⇒ fC =0 f .
4. (g ◦ f )C = gC ◦C f .
5. f = I ⇔ fC = I.
490
Capı́tulo 34. Endomorfismos de Espacios Reales
6. (p(f ))C = p(fC ).
7. Si f es biyectivo ⇒ fC es biyectivo (f −1 )C = (fC )−1 .
Demostracion:
1. (f + g)C (z) = (f + g)(R(z)) + i(f + g)(I(z)) =
= (f (R(z)) + g(R(z))) + i(f (I(z)) + g(I(z))) =
= (f (R(z)) + if (I(z))) + (g(R(z)) + ig(I(z))) =
= fC (z) + gC (z) = (fC + gC )(z)
2. (af )C (z) = (af )(R(z)) + i(af )(I(z)) =
= (af (R(z))) + i(af (I(z))) = a(f (R(z)) + if (I(z))) =
= afC (z) = (afC )(z)
3. Las dos primeras propiedades indican que la extensión de endomorfismos
actúa con linealidad. Por tanto, cambia el endomorfismo nulo de V en el
endomorfismo nulo de VC . Recı́procamente, si fC fuese el endomorfismo
nulo del espacio complexificado, actuando sobre los vectores reales z =
x + i0 del mismo, resulta 0 = fC (z) = f (x), luego f es el endomorfismo
nulo de V.
4. (g ◦ f )C (z) = (g ◦ f )(R(z)) + i(g ◦ f )(I(z)) =
= g(f (R(z))) + ig(f (I(z))) = g(R(fC (z))) + ig(I(fC (z))) =
gC (fC (z)) = (gC ◦ fC )(z).
5. Si f = I es la identidad de V, se tiene
IC (z) = I(R(z)) + iI(I(z)) = R(z) + iI(z) = z = I(z).
Recı́procamente, si fC fuese la identidad de VC , actuando sobre un vector
real z = x + i0, se obtiene fC (z) = f (x) = z = x, lo que indica que f es
la identidad de V.
6. Se tiene al combinar varias de las propiedades anteriores, pues
p(ξ) = a0 + a1 ξ + a2 ξ 2 + . . . + ar ξ r ⇒
⇒ (p(f ))C = (
r
X
j=1
aj f j )C =
r
X
j=1
(aj f j )C =
r
X
j=1
aj (f j )C =
r
X
j=1
aj (fC )j = p(fC ).
34.3. Autovectores de un autovalor imaginario
491
7. Sea z ∈ VC tal que fC (z) = 0. Entonces,
R(fC (z)) = f (R(z)) = 0, I(fC (z)) = f (I(z)) = 0 ⇒
⇒ R(z) = 0, I(z) = 0 ⇒ z = 0,
luego fC es inyectivo. Tratándose de un endomorfismo en un espacio de
dimensión finita, también es suprayectivo, y, por tanto, biyectivo. Por otro
lado, aplicando las anteriores propiedades, se obtiene
I = IC = (f −1 ◦ f )C = (f −1 )C ◦ fC ⇒ (f −1 )C = (fC )−1 .
2
Proposición 408 Siendo f ∈ End(V, IR), se prueba que
f C = fC , CfC = Cf .
Demostracion:
Fijada una base B = {v1 , v2 , . . . , vn } de V, sabemos que esta misma sirve
como base del espacio complexificado VC , de manera que si la matriz A representa a f en B, esta misma matriz representa a fC . Entonces,
1. como se trata de una matriz real, el endomorfismo fC lo será, o sea,
cumplirá f C = fC .
2. Siendo el polinomio caracterı́stico independiente de la base que se use,
haciéndolo con B resulta
CfC (ξ) = det(ξI − fC ) = det(ξI − A) = det(ξI − f ) = Cf (ξ).
2
La extensión de endomorfismos es un isomorfismo IR-lineal entre el álgebra
End(V, IR) y la parte de End(VC ,C)
I formada por los endomorfismos autoconjugados (o reales). En lo sucesivo escribiremos f en lugar de fC .
34.3.
Autovectores de un autovalor imaginario
Proposición 409 Sea λ = α + iβ, con β 6= 0, un autovalor complejo del endomorfismo real f y sea z = u + iv un autovector de λ. Entonces,
1. z es un autovector correspondiente al autovalor λ.
2. v 6= 0.
3. v, u ∈ V son independientes y el plano < v, u > es f -invariante. La
restricción de f a este plano admite la matriz
µ
¶
α −β
.
β α
492
Capı́tulo 34. Endomorfismos de Espacios Reales
Demostracion:
1. Tomando conjugados en la igualdad (f − λI)(z) = 0, resulta que
(f − λI)(z) = 0, lo que significa que z es autovector asociado a λ.
2. Si suponemos v = 0, se tiene
z = z ⇒ f (z) = λz = f (z) = λz = λz ⇒ (λ − λ)z = 0 ⇒ λ = λ
porque z 6= 0. Pero esto contradice que λ sea imaginario, luego v 6= 0.
3. Los autovectores z y z son independientes por provenir de autovalores
distintos. Entonces (proposición 398), también v y u lo son. Además,
f (u) + if (v) = f (z) = λz = (α + iβ)(u + iv) =
= (αu − βv) + i(βu + αv) ⇒
⇒ f (v) = αv + βu, f (u) = −βv + αu.
Estas fórmulas dicen que < v, u > es f -invariante e indican la forma de
la matriz de la restricción.
2
34.4.
Autoespacio real de una pareja de autovalores complejos conjugados
Proposición 410 Sea λ = α + iβ, con β 6= 0, un autovalor complejo del endomorfismo real f y sea el subespacio real
U = Ker(f 2 − 2αf + (α2 + β)2 I).
Entonces,
1. U es f -invariante.
2. Para cada autovector z = u + iv de λ se cumple que v, u ∈ U.
3. Cada vector no nulo y ∈ U es la parte imaginaria de un autovector complejo de λ.
Demostracion:
1. Considerando el polinomio real
p(ξ) = ξ 2 − 2αξ + (α2 + β 2 )
cuyas raı́ces son los autovalores λ y λ de f , resulta que U = Ker(p(f )),
luego (proposición 356) se trata de un subespacio f -invariante.
34.4. Autoespacio real de una pareja de autovalores complejos conjugados
493
2. Usando las igualdades
f (v) = αv + βu, f (u) = −βv + αu,
obtenidas en la proposición 409, resulta que
f 2 (v) = f (f (v)) = αf (v) + βf (u) = αf (v) + β(−βv + αu) =
= αf (v) − β 2 v + αβu = αf (v) − β 2 v + α(f (v) − αv) =
= 2αf (v) − (α2 + β 2 )v,
f 2 (u) = f (f (u)) = −βf (v) + αf (u) = −β(αv + βu) + αf (u) =
= −αβv − β 2 u + αf (u) = −α(−f (u) + αu) − β 2 u + αf (u) =
= 2αf (u) − (α2 + β 2 )u.
3. Si buscamos x ∈ V con la condición de que x + iy sea autovector de λ, se
deberá de cumplir que f (y) = αy + βx, luego basta tomar
x=
1
α
f (y) − y.
β
β
Como también debe cumplirse que f (x) = −βy + αx, la existencia de este
vector requiere que y ∈ U. Por su elección, también x ∈ U.
2
Por abuso de lenguaje llamaremos autoespacio real de los autovalores complejos conjugados λ y λ al subespacio f -invariante
Ker (f 2 − 2αf + (α2 + β)2 I).
Para cada autovector complejo z = u + iv, este subespacio contendrá al plano
< v, u >, de manera que su dimensión cuando menos es 2. Puede precisarse
más:
Proposición 411 Sea λ un autovalor complejo, con orden de multiplicidad s,
de un endomorfismo real f . Sea m, donde 1 ≤ m ≤ s, la dimensión del autoespacio de λ. Entonces, el autoespacio real es de dimensión 2m.
Demostracion:
Consideremos una base de Ker(f − λI)
z1 = u1 + iv1 , z2 = u2 + iv2 , . . . , zm = um + ivm .
Si U es el autoespacio real, tenemos:
494
Capı́tulo 34. Endomorfismos de Espacios Reales
Dado y ∈ U, buscamos otro x ∈ U tal que x + iy sea autovector de λ.
Existirán unos escalares a1 , a2 , . . . , am , b1 , b2 , . . . , bm ∈ IR, tales que
x + iy =
m
X
(aj + ibj )(uj + ivj ) =
j=1
=
m
X
(aj uj − bj vj ) + i(aj vj + bj uj ) =
j=1
=
m
X
(aj uj − bj vj ) + i
j=1
m
m
X
X
(aj vj + bj uj ) ⇒ y =
(aj vj + bj uj ).
j=1
j=1
Esto prueba que los vectores v1 , v2 , . . . , vm , u1 , u2 , . . . , um generan a U.
Planteada una relación lineal nula con ellos, tenemos
0=
m
X
(aj vj + bj uj ) =
j=1
m
X
j=1
=
(aj
zj +j z
zj −j z
+ bj
)=
2i
2
m
X
bj − ij a
bj + ij a
zj +
zj ) ⇒
2
2
j=1
(
bj − ij a
bj + ij a
=
= 0 ⇒ aj = bj = 0,
2
2
luego se trata de vectores independientes y, por ello, base de U.
⇒
34.5.
2
Matriz canónica reducida real
Sea λ = α + iβ, con β 6= 0, un autovalor del endomorfismo real f con orden s
de multiplicidad. En la descomposición primaria de f en VC estará el sumando
directo
W(λ) = Ker(f − λI)s
del cual sabemos que tiene dimensión s y admite a (ξ − λ)s como polinomio
caracterı́stico para su restricción. Este sumando, a su vez, se descompone en
d = dim(Ker (f − λI)) sumandos f -invariantes y f -cı́clicos, cada uno de ellos
con dimensión menor o igual que el ı́ndice m de nilpotencia de f − λI. También
sabemos que las dimensiones de los subespacios cı́clicos están determinadas por
las de los subespacios anuladores
{0}, Ker(f − λI), Ker(f − λI)2 , . . . , Ker(f − λI)m−1 , Ker(f − λI)m = W(λ).
Por ser f real, también λ será autovalor con el mismo orden. Por ello en la
descomposición primaria también está el sumando directo
W(λ) = Ker(f − λI)s ,
con dimensión s y polinomio caracterı́stico (ξ − λI)s para su restricción. Ahora
bien,
34.5. Matriz canónica reducida real
495
Proposición 412 Para cada natural h se cumple
dim(Ker(f − λI)h ) = dim(Ker(f − λI)h ).
Demostracion:
Basta observar que
(f − λh I) = (f − λI)h = (f − λI)h = (f − λI)h ,
y aplicar que endomorfismos conjugados poseen el mismo rango. Entonces,
dim(Ker (f − λI)h ) = n − rang((f − λI)h ) =
= n − rang((f − λI)h ) = dim(Ker (f − λI)h ).
2
Cuando h = 1, la fórmula obtenida es
dim(Ker f − λI) = dim(Ker f − λI) = d,
que nos indica que W(λ) y W(λ) se descomponen en la misma cantidad de
subespacios celulares. Cuando h = m, tenemos
dim(Ker (f − λI)m ) = dim(Ker (f − λI)m ) = s = dim(W(λ)),
luego también f − λI comparte el ı́ndice m de nilpotencia con f − λI. Por tanto,
la sucesión de subespacios anuladores para λ será la
{0}, Ker(f − λI), Ker(f − λI)2 , . . . , Ker(f − λI)m−1 , Ker(f − λI)m = W(λ),
compartiendo dimensión cada uno de ellos con el de igual exponente en la sucesión de λ. De todo esto se sigue que por cada subespacio celular de W(λ), con
una dimensión dada p ≤ m, hay otro de igual dimensión en W(λ).
Proposición 413 Para cada natural h se cumple
1. z ∈ Ker(f − λI)h ⇒ z ∈ Ker(f − λI)h ,
2. z ∈ Ker(f − λI)h , z 6= 0 ⇒ I(z) 6= 0.
Demostracion:
1. Tomando conjugados se tiene
z ∈ Ker(f − λI)h ⇒ 0 = (f − λI)h (z) ⇒ 0 = 0 = (f − λI)h (z) =
(f − λh I)(z) = (f − λI)h (z) ⇒ z ∈ Ker(f − λI)h .
496
Capı́tulo 34. Endomorfismos de Espacios Reales
2. Como λ 6= λ, W(λ) + W(λ) es una suma directa. Entonces,
I(z) = 0 ⇒ z = z ⇒
⇒ z ∈ Ker(f − λI)h ∩ Ker(f − λI)h ⊆ W(λ) ∩ W(λ) = {0} ⇒ z = 0,
luego si z 6= 0, necesariamente es I(z) 6= 0.
2
Sea C, de dimensión p ≤ m, un subespacio celular de W(λ). Siendo
z ∈ Ker(f − λI)p , z 6∈ Ker(f − λI)p−1 ,
la base de dicho subespacio es de la forma
z1 = (f − λI)p−1 (z), . . . , zp−1 = (f − λI)(z), zp = z
Sus conjugados
z1 = (f − λI)p−1 (z), . . . , zp−1 = (f − λI)(z), zp = z
generan otro espacio celular C, de igual dimensión, pero dentro de W(λ). Como
λ 6= λ, su suma será directa y la restricción de f a C ⊕ C tendrá como matriz
de Jordan (cuadrada de 2p filas y columnas) a la siguiente:
λ
1
λ
.
λ
1
λ
λ
1
λ
.
λ
1
λ
Proposición 414 Siendo zj = uj + ivj , ∀j, los 2p vectores reales
u1 , u2 , . . . , up−1 , up , v1 , v2 , . . . , vp−1 , vp ,
son linealmente independientes y el subespacio U ≤ V generado por ellos es
f -invariante. Ordenando la base de U en la forma
v1 , u1 , v2 , u2 , . . . , vp−1 , up−1 , vp , up ,
34.5. Matriz canónica reducida real
497
la restricción de f a U se representa en ella por la matriz
α
β
−β
α
1
1
−β
α
α
β
..
.
α
β
−β
α
1
α
β
1
−β
α
Demostracion:
Planteada una relación lineal nula con estos vectores, se tiene
0=
p
X
aj uj +
j=1
p
X
bj vj =
j=1
=
⇒
j=1
p
X
aj − ij b
j=1
p
X
2
zj +
aj
p
zj +j z X zj −j z
+
bj
=
2
2i
j=1
p
X
aj + ij b
j=1
2
zj ⇒
aj − ij b
aj + ij b
=
= 0 ⇒ aj = bj = 0.
2
2
Para j = 1, z1 es autovector de λ, luego (proposición 409) se sabe que
f (v1 ) = αv1 + βu1 , f (u1 ) = −βv1 + αu1 .
Para j > 1, basta observar que
f (uj + ivj ) = f (zj ) = zj−1 + λzj =
= (uj−1 + ivj−1 ) + (α + iβ)(uj + ivj ) =
= (uj−1 + αu − βvj ) + i(vj−1 + βuj + αvj ) ⇒
⇒ f (vj ) = vj−1 + αvj + βuj , f (uj )) = uj−1 − βvj + αuj .
Estas fórmulas dicen que U es f -invariante e indican la forma de la matriz de
la restricción.
2
Si los vectores zj y zj , que forman parte de la base (imaginaria) de Jordan, se
sustituyen por los
v1 , u1 , v2 , u2 , . . . , vp−1 , up−1 , vp , up ,
los dos bloques de la matriz canónica correspondientes a los subespacios C y C
se sustituyen por este único bloque correspondiente a U.
498
Capı́tulo 34. Endomorfismos de Espacios Reales
Esto mismo lo repetimos con cada sumando celular de W(λ). Y lo volvemos
a repetir con cada pareja de autovalores imaginarios conjugados que admita f .
Con los reales no hay nada que hacer porque los datos que aportan a la matriz
de Jordan compleja son reales. Finalizado el proceso, habrá una matriz real J
para f con bloques como los de la matriz de la propoaición 414 para las parejas
de autovalores imaginarios conjugados y bloques canónicos para los autovalores
reales. Tal matriz es la que hemos dado en llamar la matriz canónica reducida
real.
Para terminar, en los siguientes apartados, adaptaremos y detallaremos estos
resultados a las dimensiones 2, 3 y 4.
34.6.
Endomorfismos reales en dimensión 2 con
autovalores imaginarios
Supongamos que f admita los autovalores imaginarios conjugados λ y λ. Siendo
z = u + iv un autovector de λ = α + iβ, en la base {z, z} del plano sobre C,
I
f admite la matriz Diag(λ, λ). Sin embargo, tomando la base {v, u} del plano
real, f admite la matriz canónica reducida real
µ
¶
α −β
J=
.
β α
34.7.
Endomorfismos reales en dimensión 3 con
autovalores imaginarios
Como la dimensión es impar, f admitirá un autovalor real µ y una pareja de
autovalores complejos λ y λ. Buscando un autovector z = u + iv (complejo)
de λ = α + iβ y un autovector w (real) de µ, en la base {z, z, w} del espacio
complejo, f se representa por la matriz Diag(λ, λ, µ). En el espacio real se toma
la base {v, u, w} en la cual f alcanza la matriz canónica reducida real
α −β
.
J = β α
µ
34.8.
Endomorfismos reales en dimensión 4 con
autovalores imaginarios
1. f admite dos autovalores complejos conjugados λ y λ y dos autovalores µ1
y µ2 reales. Se buscará un autovector z = u + iv (complejo) de λ = α + iβ,
pero para completar una base hay que abrir tres alternativas:
a) Si µ1 6= µ2 , añadiendo sendos autovectores w1 , w2 de µ1 , µ2 , en la
base {z, z, w1 , w2 }, f tiene la matriz Diag(λ, λ, µ1 , µ2 ), que en la base
34.8. Endomorfismos reales en dimensión 4 con autovalores imaginarios
499
real {v, u, w1 , w2 } se sustituye por la matriz canónica reducida
real
α −β
β α
J =
.
µ1
µ2
b) Se trata de un autovalor doble µ y su autoespacio es bidimensional.
Entonces, se buscan w1 , w2 ∈ Ker(f − µI) que sean independientes.
En {z, z, w1 , w2 }, f tiene la matriz Diag(λ, λ, µ, µ), y en la base real
{v, u, w1 , w2 } aparece la matriz canónica reducida real
α −β
β α
J =
.
µ
µ
c) Es un autovalor doble µ con una recta de autovectores. Entonces,
se busca w2 ∈ Ker(f − µI)2 , w2 6∈ Ker(f − µI), y se calcula w1 =
(f − µI)(w2 ). En {z, z, w1 , w2 }, f tiene la matriz normal de Jordan
λ
λ
µ 1
µ
y en la real {v, u, w1 , w2 } aparece la matriz canónica reducida
real
α −β
β α
J =
.
µ 1
µ
2. f admite dos parejas de autovalores imaginarios conjugados
λ1 = α1 + iβ1 , λ1 , λ2 = α2 + iβ2 , λ2 ,
siendo λ1 6= λ2 . Se buscan autovectores z1 = u1 + iv1 y z2 = u2 +
iv2 para λ1 y λ2 , respectivamente. En la base {z1 z1 , z2 , z2 }, f tiene la
matriz Diag(λ1 , λ1 , λ2 , λ2 ) y en la real {v1 , u1 , v2 , u2 } aparece la matriz
canónica reducida real
α1 −β 1
α
β
J = 1 1
.
α2 −β 2
β2 2α
3. f admite como autovalores dobles una pareja
λ = α + iβ, λ = α − iβ
de números complejos conjugados. Para este caso se abren dos alternativas:
500
Capı́tulo 34. Endomorfismos de Espacios Reales
a) Los autoespacios son bidimensionales. En Ker(f − λI) se buscan dos
autovectores z1 = u1 + iv1 , z2 = u2 + iv2 (complejos) que sean linealmente independientes. En la base {z1 , z2 , z1 , z2 }, f tiene la matriz
Diag(λ, λ, λ, λ), pero en la {v1 , u1 , v2 , u2 } se representa por la matriz canónica reducida real
α
β
J =
−β
α
α
β
−β
α
.
b) Los autoespacios son unidimensionales. Se busca un vector
z2 = u2 + iv2 ∈ Ker(f − λI)2 , z2 6∈ Ker(f − λI),
y a continuación se calcula el autovector
z1 = u1 + iv1 = (f − λI)(w2 ).
Con ellos se forma la base compleja {z1 , z2 , z1 , z2 }, en la cual f tiene
la matriz canónica normal de Jordan
λ
1
λ
λ
1
λ
.
En el espacio real se toma la base {v1 , u1 , v2 , u2 }, en la que f alcanza
la matriz canónica reducida real
α
β
J =
34.9.
−β
α
1
α
β
1
.
−β
α
Complementos / Ejercicios
1. Determinar la matriz canónica reducida real, base en que se alcanza y
matrices de cambio, para cada operador f que en la base canónica de IRn
(n = 2, 3, 4) está representado por las matrices:
34.9. Complementos / Ejercicios
µ
a)
−1 5
−1 3
7
1
c)
−1
3
4
−3
e)
−1/2
2
2
0
−1
2
µ
¶
3
1
−2
1
4
0
k)
2
0
1
2
0
0
−1
−3
m)
0
−2
−3
−2
o)
−2
−2
−14
b) 10
−10
3
1
7
−1
−1
−3
−1
7
0
0
2 −12
1
0
−2
8
0
−2
g)
−2
−1
i)
¶
1
7
−3
1
501
2
1
0
−2
24
15
d)
15
0
0
2
−1
6
1
2
f)
0
−1
1
−2
2
0
1
1
h)
−1
1
−8
8
−6
0
8
0
0
12
−6
8
−48 −16
−32 −15
−24 −15
0
8
−1
0
−4
−1
−1
0
2
1
−1
2
−1
1
−1 0 −2
1 0 0
1 1 1
1 1 1
1 2 0
j) −1 1 0
0 1 1
−1 0
0 0
2 2
0 4
1
−1
l)
−1
1
−1
1
0
−4
1 3
0 3
2 0
1 4
0
−1
2
−2
2 2
0 2
−1 0
2 1
3
1
n)
1
−2
−6
−13
p)
−5
−18
1
−1
1
−1
−1
−1
1
1
1
1
1
1
1
1
−1
−2
−2
0
1
2
2
1
−1
−1
0
2
0
2
10
20
8
24
0
−1
0
0
2. Determinar la matriz canónica reducida real, base en que se alcanza y
matrices de cambio, para cada endomorfismos f que en la base canónica
de IRn está representado por las siguientes matrices:
1
0
a) 0
0
0
1 0
3 1
−2 1
1 1
−2 0
0
−2
2
0
2
0
0
−2 .
−1
0
502
Capı́tulo 34. Endomorfismos de Espacios Reales
1
0
0
b) 1
0
0
0
0 −1
4 −2
5 −2
−5 3
0
0
0
0
0
0
4
0
−20
c)
0
−4
4
−2
1
0
d)
0
0
0
−4
6
−40
4
−8
8
−5
2
0
0
0
0
0
0
0
0
3
0
0
0
0
−2
0
−2
2
2
0 0
−1 0 0
0 10 0
.
2
0 0
0
6 0
0
6 3
−2
1
0
1
0
0
−1
0
−1
0
0
0
−6
0
0
−6
3
2
0
−5
0
0
−5 .
2
0
2
−1
0
0
1
0
0
0
0
0
0
0
−1 −1
.
1
0
−1 −1
2
1
3. Razonar que todo endomorfismo real f admite cuando menos una recta o
bien un plano que es f -invariante.
4. Sea V un espacio vectorial real y f un endomorfismo de V. Razonar que
V es f -simple únicamente si dim(V) = 1 o bien si dim(V) = 2 y f admite
dos autovalores imaginarios conjugados.
5. Sea V el plano vectorial real (dentro del espacio de todas las funciones
reales de dominio IR) generado por las funciones coseno y seno. Se considera el operador de derivación D. Comprobar que V es D-simple.
6. Razonar la semejanza de las dos siguientes matrices reales:
µ
¶ µ
¶
α −β
α β
,
.
β α
−β α
7. Sean tres nḿeros reales a, b, c tales que a2 + b2 + c2 = 1, y sea la matriz
antisimétrica
0
a b
A = −a 0 c .
−b −c 0
Hallar sus autovalores y autovectores. Probar que A3 = −A y que
eξ A = I + A sen ξ + A2 (1 − cos ξ).
34.9. Complementos / Ejercicios
503
8. Sea f un endomorfismo real que se diagonaliza en el campo complejo. Razonar que en el campo real f se diagonaliza por bloques. Concretamente,
en una cantidad par de bloques del tipo
¶
µ
α −β
,
β α
correspondientes a los autovalores complejos, seguidos de bloques de orden
1 (una fila y una columna), correspondientes a los autovalores reales.
504
Capı́tulo 34. Endomorfismos de Espacios Reales
Bibliografı́a
505
Bibliografı́a
[1] ALSINA, CLAUDI-TRILLAS, ENRIC (1991), Lecciones de Algebra y Geometrı́a, Editorial Gustavo Gili, Barcelona.
[2] ARTIN, EMIL (1972), Algebra Geométrica, Limusa, México.
[3] AYRES, FRANK JR. (1962),Theory and Problems of Matrices, McGrawHill, New York.
[4] BURGOS, JUAN DE (1999), Algebra Lineal y Geometrı́a Cartesiana, Mc
Graw Hill, Madrid.
[5] Cohn, P.M. (2000), Classic Algebra, Wiley, England.
[6] DOMINGUEZ, E-SANZ, L.-LOPEZ, M-SOLANA, PABLO (1998),Problemas de Algebra Lineal, Editorial Bellisco, Madrid.
[7] GARCIA, JOSE-LOPEZ PELLICER, MANUEL (1990), Algebra Lineal y
Geometrı́a, Editorial Marfil, Alicante.
[8] GODEMENT, ROGER (1967), Algebra, Editorial Tecnos, Madrid.
[9] GOLOVINA, L. I. (1983), Algebra Lineal y algunas de sus aplicaciones,
Editorial Mir, Moscú.
[10] HALMOS, PAUL RICHARD (1987), Finite-Dimensional Vector Spaces,
Springer-Verlag, New York.
[11] IKRAMOV, J. (1990), Problemas de Algebra Lineal, Editorial Mir, Moscú.
[12] KUROSCH, ALEXANDER G. (1977), Curso de Algebra Superior, Editorial
Mir, Moscú.
[13] LANG, SERGE (1971), Linear Algebra, Addison-Wesley, Massachusetts.
[14] LENTIN, A.-RIVAUD, J. (1967),Algebra Moderna, Editorial Aguilar,
Madrid.
[15] MALTSEV, ANATOLI I. (1972), Fundamentos de Algebra Lineal, Editorial
Mir, Moscú.
View publication stats
506
Bibliografı́a
[16] POSTNIKOV, MIKHAIL (1981), Algèbre linéaire et géométrie différentielle, Editorial Mir, Moscú.
[17] POSTNIKOV, MIKHAIL (1981), Géométrie analytique, Editorial Mir,
Moscú.
[18] PROSKURIAKOV, I. (1986), Problemas de Algebra Lineal, Editorial Mir,
Moscú.
[19] ROJO, JESUS (2001), Algebra Lineal, Mc Graw Hill, Madrid.
[20] TORREGROSA, JUAN R.-JORDAN, CRISTINA (1991),Algebra Lineal y
sus aplicaciones, Mc Graw Hill, Madrid.
[21] VOEVODIN, VALENTIN V. (1986), Algebra Lineal, Editorial Mir, Moscú.
0
You can add this document to your study collection(s)
Sign in Available only to authorized usersYou can add this document to your saved list
Sign in Available only to authorized users(For complaints, use another form )