Introducción a la GEOMETRÍA DIFERENCIAL DE
Transcripción
Introducción a la GEOMETRÍA DIFERENCIAL DE
Introducción a la GEOMETRÍA DIFERENCIAL DE VARIEDADES Miguel Sánchez Caja José Luis Flores Dorado Depto. Geometrı́a y Topologı́a, Universidad de Granada, 2003 Déposito Legal: GR-1558/04 Índice general 1. Topologı́a básica 1.1. Generalidades . . . . . . . . . 1.2. Construcción de topologı́as . . 1.3. Axiomas de numerabilidad . . 1.4. Lı́mites. Espacios Hausdorff . 1.5. Continuidad . . . . . . . . . . 1.6. Espacios topológicos métricos 1.7. Conexión y arcoconexión . . . 1.8. Compacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. El concepto de variedad diferenciable 2.1. Concepto de variedad topológica . . . 2.2. Variedades diferenciables . . . . . . . 2.3. Aplicaciones diferenciables . . . . . . 2.4. Hipersuperficies regulares de Rn . . . 2.5. Subvariedades regulares de Rn . . . . 2.6. Apéndice 1: atlas en §2 . . . . . . . . 2.7. Apéndice 2: coordenadas en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 5 8 9 10 12 16 18 . . . . . . . 23 23 26 31 34 38 41 44 3. Espacio tangente 3.1. Concepto de vector tangente . . . . . . . . . . . . . . . 3.1.1. Vector tangente como clase de equivalencia de curvas . . . . . . . . . . . . . . . . . . . . . . . 3.1.2. Vector tangente por coordenadas . . . . . . . . 3.1.3. Vector tangente como derivación . . . . . . . . . 3.2. Estructura del espacio tangente . . . . . . . . . . . . . 3.2.1. Vectores tangentes inducidos por los entornos coordenados . . . . . . . . . . . . . . . . . . . . . i 49 49 50 52 53 55 56 ii ÍNDICE GENERAL 3.2.2. Estructura de espacio vectorial de 3.3. Variedad tangente . . . . . . . . . . . . . 3.4. Apéndice: Mecánica Lagrangiana . . . . 3.4.1. Lagrangianas . . . . . . . . . . . 3.4.2. Curvas crı́ticas de la acción . . . 4. Aplicaciones diferenciables 4.1. Diferencial de una función . . . . 4.1.1. Concepto . . . . . . . . . 4.1.2. Expresión en coordenadas 4.1.3. Cambio de coordenadas . 4.2. El espacio cotangente . . . . . . . 4.3. Diferencial de una aplicación . . . 4.4. Teoremas fundamentales . . . . . 4.5. Apéndice: el espacio dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Campos vectoriales 5.1. Concepto de campo vectorial . . . . . . . 5.2. Estructura de los campos vectoriales . . 5.3. Paralelizabilidad . . . . . . . . . . . . . 5.4. Curvas integrales. Flujos . . . . . . . . . 5.5. Grupo uniparamétrico de difeomorfismos 5.6. Corchete de Lie . . . . . . . . . . . . . . 5.7. Apéndice: Grupos y Álgebras de Lie . . . Tp Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 60 62 63 64 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 69 69 69 70 71 73 76 79 . . . . . . . 85 85 86 87 89 91 95 99 . . . . . . . . . . . . 105 105 105 107 108 111 111 112 112 116 117 118 118 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Tensores y formas diferenciales 6.1. Tensores en un espacio vectorial . . . . . . . . . . . . 6.1.1. Concepto . . . . . . . . . . . . . . . . . . . . 6.1.2. Producto tensorial . . . . . . . . . . . . . . . 6.1.3. Tensores tipo (r, s) con r + s = 2 . . . . . . . 6.1.4. Tensores tipo (r, s) . . . . . . . . . . . . . . . 6.1.5. Tensores simétricos y antisimétricos tipo (2, 0) 6.2. Tensores sobre variedades . . . . . . . . . . . . . . . 6.2.1. Tensores en un espacio vectorial tangente . . . 6.2.2. Campos tensoriales . . . . . . . . . . . . . . . 6.3. Formas diferenciales . . . . . . . . . . . . . . . . . . 6.4. La diferencial exterior . . . . . . . . . . . . . . . . . 6.4.1. Formas exactas . . . . . . . . . . . . . . . . . ÍNDICE GENERAL iii 6.4.2. Diferencial de formas. Lema de Poincaré 6.5. Circulación de una forma diferencial . . . . . . . 6.6. Apéndice 1: conexión simple . . . . . . . . . . . 6.7. Apéndice 2: Termodinámica . . . . . . . . . . . 7. Campos tensoriales métricos 7.1. Métricas riemannianas y lorentzianas . . . . 7.2. Gradiente de una función . . . . . . . . . . . 7.3. Campos conservativos e irrotacionales . . . . 7.4. Circulación de un campo vectorial . . . . . . 7.5. Isometrı́as . . . . . . . . . . . . . . . . . . . 7.6. Distancia en el caso riemanniano . . . . . . 7.7. Apéndice 1: bemol y sostenido . . . . . . . . 7.8. Apéndice 2: M. Lagrangiana y Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 122 125 127 . . . . . . . . 131 131 135 137 138 139 141 142 144 8. Integración en Variedades 155 8.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . 156 8.2. Integración de n−formas diferenciales . . . . . . . . . . 159 8.2.1. El problema de la integración sobre una variedad 159 8.2.2. Integración de n-formas en entornos coordenados 161 8.2.3. Integración general de n−formas . . . . . . . . 163 8.2.4. Particiones de la unidad e integración . . . . . . 165 8.3. Integración de funciones . . . . . . . . . . . . . . . . . 167 8.3.1. Elementos de volumen e integración de funciones 167 8.3.2. Integración en variedades semi-riemannianas . . 167 8.4. Teorı́a de la medida . . . . . . . . . . . . . . . . . . . . 169 8.4.1. Nota previa sobre la integral de Riemann . . . . 169 8.4.2. Medida de Lebesgue . . . . . . . . . . . . . . . 171 8.4.3. Integral de Lebesgue en Rn . . . . . . . . . . . 172 8.4.4. Conjuntos de medida nula y espacio de medida en una variedad . . . . . . . . . . . . . . . . . . 175 8.4.5. Integración en una variedad . . . . . . . . . . . 176 8.5. Apéndice 1: álgebra exterior sobre V (R) . . . . . . . . 178 8.6. Apéndice 2: Elementos de volumen en V (R) . . . . . . 183 8.6.1. Elemento de volumen y orientación . . . . . . . 183 8.6.2. Determinante de un endomorfismo . . . . . . . 184 8.6.3. El elemento de volumen métrico orientado . . . 185 8.7. Apéndice 3: r−formas y orientación . . . . . . . . . . . 186 iv ÍNDICE GENERAL 8.7.1. El álgebra de r−formas diferenciales . . . . . . 186 8.7.2. Orientación de una variedad . . . . . . . . . . . 187 8.7.3. El recubridor de dos hojas orientable . . . . . . 189 9. Teorema de Stokes 9.1. Derivaciones y antiderivaciones . . . . . . . . 9.1.1. Derivación tensorial . . . . . . . . . . . 9.1.2. Antiderivación tensorial . . . . . . . . 9.1.3. Teorema de Cartan . . . . . . . . . . . 9.2. Variedades con borde . . . . . . . . . . . . . . 9.2.1. Diferenciabilidad en abiertos de Rn+ . . 9.2.2. Concepto de variedad con borde . . . . 9.2.3. Orientación en el borde . . . . . . . . . 9.3. Teorema de Stokes . . . . . . . . . . . . . . . 9.4. Primeras aplicaciones . . . . . . . . . . . . . . 9.4.1. Fórmula de Green-Riemann en el plano 9.4.2. Teorema integral de Cauchy . . . . . . 9.4.3. Teorema clásico de Stokes . . . . . . . 9.5. Teorema de la Divergencia . . . . . . . . . . . 9.6. Aplicaciones del T. de la Divergencia . . . . . 9.7. Fórmulas de Green . . . . . . . . . . . . . . . 9.8. Apéndice: producto vectorial . . . . . . . . . . 9.8.1. Isomorfismos especiales en (V 3 (R), µ0 ). 9.8.2. El rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 191 191 194 198 199 200 201 204 206 209 209 210 211 214 216 221 223 223 224 . . . . . . . 225 225 229 231 234 236 237 238 11.Curvatura 11.1. Concepto de curvatura . . . . . . . . . . . . . . . . . . 11.2. Tensor de curvatura 4-covariante . . . . . . . . . . . . 11.3. Curvatura seccional . . . . . . . . . . . . . . . . . . . . 241 241 242 243 10.Conexiones afines 10.1. Concepto de conexión afı́n 10.2. Sı́mbolos de Christoffel . . 10.3. Derivada covariante . . . . 10.4. Transporte paralelo . . . . 10.5. Geodésicas . . . . . . . . . 10.6. Conexiones simétricas . . . 10.7. Aplicación exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ÍNDICE GENERAL 11.4. Tensor de Ricci . . . . . . . . . . . . . 11.5. Curvatura escalar . . . . . . . . . . . . 11.6. Significado de la curvatura . . . . . . . 11.6.1. Orı́genes geométricos . . . . . . 11.6.2. Cómo la curvatura determina la 11.6.3. Ecuación de Jacobi . . . . . . . 11.6.4. Otras propiedades . . . . . . . . v . . . . . . . . . . . . . . . . . . . . métrica . . . . . . . . . . . . . . . . . . . . . . . . 12.Algunas notas sobre Relatividad 12.1. Relatividad Especial . . . . . . . . . . . . . . . . . 12.1.1. Espacios vectoriales lorentzianos . . . . . . . 12.1.2. El grupo de Lorentz . . . . . . . . . . . . . 12.1.3. L4 como modelo de espaciotiempo . . . . . . 12.1.4. La constancia de la velocidad de la luz . . . 12.1.5. Algunas consecuencias del modelo . . . . . . 12.2. Relatividad General . . . . . . . . . . . . . . . . . . 12.2.1. El modelo matemático . . . . . . . . . . . . 12.2.2. Causalidad . . . . . . . . . . . . . . . . . . 12.2.3. Maximización por geodésicas causales . . . . 12.2.4. Ecuación de Einstein . . . . . . . . . . . . . 12.2.5. Modelos cosmológicos de Robertson-Walker 12.2.6. Espaciotiempo de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244 245 246 246 250 252 253 . . . . . . . . . . . . . 255 255 255 257 259 261 263 265 265 267 269 270 273 275 vi ÍNDICE GENERAL Nota introductoria El presente volumen recoge los apuntes del curso “Fı́sica Matemática III: Ga Diferencial y Variedades” impartido por el primero de los autores en la licenciatura de Fı́sica desde el año 00/01. Su objetivo es ofrecer una introducción rápida a la Geometrı́a Diferencial que provea al estudiante de una base geométrica para la Mecánica Racional, la Relatividad General y otras ramas de la Fı́sica. Con este objetivo, hacemos especial hincapié en la reflexión sobre los conceptos y estructuras geométricas, ilustrándolos con ejemplos comunes en Fı́sica. Las demostraciones también están orientadas a este fin, por lo que se seleccionan aquéllas que permiten profundizar en los conceptos o resolver problemas concretos. No obstante, aunque se excluyan demostraciones, a menudo se dan esquemas o ideas intuitivas de ellas, que aporten más seguridad a los conocimientos adquiridos. Estos apuntes también se han revelado útiles para alumnos de Matemáticas como los de doctorado, los cuales, una vez concluida la licenciatura, han necesitado reordenar sus conocimientos geométricos. No obstante, conviene que los lectores de formación matemática tengan presente las siguientes dos advertencias: (1) El objetivo de las frecuentes “Notas” o “Apéndices” sobre cuestiones de motivación fı́sica no es enseñar éstas a quien se las tope por primera vez: si éste es el caso, resulta preferible saltárselas. Su modesto objetivo es permitir, a quien ya las ha estudiado alguna vez (aunque, probablemente, con un lenguaje muy diferente) ubicarlas en el contexto geométrico apropiado. (2) Aunque los conceptos se suelen definir del modo intrı́nseco “libre de coordenadas” usual en la Matemática moderna, se hace especial hincapié en las expresiones en coordenadas (incluso desde el punto de vista de los fundamentos). Ello suele ser especialmente útil para vii viii ÍNDICE GENERAL los fı́sicos, pero no creemos que deba obviarlo un matemático. Por el contrario, en nuestra opinión, éste debe adquirir suficiente soltura en cálculos concretos usando coordenadas. Partimos de un conocimiento básico de Cálculo Diferencial e Integral en varias variables, ası́ como de Álgebra Lineal. No obstante, algunos temas de ésta, que no suelen conocerse con mucha profundidad (espacio dual, tensores) se repasan en secciones especı́ficas. No presuponemos, sin embargo, ningún conocimiento previo de topologı́a, por lo que, brevemente, el Tema 1 se dedica a ella. Aparte de este primer tema sobre topologı́a, y del último, que proporciona una introducción geométrica a la Teorı́a de la Relatividad, el volumen puede dividirse en cuatro partes: Parte I. Temas 2–4. Se introducen los “fundamentos” del concepto de variedad, mostrando cómo el Cálculo Diferencial puede extenderse a espacios mucho más generales que los abiertos de Rn . Merece comentarse: (a) Aunque el concepto de variedad diferenciable pueda introducirse de manera bastante más directa (“conjunto dotado de un atlas diferenciable maximal”) preferimos detenernos primero en el de variedad topológica. La topologı́a que subyace a toda variedad diferenciable origina muchas de sus propiedades, y los preliminares del Tema 1 permiten entenderla con rigor. (b) Tampoco presuponemos un conocimiento previo de superficies de R3 , por lo que éstas y, en general, las subvariedades de Rn , aparecerán a menudo como ejemplos de variedades. Sin embargo, aunque se estudien en particular sus propiedades, nuestro punto de vista es el de la geometrı́a intrı́nseca, al resultar ésta esencial en los fundamentos de la Fı́sica Teórica. La geometrı́a extrı́nseca de curvas y superficies, mucho más intuitiva (y de utilidad práctica en problemas más cotidianos) no la desarrollamos por razones de espacio. No obstante, hay excelentes manuales sobre ella, como el libro de do Carmo [dC2]. Recomendamos al alumno que nunca la haya estudiado, consultar la bibliografı́a para formarse una mejor idea de conjunto, y para que su aproximación a la Geometrı́a Diferencial resulte más gradual. (c) Los vectores tangentes y aplicaciones diferenciables se introducen de diversas maneras, progresivamente más abstractas, ası́: vectores como clases de equivalencia de curvas / vectores por coordenadas ÍNDICE GENERAL ix / derivaciones. A pesar de las redundancias y poca economı́a lógica que esto supone, creemos que ası́ se hacen más asimilables esos conceptos. Parte II. Temas 5–7. Se estudian objetos geométricos elementales sobre una variedad diferenciable, hasta un primer contacto con la geometrı́a riemanniana. Aparte del tratamiento algebraico de campos tensoriales sobre la variedad, se introducen: (i) campos vectoriales (curvas integrales, flujos), (ii) formas diferenciales (circulación, formas cerradas y exactas) y (iii) métricas riemannianas o, con más generalidad, semiriemannianas. Ponemos especial interés en mostrar cómo, fijada una tal métrica, los conceptos asociados a formas diferenciales pueden aplicarse a campos vectoriales (y viceversa). La utilidad de las métricas riemannianas, y su fácil asimilación intuitiva, hacen que anticipemos algunos conceptos, como el de distancia asociada, que se estudian con más detalle posteriormente. Ası́, al terminar esta segunda parte, el lector habrá adquirido unas nociones mı́nimas de geometrı́a riemanniana. Parte III. Temas 8–9. Se estudia integración en variedades, tanto desde el punto de vista de la integración de n-formas diferenciales en variedades orientadas, como del de la integración de funciones en un espacio de medida, definido éste de manera natural a partir de una métrica semi-riemanniana. El motivo de desarrollar ambos enfoques se debe a que el alumno, probablemente, se tropezará antes o después con los dos, aunque en las referencias al uso suelan escoger sólo uno. Se pretende, pues, que se adquiera una visión de conjunto sobre integración. Los conceptos relacionados de álgebra exterior de formas diferenciales y orientación (para el primer enfoque) o de integración de Lebesgue (para el segundo) se explican sucintamente. En el Tema 9, dedicado al Teorema de Stokes, también desarrollamos los conceptos de derivaciones y antiderivaciones tensoriales. Muchas de las consecuencias del Teorema de Stokes tienen utilidad práctica, tanto en partes de la Fı́sica (electromagnetismo, Teorı́as de Campos...) como más puramente matemáticas (cálculo de áreas, valores propios del laplaciano...), y nos centramos en las más clásicas. La Parte III resulta independiente de la Parte IV posterior, con lo que el lector interesado en ésta puede leerla directamente después de la I y II, sin pérdida de continuidad. Parte IV. Temas 10–11. Se estudia la conexión de Levi-Civita asociada a una métrica (y, en general, conexiones afines), ası́ como sus elemen- x ÍNDICE GENERAL tos geométricos asociados: derivada covariante, geodésicas, curvatura... Estos conceptos matemáticos son más sutiles que el de métrica riemanniana, y su desarrollo histórico fue largo y complejo. De ahı́ que hayamos preferido sacrificar (parcialmente) la intuición, introduciendo los conceptos de una manera “lógicamente económica”. No obstante, se intenta justificar la naturalidad de las definiciones, aunque sea a posteriori. Ası́, p. ej., el Tema 11 concluye con un repaso puramente intuitivo del concepto de curvatura en Geometrı́a, con el objetivo de hacer más asimilable la muy abstracta definición de (tensor) curvatura de una variedad riemanniana. Concluimos con un tema introductorio a la Relatividad General (y, por completitud, también a la Especial). Se pretende ilustrar ası́ la aplicabilidad de la geometrı́a aprendida a esta parte fundamental de la Fı́sica, que la genialidad de Einstein pudo desarrollar gracias a la Geometrı́a Diferencial preexistente. No queremos terminar sin expresar nuestra gratitud a nuestros alumnos quienes, con agudas preguntas y disparatados comentarios, han ayudado en buena medida a enfocar estos apuntes. En particular, agradecemos a Jorge de Blas Mateo que nos prestara sus apuntes correspondientes al primer año en que impartimos la asignatura. Los autores somos conscientes de la no escasa dificultad que, probablemente, hallarán los alumnos a quienes en primer lugar se dirige el presente volumen. Pero les animamos a perseverar: si, como decı́a Galileo, el libro de la Naturaleza está escrito “in lingua matematica” pocas tareas resultarán tan gratificantes como dominar esta lengua. Capı́tulo 1 Topologı́a básica 1.1. Generalidades Intuitivamente la Topologı́a es la rama de las matemáticas que estudia las propiedades de los objetos que se conservan cuando estos se deforman sin “cortar” ni “pegar” (con la excepción de que es posible “cortar” si luego se “pega” por el mismo sitio). Por ejemplo, la superficie de una bola es topológicamente equivalente a la de una pelota de rugby o la de una barra, aunque no lo es a la de un toro, puesto que este último tiene un agujero. Este último es topológicamente equivalente a un toro “anudado” como el de la Figura 1. En el presente capı́tulo estudiaremos algunos preliminares topológicos, que pueden encontrarse en cualquier libro elemental de Topologı́a (p. ej., véase [AMR, Chapter 1] o [Ar]). 1 2 CAPÍTULO 1. TOPOLOGÍA BÁSICA Figura 1 Definiciones 1.1.1 Dado un conjunto X diremos que una colección de subconjuntos τ de X es una topologı́a si verifica: (i) ∅, X ∈ τ . (ii) Si U, V ∈ τ entonces U ∩ V ∈ τ (o, equivalentemente, la intersección finita de elementos de τ pertenece a τ ). (iii) La unión arbitraria de elementos de τ pertenece a τ . Al par (X, τ ) lo llamaremos espacio topológico. A cada elemento de la topologı́a τ lo llamaremos abierto. Ejemplos: (1) Dado un conjunto X definimos la topologı́a trivial de X como τ = {X, ∅}. (2) Dado un conjunto X definimos la topologı́a discreta de X como τ = P(X) (conjunto de las partes de X, esto es, colección de todos los subconjuntos de X). 1.1. GENERALIDADES 3 (3) Dado X = R definimos la topologı́a usual τ de R como la colección de todos los conjuntos que son intervalos abiertos o uniones arbitrarias de ellos. (4) Dado X = R2 definimos la topologı́a usual de R2 como la colección de todos los rectángulos sin borde ]a, b[×]a0 , b0 [ o uniones arbitrarias de ellos. Ello es claramente generalizable a Rn , n ∈ N, cuyos abiertos para la topologı́a usual se definen como uniones arbitrarias de n−rectángulos, cada uno de éstos definido como el producto cartesiano de n intervalos abiertos. Salvo especificación contraria, Rn se considerará dotado siempre de la topologı́a usual. Como ejemplo veamos que (3) es una topologı́a. Obviamente, se verifican los axiomas (i) (∅ =]a, a[, R =] − ∞, ∞[) y (iii). Por tanto, sólo resta comprobar (ii). Para ello es suficiente demostrar que si U, V son abiertos y x ∈ U ∩ V entonces existe un intervalo abierto Ix ⊆ U ∩ V tal que x ∈ Ix (pues en este caso U ∩ V = ∪x∈U ∩V Ix ∈ τ ). Como x ∈ U (resp. x ∈ V ), que es abierto, existe ]a1 , b1 [⊆ U (resp. ]a2 , b2 [⊆ V ) tal que x ∈]a1 , b1 [ (resp. x ∈]a2 , b2 [). Por tanto, basta tomar Ix =]a, b[ con a = Max{a1 , a2 }, b = Min{b1 , b2 }. Definición 1.1.2 Sea (X, τ ) un espacio topológico, decimos que A ⊆ X es cerrado si su complemento en X (es decir, X − A = {x ∈ X : x 6∈ A}) es abierto. Ejemplos: (1) ∅ y X son cerrados. (2) En R con la topologı́a usual el subconjunto [0, 1] es cerrado ya que R − [0, 1] =] − ∞, 0[∩]1, ∞[ es abierto. Sin embargo, los subconjuntos [0, 1[ y ]0, 1[∪[2, 7] no son cerrados ni abiertos. (3) En un conjunto arbitrario X con la topologı́a trivial los únicos subconjuntos cerrados o abiertos son ∅ y X. (4) En un conjunto arbitrario X con la topologı́a discreta todo subconjunto es cerrado y abierto. (5) En R3 se ha definido la topologı́a usual como la colección de todos los subconjuntos del tipo ]a1 , b1 [×]a2 , b2 [×]a3 , b3 [ (3-rectángulos) 4 CAPÍTULO 1. TOPOLOGÍA BÁSICA o uniones arbitrarias de ellos. No es difı́cil comprobar que la esfera unidad S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} ⊂ R3 es un cerrado. Las propiedades de los cerrados se deducen inmediatamente de las definiciones: (1) ∅ y X son cerrados. (2) La intersección arbitraria de cerrados es un cerrado. (3) Si U y V son cerrados entonces U ∪ V también lo es (o, equivalentemente, la unión finita de cerrados es un cerrado). Definiciones 1.1.3 Sea (X, τ ) un espacio topológico. Un entorno abierto de x ∈ X es un abierto U tal que x ∈ U . Un entorno de x es un conjunto N ⊆ X que contiene a un entorno abierto de x. Definiciones 1.1.4 Sean (X, τ ) un espacio topológico, A ⊆ X y x ∈ X. Diremos que: (1) x es un punto interior de A si existe un entorno de x incluido en A. Usaremos la notación Å= {x ∈ A : x es punto interior de A}. (2) x es un punto adherente de A si todo entorno de x interseca a A. Usaremos la notación A = {x ∈ X : x es punto adherente de A}. Se dice que A es denso en X is A = X. (3) x es un punto frontera de A si es adherente de A y de X − A. Usaremos la notación ∂A = {x ∈ X : x es punto frontera de A}. (4) x es un punto de acumulación de A si todo entorno de x interseca a A en puntos distintos de x. Usaremos la notación A0 = {x ∈ X : x es punto de acumulación de A}. (5) x es un punto aislado de A si existe un entorno N de x tal que N ∩ A = {x}. Usaremos la notación Ais(A) = {x ∈ A : x es punto aislado de A}. Ejercicio. Clasifı́quense los puntos del subconjunto A ⊂ R2 de la Figura 2 definido como la unión del punto p, la curva γ (con un extremo incluido) y la región interior de la curva ρ junto con parte de esta curva. Algunas propiedades inmediatas: 1.2. CONSTRUCCIÓN DE TOPOLOGÍAS 5 Figura 2 (1) Å ⊆ A ⊆ A (2) ∂A = A ∩ (X − A) (3) A = A ∪ ∂A =Å∪∂A (4) Å coincide con la unión de todos los abiertos incluidos en A (Å es el abierto “más grande” incluido en A). (5) A coincide con la intersección de todos los cerrados que contienen a A (A es el “menor cerrado” que contiene a A). Ejercicio. Clasifı́quense los puntos del conjunto A = [0, 1[∪{7}∪ (] − 3, 0[−] − 2, −1[) ⊂ R. Ejercicio. Clasifı́quense los puntos de un subconjunto arbitrario A ⊆ X con cardinal mayor que 1 cuando se considera para X: (i) la topologı́a discreta, (ii) la topologı́a trivial. 1.2. Algunos modos de construcción de topologı́as Existen diferentes modos de definir una topologı́a sobre un conjunto X que pueden ser útiles dependiendo de la manera en que viene dado dicho conjunto: 6 CAPÍTULO 1. TOPOLOGÍA BÁSICA A. Bases topológicas. Dado un espacio topológico (X, τ ) una base topológica o de entornos suya es un conjunto de abiertos B ⊆ τ tal que todo abierto (no vacı́o) U ∈ τ se puede expresar como unión de elementos de B. Ejemplos: (1) En R con la topologı́a usual una base topológica es la colección de todos los intervalos abiertos de R. (2) En Rn con la topologı́a usual una base topológica es la colección de todos los n-rectángulos abiertos de Rn . (3) En Rn con la topologı́a usual una base topológica es la colección de todas las bolas abiertas Bp (r) = {x ∈ Rn : kx − pk < r}, p ∈ Rn , r > 0. No es difı́cil comprobar que, dado un conjunto X y una colección arbitraria B de subconjuntos de X tal que X = ∪B∈B B, se verifica: B es una base topológica para alguna topologı́a τ de X si y sólo si para cualesquiera B1 , B2 ∈ B la intersección B1 ∩ B2 se puede escribir como unión de elementos de B. En este caso1 , τ está determinada de manera única, y sus abiertos se construyen como uniones de elementos de B. B. Subespacios topológicos. Dado un espacio topológico (X, τ ) y un subconjunto A ⊆ X definimos la topologı́a inducida en A por τ como la topologı́a de A: τA = {A ∩ U : U ∈ τ }. Ası́ todo subconjunto arbitrario de R3 (por ejemplo, superficies como la esfera S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}) tiene una topologı́a natural, que es la inducida por la usual de R3 . Cabe destacar que los abiertos de A con τA no tienen por qué ser abiertos de X con τ . Ası́, p. ej.: (a) los abiertos de S 2 no lo son de R3 (salvo el ∅), o (b) un abierto de [0, 1] (con la topologı́a inducida de R) es ]1/2, 1]. C. Topologı́a producto. Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos, se define la topologı́a producto en X × X 0 como aquella topologı́a 1 En el caso de que no se verificara esta condición, se puede demostrar que los elementos de B junto con las intersecciones finitas de ellos (y, eventualmente, el total X), determinan una base topológica; se dice entonces que B es una subbase topológica. La topologı́a ası́ generada se puede caracterizar como la menos fina (la que tiene menos abiertos) de entre las que contienen a B o, equivalentemente, como la intersección de todas las topologı́as que contienen a B 1.2. CONSTRUCCIÓN DE TOPOLOGÍAS 7 que admite por base topológica los productos U × U 0 , donde U, U 0 son abiertos de τ, τ 0 , respectivamente. Por ejemplo, la topologı́a usual de R2 coincide con la topologı́a producto de R × R. D. Topologı́a cociente. Dado un espacio topológico (X, τ ) y una relación de equivalencia ∼ definida en X, sea X/ ∼ el conjunto cociente, esto es, el conjunto de todas las clases de equivalencia, y π la proyección canónica, es decir, π : X → X/ ∼ x 7→ [x], donde [x] denota la clase de equivalencia de x. Definimos la topologı́a cociente en X/ ∼ como aquélla que tiene por abiertos los subconjuntos del tipo U ⊂ X/ ∼ tales que π −1 (U ) es un abierto de τ . En efecto, es inmediato comprobar que ası́ se define una topologı́a, usando: (i) π −1 (∅) = ∅, π −1 (X/ ∼) = X, (ii) π −1 (U ∩ V ) = π −1 (U ) ∩ π −1 (V ) y (iii) π −1 (∪α Uα ) = ∪α π −1 (Uα ). Ejemplos: (1) En X = [0, 1] ⊂ R definimos la relación de equivalencia: x ∼ x para todo x ∈ [0, 1] y 0 ∼ 1, 1 ∼ 0. El espacio topológico cociente se puede visualizar como2 una circunferencia. (2) En X = R2 definimos la relación de equivalencia (x, y) ∼ (x0 , y 0 ) si x − x0 ∈ Z y y − y 0 ∈ Z. El espacio topológico cociente R2 / ∼ se puede visualizar como un toro. (3) En el subespacio topológico [0, 1] × [0, 1] de R2 se considera la relación de equivalencia que se obtiene a partir de identificar cada (0, y) con (1, y), ∀y ∈ [0, 1]. El cociente puede visualizarse como un cilindro (con “borde” y sin “tapas”). Si se considera la relación de equivalencia que se obtiene a partir de identificar cada (0, y) con (1, 1−y) el cociente puede visualizarse como la popular cinta de Moebius (que es una superficie de R3 con una sola cara, un solo borde, y para la que no existe una elección continua posible 2 De manera rigurosa, la expresión “poder visualizar como” significa “ser homeomorfo a” (siendo el codominio del homeomorfismo un subespacio topológico de R3 ); véase la Definición 1.5.3. 8 CAPÍTULO 1. TOPOLOGÍA BÁSICA de un vector normal en cada punto). Si en la cinta de Moebius además se identifica cada (x, 0) con (x, 1) el cociente (botella de Klein) no puede visualizarse propiamente como una superficie de R3 . 1.3. Axiomas de numerabilidad Una condición implı́cita en muchas topologı́as es la siguiente: Definición 1.3.1 Un espacio topológico (X, τ ) verifica el segundo axioma de numerabilidad (ANII) si admite una base topológica numerable, es decir, finita o con el cardinal de N. Aún más, esta condición puede relajarse: Definición 1.3.2 Un espacio topológico (X, τ ) verifica el primer axioma de numerabilidad (ANI) si cada punto x ∈ X admite una base numerable de entornos, esto es, una sucesión de entornos abiertos {Un }n (que puede elegirse de manera que Un+1 ⊂ Un para todo n) tal que: para todo entorno N de x existe un n ∈ N tal que Un ⊂ N . Observaciones: (1) No es difı́cil comprobar: ANII⇒ANI. De hecho, la sucesión {Un }n desempeña el papel de “base topológica numerable” alrededor de x. (2) R (y, en general, Rn ) con la topologı́a usual es ANII (y, por tanto, ANI). En efecto, una base numerable de la topologı́a usual de R es B = {]x−², x+²[: x, ² ∈ Q} (recordemos que Q es numerable). (3) R con la topologı́a discreta es ANI pero no es ANII. En efecto, dado x ∈ R tómese, en la definición de ANI, Un ≡ {x} ∀ n ∈ N. Sin embargo, cualquier base de la topologı́a discreta de R debe contener a cada uno de los números reales como abierto suyo y, por tanto, no puede ser numerable (el cardinal de R es mayor que el de N). 1.4. LÍMITES. ESPACIOS HAUSDORFF 1.4. 9 Lı́mites. Espacios Hausdorff Definición 1.4.1 Sea (X, τ ) un espacio topológico y {xn }n ⊆ X una sucesión de elementos de X. Diremos que {xn }n converge a x ∈ X si para todo entorno N de x existe un n0 ∈ N tal que xn ∈ N para todo n ≥ n0 . En este caso diremos que x es un lı́mite de {xn }n y escribiremos {xn }n → x. Ejemplos: (1) La sucesión {1/n}n ⊂ R converge a 0 con la topologı́a usual. (2) Consideremos en un conjunto X la topologı́a trivial. Entonces cualquier sucesión de X converge a cualquier elemento de X. Ası́, el lı́mite de una sucesión puede no ser único. El problema de la posible falta de unicidad de los lı́mites, entre otros, se evita con el siguiente concepto. Definición 1.4.2 Se dice que un espacio topológico (X, τ ) es Hausdorff (ó T2 ) si para cualesquiera x, y ∈ X x 6= y, existen entornos Nx , Ny de x e y, respectivamente, tales que Nx ∩ Ny = ∅. Proposición 1.4.3 En todo espacio topológico Hausdorff (X, τ ) el lı́mite de una sucesión convergente es único. Demostración. Supongamos, por reducción al absurdo, que una sucesión {xn }n ⊆ X satisface {xn }n → x, {xn }n → y, siendo x 6= y. Como X es Hausdorff existen entornos Nx , Ny de x e y respectivamente que son disjuntos. En consecuencia, existe un n0 (resp. n00 ) tal que xn ∈ Nx (resp. xn ∈ Ny ) si n ≥ n0 (resp. n ≥ n00 ). Entonces, si n = Max{n0 , n00 } tenemos que xn ∈ Nx ∩ Ny , lo que contradice que Nx ∩ Ny = ∅. 2 Es inmediato comprobar que todo subespacio topológico de un espacio topológico Hausdorff es también Hausdorff. Ejemplos: (1) Rn con la topologı́a usual (y todos sus subconjuntos con la topologı́a inducida) es Hausdorff. (2) Obviamente, ningún conjunto X con cardinal mayor que uno y dotado de la topologı́a trivial es Hausdorff. Todo conjunto con la topologı́a discreta es Hausdorff. 10 CAPÍTULO 1. TOPOLOGÍA BÁSICA (3) Sea X = R ∪ {00 } donde 00 es un elemento que no pertenece a R, y consideremos la topologı́a que tiene por base la colección formada por: (a) los abiertos de R (con la topologı́a usual) y (b) los subconjuntos que resultan de tomar los abiertos de R que contienen al 0, y reemplazar 0 por 00 . Esta topologı́a no es Hausdorff: los puntos 0 y 00 no se pueden “separar” por entornos. 1.5. Continuidad Definición 1.5.1 Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos y f : X → X 0 una aplicación entre ellos. Se dice que f es continua en x0 ∈ X si para todo entorno abierto U 0 de f (x0 ) existe un entorno abierto U de x0 tal que f (U ) ⊆ U 0 . Diremos que f es continua si lo es en todos los puntos de X (véase la Figura 3). Figura 3 Por supuesto, en la definición anterior podemos reemplazar la expresión “entorno abierto” por “entorno” (compruébese). También es fácil comprobar: Proposición 1.5.2 Una aplicación entre dos espacios topológicos f : X → X 0 es continua si y sólo si f −1 (U 0 ) es abierto de (X, τ ) para todo abierto U 0 de (X 0 , τ 0 ). 1.5. CONTINUIDAD 11 Definición 1.5.3 La aplicación f : X → X 0 se dice que es un homeomorfismo si es biyectiva y tanto f como f −1 son continuas. Dos espacios topológicos (X, τ ), (X 0 , τ 0 ) son homeomorfos si existe un homeomorfismo entre ellos (f : X → X 0 o, equivalentemente, g : X 0 → X). El concepto de homeomorfismo es uno el modo riguroso de expresar la idea de cuándo dos espacios topológicos son “equivalentes” y que tratábamos de apuntar con ideas intuitivas al principio de este capı́tulo, como las de que dos espacios topológicos son “equivalentes” si se pueden obtener uno de otro deformando sin cortar ni pegar3 . Dos espacios topológicos homeomorfos poseen las mismas propiedades topológicas. Observaciones: Sean (X, τ ), (X 0 , τ 0 ) y (X 00 , τ 00 ) tres espacios topológicos. (1) La composición g ◦ f : X → X 00 de dos aplicaciones continuas f : X → X 0 y g : X 0 → X 00 es también continua. (2) La restricción f |A⊆X : A → X 0 de una aplicación continua f : X → X 0 es también continua (consideramos la topologı́a inducida en A por X). Ası́, por ejemplo, la inclusión i : A ⊆ X → X es continua ya que coincide con la restricción a A de la aplicación identidad en X. También son continuas las aplicaciones ix00 : X → X × X 0 x 7→ (x, x00 ) ix0 : X 0 → X × X 0 x0 7→ (x0 , x0 ). para cada x00 ∈ X 0 , x0 ∈ X. (3) En el espacio topológico producto de (X, τ ) y (X 0 , τ 0 ) son continuas las proyecciones: p : X × X0 → X (x, x0 ) 7→ x p0 : X × X 0 → X 0 (x, x0 ) 7→ x0 . En efecto, la continuidad de p es consecuencia de que si U es un abierto de (X, τ ) entonces f −1 (U ) = U × X 0 es un abierto de X × X 0. 3 Otro concepto relevante en este contexto es el de equivalencia homotópica, en el que no entraremos. 12 CAPÍTULO 1. TOPOLOGÍA BÁSICA (4) Si (X, τ ) es un espacio topológico entonces la proyección π : X → X/ ∼ es continua (consideramos la topologı́a cociente para X/ ∼). En efecto, por la definición de la topologı́a cociente, si U es un abierto de X/ ∼ entonces π −1 (U ) es un abierto de X. Más aún, dado otro espacio topológico (X 0 , τ 0 ), una aplicación f : (X/ ∼) → X 0 será continua si y sólo si lo es la composición f ◦ π : X → X 0. Ejercicio. (1) Sean (X, τ ) un espacio topológico ANI, A ⊆ X y x ∈ X. Pruébese que x ∈ A si y sólo si existe una sucesión {xn }n ⊆ A que converge a x. (2) Sea f : X → X 0 una aplicación entre dos espacios topológicos siendo (X, τ ) ANI, y sea x0 ∈ X. Pruébese que f es continua en x0 si y sólo si para toda sucesión {xn }n ⊆ X que converge a x0 la sucesión {f (xn )}n converge a f (x0 ). (3) Compruébese que la relación “ser homeomorfo a” en la clase de todos los espacios topológicos es de equivalencia. 1.6. Espacios topológicos métricos En el espacio euclı́deo Rn estamos familiarizados con el uso de la P distancia (usual) definida por d0 (x, y) = ( ni=1 (xi −yi )2 )1/2 , siendo x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) dos puntos cualesquiera de Rn . Veamos cómo se puede generalizar este concepto a conjuntos arbitrarios: Definición 1.6.1 En un conjunto X definimos una distancia o métrica como una aplicación d : X × X → R que verifica: (i) d(x, y) ≥ 0 para todo x, y ∈ X, con igualdad si y sólo si x = y. (ii) d(x, y) = d(y, x) para todo x, y ∈ X. (iii) d(x, z) ≤ d(x, y) + d(y, z) para todo x, y, z ∈ X. En este caso al par (X, d) se le llama espacio métrico. Es inmediato comprobar que cada A ⊂ X hereda una distancia por restricción de d a A × A. Se dice entonces que A (o, más propiamente, A con la restricción de la distancia) es un subespacio métrico de X. 1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS 13 Ejemplo. Una distancia en R2 muy distinta a la usual es la siguiente aplicación d0 : R2 × R2 → R (“distancia de la Renfe”): ½ kx − yk si x, y están en una recta que pasa por (0, 0), 0 d (x, y) = kxk + kyk en caso contrario. Definiciones 1.6.2 Sea (X, d) un espacio métrico y x0 ∈ X. Definimos la bola abierta de centro x0 y radio r ≥ 0 como Bx0 (r) = {x ∈ X : d(x, x0 ) < r}. Análogamente, definimos la bola cerrada de centro x0 y radio r ≥ 0 como B x0 (r) = {x ∈ X : d(x, x0 ) ≤ r}. Definición 1.6.3 Sea (X, d) un espacio métrico. Llamaremos topologı́a métrica asociada a (o inducida por) d en X a aquélla que admite por base topológica todas las bolas abiertas (de cualquier centro y de cualquier radio) para dicha métrica. Ejercicio. (1) Pruébese que las bolas abiertas constituyen, efectivamente, una base para una topologı́a. (2) Sea U un abierto de (X, d) para la topologı́a métrica. Pruébese que para todo x ∈ U existe un ² > 0 tal que Bx (²) ⊂ U . Es fácil comprobar que la topologı́a inducida por una métrica es siempre ANI y Hausdorff, aunque no necesariamente ANII. Ejemplo. Sea X un conjunto y consideremos la distancia ½ 0 si x = y, d(x, y) = 1 si x 6= y. La topologı́a asociada a d es la discreta. Por tanto, si X no es numerable, la topologı́a asociada no resultará ANII. Un espacio topológico (X, τ ) se dice metrizable si existe alguna distancia d cuya topologı́a métrica sea τ . Estaremos especialmente interesados en tales espacios topológicos, pero destaquemos que, en general, la distancia d no está fijada de modo único o canónico por τ . Ejemplo. En R2 (y en cualquier Rn ) la topologı́a métrica asociada a la distancia usual d0 es la topologı́a usual. Considérese la nueva distancia sobre R2 , d((x, y), (x0 , y 0 )) = |x − x0 | + |y − y 0 | (¿cómo son sus bolas?). La topologı́a métrica asociada a d también coincide con la usual. Sin 14 CAPÍTULO 1. TOPOLOGÍA BÁSICA embargo, la topologı́a métrica asociada a la “distancia de la Renfe” d0 es diferente. Todo espacio métrico (X, d) se considerará siempre como espacio topológico métrico, esto es, como una terna (X, d, τ ) donde τ es la topologı́a métrica asociada a d. Para espacios topológicos métricos podemos reescribir los conceptos de lı́mite y continuidad. Las siguientes dos proposiciones se pueden comprobar con facilidad. Proposición 1.6.4 Sea (X, d) un espacio métrico. Una sucesión {xn }n ⊆ X converge a x0 ∈ X si y sólo si para todo ² > 0 existe un n0 ∈ N tal que si n ≥ n0 entonces d(xn , x0 ) < ². Nótese que el lı́mite, si existe, es único pues la topologı́a métrica es Hausdorff. Proposición 1.6.5 Sean (X, d), (X 0 , d0 ) dos espacios métricos, f : X → X 0 una aplicación y x0 ∈ X. Son equivalentes: (i) f es continua en x0 . (ii) Si {xn }n ⊆ X converge a x0 entonces {f (xn )}n converge a f (x0 ). (iii) Para todo ² > 0 existe un δ > 0 tal que si d(x, x0 ) < δ entonces d0 (f (x), f (x0 )) < ². Nótese que la equivalencia entre (i) y (ii) se mantiene en todo espacio topológico ANI (véase el ejercicio de la Sección 1.5). Definición 1.6.6 De un homeomorfismo f : X → X 0 entre dos espacios métricos (X, d), (X 0 , d0 ) que verifique d(x, y) = d0 (f (x), f (y)), para todo x, y ∈ X, se dice que es una isometrı́a. En este caso, se dice que los dos espacios métricos son isométricos. Espacios métricos isométricos tienen iguales todas sus propiedades relativas a la distancia. La relación “ser isométrico a” en la clase de todos los espacios métricos es de equivalencia. Ejercicio. Compruébese que, en la definición de isometrı́a, la inyectividad de f , y la continuidad tanto de f como de su inversa, se pueden deducir del resto de las condiciones. Dos conceptos que podemos definir en espacios métricos pero no en topológicos son los siguientes de sucesión de Cauchy y completitud. 1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS 15 Definición 1.6.7 Sea (X, d) un espacio métrico. Diremos que una sucesión {xn }n ⊆ X es de Cauchy si para todo ² > 0 existe un n0 ∈ N tal que si n, m ≥ n0 entonces d(xn , xm ) < ². Claramente toda sucesión convergente es de Cauchy, pero el recı́proco no es cierto. Definición 1.6.8 Se dice que un espacio métrico (X, d) es completo si toda sucesión de Cauchy es convergente. Ejemplos: (1) El espacio euclı́deo Rn con la distancia usual es completo. Con la topologı́a inducida sus bolas cerradas B x0 (r) son completas (y las abiertas Bx0 (r) no, para ningún x0 ∈ Rn , r > 0). (2) El conjunto de los números racionales Q con la distancia inducida por la usual de R no es completo4 . Obsérvese que los conceptos de completitud o de sucesión de Cauchy dependen (a diferencia de los de convergencia o continuidad) no sólo de la topologı́a sino también de la métrica. Ası́, aunque varias distancias generen la misma topologı́a métrica τ , una misma sucesión {xn }n puede ser de Cauchy para una de ellas y no para las otras. Pero {xn }n será convergente si y sólo si lo es para la topologı́a τ ; por tanto, si {xn }n es convergente también será de Cauchy para todas las métricas con topologı́a métrica asociada τ . Ejercicio. Se dice que una aplicación entre dos espacios métricos f : X → X 0 es uniformemente continua si ∀² > 0, ∃δ > 0 : d(x, y) < δ ⇒ d0 (f (x), f (y)) < ². Compruébese que si f es uniformemente continua: (a) es continua, y (b) la imagen por f de una sucesión de Cauchy en (X, d) es una sucesión de Cauchy en (X 0 , d0 ). Muéstrese con un contraejemplo que si f verifica (a) y (b) no tiene por qué ser uniformemente continua. De hecho, R puede verse como la “completación” de Q -intuitivamente, como el espacio que se obtiene añadiendo a Q el mı́nimo de puntos necesarios para obtener un espacio completo-; el concepto de completación se puede generalizar a cualquier espacio métrico. 4 16 1.7. CAPÍTULO 1. TOPOLOGÍA BÁSICA Conexión y arcoconexión Definición 1.7.1 Decimos que un espacio topológico (X, τ ) es conexo si los únicos subconjuntos de X que son a la vez abiertos y cerrados son el vacı́o y el total. Observación. Nótese que encontrar un subconjunto A ⊆ X, A 6= ∅, X que sea abierto y cerrado equivale a encontrar dos subconjuntos de X abiertos (o cerrados) U, V no vacı́os, disjuntos y tales que X = U ∪ V . Por ejemplo, en R3 el subconjunto A definido como la unión de una esfera y un plano que no sean tangentes ni secantes es no conexo. Definición 1.7.2 Sea (X, τ ) un espacio topológico y A ⊆ X. Diremos que A es una parte o componente conexa de X si el único subconjunto conexo de X que contiene a A es el propio A. Por ejemplo, las componentes conexas de Q son cada uno de sus elementos ya que ningún subconjunto A ⊆ Q con más de un elemento es conexo. En efecto, sean r1 , r2 ∈ A, r1 < r2 , y sea a ∈ R − Q con r1 < a < r2 . En ese caso, los subconjuntos no vacı́os U =] − ∞, a[∩A y V =]a, ∞[∩A son abiertos de A, disjuntos y tales que A = U ∪ V , por tanto, A no es conexo. Supondremos conocido de la estructura de R que los subconjuntos conexos de R coinciden con los intervalos (de cualquier tipo: abiertos, cerrados, semiabiertos, acotados, no acotados...). Ejercicio. Sea X un conjunto con cardinal mayor que 1 y considérense las topologı́as trivial y discreta. ¿Con cuáles de ellas es X conexo? Definición 1.7.3 Dado un espacio topológico (X, τ ) definimos un arco ϕ en X como una aplicación continua ϕ : [a, b] → X, −∞ < a < b < ∞. Si x = ϕ(a) y y = ϕ(b) diremos que dicho arco conecta x con y. En esta definición se puede normalizar el dominio de los arcos suponiendo siempre [a, b] = [0, 1]. Definición 1.7.4 Un espacio topológico (X, τ ) se dice que es arcoconexo si cualesquiera x, y ∈ X se pueden conectar con un arco en X. 1.7. CONEXIÓN Y ARCOCONEXIÓN 17 Un ejemplo sencillo de espacio topológico arcoconexo (y, por tanto conexo; véase la siguiente proposición) es Rn con la topologı́a usual. En efecto, para cualesquiera x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn el arco (segmento cerrado) ϕ : [0, 1] → Rn , ϕ(t) = x − t(x − y) conecta x con y. Proposición 1.7.5 Todo espacio topológico (X, τ ) arcoconexo es conexo. Demostración. Supongamos, por reducción al absurdo, que no es conexo. Entonces existen abiertos disjuntos no vacı́os U, V tales que X = U ∪ V . Como X es arcoconexo existe un arco ϕ : [0, 1] → X que conecta x ∈ U con y ∈ V . En consecuencia, los subconjuntos ϕ−1 (U ) y ϕ−1 (V ) son abiertos de [0, 1] (ya que ϕ es continua), disjuntos (ya que U ∩ V = ∅), no vacı́os (0 ∈ ϕ−1 (U ),1 ∈ ϕ−1 (V )) y tales que [0, 1] = ϕ−1 (U ) ∪ ϕ−1 (V ) (ya que X = U ∪ V ), lo que contradice que el intervalo [0, 1] es conexo. 2 Ejemplo. El subconjunto X = {(x, y) ∈ R2 : y = sen πx , 0 < x ≤ 1} ∪ {(0, y) : −1 ≤ y ≤ 1} ⊂ R2 con la topologı́a inducida de R2 es un ejemplo tı́pico de espacio topológico conexo que no es arcoconexo (véase la Figura 4). Figura 4 18 CAPÍTULO 1. TOPOLOGÍA BÁSICA Teorema 1.7.6 Sean (X, τ ), (X 0 , τ 0 ) espacios topológicos y f : X → X 0 una aplicación continua. Si X es conexo entonces f (X) también es conexo. Demostración. Supongamos, por reducción al absurdo, que f (X) no es conexo. Entonces existen abiertos disjuntos U 0 , V 0 ⊆ X 0 tales que f (X) ⊆ U 0 ∪ V 0 , U 0 ∩ f (X) 6= ∅ y V 0 ∩ f (X) 6= ∅. Como f es continua, U = f −1 (U 0 ) y V = f −1 (V 0 ) son abiertos no vacı́os de X. Además, U ∩ V = ∅ y X = U ∪ V . Luego X no es conexo, lo que contradice nuestra hipótesis. 2 Obsérvese que el Teorema de Bolzano clásico se obtiene de este resultado sin más que tomar X = [a, b], X 0 = R y suponer f (a) · f (b) < 0. En efecto, en ese caso al ser f ([a, b]) un conexo de R, este conjunto tiene que ser otro intervalo y, necesariamente, 0 pertenecerá a él. Ejercicio. Pruébese que si f : X → X 0 es continua y X es arcoconexo entonces f (X) es arcoconexo. 1.8. Compacidad Definición 1.8.1 Dado un espacio topológico (X, τ ) llamamos recubrimiento abierto U de (X, τ ) a una colección de abiertos de X cuya unión sea todo X. Un subrecubrimiento de U es un subconjunto Ũ ⊆ U tal que Ũ también es un recubrimiento abierto de X. Definición 1.8.2 Decimos que un espacio topológico (X, τ ) es compacto si para todo recubrimiento abierto suyo U existe un subrecubrimiento U f ⊆ U con un número finito de elementos. Dos propiedades tı́picas de los espacios compactos son las siguientes: Proposición 1.8.3 Sea (X, τ ) un espacio topológico compacto: (1) Si A ⊆ X es cerrado entonces A es compacto. (2) Si (X 0 , τ 0 ) es otro espacio topológico y f : X → X 0 es continua entonces Imf = {f (x) : x ∈ X}(= f (X)) es compacto. 1.8. COMPACIDAD 19 Demostración. (1) Nótese que cada abierto UA de A se puede escribir como UA = U ∩ A, donde U es un abierto de X. Dado cualquier recubrimiento abierto de A, UA , consideremos el conjunto U formado por los abiertos U de X con U ∩ A ∈ UA . Como A es cerrado, X − A es un abierto de X; por tanto, U ∪ (X − A) es un recubrimiento abierto de X. Al ser X compacto, podemos extraer un subrecubrimiento finito U f de U ∪ {X − A}, y el conjunto UAf = {U ∩ A|U ∈ (U f − (X − A))} es un subrecubrimiento finito de UA . (2) Para cualquier recubrimiento abierto U 0 de f (X), se considera el recubrimiento abierto de X: U = {f −1 (U 0 )|U 0 ∈ U 0 }. Tomando ahora un subrecubrimiento finito de U y, para cada abierto Ui , i = 1, . . . k, de este subrecubrimiento, un abierto Ui0 ∈ U 0 con f (Ui ) = Ui0 , se extrae el subrecubrimiento finito {U10 , . . . , Uk0 } de U 0 . 2 Proposición 1.8.4 Sea (X, τ ) un espacio topológico Hausdorff. Si K ⊆ X es compacto entonces K es cerrado en X. Demostración. Probaremos que X − K es abierto. Para ello, basta con demostrar que, fijado y ∈ X − K existe un entorno abierto Uy tal que Uy ∩ K = ∅. Por ser X Hausdorff para cada x ∈ K existen entornos abiertos Ux , Ux0 de x e y, respectivamente, tales que Ux ∩ Ux0 = ∅. En consecuencia, UK = {Ux ∩ K : x ∈ K} es un recubrimiento abierto de K. Pero como K es compacto podemos extraer un subrecubrimiento finito UKf = {Ux1 ∩ K, . . . , Uxn ∩ K}. Por tanto, un entorno abierto de y que satisface las propiedades requeridas es Uy = Ux0 1 ∩· · ·∩Ux0 n ⊆ X−K. 2 Relacionada con la compacidad se halla la siguiente propiedad. Definición 1.8.5 Un espacio topológico (X, τ ) se dice que es secuencialmente compacto si cualquier sucesión {xn }n ⊆ X admite una parcial5 convergente. En los espacios topológicos que nos interesarán, compacidad y compacidad secuencial coinciden. Teorema 1.8.6 (Bolzano-Weierstrass). Sea (X, τ ) un espacio topológico metrizable y ANII. Entonces, X es compacto si y sólo si X es secuencialmente compacto. Esto es, una sucesión del tipo {xσ(n) }n , donde σ : N → N es una aplicación estrictamente creciente. 5 20 CAPÍTULO 1. TOPOLOGÍA BÁSICA La prueba, bajo hipótesis más refinadas, puede consultarse, por ejemplo, en [AMR, Proposition 1.5.5]. Ejercicio. Sea (X, d) un espacio métrico. Demuéstrese: (i) si una sucesión de Cauchy admite una parcial convergente entonces converge; (ii) si (X, d) es secuencialmente compacto entonces debe ser completo. Analicemos con más detalle el concepto de compacidad en espacios métricos. Definiciones 1.8.7 Sea (X, d) un espacio métrico y ∅ 6= A ⊆ X. Definimos el diámetro de A como diam(A) =Sup{d(x, y) : x, y ∈ A} ∈ [0, ∞]. Ası́, diremos que A está acotado si diam(A) < ∞. Nótese que el diámetro de las bolas (abiertas o cerradas) de Rn es dos veces su radio. Proposición 1.8.8 Sea (X, d) un espacio métrico y K ⊆ X compacto. Entonces K es cerrado y acotado. Demostración. Por la Proposición 1.8.4, K es cerrado (recordemos que todo espacio métrico es Hausdorff). Para probar que es acotado, fijemos xo ∈ K y consideremos su recubrimiento abierto UK = {Bx0 (n) ∩ K : n ∈ N}. Como K es compacto podemos extraer un subrecubrimiento finito y, por tanto, K ⊂ Bx0 (n0 ) para algún n0 . Luego diam(K) ≤diam(Bx0 (n0 )) ≤ 2n0 . 2 Señalemos que, en general, no es cierto que si K ⊆ X es cerrado y acotado ello implique que sea compacto (por ejemplo, tómese K = X = R con la distancia d(x, y) = 1 si x 6= y)6 . Sin embargo, ello ocurre en Rn con la topologı́a usual, esto es : Teorema 1.8.9 (Heine-Borel) Los conjuntos compactos de Rn son los cerrados y acotados. La demostración no es difı́cil teniendo en cuenta: (a) por la Proposición 1.8.3 basta con probar que un n-rectángulo cerrado y acotado [a1 , b1 ]×· · ·×[an , bn ] que contenga A es compacto, (b) [a1 , b1 ] es secuencialmente compacto y, razonando inductivamente tomando sucesiones parciales, el n-rectángulo también lo será, (c) por el Teorema 1.8.6, el 6 Menos trivialmente: en un espacio de Hilbert de dimensión ∞ la bola cerrada de centro el vector 0 y radio 1 no es compacta. 1.8. COMPACIDAD 21 n-rectángulo es compacto (más detalles pueden consultarse, p. ej., en [AMR, 1.5.9]). Corolario 1.8.10 Sea (X, τ ) un espacio topológico compacto y f : X → R continua. Entonces f admite un máximo y un mı́nimo absolutos. Demostración. En efecto, como X es compacto también lo es su imagen f (X) ⊂ R (Proposición 1.8.3(2)). Entonces f (X) es cerrada y acotada. Por ser acotada Supf < ∞ y, por ser cerrada, Supf = Maxf (para el mı́nimo absoluto se razona análogamente). 2 En particular, este resultado se da cuando X = [a, b], generalizándose una propiedad elemental conocida de las funciones continuas. 22 CAPÍTULO 1. TOPOLOGÍA BÁSICA Capı́tulo 2 El concepto de variedad diferenciable 2.1. Concepto de variedad topológica Definición 2.1.1 Una variedad topológica de dimensión n ∈ N es un espacio topológico Hausdorff y ANII1 Q(≡ (Q, τ )), Q 6= ∅, que es localmente homeomorfo a Rn en el siguiente sentido (véase la Figura 5): para cada punto p ∈ Q existen un entorno abierto U de p y un abierto Θ de Rn que son homeomorfos, esto es, tales que ∃ ϕ : U → Θ ⊆ Rn homeomorfismo. Dada una variedad topológica Q, introducimos los siguientes conceptos: – (U, ϕ) es un entorno coordenado de p (o bien, una carta coordenada o unas coordenadas locales alrededor de p). – Sea π i : Rn → R, π i (x1 , . . . , xn ) = xi , entonces a q i ≡ π i ◦ϕ : U ⊆ Q → R le llamaremos coordenada i-ésima. También usaremos la notación (U, ϕ) ≡ (U, q 1 , . . . , q n ). 1 Muchos autores no imponen el requisito de ser ANII. En la práctica, para nosotros, no será restrictivo (véase la Observación (4) más adelante). 23 24CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE Figure 5 – Una colección de entornos coordenados A = {(Uα , ϕα ) : α ∈ I} es un atlas (topológico) si Q = ∪α∈I Uα . Observaciones: (1) En la definición se ha supuesto que la dimensión es un número natural (n ≥ 1). Como caso lı́mite admitiremos n = 0 asumiendo R0 := {1} (si Q es localmente homeomorfo a R0 entonces tendrá la topologı́a discreta). (2) La dimensión de la variedad es única, porque un espacio topológico no puede ser localmente homeomorfo a Rn y Rm , n 6= m a la vez. Esto se debe a que ningún abierto (6= ∅) de Rn puede ser homeomorfo a ningún abierto de Rm . Aunque muy intuitivo, la prueba de este resultado no es en absoluto trivial2 . (3) Un espacio topológico que sea localmente homeomorfo a Rn puede no ser Hausdorff. De hecho, el ejemplo no trivial de espacio topológico no Hausdorff que vimos en el capı́tulo anterior, al final de la Sección 1.4, prueba que ser localmente homeomorfo a R no implica ser Hausdorff. 2 Es una consecuencia de un resultado clásico en Topologı́a, el Teorema de Invariancia Dominio. Sin embargo, la unicidad de la dimensión de las variedades diferenciables, que estudiaremos más adelante, sı́ se puede probar con facilidad a partir del Teorema de la Función Inversa. 2.1. CONCEPTO DE VARIEDAD TOPOLÓGICA 25 (4) La hipótesis relativa al axioma ANII puede no imponerse en principio, si bien otras hipótesis “muy razonables” pueden acabar implicándolo. De hecho, es posible demostrar que, fijadas las otras hipótesis de la definición de variedad, equivale exigir: (1) Q es ANII y (2) la topologı́a de Q es metrizable con un conjunto numerable de partes conexas3 . Ejercicio. Sea (Q, τ ) un espacio topológico localmente homeomorfo a Rn . Pruébese: (i) Q es ANI, (ii) Q es conexo si y sólo si es arco-conexo, (iii) las partes conexas de Q son abiertas y cerradas en Q (¿ocurre lo mismo con las partes conexas del conjunto de los racionales Q?) Por supuesto, Rn (o cualquier abierto suyo no vacı́o) es una variedad topológica de dimensión n. En efecto, para probarlo basta considerar como atlas A = {(Rn , Id)} (Id: aplicación identidad). Sin embargo, en ocasiones resulta útil usar otros entornos coordenados como, por ejemplo, las coordenadas polares sobre R2 , las coordenadas esféricas o bien las cilı́ndricas sobre R3 , etc. (véase el Apéndice 2). Como un ejemplo explı́cito menos trivial, en el Apéndice 1 construimos dos atlas sobre la esfera. En una variedad topológica (Q, τ ) consideremos dos cartas (U, ϕ), (Ũ , ϕ̃) tales que U ∩ Ũ 6= ∅ y tomemos p ∈ U ∩ Ũ . Entonces, a partir de los homeomorfismos ϕ |U ∩Ũ : U ∩ Ũ → ϕ(U ∩ Ũ ) ϕ̃ |U ∩Ũ : U ∩ Ũ → ϕ̃(U ∩ Ũ ) podemos construir los homeomorfismos ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn . A estos homeomorfismos se les llama cambios de carta o de coordenadas (véase la Figura 6). 3 La metrizabilidad también equivale a la propiedad topológica llamada paracompacidad, que muchos autores usan en lugar de ANII. Ası́, cuando se usa la paracompacidad en lugar de ANII, se permite un conjunto no numerable de partes conexas. Esta generalidad no es de mucha utilidad práctica (y resulta incluso contraproducente en algunos contextos, como los resultados de unicidad para la topologı́a de subvariedades). 26CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE Figura 6 Observación. De acuerdo con la notación ya introducida (U, ϕ) ≡ (U, q 1 , . . . , q n ), (Ũ , ϕ̃) ≡ (Ũ , q̃ 1 , . . . , q̃ n ) se suele usar la notación ϕ̃ ◦ (ϕ |U ∩Ũ )−1 ≡ (q̃ 1 (q 1 , . . . , q n ), . . . , q̃ n (q 1 , . . . , q n )) ϕ ◦ (ϕ̃ |U ∩Ũ )−1 ≡ (q 1 (q̃ 1 , . . . , q̃ n ), . . . , q n (q̃ 1 , . . . , q̃ n )). Ası́, para el ejemplo de las coordenadas polares en R2 (Apéndice 2) se tienen los siguientes cambios de coordenadas: (x(ρ, θ), y(ρ, θ)); (ρ(x, y), θ(x, y)); 2.2. x(ρ, θ) = ρpcos θ, y(ρ, θ) = ρsenθ, ρ(x, y) = x2 + y 2 , θ(x, y) = 2 · arc tan x+ √y x2 +y 2 . Variedades diferenciables Definiciones 2.2.1 Sea (Q, τ ) una variedad topológica de dimensión n: (1) Diremos que un cambio de cartas entre (U, ϕ) y (Ũ , ϕ̃) es diferenciable C r , r ∈ N ∪ {∞} si las aplicaciones ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn son diferenciables C r . (Si U ∩ Ũ = ∅ el correspondiente cambio de coordenadas será diferenciable C ∞ por definición.) 2.2. VARIEDADES DIFERENCIABLES 27 (2) Diremos que un atlas A = {(Uα , ϕα ) : α ∈ I} es diferenciable C r si todos sus cambios de carta son diferenciables C r . Por simplicidad de lenguaje, de ahora en adelante por “diferenciable” entenderemos “diferenciable C ∞ ” para los cambios de carta. Definición 2.2.2 Diremos que un atlas D de Q es una estructura diferenciable si es un atlas diferenciable (C ∞ ) maximal en el siguiente sentido: Si (U, ϕ) es un entorno coordenado de Q cuyos cambios de cartas con todos los elementos de D son diferenciables entonces (U, ϕ) ∈ D. Observaciones: (1) Cualquier atlas diferenciable A determina una única estructura diferenciable D(A) tal que A ⊆ D(A). (2) Dados dos atlas diferenciables A, B se tiene que D(A) = D(B) si y sólo si A ∪ B es un atlas diferenciable. Definición 2.2.3 Una variedad diferenciable de dimensión n es una terna (Q, τ, D) donde (Q, τ ) es una variedad topológica de dimension n y D una estructura diferenciable. De ahora en adelante, cuando digamos que Q es una variedad diferenciable realmente nos estaremos refiriendo a la terna (Q, τ, D). Observación. Una misma variedad topológica puede admitir más de una estructura diferenciable. En efecto, consideremos la variedad topológica Q = R y los atlas A = {(R, Id)}, B = {(R, x3 )}. Si consideramos los cambios de carta entre (U, ϕ) = (R, Id) y (Ũ , ϕ̃) = (R, x3 ) tenemos: ϕ̃ ◦ ϕ−1 : R → R x 7→ x3 ϕ ◦ ϕ̃−1 : R → R x 7→ x1/3 . Vemos que ϕ ◦ ϕ̃−1 no es diferenciable en cero y, por tanto, D(A) 6= D(B). De ahora en adelante cuando hablemos de Rn como variedad diferenciable asumiremos como estructura diferenciable la generada por el atlas A = {(Rn , Id)}. 28CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE En el Apéndice 1 construimos explı́citamente dos atlas diferenciables naturales sobre la esfera. Ambos generan la misma estructura diferenciable la cual, por defecto, será la que consideremos sobre la esfera. Es digno de reflexión que, aunque en la práctica baste con trabajar con un atlas diferenciable, resulte conceptualmente necesario considerar “estructuras diferenciables” en la definición de variedad. Consideremos ahora otros ejemplos: Ejemplos de variedades diferenciables: (1) Construyamos una estructura de variedad diferenciable en cualquier espacio vectorial real de dimensión n, V n (R), definiendo tanto la topologı́a como la estructura diferenciable. Sea B = (v1 , . . . , vn ) una base ordenada cualquiera de V n . Consideremos la aplicación biyectiva FB que a cada vector le hace corresponder sus coordenadas en B, esto es: FB−1 : Rn → V n P (a1 , . . . , an ) 7→ ni=1 ai vi . Si tomamos otra base distinta B̃ = (ṽ1 , . . . , ṽn ) podemos considerar igualmente la aplicación biyectiva FB̃−1 : Rn → V n P (a1 , . . . , an ) 7→ ni=1 ai ṽi . Entonces la aplicación FB ◦ FB̃−1 : Rn → Rn es biyectiva y lineal (en particular, continua y diferenciable). Obviamente, lo mismo ocurre con la aplicación FB̃ ◦ FB−1 . Por tanto se trata de un homeomorfismo. Diremos que U ⊆ V n es un abierto de V n si FB (U ) (y, por tanto, FB̃ (U ) para cualquier otra base B̃) es un abierto de Rn . De esta forma queda definida una topologı́a sobre V n , que resulta independiente de la base escogida. Por construcción, V n es homeomorfo a Rn y, por tanto, Hausdorff y ANII, además de una variedad topológica de dimensión n. Si tomamos como entornos coordenados A = {(V n , FB ) : B base de V n } entonces los cambios de carta son las aplicaciones FB ◦ FB̃−1 que, como hemos visto, son diferenciables. Por tanto, A es un atlas diferenciable que genera una estructura diferenciable para V n . 2.2. VARIEDADES DIFERENCIABLES 29 (2) El conjunto de las matrices reales de orden m × n, Mm×n (R) es una variedad diferenciable de orden m·n. En efecto, basta dotarla de la estructura diferenciable de Rm·n bajo la identificación natural Mm×n (R) ≡ Rm·n . (3) Si tenemos dos espacios vectoriales reales V n (R), V m (R) entonces el conjunto de todas las aplicaciones lineales L(V n , V m ) = {f : V n → V m : f es lineal} es una variedad diferenciable de dimensión n·m. En efecto, esto es inmediato de (1) y de que L(V n , V m ) tiene estructura de espacio vectorial de dimensión n · m. Una forma natural de definir un atlas es fijar dos bases B y B 0 de V n y V m , respectivamente, y considerar la aplicación biyectiva f : L(V n , V m ) → Mm×n (R) f 7→ M (f, B 0 ← B) que asocia a cada aplicación lineal f su representación matricial con respecto a las bases B y B 0 . (Esta aplicación permite definir una topologı́a y una estructura diferenciable para L(V n , V m ) a partir de las de Mm×n (R) tal y como se hizo en (1) a partir de Rn .) (4) Un abierto U (6= ∅) de una variedad diferenciable Q de dimensión n es también una variedad diferenciable de dimensión n. En efecto, basta tomar la restricción a U de la topologı́a y los elementos de la estructura diferenciable de Q. Por ejemplo, el grupo lineal general de orden n sobre R, Gl(n, R) = {A ∈ Mn×n (R) : det(A) 6= 0} ⊂ Mn×n (R) es un abierto de Mn×n (R). De hecho, Gl(n, R) = det−1 (R − {0}) siendo det : Mn×n (R) → R A 7→ det(A) una aplicación continua. Por tanto, Gl(n, R) es una variedad diferenciable de dimensión n2 . (5) Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 , respectivamente, entonces Q × Q0 admite una estructura natural de variedad diferenciable de dimensión n + n0 . En efecto, dadas dos cartas coordenadas (U, ϕ), ϕ : U → ϕ(U ) ⊆ Rn y (U 0 , ϕ0 ), 30CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE 0 ϕ0 : U 0 → ϕ0 (U 0 ) ⊆ Rn de Q y Q0 , respectivamente, tomamos como carta coordenada de Q × Q0 ϕ × ϕ0 : U × U 0 ⊆ Q × Q0 → ϕ(U ) × ϕ0 (U 0 ) ⊆ Rn × Rn (p, p0 ) 7→ (ϕ(p), ϕ0 (p0 )). 0 Fácilmente se comprueba que si las ϕ, ϕ0 tienen cambios de carta diferenciables entonces también los tienen ϕ × ϕ0 . En particular, son variedades diferenciables de dimension 2 el toro S 1 × S 1 o el cilindro S 1 × R. Notas al concepto de variedad diferenciable: (1) Si en lugar de considerar espacios localmente homeomorfos a Rn los consideramos localmente homeomorfos al semiplano superior Rn+ = {(x1 , . . . , xn ) : xn ≥ 0} entonces podemos hablar de una variedad topológica (o diferenciable, en su caso) con borde. De los puntos que, en algún entorno coordenado (y, por tanto, en todo entorno coordenado), tienen su última coordenada nula se dice que están en el borde. Obsérvese que el concepto de diferenciabilidad entre abiertos de Rn se extiende naturalmente a abiertos de Rn+ .4 Análogamente, si se toman homeomorfismos con abiertos de {(x1 , . . . , xn ) : xi ≥ 0 ∀i ∈ {1, . . . , n}} y con cambios de carta diferenciables entonces hablamos de variedad diferenciable con borde anguloso (o diferenciable a trozos). (2) Si en lugar de considerar espacios localmente homeomorfos a Rn los consideramos localmente homeomorfos a Cn , con cambios de carta holomorfos, entonces tendremos una variedad compleja de dimensión (compleja) n. Las superficies de Riemann son variedades complejas de dimensión 1. (3) En general, los posibles estados de un sistema fı́sico (no cuántico y discreto) tienen intrı́nsecamente una estructura de variedad diferenciable de dimensión n (= número de “grados de libertad” del sistema). 4 Profundizaremos en las variedades con borde dentro del contexto del Teorema de Stokes, Subsección 9.2. 2.3. APLICACIONES DIFERENCIABLES 31 Más concretamente, en Fı́sica (Mecánica, Termodinámica, Relatividad...) es frecuente suponer, al menos implı́citamente, que el conjunto X de los estados de un sistema fı́sico5 admite para cada estado un subconjunto U ⊆ X que contiene a dicho estado y una aplicación biyectiva ϕ : U ⊆ X → Θ ⊆ Rn ; esto es, podemos describir ese estado en función de coordenadas en un abierto Θ de Rn . Más aún, se supone que los cambios de coordenadas son diferenciables. Veamos que es suficiente con estos elementos para definir una estructura de variedad diferenciable, salvo por los requisitos topológicos Hausdorff y ANII. Para definir la topologı́a en X, tomaremos como base de abiertos de X los subconjuntos ϕ−1 (Θ0 ), siendo Θ0 cualquier abierto de Rn en el codominio de ϕ. En consecuencia, obtenemos un espacio topológico (X, τ ) que, por construcción, es localmente homeomorfo a Rn , y además estará dotado de un atlas diferenciable. El requisito de que la variedad sea Hausdorff siempre se supone para la topologı́a τ , al menos, implı́citamente (pues se da por hecho que se pueden tomar coordenadas que separen entornos de dos estados distintos). Como se comentó, la hipótesis ANII no es en principio imprescindible. Pero, suele haber otras hipótesis más o menos implı́citas para X que acaban por implicar que sea ANII (matemáticamente, como ya hemos visto, basta con que la topologı́a sea métrica y que X tenga un conjunto numerable de partes conexas; fı́sicamente, parece lógico pensar que una topologı́a que no quedara constructivamente determinada en un conjunto numerable de pasos se escaparı́a a las posibilidades reales de medición). 2.3. Aplicaciones diferenciables entre variedades. Difeomorfismos Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 , respectivamente, y f : Q → Q0 una aplicación continua en p ∈ Q. 5 En el caso “extremo” de la Relatividad el sistema fı́sico serı́a el espacio y tiempo, y sus “estados” los “eventos” aquı́-ahora. 32CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE De la definición de aplicación continua en un punto que vimos en el capı́tulo anterior se tiene que para cada entorno coordenado (U 0 , ϕ0 ) de Q0 que contenga a f (p) existe un entorno coordenado (U, ϕ) de Q que contiene a p tal que f (U ) ⊆ U 0 . En consecuencia, podemos considerar la aplicación “f vista en coordenadas”, esto es, ϕ0 ◦ f ◦ ϕ−1 : ϕ(U ) ⊆ 0 Rn → Rn , que será continua en p por ser composición de continuas (véase la Figura 7). Figura 7 Definición 2.3.1 Sean Q, Q0 dos variedades diferenciables de dimensiones n, n0 , respectivamente. Diremos que una aplicación f : Q → Q0 continua en p ∈ Q es diferenciable en este punto si para un par de entornos coordenados (U, ϕ) y (U 0 , ϕ0 ) de p y f (p), respectivamente, tales 0 que f (U ) ⊆ U 0 se tiene que la aplicación ϕ0 ◦f ◦ϕ−1 : ϕ(U ) ⊆ Rn → Rn es diferenciable en ϕ(p). Observación. En la Definición 2.3.1 se puede sustituir la expresión “un par” por “cualesquiera”. En efecto, supongamos que ϕ0 ◦ f ◦ ϕ−1 es diferenciable en ϕ(p) y probemos que, para cualesquiera otros entornos coordenados (Ũ , ϕ̃) y (Ũ 0 , ϕ̃0 ) de p y f (p), respectivamente, también se tiene que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en ϕ̃(p). En un entorno de ϕ̃(p) podemos escribir: ϕ̃0 ◦ f ◦ ϕ̃−1 = (ϕ̃0 ◦ ϕ0−1 ) ◦ (ϕ0 ◦ f ◦ ϕ−1 ) ◦ (ϕ ◦ ϕ̃−1 ). (2.1) 2.3. APLICACIONES DIFERENCIABLES 33 Como ϕ̃0 ◦ ϕ0−1 y ϕ ◦ ϕ̃−1 son diferenciables en todos los puntos de su dominio (son cambios de carta) y ϕ0 ◦ f ◦ ϕ−1 es diferenciable en ϕ(p) (por hipótesis), se tiene de (2.1) que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en ϕ̃(p). Observación. En principio tiene sentido definir si f es diferenciable C s , s ∈ N∪{∞}, en p. Ello se debe a que los cambios de carta en Q y Q0 0 son C ∞ . Si sólo fueran C r y C r , respectivamente, sólo tendrı́a sentido definir que f es diferenciable C s , para s ≤ Min{r, r0 }. En cualquier caso, también supondremos por simplicidad que “f es diferenciable” significa que lo es C ∞ , salvo que se indique explı́citamente lo contrario. Ejercicio. Comprobar usando la definición que la aplicación f : S 2 ⊂ R3 → R, f (x, y, z) = z es diferenciable. Definición 2.3.2 Dadas dos variedades diferenciables Q, Q0 se dice que una aplicación f : Q → Q0 es un difeomorfismo si f es biyectiva y f , f −1 son diferenciables. El nombre difeomorfismo local se extiende al caso de que sólo se pueda asegurar sobre f que, para cada p ∈ Q, existen entornos abiertos U de p y U 0 = f (U ) de f (p), tales que la restricción de f a U y U 0 sea un difeomorfismo. Definición 2.3.3 Dos variedades diferenciables Q, Q0 son difeomorfas si existe un difeomorfismo f : Q → Q0 . Ejercicio. Probar que las variedades diferenciables (R, D(A)), (R, D(B)) con A = {(R, Id)}, B = {(R, x3 )} son difeomorfas. Observaciones: (1) El espacio euclı́deo Rn admite infinitas estructuras diferenciables compatibles con la topologı́a usual. Además, si n 6= 4 todas ellas son difeomorfas. Curiosamente, existen infinitas estructuras diferenciables sobre R4 que no son difeomorfas6 . (2) Toda variedad diferenciable (¡ANII!) conexa de dimensión 1 es difeomorfa a R ó a S 1 . 6 La prueba de estos hechos es realmente difı́cil. 34CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE 2.4. Hipersuperficies regulares de n R Consideremos un abierto U ⊆ R2 y una aplicación f : U → R diferenciable. Definimos el grafo de f como el subconjunto Graf(f ) = {(x, y, f (x, y)) : (x, y) ∈ U } ⊆ R3 . De manera natural, Graf(f ) es una variedad diferenciable de dimensión 2, pues podemos considerar como carta global la proyección πz : Graf(f ) → U (x, y, f (x, y)) 7→ (x, y). Ası́, por ejemplo, en la esfera S 2 ⊂ R3 cada “casquete” Uz± (véase el Apéndice 1) puede verse como una variedad diferenciable de este tipo, es decir, como grafos de las aplicaciones f± : U ⊆ R2 → R p (x, y) 7→ ± 1 − x2 − y 2 siendo U = {(x, y) ∈ R2 : x2 + y 2 < 1}. De esta manera, la carta global πz arriba definida coincide con las aplicaciones 2 ± ϕ± z : Uz → U ⊆ R (x, y, f± (x, y)) 7→ (x, y) en el Apéndice 1. Para generalizar esta situación conviene ver S 2 como la “solución” de la ecuación F (x, y, z) := x2 + y 2 + z 2 = 1. Obsérvese que en las cartas (Uz± , ϕ± z ) hemos podido despejar la variable z de esta = 2z 6= 0 en ecuación. De hecho, esto se ha podido hacer porque ∂F ∂z todo Uz± . Con más generalidad, sea U un abierto de R3 , F : U → R diferenciable, c0 ∈ Im(F ) y p0 ∈ F −1 (c0 ). Si ∂F (p0 ) 6= 0 entonces el Teorema de la ∂z Función Implı́cita (véase el Teorema 2.5.2) permite encontrar abiertos Vz ⊆ R3 y Dz ⊆ R2 , y una aplicación diferenciable φz : Dz ⊆ R2 → R tales que F −1 (c0 )∩Vz = {(x, y, φz (x, y)) : (x, y) ∈ Dz }. Obviamente, lo mismo ocurre si cambiamos el papel de la variable z con el de la variable x ó y. Esto es, en los puntos donde alguna de las parciales de F es distinta de 0, la proyección sobre el correspondiente plano coordenado sirve de carta local (véase la Figura 8). Además, si dos parciales son distintas de cero en p0 entonces los cambios de carta resultan ser diferenciables. En efecto, veamos explı́citamente cómo son estos cambios de carta cuando las coordenadas 2.4. HIPERSUPERFICIES REGULARES DE RN 35 Figura 8 con parciales distintas de cero son z e y. En primer lugar, para la coordenada z tenemos πz : F −1 (c0 ) ∩ Vz ∩ Vy → Dz0 ⊆ R2 (x, y, z) 7→ (x, y) y πz−1 : Dz0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy (x, y) 7→ (x, y, φz (x, y)), donde φz (x, y) es la función diferenciable dada en el Teorema de la Función Implı́cita por ser ∂F (p0 ) 6= 0 (Dz0 es algún entorno apropiado ∂z de πz (p0 ) –cualquiera incluido en Dz ∩ πz (Vy )). Análogamente para la coordenada y: πy : F −1 (c0 ) ∩ Vz ∩ Vy → Dy0 ⊆ R2 (x, y, z) 7→ (x, z) y πy−1 : Dy0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy (x, z) 7→ (x, φy (x, z), z), 36CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE donde φy (x, z) es la función dada en el Teorema de la Función Implı́cita por ser ∂F (p0 ) 6= 0. Entonces, los cambios de carta son: ∂y πz ◦ πy−1 : Dy0 ⊆ R2 → Dz0 ⊆ R2 (x, z) 7→ (x, φy (x, z)) y πy ◦ πz−1 : Dz0 ⊆ R2 → Dy0 ⊆ R2 (x, y) 7→ (x, φz (x, y)), que son diferenciables por serlo sus componentes. Obviamente, este razonamiento puede generalizarse al caso en que el espacio ambiente es Rn , lo que permite demostrar la Proposición 2.4.2 con la siguiente definición previa: Definición 2.4.1 Sea F : U ⊆ Rn → R diferenciable (U abierto) y sea c0 ∈ Im(F ). Diremos que c0 es un valor regular de F si para todo ∂F ∂F p ∈ F −1 (c0 ) se tiene que gradF (p) = ( ∂x 1 (p), . . . , ∂xn (p)) 6= 0 (esto es, al menos una parcial es distinta de cero). Proposición 2.4.2 Si c0 ∈ R es un valor regular de una aplicación diferenciable F : U ⊆ Rn → R entonces F −1 (c0 ) admite una estructura de variedad diferenciable de dimensión n−1, con un atlas diferenciable generado por las proyecciones sobre los hiperplanos coordenados. (Remarcamos que en esta proposición estamos considerando la topologı́a inducida de Rn , y el atlas diferenciable para F −1 (c0 ) se define por las proyecciones sobre el plano xi ≡ 0 de un entorno de cada punto ∂F p ∈ F −1 (c0 ) con ∂x i (p) 6= 0, como acabamos de justificar.) Definición 2.4.3 Si c0 es un valor regular de F : U ⊆ Rn → R entonces a la hipersuperficie dada por F −1 (c0 ) le llamaremos hipersuperficie regular de Rn . Ejemplos: (1) La esfera Sqn0 (r) de centro q0 ∈ Rn+1 y radio r > 0. En efecto, si q0 = (a1 , . . . , an+1 ) ∈ Rn+1 entonces Sqn0 (r) se define como: {(x1 , . . . , xn+1 ) ∈ Rn+1 : (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 = r2 }. 2.4. HIPERSUPERFICIES REGULARES DE RN 37 Sea F : Rn+1 → R la función F (x1 , . . . , xn+1 ) = (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 . Para ver que es una hipersuperficie regular de Rn+1 debemos ∂F i probar que r2 es un valor regular de F . Ahora bien, ∂x i = 2(x − ∂F i i ai ) y, por tanto, ∂x i = 0 si y sólo si x = a para todo i. Como n n q0 6∈ Sq0 (r), se tiene que Sq0 (r) es una hipersuperficie regular. (2) Se prueba análogamente que en R3 el elipsoide de semiejes a, b, c > 0 y centro q0 = (a1 , a2 , a3 ) F (x, y, z) := (x − a1 )2 (y − a2 )2 (z − a3 )2 + + =1 a2 b2 c2 es una hipersuperficie regular de R3 . (3) Análogamente, también lo es el hiperboloide de una hoja en R3 para r > 0: F (x, y, z) := x2 + y 2 − z 2 = r2 (4) En general, resulta válida la idea intuitiva de que cualquier superficie “suave” S en R3 es una hipersuperficie regular, siempre que se le pueda asignar de manera continua un vector normal N . Para convencerse de ello, la idea consiste esencialmente en tomar como función F la que a cada punto de R3 la asigna la distancia “con signo” (positiva en el sentido al que apunta N y negativa en el contrario) del punto a la superficie. Entonces F es diferenciable en un entorno de S, y admite como valor regular el 0 (S = F −1 (0)), véase la Figura 9. Proposición 2.4.4 Si Q = F −1 (c0 ) ⊆ Rn es una hipersuperficie regular y f : Rn → R es una aplicación diferenciable entonces f |Q : Q → R es también diferenciable. Demostración. Es continua por ser la restricción a Q de una aplicación continua. Para ver que es diferenciable, sea p0 ∈ Q y, digamos, ∂F (p0 ) 6= 0. Consideremos para p0 la carta generada por la Proposición ∂xi 2.4.2, esto es, πxi : Vxi ∩ F −1 (c0 ) → Dxi ⊆ Rn−1 (x1 , . . . , xn ) 7→ (x1 , . . . , xi−1 , xi+1 , . . . , xn ) 38CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE Figura 9 −1 para abiertos Vxi , Dxi . Se tiene, πx−1 (c0 ) con: i : Dxi → Vxi ∩ F (x1 , . . . , xi−1 , xi+1 , . . . , xn ) 7→ (x , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ), 1 siendo φxi la función dada por el Teorema de la Función Implı́cita (sobre el codominio R consideramos como carta la identidad Id). Por tanto, 1 i−1 Id ◦ f ◦ πx−1 , xi+1 , . . . , xn ) i (x , . . . , x = f (x1 , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ), que es diferenciable por ser composición de diferenciables. 2 2.5. Subvariedades regulares de n R Definición 2.5.1 Sea F : U ⊆ Rn → Rm (n ≥ m) diferenciable (C ∞ ) y sea c0 ∈ Im(F ). Se dice que c0 es un valor regular de F si la diferencial de F en p, (d F )p , tiene rango máximo m para todo p ∈ F −1 (c0 ). i Esto es, la matriz ( ∂F (p))i,j ∈ Mm×n (R) tiene rango m para todo ∂xj −1 p ∈ F (c0 ). 2.5. SUBVARIEDADES REGULARES DE RN 39 ∂F Si m = 1 entonces la matriz anterior se reduce a grad F (p) = ( ∂x 1 (p), ∂F . . . , ∂xn (p)) y, por tanto, reobtenemos la definición de valor regular de la sección anterior. Nuestro objetivo será ahora generalizar la Proposición 2.4.2 para mostrar que la imagen inversa de cualquier valor regular es una variedad diferenciable. i (p))i,j tiene rango m entonces habrá alguna Observemos que si ( ∂F ∂xj submatriz cuadrada de orden m con determinante distinto de 0. Esto es, podremos escoger m columnas (que supondremos son las m últimas) tales que el correspondiente determinante es distinto de 0. En este caso, el Teorema de la Función Implı́cita permite asegurar que en la ecuación F (x1 , . . . , xn−m , xn−m+1 , . . . , xn ) = c0 las variables xn−m+1 , . . . , xn son “despejables” como función de las n − m primeras x1 , . . . , xn−m . Esto es, la proyección sobre las n − m primeras variables sirve como carta local en F −1 (c0 ) y, además, los cambios de carta resultan diferenciables. Con más precisión, recordemos ese teorema: Teorema 2.5.2 (Teorema de la Función Implı́cita): Consideremos los abiertos U ⊆ Rn−m , V ⊆ Rm y U × V ⊆ Rn . Supongamos que F : U × V ⊆ Rn → Rm es diferenciable y que (x0 , y0 ) ∈ U × V es tal que la diferencial respecto de las variables en V de F (dy F )(x0 ,y0 ) : Rm → Rm es un isomorfismo (lineal). Entonces existe un entorno U0 de x0 y W0 de c0 := F (x0 , y0 ) y una aplicación g : U0 × W0 → V diferenciable tal que F (x, g(x, c)) = c para todo x ∈ U0 y c ∈ W0 . Si llamamos gc0 : U0 → V x 7→ g(x, c0 ) entonces F (x, gc0 (x)) = c0 para todo x ∈ U0 , y la coordenada y se despeja en función de la x (y = gc0 (x)). Razonando entonces como en la sección anterior y usando el Teorema 2.5.2 se obtiene la siguiente generalización de las Proposiciones 2.4.2 y 2.4.4: Teorema 2.5.3 Sea F : U ⊆ Rn → Rm diferenciable y c0 ∈ Im(F ) un valor regular. Entonces Q = F −1 (c0 ) es una variedad topológica, y las proyecciones sobre los subespacios coordenados de dimensión n − m generan canónicamente una estructura diferenciable. Además, si f : U ⊆ Rn → Q0 es diferenciable entonces también lo es f |Q . 40CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE (Como en la Proposición 2.4.2, a fin de generar un atlas diferenciable se entiende aquı́ que, para cada p ∈ Q, si las columnas i1 , . . . , im de dFp son independientes entonces se toma como función coordenada en un entorno de p la proyección sobre las otras n − m variables.) A las variedades ası́ obtenidas las llamaremos subvariedades regulares de Rn . Ejemplo. Consideremos el grupo ortonormal de dimensión 2 O(2, R) = {A ∈ M2×2 (R) : A · At = Id} ⊂ R4 . Veamos que O(2, R) es una variedad diferenciable de dimensión 1. En primer lugar tenemos que M2×2 (R) ≡ R4 . Ahora µ bien, A ¶ ∈ O(2, R) si a b y sólo si A · At = Id, es decir, si y sólo si A = ≡ (a, b, c, d) c d verifica a 2 + b2 = 1 ac + bd = 0 c2 + d2 = 1. Por tanto, si definimos F : R4 → R3 (a, b, c, d) 7→ (a2 + b2 , ac + bd, c2 + d2 ), tenemos que O(2, R) = F −1 (1, 0, 1). Basta con comprobar que (1, 0, 1) es un valor regular de F , esto es, que el rango de (d F )A es 3 para todo A ∈ O(2, R). En primer lugar, observemos que 2a 2b 0 0 (d F )A = c d a b ∈ M3×4 (R). (2.2) 0 0 2c 2d Ahora bien, como A · At = Id se tiene que det(A) = ±1 6= 0 y las dos primeras columnas de (d F )A son independientes. Además también se obtiene que c y d no se anulan simultáneamente, por lo que el rango de (d F )A es 3. En consecuencia, tomando como coordenada sobre O(2, R) la proyección al elemento c (cuando c 6= 0) o d (cuando d 6= 0) obtenemos un atlas para O(2, R). Notas: (1) O(2, R) puede estudiarse más detenidamente como sigue. Si definimos O+ (2, R) = {A ∈ O(2, R) : det(A) = 1} O− (2, R) = {A ∈ O(2, R) : det(A) = −1} 2.6. APÉNDICE 1: ATLAS EN §2 41 entonces se puede comprobar: µ ¶ cos θ −senθ + O (2, R) = { : θ ∈ R} µ senθ cos θ ¶ cos θ senθ O− (2, R) = { : θ ∈ R}. senθ − cos θ Los conjuntos O+ (2, R) y O− (2, R) son las dos partes conexas de O(2, R). El grupo O(2, R) se reduce, por tanto, a dos copias de S 1 . En general, O(n, R) = {A ∈ Mn×n (R) : AAt = Idn } es una variedad diferenciable de dimensión n(n − 1)/2 que tiene dos componentes conexas. Además, O(n, R) s compacto, al identificarse con un subconjunto cerrado y aco2 tado de Rn . (2) O(n, R) con el producto usual de matrices es un caso especial de grupo de Lie; esto es, de grupo algebraico G ≡ (G, ·) dotado de una estructura de variedad diferenciable, y tal que las aplicaciones G×G→G (g, h) 7→ g · h y G→G g 7→ g −1 son diferenciables7 . 2.6. Apéndice 1: dos atlas explı́citos sobre la esfera La Proposición 2.4.2 ó el Teorema 2.5.3 permiten concluir que la esfera S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} es una (hiper)superficie regular de R3 . Sin embargo, en este apéndice comprobaremos directamente que es una variedad topológica de dimensión 2 suministrando, de hecho, dos atlas diferenciables de interés que generan dicha estructura diferenciable. Sean Uz+ = {(x, y, z) ∈ S 2 : z > 0} ⊂ R3 (casquete superior de la esfera) Θ = {(x, y) ∈ R2 : x2 + y 2 < 1} ⊂ R2 , dos abiertos de S 2 y R2 , respectivamente, y definamos la aplicación + ϕ+ z : Uz → Θ (x, y, z) 7→ (x, y) 7 La teorı́a de grupos de Lie es muy precisa y, en particular, muestra que las hipótesis de esta definición son algo redundantes. 42CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE que es continua, ya que coincide con la restricción a Uz+ de la proyección πz : R2 × R → R2 ((x, y), z) 7→ (x, y), + es decir, ϕ+ z = πz |Uz+ . La aplicación ϕz obviamente admite por inversa a la aplicación −1 (ϕ+ : Θ ⊂ R2 → Uz+ ⊂p R3 z) (x, y) 7→ (x, y, 1 − x2 − y 2 ), que es continua puesto que cada componente suya lo es. En consecuencia, hemos encontrado un entorno coordenado para cada punto p ∈ Uz+ . Para el abierto Uz− = {(x, y, z) ∈ S 2 : z < 0} (casquete inferior) repetimos el mismo proceso pero ahora con − ϕ− z : Uz → Θ (x, y, z) 7→ (x, y) −1 (ϕ− : Θ → Uz− z) p (x, y) 7→ (x, y, − 1 − x2 − y 2 ). Para completar nuestro atlas debemos cubrir el ecuador. Para ello consideramos en primer lugar los abiertos Uy+ = {(x, y, z) ∈ S 2 : y > 0} y Uy− = {(x, y, z) ∈ S 2 : y < 0} con + ϕ+ y : Uy → Θ (x, y, z) 7→ (x, z) −1 (ϕ+ : Θ → Uy+ y) √ (x, z) 7→ (x, 1 − x2 − z 2 , z) y − ϕ− y : Uy → Θ (x, y, z) 7→ (x, z) −1 (ϕ− : Θ → Uy− y) √ (x, z) 7→ (x, − 1 − x2 − z 2 , z), respectivamente. Por último, para cubrir los puntos (1, 0, 0), (−1, 0, 0) ∈ S 2 tomamos los abiertos Ux+ = {(x, y, z) ∈ S 2 : x > 0} y Ux− = {(x, y, z) ∈ S 2 : x < 0} con + ϕ+ x : Ux → Θ (x, y, z) 7→ (y, z) −1 : Θ → Ux+ p (ϕ+ x) (y, z) 7→ ( 1 − y 2 − z 2 , y, z) y − ϕ− x : Ux → Θ (x, y, z) 7→ (y, z) −1 : Θ → Ux− p (ϕ− x) (y, z) 7→ (− 1 − y 2 − z 2 , y, z), 2.6. APÉNDICE 1: ATLAS EN §2 43 respectivamente. En conclusión, el atlas para toda la esfera S 2 queda − − + + − − + + − − AS 2 = {(Uz+ , ϕ+ z ), (Uz , ϕz ), (Uy , ϕy ), (Uy , ϕy ), (Ux , ϕx ), (Ux , ϕx )}. 2 Por tanto, S es una variedad topológica. De la forma explı́cita de los cambios de carta resulta inmediato comprobar que el atlas AS 2 es diferenciable. Podemos optimizar el número de elementos que componen un atlas para S 2 proyectando estereográficamente. En efecto, lo haremos para el caso general de la esfera n-dimensional S n (de nuevo centrada en el origen y de radio 1 por comodidad). Sean N = (0, . . . , 0, 1) (polo norte) y S = (0, . . . , 0, −1) (polo sur). Como primer entorno coordenado consideramos el abierto U N = S n − {N } junto con la proyección estereográfica desde N , ϕN : U N → Rn , esto es, ϕN es la aplicación que lleva cada elemento (x1 , . . . , xn+1 ) de U N al punto de corte con el plano xn+1 ≡ 0 de la recta que pasa por N y por (x1 , . . . , xn+1 ). Explı́citamente, ϕN : U + → Rn (x1 , . . . , xn+1 ) 7→ 1 (x1 , . . . , xn ). 1−xn+1 Análogamente, consideremos el abierto U S = S n − {S} junto con la proyección estereográfica desde S, ϕS : U S → Rn (x1 , . . . , xn+1 ) 7→ 1 (x1 , . . . , xn ). 1+xn+1 Entonces (U N , ϕN ) y (U S , ϕS ) completan un atlas para la esfera S n . Ejercicio. Compruébese: (1) ϕN , ϕS son homeomorfismos, (2) su cambio de cartas es diferenciable y (3) el atlas A = {(U N , ϕN ), (U S , ϕS )} genera la misma estructura diferenciable en S n que la ya estudiada. Nota. Para n = 2 se tiene el cambio de cartas ϕS ◦ (ϕN )−1 : R2 − {(0, 0)} → R2 − {(0, 0)}, (u, v) → (u, v)/(u2 + v 2 ). Esta aplicación (y su inversa) no son sólo diferenciables sino también anti-holomorfas. Si en lugar de ϕS tomamos la aplicación ϕ̃S = s ◦ ϕS donde s(u, v) = (v, u), ∀(u, v) ∈ R2 , el cambio de cartas ϕ̃S ◦ (ϕN )−1 (y su inverso) resulta holomorfo. En consecuencia, el atlas A = {(U N , ϕN ), (U S , ϕ̃S )} es holomorfo y S 2 admite una estructura de variedad compleja de dimensión 1 (esfera de Riemann) –véase la nota al concepto de variedad (2) al final de la Sección 2.2. 44CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE Observación. Señalemos que no existe un atlas con una única carta para S n (ni para ninguna otra variedad compacta). Si existiera dicho atlas entonces tendrı́amos un homeomorfismo ϕ : S n → Θ, siendo Θ un abierto de Rn . Pero S n es compacto luego, como ϕ es continua, también Θ = ϕ(S n ) es compacto. En consecuencia, Θ es un cerrado (y abierto) de Rn , es decir, Θ = Rn por ser Rn es conexo. Esto es una contradicción puesto que Rn no es acotado y, por tanto, no puede ser compacto. 2.7. Apéndice 2: coordenadas polares, cilı́ndricas y esféricas Coordenadas polares sobre R2 : Estas coordenadas vienen definidas de la siguiente manera. Consideremos como carta el abierto U = R2 − {(x, 0) ∈ R2 : x ≤ 0} junto con la aplicación ϕ : U ⊂ R2 →]0, ∞[×] − π, π[ (x, y) 7→ (ρ(x, y), θ(x, y)), p donde ρ(x, y) = x2 + y 2 y θ(x, y) es el único real de ] − π, π[ tal que x = ρ · cos θ e y = ρ · senθ (por tanto, la inversa de ϕ es ϕ−1 (ρ, θ) = (ρ · cos θ, ρ · senθ)). Existen diferentes modos de determinar la función θ(x, y) de manera explı́cita: arc tan xy si x > 0 π si x = 0, y > 0 2 y π + arc tan x si x < 0, y > 0 θ(x, y) = π − si x = 0, y < 0 2 −π + arc tan xy si x < 0, y < 0 o más compactamente: θ(x, y) = 2 · arc tan y p x + x2 + y 2 para todo (x, y) ∈ R2 − {(x, 0) : x ≤ 0}. Coordenadas cilı́ndricas sobre R3 : Para definir estas coordenadas consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto 2.7. APÉNDICE 2: COORDENADAS EN R3 45 con la aplicación ϕ : U ⊂ R3 →]0, ∞[×] − π, π[×R (x, y, z) 7→ (ρ(x, y), θ(x, y), z), donde ρ(x, y) y θ(x, y) se definen como en las coordenadas polares. Por tanto, la correspondiente inversa es ϕ−1 (ρ, θ, z) = (ρ · cos θ, ρ · senθ, z). Coordenadas esféricas sobre R3 : Para definir estas coordenadas consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto con la aplicación ϕ : U ⊂ R3 →]0, ∞[×]0, π[×] − π, π[ (x, y, z) 7→ (r(x, y, z), θ(x, y, z), φ(x, y, z)), p donde r(x, y, z) = x2 + y 2 + z 2 , y θ(x, y, z) y φ(x, y, z) son los únicos reales de ]0, π[ y ] − π, π[, respectivamente, tales que x = r · senθ · cos φ e y = r · senθ · senφ. Por tanto, en este caso ϕ−1 (r, θ, φ) = (r · senθ · cos φ, r · senθ · senφ, r · cos θ). Ejercicios Ejercicio 1. Razonar si todo espacio topológico X localmente homeomorfo a Rn es necesariamente T1 (esto es, para cada par de puntos x, y ∈ X, existe un entorno de x que no contiene a y, y un entorno de y que no contiene a x.) Ejercicio 2. Se considera la aplicación ϕ : R+ × R → R2 − {(0, 0)}, (ρ, θ) → (ρ cos θ, ρsenθ). Compruébese que ϕ es un difeomorfismo local y suprayectivo. ¿Es ϕ un difeomorfismo global? Ejercicio 3. Si Q es una variedad diferenciable, pruébese que cada carta ϕ : U −→ ϕ(U ) de Q es un difeomorfismo entre las variedades diferenciables U y ϕ(U ). Ejercicio 4. Dado un número real ² > 0 (ó ² = ∞), demuéstrese que todo punto p de una variedad diferenciable Q de dimensión n tiene una carta (U, ϕ) tal que ϕ(p) = 0 y ϕ(U ) = B0 (²) = {x ∈ Rn : kxk < ²}. Ejercicio 5. Se consideran en R+ =]0, ∞[ los atlas A1 = {(R+ , IdR+ )}, A2 = {(R+ , ln)}, A3 = {(R+ , exp)}, A4 = {(R+ , x3 )}, A5 = {(R+ , (x− 46CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE 1)3 )}, donde ln es la aplicación logaritmo neperiano y exp la exponencial. ¿Cuáles de ellos definen iguales estructuras diferenciables? Ejercicio 6. Sea S 2 la esfera unitaria centrada en (0, 0, 0) de R3 y sea ϕN : S 2 − {(0, 0, 1)} −→ R2 la proyección estereográfica desde el polo norte (0, 0, 1). Calcúlense las cordenadas, con respecto a esta carta, del punto ( √13 , √13 , √13 ) de S 2 . ¿Qué punto de S 2 tiene coordenadas (0, 0) con respecto a esta carta? Ejercicio 7. Sean Q y Q0 variedades diferenciables y sean π : Q × Q0 −→ Q y π 0 : Q × Q0 −→ Q0 las correspondientes proyecciones; es decir, π(p, p0 ) = p y π 0 (p, p0 ) = p0 , ∀(p, p0 ) ∈ Q × Q0 . Pruébese que π y π 0 son aplicaciones diferenciables. Si Q00 es otra variedad diferenciable y F : Q00 −→ Q × Q0 es una aplicación, pruébese que F es diferenciable si y sólo si π ◦ F y π 0 ◦ F son diferenciables. Ejercicio 8. Con las mismas notaciones del problema anterior, para cada (p, p0 ) ∈ Q × Q0 consideremos las aplicaciones ip0 : Q −→ Q × Q0 , ip0 (q) = (q, p0 ), ∀q ∈ Q, y jp : Q0 −→ Q × Q0 , jp (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 . Pruébese que ip0 y jp son aplicaciones diferenciables. Ejercicio 9. Si F : Q −→ N y F 0 : Q0 −→ N 0 son aplicaciones diferenciables, pruébese que F × F 0 : Q × Q0 −→ N × N 0 , definida por (F × F 0 )(p, p0 ) = (F (p), F 0 (p0 )), es también diferenciable. Ejercicio 10. Se consideran las aplicaciones F, G : R2 −→ R2 , dadas por F (x, y) = (xey + y, xey − y) G(x, y) = (ex cos(y), ex sen(y)). ¿Es F (resp. G) un difeomorfismo? Ejercicio 11. Encuéntrese un difeomorfismo entre el paraboloide grafo de la función z = x2 + y 2 y el hiperboloide grafo de la función z = x2 − y 2 . Ejercicio 12. Demuéstrese que todos los intervalos abiertos de R son difeomorfos. Ejercicio 13. Demuéstrese que dos esferas de Rn+1 con centros y radios arbitrarios son difeomorfas. Ejercicio 14. Se considera al subconjunto de R3 , S = {(x, y, z) : yex + zey + yez = −1}. ¿Es S una superficie regular de R3 ? 2.7. APÉNDICE 2: COORDENADAS EN R3 47 Ejercicio 15. Sean A, B, C ∈ R\{0}. Determı́nense los valores regulares de la función sobre R3 , f (x, y, z) = Ax2 + Bxy + Czy. Ejercicio 16. En la esfera S 2 se considera la relación de equivalencia p ∼ q si y sólo si q = ±p, ∀p, q ∈ S 2 . Denotaremos por P2 (R) al espacio cociente S 2 / ∼ (espacio proyectivo real bidimensional). Pruébese que, con la topologı́a cociente, P2 (R) es una variedad topológica de dimensión 2. Demuéstrese que admite una estructura diferenciable tal que la correspondiente proyección canónica desde S 2 es un difeomorfismo local (esta estructura diferenciable es única). Generalizar a cualquier dimensión n ∈ N. Ejercicio 17. Consideremos la esfera unidad de dimensión 1, S 1 , como los números complejos de módulo 1, es decir, S 1 = {z ∈ C : |z| = 1}. (1) Pruébese que la aplicación F : S 1 −→ S 1 , definida por F (z) = z 2 , ∀z ∈ S 1 , es diferenciable, sobreyectiva y coincide sobre cada par de puntos antı́podas de S 1 . (2) Si F̃ : P1 (R) −→ S 1 es la aplicación inducida por F en el cociente, pruébese que F̃ es un difeomorfismo. 48CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE Capı́tulo 3 Espacio tangente 3.1. Concepto de vector tangente a una variedad Q en un punto p Consideremos una superficie S ⊂ R3 y una curva diferenciable γ(t) = (x(t), y(t), z(t)) ⊂ S. Obviamente, podemos definir la velocidad de la curva γ(t) en t = 0 como γ 0 (0) = (x0 (0), y 0 (0), z 0 (0)) ∈ R3 . De este modo, si γ(0) = p entonces el vector γ 0 (0) será “tangente” a la superficie S en p. Esto es, la velocidad de la curva en p está contenida en el plano tangente a S en p, si pensamos en γ 0 (0) como un vector con “origen” el punto p (véase la Figura 10). Ejercicio. Sea S un superficie de R3 obtenida como imagen inversa de un valor regular para alguna función f : R3 → R, S = F −1 (c0 ). Demuéstrese que la ecuación implı́cita del plano afı́n que es tangente a S en un punto p0 = (x0 , y0 , z0 ) ∈ S es: ∂f ∂f ∂f (p0 )(x − x0 ) + (p0 )(y − y0 ) + (p0 )(z − z0 ) = 0. ∂x ∂y ∂z Generalı́cese a subvariedades regulares de Rn . 49 50 CAPÍTULO 3. ESPACIO TANGENTE Figura 10 Con más generalidad, consideremos ahora una variedad diferenciable arbitraria Q de dimensión n y un punto p ∈ Q. El objetivo de este capı́tulo es dar una definición razonable de espacio tangente a la variedad Q en el punto p, ası́ como el estudio de la estructura de dicho espacio. En general, asociaremos a cada punto p de una variedad n-dimensional Q, su espacio tangente, que será un espacio vectorial también de dimensión n. Como primera aproximación, en esta sección introduciremos los conceptos de vector y espacio tangente a una variedad en un punto de tres formas diferentes, cada vez más abstractas, aunque equivalentes. 3.1.1. Vector tangente como clase de equivalencia de curvas Consideremos en adelante una variedad diferenciable Q de dimensión n y fijemos un punto p ∈ Q. Sea Cp = {γ :] − ²γ , ²γ [→ Q : ²γ > 0, γ(0) = p, γ diferenciable}, esto es, Cp es el conjunto de curvas contenidas Q que pasan por p donde, para simplificar el lenguaje, suponemos que cada curva pasa por p en 0 y está definida en algún entorno abierto simétrico de 0. Establecemos en Cp una relación de equivalencia como sigue. Diremos que dos curvas γ, ρ ∈ Cp son equivalentes si para algún entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de p se verifica dtd |t=0 (ϕ ◦ γ)(t) = dtd |t=0 (ϕ ◦ ρ)(t) 3.1. CONCEPTO DE VECTOR TANGENTE 51 (obsérvese que ϕ(γ(0)) = ϕ(ρ(0)) = ϕ(p)). Es decir, las curvas son equivalentes si coinciden los vectores tangentes en Rn de ambas curvas vistas en coordenadas (véase la Figura 11). Figura 11 Observación. Esta definición es independiente del entorno coordenado escogido. En efecto, sea (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) otro entorno coordej nado de p y denotemos por ∂∂qq̃ i (p) la i-ésima parcial de q̃ j ◦ ϕ−1 , esto es, ∂ q̃ j ∂(q̃ j ◦ ϕ−1 ) (p) = (ϕ(p)), ∂q i ∂xi donde ∂x∂ j denota la parcial j-ésima usual para funciones definidas en Rn . Entonces d | (q̃ j ◦ γ)(t) = d |t=0 [(q̃ j ◦ ϕ−1 ) ◦ (ϕ´◦ γ)](t) dt t=0 Pn ³ ∂ q̃j dt d = i=1 ∂qi (p) · dt |t=0 (q i ◦ γ)(t) (y, si γ y ρ están relacionadas usando (U, ϕ)) ´ P ³ j = ni=1 ∂∂qq̃ i (p) · dtd |t=0 (q i ◦ ρ)(t) = d | dt t=0 (q̃ j ◦ ρ)(t) para todo j y, por tanto, dtd |t=0 (ϕ̃◦γ)(t) = dtd |t=0 (ϕ̃◦ρ)(t). Nótese que la relación entre dtd |t=0 (ϕ̃ ◦ γ)(t) y dtd |t=0 (ϕ ◦ γ)(t) es, matricialmente, d ∂ q̃1 d ∂ q̃ 1 1 1 . . . | (q̃ ◦ γ)(t) | (q ◦ γ)(t) 1 n t=0 t=0 ∂q ∂q dt dt .. . . .. .. . = . . . .. · . . d d n n ∂ q̃ n ∂ q̃ n | (q̃ ◦ γ)(t) | (q ◦ γ)(t) . . . ∂qn dt t=0 dt t=0 ∂q 1 p (3.1) 52 CAPÍTULO 3. ESPACIO TANGENTE Es inmediato comprobar que el concepto de curvas equivalentes proporciona una relación de equivalencia. Estamos pues en condiciones de establecer la primera definición de vector tangente. Definición 3.1.1 Llamaremos vector tangente a Q en p (como clase de curvas) a cada una de las clases de equivalencia definidas por ∼ en Cp . Ası́, denotaremos por [γ] al vector tangente representado por la curva γ, esto es, la clase de equivalencia de γ. En consecuencia, Definición 3.1.2 Llamaremos espacio tangente a Q en p al conjunto Cp / ∼. Por simplicidad de notación (y por las expresiones en coordenadas que veremos en la próxima subsección) escribiremos γ 0 (0) = [γ]. 3.1.2. Vector tangente por coordenadas Consideremos, en la variedad diferenciable Q, dos curvas γ, ρ ∈ Cp . En este caso, si fijamos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) se tiene: d | dt t=0 d | dt t=0 ϕ ◦ γ(t) = ( dtd |t=0 q 1 ◦ γ(t), . . . , dtd |t=0 q n ◦ γ(t)) = (a1 , . . . , an ) ϕ ◦ ρ(t) = ( dtd |t=0 q 1 ◦ ρ(t), . . . , dtd |t=0 q n ◦ ρ(t)) = (b1 , . . . , bn ) y se verifica γ ∼ ρ ⇔ (a1 , . . . , an ) = (b1 , . . . , bn ). Esto es, fijado un sistema de coordenadas (U, ϕ) cada vector tangente [γ] se puede identificar con una n-upla (a1 , . . . , an ) ∈ Rn . Además, si tomamos otra carta coordenada (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )), al mismo vector tangente [γ] le asignamos la n-upla: d d d |t=0 ϕ̃ ◦ γ(t) = ( |t=0 q̃ 1 ◦ γ(t), . . . , |t=0 q̃ n ◦ γ(t)) = (ã1 , . . . , ãn ), dt dt dt que, aunque es distinta de (a1 , . . . , an ), se relaciona con ella mediante la igualdad (3.1). Podemos establecer la siguiente definición alternativa de vector tangente: 3.1. CONCEPTO DE VECTOR TANGENTE 53 Definición 3.1.3 Un vector tangente a Q en p (por coordenadas) es una aplicación que a cada entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de p le hace corresponder un elemento (a1 , . . . , an ) ∈ Rn , de modo tal que dado otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) el nuevo elemento (ã1 , . . . , ãn ) ∈ Rn asignado verifica ∂ q̃1 ã1 ∂q 1 .. .. . = . ∂ q̃ n ãn ∂q 1 a1 .. · .. , . . ∂ q̃ n an ∂q n (3.2) ∀i ∈ {1, . . . , n}. (3.3) ∂ q̃ 1 ∂q n ... .. . ... p o, equivalentemente, n X ∂ q̃ i ã = (p) · aj j ∂q j=1 i Resulta inmediato comprobar que las Definiciones 3.1.1 y 3.1.3 son equivalentes. Además, de la linealidad de (3.2) queda de manifiesto la estructura de espacio vectorial de dimensión n (a partir de la suma y el producto por escalares usuales en Rn ) de que está dotado el conjunto de todos los vectores tangentes a p. La Definición 3.1.3 formaliza la idea clásica en Fı́sica de que un vector es asignar a cada sistema de coordenadas un elemento de Rn “que se transforma como un vector” (esto es, verificándose (3.3)). 3.1.3. Vector tangente como derivación Introducimos ahora un nuevo concepto de vector tangente basándonos en la existencia de un “modo de derivar funciones” para cada vector tangente a Q en p; es lo que generaliza la derivada direccional en Rn . Más concretamente, sea γ ∈ Cp y consideremos su vector tangente asociado [γ]. Si f : Q → R es una aplicación diferenciable (C ∞ ) entonces podemos considerar f ◦ γ :] − ²γ , ²γ [→ R y calcular dtd |t=0 (f ◦ γ)(t). A este número real lo llamaremos derivada direccional de f en la dirección del vector tangente [γ]. Comprobemos, en primer lugar, que esta derivada es independiente del representante escogido en la clase [γ]. Esto es, Lema 3.1.4 Si γ ∼ ρ entonces d | dt t=0 (f ◦ γ)(t) = d | dt t=0 (f ◦ ρ)(t). 54 CAPÍTULO 3. ESPACIO TANGENTE Demostración. Si (U, ϕ = (q 1 , . . . , q n )) es un sistema de coordenadas en p entonces dtd |t=0 (f ◦ γ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t). Entonces, aplicando la regla de la cadena, Pn ∂(f ◦ϕ−1 ) d −1 (ϕ(p)) · dtd |t=0 (q j ◦ γ)(t) | (f ◦ ϕ ) ◦ (ϕ ◦ γ)(t) = t=0 j=1 dt ∂xj Pn ∂(f ◦ϕ−1 ) = j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j ◦ ρ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ ρ)(t) = dtd |t=0 (f ◦ ρ)(t). 2 Por tanto, cada clase de equivalencia proporciona una única derivada direccional en p. De la prueba del Lema 3.1.4 resulta inmediato comprobar que si el vector tangente [γ] viene dado por coordenadas entonces la derivada P ◦ϕ−1 ) direccional de f es igual a i ai ∂(f∂x (ϕ(p)), en la notación de la i Definición 3.1.3. Consideremos el conjunto C ∞ (Q) = {f : Q → R : f es diferenciable C ∞ }. De manera natural, en este conjunto se pueden definir las operaciones f + g, f · g y a · f , siendo f, g ∈ C ∞ (Q) y a ∈ R. De hecho, (C ∞ (Q), +, ·) tiene estructura de anillo unitario conmutativo y (C ∞ (Q), +, ·R) tiene estructura de espacio vectorial. Si fijamos un vector tangente en p, [γ] = vp , podemos definir la aplicación: Dvp : C ∞ (Q) → R f 7→ Dvp (f ) ≡ vp (f ), (3.4) siendo vp (f ) = dtd |t=0 (f ◦γ)(t) la derivada direccional de f con respecto a vp . La aplicación (3.4) verifica las siguientes propiedades: (1) Es R-lineal: Dvp (a·f +b·g) = a·Dvp (f )+b·Dvp (g), ∀f, g ∈ C ∞ (Q), ∀a, b ∈ R. (2) Verifica la regla de Leibniz del producto en p: Dvp (f · g) = (Dvp f ) · g(p) + f (p) · Dvp (g), ∀f, g ∈ C ∞ (Q) Demostración de (2). Si vp = [γ], entonces Dvp (f · g) = dtd |t=0 ((f · g) ◦ γ)(t) = dtd |t=0 ((f ◦ γ) · (g ◦ γ))(t) = ( dtd |t=0 (f ◦ γ)(t)) · g(γ(0)) + f (γ(0)) · ( dtd |t=0 (g ◦ γ)(t)) = Dvp (f ) · g(p) + f (p) · Dvp (g). 2 3.2. ESTRUCTURA DEL ESPACIO TANGENTE 55 Ahora estamos en condiciones de establecer nuestra última definición de vector tangente. Definición 3.1.5 Sea Q una variedad diferenciable y p ∈ Q. Un vector tangente en p a Q (como derivación) es una aplicación Dvp : C ∞ (Q) → R tal que: (1) Es R-lineal. (2) Verifica la regla de Leibniz del producto en p. Observaciones: (1) Obviamente, cada vector tangente según las anteriores definiciones proporciona un vector tangente como derivación. Más aún, el recı́proco también es cierto. Esto es, si tenemos un vector tangente como derivación vp = Dvp entonces existe un único vector tangente [γ] tal que1 : Dvp (f ) = vp (f ) = d |t=0 (f ◦ γ)(t) ∀f ∈ C ∞ (Q). dt (2) Si dos funciones f , g coinciden en un entorno V de p se puede demostrar que Dvp f = Dvp g. En consecuencia, un vector tangente en p como derivación también proporciona una aplicación C ∞ (V ) → R, R-lineal y que verifica la regla del producto, para todo entorno V de p. Esta tercera definición de vector tangente a p es la más abstracta de las tres, aunque también la más cómoda desde el punto de vista puramente matemático. En adelante diremos que “vp es un vector tangente a p” y usaremos cualesquiera de las tres definiciones, según conveniencia. 3.2. Estructura del espacio tangente En adelante denotaremos por Tp Q el conjunto de todos los vectores tangentes en p a Q, y lo llamaremos espacio tangente en p a Q. 1 Véase [O’N, Capı́tulo 1]; en la próxima sección veremos explı́citamente cómo un vector tangente como derivación puede expresarse por coordenadas o como clase de equivalencia de curvas. 56 3.2.1. CAPÍTULO 3. ESPACIO TANGENTE Vectores tangentes inducidos por los entornos coordenados Sea Q una variedad n-dimensional y consideremos un punto p ∈ Q. Existe una manera natural de asociar a cada entorno coordenado (U, ϕ = (q 1 , . . . , q n )) n vectores tangentes en p a Q. En efecto, fijado i ∈ {1, . . . , n} consideremos el vector ei = (0, . . . , 1(i) , . . . , 0) ∈ Rn . Definimos la recta ri : ri : R → Rn t 7→ ϕ(p) + t · ei . A continuación, tomemos la preimagen por ϕ de la recta ri anterior: γi :] − ², ²[ → Q t 7→ ϕ−1 (ϕ(p) + t · ei ). Obtenemos ası́ n vectores tangentes en p, [γi ], i = 1, . . . , n, para cada entorno coordenado. Observemos que d d |t=0 (ϕ ◦ γi )(t) = |t=0 (ϕ(p) + t · ei ) = ei . dt dt Es decir, el vector de Rn asociado al vector tangente por coordenadas [γi ] mediante (U, ϕ) vuelve a ser ei (véase la Figura 12). Figura 12 Observemos además que en este caso la derivación asociada a vp ≡ [γi ] es Dvp : C ∞ (Q) → R ∂(f ◦ϕ−1 ) ∂f (ϕ(p)). f 7→ ∂q i (p) := ∂xi 3.2. ESTRUCTURA DEL ESPACIO TANGENTE 57 En efecto: Dvp (f ) = dtd |t=0 (f ◦ γi )(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γi )(t) P ◦ϕ−1 ) = nj=1 ∂(f∂x (ϕ(p)) · dtd |t=0 q j ◦ ϕ−1 (ϕ(p) + tei ) j Pn ∂(f ◦ϕ−1 ) ◦ϕ−1 ) (ϕ(p)), = j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j (p) + δij t) = ∂(f∂x i donde recordemos que q j = xj ◦ ϕ y δij es la delta de Kronecker. Esto justifica que de ahora en adelante sigamos la notación Dvp ≡ ∂q∂ i |p siempre que vp = [γi ]. En resumen, fijado un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) hemos obtenido n derivaciones en p, ∂ ∂q i |p : C ∞ (Q) → R ∂f f 7→ ∂q i (p) i = 1, . . . , n. Ejemplo. Consideremos la aplicación f : R2 → R, f (x, y) = x2 + y. Consideremos coordenadas polares (U, ϕ = (ρ, θ)) con U = R2 − {(x, 0) : x ≤ 0}. Si tomamos p = (0, 1) entonces ϕ(p) = (ρ(p), θ(p)) = ∂ ∂ (1, π/2). Por tanto, para los vectores tangentes ∂ρ |p y ∂θ |p tenemos: ∂ | ∂ρ p ∂ ∂θ ∂ (f ) = ∂f (p) ∂ρ |(1,π/2) (ρ2 cos2 θ + ρsenθ) ∂ρ = (2ρ cos2 θ + senθ) |(1,π/2) = 1. ∂ |p (f ) = ∂f (p) = ∂θ |(1,π/2) (ρ2 cos2 θ + ρsenθ) ∂θ 2 = (−ρ sen2θ + ρ cos θ) |(1,π/2) = 0. Ejercicio. Para Q = R2 y coordenadas usuales (x, y), compruébese ∂ ∂ que ∂x |p y ∂y |p coinciden con las derivadas parciales usuales en p. 3.2.2. Estructura de espacio vectorial de Tp Q Cuando estudiamos el concepto de vector tangente por coordenadas llamamos la atención sobre la estructura de espacio vectorial de dimensión n del espacio tangente. La estructura de espacio vectorial resulta también obvia (no tanto su dimensionalidad) tratando los vectores tangentes como derivaciones. En efecto, si vp , wp ∈ Tp Q entonces la suma vp + wp : C ∞ (Q) → R f 7→ vp (f ) + wp (f ), 58 CAPÍTULO 3. ESPACIO TANGENTE y el producto por un escalar λ ∈ R λ · vp : C ∞ (Q) → R f 7→ λ · vp (f ), verifica todas las propiedades de espacio vectorial. El siguiente resultado permite trabajar con facilidad en coordenadas. Proposición 3.2.1 Para cada entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de p ∈ Q se tiene que Bpϕ = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) es una base de Tp Q. P Además, si vp ∈ Tp Q entonces vp = ni=1 vp (q i ) ∂q∂ i |p . Demostración. Ya vimos que para cada entorno coordenado (U, ϕ) se tiene el isomorfismo natural v1 vp 7→ ... ∈ Rn . vn En particular, ∂q∂ i |p → ei ∈ Rn . Por tanto, Bpϕ se aplica en la base usual P de Rn y, es entonces una base. Más aún, si vp = ni=1 v i ∂q∂ i |p entonces j vp (q ) = n X i=1 v i ∂q j ∂q i (p) = n X v i δij = v j . i=1 2 En particular, si (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) es otro entorno coordenado de p ∈ Q entonces ∂q∂ j |p se puede escribir como combinación lineal de elementos de la base Bpϕ̃ = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ). Con más precisión: n X ∂ q̃ i ∂ ∂ | = (p) i |p . p j j ∂q ∂q ∂ q̃ i=1 (3.5) Observaciones: (1) La expresión (3.5) se reduce a aplicar la regla de la cadena evaluando en la correspondiente función. En efecto, ∂ ∂q j −1 −1 −1 ∂(f ◦ϕ ) ∂f |p (f ) = ∂q (ϕ(p)) = ∂(f ◦ϕ̃ ∂x◦jϕ̃◦ϕ ) (ϕ(p)) j |p = ∂xj Pn ∂ q̃i P ◦ϕ̃−1 ∂ q̃ i ∂ (ϕ̃(p)) ∂q = ni=1 ∂f∂x i j (p) = i=1 ∂q j (p) ∂ q̃ i |p (f ). (3.6) 3.2. ESTRUCTURA DEL ESPACIO TANGENTE 59 (2) También seguiremos la notación v i = q̇ i (vp )(= vp (q i )). Por tanto, i q̃˙ (vp ) = n X ∂ q̃ i (p) · q̇ j (vp ) j ∂q j=1 (3.7) (o, más brevemente, si se da por supuesto el vector vp entonces P i ∂ q̃ i j q̃˙ = nj=1 ∂q j q̇ ). Ejemplos: (1) En R2 consideramos las coordenadas usuales ϕ = (x, y). Fijemos p0 ∈ R2 y consideremos la base del espacio tangente en p0 Bp0 = ∂ ∂ ( ∂x |p0 , ∂y |p0 ). Tenemos pues las aplicaciones C ∞ (R2 ) → R, f 7→ ∂f (p ) ∂x 0 |p0 : C ∞ (R2 ) → R, f 7→ ∂f (p0 ). ∂y ∂ | : ∂x p0 ∂ ∂y Además, dado vp0 ∈ Tp0 R2 se tiene vp0 = a ∂ ∂ |p0 +b |p ∂x ∂y 0 con a = vp0 (x) ≡ ẋ(vp0 ) b = vp0 (y) ≡ ẏ(vp0 ). Se puede establecer por tanto un isomorfismo canónico ip0 : R2 → Tp0 R2 ∂ ∂ (a, b) 7→ (a ∂x |p0 +b ∂y |p0 ). Obviamente, esto es extensible a Rn . De hecho, podemos trabajar indistintamente con Rn o con su tangente Tp0 Rn vı́a el isomorfismo canónico ip0 anterior. Más aún, en todo espacio vectorial V (R) existe una identificación natural entre Tv V y V , ∀v ∈ V . En efecto, fijado v ∈ V , para cada w ∈ V se tiene una curva t 7→ v + tw que define un vector tangente wv ∈ Tv V . Se tiene entonces un isomorfismo natural Tv V → V wv 7→ w. Sin embargo, nada similar a estas identificaciones ocurre en variedades diferenciables arbitrarias. 60 CAPÍTULO 3. ESPACIO TANGENTE (2) Si tomamos coordenadas polares (ρ, θ) en un abierto U de R2 que contenga a p0 = (ρ0 cos θ0 , ρ0 senθ0 ) ∈ R2 y consideramos la base ∂ ∂ ( ∂ρ |p0 , ∂θ |p0 ) del espacio tangente Tp0 R2 tenemos ∂ | = ∂x | ∂ | ∂ρ p0 ∂ρ p0 ∂x p0 + ∂y | ∂ρ p0 ∂ ∂y ∂ ∂ |p0 = cos θ0 ∂x |p0 +senθ0 ∂y |p0 ∂ ∂θ + ∂y | ∂θ p0 ∂ ∂y ∂ ∂ |p0 = −ρ0 senθ0 ∂x |p0 +ρ0 cos θ0 ∂y |p0 . |p0 = ∂x | ∂ | ∂θ p0 ∂x p0 ∂ ∂ ∂ |p0 , ∂θ |p0 ) es una base de Tp0 R2 . Si escribimos êρ = ∂ρ |p0 , Ası́, ( ∂ρ 1 ∂ êθ = ρ0 ∂θ |p0 e identificamos (êρ , êθ ) vı́a ip0 con una base de R2 , esta base es ortonormal para el producto euclı́deo usual. ∂ ∂ Ejercicio. Calcular las coordenadas del vector vp = v 1 ∂x |p +v 2 ∂y |p ∈ 2 ∂ ∂ Tp R en la base ( ∂ρ |p , ∂θ |p ). 3.3. Variedad tangente Sea Q una variedad diferenciable de dimensión n. Definimos el espacio o variedad tangente a Q como T Q = ∪p∈Q Tp Q. Consideremos la proyección π : T Q → Q, π(vp ) = p. Nuestro objetivo es demostrar que cada entorno coordenado de Q induce un entorno coordenado en T Q de modo que T Q resulta ser, de manera natural, una variedad diferenciable de dimensión 2n. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q. Definimos ϕT : π −1 (U )(⊆ T Q) → ϕ(U ) × Rn (⊆ Rn × Rn ≡ R2n ) vp 7→ (ϕ(p), (vp (q 1 ), . . . , vp (q n ))) ≡ ((q 1 (p), . . . , q n (p)), (q̇ 1 (vp ), . . . , q̇ n (vp )). (3.8) Claramente, ϕT es biyectiva. Consideraremos en T Q la única topologı́a tal que cada ϕT es un homeomorfismo, esto es, la que admite como base topológica los subconjuntos de T Q que se pueden escribir como (ϕT )−1 (V ), para algún ϕT construido como (3.8) y algún abierto V de ϕ(U ) ⊆ Rn . Esta topologı́a resulta ser Hausdorff y ANII, siendo además T Q localmente homeomorfo a R2n . Ası́, T Q es una variedad topológica de dimensión 2n, donde cada (π −1 (U ), ϕT ) es obviamente un entorno coordenado. Si ahora tomamos otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) de Q, y definimos la correspondiente aplicación ϕ̃T : π −1 (Ũ ) → ϕ̃(Ũ ) × Rn (⊂ R2n ), 3.3. VARIEDAD TANGENTE 61 se tiene ϕ̃T ◦ (ϕT )−1 : ϕ(U ∩ Ũ ) × Rn → ϕ̃(U ∩ Ũ ) × Rn 1 n ((q 1 , . . . , q n ), (q̇ 1 , . . . , q̇ n )) 7→ ((q̃ 1 (q), . . . , q̃ n (q)), (q̃˙ (q, q̇), . . . , q̃˙ (q, q̇)), donde q = (q 1 , . . . , q n ), q̇ = (q̇ 1 , . . . , q̇ n ). Obviamente, ϕ̃T ◦ (ϕT )−1 es i diferenciable y q̃˙ (q, q̇) viene determinado por (3.7). En conclusion, Teorema 3.3.1 T Q es una variedad diferenciable de dimensión 2n. Observación. T Q es localmente difeomorfo a Q × Rn ; de hecho, dos variedades arbitrarias de la misma dimensión k son localmente difeomorfas (por ser difeomorfas a Rk localmente). Sin embargo, no son necesariamente globalmente difeomorfos. Ejemplos: (1) Consideremos R2 y T R2 . La aplicación R2 × R2 → T R2 ∂ ∂ (x0 , y0 , a, b) 7→ a ∂x |(x0 ,y0 ) +b ∂y |(x0 ,y0 ) es un difeomorfismo entre R4 y T R2 . Análogamente, la aplicación V × V → TV (v, w) 7→ (v, α0 (0)), con α(t) = v + tw, determina un difeomorfismo entre V × V y TV . (2) Justifiquemos que también T S 1 es difeomorfo a S 1 × R. Consideremos primero el vector tangente en cada punto de R2 −y ∂ ∂ |(x,y) +x |(x,y) . ∂x ∂y Este vector coincide con el vector coordenado ∂ ∂ ∂ |(x,y) = −ρsen(θ(x, y)) |(x,y) +ρ cos(θ(x, y)) |(x,y) ∂θ ∂x ∂y en el dominio de definición de las polares. De ahı́ que, sin posibil∂ idad de confusión, podamos denotarlo ∂θ |(x,y) para todo (x, y) ∈ 2 R −{(0, 0)}. En particular, sobre todo punto de S 1 , podemos ver 62 CAPÍTULO 3. ESPACIO TANGENTE ∂ ∂θ |(x,y) como la clase de equivalencia de la curva θ 7→ (cos(θ + θ0 ), sen(θ + θ0 )) ∈ S 1 , con x = cos θ0 , y = senθ0 . Fácilmente se comprueba entonces que S1 × R → T S1 ∂ ((x, y), a) 7→ a ∂θ |(x,y) es un difeomorfismo. (3) Sin embargo, la variedad T S 2 , tangente a la esfera bidimensional S 2 , no es difeomorfa a S 2 × R2 (véase la Sección 5.3). Por último, señalemos que cada curva γ(t) en Q determina un vector tangente [γ] ≡ γ 0 (0) en γ(0) o, con más generalidad, un vector tangente γ 0 (t0 ) en cada punto t0 de su dominio de definición (formalmente, γ 0 (t0 ) := [γ(t + t0 ]). Ası́, cada curva γ(t) en Q genera una curva γ 0 (t) en TQ. 3.4. Apéndice: notas sobre Mecánica Lagrangiana A continuación, vamos a aplicar estos conceptos al estudio de los sistemas lagrangianos. Recordemos que para una partı́cula que describe una curva x(t) en R3 con energı́a cinética T = (1/2)m k x0 (t) k2 y energı́a potencial V (x(t), t), la lagrangiana se define como 1 L(x, ẋ, t) = m k ẋ k2 −V (x, t), 2 que es una función explı́cita de la posición, la velocidad y también del tiempo t (en el caso de que lo sea V ). Si, p. ej., la trayectoria de la partı́cula está restringida a pasar por una superficie S ⊂ R3 , es natural pensar que el sistema “pierde un grado de libertad”, y la lagrangiana será una función con dominio la superficie, junto con todos los planos tangentes a ella posibles, más, eventualmente, el tiempo. Esta situación se puede generalizar y abstraer progresivamente, lo que conduce a los siguientes conceptos. 3.4. APÉNDICE: MECÁNICA LAGRANGIANA 3.4.1. 63 Lagrangianas Con bastante generalidad, se postula que el espacio de configuración de un sistema mecánico es una variedad diferenciable arbitraria Q siendo entonces la lagrangiana una función sobre T Q o, con más generalidad (lagrangianas dependientes del tiempo), L : T Q × R → R, donde la coordenada natural de R en T Q × R o “tiempo” se usará para parametrizar las curvas bajo consideración (fórmula (3.9)). El dominio de definición de la lagrangiana es pues una variedad producto N = T Q × R, donde usualmente se trabaja con coordenadas tipo (q, q̇, t), esto es, coordenadas (q, q̇) ≡ ϕT como en (3.8) junto a la coordenada usual de R. Tiene sentido pues considerar ∂L , ∂L y ∂L . Sea ∂q ∂ q̇ ∂t γ:I⊂R →Q t 7→ γ(t) una curva diferenciable (tomando coordenadas podemos escribir t → q(t)). Esta curva induce a su vez curvas en T Q y en N = T Q × R: I ⊂ R → TQ t 7→ γ 0 (t) I ⊂ R → TQ × R t 7→ (γ 0 (t), t). (3.9) En coordenadas esta última aplicación se suele escribir (q(t), q̇(t), t), donde cada q̇ i (t) es igual a la componente i-ésima del vector tangente γ 0 (t), que coincide con la derivada de q i (t) ≡ q i (γ(t)) en cada t ∈ I, dq i (t) ∀t ∈ I. dt Obsérvese que, en general, si ρ(t) = (q(t), q̇(t), t) es una curva definida directamente en N = T Q × R entonces se tiene q̇ i (t) = = (t) ρ̇(t)(L) = d(L◦ρ) dt dq̇ i ∂L ∂L i=1 ( ∂q i (q(t), q̇(t), t) dt (t) + ∂ q̇ i (q(t), q̇(t), t) dt (t) + Pn dq i ∂L (q(t), q̇(t), t)). ∂t Pero sólo cuando la curva ρ(t) es del tipo ρ(t) = γ 0 (t) para alguna curva γ(t) de Q se puede escribir dq̇ i d2 q i dq i = q̇ i (t); = 2. dt dt dt 64 3.4.2. CAPÍTULO 3. ESPACIO TANGENTE Curvas crı́ticas de la acción Es sabido que, en la deducción variacional de las Recuaciones de t Euler-Lagrange, se considera el funcional acción A(γ) = t01 L(γ 0 (t), t)dt sobre curvas diferenciales γ : [t0 , t1 ] → Q. La compacidad de [t0 , t1 ] (concretamente, la existencia de un “número de Lebesgue”) permite hallar un número finito de entornos coordenados (U (α) , q (α) ) y una partición del intervalo t0 = s0 < s1 < . . . < sk = t1 tal que γ([si , si+1 ]) ⊂ U (αi ) para algún αi . Ası́, tiene sentido escribir Z t1 k Z si X 0 A(γ) = L(γ (t), t)dt = L(q (αi ) (t), q̇ (αi ) (t), t)dt t0 i=1 si−1 para poder deducir expresiones manejables en coordenadas. Tı́picamente, en Mecánica Lagrangiana se consideran curvas que conectan dos puntos fijos p0 , p1 ∈ Q, y que son crı́ticas para el funcional acción A en el siguiente sentido. Sea γ una curva que conecta p0 con p1 , γ : [t0 , t1 ] → Q, γ(t0 ) = p0 , γ(t1 ) = p1 . Una variación de γ es una aplicación diferenciable ] − ², ²[×[t0 , t1 ] → Q, (s, t) 7→ γs (t) para algún ² > 0, que verifica γ0 (t) = γ(t), ∀t ∈ [t0 , t1 ] (en ocasiones, también conviene permitir que el intervalo de definición de γs dependa de s, por lo que el dominio de la variación se generaliza subsecuentemente). La variación se llama de extremos fijos si γs (t0 ) = p0 , γs (t1 ) = p1 , ∀s ∈] − ², ²[. Para cada s fijo, la curva t 7→ γs (t) es una curva longitudinal de la variación. Para cada t fijo, la curva s 7→ γs (t) es una curva transversal; esta curva determina en s = 0 un vector tangente V (t) para cada t. A la curva en T Q t 7→ V (t) se le llama campo variacional o variación infinitesimal de γ. Obsérvese que la variación de γ en Q induce una variación de γ 0 en T Q: ] − ², ²[×[t0 , t1 ] → T Q, (s, t) 7→ γs0 (t), (3.10) 3.4. APÉNDICE: MECÁNICA LAGRANGIANA 65 donde γs0 (t) denota al vector tangente en γs (t) determinado por la curva longitudinal γs (a su vez, esta variación induce trivialmente una en T Q × R). Se dice que γ es una curva crı́tica para A si para toda variación de γ en el conjunto de curvas que se esté considerando se tiene dA(γs ) |s=0 = 0. ds No es difı́cil demostrar que las curvas crı́ticas para variacioness de extremos fijos coinciden con las que, escritas en cualesquiera coordenadas, satisfacen las ecuaciones de Euler-Lagrange: d dt µ ∂L ∂ q̇ i ¶ − ∂L = 0. ∂q i Ejercicios Ejercicio 1. Razonar por qué se puede identificar Tp R2 con R2 , ∀ p ∈ R2 . Ejercicio 2. Calcúlese una base de T(1,1,2) Q, siendo Q el paraboloide dado por la gráfica de la función z = x2 + y 2 . Ejercicio 3. Calcúlese una base de T( √1 ,0,√2) Q, siendo Q el elipsoide 2 de ecuación 2 x2 + y 2 + z4 = 1. Ejercicio 4. Sea Q una variedad, p ∈ Q y v ∈ Tp Q. Demuéstrese: (i) Si f ∈ C ∞ (Q) es constante entonces v(f ) = 0. (ii) Si f, g ∈ C ∞ (Q) coinciden en un entorno de p entonces v(f ) = v(g). Ejercicio 5. Se consideran las coordenadas cilı́ndricas definidas en [Tema 2, Apéndice 2]. Escrı́banse ∂/∂ρ|p , ∂/∂θ|p y ∂/∂z|p como combinación lineal de la base de Tp R3 inducida por las coordenadas usuales (cartesianas) de R3 . Ejercicio 6. Sean U = {(x, y, z) : z > 0} y f : U → R la aplicación definida por f (x, y, z) = 3 x + y/z. Calcular qué valor toman sobre f las derivaciones asociadas a las coordenadas cilı́ndricas en el punto p = (1, 1, 3). 66 CAPÍTULO 3. ESPACIO TANGENTE Ejercicio 7. Sean p = (3, 4, 2) ∈ R3 y vp = −∂x + 3 ∂y − 2 ∂z ∈ Tp R3 . Hállese la expresion de vp en coordenadas cilı́ndricas. Ejercicio 8. Dado p = (0, 1, 1) ∈ R3 , se considera vp = −2 ∂ρ + ∂θ − ∂z ∈ Tp R3 . Calcúlese la expresión de vp en coordenadas cartesianas. Ejercicio 9. Sea F : R3 −→ R2 la aplicación definida por F (x, y, z) = (x2 + y 2 , z 2 ). Discutir si c = (1, 1) es un valor regular de F , y en tal caso, determinar la dimensión de la subvariedad regular Q = F −1 (c), y hallar T(1,0,1) Q. Ejercicio 10. Dada la aplicación F : R4 −→ R3 , definida por F (x, y, z, t) = (2 x + y, t, z), estudiar si Q = F −1 (c) es una subvariedad regular de R4 , con c = (0, 1, 1), y en caso afirmativo, calcular T(1,−2,1,1) Q. Ejercicio 5. Idem para las coordenadas esféricas ϕ = (r, θ, φ) definidas en ese mismo apéndice. Capı́tulo 4 Aplicaciones diferenciables entre variedades En este capı́tulo pretendemos generalizar el concepto de diferencial de una aplicación diferenciable entre espacios euclı́deos a aplicaciones entre variedades arbitrarias. Para ello partiremos del conocimiento previo de algunas nociones sobre el espacio dual, que se desarrollan en el Apéndice. Más aún, definiremos las variedades cotangentes, que sirven de dominio natural a la Mecánica Hamiltoniana, y generalizaremos algunos teoremas fundamentales sobre aplicaciones diferenciables. Recordemos que, dada una función diferenciable de dos variables reales f : R2 → R, el plano tangente a su gráfica en un punto (x0 , y0 , f (x0 , y0 )) admite la expresión z − z0 = ∂f ∂f (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ). ∂x ∂y Este plano se suele escribir como una diferencial en (x0 , y0 ) ∈ R2 , dz ≡ (df )(x0 ,y0 ) = ∂f ∂f (x0 , y0 )dx + (x0 , y0 )dy. ∂x ∂y Esta diferencial puede interpretarse como una función lineal sobre 67 68 CAPÍTULO 4. APLICACIONES DIFERENCIABLES T(x0 ,y0 ) R2 . En efecto, tomando un vector tangente arbitrario v = v1 ∂ ∂ |(x0 ,y0 ) +v 2 |(x ,y ) ∈ T(x0 ,y0 ) R2 ∂x ∂y 0 0 se tiene (df )(x0 ,y0 ) (v) = v 1 ∂f ∂f (x0 , y0 ) + v 2 (x0 , y0 ) ∈ R, ∂x ∂y véase la Figura 13. Figura 13 En la Sección 4.1 se va a extender este punto de vista a cualquier función real sobre Q lo que, en particular, permitirá definir la variedad cotangente, Sección 4.2. En la Sección 4.3 extenderemos el concepto de diferencial a cualquier aplicación entre dos variedades. 4.1. DIFERENCIAL DE UNA FUNCIÓN 69 4.1. Diferencial de una función sobre una variedad 4.1.1. Concepto Sea vp = [γ] un vector tangente a Q en p. Recordemos que para f ∈ C ∞ (Q) habı́amos definido la derivada de f en la dirección de vp como vp (f ) = dtd |t=0 (f ◦ γ) ∈ R. En consecuencia, para cada f ∈ C ∞ (Q) se tiene la aplicación dfp : Tp Q → R vp 7→ vp (f ) (4.1) a la que denominaremos diferencial de f en p. Como muestra la siguiente proposición, la aplicación dfp es una forma lineal sobre Tp Q (véase (1) del Apéndice). En efecto, Proposición 4.1.1 La aplicación dfp definida en (4.1) es lineal, esto es, dfp ∈ Tp Q∗ . Demostración. dfp (avp +bwp ) = (avp +bwp )(f ) = avp (f )+bwp (f ) = a·dfp (vp )+b·dfp (wp ) para todo vp , wp ∈ Tp Q y todo a, b ∈ R. 2 Ası́, la aplicación dfp extiende a la diferencial usual de funciones reales, y representa la mejor aproximación lineal a f en p. 4.1.2. Expresión en coordenadas A continuación estudiaremos bases de Tp Q∗ asociadas a entornos coordenados, y determinaremos la expresión en coordenadas de la diferencial de f : Q → R. Fijemos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de la variedad Q. La base canónica de Tp Q asociada a dicho entorno es Bpϕ = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ). Proposición 4.1.2 La base dual de Bpϕ (véase (2) del Apéndice) es Bpϕ∗ = (dqp1 , . . . , dqpn ). 70 CAPÍTULO 4. APLICACIONES DIFERENCIABLES Demostración. Obsérvese en primer lugar que q i : U ⊆ Q → R es, obviamente, diferenciable, por lo que, efectivamente dqpi define un elemento de Tp Q∗ . El resultado se deduce por tanto de: dqpj ( ∂q j ∂ | ) = (p) = δij p ∂q i ∂q i ∀i, j ∈ {1, . . . , n}. 2 Podemos ahora considerar la matriz de dfp asociada a Bpϕ , esto es, (siguiendo el Apéndice), las coordenadas de dfp en Bpϕ∗ . Usando que ∂ ∂f |p (f ) = i (p) ∀i ∈ {1, . . . , n} i ∂q ∂q dicha matriz queda: µ ¶ ∂ ∂ M (dfp , {1} ← = dfp ( 1 |p ), . . . , dfp ( n |p ) ∂q ∂q µ ¶ ∂f ∂f = (p), . . . , n (p) . ∂q 1 ∂q Bpϕ ) Ası́, n X ∂f dfp = (p)dqpi , i ∂q i=1 (4.2) y si vp ∈ Tp Q entonces n n X X ∂f ∂f i dfp (vp ) = (p) · dqp (vp ) = (p) · vpi , i i ∂q ∂q i=1 i=1 donde vp = 4.1.3. Pn i=1 vpi ∂q∂ i |p . Cambio de coordenadas Tomemos ahora otro sistema de coordenadas (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) alrededor de p. Para estas coordenadas se verifica igualmente dfp = n X ∂f (p)dq̃pi . i ∂ q̃ i=1 4.2. EL ESPACIO COTANGENTE 71 Ahora bien, por (4.2) el cambio de base entre Bpϕ∗ y Bpϕ̃∗ queda (compárese con el Apéndice (3)): dqpi = n X ∂q i (p)dq̃pj . j ∂ q̃ j=1 En consecuencia, de la anterior ecuación se tiene fácilmente la siguiente relación entre las parciales de f con respecto a las distintas coordenadas: Pn ∂qi Pn ∂qi ∂f ∂ ∂ ∂ (p) = df ( | ) = df ( (p) | ) = p p p p j j j i i=1 ∂ q̃ i=1 ∂ q̃ j (p)dfp ( ∂q i |p ) ∂ q̃ ∂q Pn ∂ q̃ ∂qi ∂f = i=1 ∂ q̃j (p) ∂q i (p). Se obtiene ası́ la relación entre las coordenadas de dfp en Bpϕ̃∗ y Bpϕ∗ . 4.2. El espacio cotangente El desarrollo de la sección anterior es aplicable a cualquier forma lineal sobre Tp Q. Ası́, si fijamos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de p ∈ Q y consideramos las bases Bpϕ y Bpϕ∗ entonces a cada φ ∈ Tp Q∗ le corresponden n números reales (b1 , . . . , bn ) tales que φ= n X bi · dqpi . i=1 Estos n números reales son las coordenadas de φ en Bpϕ∗ y vienen dados por la expresión bi = φ( ∂ |p ) ∀i ∈ {1, . . . , n}. ∂q i Si tomamos otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) la forma lineal φ tendrá coordenadas (b̃1 , . . . , b̃n ), deduciéndose la relación b̃j = n X ∂q i (p)bi . j ∂ q̃ i=1 (4.3) Como ocurrı́a con los vectores tangentes, esta relación permite definir cada elemento del espacio dual Tp Q∗ por coordenadas como una n-upla 72 CAPÍTULO 4. APLICACIONES DIFERENCIABLES asignada a cada entorno coordenado de p que se transforma según (4.3) frente a cambios de coordenadas. Análogamente al caso del espacio tangente, llamamos espacio o variedad cotangente de Q a T Q∗ = ∪p Tp Q∗ . Este espacio también se considera dotado de una estructura natural de variedad diferenciable, definiéndose un atlas diferenciable como sigue. Sea π : T Q∗ → Q, π(αp ) = p, la proyección canónica, y (U, ϕ) un entorno coordenado de Q. Definimos ϕC : π −1 (U ) → ϕ(U ) × Rn (⊆ R2n ) αp 7→ (q 1 (p), . . . , q n (p), p1 (αp ), . . . , pn (αp )), P donde pi (αp ) = αp ( ∂q∂ i |p ), esto es, αp = ni=1 pi (αp )dqpi . (4.4) Nota. En Mecánica Hamiltoniana se parte de la variedad de configuración Q, de su espacio cotangente T Q∗ (o espacio de fases) y de una hamiltoniana H : T Q∗ × R → R. A las coordenadas pi se les llama momentos generalizados. Análogamente al caso lagrangiano (Sección 3.4), en Mecánica Hamiltoniana se pueden calcular curvas crı́ticas de la hamiltoniana (u otros funcionales relacionados con ella) para diversos tipos de variaciones. Esto es, curvas en T Q∗ ρ : [t0 , t1 ] → T Q∗ , ρ(t) = (q(t), p(t)) tales que para cualquier variación ] − ², ²[×[t0 , t1 ] → T Q∗ (s, t) 7→ ρs (t) (en la clase de curvas que se considere) la función µ Z t1 ¶ Z t1 A(ρs ) = H(ρs (t), t)dt ≡ H(qs (t), ps (t), t)dt t0 t0 verifique dA | = 0. Pero, a diferencia del caso lagrangiano, tanto la ds s=0 curva ρ(t) como la variación ρs (t) se toman directamente en T Q∗ , esto es, no se construyen a partir de curvas de Q (compárese con (3.10)). La consecuencia de esta “mayor libertad” en las variaciones, es que las ecuaciones de Hamilton ∂H dq i (t) = (q(t), p(t), t); dt ∂pi dpi ∂H (t) = − i (q(t), p(t), t), dt ∂q (4.5) 4.3. DIFERENCIAL DE UNA APLICACIÓN 73 (que caracterizan localmente a curvas extremales apropiadas), son 2n ecuaciones de primer orden –en lugar de n ecuaciones de segundo, como en el caso lagrangiano. 4.3. Diferencial de una aplicación entre variedades En esta sección introduciremos el concepto de diferencial de una aplicación entre dos variedades arbitrarias. Sean Q, Q0 dos variedades diferenciables y F : Q → Q0 una aplicación diferenciable entre ellas. Es claro que si vp = [γ] ∈ Tp Q entonces [F ◦ γ] ∈ TF (p) Q0 . Pues bien, llamamos diferencial de F en p a la aplicación dFp : Tp Q → TF (p) Q0 [γ] 7→ [F ◦ γ], véase la Figura 14. Figura 14 Observación. Para comprobar que esta definición es consistente, debemos tener en cuenta lo siguiente: 74 CAPÍTULO 4. APLICACIONES DIFERENCIABLES (1) La definición es independiente de la curva de la clase [γ] que se elija. En efecto, supongamos que m y n son las dimensiones de Q y Q0 , respectivamente. Sean (U, ϕ = (q 1 , . . . , q m )) y (U 0 , ϕ0 = (q 01 , . . . , q 0n )) entornos coordenados alrededor de p y de F (p), respectivamente. Si vp = [γ] ∈ Tp Q entonces d | dt t=0 (ϕ0 ◦ F ◦ γ)(t) = dtd |t=0 (ϕ0 ◦ F ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t) P ∂(ϕ0 ◦F ◦ϕ−1 ) = m (ϕ(p)) dtd |t=0 (q j ◦ γ)(t). j=1 ∂xj (4.6) d Ahora bien, si γ ∼ ρ (esto es, vp = [γ] = [ρ]) entonces dt |t=0 (q j ◦ γ)(t) = dtd |t=0 (q j ◦ ρ)(t) ∀j. En consecuencia, de (4.6) deducimos que la definición de diferencial sólo depende del vector vp y no del representante de la clase. (2) Esta definición es consistente con la definición de diferencial que vimos para una función real f : Q → R. En efecto, esto se ve fácilmente gracias a la identificación entre R y Tf (p) R, ya que dfp (vp ) = vp (f ) = d |t=0 (f ◦ γ) ∈ Tf (p) R ≡ R. dt De ahora en adelante usaremos la notación q 0i ◦ F ≡ F i 1 n ∂ | (ϕ0 ◦ F ◦ ϕ−1 ) = ( ∂F , . . . , ∂F )(p). ∂xj ϕ(p) ∂q j ∂q j Con esta notación dFp (vp ) adopta la expresión: à m ! n X X ∂F i ∂ dFp (vp ) = (p)v j | , j 0i F (p) ∂q ∂q i=1 j=1 P j ∂ donde vp = m j=1 v ∂q j |p . Esto es, matricialmente las coordenadas de 0 dFp (vp ) en la base Bpϕ = ( ∂q∂01 |p , . . . , ∂q∂0n |p ) son ∂F 1 ∂F 1 1 . . . v 1 m ∂q ∂q .. .. · .. . .. (4.7) . . . . m ∂F n ∂F n v . . . ∂qm ∂q 1 p De hecho, (4.7) puede considerarse como definición de dFp , aplicable directamente cuando los vectores tangentes se dan por coordenadas. 4.3. DIFERENCIAL DE UNA APLICACIÓN 75 De todo lo anterior resulta inmediato que dFp : Tp Q → TF (p) Q0 es lineal. La siguiente proposición relaciona los vectores tangentes dFp (vp ) y vp vistos como derivaciones. Proposición 4.3.1 Si vp ∈ Tp Q y F : Q → Q0 es una aplicación diferenciable entonces dFp (vp ) : C ∞ (Q0 ) → R g 7→ vp (g ◦ F ). (4.8) Demostración. Si vp = [γ] entonces dFp (vp ) = [F ◦ γ]. Por tanto, dFp (vp )(g) = d d |t=0 g ◦ (F ◦ γ) = |t=0 (g ◦ F ) ◦ γ = vp (g ◦ F ). 2 dt dt Figura 15 Obviamente, (4.8) también puede tomarse como definición de dFp , aplicable directamente a vectores dados como derivaciones. Ejemplos: (1) Para una función diferenciable F : Rm → Rn , si identificamos los espacios tangentes Tp Rm , TF (p) Rn con Rm , Rn (véase (4.7)), respectivamente, entonces la definición de diferencial (dF )p coincide con la usual entre Rm y Rn . 76 CAPÍTULO 4. APLICACIONES DIFERENCIABLES (2) Consideremos la circunferencia S 1 ⊂ R2 ≡ C (véase la Sección 3.3) y la aplicación diferenciable F : S 1 → S 1 , F (z) = z 2 , ∀z ∈ C. Para calcular dFp0 , p0 ∈ S 1 , tomamos como coordenada en torno a p0 el “ángulo” θ y consideramos la curva θ → (cos θ, senθ) ∈ S 1 ⊂ R2 . Si θ0 es tal que p0 = (cos θ0 , senθ0 ) entonces: dFp0 ( ∂ d |p0 ) = |θ F (cos θ, senθ) ∂θ dθ 0 d ∂ |θ0 (cos 2θ, sen2θ) = 2 |F (p0 ) , dθ ∂θ donde recordemos (véase [Sección 3.3, Ejemplo (2)]) = ∂ ∂ ∂ |p0 = −senθ0 |p0 + cos θ0 |p . ∂θ ∂x ∂y 0 (3) Consideremos una subvariedad regular Q ⊂ Rn+p y una aplicación F : Q → Q0 que sea restricción de otra aplicación F̄ : Rn+p → Q0 . Se verifica entonces dFp = dF̄p |Tp Q . Ası́, por ejemplo, la aplicación F : S 2 → S 2 , F (x) = −x es la restricción a S 2 de la aplicación F̄ : R3 → R3 , F̄ (x) = −x. Como, salvo identificación, dF̄p = −Id3 , se tiene à n ! n X ∂ X ∂ i dFp a |p = − ai i |(−p) i ∂x ∂x i=1 i=1 para cualquier vector tangente 4.4. Pn i=1 ai ∂x∂ i |p ∈ Tp S 2 . Teoremas fundamentales En esta sección enunciaremos con generalidad en variedades arbitrarias algunos teoremas fundamentales relacionados con las aplicaciones diferenciables. Esencialmente, sus demostraciones se reducen a las de los correspondientes teoremas entre espacios euclı́deos, una vez escritos los enunciados en coordenadas. 4.4. TEOREMAS FUNDAMENTALES 77 Teorema (Regla de la cadena): Consideremos dos aplicaciones diferenciables entre variedades F : Q → Q0 y G : Q0 → Q00 y consideremos sus respectivas diferenciales dFp : Tp Q → TF (p) Q0 y dGF (p) : TF (p) Q0 → TG(F (p)) Q00 con p ∈ Q. Se verifica entonces: d(G ◦ F )p = dGF (p) ◦ dFp . Teorema de la Función Inversa: Sea F : Q → Q0 una aplicación diferenciable y p0 ∈ Q. Supongamos que (dF )p0 : Tp0 Q → TF (p0 ) Q0 es biyectiva (por lo que, necesariamente, dim Q =dim Q0 ). Entonces existen entornos coordenados U de p0 y U 0 de F (p0 ) tales que F (U ) = U 0 y la restricción de F a U es biyectiva con inversa diferenciable; esto es, F |U : U → U 0 p 7→ F (p) −1 es un difeomorfismo. Además, d(F |−1 U )F (p0 ) = (dFp0 ) . (Obsérvese que F es un difeomorfismo local si y sólo si (dF )p es biyectiva para todo p ∈ Q.) Teorema de la Función Implı́cita: Sea F : Q → Q0 una aplicación diferenciable y q ∈ ImF (⊆ Q0 ) un valor regular de F , esto es, tal que para todo p ∈ F −1 (q) se tiene que dFp : Tp Q → TF (p) Q0 es suprayectiva. Entonces F −1 (q) es una variedad topológica de dimensión dim Q−dim Q0 ≥ 0 y admite una estructura diferenciable natural a partir de las cartas de Q. A cada variedad diferenciable obtenida mediante este teorema la llamaremos subvariedad de Q asociada al valor regular q de F . Observación 4.4.1 Sobre el Teorema de la Función Implı́cita merece tenerse en cuenta lo siguiente: (1) Sean, n = dim Q, m = dim Q0 . Como en el Teorema 2.5.3, para construir un atlas diferenciable en F −1 (q) se entiende que, para cada p ∈ F −1 (q) y cada entorno coordenado (U, ϕ) de Q alrededor de p, si las columnas i1 , . . . , im de dFp en esas coordenadas son independientes entonces se deben escoger las otras n − m funciones coordenadas de ϕ. (2) Como en la [Sección 4.3, Ejemplo (3)], la restricción de cualquier aplicación diferenciable definida sobre Q a una subvariedad suya es también diferenciable. Además, el espacio tangente a F −1 (q) en cada punto p ∈ F −1 (q) puede verse como un subespacio de Tp Q. 78 CAPÍTULO 4. APLICACIONES DIFERENCIABLES Observemos que, en el Teorema de la Función Inversa, dFp0 es biyectiva, mientras que en el Teorema de la Función Implı́cita dFp es sobreyectiva. Si dFp es inyectiva entonces existen entornos U de p y U 0 de F (p) tales que la restricción F |U : U → U 0 p 7→ F (p) es inyectiva. Esto es, F |U es un embebimiento en el sentido que definimos a continuación: Definiciones 4.4.2 Sea F : Q → Q0 una aplicación diferenciable. (1) F es una inmersión si dFp es inyectiva para todo p ∈ Q. En este caso diremos que (Q, F ) es una subvariedad inmersa en Q0 . (2) F es un embebimiento si, además, F es un homeomorfismo sobre su imagen F (Q). En este caso diremos que (Q, F ) es una subvariedad embebida en Q0 . En este último caso, F (Q) no es sólo una variedad topológica (con la topologı́a inducida de Q0 ) sino que la estructura diferenciable de Q se induce sobre F (Q) de modo que Q y F (Q) son variedades difeomorfas. Una subvariedad embebida es entonces equivalente a una subvariedad en el siguiente sentido: una variedad Q incluida en otra variedad Q0 es una subvariedad de ésta si la inclusión i : Q → Q0 es un embebimiento. Ejemplo. Consideremos tres curvas γi :]0, 1[→ R2 , γi0 (t) 6= 0 ∀t ∈ ]0, 1[, i = 1, 2, 3, cuyas imágenes y sentido de recorrido aparecen en la Figura 16. La curva γ1 es una inmersión, con lo que (]0, 1[, γ1 ) es una subvariedad inmersa en R2 . La curva γ2 es una inmersión inyectiva, aunque no un embebimiento. Finalmente, la curva γ3 sı́ resulta ser un embebimiento, y su imagen una subvariedad. Nota. Recordemos que en Mecánica Lagrangiana se postula que el espacio de configuración de un sistema fı́sico es una variedad diferenciable Q. El espacio de estados del sistema queda entonces modelado por la variedad tangente T Q. En ocasiones, existen “ligaduras” sobre los posibles estados del sistema, que se representan mediante una función F : T Q → Rk (o, más generalmente, F : T Q → Q0 ). En este caso se supone que los estados del sistema caen en F −1 (c) ⊂ T Q, para 4.5. APÉNDICE: EL ESPACIO DUAL 79 Figura 16 algún valor regular c ∈ Rk . Cuando existe una subvariedad S de Q tal que T S = F −1 (c) entonces se dice que las ligaduras son holónomas o integrables. En caso contrario, se dice que son anholónomas. 4.5. Apéndice: el espacio dual (1) Concepto de dual algebraico. Sea V (R) un espacio vectorial real de dimensión n. Se define el espacio dual V ∗ (R) de V (R) como: V ∗ (R) := (L(V, R) =){φ : V → R : φ lineal}. A cada elemento del dual φ ∈ V ∗ (R) se le llama forma lineal. El espacio dual V ∗ (R), dotado de sus operaciones naturales, es un espacio vectorial de dimensión n(= dim V · dim R). Si fijamos una base ordenada de V (R) B = (v1 , . . . , vn ) y tomamos {1} como base de R(R) entonces para cada φ ∈ V ∗ (R) podemos calcular la matriz de la aplicación φ expresada en dichas bases M (φ, B, {1})(≡ M (φ, {1} ← B)), que Pnmatriz i resulta ser igual a (φ(v1 ) . . . φ(vn )). De esta forma, si v = i=1 a vi ∈ V entonces 1 a n X φ(v) = φ(vi )ai = (φ(v1 ) . . . φ(vn )) · ... i=1 an 80 CAPÍTULO 4. APLICACIONES DIFERENCIABLES a1 = M (φ, {1} ← B) · ... ∈ R. an (2) Base dual. Consideremos los espacios vectoriales V (R), V ∗ (R) y fijemos una base B = (v1 , . . . , vn ) de V (R). Es conocido el siguiente resultado: Teorema 4.5.1 Existe una única base B ∗ = (φ1 , . . . , φn ) de V ∗ (R) que verifica φi (vj ) = δji ∀i, j ∈ {1, . . . , n}. A esta base B ∗ se la llama base dual de la base B. Además, para los elementos de esta base se tiene M (φ1 , {1} ← B) = (1, 0, . . . , 0) .. .. . . M (φn , {1} ← B) = (0, 0, . . . , 1). ∗ Fijada la base B =P(v1 , . . . , vn ) P y su base dual B = (φ1 , . . . , φn ) se P n n n verifica φj (v) = φj ( i=1 ai vi ) = i=1 ai φj (vi ) = i=1 ai δij = aj . Esto es, n X 1 n v = φ (v)v1 + · · · + φ (v)vn = φi (v)vi , ∀v ∈ V. Análogamente, si φ ∈ V ∗ y φ = bj . Esto es, 1 i=1 Pn i i=1 bi φ n φ = φ(v1 )φ + · · · + φ(vn )φ = n X entonces φ(vj ) = φ(vi )φi , Pn ∀φ ∈ V ∗ . i i=1 bi δj = (4.9) i=1 (3) Cambio de base dual. Sean B = (v1 , . . . , vn ), B = (v̄1 , . . . , v̄n ) dos bases de V (R) y 1 n ∗ B ∗ = (φ1 , . . . , φn ), B P= (φ , . . . , φ ) sus respectivas bases duales. Supongamos que v j = ni=1 aij vi , j ∈ {1, . . . , n}, es decir, a11 . . . a1n = ... . . . ... . an1 . . . ann M (IdV , B ← B) = (aij )i,j 4.5. APÉNDICE: EL ESPACIO DUAL 81 P Como consecuencia, si v ∈ V y v = ni=1 ai vi P ai = ni=1 aij aj . Esto es, a1 .. . = M (IdV , B ← B) · an = Pn j=1 aj v j entonces a1 .. . . an Comprobemos a continuación ∗ M (IdV ∗ , B ← B ∗ ) = M (IdV , B ← B)t . (4.10) P Obsérvese que, si escribimos φk = nj=1 bkj φ̄j entonces los elementos de ∗ la matriz (bkj ) serán los de la matriz M (Id, , B ← B ∗ ), pero el ı́ndice superior indicará ahora columna y no fila (como en (aij )). Ası́, (4.10) se sigue de bkj = φk (v̄j ) = akj (la primera igualdad por (4.9). Pn Pn j i Como consecuencia de (4.10), si ϕ = b ϕ = i i=1 j=1 bj ϕ se tiene n X b̄j = aij bi , i=1 (o bien, directamente, bj = ϕ(v j ) = Pn i=1 aij ϕ(vi ) = Pn i=1 aij bi ). (4) Trasposición de una aplicación lineal. Sean V (R), V 0 (R) dos espacios vectoriales y f : V → V 0 una aplicación lineal entre ellos. Para cada φ0 ∈ V 0∗ (R) podemos definir la aplicación φ0 ◦ f : V → R. Como φ0 ◦ f es una composición de aplicaciones lineales se tiene que φ0 ◦ f es también lineal y, por tanto, φ0 ◦ f ∈ V ∗ (R). Definición 4.5.2 Definimos la aplicación traspuesta f t de la aplicación lineal f : V → V 0 como la aplicación f t : V 0∗ → V ∗ φ0 7→ f t (φ0 ) := φ0 ◦ f. Se tiene entonces el siguiente resultado: Teorema 4.5.3 La aplicación traspuesta f t de una aplicación lineal f : V → V 0 verifica: (i) Es lineal. 82 CAPÍTULO 4. APLICACIONES DIFERENCIABLES (ii) Si B y B 0 son bases de V y V 0 , respectivamente, entonces M (f t , B ∗ ← B 0∗ ) = M (f, B 0 ← B)t . (iii) La aplicación trasposición t : L(V, V 0 ) → L(V 0∗ , V ∗ ) f 7→ f t es lineal. De hecho, es un isomorfismo de espacios vectoriales. (5) Teorema de reflexividad. Sean V (R) y V ∗ (R) un espacio vectorial y su dual, respectivamente. Podemos considerar el dual de V ∗ (R), o bidual de V (R): V ∗∗ (R) = (V ∗ (R))∗ . Estos tres espacios vectoriales tienen igual dimensión y, por tanto, son isomorfos. Sin embargo, mientras que no existe ningún isomorfismo canónico general entre V (R) y V ∗ (R), sı́ podemos definir uno entre V (R) y V ∗∗ (R). Ello, en la práctica, equivale a considerar ambos espacios como iguales. Concretamente, fijado un vector v ∈ V definimos la aplicación Φv : V ∗ → R φ 7→ φ(v) que es lineal y, por tanto, pertenece al bidual V ∗∗ (R). No es difı́cil comprobar: Teorema 4.5.4 (de Reflexividad). La aplicación Φ : V → V ∗∗ v 7→ Φv es un isomorfismo de espacios vectoriales. Otro modo de construir este isomorfismo es el siguiente (pruébese como ejercicio). Sean B, B dos bases de V (R). Existe un único isomorfismo F : V → V ∗ que, de manera ordenada, aplica B en B ∗ . Análogamente, existe un único isomorfismo G : V ∗ → V ∗∗ que aplica B ∗ en B ∗∗ . Con B obtenemos análogamente isomorfismos F , G. En general, F 6= F y G 6= G. Sin embargo, G ◦ F = G ◦ F , y ambos coinciden con el isomorfismo que proporciona el Teorema de Reflexividad. 4.5. APÉNDICE: EL ESPACIO DUAL 83 Una consecuencia inmediata del Teorema de Reflexividad es que cualquier base B 0 = (φ1 , . . . , φn ) de V ∗ (R) es la base dual de una única base B de V (R). En efecto, si tomamos la base dual de B 0 , podemos escribir B 0∗ = (Φv1 , . . . , Φvn ) donde B = (v1 , . . . , vn ) es una base de V (R). Entonces, se comprueba fácilmente que B ∗ = B 0 . Ejercicios Ejercicio 1. (a) Si F : Rn −→ Rm es una aplicación lineal, compruébese que, con las identificaciones usuales de Tp (Rk ) con Rk , se tiene (dF )p = F , ∀p ∈ Rn . (b) Sea Q una subvariedad de R3 . Si φ ∈ (R3 )∗ y f : Q −→ R es la función diferenciable sobre Q dada por f (p) = φ(p), ∀p ∈ Q, compruébese que (df )p (v) = φ(v), ∀v ∈ Tp Q. Ejercicio 2. Se consideran las aplicaciones f : R2 −→ R2 , g : R2 −→ R3 , dadas por f (x, y) = (x2 − 2y, 4x3 y 2 ), g(x, y) = (x2 y + y 2 , 2 − 2y 3 , yex ) Calcúlese: (a) la matriz de (df )(1,0) en coordenadas cartesianas; (b) ∂ ∂ ı́dem para (d(g ◦ f ))(1,0) ; (c) el valor de (df )(1,0) (2 ∂x − ∂y ). Ejercicio 3. Sea f : S 2 −→ R la función dada por f (x, y, z) = 2x − y + z. Calcúlese (df )p (v), siendo p = ( √12 , √12 , 0) y v = (1, −1, 1). Ejercicio 4. Sean Q y Q0 variedades diferenciables, Q×Q0 la variedad producto de Q por Q0 , (p, p0 ) ∈ Q × Q0 y f ∈ C ∞ (Q × Q0 ). Pruébese: v(f ) = v1 (f ◦ ip0 ) + v2 (f ◦ ip ) donde v ∈ T(p,p0 ) (Q × Q0 ), v1 = (dπQ )(p,p0 ) (v), v2 = (dπQ0 )(p,p0 ) (v), πQ , πQ0 son las proyecciones de Q × Q0 en Q y Q0 , respectivamente, e ip0 : Q −→ Q × Q0 , ip : Q0 −→ Q × Q0 son las inclusiones ip0 (q) = (q, p0 ), ∀q ∈ Q, ip (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 . Ejercicio 5. Sea F : Q −→ Q0 una aplicación diferenciable entre las variedades Q y Q0 . Supongamos que (dF )p = 0 (aplicación lineal nula) ∀p ∈ Q. Pruébese que si Q es conexa entonces F es constante. 84 CAPÍTULO 4. APLICACIONES DIFERENCIABLES Ejercicio 6. Si f, f 0 : Q −→ R son dos funciones diferenciables sobre una variedad conexa Q tales que (df )p = (df 0 )p , ∀p ∈ Q, y f (p0 ) = f 0 (p0 ) para un punto fijo p0 ∈ Q, pruébese que f = f 0 . Ejercicio 7. Fijada una aplicación diferenciable F : Q → Q0 con diferencial en p dFp : Tp Q → TF (p) Q0 llamaremos codiferencial δFp de F a la aplicación traspuesta (dFp )t . ¿Cuál es su dominio y codominio? Sean F : Q −→ Q0 , y G : Q0 −→ Q00 aplicaciones diferenciables entre las variedades Q, Q0 y Q00 . Pruébese la siguiente regla de la cadena para la codiferencial de una composición: δ(G ◦ F )p = (δF )p ◦ (δG)F (p) , ∀p ∈ Q. Ejercicio 8. Sea α : Tp (S 2 ) −→ R, p = (−1, 0, 0), dada por α(0, a, b) = 2a+b. Si (U, ϕ) es una carta de S 2 con p ∈ U , calcúlese las coordenadas de α en la correspondiente base ((dq 1 )p , (dq 2 )p ) de T∗p (S 2 ). Ejercicio 9. Dada una función diferenciable f : S 2 −→ R tal que (df )p0 6= 0, p0 ∈ S 2 , pruébese que existe una carta (U, ϕ), con p0 ∈ U , tal que una de sus coordenadas coincide con f sobre U . Ejercicio 10. Sea F : Q −→ Q0 una aplicación diferenciable. Supongamos que (dF )p0 es biyectiva. Pruébese que para cada sistema de coordenadas (x1 , . . . , xn ) en un entorno abierto de F (p0 ) en Q0 , las funciones x1 ◦ F, ..., xn ◦ F son un sistema de coordenadas en un cierto entorno abierto de p0 en Q. Ejercicio 11. Dada la aplicación f : R3 −→ R definida por f (x, y, z) = x ez + 2, calcúlese (df )p en coordenadas cartesianas, cilı́ndricas y esféricas, en cada punto p ∈ R3 donde éstas se hallen definidas. Ejercicio 12. Sea O ⊂ R3 un abierto, y f : O → R una aplicación diferenciable que admite un valor regular a. Sea S = f −1 (a) la correspondiente superficie regular de R3 . Compruébese que Tp S = Nuc((df )p ), donde, con las identificaciones usuales, Nuc((df )p ) = {v ∈ R3 : (df )p (v) = 0}). Capı́tulo 5 Campos vectoriales 5.1. Concepto de campo vectorial Sean Q una variedad diferenciable, T Q su variedad tangente y π : T Q → Q la proyección canónica. Un campo vectorial X sobre Q es una aplicación que asigna a cada punto p ∈ Q un vector tangente a Q en ese punto, Xp ∈ Tp Q. Esto es, una aplicación X : Q → T Q tal que π ◦ X = IdQ . Un campo X se dice diferenciable (resp. continuo) si X es diferenciable C ∞ (resp. continua) como aplicación entre variedades. Ası́, si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) entonces X, que puede escribirse ∂ ∂ Xp ≡ X(p) = X 1 (p) 1 |p + · · · + X n (p) n |p ∀p ∈ U, ∂q ∂q será diferenciable en p0 ∈ U si y sólo si X 1 , . . . , X n son aplicaciones diferenciables en p0 . En particular, observemos que sobre el abierto U las coordenadas inducen n campos vectoriales diferenciables ∂q∂ 1 , . . . , ∂q∂n (campos coordenados) en función de los cuales podemos expresar cualquier otro campo sobre U . Como en el caso de variedades y aplicaciones entre variedades, de ahora en adelante supondremos, salvo mención explı́cita 85 86 CAPÍTULO 5. CAMPOS VECTORIALES de lo contrario, que los campos vectoriales son “diferenciables”, por lo que omitiremos esta palabra. Ejemplos: (1) Campos vectoriales sobre RnP . Todo campo vectorial X sobre Rn se puede escribir como X = ni=1 f i · ∂x∂ i , donde f i ∈ C ∞ (Rn ) y (∂/∂x1 , . . . , ∂/∂xn ) son los campos coordenados asociados a las coordenadas usuales (x1 , . . . , xn ). (2) Campos vectoriales sobre la esfera S n . Con las identificaciones naturales, Tp S n puede verse como un hiperplano de Rn+1 ortogonal a p con el producto escalar usual h·, ·i. En consecuencia, dar un campo vectorial sobre S n equivale a dar una aplicación diferenciable X : S n → Rn+1 tal que hp, X(p)i = 0 para todo p ∈ S n. 5.2. Estructura de los campos vectoriales Denotaremos por X(Q) al conjunto de todos los campos vectoriales sobre Q. Veamos cuáles son las operaciones naturales en X(Q). (1) Suma: X(Q) × X(Q) → X(Q) (X, Y ) 7→ X + Y, definida por (X + Y )p = Xp + Yp para todo p ∈ Q. (2) Producto por escalares (reales): R × X(Q) → X(Q) (a, X) 7→ a · X, definido por (a · X)p = a · Xp para todo p ∈ Q. (3) Producto por funciones: C ∞ (Q) × X(Q) → X(Q) (f, X) 7→ f · X, definido por (f · X)p = f (p) · Xp para todo p ∈ Q. El conjunto X(Q) dotado de las dos primeras operaciones tiene estructura de espacio vectorial real de dimensión ∞ (salvo que Q tenga 5.3. PARALELIZABILIDAD 87 dimensión 0, en cuyo caso X(Q) ≡ 0). Por otra parte, X(Q) con la primera y la tercera operación verifica propiedades formalmente análogas a las de un espacio vectorial sobre C ∞ (Q). Ahora bien, C ∞ (Q) no es un cuerpo, ya que no existe inverso respecto al producto para funciones que, sin ser idénticamente nulas, se anulen en algún punto de la variedad. De hecho, C ∞ (Q) sólo tiene estructura de anillo unitario conmutativo. Se dice entonces que X(Q) es un módulo sobre el anillo C ∞ (Q). Fijado un campo vectorial X ∈ X(Q), para cada función f ∈ ∞ C (Q) podemos definir la aplicación X(f ) : Q → R p 7→ Xp (f ). P Si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) y X = ni=1 X i ∂q∂ i entonces ! à n n X X ∂f ∂ i (f ) = X i i ∈ C ∞ (Q). X(f ) = X i ∂q ∂q i=1 i=1 En consecuencia, para cada X ∈ X(Q) tenemos una aplicación C ∞ (Q) → C ∞ (Q) f 7→ X(f ) que es R-lineal y verifica la regla de Leibniz, esto es: X(f · g) = X(f ) · g + f · X(g). 5.3. Paralelizabilidad Fijados r campos vectoriales X1 , . . . , Xr ∈ X(Q) diremos que son independientes (punto a punto) si el conjunto de vectores {X1 (p), . . . , Xr (p)} ⊂ Tp Q es linealmente independiente para todo p ∈ Q. En este caso necesariamente r ≤ n (n = dim Q). Obviamente, si son independientes y r = n entonces el conjunto {X1 (p), . . . , Xn (p)} es una base de cada espacio tangente Tp Q. En este caso diremos que {X1 , . . . , Xn } es una base (global) de campos vectoriales (o bien una referencia móvil). En general, no tienen por qué existir r campos independientes sobre toda la variedad, por lo que existen variedades que no admiten una base global de campos. 88 CAPÍTULO 5. CAMPOS VECTORIALES Definición 5.3.1 De una variedad diferenciable Q que admita una base global de campos vectoriales se dice que es paralelizable. En caso contrario, diremos que es no-paralelizable. En caso de que una variedad Q sea paralelizable y {X1 , . . . , Xn } sea una base global suya podemos establecer el isomorfismo de espacios vectoriales: C ∞ (Q)n → X(Q) P (f 1 , . . . , f n ) 7→ ni=1 f i Xi . Obviamente, en este caso la aplicación Q × Rn → T Q P (p, a1 , . . . , an ) 7→ ni=1 ai Xi (p). es un difeomorfismo entre Q×Rn y T Q. Es decir, en las variedades paralelizables el correspondiente espacio tangente se reduce esencialmente a Q × Rn . Ejemplos: (1) Ejemplos sencillos de variedades paralelizables son Rn (véase [Sección 3.3, Ejemplo (1)]), cualquier espacio vectorial y cualquier abierto de un entorno coordenado. No es difı́cil visualizar que un toro también es una variedad paralelizable. (2) La esfera 1-dimensional S 1 ⊂ R2 también es paralelizable. En ∂ ∂ ∂ efecto, una base de campos global suya es ∂θ = −y ∂x + x ∂y , [Sección 3.3, Ejemplo (2)]. (3) Las esferas de dimensión par S 2n ⊂ R2n+1 en cambio no admiten campos vectoriales sin ceros, esto es, sin que se anulen en algún punto1 . En consecuencia, estas esferas S 2n no son paralelizables. (4) Para las esferas impares S 2n+1 ⊂ R2n+2 sı́ existen campos vectoriales que no se anulan. En efecto, basta tomar como campo vectorial X en cada p = (p1 , . . . , p2n+2 ) ∈ S 2n+1 : X(p) = (p2 , −p1 , . . . , p2n+2 , −p2n+1 ) ∈ Tp S 2n+1 (⊂ Tp R2n+2 ). 1 Esta propiedad, relacionada con el clásico Teorema del Punto Fijo de Brouwer, puede interpretarse intuitivamente como la imposibilidad de “peinar una esfera peluda sin hacer remolinos”. 5.4. CURVAS INTEGRALES. FLUJOS 5.4. 89 Curvas integrales. Flujos Definición 5.4.1 Sea Q una variedad diferenciable, X ∈ X(Q) un campo vectorial y γ : I → Q, I =]a, b[⊆ R una curva diferenciable. Diremos que γ es una curva integral de X si γ 0 (t) = Xγ(t) para todo t ∈ I. Toda curva integral de X se puede extender como curva integral hasta un (único) dominio máximo. Más formalmente, la curva integral γ : I → Q es inextensible o maximal si no existe otra curva integral γ̃ : J → Q tal que I J y γ = γ̃ |I . Como veremos, toda curva integral determinará una única maximal por lo que, en adelante, consideraremos siempre curvas integrales inextensibles. Una curva integral de X (inextensible) γ : I → Q es completa si I = R, e incompleta en caso contrario. En el primer caso, diremos que X es completo a lo largo de γ. Diremos que X es completo si es completo a lo largo de todas sus curvas integrales. ∂ Ejemplo. Consideremos en R2 el campo X = ∂x . Sus curvas integrales son del tipo γ(x0 ,y0 ) (t) = (x0 , y0 )+(t, 0), t ∈ R. Por tanto, X es completo sobre R2 . Sin embargo, resulta obvio que ∂/∂x es incompleto sobre el abierto ]0, ∞[×R. Estudiemos a continuación cómo se determinan localmente las curvas integrales de un campo vectorial. Sea X ∈ X(Q) un campo vectorial y (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q. Nuestro objetivo es encontrar una curva integral γ : I → Q de X. Ahora bien, si componemos con ϕ, esto equivale a encontrar una solución del sistema de ecuaciones diferenciales sobre U de primer orden: dq i (t) = X i (q(t)) ∀i ∈ {1, . . . , n}. dt (5.1) De los teoremas clásicos de existencia de soluciones para sistemas de ecuaciones diferenciales se deduce que, si fijamos una condición inicial ϕ(γ(t0 )) = ϕ(p0 ), p0 ∈ U (esto es, q 1 (t0 ) = p10 , . . . , q n (t0 ) = pn0 con p10 , . . . , pn0 ∈ R), existe ² > 0 tal que el sistema de ecuaciones (5.1) admite solución en ]t0 − ², t0 + ²[. Además, esta solución es única en el sentido de que para cualquier otra solución con la misma condición inicial en t0 y definida en un intervalo J, las dos soluciones coinciden en J∩]t0 − ², t0 + ²[. Más aún, ello acaba implicando la existencia de 90 CAPÍTULO 5. CAMPOS VECTORIALES una única curva integral maximal. Por otra parte, si γ(t) es una curva integral de un campo X entonces también lo es la curva γ̃(t) = γ(t+t0 ), por lo que no será restrictivo suponer, como haremos en adelante, t0 = 0 ∈ I. En conclusión, Teorema 5.4.2 Fijado un campo vectorial X ∈ X(Q), para cada p ∈ Q existe una única curva integral inextensible de X, γp :]ap , bp [→ Q, tal que γp (0) = p (0 ∈]ap , bp [). Ejemplo. Consideremos sobre R2 el campo vectorial X = xy ∂/∂x. Si imponemos que γ(t) sea una curva integral de X entonces obtenemos el sistema de ecuaciones x0 (t) = x(t)y(t) y 0 (t) = 0. Si suponemos γ(0) = (x0 , y0 ) ∈ R2 entonces este sistema tiene por solución x(t) = x0 ey0 ·t y(t) = y0 para todo t ∈ R. En particular, se deduce que X es completo. ∂ Ejercicio. Consideremos sobre R el campo de vectores X = xm ∂x , m ∈ N. Hállense sus curvas integrales y compruébese si es completo o no (discútase según el valor de m). Del ejercicio anterior se deduce que, incluso en R, existen campos vectoriales completos e incompletos. Ello ocurre en toda variedad (de dimensión mayor que 0) excepto en las compactas. De hecho, es posible demostrar que: si Q es compacta entonces todo campo vectorial X ∈ X(Q) es completo (véase, v. gr., [O’N, Lemma 1.56]). Intimamente relacionado con las curvas integrales aparece el concepto de flujo de un campo vectorial. Definición 5.4.3 Consideremos un campo vectorial completo X ∈ X(Q). Definimos el flujo φ de X como la aplicación φ: R×Q→Q (t, p) 7→ φt (p) = γp (t), donde γp es la curva integral de X dada en el Teorema 5.4.2. 5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS 91 El flujo φt de X para cada t consiste por tanto en desplazar cada punto a lo largo de sus curvas integrales en un valor t de su parámetro. Si visualizamos el campo vectorial como el campo de las velocidades de un fluido, φt determina hacia dónde se mueve cada partı́cula del fluido tras un tiempo t. Debido a la variación diferenciable de las soluciones de (5.1) con las condiciones iniciales, tanto φt como la aplicación flujo φ son diferenciables. Más aún, se verifican las siguientes propiedades: (1) φ0 = Id. (2) φs ◦ φt = φs+t , ∀t, s ∈ R (en efecto, φs ◦ φt (p) = φs (γp (t)) = γp (t + s) = φt+s (p)). (3) φ−t = (φt )−1 , ∀t ∈ R (en particular, cada φt es biyectiva para todo t ∈ R). Por otra parte, si X no es completo entonces para cada p ∈ Q existe un entorno abierto U de p y un ² > 0 tal que la aplicación φ :] − ², ²[×U → Q (t, p) 7→ φt (p) = γp (t) está bien definida y es diferenciable. En este caso, la aplicación φ verifica propiedades análogas a las anteriores: (1’) φ0 (p) = p, ∀p ∈ U . (2’) φs ◦ φt = φs+t , siempre que s, t, s + t ∈] − ², ²[. (3’) Para cada t, φt es inyectiva, y puede escogerse un entorno abierto V ⊂ U de cada p0 ∈ U fijo tal que φt (V ) ⊂ U . Restringiendo entonces, φt : V → φt (V ) ⊂ U , se tiene φ−t = (φt )−1 . 5.5. Grupo uniparamétrico de difeomorfismos En esta sección vamos a introducir el concepto de grupo uniparamétrico de difeomorfismos, que, como veremos, abstrae la noción de flujo. Sea X ∈ X(Q) un campo completo y consideremos su flujo global φ. 92 CAPÍTULO 5. CAMPOS VECTORIALES Entonces G = {φt : t ∈ R} es un conjunto de difeomorfismos de Q que con la operación de composición tiene estructura de grupo (véanse las propiedades (1), (2) y (3) de la sección anterior). Es más, se trata de un grupo conmutativo ya que φt ◦ φs = φt+s = φs+t = φs ◦ φt . Además, la aplicación (R, +) → (G, ◦) t 7→ φt es entonces un epimorfismo de grupos. Las propiedades del flujo global φ se pueden abstraer mediante el siguiente concepto: Definición 5.5.1 Sea Q una variedad diferenciable. Llamaremos grupo uniparamétrico de difeomorfismos de Q a toda aplicación diferenciable Φ: R×Q→Q (t, p) 7→ Φt (p) que verifique: (i) Φ0 = IdQ , (ii) Φs+t = Φs ◦ Φt . Obsérvese que de (i) e (ii) se tiene IdQ = Φt−t = Φt ◦ Φ−t ; por tanto, Φt : Q → Q es biyectiva con inversa Φ−t . Ası́, el conjunto de difeomorfismos GΦ = {Φt : t ∈ R} tiene estructura de grupo respecto a la composición. Obviamente, el flujo φ de un campo completo X es un grupo uniparamétrico de difeomorfismos de Q. Es más, el recı́proco también se verifica: Teorema 5.5.2 Fijado un grupo uniparamétrico de difeomorfismos Φ en Q, existe un campo vectorial completo X sobre Q cuyo flujo asociado φ coincide con Φ. Al campo X ası́ definido se le llamará generador infinitesimal del grupo Φ. Demostración. Todo se reduce a definir sobre Q un campo vectorial X cuyas curvas integrales sean del tipo t → Φt (p). Consideremos pues el campo X determinado en cada punto p por: Xp = d |t=0 Φt (p). dt 5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS 93 Para demostrar que t 7→ Φt (p) es una curva integral de X, basta comprobar que: d |t=t0 Φt (p) = XΦt0 (p) ∀t0 ∈ R. dt En efecto, d d d |t=t0 Φt (p) = |t=0 Φt+t0 (p) = |t=0 Φt (Φt0 (p)) = XΦt0 (p) . 2 dt dt dt Observaciones: (1) El generador infinitesimal X de Φ es invariante por Φ; esto es, verifica la propiedad XΦt0 (p) = (dΦt0 )p Xp para todo t0 . En efecto, XΦt0 (p) = d d |t=0 Φt0 +t (p) = |t=0 Φt0 (Φt (p)) = (dΦt0 )p Xp . dt dt (2) Las curvas del tipo t 7→ Φt (p) son inyectivas o se cierran sobre sı́ mismas, ya que son curvas integrales de un campo (el generador infinitesimal). Estas curvas reciben el nombre de órbitas del grupo uniparamétrico (véase la Figura 17). Ejemplo. Consideremos en Q = R3 ó Q respecto al eje z, Φ : R × Q → Q x cos θ −senθ θ, y 7→ senθ cos θ z 0 0 = S 2 las rotaciones con 0 x 0 y . · 1 z Es directo comprobar que se trata de un grupo uniparamétrico de difeomorfismos de Q. Su generador infinitesimal es d |θ=0 Φθ (x, y, z) = dθ x cos θ − ysenθ −y xsenθ + y cos θ = x ∈ T(x,y,z) Q, z 0 X(x,y,z) = d |θ=0 dθ 94 CAPÍTULO 5. CAMPOS VECTORIALES Figura 17 ∂ ∂ + x ∂y . es decir, el campo vectorial X = −y ∂x Nota. Conviene destacar que un grupo uniparamétrico Φ : R×Q → Q induce otro grupo uniparamétrico en el espacio tangente a Q que viene dado por la expresión R × TQ → TQ (t, vp ) 7→ dΦt (vp ) ∈ TΦt (p) Q. Obviamente, también se induce un grupo uniparamétrico sobre N = T Q × R sin más que dejar constante la componente en R. Diremos que una función F : Q → R es invariante por Φ si F (p) = F (Φt (p)) para todo t ∈ R. Análogamente, diremos que una función L : N = T Q × R → R es invariante por Φ si lo es por el grupo uniparamétrico inducido en T Q × R (en el sentido anterior). Por el Teorema de Noether clásico se sabe que, si una lagrangiana es invariante por un grupo uniparamétrico, entonces sus curvas extremales admiten una cantidad conservada (momento lineal, momento angular, energı́a, etc. -véase la última sección del Tema 7). 5.6. CORCHETE DE LIE 5.6. 95 Corchete de Lie de campos vectoriales Consideremos una base de campos de vectores {X1 , . . . , Xn } sobre un abierto U de una variedad Q. Fijado un punto p ∈ Q nos preguntamos si existen coordenadas (q 1 , . . . , q n ) alrededor de p tales que Xi = ∂ ∂q i ∀i ∈ {1, . . . , n} (5.2) sobre U . Para responder a esta pregunta consideremos una función f ∈ C ∞ (Q). Podemos construir entonces funciones Xi (f ) ∈ C ∞ (Q) y, repitiendo el proceso, Xj (Xi (f )) ∈ C ∞ (Q). Si la base de campos proviniese de un sistema de coordenadas entonces se verificarı́a (5.2) y, por tanto, µ ¶ ∂f ∂2f ∂ = . Xj (Xi (f )) = j ∂q ∂q i ∂q j ∂q i Del Lema de Schwarz se deduce entonces que Xj (Xi (f )) = ∂ 2f ∂ 2f = = Xi (Xj (f )). ∂q j ∂q i ∂q i ∂q j Por tanto, una condición necesaria para que una base de campos vectoriales sea localmente de campos coordenados (esto es, que verifique (5.2) en un entorno de cada p ∈ Q), es que se verifique: Xi (Xj (f )) = Xj (Xi (f )) ∀f ∈ C ∞ (Q) ∀i, j ∈ {1, . . . , n}. La justificación de que esta propiedad es suficiente conduce a la siguiente definición, de interés propio: Definición 5.6.1 Si X, Y ∈ X(Q), definimos su corchete de Lie en un punto p ∈ Q como la aplicación [X, Y ]p : C ∞ (Q) → R f 7→ Xp (Y (f )) − Yp (X(f )). (5.3) Observemos que de esta definición se puede deducir fácilmente la identidad de Leibniz para el producto: [X, Y ]p (f · g) = f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ). 96 CAPÍTULO 5. CAMPOS VECTORIALES En efecto, [X, Y ]p (f · g) = Xp (Y (f · g)) − Yp (X(f · g)) = Xp (g · Y (f ) + f · Y (g)) − Yp (g · X(f ) + f · X(g)) = Xp (g) · Yp (f ) + g(p) · Xp (Y (f )) + Xp (f ) · Yp (g) + f (p) · Xp (Y (g)) −Yp (g) · Xp (f ) − g(p) · Yp (X(f )) − Yp (f ) · Xp (g) − f (p) · Yp (X(g)) = f (p) · (Xp (Y (g)) − Yp (X(g))) + g(p) · (Xp (Y (f )) − Yp (X(f ))) = f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ). Puesto que [X, Y ]p es también R-lineal, se tiene que (5.3) define un vector tangente a Q en cada punto p como derivación. Resumiendo: Proposición 5.6.2 Si X, Y ∈ X(Q) entonces [X, Y ]p ∈ Tp Q. Además, [X, Y ] : Q → T Q p 7→ [X, Y ]p es un campo vectorial sobre Q. Veamos qué expresión adquiere el corchete de Lie en coordenadas locales. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q y sean X, Y dos campos de vectores sobre Q. Expresados en estas coordenadas se tiene: n n X X ∂ i ∂ X= X Y = Y i i. i ∂q ∂q i=1 i=1 Pn Si escribimos en coordenadas [X, Y ] = k=1 [X, Y ]k ∂q∂k , entonces = [X, Y ]k = [X, Y ](q k ) = X(Y (q k )) − Y (X(q k )) P P P k )) k k k i ∂(Y (q )) − ni=1 Y i ∂(X(q = ni=1 X i ∂Y − ni=1 Y i ∂X . i=1 X ∂q i ∂q i ∂q i ∂q i Pn Por tanto, el corchete de Lie en coordenadas locales queda: ¶ n µ k k X ∂ i ∂Y i ∂X [X, Y ] = X − Y . i i k ∂q ∂q ∂q i,k=1 (5.4) Propiedades del corchete de Lie: (1) El corchete de Lie de campos es un corchete de Lie “abstracto”. Esto quiere decir que es una aplicación [·, ·] : X(Q) × X(Q) → X(Q) (X, Y ) 7→ [X, Y ] que verifica las siguientes propiedades: 5.6. CORCHETE DE LIE 97 (i) Es lineal en cada variable, esto es, [aX + bX 0 , Y ] = a[X, Y ] + b[X 0 , Y ] [X, aY + bY 0 ] = a[X, Y ] + b[X, Y 0 ] para todo X, X 0 , Y, Y 0 ∈ X(Q) y todo a, b ∈ R. (ii) Es antisimétrico, esto es, [X, Y ] = −[Y, X] ∀X, Y ∈ X(Q). (iii) Verifica la identidad de Jacobi, esto es, [X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 ∀X, Y, Z ∈ X(Q). Un espacio vectorial dotado de una operación que verifique las propiedades (i), (ii), (iii) anteriores recibe el nombre de álgebra de Lie. En consecuencia, (X(Q), [·, ·]) es un álgebra de Lie (de dimensión ∞ si dim Q > 0). (2) Dos campos X, Y ∈ X(Q) verifican [X, Y ] = 0 si y sólo si para cualesquiera flujos φ, ψ de X, Y , respectivamente, se tiene φs ◦ ψt = ψt ◦ φs en su dominio de definición. En este caso se dice que X e Y conmutan. La siguiente expresión del corchete de Lie permite entender esta propiedad. Sea φ el flujo del campo X ∈ X(Q). Consideremos la aplicación φ−t y su diferencial dφ−t : Tφt (p) Q → Tp Q. Si Y ∈ X(Q), tiene sentido comparar los vectores Yp y (dφ−t )φt (p) Yφt (p) . Se verifica entonces (véase la Figura 18): [X, Y ]p = limt→0 (dφ−t )φt (p) Yφt (p) − Yp . t Esto es, el corchete de Lie mide lo que “varı́a infinitesimalmente” el campo Y a lo largo de las curvas integrales de X. (3) El corchete de Lie se preserva por aplicaciones diferenciables. Es decir, si F : Q → Q0 es diferenciable, y X, Y ∈ X(Q), X 0 , Y 0 ∈ X(Q0 ) verifican XF0 (p) = dFp Xp , YF0 (p) = dFp Yp , para todo p ∈ Q, entonces dFp [Xp , Yp ] = [XF0 (p) , YF0 (p) ]. 98 CAPÍTULO 5. CAMPOS VECTORIALES Figura 18 El siguiente resultado resuelve el problema que planteaban las bases de campos y con el que iniciamos esta sección: Teorema 5.6.3 (Frobenius). Sea {X1 , . . . , Xr } un conjunto de campos vectoriales independientes sobre una variedad Q. Son equivalentes: (i) [Xi , Xj ] = 0 para todo i, j ∈ {1, . . . , r}. (ii) Para cada p ∈ Q existe un entorno coordenado (U, q 1 , . . . , q n ) tal que Xi = ∂q∂ i para todo i ∈ {1, . . . , r}. En particular, si r = n, una base de campos {X1 , . . . , Xn } es localmente una base de campos coordenados si y sólo si [Xi , Xj ] = 0 ∀i, j ∈ {1, . . . , n}. Idea de la demostración. La implicación (ii) ⇒ (i) es inmediata de la discusión al comienzo de esta sección. Para la implicación (i) ⇒ (ii) (i) consideremos para simplificar el caso r = n. Sean φt flujos locales de Xi , i = 1, . . . , n, definidos en un entorno de p para todo t ∈] − ², ²[. Consideremos la aplicación F :] − ², ²[n → Q (1) (n) (t1 , . . . , tn ) 7→ φt1 ◦ · · · ◦ φtn (p). Claramente, dF ( ∂t∂ i |(0,...,0) ) = Xi (p), ∀i ∈ {1, . . . , n}. En consecuencia, por el Teorema de la Función Inversa existen entornos Θ de (0, . . . , 0) 5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE 99 y U de p tales que la restricción F |Θ : Θ → U es un difeomorfismo. El entorno coordenado en cuestión será entonces (U, (F |Θ )−1 ≡ (q 1 , . . . , q n )). Para comprobar que, efectivamente, Xi = ∂q∂ i , se usa la conmutatividad de los flujos (para más detalles véase, p. ej., [AM, 2.2.26]). 2 5.7. Apéndice: Grupos y Álgebras de Lie Recordemos que un grupo de Lie (G, ·) es una variedad diferenciable G de dimensión finita n con una operación que la dota de estructura de grupo y tal que las aplicaciones G×G→G (g, h) 7→ g · h G→G g 7→ g −1 son diferenciables [Sección 2.5, Nota (2)]. En todo grupo de Lie (G, ·) se pueden definir las traslaciones por la izquierda como sigue: fijado g ∈ G la traslación por la izquierda según g es Lg : G → G h 7→ g · h. Obviamente, las aplicaciones Lg , g ∈ G son difeomorfismos. Un campo vectorial X ∈ X(G) se dice que es invariante por la izquierda si (dLg )h Xh = Xg·h para todo g, h ∈ G. Una manera de construir campos invariantes por la izquierda es la siguiente: sea e ∈ G el elemento neutro del grupo y sea v ∈ Te G, entonces el campo vectorial X v dado por Xgv = (dLg )e v es diferenciable e invariante por la izquierda. De hecho, todo campo invariante por la izquierda puede construirse de este modo. El conjunto G = {X ∈ X(G) : X es invariante por la izquierda} con las operaciones usuales es un espacio vectorial. De hecho, la aplicación Te G → G v 7→ X v es un isomorfismo de espacios vectoriales, por lo que G también tiene dimensión n. Ası́, si (v1 , . . . , vn ) es una base de Te G entonces (X v1 , . . . , X vn ) ≡ (X1 , . . . , Xn ) es una base de campos sobre todo el grupo de 100 CAPÍTULO 5. CAMPOS VECTORIALES P Lie G. En particular, G es paralelizable. Más aún, si X = ni=1 f i Xi ∈ X(G) entonces X ∈ G si y sólo si f i ≡ cte para todo i. Un hecho destacable es que el corchete de Lie preserva los campos invariantes por la izquierda, esto es: X1 , X2 ∈ G =⇒ [X1 , X2 ] ∈ G (debido a que dLg [X1 , X2 ] = [dLg X1 , dLg X2 ] = [X1 , X2 ], véase [Sección 5.6, Propiedad (3)]). Como consecuencia, (G, [·, ·]) es un algebra de Lie de dimensión finita n. Además, para los elementos de la base P (X1 , . . . , Xn ) se tiene [Xi , Xj ] = nk=1 ckij Xk , donde los ckij ∈ R determinan el álgebra (salvo isomorfismos) y se denominan constantes de estructura del grupo en la base (X1 , . . . , Xn ). La teorı́a de grupos de Lie estudia detalladamente cómo las propiedades del álgebra de Lie (G, [·, ·]) determinan el grupo de Lie G (al menos localmente). Una simplificación importante se debe a que, esencialmente, todo grupo de Lie es isomorfo a un subgrupo de matrices regulares (Teorema de Ado), siendo el corchete de Lie identificable con el conmutador de las matrices en el espacio tangente a la matriz identidad. Ejercicio. Compruébese que el álgebra de Lie del grupo de las matrices ortonormales O(n, R) = {A ∈ Gl(n, R) : A · At = In } es identificable al espacio vectorial de las matrices antisimétricas n × n. Ejercicios ∂ ∂ Ejercicio 1. Se considera el campo vectorial X = (x−y) ∂x −2xz ∂y + 3 ∂ sobre R . Calcúlese X(f ), siendo f (x, y, z) = 2x − y + z. ∂z ∂ ∂ Ejercicio 2. Se considera el campo vectorial X = x ∂x − y ∂y sobre 2 R . Exprésese como combinación lineal de los campos coordenados originados por las coordenadas polares usuales (ρ, θ). Ejercicio 3. Sobre R2 se consideran los campos de vectores: X = (x + y) ∂ ∂ − , ∂x ∂y Y = (y 2 + 1) ∂ ∂ +x . ∂x ∂y (i) Pruébese que son independientes en cada punto. 5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE 101 ∂ ∂ (ii) Si Z = (x2 + y 2 ) ∂x + (x2 − y 2 ) ∂y , encuéntrense f1 , f2 ∈ C ∞ (R2 ) tales que Z = f1 · X + f2 · Y . Ejercicio 4. (a) Encuéntrese un campo vectorial sobre S 2 que se anule exactamente en dos puntos. (b) Encuéntrese un campo vectorial sobre S 2 que se anule exactamente en un punto. Ejercicio 5. Compruébese que, con las identificaciones usuales, la aplicación X : S 2 −→ R3 , X(x, y, z) = (xz, yz, z 2 − 1) define un campo vectorial sobre S 2 . Tómense las coordenadas x, y sobre el hemisferio z > 0 y calcúlense las coordenadas de X en los correspondientes campos coordenados. Ejercicio 6. Se consideran los campos de vectores sobre R2 X=x ∂ ∂ + , ∂x ∂y Y =y ∂ ∂ +x . ∂x ∂y Calcúlese [X, Y ]. Ejercicio 7. Compruébese que para todo X, Y ∈ X(Q) y todo f, g ∈ X(Q) se verifica: [f X, gY ] = f g[X, Y ] + f (X(g))Y − g(Y (f ))X. Ejercicio 8. Sea F : Q −→ Q0 un difeomorfismo. Para cada X ∈ X(Q) compruébese que (F∗ (X))q0 := (dF )F −1 (q0 ) (XF −1 (q0 ) ), ∀q 0 ∈ Q0 define un campo vectorial sobre Q0 . Pruébese que F∗ ([X, Y ]) = [F∗ (X), F∗ (Y )]0 , ∀X, Y ∈ X(Q), donde [, ] y [, ]0 son los respectivos corchetes de Lie en Q y Q0 . Ejercicio 9. Compruébese que la aplicación Φ : R × R2 −→ R2 , Φ(t, x, y) = (xe2t , ye−3t ), es un grupo uniparamétrico de difeomorfismos de R2 . Determı́nese el campo vectorial que induce. P Ejercicio 10. Se considera el campo vectorial sobre Rn , X = ni=1 ai ∂x∂ i , ai ∈ R, 1 ≤ i ≤ n. Pruébese que X admite como grupo uniparamétrico 102 CAPÍTULO 5. CAMPOS VECTORIALES global asociado a la aplicación Φ : R × Rn −→ Rn , Φ(t, p) = p + tv, siendo v = (a1 , ..., an ). ∂ ∂ Ejercicio 11. Se considera el campo vectorial X = y ∂x −x ∂y ∈ X(R2 ) ¿Admite un grupo uniparamétrico global? Ejercicio 12. En la variedad Q = R2 − {(0, 0)} se considera el campo X = x∂x − y∂y . Calcúlense y dibújense sus curvas integrales. Determı́nese su flujo. ¿Es X completo? Ejercicio 13. En R2 se considera el campo de vectores X = y ∂∂x − (y + 1) ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo? Ejercicio 14. Se considera la aplicación φ : R × R2 → R2 , φ(t, (x, y)) = ¢ 1¡ (x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t . 2 (i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 . (ii) Calcúlese su generador infinitesimal X. (iii) ¿Es X completo? Ejercicio 15. En R3 se considera el campo de vectores, X = (x2 − y) ∂ ∂ ∂ − 2xz +y . ∂x ∂y ∂z Calcúlese X(f ), siendo f (x, y, z) = x + y + z. Ejercicio 16. En R3 se consideran los campos vectoriales: X1 = y∂z − z∂y , X2 = z∂x − x∂z , X3 = x∂y − y∂x . (i) Compruébese que inducen, por restricción, tres campos vectoriales sobre cualquier esfera S centrada en el origen. ¿Forman una base de campos (referencia móvil) sobre R3 ? ¿Y sobre S? Calcúlense todos los corchetes [Xi , Xj ], i, j = 1, 2, 3. (ii) Sea φ(i) el flujo de cada Xi y considérese la aplicación ψ : R × (2) (1) S → S, ψ(t, p) = φt ◦ φ2t (p). ¿Es un grupo uniparamétrico de difeomorfismos? Calcúlese el campo generado como ∂ψ(t, p)/∂t|0 . 5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE 103 Ejercicio 17. En R2 se consideran los siguientes tres campos vectoriales: X = ∂ x + x2 ∂ y , Y = x2 ∂ x + ∂ y Z = [[X, Y ], ∂y ] + [[∂y , X], Y ]. Calcúlense sus curvas integrales. ¿Cuáles de ellos son completos? Ejercicio 18. En R3 se consideran los campos de vectores: X = ∂y , Y = zy∂x + 3∂y − xy∂z . Calcúlense las curvas integrales de Z = [X, Y ]. ¿Es Z completo? Ejercicio 19. Se considera la aplicación φ : R × R2 → R2 , φ(t, (x, y)) = ¢ 1¡ (x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t . 2 (i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 . (ii) Calcúlese su generador infinitesimal X. (iii) ¿Es X completo? Ejercicio 20. Se considera el campo vectorial sobre R2 , X = x ∂∂x − y 2 ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo? Ejercicio 21. Dada una función diferenciable no constante y que no se anule f : R −→ R, se considera el campo vectorial X sobre R, d Xy = f (y) dx |y , ∀y ∈ R. Hállense todos los campos que conmutan con d . X, y compruébese que, salvo el nulo, ninguno de ellos conmuta con dx Ejercicio 22. Se considera en R3 un sistema de ecuaciones en derivadas parciales ∂z = g(x, y, z), ∂x ∂z = h(x, y, z), ∂y y se le asocian los campos X= ∂ ∂ +g , ∂x ∂z Y = ∂ ∂ +h . ∂y ∂z Demuéstrese que si el sistema admite una solución z = f (x, y), entonces los campos X, Y son una paralelización de la variedad z = f (x, y) tal que [X, Y ] = 0. 104 CAPÍTULO 5. CAMPOS VECTORIALES Capı́tulo 6 Campos tensoriales y formas diferenciales En este tema comprobamos en primer lugar que no sólo el concepto de vector tangente induce el de campo vectorial, sino que toda el álgebra tensorial sobre un espacio vectorial induce los correspondientes campos y operaciones tensoriales sobre la variedad. A continuación, nos centramos por su particular interés en las r−formas diferenciales para r = 1, 2, e introducimos los conceptos de 1-formas cerradas y exactas, y de circulación de una 1-forma a lo largo de una curva. El estudio general de r−formas diferenciales se pospone hasta el estudio de Integración en Variedades (Temas 8 y 9), que resulta independiente del resto. 6.1. Tensores en un espacio vectorial 6.1.1. Concepto Definición 6.1.1 Sea V (R) un espacio vectorial. Un tensor r veces covariante y s veces contravariante (o tipo (r, s)) sobre V (R) es una aplicación T : V r × (V ∗ )s → R (u1 , . . . , ur , φ1 , . . . , φs ) 7→ T (u1 , . . . , ur , φ1 , . . . , φs ) 105 106 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES que es multilineal, esto es, lineal en cada una de sus r + s variables. Denotaremos por Tr,s (V ) al conjunto de los tensores tipo (r, s) sobre V (R). De manera natural se puede definir en este conjunto una suma y un producto por escalares reales. Concretamente, (1) si T, T 0 ∈ Tr,s (V ) entonces T + T 0 (∈ Tr,s (V )) se define por: (T + T 0 )(y 1 , . . . , y r , φ1 , . . . , φs ) = T (y 1 , . . . , y r , φ1 , . . . , φs ) + T 0 (y 1 , . . . , y r , φ1 , . . . , φs ); (2) si T ∈ Tr,s (V ), a ∈ R entonces a · T (∈ Tr,s (V )) se define por: (a · T )(y 1 , . . . , y r , φ1 , . . . , φs ) = a · T (y 1 , . . . , y r , φ1 , . . . , φs ). Se comprueba fácilmente que (Tr,s (V ), +, ·R) tiene estructura de espacio vectorial. Ejemplos: (1) Claramente, T1,0 (V ) = V ∗ y T0,1 (V ) = V ∗∗ . Ahora bien, puesto que por el Teorema de Reflexividad podemos identificar V ∗∗ con el propio V , podemos considerar T0,1 (V ) = V . Por tanto, un vector v se correspondelos con el tensor 1-contravariante: v : V∗ →R φ 7→ φ(v). (2) Los métricas g : V × V → R sobre V (R) se definen como tensores 2-covariantes y simétricos; esto es, tales que verifican g(u, v) = g(v, u), ∀u, v ∈ V (véase el Tema siguiente). 2 (3) Consideremos la aplicación det : Rn → R definida por ¯ ¯ ¯ a11 . . . a1n ¯ a1n a11 ¯ ¯ ¯ ¯ .. . . .. .. . . ( . , . . . , . ) 7→ ¯ . . . ¯. ¯ ¯ ¯ an1 . . . ann ¯ ann an1 Es directo comprobar que det∈ Tn,0 (Rn ). 6.1. TENSORES EN UN ESPACIO VECTORIAL 107 (4) Sea f : V → V un endomorfismo de espacios vectoriales y consideremos la aplicación Tf : V × V ∗ → R (u, φ) 7→ φ(f (u)). Se demuestra fácilmente Tf ∈ T1,1 (V ). Es más, la aplicación End(V ) → T1,1 (V ) f 7→ Tf es un isomorfismo de espacios vectoriales. Por tanto, es posible asociar una traza a un tensor tipo (1, 1) sin más que calcular la de su endomorfismo correspondiente. Concretamente, si B = (v1 , . . . , vn ) es una base de V : traza Tf := traza f = n X φi (f (vi )) = i=1 n X Tf (vi , φi ), i=1 que resulta independiente de la base B escogida. Por completitud, se define también T0,0 (V ) = R, de modo que el concepto de tensor incluye simultánemente los de escalar, vector, forma lineal y endomorfismo. 6.1.2. Producto tensorial El producto tensorial resultará útil para estudiar tensores tipo (r, s) a partir de tensores de tipo inferior en r ó s. El objetivo final será poder estudiar todos los tensores a partir de los (1,0) (vectores) y (0,1) (formas lineales). Definición 6.1.2 Sean T ∈ Tr,s (V ) y T 0 ∈ Tr0 ,s0 (V ). Se define el producto tensorial de T por T 0 como 0 0 T ⊗ T 0 : V r+r × (V ∗ )s+s → R 0 0 ((u1 , . . . , ur+r0 ), (φ1 , . . . , φs+s )) 7→ T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ), siendo 0 T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ) = 0 = T (u1 , . . . , ur , φ1 , . . . , φs ) · T 0 (ur+1 , . . . , ur+r0 , φs+1 , . . . , φs+s ). 108 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES Propiedades. Se comprueba fácilmente: (1) T ⊗ T 0 es multilineal y, por tanto, T ⊗ T 0 ∈ Tr+r0 ,s+s0 (V ). (2) La operación producto tensorial es lineal en cada variable en el siguiente sentido: (aT + bT ) ⊗ T 0 = a(T ⊗ T 0 ) + b(T ⊗ T 0 ) 0 0 T ⊗ (aT 0 + bT ) = a(T ⊗ T 0 ) + b(T ⊗ T ) 0 para todo T, T ∈ Tr,s y T 0 , T ∈ Tr0 ,s0 . (3) La operación producto tensorial es asociativa (aunque no conmutativa). 6.1.3. Tensores tipo (r, s) con r + s = 2 Consideremos en primer lugar el espacio vectorial T2,0 (V ). Acabamos de ver que si φ, ψ ∈ V ∗ (= T1,0 (V )) entonces φ ⊗ ψ ∈ T2,0 (V ), siendo (φ ⊗ ψ)(v, w) = φ(v) · ψ(w), ∀v, w ∈ V . Consideremos fijada una base B = (v1 , . . . , vn ) de V , y su correspondiente base dual B ∗ = (φ1 , . . . , φn ). Nuestro objetivo será demostrar que una base de T2,0 (V ) es el conjunto de todos los productos tensoriales de elementos de B ∗ , esto es B2,0 = {φi ⊗ φj : i, j ∈ {1, . . . , n}}. P Lema 6.1.3 Si T = ni,j=1 tij φi ⊗φj ∈ T2,0 (V ) entonces tkl = T (vk , vl ) para todo k, l ∈ {1, . . . , n}. Demostración. T (vk , vl ) = n X i,j=1 i j tij (φ ⊗ φ )(vk , vl ) = n X tij δki δlj = tkl . 2 i,j=1 Teorema 6.1.4 (1) El conjunto B2,0 es una base del espacio T2,0 (V ) y, por tanto, dim T2,0 = n2 . (2) La coordenada (k, l) de un tensor T en la base B2,0 coincide con T (vk , vl ). 6.1. TENSORES EN UN ESPACIO VECTORIAL 109 Demostración. (1) En primer que B2,0 es linealmente Pnlugar veamos i j independiente. En efecto, si i,j=1 tij φ ⊗ φ = T0 ≡ 0 entonces, por el Lema 6.1.3, tij = T0 (vi , vj ) = 0, ∀i, j. Para demostrar que B2,0 es un sistema de generadores basta comprobar que para todo T ∈ T2,0 (V ) Pn se tiene T = t φi ⊗ φj , siendo tij = T (vi , vj ). En efecto, si i,j=1 Pn i Pnij j u = i=1 a vi , v = j=1 b vj entonces n n n X X X i j T (u, v) = T ( a vi , b vj ) = T (vi , vj )ai bj i=1 = n X j=1 à tij ai bj = i,j=1 n X i,j=1 ! tij φi ⊗ φj (u, v) i,j=1 (2) Inmediato del Lema 6.1.3. 2 Observación. Las coordenadas tij de T en B2,0 se pueden escribir de modo matricial T (v1 , v1 ) . . . T (v1 , vn ) .. .. ... MB (T ) = (tij )i,j = . . . T (vn , v1 ) . . . T (vn , vn ) Se comprueba entonces: b1 T (u, v) = (a1 , . . . , an )MB (T ) ... . bn Observación. Todos los tensores tipo (2, 0) se pueden escribir como productos tensoriales del tipo φ ⊗ ψ o sumas finitas de ellos. Esto lleva a usar a veces la notación T2,0 (V ) = V ∗ ⊗ V ∗ (producto directo de V ∗ por V ∗ ). Ejercicio. Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ con n ≥ 2. Pruébese que no existen φ, ψ ∈ V ∗ tales que φ ⊗ ψ = φ1 ⊗ φ2 + φ2 ⊗ φ1 . Un desarrollo análogo al que hemos hecho para T2,0 (V ) se puede llevar a cabo para T0,2 (V ), T1,1 (V ). Ası́, consideremos el espacio vectorial T0,2 (V ). Dados dos vectores u, v ∈ V (≡ T0,1 (V )) ahora también 110 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES podemos definir la aplicación u⊗v :V∗×V∗ →R (φ, ψ) 7→ φ(u) · ψ(v). En consecuencia, fijada una base B = (v1 , . . . , vn ) de V y su correspondiente base dual B ∗ = (φ1 , . . . , φn ), podemos construir el conjunto B0,2 = {vi ⊗ vj : i, j ∈ {1, . . . , n}} de manera que se verifica: Lema 6.1.5 Si T = Pn i,j=1 tij vi ⊗ vj entonces tkl = T (φk , φl ). Teorema 6.1.6 (1) El conjunto B0,2 es una base del espacio T0,2 (V ) y, por tanto, dim T0,2 = n2 . (2) La coordenada (k, l) de un tensor T en la base B0,2 coincide con T (φk , φl ). Observación. Se suele usar la notación T0,2 (V ) ≡ V ⊗ V . Finalmente, consideremos el espacio vectorial T1,1 (V ). Dados φ ∈ V y u ∈ V podemos definir ∗ φ⊗u:V ×V∗ →R (v, ψ) 7→ φ(v) · ψ(u). Para el conjunto B1,1 = {φj ⊗vi : i, j ∈ {1, . . . , n}} se verifica entonces: Lema 6.1.7 Si T = Pn i j i,j=1 tj φ ⊗ vi entonces tlk = T (vk , φl ). Teorema 6.1.8 (1) El conjunto B1,1 es una base del espacio T1,1 (V ) y, por tanto, dim T1,1 = n2 . (2) La coordenada (k, l) de un tensor T correspondiente al elemento l φ ⊗ vk de la base B1,1 coincide con T (vl , φk ). Observación. Según la definición general de producto tensorial que estamos considerando, se verifica φ ⊗ u = u ⊗ φ. Por tanto, indistintamente se suelen usar las notaciones T1,1 (V ) ≡ V ⊗ V ∗ ≡ V ∗ ⊗ V . 6.1. TENSORES EN UN ESPACIO VECTORIAL 6.1.4. 111 Tensores tipo (r, s) Consideremos r formas lineales ψ 1 , . . . , ψ r en V ∗ y s vectores u1 , . . . , us en V . Usando la asociatividad de ⊗ puede escribirse inequı́vocamente ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us ∈ Tr,s (V ). Explı́citamente, ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us : V r × (V ∗ )s → R (w1 , . . . , wr , ρ1 , . . . , ρs ) 7→ ψ 1 (w1 ) · · · ψ r (wr ) · ρ1 (u1 ) · · · ρs (us ). Para construir una base de Tr,s (V ) consideramos una base B = (v1 , . . . , vn ) de V y su base dual B ∗ = (φ1 , . . . , φn ) de V ∗ . Definimos entonces Br,s = {φi1 ⊗· · ·⊗φir ⊗vj1 ⊗· · ·⊗vjs : i1 , . . . , ir , j1 , . . . , js ∈ {1, . . . , n}}. Argumentos análogos a los del caso r + s = 2 permiten demostrar: Teorema 6.1.9 (1) Br,s es una base de Tr,s (V ) y, por tanto, dim Tr,s (V ) = nr+s . (2) Si T ∈ Tr,s (V ) satisface T = n X ...js tji11...i · φi1 ⊗ · · · ⊗ φir ⊗ vj1 ⊗ · · · ⊗ vjs r i1 ,...,js =1 ...js entonces tji11...i = T (vi1 , . . . , vir , φj1 , . . . , φjs ). r ,...,js Abusando del lenguaje se suele decir que los escalares tji11,...,i son las r coordenadas de T en B (en lugar de en Br,s ). 6.1.5. Tensores simétricos y antisimétricos tipo (2, 0) Definiciones 6.1.10 (1) Diremos que un tensor T ∈ T2,0 (V ) es simétrico si T (x, y) = T (y, x), ∀x, y ∈ V . (2) Diremos que un tensor T ∈ T2,0 (V ) es antisimétrico si T (x, y) = −T (y, x), ∀x, y ∈ V . En caso de tensores tipo (0, 2) se puede dar una definición análoga; en cambio, para tensores tipo (1, 1) esto no tiene sentido. Proposición 6.1.11 Sea T ∈ T2,0 (V ). Son equivalentes: (i) T es simétrico (resp. antisimétrico). 112 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES (ii) Existe una base B = (v1 , . . . , vn ) de V tal que T (vi , vj ) = T (vj , vi ) (resp. T (vi , vj ) = −T (vj , vi )), ∀i, j ∈ {1, . . . , n}. (iii) Cualquier base verifica la propiedad (ii). Demostración. Las implicaciones (i) ⇒ (iii) y (iii) ⇒ (ii) son triviales. Para (ii) ⇒ (i) téngase en cuenta lo siguiente: n n X X i T (x, y) = T ( a vi , aj vj ) i=1 = n X i,j=1 i j a b T (vi , vj ) = n X j=1 ai bj T (vj , vi ) = T (y, x). 2 i,j=1 Observación: Si φ, ψ ∈ V ∗ entonces el tensor φ⊗ψ+ψ⊗φ es simétrico mientras que el tensor φ ⊗ ψ − ψ ⊗ φ es antisimétrico. Definición 6.1.12 Si φ, ψ ∈ V ∗ se define su producto exterior como el tensor antisimétrico φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ. Es fácil probar que se verifican la siguientes propiedades: S A (1) Tanto T2,0 (V ) = {T ∈ T2,0 (V ) : T es simétrico} como T2,0 (V ) = {T ∈ T2,0 (V ) : T es antisimétrico} son subespacios vectoriales de T2,0 (V ). S (2) Se verifica la descomposición en suma directa T2,0 (V ) = T2,0 (V )⊕ A S A S A T2,0 (V ) (esto es, T2,0 (V ) = T2,0 (V )+ T2,0 (V ) y T2,0 (V ) ∩ T2,0 (V ) = {0}.) (3) Si B = (φ1 , . . . , φn ) es una base de V ∗ entonces los conjuntos S A B2,0 = {φi ⊗ φj + φj ⊗ φi : 1 ≤ i ≤ j ≤ n} y B2,0 = {φi ∧ φj = S φi ⊗ φj − φj ⊗ φi : 1 ≤ i < j ≤ n} son bases de los espacios T2,0 (V ) y A T2,0 , respectivamente. Por tanto, la dimensión del primero es n(n+1)/2 y la del segundo n(n − 1)/2. 6.2. Tensores sobre variedades 6.2.1. Tensores en un espacio vectorial tangente Sea Q una variedad diferenciable y p ∈ Q. Consideremos el espacio vectorial tangente Tp Q y sea (U, ϕ = (q 1 , . . . , q n )) un entorno 6.2. TENSORES SOBRE VARIEDADES 113 coordenado de p. Para estas coordenadas podemos construir las bases Bp = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) y Bp∗ = (dqp1 , . . . , dqpn ), y a partir de ellas, los tensores dqpi ⊗dqpj ∈ T2,0 (Tp Q), dqpi ⊗ ∂q∂ j |p ∈ T1,1 (Tp Q), etc. Como vimos en la Subsección 6.1.3, estos tensores permiten construir las bases de los correspondientes espacios tensoriales (T2,0 (Tp Q), T1,1 (Tp Q)). Con más generalidad (Subsección 6.1.4), si Tp ∈ Tr,s (Tp Q), existirán números ...js reales tji11...i tales que r Tp = n X ,...,js tji11,...,i · dqpi1 ⊗ · · · ⊗ dqpir ⊗ r i1 ,...,js =1 ∂ ∂ |p ⊗ · · · ⊗ j s |p , j 1 ∂q ∂q ,...,js donde tji11,...,i = Tp ( ∂q∂i1 |p , . . . , ∂q∂ir |p , dqpj1 , . . . , dqpjs ) (coordenadas de T r en Bp ). Para estudiar cómo cambian las coordenadas del tensor ante cambios de base, supongamos que (Ũ , ϕ̃ = (q̃1 , . . . , q̃n )) es otro entorno coordenado alrededor de p. Entonces las nuevas bases asociadas a esas coordenadas son B̃p = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ) y B̃p∗ = (dq̃p1 , . . . , dq̃pn ). Por tanto, debemos hallar la relación existente entre las coordenadas de Tp en las diferentes bases de tensores inducidas por Bp y B̃p . Para ello, supongamos en primer lugar que Tp ∈ T2,0 (Tp Q), entonces Tp = n X tij · dqpi ⊗ dqpj = i,j=1 Ahora bien, n X t̃kl · dq̃pk ⊗ dq̃pl . k,l=1 Pn ∂ | = p k ∂ q̃ Pni=1 ∂ | = j=1 ∂ q̃ l p ∂q i (p) ∂q∂ i |p ∂ q̃ k ∂q j (p) ∂q∂ j |p , ∂ q̃ l luego P P t̃kl = Tp ( ∂∂q̃k |p , ∂∂q̃l |p ) = ni=1 nj=1 P i j (p)tij . = ni,j=1 ∂∂qq̃k (p) ∂q ∂ q̃ l j ∂q i (p) ∂q (p) ∂ q̃ k ∂ q̃ l · Tp ( ∂q∂ i |p , ∂q∂ j |p ) Esto es, n X ∂q j ∂q i t̃kl = (p) (p)tij k l ∂ q̃ ∂ q̃ i,j=1 ∀k, l ∈ {1, . . . , n}. 114 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES Ejercicio. (1) En el caso de que Tp sea un tensor 2 contravariante, compruébese que la transformación análoga de coordenadas es n X ∂ q̃ l ∂ q̃ k (p) (p)tij t̃ = i j ∂q ∂q i,j=1 kl ∀k, l ∈ {1, . . . , n}. (2) Supongamos que la transformación de coordenadas q̃ i (q 1 , . . . , q n ) es afı́n, esto es: q̃ 1 q1 q01 .. . . (6.1) . = A · .. + .. q̃ n qn q0n para alguna matriz regular A = (aji )i,j y q01 , . . . , q0n ∈ R fijos. Escribiendo la matriz inversa como A−1 = (bji )i,j , muéstrese que se verifica: kl t̃ = n X i,j=1 aki alj tij , t̃kl = n X bik bjl tij i,j=1 para todo k, l ∈ {1, . . . , n}. ¿Qué sucede si A es una matriz ortonormal, A ∈ O(n, R)? (3) Repı́tanse los dos puntos anteriores cuando Tp es un tensor (1,1). A continuación, consideremos el caso general Tp ∈ Tr,s (Tp Q). Ahora ,...,js s tenemos coordenadas tji11,...,i y t̃lk11,...,l ,...,kr en las bases inducidas por Bp y r B̃p , respectivamente. La relación entre ambas queda: ∂ ∂ s l1 ls t̃lk11,...,l ,...,kr = Tp ( ∂ q̃ k1 |p , . . . , ∂ q̃ kr |p , dq̃p , . . . , dq̃p ) Pn ∂qi1 P ir = Tp ( i1 =1 ∂ q̃k1 (p) ∂ q̃∂i1 |p , . . . , nir =1 ∂∂qq̃kr (p) ∂q∂ir |p , Pn ∂ q̃ls Pn ∂ q̃l1 j1 js js =1 ∂q js (p)dqp ). j1 =1 ∂q j1 (p)dqp , . . . , Por tanto, usando la multilinealidad de los tensores se tiene s t̃lk11,...,l ,...,kr = n X i1 ,...,js ∂q i1 ∂q ir ∂ q̃ l1 ∂ q̃ ls ...js (p) · · · (p) · (p) · · · (p) · tji11...i . (6.2) r k1 kr j1 js ∂ q̃ ∂ q̃ ∂q ∂q =1 La expresión (6.2) proporciona la definición clásica por coordenadas de tensor (r, s) en p, esto es: una asignación de nr+s números reales a cada entorno coordenado de p que se transforma según (6.2). 6.2. TENSORES SOBRE VARIEDADES 115 Observación. La elección de las posiciones de los ı́ndices (“contravariantes” arriba, “covariantes” abajo) facilita recordar mnemotécnicamente expresiones tensoriales generales como (6.2): (i) siempre que hay un sumatorio de dos ı́ndices, uno de ellos aparece arriba y otro abajo, (ii) si un ı́ndice queda suelto (sin sumarse en él) en uno de los miembros de la igualdad, también quedará suelto en el otro, y en la misma posición. Nota (Sobre el electromagnetismo en Relatividad Especial). Clásicamente se suponı́a que cada observador inercial O medı́a en cada instante de tiempo t y en cada punto p del espacio fı́sico ordinario tridimensional ~ t (p) ≡ (al que asigna unas coordenadas (x, y, z)), un campo eléctrico E ~ ~ ~ E(t, x, y, z) y un campo magnético Bt (p) ≡ B(t, x, y, z). Otro obser~ 0 (p) ≡ E ~ 0 (t, x0 , y 0 , z 0 ) y un vador inercial O0 medirá un campo eléctrico E t ~ t0 (p) ≡ B ~ 0 (t, x0 , y 0 , z 0 ). Si, por ejemplo, O0 se mueve campo magnético B a lo largo del eje x de O con velocidad constante v, desde el punto de vista de Galileo la transformación de coordenadas que los observadores inerciales encuentran para los puntos del espacio fı́sico es: x0 = x − vt y0 = y z 0 = z. (6.3) Nótese que t desempeña el papel de un parámetro (igual para O y O’) independiente de p. Ası́, ∂ ∂ |p = |p ; ∂x ∂x0 ∂ ∂ |p = 0 |p ; ∂y ∂y ∂ ∂ |p = 0 |p . ∂z ∂z (6.4) Si los campos eléctrico y magnético fueran vectores sobre el espacio ~ t (p) = E ~ t0 (p), B ~ t (p) = B ~ t0 (p) y fı́sico medibles por O y O0 , entonces E ~ t (p) y B ~ t (p) las igualdades (6.4) conducirı́an a que las coordenadas de E 0 deberı́an ser las mismas para O y O . Por el contrario, se sabe de las distintas leyes de la electrodinámica que ello no ocurre ası́. Es mérito de Einstein percatarse del siguiente hecho. Consideremos el tiempo como una coordenada más (esto es, ahora la variedad Q es el espacio-tiempo fı́sico, formado por todos los “eventos” espacio-temporales) y consideremos las ternas (E 1 , E 2 , E 3 ), (B 1 , B 2 , B 3 ) obtenidas de las mediciones ~ x, y, z), B(t, ~ x, y, z) por cada observador inercial O. Podemos de E(t, construir el tensor electromagnético F para O, definido por la matriz 116 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES de coordenadas : 0 E1 E2 E3 −E 1 0 B 3 −B 2 . (Fij ) = −E 2 −B 3 0 B1 −E 3 B 2 −B 1 0 Supongamos ahora que, entre cada dos observadores inerciales O, O0 la transformación de coordenadas (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) asignada a un mismo evento espacio-temporal, en lugar de verificar la transformación galileana (6.3) (más la implı́cita t = t0 ), verifica la igualdad (6.1) para alguna matriz A en el grupo de Lorentz (esto es, tal que AηAt = η, donde η es la matriz diagonal -1,+1,+1,+1). Entonces “la matriz (Fij )i,j se transforma como un tensor entre observadores inerciales”, esto es: el tensor electromagnético F construido por O en ~ x, y, z), B(t, ~ x, y, z) coin(t, x, y, z) a partir de sus mediciones de E(t, cide con el tensor electromagnético F 0 construido por cualquier otro observador inercial O0 en ese punto a partir de sus propias mediciones ~ 0 (t0 , x0 , y 0 , z 0 ), B ~ 0 (t0 , x0 , y 0 , z 0 ). de E 6.2.2. Campos tensoriales Un campo tensorial T tipo (r, s) sobre una variedad Q es una asignación de un tensor Tp ∈ Tr,s (Tp Q) a cada punto p ∈ Q. Dado el campo T y un entorno coordenado (U, ϕ = (q 1 , . . . , q n )), existen funciones ,...,js tji11,...,i , i1 , . . . , js ∈ {1, . . . , n} definidas en U tales que r Tp = n X i1 ,...,js =1 ,...,js tji11,...,i (p)·dqpi1 ⊗· · ·⊗dqpir ⊗ r ∂ ∂ |p ⊗ · · ·⊗ js |p j 1 ∂q ∂q ∀p ∈ U. Diremos que el campo tensorial T es continuo (resp. diferenciable C r ) ...js en p si todas las funciones tij11...i son continuas (resp. diferenciables r r C ) en p. A partir de ahora adoptaremos el convenio de llamar campos tensoriales a aquéllos que son diferenciables C ∞ . Observación. Recordemos que habı́amos definido un campo de vectores como una aplicación X : Q → T Q tal que π ◦ X = IdQ , siendo π(vp ) = p para todo p ∈ Q. Una definición análoga puede darse para campos tensoriales en general. Para ello, consideramos: Tr,s (Q) ≡ ∪p∈Q Tr,s (Tp Q), 6.3. FORMAS DIFERENCIALES 117 que, de forma natural, es una variedad de dimensión n + nr+s , Un campo tensorial tipo (r, s) es una aplicación T : Q → Tr,s (Q) tal que πr,s ◦ T = IdQ , siendo πr,s : Tr,s (Q) → Q la proyección canónica, esto es, πr,s (Tp ) = p, ∀Tp ∈ Tr,s (Q). Denotamos por Xr,s (Q) al conjunto de todos los campos tensoriales (diferenciables) (r, s) sobre Q. Al igual que X(Q), también Xr,s (Q) tiene estructura de espacio vectorial (de dimensión infinita si dim Q > 0) y de C ∞ (Q)-módulo. Definición 6.2.1 Sea T un campo tensorial tipo (2, 0) sobre Q. Diremos que T es simétrico (resp. antisimétrico) si Tp es simétrico (resp. antisimétrico) para todo p ∈ Q; esto es, si Tp (vp , wp ) = Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q (resp. Tp (vp , wp ) = −Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q). Ejercicio. Consideremos el campo tensorial sobre R2 g = dx ⊗ dx + dy ⊗ dy(≡ dx2 + dy 2 ). Escrı́banse sus coordenadas en la base inducida por las coordenadas polares. 6.3. Formas diferenciales Definición 6.3.1 Una forma diferencial (tipo (1, 0) ó 1-forma diferencial) α es un campo de formas lineales, esto es, de tensores tipo (1, 0). Denotaremos por Λ1 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales. Ahora podemos reobtener el concepto de variedad cotangente a Q (definida ya en la Sección 4.2) sin más que tener en cuenta T1,0 (Q) = T Q∗ .De nuevo, Λ1 (Q) es un espacio vectorial (de dimensión ∞) y un C ∞ (Q)-módulo. La diferente notación introducida hasta ahora se resume en el siguiente esquema: (r, s) cualquiera Tr,s (Q) Xr,s (Q) r = 0, s = 1 TQ X(Q) r = 1, s = 0 T Q∗ Λ1 (Q). 118 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES 1 Además, si α ∈ (Q) y (U, q 1 , . . . , q n ) es un entorno coordenado de Q PΛ n entonces α = i=1 αi dq i , siendo αi = α( ∂q∂ i ). Un ejemplo relevante de forma de diferencial es la diferencial de una función f ∈ C ∞ (Q) esto es, df ∈ Λ1 (Q). Definición 6.3.2 Una forma diferencial (2, 0) o 2-forma diferencial Ω sobre una variedad Q es un campo tensorial tipo (2, 0) que es antisimétrico, esto es, tal que Ωp (vp , wp ) = −Ωp (wp , vp ), ∀vp , wp ∈ Tp Q y ∀p ∈ Q. Denotaremos por Λ2 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales. Recordemos que si φ, ψ ∈ Tp Q entonces φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ es un tensor (2, 0) antisimétrico y, obviamente, el producto ∧ se extiende naturalmente a formas diferenciales. Además, si Ω ∈ Λ2 (Q) entonces Ω= n X Ωij dq i ⊗ dq j , i,j=1 donde Ωij = Ω( ∂q∂ i , ∂q∂ j ) = −Ω( ∂q∂ j , ∂q∂ i ) = −Ωji . Ası́, Ω= X Ωij dq i ∧ dq j , 1≤i<j≤n siendo Ωii = 0 para todo i. Nota. En general, para todo entero r no negativo se puede definir el concepto de r-forma diferenciable sin más que extender el concepto de antisimetrı́a a tensores tipo (r, 0) (si r = 0 se define Λ0 (Q) ≡ C ∞ (Q)). Ası́, el espacio vectorial y C ∞ (Q)-módulo de todas las r-formas diferenciales sobre Q se denota por Λr (Q). 6.4. La diferencial exterior 6.4.1. Formas exactas Definición 6.4.1 Diremos que una forma diferencial α ∈ Λ1 (Q) es exacta si existe una función f ∈ C ∞ (Q) tal que α = df . 6.4. LA DIFERENCIAL EXTERIOR 119 Una interesante consiste en cuándo una forma diferencial α = Pn cuestión i i=1 αi dq es exacta. Obsérvese que, en caso afirmativo, n X ∂f i dq , α= i ∂q i=1 f ∈ C ∞ (Q) y, por tanto, ∂αi ∂ 2f ∂ 2f ∂αj = = = . j j i i j ∂q ∂q ∂q ∂q ∂q ∂q i Esto es, si α es exacta entonces en cualquier sistema de coordenadas: ∂αi ∂αj = j ∂q ∂q i ∀i, j ∈ {1, . . . , n}. (6.5) Más adelante veremos que la condición (6.5) no sólo es una condición necesaria para que α sea exacta sino que, localmente, también es suficiente (Teorema 6.4.6). Pero antes definiremos el concepto de diferencial de una forma, que, como veremos, extiende al de una función. Este concepto nos permitirá comprobar que la igualdad (6.5) es independiente de coordenadas, esto es, si para unas coordenadas sobre un abierto U se verifica (6.5), entonces también se verifica para cualesquiera otras coordenadas en U . 6.4.2. Diferencial de formas. Lema de Poincaré Pn i Sea α = i=1 αi dq la expresión de una forma diferencial en un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de Q. Por analogı́a con la diferencial de una función, no resulta extraño definir la diferencial exterior de α (en esas coordenadas) como dα = n X dαi ∧ dq i . i=1 Obsérvese que dαi = Pn ∂αi j j=1 ∂q j dq , dα = por lo que n X n X ∂αi i=1 j=1 ∂q j · dq j ∧ dq i , (6.6) 120 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES o también, X dα = ( 1≤i<j≤n ∂αi ∂αj − i ) · dq j ∧ dq i . ∂q j ∂q (6.7) Sin embargo, para que esta definición sea consistente, debe resultar independiente de coordenadas, como comprobamos a continuación. Proposición 6.4.2 Sea α ∈ Λ1 (Q), y sean (U, ϕ = (q 1 , . . . , q n )), (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) do entornos coordenados con U ∩ Ũ 6= ∅, escribiéndose en U ∩ Ũ : α= n X αi dq i = i=1 Entonces: n X j=1 n X α̃j dq̃ j . j=1 j dα̃j ∧ dq̃ = n X dαk ∧ dq k . (6.8) k=1 Llamaremos diferencial exterior dα de α a la 2-forma diferencial definida en cada entorno coordenado por la expresión (6.8). Demostración. Como à n ! µ ¶ µ ¶ X n n k X X ∂ ∂q ∂ ∂q k ∂ ∂q k α̃j = α =α = α = αk , ∂ q̃ j ∂ q̃ j ∂q k ∂ q̃ j ∂q k ∂ q̃ j k=1 k=1 k=1 (que es un caso particular de (6.2)) se tiene: à n ! ¶ n n µ X X ∂ X ∂q k ∂ 2qk ∂q k ∂αk l dα̃j = α dq̃ = α + j dq̃ l . l j k l ∂ q̃ j k l ∂ q̃ ∂ q̃ ∂ q̃ ∂ q̃ ∂ q̃ l=1 k=1 k,l=1 En consecuencia, P Pn 2 k k ∂α j k = nj,k,l=1 ( ∂∂q̃l ∂q q̃j αk + ∂q )dq̃ l ∧ dq̃ j j=1 dα̃j ∧ dq̃ ∂ q̃ j ∂ q̃ l Pn P k k = k,l,j=1 ( ∂α dq̃ l ) ∧ ( ∂q dq̃ j ) = nk=1 dαk ∧ dq k , ∂ q̃ j ∂ q̃ l donde se ha usado que n X ∂ 2qk dq̃ l ∧ dq̃ j = 0 l ∂ q̃ j ∂ q̃ l,j=1 6.4. LA DIFERENCIAL EXTERIOR 121 por la antisimetrı́a de ∧. 2 El siguiente resultado caracteriza a la diferencial exterior, y puede tomarse como definición alternativa de ella. Teorema 6.4.3 Sea α ∈ Λ1 (Q), y X, Y ∈ X(Q). Entonces: dα(X, Y ) = X(α(Y )) − Y (α(X)) − α([X, Y ]). Demostración. Resulta inmediato de (6.7) en el caso de que X, Y sean campos coordenados. Para el caso general, obsérvese que cada miembro es C ∞ (Q)−lineal en X e Y , esto es, resulta equivalente en cada miembro multiplicar por f ∈ C ∞ (Q) que reemplazar X (resp. Y ) por f X (resp. f Y ) . 2 Ejercicio. Demuéstrese que la aplicación diferencial exterior d : Λ1 (Q) → Λ2 (Q) es lineal y verifica: d(f α) = df ∧ α + f dα, ∀f ∈ Λ0 (Q), ∀α ∈ Λ1 (Q). Podemos caracterizar ahora la igualdad (6.5). Definición 6.4.4 Diremos que una forma diferencial α ∈ Λ1 (Q) es cerrada si dα = 0, esto es, si en cualesquiera coordenadas verifica (6.5). De la discusión al comienzo de la Subsección 6.4.1 se tiene: Corolario 6.4.5 Si α ∈ Λ1 (Q) es exacta (α = df ) entonces α es cerrada (dα = 0). Veamos a continuación un recı́proco parcial de este resultado. Teorema 6.4.6 (Lema de Poincaré). Sea α ∈ Λ1 (Q) una forma diferencial cerrada. Para cada p ∈ Q existe un entorno abierto V de p y una función f : V → R tal que α = df sobre V . Demostración. Consideremos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de p ∈ Q tal que ϕ(p) = 0. Sea δ > 0 tal que ]−δ, δ[n ⊂ ϕ(U ) ⊆ Rn , y tomemos V = ϕ−1 (] − δ, δ[n ). Todo se reduce a hallar una función f tal que ∂f = αi ∀i ∈ {1, . . . , n}. (6.9) ∂q i 122 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES Ahora bien, como α es cerrada, la solución explı́cita del sistema de ecuaciones (6.9) es: R q1 R q2 f (q 1 , . . . , q n ) = 0 α1 (t, q 2 , . . . , q n )dt + 0 α2 (0, t, q 3 , . . . , q n )dt+ R q3 R qn + 0 α3 (0, 0, t, q 4 , . . . , q n )dt + . . . + 0 αn (0, . . . , 0, t)dt + C para cualquier C ∈ R.1 2 Una cuestión interesante es “cómo de grande” puede tomarse V en el Lema de Poincaré. De la demostración anterior resulta obvio que si Q = Rn entonces es posible tomar V = Rn . Con más generalidad, es posible demostrar que podemos asumir V = Q siempre que Q sea “simplemente conexa” (véase el Apéndice 1). Concretamente: Teorema 6.4.7 Sea Q una variedad simplemente conexa. Una forma diferencial α ∈ Λ1 (Q) es cerrada si y sólo si es exacta. A veces, aunque α no sea cerrada existe una función h ∈ C ∞ (Q), h > 0, tal que h · α es cerrada. Se dice entonces que h es un factor integrante de α. Obviamente, en este caso h verifica la ecuación d(h · α) = dh ∧ α + hdα = 0. Observemos que, al no anularse h, el núcleo de la forma lineal h(p)·αp : Tp Q → R coincide con el de αp . Por otra parte, es fácil comprobar que dos formas lineales que tengan igual núcleo son proporcionales. Dada una forma diferencial α la colección de todos los núcleos de las correspondientes formas lineales αp , p ∈ Q determina cuándo α admite factores integrantes. De hecho, del Teorema 6.4.3 es inmediato deducir que si α ∈ Λ1 (Q) admite un factor integrante, entonces para cualesquiera X, Y ∈ X(Q) con α(X) ≡ α(Y ) ≡ 0 se tiene α([X, Y ]) ≡ 0. El recı́proco también es cierto localmente; en particular, en dimensión 2 toda forma diferencial admite localmente factores integrantes. 6.5. Circulación de una forma diferencial Consideremos una forma diferencial α ∈ Λ1 (Q) y una curva diferenciable γ : [a, b] → Q. Es posible definir la composición: α ◦ γ 0 (t) = αγ(t) (γ 0 (t)) ∈ R, 1 ∀t ∈ [a, b], Esto es bien sabido del estudio elemental de ecuaciones en derivadas parciales, y se puede comprobar directamente derivando. 6.5. CIRCULACIÓN DE UNA FORMA DIFERENCIAL 123 que resulta ser una aplicación diferenciable [a, b] → R. Definimos la circulación de α a lo largo de γ como la integral de esta aplicación: Z Z b α := α(γ 0 (t))dt. (6.10) γ a Esta definición se extiende de manera natural al caso en el que γ sea sólo diferenciable a trozos (véase la Sección ??, Observación (3); el integrando no estarı́a bien definido sólo en un conjunto finito de puntos). Una consecuencia interesante de la linealidad de α es que la circulación resulta independiente de la reparametrización de γ. Con más precisión: Proposición 6.5.1 Consideremos una forma diferencial α ∈ Λ1 (Q), una curva γ : [a, b] → Q y una aplicación diferenciable t : [c, d] → [a, b], s 7→ t(s) con t(c) = a, t(d) = b. Si definimos γ̄ : [c, d] → Q como2 γ̄(s) = γ(t(s)), entonces la circulación de α a lo largo de γ coincide con la circulación de α a lo largo de γ̄. Demostración. Del comportamiento de la integral frente al cambio de variable y de la linealidad de α se tiene: Z b Z d Z d dt 0 0 α(γ (t))dt = α(γ (t(s))) · · ds = α(γ̄ 0 (s))ds. 2 ds a c c Cuando γ cae dentro de un entorno coordenado (U, q 1 , . . . , q n ) se verifica: Z b n Z b X dq i (t) 0 α(γ (t))dt = αi (q 1 (t), . . . , q n (t)) dt, (6.11) dt a a i=1 siendo γ(t) = (q 1 (t), . . . , q n (t)). En la práctica, se suele calcular la circulación mediante la expresión: n Z b X dq i (t) 1 n αi (q (t), . . . , q (t)) dt dt i=1 a 2 Cuando t0 (s) > 0 en todo punto se dice que γ̄ es una reparametrización (creciente) de γ, aunque esta hipótesis no es necesaria para la presente proposición. En cualquier caso, la condición t(c) = a, t(d) = b implica que la derivada sea positiva en un subconjunto de [c, d]; si reemplazamos esta condición por t(c) = b, t(d) = a entonces el signo de la circulación a lo largo de γ̄ cambia con respecto a γ. Obsérvese además que, en el caso de que γ(a) = γ(b), la condición t(c) = a, t(d) = b implica intuitivamente que el “número de vueltas” con el que finalmente se recorre γ sea igual al “número de vueltas” con el que se recorre γ̄. 124 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES = n Z X i=1 q1i q0i αi (q 1 (q i ), . . . , q i , . . . , q n (q i ))dq i , (6.12) (q01 , . . . , q0n ), siendo γ(a) ≡ γ(b) ≡ (q11 , . . . , q1n ). En ocasiones, en lugar de la expresión “circulación de α a lo largo de γ” se habla de “integral de lı́nea (o camino) de α a lo largo de (la imagen de) γ”, con lo que se pone más de manifiesto su invariancia ante reparametrizaciones. Si conocemos la circulación de α a lo largo de cualquier curva entonces podemos reconstruir α. Con más precisión, de (6.11) se sigue inmediatamente: Proposición 6.5.2 Si vp ∈ Tp Q y si γ : [0, ²] → Q, ² > 0 es una curva diferenciable con γ 0 (0) = vp , entonces se verifica Rt α(γ 0 (t))dt 0 . α(vp ) = limt→0 t La circulación de α a lo largo de dos curvas distintas γ y γ̃ no tiene por qué coincidir aunque los extremos de γ y γ̃ sı́ lo hagan. Sin embargo, esto sı́ coincide cuando α es exacta. En efecto, si α = df entonces Z b Z b Z b d(f ◦ γ) 0 0 α(γ (t))dt = df (γ (t))dt = dt = f (γ(b)) − f (γ(a)). dt a a a (6.13) De hecho, esta propiedad caracteriza a las formas diferenciales exactas: Teorema 6.5.3 Resultan equivalentes: (i) α es una forma diferencial exacta. (ii) Para cualesquiera dos curvas γ : [a, b] → Q, γ̃ : [c, d] → Q con γ(a) = γ̃(a), γ(b) = γ̃(b) la circulación de α a lo largo de γ coincide con la circulación de α a lo largo de γ̃. Demostración. La implicación (i) ⇒ (ii) se reduce a (6.13). Para la recı́proca, escojamos un punto p0 en (cada parte conexa de) Q. Para cada punto p (en esa parte conexa -y, por tanto, arcoconexa) tomamos una curva γ : [0, b] → Q que conecte p0 con p. Definimos f escogiendo f (p0 ) ∈ R arbitrariamente y tomando: Z b f (p) = f (p0 ) + α(γ 0 (t))dt. (6.14) 0 6.6. APÉNDICE 1: CONEXIÓN SIMPLE 125 La función f está bien definida por la hipótesis (ii). Si v = γ 0 (0) ∈ Tp0 Q, de d(f ◦ γ) (0), v = γ 0 (0) dt y (6.14) se comprueba que αp0 (v) = dfp0 (v). Para comprobar la igualdad entre α y df en cualquier otro punto p1 (de la misma parte conexa de p0 ), basta con darse cuenta de que la igualdad (6.14) se verifica también sustituyendo f (p0 ) por f (p1 ) y tomando curvas que conecten p1 con cada p (fı́jese una curva γ0 que conecte p0 con p1 y yuxtapóngase con cualquiera que conecte p1 con p). 2 Si α es cerrada pero no exacta entonces las circulaciones de α a lo largo de γ y γ̃ no tienen por qué coincidir. Ahora bien, si γ y γ̃ son homotópicas (véase el Apéndice 1) entonces estas circulaciones necesariamente coinciden. Una explicación intuitiva de este hecho es que, al ser γ y γ̃ homotópicas, ambas caen en un conjunto simplemente conexo U de Q. Por tanto, α es exacta sobre U y el resultado se sigue del Teorema 6.5.3. dfp (v) = Ejercicio. Sea α una forma diferencial cerrada sobre Q = R2 \{0}. Pruébese que es exacta si y sólo si su circulación a lo largo de la curva γ(t) = (cos t, sent), t ∈ [0, 2π] es nula. Generalı́cese a Q igual a R2 menos un conjunto finito de puntos. 6.6. Apéndice 1: variedades simplemente conexas A continuación introducimos el concepto de conexión simple. Este concepto es aplicable a todo espacio topológico aunque, por comodidad, puede suponerse que el espacio topológico es siempre una variedad (topológica) Q. Fijados p, q ∈ Q, diremos que la curva (continua) γ : [0, 1] → Q conecta p con q si p = γ(0), q = γ(1). En el caso particular p = q, diremos que γ es un lazo en p. Dada otra curva γ̃ : [0, 1] → Q que conecte p y q se dice que γ y γ̃ son homotópicas si existe una aplicación continua H : [0, 1] × [0, 1] → Q (s, t) 7→ γs (t) 126 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES tal que cada curva γs conecta p y q, ∀s ∈ [0, 1] y, además, γ0 = γ, γ1 = γ̃. Un lazo γ en p se dice homotópico nulo si es homotópico al lazo constantemente igual a p. Definición 6.6.1 Una variedad3 conexa Q es simplemente conexa si todo lazo en p es homotópico nulo, ∀p ∈ Q. Al ser la variedad conexa, no es difı́cil comprobar que si la anterior condición se verifica en un punto entonces se verifica en todos los puntos. Algunos ejemplos de espacios simplemente conexos son Rn , S n con n ≥ 2 y R3 − {p} (para cualquier p ∈ R3 ). Ejemplos de espacios que no son simplemente conexos son S 1 , R2 − {p} y R3 − {r} donde r es cualquier lı́nea recta. Nota. Resulta relevante que todo espacio topológico arcoconexo Q admite (bajo hipótesis muy generales satisfechas por cualquier variedad) un recubridor universal (Q̃, Π), donde Q̃ es un espacio topológico simplemente conexo y Π : Q̃ → Q una aplicación recubridora, esto es, un homeomorfismo local que verifica: todo punto p ∈ Q admite un entorno conexo V tal que Π restringido a cada parte conexa de Π−1 (V ) es un homeomorfismo sobre V . En el caso de que Q sea una variedad diferenciable, la aplicación recubridora Π induce de manera natural una (única) estructura diferenciable sobre Q̃, para la cual Π resulta ser un difeomorfismo local4 . Análogas conclusiones se derivan para el caso de variedades complejas (véase la nota al concepto de variedad anterior a la Sección 2.3). De hecho, la superficie de Riemann Q̃ que se construye en variable compleja para una función holomorfa f sobre C con singularidades aisladas, es un ejemplo tı́pico de variedad (real de dimensión 2, compleja de dimensión 1) construida de tal modo que la aplicación 3 En principio, los conceptos de homotopı́a y de conexión simple son aplicables a todo espacio topológico, por lo que se formulan sólo con continuidad. No obstante, en variedades se puede suponer que todos los elementos son diferenciables (o diferenciables a trozos) sin pérdida de generalidad. De hecho, toda curva continua que conecte dos puntos fijos es homotópica a una diferenciable, y si dos curvas diferenciables son continuamente homotópicas entonces también son diferenciablemente homotópicas. 4 Discutiremos con más detalle estas propiedades en el Tema 8, Apéndice 8.7 6.7. APÉNDICE 2: TERMODINÁMICA 127 Π : Q̃ → C\{singularidades} que identifica puntos de diversas hojas de Q̃ resulta ser una aplicación recubridora (diferenciable compleja). Ası́, p. ej., la superficie de Riemann Q̃ de la aplicación logaritmo neperiano, dotada de su proyección natural Π : Q̃ → C\{0}, puede verse como el recubridor universal de C\{0}. 6.7. Apéndice 2: Termodinámica Consideramos los “estados de equilibrio” de un sistema termodinámico (simple) como puntos de una variedad5 M que, por sencillez, supondremos simplemente conexa. Cada “proceso casiestático” de un estado p ∈ M a un estado q ∈ M se modela por una curva diferenciable γ : [a, b] → M con γ(a) = p, γ(b) = q. El parámetro de la curva no debe interpretarse como el tiempo (los estados son de equilibrio). Como estaremos interesados en circulaciones de formas, por la Proposición 6.5.1 no nos importará la reparametrización de γ. En cada proceso casiestático γ, el fı́sico es, en principio, capaz de calcular el calor transferido Q y el trabajo realizado L por el sistema. La independencia de Q y L con la reparametrización de γ sugiere que ambos son circulaciones de formas diferenciales. La Proposición 6.5.2 permitirı́a calcular entonces estas formas. Postulamos entonces que exˆ y dL, ˆ cuyas circulaciones a lo largo isten dos formas diferenciales, dQ de cualquier proceso casiestático γ proporcionan, respectivamente, Q y L. Nótese que dˆ es sólo una notación, no representa diferenciales de ˆ dL ˆ ∈ Λ1 (M ). La notación simplemente sugiere que el funciones, dQ, calor o trabajo transferidos a lo largo del proceso γ se obtiene como una circulación a lo largo de él. ˆ dL ˆ pueden ser arbitrarias, con la única En principio, las formas dQ, restricción de que en ningún punto se anulen. Sin embargo, existen razones fı́sicas por las que se postula que su diferencia es exacta, esto es: (Primer Principio de la Termodinámica.) Existe una función U , la energı́a interna del sistema termodinámico, que verifica: ˆ − dL ˆ = dU. dQ 5 En esta sección reservamos la letra Q para el calor transferido por el sistema. 128 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES ˆ dL ˆ no sean cerradas, se admite que dL ˆ es expresable Aunque dQ, en términos de funciones con significado fı́sico sobre M , tı́picamente ˆ = −P dV , donde P es la presión del sistema y V : M → (0, ∞) dL ˆ De nuevo, exisel volumen; ası́, 1/P es un factor integrante de dL. ˆ también debe admitir un factor ten razones fı́sicas para creer que dQ integrante: (Segundo Principio de la Termodinámica). La inversa de la temperatura T del sistema fı́sico es un factor integrante de ˆ esto es 1 dQ ˆ es cerrada. Al ser M simplemente conexa, dQ, T podemos escribir: 1ˆ dQ = dS T para una función S sobre M , a la que se le llamará entropı́a del sistema fı́sico. Una consecuencia del Segundo Principio de la Termodinámica es el “Teorema de Caratheodory”, la conclusión del cual puede admitirse como un postulado alternativo al Segundo (“Postulado de Caratheodory”). Para analizarlo téngase en cuenta el siguiente resultado general [AMR, Section 8.4.1]: Teorema 6.7.1 Sea M simplemente conexa y α ∈ Λ1 (M ) tal que αp 6= 0, ∀p ∈ M . Equivalen: (i) α admite un factor integrante. (ii) Para ningún p ∈ M existe un entorno suyo U tal que el punto p y cada q ∈ U puedan conectarse mediante una curva γ con α ◦ γ 0 ≡ 0. [Es fácil comprobar (i) ⇒ (ii). De hecho, si h·α = df entonces α◦γ 0 ≡ 0 equivale a df ◦ γ 0 ≡ 0, esto es, f ◦ γ ≡ constante. Por tanto, mediante curvas γ con α ◦ γ 0 ≡ 0 sólo podremos conectar p y q si f (p) = f (q).] Una vez admitido el Segundo Postulado de la Termodinámica, el Teorema de Caratheodory afirma: Para todo estado p ∈ M existen estados arbitrariamente próximos de p (esto es, una sucesión {pn }n → p, pn ∈ M − {p}, ∀n ∈ N) que son inaccesibles desde p por vı́a adiabática (esto es, no existe ningún proceso casiestático γ 0 ˆ entre p y pn tal que dQ(γ (t)) ≡ 0). Claramente, esta conclusión es una reformulación de (i) ⇒ (ii) en el teorema anterior. 6.7. APÉNDICE 2: TERMODINÁMICA 129 Ejercicios Ejercicio 1. Exprésese en coordenadas cilı́ndricas el campo tensorial sobre R3 : T = xyzdx ⊗ dz ⊗ ∂/∂y. Ejercicio 2. Pruébese que para toda función f sobre una variedad diferenciable Q se verifica d(df ) = 0. Ejercicio 3. Sean α, β ∈ Λ1 (Q), Ω ∈ Λ2 (Q), f ∈ C ∞ (Q) ≡ Λ0 (Q) y sea F : Q0 → Q diferenciable. Definimos (véase también la Definición 8.5.6.) F ∗ α : T Q0 → R por F ∗ α(vp0 ) = α(dFp0 (vp0 )), ∀vp0 ∈ Tp0 Q0 , ∀p0 ∈ Q0 , y, análogamente, F ∗ Ω : T Q0 × T Q0 → R. Demuéstrese: (i) F ∗ α ∈ Λ1 (Q0 ), F ∗ Ω ∈ Λ2 (Q0 ). (ii) F ∗ α ∧ F ∗ β = F ∗ (α ∧ β). (iii) d(F ∗ α) = F ∗ dα, d(f ◦ F ) = F ∗ df . (iv) si α es cerrada (resp. exacta), F ∗ α es cerrada (resp. exacta). Ejercicio 4. Se considera la forma diferencial α = (xdy − ydx)/(x2 + y 2 ) sobre R2 − {(0, 0)}. ¿Es α cerrada? ¿Es exacta? Sea Π : R+ × R → R2 − {(0, 0)}, (ρ, θ) → (ρ cos θ, ρsenθ). En la notación del ejercicio anterior, ¿es Π∗ α cerrada? ¿Es exacta? Ejercicio 5. En R+ × R+ se considera la 1-forma diferencial α = y dx + 2dy. ¿Es α cerrada o exacta? ¿Admite un factor integrante? x Calcúlese su circulación a lo largo del rectángulo de extremos los puntos (1, 1), (3, 1), (3, 2), (1, 2) en sentido de giro positivo. Ejercicio 6. En todo R2 \{0} se considera la forma diferencial que, en el dominio de definición de las coordenadas polares, se expresa como α = ρdθ + ρ2 dρ. Sea α̂ su restricción a la circunferencia unidad. Determı́nese si α y α̂ son cerradas o exactas. Calcúlese la circulación de ambas a lo largo de la curva γ(t) = (cos t, sent), t ∈ [0, 3π]. Ejercicio 7. En R2 \{0} se considera la forma diferencial α= x2 ¡ 3 ¢ 1 (x + xy 2 − y)dx + (yx2 + y 3 + x)dy . 2 +y Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es α cerrada? ¿Es exacta? 130 CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES Ejercicio 8. Sea Q la variedad formada por R2 ×]0, ∞[ menos el eje z, y considérense las formas diferenciales α, β ∈ Λ1 (Q) que, en el dominio de definición de las coordenadas cilı́ndricas, vienen dadas por: α = ρsen(2θ)dρ + ρ2 cos(2θ)dθ + 1 2 ρ sen(2θ)dz, 2z β = z α. (i) ¿Son α y β cerradas? ¿Son exactas? (ii) Calcúlese la circulación de ambas a lo largo de la curva ½ (cos t, sent, 1), t ∈ [0, 2π] γ(t) = (1, 0, t − 2π + 1), t ∈ [2π, 2π + 2]. Ejercicio 9. En R2 \{0} se considera la forma diferencial µ ¶ µ ¶ y x α= x− 2 dx + y + 2 dy. x + y2 x + y2 Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es α cerrada? ¿Es exacta? Ejercicio 10. Determı́nense las posibles funciones f ∈ C ∞ (R4 ) para que la forma diferencial sobre R4 , µ = (y + z + t)dx + (x + z + t)dy + (x + y + t)dz + f dt, sea cerrada, y entonces muéstrese explı́citamente que es exacta. Capı́tulo 7 Campos tensoriales métricos Cuando a cada espacio tangente Tp Q de una variedad Q se le fija un producto escalar gp se tiene una variedad semi-riemanniana (en particular, riemanniana o lorentziana según el ı́ndice del producto escalar). Puesto que gp determina un isomorfismo canónico entre Tp Q y su espacio dual, en este capı́tulo traduciremos las propiedades de las formas diferenciales vistas en el capı́tulo anterior a campos vectoriales. En particular, definiremos los campos conservativos e irrotacionales como los asociados a formas exactas y cerradas, respectivamente. También definiremos el concepto de variedades semi-riemannianas isométricas, que permite decidir cuándo dos variedades semi-riemannianas tienen todas sus propiedades iguales. Finalmente, anticipamos el concepto de distancia asociada a una métrica riemanniana, que desarrollaremos más ampliamente en el Capı́tulo ??. 7.1. Concepto de métrica riemanniana y lorentziana Sea V (R) un espacio vectorial real y h·, ·i un tensor 2-covariante y simétrico (métrica) sobre él. Por el Teorema de Sylvester es bien sabido que existe una base B = (v1 , . . . , vs , vs+1 , . . . vr , vr+1 , . . . , vn ) de V tal 131 132 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS que hvi , vj i = 0 si i 6= j −1 si i = 1, . . . , s 1 si i = s + 1, . . . , r y hvi , vi i = 0 si i = r + 1, . . . , n. A las bases en las que h·, ·i adopta esta expresión se les llama ortonormales. Los valores de s, r ∈ {0, 1, . . . , n} son independientes de la base ortonormal escogida y reciben el nombre de ı́ndice y rango de h·, ·i, respectivamente. Se dice que h·, ·i es: (1) no degenerado o un producto escalar si r = n. Ello ocurrirá si y sólo si la matriz asociada (hvi , vj i)i,j es regular (su determinante es distinto de 0) para alguna base B = (v1 , . . . , vn ) de V (y, en este caso, la matriz es regular para cualquier base). Equivalentemente: si un vector v ∈ V verifica hv, wi = 0 para todo w ∈ V , entonces necesariamente v = 0. (2) un producto escalar euclı́deo si s = 0 y r = n, o equivalentemente: hv, vi ≥ 0 ∀v ∈ V , con igualdad si y sólo si v = 0. Por tanto, h·, ·i es no degenerado y las bases ortonormales pueden calcularse por el procedimiento clásico de ortonormalización de Gram-Schmidt. Obsérvese que en este caso la matriz asociada a una base ortonormal B = (v1 , . . . , vn ) es la identidad. (3) un producto escalar lorentziano si n ≥ 2 y la matriz (hvi , vj i)i,j es no degenerada y con ı́ndice s = 1. En este caso, para cualquier base ortonormal B = (v1 , . . . , vn ) se tiene la matriz: −1 0 . . . 0 0 (hvi , vj i) = .. . . Idn−1 0 Definiciones 7.1.1 Sea Q una variedad diferenciable. Llamaremos campo tensorial métrico o, simplemente, métrica sobre Q a cualquier campo de tensores 2-covariante simétrico g sobre Q. En este caso se dice que la métrica g es: 7.1. MÉTRICAS RIEMANNIANAS Y LORENTZIANAS 133 (1) riemanniana si gp es un producto escalar euclı́deo de Tp Q para todo p ∈ Q. (2) lorentziana si gp es una producto escalar lorentziano de Tp Q para todo p ∈ Q. (3) semi-riemanniana si gp es un producto escalar de Tp Q con ı́ndice s constante para todo p ∈ Q1 . Según el caso, llamaremos al par (Q, g) variedad riemanniana, lorentziana o semi-riemanniana, respectivamente. En adelante todas las métricas que consideremos serán semi-riemannianas, salvo especificación contraria. Ejemplos: (1) La métrica riemanniana usual de Rn es n X g0 = dx ⊗ dx + · · · + dx ⊗ dx ≡ (dxi )2 . 1 1 n n i=1 Análogamente, la métrica lorentziana usual se define como n X gL = −dx ⊗dx +dx ⊗dx +· · ·+dx ⊗dx ≡ −(dx ) + (dxi )2 . 1 1 2 2 n n 1 2 i=2 (2) Sea S una subvariedad de Rn . Como Tp S es un subespacio de Tp Rn para todo p ∈ S, la métrica usual g0 de Rn puede restringirse a Tp S para proporcionar un producto escalar euclı́deo gpS sobre cada Tp S. Concretamente, gpS : Tp S × Tp S → R (v, w) 7→ g0 (v, w). El campo de tensores g S sobre S ası́ determinado es una métrica riemanniana. Esto ocurre, por ejemplo, en la esfera bidimensional S 2 ⊂ R3 (ası́ como en cualquier superficie de R3 ), sobre la 1 Si Q es conexa entonces la condición de que la métrica sea no degenerada implica que el ı́ndice sea constante. 134 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS que se puede inducir la métrica usual de R3 . Con más generalidad, para cualquier variedad riemaniana (Q, g), su métrica puede inducirse por restricción a cualquier subvariedad suya S, generándose ası́ una nueva variedad riemanniana2 (S, g S ). (3) Consideremos sobre R2 un campo de tensores arbitrario g = g11 (x, y)dx2 + g12 (x, y)(dx ⊗ dy + dy ⊗ dx) + g22 (x, y)dy 2 . Si el determinante ¯ ¯ g11 (x, y) g12 (x, y) ¯ ¯ g12 (x, y) g22 (x, y) ¯ ¯ ¯ ¯ es distinto de 0 en todo punto de R2 entonces g es una métrica semi-riemanniana. Si el determinante es mayor que 0 y g11 > 0 entonces g es riemanniana. Finalmente, si el determinante es menor que 0 entonces g es lorentziana. Esto se mantiene aun cuando (x, y) representaran las coordenadas de cualquier variedad bidimensional (en el abierto donde estén definidas). El criterio para comprobar cuándo es riemanniana se generaliza fácilmente a dimensiones superiores (hállese como ejercicio). (4) Consideremos dos variedades semi-riemannianas (Q, g), (Q0 , g 0 ). Para la variedad producto Q×Q0 se tiene la identificación natural T(p,p0 ) (Q × Q0 ) ≡ Tp Q × Tp0 Q0 , de modo que cada vector tangente en (p, p0 ) se puede ver como un par (vp , vp0 0 ) ∈ Tp Q × Tp0 Q0 . De modo natural, podemos considerar g y g 0 como tensores métricos sobre Q × Q0 y definir (g + g 0 )((vp , vp0 0 ), (wp , wp0 0 )) = g(vp , wp ) + g 0 (vp0 0 , wp0 0 ). Por tanto, g + g 0 es una nueva métrica semi-riemanniana cuyo ı́ndice es la suma de los ı́ndices de g y g 0 (en particular, si ambas son riemannianas entonces g+g 0 también lo es). Si h, f ∈ C ∞ (Q× Q0 ), h > 0, f > 0 entonces hg + f g 0 es también una métrica semiriemanniana. 2 Si la métrica de partida g fuera semi-riemanniana, habrı́a que tener la precaución de que el campo de tensores inducido g S sobre la subvariedad no degenerase en ningún punto. Con esta restricción, (S, g S ) también es una nueva variedad semiriemanniana, aunque no necesariamente del mismo ı́ndice que (Q, g). 7.2. GRADIENTE DE UNA FUNCIÓN 135 Puede demostrarse que toda variedad diferenciable admite una métrica riemanniana, usando particiones de la unidad (véase el Tema 8, Sección 8.2.4). Ejercicio. Sean (Q, g) = (R, −dt2 ), (Q0 , g 0 ) = (S 3 , gS ), donde −dt2 es la métrica opuesta a la usual de R y gS es la métrica inducida por (R4 , g0 ) sobre la esfera S 3 . Sea f : R × S3 → R (t, x) 7→ f (t), f > 0, y consideremos sobre R × S 3 la métrica: g = −dt2 + f 2 (t)gS (modelo cosmológico estándar de universo finito pero ilimitado de Robertson -Walker). Compruébese: (1) En cada base Bp = (∂t , v̂1 , v̂2 , v̂3 ) del espacio tangente Tp (R×S 3 ) tal que B̂ = (v̂1 , v̂2 , v̂3 ) es ortonormal para gS , la métrica g tiene por matriz asociada −1 0 ... 0 0 . .. 2 . f (t) · Id3 0 (2) La métrica g es lorentziana. Constrúyase una base ortonormal en cada punto. (3) La restricción de la métrica lorentziana g a cada hipersuperficie t ≡constante es una métrica riemanniana. (4) Si S 1 = {(x, y, z, w) ∈ S 3 : z = w = 0} es el ecuador de S 3 , entonces S = R × S 1 es una subvariedad de R × S 3 y la métrica lorentziana g restringida a S también es lorentziana. (5) Existen en R × S 3 subvariedades de dimensión 1 tales que g restringida a cualesquiera de ellas es idénticamente nula. 7.2. Gradiente de una función En un espacio vectorial dotado de un producto escalar los isomorfismos bemol y sostenido permiten asociar a cada vector una forma 136 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS lineal, y viceversa (véase el Apéndice 1). Por tanto, si (Q, g) es una variedad semi-riemanniana, se definen de manera natural la forma diferencial bemol X [ ∈ Λ1 (Q) y el campo sostenido α] ∈ X(Q) de un campo X ∈ X(Q) y una forma diferencial α ∈ Λ1 (Q), respectivamente. En coordenadas (U, q 1 , . . . , q n ), dichos campos tienen la expresión: X= n X Xi i=1 α= n X ∂ , ∂q i i αi dq , X[ = n X gij X i dq j . i,j=1 ] α = i=1 n X g ij αi i,j=1 ∂ . ∂q j Estamos en condiciones de establecer la siguiente definición: Definición 7.2.1 Sea (Q, g) una variedad semi-riemanniana. Para cada f ∈ C ∞ (Q) definimos el campo vectorial gradiente de f , grad f , como el campo asociado a la diferencial de f por la métrica g: grad fp = (dfp )] ∀p ∈ Q. Por tanto, de la expresión por coordenadas obtenida anteriormente para el campo sostenido se tiene: grad f = n X i,j=1 g ij ∂f ∂ . ∂q i ∂q j Discutimos a continuación algunas propiedades del gradiente que ayudan a comprender mejor su significado. Supongamos que la función diferenciable f : Q → R presenta un valor regular c ∈ R (esto es, dfp 6= 0 para todo p ∈ f −1 (c)). Sea S = f −1 (c) la correspondiente subvariedad (hipersuperficie de nivel) asociada a f . Consideremos un vector vp ∈ Tp S arbitrario y una curva γ en S cuya velocidad inicial coincida con vp . Entonces, g(grad fp , vp ) = dfp (vp ) = d d |t=0 f ◦ γ(t) = |t=0 c = 0. dt dt Por tanto, al ser vp ∈ Tp S arbitrario, acabamos de probar que grad fp es perpendicular a S en p. 7.3. CAMPOS CONSERVATIVOS E IRROTACIONALES 137 Más aún, cuando g es riemanniana y γ es una curva arbitraria en Q (no necesariamente contenida en S) tal que γ(0) = p ∈ S, |γ 0 (0)k = 1, entonces: d |t=0 f ◦ γ(t) = gp (grad fp , γ 0 (0)) = kgrad fp k · cos β, dt siendo β el ángulo que forman grad fp y γ 0 (0) según gp . En particular, si γ 0 (0) apunta en la dirección de grad fp entonces cos β = 1 y la derivada anterior es máxima. En resumen, grad fp es perpendicular a S en p y apunta en la dirección de máxima variación de f , en sentido creciente, con módulo igual a la máxima derivada. 7.3. Campos conservativos e irrotacionales Definiciones 7.3.1 Sea (Q, g) una variedad semi-riemanniana. (i) Diremos que un campo vectorial X ∈ X(Q) es conservativo si X = grad f para alguna función f ∈ C ∞ (Q), esto es, si X [ es exacta (X [ = df ). (ii) Diremos que un campo vectorial X ∈ X(Q) es irrotacional si X [ es cerrada, esto es, si la 2-forma rotacional dX [ es nula. De estas definiciones y de las propiedades de las formas cerradas y exactas (Sección 6.4) se tiene inmediatamente: Proposición 7.3.2 (i) Si un campo X ∈ X(Q) es conservativo entonces es irrotacional. (ii) Si un campo X ∈ X(Q) es irrotacional entonces es localmente conservativo, esto es, para todo p ∈ Q existe un entorno suyo V y una función f ∈ C ∞ (V ) tal que X = grad f en V . Cuando Q es simplemente conexa entonces puede tomarse V = Q; por tanto, para estas variedades los campos irrotacionales coinciden con los conservativos. Ejemplo. En R3 con su métrica usual consideremos un campo vectorial X = X1 ∂ ∂ ∂ + X2 + X3 . ∂x ∂y ∂z 138 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS ∂ ∂ ∂ definido en un abierto U ⊆ R3 . Dado que el conjunto ( ∂x , ∂y , ∂z ) es 3 una base ortonormal en cada punto de R se tiene: X [ = X 1 dx + X 2 dy + X 3 dz. Un cálculo simple muestra entonces que la 2-forma rotacional vale: ¶ µ ∂X 3 ∂X 2 [ dX = − dy ∧ dz ∂y ∂z µ ¶ µ ¶ ∂X 3 ∂X 1 ∂X 2 ∂X 1 + dx ∧ dz + dx ∧ dy. − − ∂x ∂z ∂x ∂y Usando las coordenadas usuales de R3 podemos definir el rotacional de X como el siguiente campo de vectores3 : µ ¶ µ ¶ µ ¶ ∂X 3 ∂X 2 ∂ ∂X 3 ∂X 1 ∂ ∂X 2 ∂X 1 ∂ Rot X = − − − + − . ∂y ∂z ∂x ∂x ∂z ∂y ∂x ∂y ∂z (7.1) Claramente, dX [ = 0 si y sólo si Rot X = 0. Ası́, si X está definido en un abierto U simplemente conexo, (p. ej., todo U = R3 ), X es conservativo si y sólo si Rot X = 0. 7.4. Circulación de un campo vectorial a lo largo de una curva Sea X un campo vectorial sobre una variedad semi-riemanniana (Q, g) y consideremos una curva diferenciable γ : [a, b] → Q. Se tienen 3 3 Para definir el rotacional de X estamos usando la base de campos usual de R . Como veremos en el Tema 9, para definir Rot X en cada punto p, podemos 3 usar (7.1) reemplazando las coordenadas usuales de R (y sus correspondientes campos vectoriales coordenados) por cualesquiera otras (q 1 , q 2 , q 3 ) que verifiquen: 3 (i) Bp = (∂/∂q 1 |p , ∂/∂q 2 |p , ∂/∂q 3 |p ) es una base ortonormal de Tp R , y (ii) Bp está “positivamente orientada” respecto a la base Bp0 en p inducida por las coordenadas cartesianas usuales, esto es, el determinante de la matriz de cambio de base entre Bp0 y Bp es positivo (por verificarse (i), el determinante será entonces igual a 1). La construcción del campo vectorial Rot X es entonces generalizable de manera inmediata a cualquier variedad riemanniana (Q, g) que esté orientada y tenga dimensión 3. En dimensión superior no existe la interpretación del rotacional como campo vectorial (véase también la Sección ?? para más detalles). 7.5. ISOMETRÍAS 139 entonces que Xγ(t) , γ 0 (t) ∈ Tγ(t) Q, y tiene sentido considerar la aplicación diferenciable [a, b] → R t 7→ g(Xγ(t) , γ 0 (t)). Definición 7.4.1 Definimos la circulación de un campo X ∈ X(Q) a lo largo de una curva diferenciable γ en Q como la integral Z b g(Xγ(t) , γ 0 (t))dt. (7.2) a Obsérvese que esta definición coincide con la circulación de X [ a lo largo de γ, esto es: Z b [ Xγ(t) (γ 0 (t))dt. a En particular, resulta independiente de la reparametrización de γ (Proposición 6.5.1). Por otra parte, de las propiedades de la circulación de formas cerradas y exactas (Sección 6.5) resultan inmediatas las propiedades análogas para la circulación de campos irrotacionales y conservativos. Ası́, si X es conservativo entonces la circulación de X a lo largo de una curva depende sólo de los extremos de la curva. Concretamente, la circulación de X = grad f a lo largo de la curva γ verifica Z b g(X, γ 0 )dt = f (γ(b)) − f (γ(a)). a Esta propiedad caracteriza a los campos conservativos (Teorema 6.5.3). Si X fuera irrotacional pero no conservativo entonces sólo podrı́amos asegurar que la circulación de X a lo largo de dos curvas γ, ρ con los mismos extremos coincide si γ y ρ son homotópicas. 7.5. Isometrı́as Definición 7.5.1 Sean (Q, g), (Q0 , g 0 ) dos variedades semi-riemannianas. Diremos que una aplicación diferenciable F : Q → Q0 es una isometrı́a (entre variedades semi-riemannianas) si 140 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS (i) F es un difeomorfismo, (ii) F “preserva las métricas”, esto es, gp (vp , wp ) = gF0 (p) (dFp (vp ), dFp (wp )), ∀vp , wp ∈ Tp Q, ∀p ∈ Q. Observemos que la condición (ii) equivale a que la aplicación dFp : Tp Q → TF (p) Q0 sea una isometrı́a vectorial entre (Tp Q, gp ) y (TF (p) Q0 , gF0 (p) ) para todo p ∈ Q. De dos variedades semi-riemannianas entre las que existe una isometrı́a se dice que son isométricas. Todas las propiedades derivadas de la métrica (y, por supuesto, de la estructura de variedad diferenciable -en particular las propiedades topológicas) que verifique una variedad semi-riemanniana (Q, g) las verificarán también todas las variedades isométricas a ella. Por tanto, las propiedades asociadas a la métrica en la variedad se conservan a través de la isometrı́a. Dadas dos variedades semi-riemannianas resulta natural preguntarse cuándo son isométricas. Por ejemplo, consideremos la esfera S 2 ⊂ R3 , un cilindro C ⊂ R3 y un plano Π ⊂ R3 como variedades riemannianas. Dos a dos no son isométricas porque no son difeomorfas globalmente (de hecho, ni siquiera son homeomorfas): la esfera es compacta y el resto no; el cilindro no es simplemente conexo mientras que la esfera y el plano sı́ lo son. Sin embargo, un casquete abierto de una esfera sı́ es difeomorfo a un disco, o a algunos abiertos de un cilindro (Figura 19). Figura 19 7.6. DISTANCIA EN EL CASO RIEMANNIANO 141 Se puede demostrar que no existen abiertos de la esfera y del plano que sean isométricos entre sı́. Por otra parte, todo abierto simplemente conexo del cilindro es isométrico a algún abierto del plano. En la determinación de la posible existencia de isometrı́as desempeña un papel esencial el tensor de curvatura, que estudiaremos más adelante. 7.6. Distancia asociada a una métrica riemanniana Sea (Q, g) una variedad riemanniana y sea γ : [a, b] → Q una curva diferenciable. Definimos la longitud de γ como Z b Z bq 0 gγ(t) (γ 0 (t), γ 0 (t))dt. L(γ) = kγ (t)kdt = a a El concepto de longitud de una curva que acabamos de introducir sugiere la siguiente definición de distancia. Dada una variedad riemanniana conexa (Q, g) y dos puntos p, q ∈ Q, definimos la distancia entre ellos como: dg (p, q) = Infγ {L(γ) : γ : [a, b] → Q, γ(a) = p, γ(b) = q}. Aunque las propiedades de la función distancia se verán con más detalle en el Capı́tulo ??, anticipamos ahora las dos siguientes: (1) La aplicación dg : Q × Q → [0, ∞) es una distancia “abstracta”, esto es, verifica las propiedades de una distancia definidas en [Sección 1.6, Definición 1.6.1]. (2) La topologı́a asociada a la distancia dg en Q coincide con la topologı́a de (Q, g) como variedad. Como acabamos de ver, toda variedad riemanniana conexa (Q, g) tiene asociado un espacio métrico (Q, dg ) que, en general, puede o no ser completo. Por otra parte, dos variedades riemannianas isométricas son también isométricas como espacios métricos. En particular, tendrán el mismo diámetro, que se define (como en cualquier espacio métrico): diam(Q) = Sup{dg (p, q) : p, q ∈ Q} ∈ [0, ∞]. 142 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS Una cuestión que surge de manera natural es la siguiente: dados dos puntos p, q ∈ Q, ¿existe alguna curva que conecte p y q y que tenga longitud igual a dg (p, q)? La respuesta a esta pregunta (que es afirmativa siempre localmente, y que lo es globalmente cuando (Q, dg ) es completo) se obtiene en términos de geodésicas, tal y como veremos en el Tema ??. 7.7. Apéndice 1: aplicaciones bemol y sostenido En general, cada producto escalar h·, ·i induce un isomorfismo canónico entre V (R) y V ∗ (R). En efecto, Definición 7.7.1 Llamamos aplicación bemol [ (“bajar ı́ndices”) entre V (R) y V ∗ (R) asociada al producto escalar h·, ·i a la aplicación [: V →V∗ v 7→ v [ ≡ hv, ·i, donde hv, ·i : V → R w 7→ hv, wi. Teorema 7.7.2 (1) La aplicación bemol [ es un isomorfismo entre los espacios vectoriales V (R) y V ∗ (R). (2) La aplicación inversa ] de [, conocida como aplicación sostenido (subir ı́ndices), queda caracterizada por la relación hφ] , wi = φ(w), ∀φ ∈ V ∗ , ∀w ∈ V . Demostración. (1) La linealidad es inmediata. Para la inyectividad nótese que son equivalentes: (i) [ tiene núcleo 0, (ii) el tensor métrico h·, ·i es no degenerado. (2) En efecto, (φ] )[ (w) = hφ] , wi = φ(w) ∀w ∈ V . Además, esta igualdad caracteriza a φ] por ser h·, ·i no degenerada. 2 Para dar sus expresiones en coordenadas consideremos una base B = (v1 , . . . , vn ) de V (R) y su correspondiente base dual B ∗ = (φ1 , . . . , φn ). 7.7. APÉNDICE 1: BEMOL Y SOSTENIDO Pn Entonces podemos suponer que v = Ahora bien, aj = v [ (vj ) = hv, vj i y i=1 ai vi ∈ V y v [ = n X [ aj = v (vj ) = hv, vj i = 143 Pn j=1 gij ai , aj φj . (7.3) i=1 P donde gij = hvi , vj i. Por tanto, v [ = ni,j=1 ai gij φj . Si denotamos por (g ij )i,j la matriz inversa de (gij )i,j entonces multiplicando ambos miembros de la igualdad (7.3) por g jk y sumando en j obtenemos: k a = n X aj g jk j=1 En conclusión, si φ = entonces Pn i i=1 bi φ ] φ = ∈ V ∗ y suponemos φ] = n X bi g ij vj . Pn j=1 b j vj (7.4) i,j=1 Observación: Si h·, ·i es euclı́dea y B es una base ortonormal entonces aj = aj para todo j ∈ {1, . . . , n}. (En el caso lorentziano la única diferencia es a1 = −a1 ). Este isomorfismo entre V (R) y V ∗ (R) induce isomorfismos entre tensores tipo (2, 0), (0, 2) y (1, 1) (y, en general, entre tensores tipo (r, s) y (r0 , s0 ) con r + s = r0 + s0 ). Por ejemplo, supongamos que T es un tensor (2, 0) y queremos construir a partir de él un tensor T̂ que sea (0, 2). Entonces basta con definir T̂ (φ, ψ) := T (φ] , ψ ] ). Obsérvese que la relación correspondiente en coordenadas queda: T = n X tij φi ⊗ φj , T̂ = i,j=1 donde tij = n X k,l=1 n X tkl vk ⊗ vl , k,l=1 kl gik gjl t , kl t = n X g ki g lj tij . i,j=1 Además, si el producto escalar es euclı́deo y la base B ortonormal entonces tij = tij , para todo i, j ∈ {1, . . . , n}. 144 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS Finalmente, recordemos que para tensores (1, 1) habı́amos definido su traza mediante la del endomorfismo asociado, [Capı́tulo 6, Subsección 6.1.1]. Puesto que usando un producto escalar euclı́deo g podemos asignar unı́vocamente a cada tensor 2-covariante o 2-contravariante un tensor (1, 1), ahora también es posible definir una traza para estos tensores. Ası́, por ejemplo, la traza de un tensor de tipo (2, 0) Pn T = i,j=1 tij ϕi ⊗ ϕj es: trazag T = n X i=1 tii , siendo tij = n X g ik tkj . k=1 Esto es fácilmente generalizable a tensores de tipo superior (“contracción” de tensores en un ı́ndice covariante y otro covariante -sin necesidad de g- y contracción de tensores en dos ı́ndices covariantes o dos contravariantes -con ayuda de g). 7.8. Apéndice 2: M. Lagrangiana frente a Hamiltoniana En este apéndice comentaremos la relación existente entre el formalismo lagrangiano, introducido en el apéndice del Capı́tulo 3, y el formalismo hamiltoniano, del que dimos algunos elementos en la nota final de la Sección 4.2. Esencialmente desarrollaremos las siguientes ideas: (1) cualquier lagrangiana L : T Q × R → R, a cada instante t fijo, define de manera natural una aplicación (no necesariamente lineal) Tp Q → Tp Q∗ para cada p y, por tanto, una aplicación T Q → T Q∗ ; cuando ésta es un difeomorfismo, la lagrangiana se dice hiper-regular, (2) las lagrangianas tı́picas L = T − V , donde T es la “energı́a cinética” asociada a una métrica semi-riemanniana g, y V un potencial, no sólo son hiper-regulares, sino que la aplicación que inducen entre T Q y T Q∗ coincide con el bemol para g, independientemente de t, (3) para cualquier lagrangiana hiper-regular, el difeomorfismo asociado T Q × R → T Q∗ × R se expresa en coordenadas (q, q̇, t) → (q, p(q, q̇, t), t), con pi = ∂L/∂ q̇ i ; además las coordenadas en T Q × R se inducen T Q∗ × R, y viceversa, y (4) cuando, fijada una función L(= Lp,t ) sobre un espacio vectorial se toman como nuevas coordenadas las derivadas parciales de L, resulta 7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA 145 conveniente introducir una nueva función, la transformada de Legendre de L, que admite una interpretación geométrica natural. Aplicación entre V y V ∗ asociada a una función sobre V Sea V (R) un espacio vectorial, B = (v1 , . . . , vn ) una base suya, ∗ B = (φ1 , . . . , φn ) su correspondiente base dual y (x1 , . . . , xn ) (resp. (p1 , . . . , pn )) las coordenadas sobre todo V (resp V ∗ ) inducidas por B (resp. B ∗ ). Sea f : V → R una aplicación diferenciable (no necesariamente lineal) y consideremos su diferencial como una aplicación entre V y V ∗ . Es decir, Df : V → V ∗ u 7→ Dfu donde Dfu : V → R coincide con la diferencial dfu : Tu V → Tf (u) R ≡ R salvo por la identificación natural de Tu V con V . Por tanto, Dfu = n X ∂f (u)φi , i ∂x i=1 o, directamente en las coordenadas introducidas, Df (x1 , . . . , xn ) = (p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn )), siendo ∂f 1 (x , . . . , xn ), i = 1, . . . , n. i ∂x Si calculamos la diferencial de Df en u0 ∈ V , se obtiene que su matriz en las coordenadas introducidas coincide con la matriz hessiana ∂ 2 f /∂xi ∂xj en u0 . Si ésta es regular, el Teorema de la Función Inversa permite escoger entornos apropiados de u0 y Dfu0 para los que la restricción de la aplicación Df es un difeomorfismo. Supongamos para simplificar que Df es un difeomorfismo global entre V y V ∗ . En este caso las coordenadas (p1 , . . . , pn ) (resp. (x1 , . . . , xn )) sobre V ∗ (resp. V ), compuestas con Df (resp. (Df )−1 ) generan unas nuevas coordenadas en V (resp V ∗ ), y las funciones pi (x1 , . . . , xn ) = (p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn )) (resp. (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))) sirven para denotar tanto la aplicación Df (resp. (Df )−1 ), como el cambio de coordenadas en V (resp. V ∗ ) entre (x1 , . . . , xn ) y (p1 , . . . , pn ) (resp. (p1 , . . . , pn ) y (x1 , . . . , xn )). 146 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS Ejercicios. (1) Sean a, b, c, d, e, f ∈ R y definamos f : R2 → R por f (x, y) = ax2 + 2bxy + cy 2 + dx + ey + f, ∀(x, y) ∈ R2 . Calcúlese Df : R2 → R2∗ y pruébese que es un difeomorfismo global si y sólo si ¯ ¯ ¯ a b ¯ ¯ ¯ ¯ b c ¯ 6= 0. (2) Sea g un producto escalar sobre el espacio vectorial V (R), y sea Eg : V → R la aplicación Eg (u) = g(u, u)/2, ∀u ∈ V . Pruébese que DEg coincide con la aplicación bemol asociada a g. Lagrangianas regulares. Momentos generalizados Consideremos en Mecánica Lagrangiana un espacio de configuración Q (≡ (q 1 , . . . , q n )), el correspondiente espacio de estados T Q (≡ (q 1 , . . . , q n , q̇ 1 , . . . , q̇ n )), y una lagrangiana L : TQ × R → R (q , . . . , q , q̇ 1 , . . . , q̇ n , t) 7→ L(q, q̇, t). 1 n Fijado (p0 , t0 ) ∈ Q × R podemos considerar la aplicación Tp0 Q → R vp0 7→ L(vp0 , t0 ), (7.5) esto es, (q̇ 1 , . . . , q̇ n ) 7→ L(q 1 (p0 ), . . . , q n (p0 ), q̇ 1 , . . . , q̇ n , t0 ). Como vimos en el apartado anterior, esta aplicación (de V = Tp Q a R) induce otra con codominio el dual: Leg(p0 ,t0 ) : Tp0 Q 7→ Tp0 Q∗ vp0 7→ v̂p0 , que viene definida por la diferncial, esto es: v̂p0 : Tp0 Q → R | (vp0 + swp0 , t0 ). wp0 7→ dL ds s=0 Diremos que la lagrangiana L es regular en (p0 , t0 ) si Leg(p0 ,t0 ) es un difeomorfismo local, esto es, si su diferencial es biyectiva en todo punto. 7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA 147 Nótese que fijado cualquier entorno coordenado (U, q 1 , . . . , q n ) de p0 la matriz de la diferencial de Leg(p0 ,t0 ) en cada vp0 ∈ Tp0 Q resulta ser µ 2 ¶ ∂ L (vp , t0 ) , ∂ q̇ i ∂ q̇ j 0 i,j por lo que L es regular en (p0 , t0 ) si y sólo si esta matriz (para unas coordenadas alrededor de p0 y, por tanto, para cualesquiera) es regular en todo vector vp0 tangente a p0 . Diremos que L es regular si es regular en todo (p0 , t0 ) ∈ Q × R. En adelante, supondremos por simplicidad la condición algo más fuerte de que L sea hiper-regular, esto es, que Leg(p0 ,t0 ) sea un difeomorfismo (no sólo local, sino global) ∀(p0 , t0 ) ∈ Q × R. Por tanto, en este caso se tiene el difeomorfismo: Leg : T Q × R → T Q∗ × R (vp , t) 7→ (v̂p = Leg(p,t) (vp ), t). (7.6) Ejercicio. Sea (Q, g) una variedad semi-riemanniana y consideremos la lagrangiana L : TQ × R → R (vp , t) 7→ 12 gp (vp , vp ) − V (p, t) (7.7) para cierta función V : Q × R → R (potencial). Demuéstrese que, independientemente del valor de t, la aplicación Leg correspondiente coincide con la aplicación bemol [ : T Q → T Q∗ , vp 7→ vp[ (en particular, L es hiper-regular). Obsérvese que, al componer con el difeomorfismo Leg, las coordenadas pi en T Q∗ sirven también como coordenadas de TQ; esto es, para cada t ∈ R podemos usar como coordenadas de T Q: (q 1 , . . . , q n , p1 := ∂L ∂L , . . . , p := ). n ∂ q̇ 1 ∂ q̇ n A estas nuevas coordenadas pi se les llama momentos generalizados. Nótese que cada vector vp y su imagen P v̂p por Leg tienen las mismas coordenadas pi . De hecho, si wp = ni=1 wpi ∂∂q̇i |p entonces v̂p (wp ) = n X ∂L (q(p), q̇(vp ), t)wpi i ∂ q̇ i=1 148 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS y, por tanto, v̂p = n X i=1 n n X ∂L X ∂ i (q(p), q̇(v ), t)dq = pi (vp , t)dqpi . v̂p ( i |p )dqpi = p p i ∂q ∂ q̇ i=1 i=1 Remarquemos que si tomamos coordenadas q ≡ (q 1 , . . . , q n ), una expresión del tipo L(q, p, t) puede denotar, indistintamente: (a) la función lagrangiana L : T Q × R → R escrita en las coordenadas sobre T Q que se obtienen componiendo Leg con las coordenadas (q, p, t) de T Q∗ × R o (b) la función L◦Leg−1 : T Q∗ × R → R escrita en coordenadas (q, p, t). Análogamente, componiendo con Leg−1 las coordenadas (q̇ 1 , . . . , q̇ n ) se pueden usar en T Q∗ , por lo que, para una función hamiltoniana H : T Q∗ × R → R, la expresión H(q, q̇, t) puede denotar tanto a la función H en las coordenadas inducidas por Leg−1 como la función H◦Leg en las coordenadas naturales de T Q × R. La transformada de Legendre Consideremos de nuevo el espacio vectorial V (R) y las bases B, B ∗ . Obsérvese que en V (R) se puede definir el campo de vectores radial ρ que a cada vector u ∈ V le hace corresponder propio vector u visto Pn el i como un elemento de Tu V ; esto es, ρ = i=1 x ∂/∂xi . Sea f : V → R tal que Df : V → V ∗ es un difeomorfismo. La transformada de Legendre de f se define como la aplicación L[f ] : V ∗ → R dada por: L[f ](φ) = (f − ρ(f )) ◦ (Df )−1 (φ), Si φ = Pn i=1 ∀φ ∈ V ∗ . pi φi entonces el vector (Df )−1 (φ) tiene coordenadas (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn )) y escribiendo directamente f, L[f ] sobre las coordenadas de u, φ: L[f ](p1 , . . . , pn ) = f (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn )) − n X xi (p1 , . . . , pn )pi (7.8) i=1 Geométricamente, la interpretación de L[f ] es la siguiente. Dada una forma lineal φ : V → R podemos considerar su grafo en V × R, que 7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA 149 será un hiperplano {(u, φ(u)) : u ∈ V } que pasa por el origen. Desplazando paralelamente este hiperplano podemos construir un hiperplano tangente a la gráfica de la función f : V → R en un (único) punto (uφ , f (uφ )). La ordenada en el origen de este hiperplano coincide con L[f ](φ). El principal interés geométrico de la transformada de Legendre aparece cuando, por alguna razón, resulta conveniente usar como coordenadas las derivadas parciales de una función4 f . Si conocemos la función f (p1 , . . . , pn ) pero no el difeomorfismo Df entonces, en principio, no podemos recuperar la función original f (x1 , . . . , xn ). Sin embargo, si conocemos L[f ] podemos recuperar la gráfica de f como la hipersuperficie envolvente a todos los hiperplanos Hφ = {(u, φ(u) + L[f ](φ)) : u ∈ V } obtenidos variando φ ∈ V ∗ . Se dice entonces que la transformada de Legendre de f “conserva la información” de f (al menos bajo la hipótesis de que Df sea un difeomorfismo). Ejercicio. (1) Se considera la función f : R → R, f (x) = x2 + 3x + 2. (a) Calcúlese Df y compruébese que es un difeomorfismo. (b) Calcúlese f ◦ (Df )−1 y L[f ]. (c) Sea h : R → R tal que Dh es un difeomorfismo. Compruébese: (i) L[h] = L[f ] ⇒ h = f , (ii) existe una función h 6= f tal que f ◦ (Df )−1 = h ◦ (Dh)−1 . (2) Repı́tanse los puntos anteriores para f : R2 → R, f (x, y) = 2xy − 3x + 4y − 1. La hamiltoniana como transformada de Legendre Consideremos ahora una lagrangiana hiper-regular L. Como hemos visto, tenemos asociado un difeomorfismo Leg entre el dominio T Q×R de L y el dominio T Q∗ × R de las funciones hamiltonianas. Llevando a cabo la transformada de Legendre de Leg(p0 ,t0 ) en cada (p0 , t0 ) ∈ Q × R y cambiando el signo, generamos una función H : T Q∗ × R → R 4 P. ej., esto ocurre frecuentemente en Termodinámica, donde las parciales de la energı́a interna U con respecto a la entropı́a S y el volumen V son, respectivamente, la temperatura T y la opuesta de la presión −P . P y T pueden resultar mucho más fáciles de medir que V y (por supuesto) que S. 150 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS que, expresada en coordenadas, se define por: H(q, p, t) = n X pi q̇ i (q, p, t) − L(q, p, t). (7.9) i=1 Se dice entonces que la función H es la función hamiltoniana asociada a la lagrangiana (hiper-regular) L. Es bien conocido que si γ(t) ≡ (q(t)) es una curva en Q para la cual se verifican las ecuaciones de Euler-Lagrange para L (γ es una curva crı́tica de L ante variaciones de las q’s con extremos fijos), entonces Leg ◦γ 0 (t) = γ̂ 0 (t) ≡ (q(t), p(t)) es una curva en T Q∗ que verifica las ecuaciones de Hamilton para H (Leg ◦γ 0 (t) es una curva crı́tica de H ante variaciones de las q y las p con extremos fijos). Por tanto, la Mecánica Lagrangiana puede verse (al menos para lagrangianas hiper-regulares, como las del tipo (7.7)) como un caso particular de la Hamiltoniana. Nota sobre el Teorema de Noether Sea Q una variedad y L una lagrangiana hiper-regular que, para simplificar, supondremos también independiente de t (eventualmente, t podrı́a considerarse como una coordenada más de Q). Sea Φ un grupo uniparamétrico de difeomorfismos de Q con generador infinitesimal X Φ ∈ X(Q), y consideremos la forma diferencial asociada a X Φ , X̂ Φ = Leg ◦ X Φ : Q → T Q∗ . Supongamos que L es invariante por Φ (véase la Sección 5.5); el Teorema de Noether afirma entonces que sobre cada curva crı́tica γ(t) de la lagrangiana (aquélla que satisface las ecuaciones de Euler-Lagrange) la función X̂ Φ (γ 0 (t)) (7.10) es constante (independiente de t). Esto es, (7.10) es una cantidad conservada a lo largo de la curva γ. Si L es una tı́pica lagrangiana 1 L(vp ) = gp (vp , vp ) − V (p), 2 (7.11) esta cantidad conservada se puede escribir directamente a partir de X φ en términos de la métrica: X̂ Φ (γ 0 ) = g(X Φ , γ 0 ) ≡ constante[γ]. (7.12) 7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA 151 Ejemplo. Considérese una lagrangiana del tipo (7.11) para (R3 , g0 ) que sea invariante por un grupo uniparamétrico de difeomorfismos Φ. No es difı́cil comprobar: (a) Si Φ es el grupo de traslaciones según el eje z de R3 (esto es, Φs (x, y, z) = (x, y, z + s), ∀x, y, z, s ∈ R) entonces X Φ = ∂/∂z, y la cantidad conservada (7.12) para cada curva crı́tica γ(t) = (x(t), y(t), z(t)) es ż(t) (o momento lineal según el eje z). (b) Si Φ es el grupo de rotaciones según el eje z (definido en el ejemplo de la Sección 5.5) entonces X Φ = −y∂/∂x + x∂/∂y, y la correspondiente cantidad conservada es el momento angular según dicho eje x(t)ẏ(t) − y(t)ẋ(t). Ejercicios Ejercicio 1. Sea V (R) un espacio vectorial real de dimensión 3, B = (v1 , v2 , v3 ) una base ordenada suya y B ∗ = (φ1 , φ2 , φ3 ) su base dual. Se consideran los tensores métricos g, g 0 sobre V definidos por sus matrices en B: 2 1 0 1 0 0 MB (g) = 1 1 0 , MB (g 0 ) = 0 −3 0 0 0 3 0 0 −1 Compruébese que g y g 0 son productos escalares y determı́nense sus ı́ndices. Calcúlese para cada uno v [ , φ] , siendo v = 2v1 + v2 + v3 y φ = φ1 − 3φ2 + φ3 . Ejercicio 2. Se considera en R3 la métrica riemanniana usual y una función f : R3 → R. Calcúlense las coordenadas de grad f en los campos coordenados inducidos por las coordenadas cartesianas, cilı́ndricas y esféricas. Ejercicio 3. Se considera sobre R2 el campo de tensores métrico g = 2ex dx2 + 2senydxdy + e−x dy 2 (≡ 2ex dx ⊗ dx + seny(dx ⊗ dy + dy ⊗ dx) + e−x dy ⊗ dy). (a) ¿Es g una métrica riemanniana? Calcúlese, si es posible, una base de campos que sea ortonormal en todo punto. 152 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS (b) ¿Cuáles de los siguientes campos son conservativos? (b1) Los campos coordenados ∂x , ∂y . (b2) El campo vectorial Z= ¡ −x ¢ 1 x (e − seny)∂ + (2e − seny)∂ . x y 2 − sen2 y Ejercicio 4. Para la variedad semi-riemanniana del problema anterior, calcúlense los campos vectoriales X = (dx)] , Y = (dy)] . Determı́nense las circulaciones de X e Y a lo largo de la curva γ(t) = (et sen(πt), t3 ), t ∈ [0, 1]. Ejercicio 5. En R2 \{0} con la métrica usual se consideran los campos X=p 1 x2 + y2 (x∂x + y∂y ) , Y = (−y∂x + x∂y ) . ¿Son conservativos? (Resuélvase trabajando tanto en coordenadas cartesianas como en polares.) Ejercicio 6. Se considera en R2 la métrica lorentziana g = dx2 − e2x dy 2 . Calcúlense todos los puntos de R2 que pueden conectarse con (0, 0) mediante una curva “luminosa” γ, esto es, que verifica γ 0 (t) 6= 0, g(γ 0 (t), γ 0 (t)) = 0 para todo valor de t. Ejercicio 7. Se considera en R3 la métrica g = −ex+y (dx ⊗ dy + dy ⊗ dx) + exy dz 2 . ¿Es g riemanniana o lorentziana? Calcúlese la circulación de ∂/∂y a lo largo de la curva γ(t) = (1, cos t, t), t ∈ [0, π]. Ejercicio 8. Se considera en R3 la métrica g = exy dx2 − dx ⊗ dy − dy ⊗ dx + 2e−xy dy 2 + 4dz 2 . ¿Es g riemanniana? Sea f = xy + yz + zx. Calcúlese grad f y su circulación a lo largo de la curva γ(t) = (t/2, tet , sen2 2t), t ∈ [0, π]. Ejercicio 9. Se considera sobre R × R+ el campo de tensores métrico g = 2y 2 dxdy. 7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA 153 (i) ¿Es g riemanniana? ¿Es lorentziana? (ii) Se consideran las nuevas coordenadas (u, v) sobre R×R+ definidas por el cambio de cartas: u = (x + y)/2, v = (x − y)/2. Obténgase la expresión de g en las coordenadas (u, v). (iii) Se considera el campo vectorial X = A(x, y)∂x , siendo A(x, y) una función sobre R × R+ . Determı́nense todas las posibles funciones A(x, y) para las que X sea conservativo. (iv) Determı́nese un campo vectorial Y y una curva γ sobre R × R+ de modo que la circulación de Y a lo largo de γ sea igual a 2π +1. Ejercicio 10. En R3 se consideran la métrica riemanniana usual g1 , la métrica lorentziana usual g2 , y la métrica g3 = −dx2 − dy 2 + dz 2 . Calcúlese el gradiente de las funciones f1 = x y z 2 y f2 = z ex y respecto de las tres métricas. 154 CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS Capı́tulo 8 Integración en Variedades En este tema generalizaremos la integración usual (de Riemann o Lebesgue) en Rn a una variedad diferenciable arbitraria. Este problema admite esencialmente dos enfoques, a priori muy distintos: a partir de integración de n−formas (en variedades orientadas) y a partir de la definición directa de una medida (variedades semi-riemannianas). La primera aproximación es la que nos será más útil para el próximo tema, con múltiples aplicaciones prácticas. La segunda, empero, también presenta ventajas: la delimitación clara del tipo de funciones objeto de integración, que permite definir espacios de funciones “completos” de dimensión infinita, con múltiples relaciones y aplicaciones a otras partes de la Matemática y Fı́sica. Tras una primera motivación de los conceptos (Sección 8.1, Subsección 8.2.1), desarrollaremos en primer lugar la integración de n−formas en variedades orientadas (Sección 8.2). La introducción de este concepto es progresiva, razonándose la cada vez mayor generalidad de n−formas a las que se puede aplicar el concepto de integración. El resultado final se obtiene en la Subsección 8.2.4, donde se introducen las particiones de la unidad. Este concepto requiere cierta dosis de abstracción y soltura en topologı́a, pero es importante en sı́ pues permite extender globalmente multitud de elementos definibles localmente sobre una variedad (de hecho, esto se requerirá para la prueba del Teorema de Stokes, en el próximo tema). No obstante, en la integración práctica 155 156 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES de una n−forma concreta se suele evitar su uso, como justificamos en la Subsección 8.2.3. Los elementos técnicos se desarrollan en los apéndices. Concretamente, en los Apéndices 8.5 y 8.6 se desarrollan sucintamente los elementos necesarios de álgebra de tensores antisimétricos para la integración de n−formas. En el Apéndice 8.7 se estudia el concepto de orientación en variedades, e introducimos el concepto topológico de espacio recubridor, que aplicamos para mostrar la existencia de un recubridor orientable. En la Sección 8.3, definiremos la integral de una función respecto a un elemento de volumen. Puesto que toda métrica semi-riemanniana sobre una variedad orientada tiene canónicamente asociada un elemento de volumen, ello permite hablar de integración de funciones en variedades semi-riemannianas orientadas. Más aún, esta integración resulta ser independiente de la orientación; de hecho, se puede extender a variedades semi-riemannianas cualesquiera (incluyendo las no-orientables). Ello sirve como motivación a la Sección 8.4, aunque esta sección puede leerse con independencia del resto. En ella se define un espacio de medida sobre cualquier variedad semi-riemanniana, y la integración de funciones sobre variedades se recupera como un caso particular de la integración de funciones sobre un espacio de medida, en analogı́a directa con la integración de Lebesgue en Rn . 8.1. Motivación Cuando se integra una función real f : U ⊆ Rn → R, se supone, explı́cita o implı́citamente, que se sabe cómo “medir” subconjuntos apropiados del dominio, derivándose este concepto de la estructura peculiar de R. Ası́, para la integral de Riemann, las sumas (superiores, inferiores) de su construcción parten del concepto de longitud de los subintervalos y, a partir de él, de volumen de los n−rectángulos en que se subdivide el dominio U . En la integral de Lebesgue se parte explı́citamente del concepto de medida (construida de nuevo a partir del concepto de longitud y volumen de intervalos y n−rectángulos) para subconjuntos muy generales de Rn . Este hecho debe tenerse presente para cualquier intento de definición de integración sobre una variedad. De hecho, no podremos definir 8.1. MOTIVACIÓN 157 la integración de una función hasta que no tengamos algún modo de “medir el volumen” de subconjuntos apropiados de la variedad. Ası́, nuestros objetivos serán: (1) abstraer primero qué significa “medir el volumen” sobre la variedad, lo que conduce a la integración de n−formas diferenciales, y a la integración de una función respecto a un elemento de volumen, y (2) mostrar cómo una métrica semiriemanniana produce un modo canónico de medir volúmenes, lo que conduce a la integración de funciones sobre variedades semirriemannianas. Para entender mejor las futuras definiciones, conviene tener presente los siguientes aspectos de Geometrı́a elemental: Determinante y volumen de n−paralelepı́pedos en Rn . Si se tienen n vectores independientes {v1 , . . . , vn } en Rn se sabe por geometrı́a elemental que det0 (v1 , . . . , vn ) (el determinante de la matriz de coordenadas de (v1 , . . . , vn ) en la base usual) es, salvo signo, igual al volumen del n-paralelepı́pedo que generan. Más aún, existen populares reglas prácticas para n = 2, 3 que permiten determinar el signo de det0 (v1 , . . . , vn ) (regla del sentido inverso del giro de las agujas del reloj, regla del sacacorchos). Obsérvese que det0 puede verse como un tensor antisimétrico n−covariante no nulo sobre Rn o “elemento de volumen”. De hecho, para n = 2, det0 = φ10 ∧ φ20 , donde (φ10 , φ20 ) es la base dual de la usual de R2 . Por otra parte, podemos afirmar que, salvo signo (determinable por las reglas prácticas aludidas), el producto escalar usual de Rn determina al elemento de volumen det0 . Ası́, puede comprobarse con facilidad para n = 2 que det0 = ±φ1 ∧ φ2 , donde (φ1 , φ2 ) es la base dual de cualquier base ortonormal de R2 . Y, para n arbitrario, el valor de det0 (v1 , . . . , vn ) coincide, salvo signo, con el del determinante de la matriz de coordenadas de (v1 , . . . , vn ) en cualquier base ortonormal. En resumen, se sugieren ası́ las relaciones Volumen de n−paralelepı́pedos ←→ elementos de volumen. Producto escalar + fijación de signo =⇒ elemento de volumen . Integración en superficies de Rn . Consideremos una superficie S de R3 , obtenida como un grafo, S = {(x, y, z(x, y)) : (x, y) ∈ D}. 158 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Fijemos (x0 , y0 ) ∈ D, z0 = z(x0 , y0 ), y sea R el rectángulo de vértices (x0 ± ∆x/2, y0 ± ∆y/2). En primer orden, el área ∆A de la porción de superficie S que se proyecta sobre R se puede aproximar por el área dA del paralelogramo en el plano tangente T(x0 ,y0 ,z0 ) S ⊂ R3 que se proyecta sobre R. Clásicamente, esta área se calcula por: s µ ¶2 µ ¶2 dxdy ∂z ∂z dA = = 1+ + (x0 , y0 ) dxdy, (8.1) ∂x ∂y |~n · ~k| donde ~k = ∂/∂z|(x0 ,y0 ,z0 ) , ~n es un vector unitario perpendicular a T(x0 ,y0 ,z0 ) S, (el normalizado de ±(∂z/∂x(x0 , y0 ), ∂z/∂y(x0 , y0 ), −1)), el producto escalar usual se denota por · , y dx = ∆x, dy = ∆y. El área de la superficie S se computa entonces integrando el segundo miembro de (8.1) en el dominio D de (x, y). Más aún, una vez que se tiene el concepto de área (esto es, medida o volumen bidimensional), se puede rehacer la construcción de Riemann –o de Lebesgue– para definir la integral de una función f : S → R. Asi, se define la “integral de superficie” de f sobre S como: Z s Z f dA = S f (x, y, z(x, y)) D µ 1+ ∂z ∂x ¶2 µ + ∂z ∂y ¶2 (x, y) dxdy. (8.2) No obstante, estas definiciones de área e integración parecen muy particulares para grafos. Para indagar su posible generalidad, pensemos ahora en el grafo S sólo como una variedad dotada de la métrica g (obtenida por restricción de la usual de R3 ), para la cual la proyección sobre el plano z = 0 desempeña el papel de carta coordenada (global) ϕ(x, y, z) = (q 1 (x, y, z) = x, q 2 (x, y, z) = y). La función “peso” |~n · ~k|−1 que aparece en (8.1), (8.2) se puede expresar en función de la métrica g y la carta coordenada ϕ como sigue. Sea B la base de campos coordenados inducida por ϕ, ¶ µ ¶ µ ∂ ∂ ∂z ∂ ∂ ∂z ∂ ∂ , = + , + . B= ∂q 1 ∂q 2 ∂x ∂x ∂z ∂y ∂y ∂z Resulta inmediato computar la matriz gij de g en la base B, 8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES 159 obteniéndose µ det MB (g) = 1 + ∂z ∂x ¶2 µ + ∂z ∂y ¶2 , que es igual a |~n · ~k|−2 . Ası́, (8.2) se reescribe: Z Z p f (q 1 , q 2 ) |det MB (g)|(q 1 , q 2 ) dq 1 dq 2 , f dA = S (8.3) D expresión ésta que valdrı́a también para cualesquiera otras coordenadas sobre S. 8.2. Integración de n−formas diferenciales 8.2.1. El problema de la integración sobre una variedad Supongamos que nos planteamos el problema de definir la integral de una función real f sobre una variedad diferenciable Q de dimensión n. Para simplificar dicho problema, supondremos inicialmente f ∈ C ∞ (Q) y que el soporte de f es compacto y está incluido en un entorno coordenado (U, ϕ) de Q, sopf ⊂ U . En este caso, la función diferenciable f ◦ ϕ−1 : ϕ(U ) ⊆ Rn → R también tiene soporte compacto incluido en Rn , pues sop(f ◦ ϕ−1 ) = ϕ(sop f ). Ingenuamente, se podrı́a pensar en definir la integral de f sobre Q como Z f ◦ ϕ−1 , (8.4) n ϕ(U )⊆R donde la integral es la usual en (abiertos de) Rn . Sin embargo, esta definición presentarı́a un problema fundamental: no es independiente del entorno coordenado escogido. Para comprobarlo, supongamos que (V, ψ) es otro entorno coordenado que verifica sopf ⊂ V , y tomemos analogamente la integral Z f ◦ ψ −1 . (8.5) ψ(Q) 160 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Puesto que sop f ⊂ U ∩ V , Z Z −1 f ◦ϕ = f ◦ ϕ−1 , ϕ◦ψ −1 (ψ(U ∩V )) ϕ(U ) y, aplicando el teorema clásico de cambio de variables para la integral usual en Rn , obtenemos: R R −1 f ◦ ϕ = ((f ◦ ϕ−1 ) ◦ (ϕ ◦ ψ −1 ))|det J(ϕ ◦ ψ −1 )| −1 ϕ◦ψ (ψ(U ∩V )) ψ(U R ∩V ) = ψ(V ) (f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )| donde J(ϕ ◦ ψ −1 ) denota la matriz jacobiana de ϕ ◦ ψ −1 . Resumiendo: Z Z −1 f ◦ϕ = (f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )|, (8.6) ϕ(U ) ψ(V ) y, puesto que el factor |det J(ϕ ◦ ψ −1 )| no es necesariamente igual a 1, las expresiones (8.4) y (8.5) no coinciden, en general. Ası́, el valor (8.4) ingenuamente propuesto para la integral de f sobre Q depende del entorno coordenado escogido, resultando este problema esencial: si se usa sólo la estructura diferenciable de la variedad Q, no existe un procedimiento canónico de privilegiar un entorno coordenado frente a otro ni, tampoco, de definir la integración de funciones. Ejercicio. Considérese en Rn el entorno coordenado (Rn , ϕ), donde ϕ : Rn → Rn viene definida por x1 x1 .. . . 7→ A · .. , xn xn siendo A ∈ Gl+ (n, R) = {A ∈ Mn×n (R) : det(A) > 0}. Compruébese Z Z f =a· f ◦ ϕ−1 n n R R donde a = det(A−1 ). En consecuencia, obténgase una definición de integración de funciones para variedades riemannianas isométricas a Rn . Una posible manera de resolver el problema anteriormente apuntado es la siguiente. Dado que los cambios de carta afectan a la integral definida 8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES 161 en (8.4) mediante el factor peso |det J(ϕ ◦ ψ −1 )|, podrı́amos tratar de hallar un objeto matemático w que, al escribirse en coordenadas, se transforme afectado exactamente por ese mismo factor peso; esto es, tal que wψ = wϕ ◦ (ϕ ◦ ψ −1 ) · |det J(ϕ ◦ ψ −1 )|. (8.7) De esta manera, multiplicando el integrando de (8.4) por dicho objeto matemático, la integral permanecerı́a invariante frente a cambios de carta. En una variedad p semi-riemannaniana (Q, g), este objeto existe: puede tomarse como |det MB (g)|, lo que conduce directamente a una definición de integración de funciones que generaliza a las integrales de superficie tipo (8.3) (véase la Sección 8.4). Pero ganaremos en perspectiva si antes centramos nuestro estudio en otro objeto matemático, que nos permitirá identificar geométricamente el significado del factor peso: las n-formas diferenciales. 8.2.2. Integración de n-formas en entornos coordenados Las r−formas diferenciales, o campos tensoriales r covariantes antisimétricos, ya fueron introducidas en el Tema 6, en el cual nos centrábamos en los casos r = 1, 2. Las propiedades de (el C ∞ (Q)-módulo de) las r−formas diferenciales Λr (Q) resultan inmediatas a partir de las propiedades de los tensores antisimétricos sobre un espacio vectorial y de los campos tensoriales sobre una variedad (véanse los Apéndices 8.5, 8.7.1). En adelante necesitaremos n−formas diferenciales, esto es, el caso de covariancia máxima no trivial r = n. Definición 8.2.1 Consideremos un abierto U ⊆ Rn y una n-forma diferencial ω ∈ Λn (U ), con soporte incluido en U , y expresión en coordenadas usuales: ω = w dx1 ∧ · · · ∧ dxn , w ∈ C ∞ (U ) La integral de ω se define como: Z Z ω := w, U U donde en el segundo miembro se está considerando la integral usual en Rn . 162 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES El siguiente resultado describe cómo se comportan las n-formas frente a transformaciones diferenciables, y será la clave que nos permitirá extender la Definición 8.2.1 a una variedad orientada arbitraria. En efecto, resulta inmediato (Apéndice 8.6, Proposición 8.6.4 (1)): Lema 8.2.2 Sean U, V dos abiertos de Rn y F : U → V una aplicación diferenciable. Si ω = w dx1 ∧ · · · ∧ dxn ∈ Λn (V ) entonces la n−forma inducida F ∗ w (Definición 8.5.6) tiene la expresión F ∗ ω = det J(F ) · (w ◦ F ) dx1 ∧ · · · ∧ dxn . Acabamos de comprobar por tanto que, salvo por el signo de det J(F ), las n-formas se transforman afectadas del mismo factor peso con que lo hacı́a la integral que proponı́amos en (8.4) (véase (8.7)). En consecuencia, se deduce ahora de la Proposición 8.6.4 (2) el siguiente resultado: Lema 8.2.3 Sean U , V dos abiertos de Rn y F : U → V un difeomorfismo que conserva (resp. invierte) la orientación (usual de Rn ) en todos sus puntos (Definición 8.6.2). Entonces, ½ R Z F ∗ω si F conserva la orientación en todo punto, UR ω= ∗ − UF ω si F invierte la orientación en todo punto. V Estamos ya en condiciones de introducir la definición de integral de una n-forma diferencial en una variedad orientada arbitraria, al menos en el caso de que el soporte de la n−forma sea compacto e incluido en un entorno coordenado. Observemos previamente que, para una variedad orientada, no supone ninguna pérdida de generalidad restringirnos a entornos coordenados (U, ϕ) que preserven la orientación (Proposición 8.7.5). Definición 8.2.4 Sea +Q una n−variedad orientada, y ω ∈ Λn (Q) una n-forma diferencial con soporte compacto incluido en un entorno coordenado. Se define la integral de ω en Q como: Z Z ω := (ϕ−1 )∗ ω, (8.8) +Q ϕ(U ) donde (U, ϕ ≡ (q 1 , . . . , q n )) es cualquier entorno coordenado que contiene al soporte de ω y preserva la orientación. Por construcción, resulta inmediato ahora comprobar que esta definición es independiente del entorno coordenado que se escoja (siempre que incluya al soporte de ω y preserve la orientación). 8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES 8.2.3. 163 Integración general de n−formas De las varias restricciones sobre ω en la Definición 8.2.4, algunas se imponen sólo por comodidad en la discusión, y otras tienen un carácter más profundo. Discutimos a continuación tales restricciones, lo que permite extender la integración a n−formas mucho más generales: 1. Orientabilidad y elección de una orientación en la variedad Q. Aunque, como veremos en la próxima sección, esta restricción no será necesaria para la integración de funciones, sı́ resulta esencial para la integración de n−formas. En cualquier caso, no son suposiciones muy restrictivas (véase el Apéndice 8.7): (i) si Q no fuera orientable admitirı́a un “recubridor de dos hojas” que sı́ lo es, (ii) si Q es orientable y conexa admite exactamente dos posibles orientaciones. 2. Diferenciabilidad C ∞ de ω, con soporte compacto. Estas hipótesis se han impuesto sólo por simplicidad de lenguaje, y se pueden relajar claramente. De hecho, en nada varı́an los argumentos anteriores que hacen consistente la Definición 8.2.4 si se supone que las n−formas (como campos tensoriales) son sólo continuas. Si el soporte no fuera compacto, las únicas precauciones serı́an: (a) la n− forma sobre Rn , (ϕ−1 )∗ ω = wdx1 ∧ . . . ∧ dxn podrı́a no ser integrable, en el sentido de que no lo sea la función w, y (b) convendrı́a incluso admitir como posibles valores de la integral ±∞. Se aplicarı́a entonces la solución estándar en teorı́a de la integración (compárese con la Subsección 8.4.3): (i) si w ≥ 0 se admite la posibilidad natural de que la integral de w (y de ω) sea infinita, y (ii) en general, se escribe w = w+ − w− donde w+ , w− ≥ 0, y se dice que w es integrable si al menos una de las dos integrales es finita, en cuyo caso se define Z Z Z Z + ω := w := w − w− ∈ [−∞, ∞]. Q ϕ(U ) ϕ(U ) ϕ(U ) Obsérvese que la descomposición w = w+ − w− también induce una descomposición de ω ligada a la orientación1 ω = ω + − ω − . 1 Más intrı́nsecamente, las funciones ω ± se caracterizan por anularse en cada 164 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Por último, podrı́amos extender la definición de integración incluso al caso en el que ω no sea continua, sino que generara en coordenadas una función w que fuera sólo integrable Riemann o Lebesgue (véase la Sección 8.4). 3. El soporte de ω cae en un entorno coordenado. A priori, esta restricción resulta totalmente indeseable y, como veremos en la próxima subsección, tal problema se puede resolver con la ayuda de un nuevo elemento de interés propio: la existencia de particiones de la unidad. No obstante, conviene tener en cuenta los siguientes hechos que anticipamos de la Sección 8.4 y que permiten, en la práctica, evitar completamente el uso de particiones de la unidad: Asociada a su estructura diferenciable, en toda variedad se pueden definir directamente los conjuntos de medida nula (Subsección 8.4.4). A efectos de cálculo de una integral, un subconjunto de medida nula carece de importancia, y puede obviarse. Toda variedad Q contiene un subconjunto cerrado de medida nula N tal que Q\N admite una carta coordenada global ϕ : Q\N → ϕ(Q\N ) ⊆ Rn , Teorema 8.4.4 (de hecho, si Q es conexa Q\N puede tomarse difeomorfo a Rn o la bola unidad). Aun cuando la manera general de construir el conjunto de medida nula N y la carta ϕN puede no ser manejable en la práctica, sı́ ocurre muy a menudo que se visualiza con facilidad un subconjunto cerrado de medida nula N , tal que Q\N es la unión de varios abiertos conexos, cada uno de los cuales admite una carta global (piénsese p. ej., en una esfera, eventualmente con una o varias asas). El problema queda entonces reducido al caso de que el soporte de ω caiga en varios entornos coordenados disjuntos. punto al menos una de ellas, y por estar positivamente orientadas donde no se anulan. Obsérvese además que si w es continua (esto es, ω continua) entonces las funciones w± (y las n−formas ω ± ) son continuas, pero éstas no necesariamente son diferenciables si w lo es. Esto ilustra las limitaciones de integrar sólo n-formas que sean diferenciables. 8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES 8.2.4. 165 Particiones de la unidad e integración Definición 8.2.5 Sea U ≡ {Uα }α∈I un recubrimiento abierto de una variedad diferenciable Q. Se dice que una colección de funciones diferenciables να : Q → [0, 1], α ∈ I es una partición de la unidad sobre Q, subordinada a U si: (1) sop να ⊂ Uα para todo α, (2) la colección {sop να }α∈I es localmente finita, esto es, todo punto de Q tiene un entorno coordenado que interseca sólo a un número finito de elementos de {sop να }α∈I , P (3) α να (p) = 1 para todo p ∈ Q. Observaciones: (1) En principio, la suma que aparece en la condición (3) anterior involucrarı́a posiblemente un número infinito de sumandos. Sin embargo, la condición (2) implica que cada p ∈ Q admite un entorno en el cual la función να es idénticamente nula para todos salvo para un número finito de valores del ı́ndice α. En consecuencia, la sumatoria en (3) debe entenderse siempre en cada punto como la suma (finita) de los términos no nulos. (2) En una variedad diferenciable (paracompacta) todo recubrimiento abierto admite una partición de la unidad.Más aún, las condiciones sobre las να implican que, aunque el conjunto de ı́ndices I podrı́a ser no numerable, sólo un subconjunto numerable de las να puede no ser idénticamente nulo2 . Ejercicio. Usando la existencia de particiones de la unidad, pruébese que toda variedad diferenciable admite una métrica riemanniana. ¿Admite también una lorentziana? Sea (+Q, g) una variedad riemanniana orientada y consideremos un recubrimiento por entornos coordenados positivamente orientados {(Uα , ϕα )}α∈I de Q. Sea {να }α∈I una partición de la unidad subordinada, y consideremos una n-forma ω. 2 De hecho, toda variedad diferenciable es Lindelöff, esto es, todo recubrimiento abierto de Q admite un subrecubrimiento numerable. 166 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Si ω tiene el soporte compacto, existe un subconjunto finito de enm tornos {(Ui , ϕi )}i=1 tal que sop ω ⊂ ∪m i=1 Ui . Consideremos la n-forma wi := w · νi , cuyo soporte es compacto y está incluido en el correspondiente R entorno coordenado (Ui , ϕi ), por lo que se tiene definida su integral +Q wi . Definimos entonces: Z m Z X w := wi . +Q i=1 +Q No es difı́cil comprobar que esta definición resulta independiente de los entornos coordenados y la partición escogida. Para incluir el caso general en que el soporte de ω no sea compacto, podemos usar que Q siempre se puede recubrir por un conjunto numerable de entornos coordenados positivamente orientados {(Ui , ϕi )}i∈N , y considerar una partición de la unidad subordinada {νi }i∈N . Escribimos entonces, para evitar inconsistencias si las integrales se hicieran infinitas, ω = ω + −ω − , con ω ± positivamente orientadas y no simultáneamente distintas de 0, y definimos ωi+ = νi ω + , ωi− = νi ω − para todo i ∈ N. Podemos dar ya la siguiente definición, donde permitiremos además que el valor de la integral sea infinito. Definición 8.2.6 Sea +Q una variedad orientada y ω una n-forma sobre Q. Diremos que ω es integrable si lo son cada una de las nformas ωi+ , ωi− para todo i ∈ N y, además, al menos una de las series ∞ Z X i=1 +Q ωi+ , ∞ Z X i=1 +Q ωi− es finita. En este caso, se define la integral de ω en (+Q, g) como Z ∞ Z ∞ Z X X + w := ωi − ωi− ∈ [−∞, ∞]. +Q i=1 +Q i=1 +Q De nuevo, la integral ası́ definida resulta independiente del recubrimiento abierto y la partición escogida. Además, como apuntamos en la subsección anterior, no sólo es aplicable al caso en que ω es diferenciable, sino también a cuando es sólo continua o, aún más, cuando cada una de las funciones wi± generada sobre ϕi (U ) ⊆ Rn por las ωi± es integrable en el sentido de Riemann o, con más generalidad, en el de Lebesgue. 8.3. INTEGRACIÓN DE FUNCIONES 167 8.3. Integración de funciones 8.3.1. Elementos de volumen e integración de funciones Recordemos del Apéndice 8.7 que un elemento de volumen sobre una variedad Q no es más que una n−forma diferencial sin ceros. Si fijamos un elemento de volumen Ω0 automáticamente consideraremos a Q orientada por [Ω0 ], y podemos definir la integración de funciones sobre Q como sigue: Definición 8.3.1 Sea Q una variedad diferenciable dotada de un elemento de volumen Ω0 . Una función f sobre Q se dirá integrable si la n−forma f Ω0 es integrable y, en este caso, definimos la integral de f en Q respecto a Ω0 como: Z Z f= f Ω0 . (Q,Ω0 ) (Q,+) donde la orientación de (Q, +) es [Ω0 ]. Resulta inmediato comprobar que, si en lugar de fijar el elemento de volumen Ω0 , fijamos −Ω0 entonces las dos integrales de f coinciden: Z Z Z Z f= f (−Ω0 ) = f Ω0 = f. (8.9) (Q,−Ω0 ) (Q,−) (Q,+) (Q,Ω0 ) Ejercicio. Compruébese que esta igualdad se mantiene si Q no es conexa y se cambia el signo de Ω0 sólo en alguna parte conexa de Q. 8.3.2. Integración en variedades semi-riemannianas El concepto de integral de funciones respecto a un elemento de volumen resulta especialmente natural desde un punto de vista semiriemanniano. En efecto, si suponemos ahora que el ambiente es una variedad semi-riemanniana orientada (+Q, g), entonces disponemos de un elemento de volumen canónico, sin más que aplicar a cada espacio tangente Tp Q la Definición 8.6.5: 168 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Definición 8.3.2 Se define el elemento de volumen métrico orientado µ+ g de una variedad semi-riemanniana orientada (+Q, g) como la nforma diferencial que en cada espacio tangente Tp Q es igual al elemento de volumen métrico orientado para (+Tp Q, gp ). El elemento de volumen métrico orientado se calcula en coordenadas a partir de las expresiones en el Apéndice 8.6. En efecto, para cualquier entorno coordenado positivamente orientado (U, ϕ ≡ (q 1 , . . . , q n )) se tiene p µ+ |det MB (g)| dq 1 ∧ · · · ∧ dq n , g = donde B = (∂q1 , . . . , ∂qn ) (véase la Proposición 8.6.6). En particular, esto prueba que µ+ g es diferenciable. La Definición 8.3.1 permite ahora definir la integración de funciones respecto a µ+ g . Por supuesto, si en Q tomamos la orientación opuesta, + entonces se tiene µ− g = −µg . De la igualdad (8.9) (para cada parte conexa de Q) se tiene que la integración es independiente de la orientación escogida, lo que conduce a la definición: Definición 8.3.3 Sea (Q, g) una variedad semi-riemanniana orientable. Una función f sobre Q se dice integrable si, escogida una (y entonces, para toda) orientación sobre Q, f es integrable respecto al elemento de volumen métrico orientado µ+ g . En este caso, se define su integral por la expresión, independiente de la orientación escogida: Z Z f := f. (Q,g) (Q,µ+ g ) El siguiente ejercicio muestra que toda integral de funciones respecto a un elemento de volumen en el sentido de la Definición 8.3.1 puede verse como una integral en una variedad riemanniana en el sentido de la Definición 8.3.3. Ejercicio. Sea Q una variedad orientable y Ω un elemento de volumen sobre ella. Pruébese que existe una métrica riemanniana g tal que (para la orientación determinada por Ω) µ+ g = Ω. (Sugerencia: úsese que siempre existe alguna métrica riemanniana h, y calcúlese f > 0 de modo que se pueda tomar g = f h.) Observación. La Definición 8.3.3 se extiende sin dificultad a variedades semi-riemannianas no orientables. Para comprobarlo, úsese: (1) 8.4. TEORÍA DE LA MEDIDA 169 el abierto de definición de cada entorno coordenado es orientable, lo que permite definir la integración para funciones con soporte en un entorno coordenado, (2) las particiones de la unidad (o, alternativamente, el Teorema 8.4.4) extienden esta definición al caso de que el soporte no verifique tal condición. 8.4. Integración a partir de la teorı́a de la medida Dado un subconjunto A de un conjunto X, la función caracterı́stica de A se denotará por χA : X → R, donde χA (x) es igual a 1 para todo x ∈ A, y a 0 en caso contrario. 8.4.1. Nota previa sobre la integral de Riemann Recordemos brevemente la integración de Riemann en Rn . Decimos que un subconjunto C ⊂ Rn es un n−rectángulo o, simplemente, un rectángulo si existen 2n constantes ai < bi , i ∈ {1, . . . , n} tales que C = {(x1 , . . . , xn ) ∈ Rn : ai < xi < bi ∀i ∈ {1, . . . , n}}. Para estos conjuntos se define su volumen como vol(C) = Πni=1 (bi − ai ). Cualquier subconjunto acotado de Rn está incluido en un rectángulo de lados suficientemente grandes, y una partición de cada uno de los lados genera de manera natural una partición del rectángulo por rectángulos menores. Consideremos una función f : Rn ⊆ Rn → R, (si sólo está definida en un subconjunto, la supondremos extendida por 0 a todo Rn ). Si suponemos que f está acotada, con f ≥ 0 y su soporte cae dentro de un rectángulo C, se hace la siguiente construcción. Sea {C m }m∈N una sucesión de particiones de C (esto es, cada término C m = {Ckm , k ∈ {1, . . . , km }} es un conjunto de km rectángulos obtenido del producto de particiones de cada uno de sus n−lados), tal que el menor diámetro |C m | de las particiones de cada uno de los n lados, tiende a cero cuando m tiende a infinito. Se dice que f es 170 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES integrable en el sentido de Riemann si: (a) existe el lı́mite Z ∞ X m f := lı́m f (xm ∈ [0, ∞], k ) · vol(Ck ) n m→∞ R k=1 (8.10) m donde xm k es cualquier punto del rectángulo Ck , y (b) este lı́mite resulta independiente de la partición y los puntos xm k escogidos. A esta definición se le hacen las extensiones progresivas estándar (compárese con la Subsección 8.4.3): (i) En el caso de que el soporte no esté acotado, se hace primero la elección C = [−L, L]n y se toma entonces el lı́mite L → ∞; (ii) si f no está acotada, se reemplaza por fM , definida en cada punto p como el mı́nimo de {f (p), M }, y se toma el lı́mite M → ∞; (iii) si no se verificara f ≥ 0, se escribe f = f + − f − , f + , f − ≥ 0, se repite la construcción para f ± y, caso de que y R ambas R integrales R existan 3 + − no sean ∞ simultáneamente , se define: Rn f = Rn f − Rn f . Un subconjunto A ⊆ Rn se dice medible Jordan si su función caracterı́stica χA es integrable (lo cual ocurre si y sólo si el conjunto de sus puntos frontera es de medida nula, en el sentido de la Subsección R 8.4.2); en este caso, se dice que la integral de Riemann de f en A, f , existe si A R R existe la de f χA , y en este caso se define A f = Rn f χA . Cuando f es continua con soporte compacto, se demuestra que el lı́mite anterior existe, y es independiente de la sucesión de particiones escogida. Concretamente, se prueba que el lı́mite de la suma superior de Riemann (esto es, la sumatoria obtenida en (8.10) tomando xm k igual al máximo de f en el rectángulo -cerrado- Ckm ) y el de la suma inferior de Riemann (ı́dem tomando xm k como el mı́nimo) coinciden. Ahora bien, la integral también está bien definida en algunas funciones no continuas (piénsese por ejemplo en la función escalón). La clase de las funciones para las que podemos definir la integral en el sentido de Riemann, y ésta es finita, recibe el nombre de clase de las funciones “integrables Riemann”. Todo ello resulta extensible de manera más o menos directa a la integración en variedades (semi-)riemannianas (véase [Sp2]). Aunque a la hora práctica de realizar integrales el concepto de integración de Riemann suele resultar suficiente, éste presenta limitaciones teóricas importantes como: (1) es fácil encontrar funciones que coinciden en todos sus puntos excepto en un conjunto numerable, una de 3 Se excluye ası́ el caso de la integral impropia de Riemann en R 8.4. TEORÍA DE LA MEDIDA 171 ellas integrable Riemann y la otra no (v. gr.: función caracterı́stica de los racionales y la idénticamente nula), (2) el espacio de las funciones integrables Riemann R (módulo las funciones de integral nula) dotado de la norma k f k= Rn |f | no es completo. Estas carencias se salvan con la integración de Lebesgue. 8.4.2. Espacios de medida. Medida de Lebesgue Un espacio medible es un par (X, F), donde X es un conjunto arbitrario y F es una σ-álgebra; esto es, una colección no vacı́a de subconjuntos de X que verifica las siguientes propiedades: (a.1) ∅ ∈ F , (a.2) si A pertenece a F entonces su complementario Ac también, (a.3) si {An }n es una sucesión de elementos de F entonces su unión también pertenece a F. Un espacio de medida es un espacio medible (X, F) dotado de una medida; esto es, de una función real m sobre F tal que: (m.1) m(∅) = 0, (m.2) m(∪∞ n=1 An ) = P∞ n=1 m(An ), siendo los An disjuntos dos a dos. Previamente a la definición de un espacio de medida canónico en Rn , definimos la medida exterior de Lebesgue de un subconjunto arbitrario A ⊂ Rn como el ı́nfimo de las sumas de los volúmenes de los rectángulos, tomado variando en el conjunto de los recubrimientos (numerables) por rectángulos de A; esto es: Ã∞ ! X µ(A) = Inf {{Ci } :A⊆∪∞ vol(Ci ) . i=1 Ci } i∈N i=1 En particular, se dice que un subconjunto A ⊂ Rn es de medida nula si µ(A) = 0; o, equivalentemente, si para todo ² > 0 existe un con∞ junto P∞ numerable de rectángulos {Ci }i=1 que recubren A y tales que i=1 vol(Ci ) < ². Esencialmente, para la integración lo que ocurra en un conjunto de medida nula resultará irrelevante, de ahı́ que se hable de 172 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES que una propiedad se verifica “casi por doquier” (c.p.d.) cuando se verifica para todos los puntos, salvo a lo más para los de un subconjunto de medida nula. La relación entre los conjuntos de medida nula y las aplicaciones diferenciables se resume en el siguiente resultado: Teorema 8.4.1 Sea F : Rn → Rn , una aplicación diferenciable: (1) Si A ⊂ Rn es de medida nula en Rn entonces F (A) es de medida nula en Rn . (2) (Sard.) Si ΣF ⊂ Rn es el conjunto de los puntos crı́ticos de F , entonces F (ΣF ) es de medida nula en Rn . Además, si F : Rn → Rm , y n < m entonces F (Rn ) es de medida nula en Rm . El conjunto P(Rn ) de las partes de Rn es obviamente una σ-álgebra de Rn , y la medida exterior de Lebesgue es aplicable a cualquier elemento de ella. Sin embargo, la medida exterior no verifica la propiedad (m.2) de una medida. De ahı́ que se elijan σ-álgebras para las cuales la restricción de la medida exterior de Lebesgue sı́ proporcione una medida. Existen dos elecciones fundamentales: (1) la σ-álgebra boreliana, esto es, la σ-álgebra mı́nima que contiene a los abiertos de Rn , y (2) la σ-álgebra de Lebesgue, esto es, la σ-álgebra mı́nima que contiene tanto a los abiertos como a los conjuntos de medida nula de Rn . (Que tales σ-álgebras mı́nimas existen se prueba tomando la intersección de todas las σ-álgebras que contienen los subconjuntos requeridos). Se define ası́ el espacio de medida de Lebesgue (Rn , MRn , µRn ) ≡ (Rn , M, µ), donde M es la σ-álgebra de Lebesgue, y µ es la restricción a M de la medida exterior de Lebesgue o, simplemente, medida de Lebesgue. La clase de los conjuntos medibles Lebesgue (que, desde luego, incluye tanto a los abiertos como a los cerrados), se revela espectacularmente grande; la construcción de un conjunto no medible precisa del axioma de elección. 8.4.3. Integral de Lebesgue en Rn Una vez definido el espacio de medida de Lebesgue, vamos a definir la clase de las funciones sobre Rn a las que, potencialmente, podremos 8.4. TEORÍA DE LA MEDIDA 173 definir la integral. Intentaremos que ésta sea lo más general posible y, eventualmente, admitiremos incluso como valor de las funciones ±∞. Definición 8.4.2 Diremos que f : Rn → [−∞, ∞] es medible si son subconjuntos medibles Lebesgue las preimágenes de cualquier intervalo abierto f −1 (]y0 , y1 [), ası́ como f −1 (∞), f −1 (−∞).4 La clase de las funciones medibles no sólo incluye a las continuas, sino que, al igual que la de los conjuntos medibles, resulta muy grande. La medibilidad no sólo es respetada por las operaciones algebraicas elementales, sino que se conserva por paso al lı́mite. Ası́, una función f será medible cuando exista una sucesión de funciones {fm }m∈N medibles que converge puntualmente c.p.d a f ; el lı́mite superior o inferior de una sucesión de funciones medibles es también medible. El proceso de definición de la integral sigue entonces los siguientes pasos: (1) En primer lugar, supongamos f ≥ 0 y acotada, f (Rn ) ⊂ [0, M ] para algún real M > 0. Consideremos una sucesión de particiones {P m }m de [0, M ], P m = {ykm , k = 0, . . . , jm }, y tal que su m diámetro |P m | = supk {(yk+1 − ykm ) : k ∈ {0, . . . , jm − 1} tienda a cero. Definimos la integral de f sobre Rn como: ! Ãj −1 Z m X m m f (yk ) · µ(Ak ) ∈ [0, ∞], f := lı́m m→∞ Rn k=0 −1 m siendo Am ([ykm , yk+1 ]). En efecto, se puede demostrar que k = f este lı́mite existe y es independiente de la sucesión de particiones R escogida. En particular, con esta definición se tiene Rn χA = µ(A), para todo A ⊆ Rn medible. 4 En general, dados dos espacios medibles (X, F), (X 0 , F 0 ), una aplicación f : X → X 0 se dice medible si f −1 (A0 ) ∈ F para todo A0 ∈ F 0 . Se puede comprobar n que, para el caso de que f : R → R, esta definición general incluye a la de arriba n siempre que en el dominio R consideremos la σ−álgebra de Lebesgue y en el codominio la σ− álgebra boreliana (la cual, al tener menos elementos que la de Lebesgue, en principio permite que sean admisibles como medibles más funciones). La extensión de la σ-álgebra boreliana a [−∞, ∞] puede hacerse de manera obvia; en cualquier caso, la definición de que f sea medible equivale a que la preimagen de cualquier intervalo cerrado de [−∞, ∞] sea un medible. 174 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES (2) Si f ≥ 0 no está acotada, se define fM : Rn → [0, ∞[ como fM (x) =Min{f (x), M }, se considera la integral de fM según el paso anterior y se define: Z Z fM . f := lı́m M →∞ Rn Rn Obsérvese que este lı́mite debe existir, pues la integral de fM (≥ 0) crece con M . (3) Supongamos ahora que la función medible f puede tomar valores negativos. Entonces podemos escribir f = f + − f − , donde f + , f − : Rn → [0, ∞] son funciones medibles no negativas (cuya integral ya hemos En este caso, si al menos una de las R definido). R dos integrales Rn f + , Rn f − es finita, se define la integral de f por Z Z Z n R f := n R f+ − n R f − ∈ [−∞, ∞]. (4) Se dice que una función f : Rn → [∞, ∞] es integrable L1 si la integral de f está bien definida según el Rpaso anterior, y su integral es finita (esto es, si f es medible y Rn |f | < ∞). Si se establece en el espacio de las funciones integrables L1 la relación de equivalencia f ∼ R h si y sólo si f ≡ h c.p.d. (o, equivalentemente, si y sólo si Rn |f − h| = 0) se induce en el cociente una 1 estructura R de espacio vectorial, ası́ como la norma (norma L ): k[f ]k = Rn |f | (es costumbre abusar de la notación y denotar por f indistintamente a la función y a su clase de equivalencia [f ]). Se denota por L1 (Rn ) a este espacio normado, que resulta ser de Banach. (5) Finalmente, señalemos que no es necesario considerar siempre como dominio todo Rn . Ası́, cualquier función f definida en un subconjunto medible E se supone extendida por 0 fuera de él, y se define: Z Z f := f χE , E Rn (en el caso de que exista el último miembro) ası́ como, de manera obvia, el espacio L1 (E). 8.4. TEORÍA DE LA MEDIDA 8.4.4. 175 Conjuntos de medida nula y espacio de medida en una variedad Consideremos ahora una variedad semi-riemanniana (Q, g) de dimensión n. Para definir de manera análoga a Rn un espacio de medida, debemos empezar por considerar una σ−álgebra sobre Q. La σ−álgebra, será intrı́nseca a la estructura diferenciable, e independiente de g. Definición 8.4.3 Un subconjunto A de la variedad diferenciable Q es de medida nula si para todo entorno coordenado (U, ϕ) el subconjunto ϕ(U ∩ A) es un conjunto de medida nula de Rn . El Teorema 8.4.1(1) muestra la consistencia de esta definición, esto es, basta con verificar que ϕ(U ∩ A) es de medida nula para un recubrimiento por entornos coordenados de A. Es fácil entender la importancia a la hora del cómputo de una integral del siguiente resultado, que permite reducir siempre la integración a un único entorno coordenado (entorno coordenado c.p.d.)5 : Teorema 8.4.4 Sea Q una variedad diferenciable de dimensión n. Existe un cerrado C ⊂ M de medida nula tal que U = Q\C es difeomorfo a un abierto de Rn . Consecuencia inmediata de este resultado es que el Teorema 8.4.1 es traspasable a variedades, sin más que sustituir Rn , Rm por variedades de dimensiones n, m, resp. Con estas definiciones, ya estamos en condiciones de definir el espacio medible para (Q, g). Definimos la σ-álgebra MQ de Q como la σ-álgebra generada por los abiertos y los conjuntos de medida nula de Q. A los elementos de MQ los llamaremos conjuntos medibles de la variedad. Para cada conjunto medible A ⊆ Q, y cualquier entorno coordenado, ϕ(U ∩ A) resulta ser entonces un medible de Rn . Definimos ası́ la medida de A como: Z p |det MB (g)|χϕ(U ∩A) , µg (A) = ϕ(U ) 5 Aunque se puede dar una prueba directa de este teorema, existen métodos elegantes y simples dentro del marco de la Geometrı́a Riemanniana: se toma una métrica riemanniana completa, y se suprime su “lugar de corte”. 176 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES donde (U, ϕ) es cualquier entorno coordenado c.p.d. Es fácil comprobar directamente por el teorema del cambio de variables (y se ha discutido ya exhaustivamente en las Subsecciones 8.2.1, 8.3.2), que la medida ası́ definida resulta independiente del entorno coordenado escogido6 . Algunas propiedades de esta medida, que resultan inmediatas de las de Rn , son las siguientes: 1. Si A ⊆ B ⊆ Q entonces µQ (A) ≤ µQ (B). 2. Dada una sucesión {An }n ⊆ Q, si µQ (An ) = 0 para todo n entonces µQ (∪n An ) = 0. 3. Si A ⊂ Q verifica µQ (A) = 0 entonces su interior es vacı́o. 4. Si F : Q → Q0 es diferenciable y las dimensiones de Q, Q0 coinciden, entonces A ⊂ Q con µQ (A) = 0 implica µQ0 (F (A)) = 0. 5. Si F : Qn → Qm es diferenciable y las respectivas dimensiones satisfacen n < m, entonces µQ0 (F (Q)) = 0. 6. Dadas las variedades Q, Q0 , y fijado un punto (q0 , q00 ) ∈ Q × Q0 definimos iq00 : Q → Q × Q0 q 7→ (q, q00 ) jq0 : Q0 → Q × Q0 q 0 7→ (q0 , q 0 ). Sea A ⊂ Q × Q0 . Si casi para todo q0 ∈ Q (resp. casi para todo q00 ∈ Q0 ) 0 µQ0 (jq−1 (A)) = 0 (resp. µQ (i−1 q 0 (A)) = 0) entonces µQ×Q (A) = 0. 0 0 8.4.5. Integración en una variedad Una vez definido el espacio de medida de la variedad (Q, g), la definición Rde función medible f : Q → [−∞, ∞], de la la integral de Lebesgue Q f y del espacio normado de Banach L1 (Q) sigue pasos completamente análogos a los de la Subsección 8.4.3 para Rn (basta con reemplazar Rn , µ por Q, µg a lo largo de toda esa subsección). 6 Obsérvese que aunque, debido a la simplificación de notación para el elemento de volumen métrico orientado, µ+ g ≡ µg , usamos ahora la misma notación para la medida, no existe posibilidad de confusión entre ambas. 8.4. TEORÍA DE LA MEDIDA 177 Más aún, las propiedades fundamentales de la integral de Lebesgue se demuestran de manera completamente análoga en el caso de Rn y de la variedad. Repasamos brevemente estas propiedades, formulándolas directamente para (Q, g): Elementales: (i) Linealidad: si f = af1 + bf2 siendo f1 y f2 integrables R Lebesgue, entonces f es integrable Lebesgue y: (Q,g) f = R R f + (Q,g) f2 , (Q,g) 1 R R (ii) Orden: f ≤ g entonces (Q,g) f ≤ (Q,g) g. Conmutatividad del lı́mite con la integral: Teorema de la Convergencia Monótona. Sea {fn }n una sucesión no decreciente c.p.d. de funciones medibles positivas sobre (Q, g) y f : Q → [0, ∞] su lı́mite puntual c.p.d. Entonces, f R R es medible y su integral verifica: (Q,g) f = lı́mn (Q,g) fn . Teorema de la Convergencia Dominada. Sea {fn }n una sucesión de funciones integrables L1 en (Q, g) tales que: (i) existe una función h integrable L1 tal que |fn | ≤ h c.p.d. para cada n ∈ N; (ii) existe f : Q → [−∞, ∞] que es lı́mite R puntual R c.p.d. de {fn }n . Entonces, f es integrable L1 y lı́mn (Q,g) fn = (Q,g) f . Integración en variedades producto: Para integrar en una variedad producto, usaremos la notación estándar (diferencial respecto a una variable) para indicar si se está integrando sólo en uno de los factores. Teorema de Fubini. Sean (Qi , gi ), i ∈ {1, 2} dos variedades semi-riemannianas y f : Q1 × Q2 → [−∞, ∞] una función medible. Sean: Z Z I12 = dq1 Z (Q1 ,g1 ) I21 = dq2 |f (q1 , q2 )| Z (Q2 ,g2 ) dq2 (Q2 ,g2 ) dq1 |f (q1 , q2 )|. (Q1 ,g1 ) 178 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Entonces I12 < ∞ ⇔ I21 < ∞. En este caso, f es integrable L1 y se verifica: Z f (q1 , q2 ) = (Q1 ×Q2 ,g1 +g2 ) Z Z Z dq1 (Q1 ,g1 ) Z dq2 f (q1 , q2 ) = (Q2 ,g2 ) dq2 (Q2 ,g2 ) dq1 f (q1 , q2 ), (Q1 ,g1 ) donde además: (i) casi para todo q10 ∈ Q1 , la función q2 7→ fq10 (q2 ) := f (q10 , q2 ) es finita c.p.d. en Q2 y es integrable L1 ; (ii) casi para todo q20 ∈ Q2 , la función q1 7→ fq20 (q1 ) := f (q1 , q20 ) es finita c.p.d. en Q1 y es integrable L1 ; R (iii) la función q1 7→ (Q2 ,g2 ) fq1 es finita c.p.d. en Q1 y es integrable L1 ; R (iv) la función q2 7→ (Q1 ,g1 ) fq2 es finita c.p.d. en Q2 y es integrable L1 ; Otros resultados clásicos de teorı́a de integración permiten relacionar integrales con derivadas (versión de la Regla de Barrow clásica, resultados que permiten permutar la integral con derivadas parciales, etc.) 8.5. Apéndice 1: álgebra exterior sobre V (R) En este apéndice y el siguiente se recogen algunas notas básicas sobre el álgebra exterior en un espacio vectorial V (R) de dimensión n, necesarias para el desarrollo de la teorı́a de la integración de n−formas en variedades. Esencialmente, en el presente apéndice estudiaremos tensores antisimétricos, extendiendo nuestro estudio de los 2-covariantes en la Sección 6.4 a los r−covariantes; en el Apéndice 2 nos centraremos en el caso r = n. 8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R) 179 Definición 8.5.1 Diremos que un tensor r-covariante T ∈ Tr,0 (V ) es antisimétrico si verifica: T (y1 , . . . , yi , . . . , yj , . . . , yr ) = −T (y1 , . . . , yj , . . . , yi , . . . , yr ) 1 ≤ i < j ≤ r, para todo y1 , . . . , yr ∈ V , esto es, si T es antisimétrico respecto a cualquier par (i, j) de sus variables, i < j. El conjunto de todos los tensores r-covariantes antisimétricos se denotará por Λr (V ). Es directo comprobar que Λr (V ) es un subespacio vectorial de Tr,0 (V ). Recordemos además las identificaciones Λ1 (V ) = V ∗ y Λ0 (V ) = R. Antes de introducir el concepto de antisimetrizador para los tensores de un espacio vectorial, conviene recordar la definición, ası́ como algunas propiedades básicas, de las permutaciones. Definición 8.5.2 Sea S(r) = {1, 2, . . . , r} ⊂ N. Llamaremos permutación de S(r) (o de r elementos) a toda aplicación biyectiva σ : S(r) → S(r). Al conjunto de todas las permutaciones de S(r) lo denotaremos por Sr . Propiedades elementales: (1) El conjunto de las permutaciones Sr junto con la operación de composición tiene estructura de grupo abeliano. Además, su cardinal es r! (2) Toda permutación σ ∈ Sr , se puede escribir como composición de trasposiciones (permutaciones que actuan sobre S(r) únicamente intercambiando dos de sus elementos). Existen muchas maneras de escribir una misma permutación σ como composición de trasposiciones, y se pueden escoger éstas de un modo canónico como [σ] trasposiciones “de ı́ndices contiguos”, tomadas de modo que se vayan “reordenando los ı́ndices de menor a mayor”. En cualquier caso, el número de trasposiciones necesarias para una σ fijada siempre será par o impar, independientemente de la composición de trasposiciones, y se define la signatura de σ como sig(σ) := (−1)[σ] . (3) La aplicación sig : Sr → {−1, 1} es un homomorfismo de grupos. La permutación σ se dice par (resp. impar) si sig(σ) = 1 (resp. = −1). 180 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Definición 8.5.3 Se define el antisimetrizador de orden r ∈ N para el espacio vectorial V como la aplicación hr : Tr,0 (V ) → T r,0 (V ) P T 7→ σ∈Sr sig(σ)T σ , donde T σ (y1 , . . . , yr ) := T (yσ(1) , . . . , yσ(r) ) para todo y1 , . . . , yr ∈ V . No es difı́cil comprobar las siguientes propiedades: Propiedades: (1) hr es lineal y hr (T σ ) = sig(σ) hr (T ). (2) Im hr ⊂ Λr (V ), y si T ∈ Λr (V ) entonces hr (T ) = r! T . (3) Para todo T ∈ Tr,0 (V ), T 0 ∈ Tr0 ,0 (V ) se tiene 0 0 hr+r (hr (T ) ⊗ T 0 ) = r! hr+r (T ⊗ T 0 ), 0 0 0 hr+r (T ⊗ hr (T 0 )) = r0 ! hr+r (T ⊗ T 0 ). 0 0 0 (4) hr+r (T ⊗ T 0 ) = (−1)r·r hr+r (T 0 ⊗ T ). Definición 8.5.4 Se definen los siguientes productos exteriores: 0 0 ∧ : Λr (V ) × Λr (V ) → Λr+r (V ) (T, T 0 ) 7→ T ∧ T 0 = 0 0 1 hr+r (T r!r0 ! ⊗ T 0) 0 ∧ : Λr (V ) × Λr (V ) → Λr+r (V ) 1 r+r0 (T ⊗ T 0 ). (T, T 0 ) 7→ T ∧T 0 = (r+r 0 )! h Es inmediato comprobar que estos productos pueden expresarse del siguiente modo: P P T ∧ T 0 = k!k1 0 ! σ∈Sr+r0 sig(σ)(T ⊗ T 0 )σ = σ∈σr,r0 sig(σ)(T ⊗ T 0 )σ P 1 0 σ T ∧T 0 = (k+k 0 )! σ∈Sr+r0 sig(σ)(T ⊗ T ) donde σr,r0 = {σ ∈ Sr+r0 : σ(1) < · · · < σ(r) y σ(r + 1) < · · · < σ(r + r0 )}. Propiedades: Los productos exteriores ∧, ∧ son: 8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R) 181 (1) bilineales (obviamente), (2) asociativos (para lo cual resulta esencial la elección hecha de los factores r!r0 ! o (r + r0 )!), y (3) antisimétricos, en el siguiente sentido: 0 T ∧ T 0 = (−1)r+r T 0 ∧ T, 0 T ∧T 0 = (−1)r+r T 0 ∧T, 0 para T ∈ Λr (V ), T 0 ∈ Λr (V ). En adelante, escogeremos siempre el producto exterior ∧. Proposición 8.5.5 Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ , se verifican: (i) El conjunto {φi1 ∧ · · · ∧ φir : 1 ≤ i1 < · · · < ir ≤ n} es una base de Λr (V ). µ ¶ n r si r ≤ n, y 0 si r > n. (ii) dim Λ (V ) = r (iii) Si T ∈ Λr (V ) entonces: X T = ti1 ...ir φi1 ∧ · · · ∧ φir , 1≤i1 <···<ir ≤n donde ti1 ...ir = T (vi1 , . . . , vir ) y B = (v1 , . . . , vn ) tiene por base dual a B ∗ . Demostración. Obviamente, (ii) se deduce directamente de (i). Para comprobar la independencia lineal del conjunto en cuestión, supongamos que X ai1 ...ir φi1 ∧ · · · ∧ φir = 0. 1≤i1 <···<ir ≤n Entonces, aplicando los dos miembros de la expresión al vector (vl1 , . . . , vlr ), 1 ≤ l1 < · · · < lr ≤ n, obtenemos que al1 ···lr = 0. Finalmente, escribiendo como hasta ahora ti1 ···ir = T (vi1 , . . . , vir ): P T = ni1 ,...,ir =1 ti1 ,...,ir φi1 ⊗ · · · ⊗ φir P P = 1≤i1 <···<ir ≤n σ∈Sr tiσ(1) ...iσ(r) φiσ(1) ⊗ · · · ⊗ φiσ(r) P P = P1≤i1 <···<ir ≤n σ∈Sr sig(σ)ti1 ...ir φiσ(1) ⊗ · · · ⊗ φiσ(r) = P1≤i1 <···<ir ≤n ti1 ...ir hr (φi1 ⊗ · · · ⊗ φir ) = 1≤i1 <···<ir ≤n ti1 ...ir φi1 ∧ · · · ∧ ϕir , 182 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES lo que prueba (i) y (iii). 2 Ejercicio. Consideremos φ1 , . . . , φr ∈ V ∗ . Demuéstrese que el conjunto {φ1 , . . . , φr } es linealmente independiente si y sólo si φ1 ∧· · ·∧φr 6= 0. Llamaremos álgebra exterior sobre V al espacio Λ(V ) ≡ (⊕nr=0 Λr (V ), ∧), donde el producto exterior ∧ se supone definido para cualequiera par de elemento de Λ(V ) extendiéndolo de manera natural por bilinealidad. Por último, justifiquemos para referencia posterior cómo es posible usar los homomorfismos entre espacios vectoriales para transportar tensores antisimétricos y, en general, r-covariantes, de uno a otro espacio. En adelante, V 0 (R) será otro espacio vectorial de dimensión finita. Definición 8.5.6 Sea F : V → V 0 lineal y T 0 ∈ Tr,0 (V 0 ). Se define el tensor inducido o pull-back F ∗ T 0 ∈ Tr,0 (V ) de T 0 por F como F ∗ T 0 (y1 , . . . , yr ) = T 0 (F (y1 ), . . . , F (yr )), ∀y1 , . . . yr ∈ V. Propiedades: (1) La aplicación F ∗ : Tr,0 (V 0 ) → Tr,0 (V ) es lineal y verifica F ∗ (Λr (V 0 )) ⊂ Λr (V ). (2) Si F = IdV entonces F ∗ = IdTr,0 (V ) . (3) Si se tiene otra aplicación lineal G : V 0 → V 00 entonces (G◦F )∗ = F ∗ ◦ G∗ . (4) Si F es biyectiva entonces (F −1 )∗ = (F ∗ )−1 . En particular, F ∗ es biyectiva y F ∗ (Λr (V 0 )) = Λr (V ). Se define entonces F∗ = (F −1 )∗ que, en el caso de que G también sea biyectiva verifica: (G ◦ F )∗ = G∗ ◦ F∗ . (5) F ∗ (T10 ∧ T20 ) = F ∗ (T10 ) ∧ F ∗ (T20 ). 8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R) 183 8.6. Apéndice 2: Elementos de volumen en V (R) 8.6.1. Elemento de volumen y orientación Si ω ∈ Λn (V ), ω 6= 0, entonces forma una base de Λn (V ). Este hecho simple permite introducir los siguientes conceptos: Definiciones 8.6.1 (1). Llamamos elemento de volumen de V a todo ω ∈ Λn (V ) no nulo. (2). Consideremos la relación de equivalencia en Λn (V )−{0} definida por: ω1 ∼ ω2 si y sólo si w1 = a w2 , a > 0. Llamamos orientación en V a cada una de las dos únicas clases de equivalencia definidas por ∼. Fijada una de estas clases, [ω], al par (V, [ω]) le llamaremos espacio vectorial orientado según [ω]. (3). Sea (V, [ω]) un espacio vectorial orientado. Diremos que una base (ordenada) B = (v1 , . . . , vn ) está positivamente orientada (resp. negativamente orientada) si su correspondiente base dual B ∗ = (φ1 , . . . , φn ) verifica TB := φ1 ∧ · · · ∧ φn ∈ [ω] (resp. TB 6∈ [ω]). Al tensor TB le llamaremos tensor determinante en B (y, de hecho, TB (y1 , . . . , yn ) coincide con el determinante de la matriz cuya columna j−ésima está formada por las coordenadas de yj en B, para todo j). Ejercicio. Pruébense las siguientes afirmaciones: (i). Todo elemento de volumen ω ∈ Λn (V ) puede escribirse como un tensor determinante para alguna base ordenada B. (ii). Para Rn , el determinante usual de n vectores es un elemento de volumen, que coincide con el tensor determinante en la base usual. (iii). Si B 0 = (v10 , . . . , vn0 ) es otra base ordenada entonces TB 0 = det(M (IdV , B 0 ← B)) · TB . (8.11) donde M (IdV , B 0 ← B) es la matriz en cuyas columnas aparecen, ordenadamente, las coordenadas de los elementos de la base B en B 0 . 184 8.6.2. CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Determinante de un endomorfismo Definición 8.6.2 Sean (V, [ω]), (V 0 , [ω 0 ]) dos espacios vectoriales orientados. Diremos que un isomorfismo F : V → V 0 preserva las orientaciones si F ∗ ω 0 ∈ [ω]. Obsérvese que esta definición es independiente del representante ω 0 escogido. Además, si F preserva las orientaciones [ω] y [ω 0 ], entonces también preserva las orientaciones opuestas. El hecho de que Λn (V ) tenga dimensión 1 permite definir el determinante cuando F es un endomorfismo. Definición 8.6.3 Sea F un endomorfismo de V y consideremos el correspondiente endomorfismo F ∗ : Λn (V ) → Λn (V ) w 7→ F ∗ w del espacio vectorial monodimensional Λn (V ). Llamamos determinante de F al único número real det F ∈ R que verifica F ∗ = det F · IdΛn (V ) . Esta definición coincide, para cualquier base B = (v1 , . . . , vn ), con la del determinante usual de la matriz M (F, B) cuya columna j−ésima está formada por las coordenadas de F (vj ) en B. De hecho, es fácil comprobar de la Definición 8.6.3 y las propiedades del tensor TB : Proposición 8.6.4 (1) Si F es un endomorfismo de V y B = (v1 , . . . , vn ) es una base ordenada suya, entonces se verifica det F = TB (F (v1 ), . . . , F (vn )) = det(M (F, B)). (2) Sea F un automorfismo de V . Se verifica que det F > 0 si y sólo si F ∗ ω ∈ [ω] para algún (y, entonces, para todo) elemento de volumen ω, esto es, si y sólo si F aplica bases positivamente orientadas en bases positivamente orientadas. 8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R) 8.6.3. 185 El elemento de volumen métrico orientado Consideremos ahora que, en el espacio vectorial orientado (V, [ω]), fijamos un producto escalar g = h·, ·i. Definición 8.6.5 Se define el elemento de volumen métrico orientado de (V, g, [ω]) como µ+ g := TB0 , donde B0 es cualquier base de V ortonormal y positivamente orientada. Resulta inmediato de (8.11) que, en esta definición, TB0 no depende de la base B0 (ortonormal y positivamente orientada) escogida. Por simplicidad, omitiremos en la notación la dependencia del elemento de volumen métrico con la orientación, y escribiremos únicamente µg . No obstante, cuando nos refiramos al elemento de volumen métrico con la orientación opuesta, escribiremos µ− g. Obsérvese que si fijamos una base B = (v1 , . . . , vn ) de V entonces se tiene: µg = µg (v1 , . . . , vn ) · TB = det(IdV , B0 ← B) · TB , donde B0 es cualquier base ortonormal, positivamente orientada. Ahora bien, considerando las matrices MB (g), MB0 (g) de la métrica g en las bases B, B0 , respectivamente, se tiene MB (g) = M (IdV , B0 ← B)t · MB0 (g) · M (IdV , B0 ← B). Por tanto, deducimos que |det MB (g)| = det (M (IdV , B0 ← B))2 . En resumen: Proposición 8.6.6 Si B es cualquier base positivamente orientada de (V, [ω], g), entonces: p µg = |det MB (g)| TB . Por último, es de señalar que la definición de determinante de un endomofismo se puede extender a la de determinante de una aplicación lineal entre dos espacios vectoriales métricos orientados de igual dimensión. 186 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Definición 8.6.7 Sean (V, g, [ω]), (V 0 , g 0 , [ω 0 ]) dos espacios vectoriales métricos orientados de igual dimensión, y F : V → V 0 una aplicacion lineal. Se define el determinante de F como el único número real det F ∈ R que verifica F ∗ µg0 = det F · µg . Obviamente, si F es un endomorfismo de V entonces las Definiciones 8.6.3 y 8.6.7 coinciden para todo g y [ω], siempre y cuando se supongan g 0 = g y [ω 0 ] = [ω]. 8.7. Apéndice 3: r−formas y orientación en variedades 8.7.1. El álgebra de r−formas diferenciales De manera inmediata, todo el álgebra de tensores antisimétricos desarrollada en las secciones anteriores para un espacio vectorial se traspasa a variedades diferenciables. Ası́, un un campo tensorial antisimétrico r-covariante o r−forma diferencial β ∈ Λr (Q) se escribirá en coordenadas: X β= βi1 ···ir dq i1 ∧ · · · ∧ dq ir , i1 , . . . , ir ∈ {1, . . . , n}. (8.12) 1≤i1 <···<ir ≤n con βi1 ···ir = β(∂i1 · · · ∂ir ). Se define el álgebra exterior Λ(Q) ≡ (⊕nr=0 Λr (Q), ∧) entendiéndose la acción natural del producto exterior ∧ punto a punto. Como para cualquier campo tensorial, la diferenciabilidad de cada r-forma equivale a que las funciones ai1 ···ir sean diferenciables para cualesquiera entornos coordenados (aunque basta con que la diferenciabilidad se verifique para las cartas de un atlas). Análogamente, se pueden definir r−formas que sean sólo continuas o medibles, según el carácter de las funciones que inducen sus coordenadas sobre abiertos de Rn . 8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN 8.7.2. 187 Orientación de una variedad Dada una n−variedad Q, un elemento de volumen (resp. orientación) sobre Q se define como una asignación diferenciable de un elemento de volumen sobre cada Tp Q: Definiciones 8.7.1 (1) Un elemento de volumen sobre Q es una nforma diferenciable Ω que no se anula en ningún punto. (2) Una orientación sobre una variedad Q es una elección en cada p ∈ Q de una orientación [ωp ] de Tp Q que resulta diferenciable en el sentido de que para todo p ∈ Q existe un entorno Up y un elemento de volumen Ω sobre Up tal que Ωp0 ∈ [ωp0 ] para todo p0 ∈ Up . Proposición 8.7.2 Sea Q una variedad diferenciable. Son equivalentes: (1) Q admite un elemento de volumen. (2) El C ∞ (Q)-modulo Λn (Q) esta generado por un elemento Ω0 , esto es, Λn (Q) = {f Ω0 : f ∈ C ∞ (Q)}. (3) Q admite una orientación. (4) Cada parte conexa de Q admite exactamente dos orientaciones. Idea de la Demostración. Resultan inmediatas la equivalencia (2) ⇔ (1) ⇒ (3). (3) ⇒ (1) se demuestra usando una partición de la unidad µi subordinadaPal recubrimento de los Up en la Definición 8.7.1(2), y tomando Ω = i µi Ωpi . Para la equivalencia con (4), obsérvese que la orientación determinada por el elemento de volumen Ω es distinta a la de −Ω. Además, si Q es conexa no pueden existir más de dos orientaciones por (2): la determinada por f Ω0 y la determinada por −f Ω0 , para cualquier f > 0. 2 Definición 8.7.3 Una variedad diferenciable Q se dice orientable si (alguna de) las condiciones de la Proposición 8.7.2 se verifican. En este caso, al par (Q, [Ω]) se le llama variedad orientada, siendo Ω un elemento de volumen y [Ω] la orientación que define. 188 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES Para simplificar la notación, escribiremos (Q, [Ω]) ≡ +Q, y −Q denotará la variedad orientada con la orientación opuesta. Todo abierto de una variedad orientada se supone asimismo orientado por la restricción de la orientación. A continuación centraremos nuestra atención en el comportamiento de la orientación respecto a los difeomorfismos locales y, en particular, respecto de los entornos coordenados. Definición 8.7.4 Sea F : Q0 → Q un difeomorfismo local y [Ω] una orientación sobre Q. Se define la orientación inducida por F en Q0 como [F ∗ Ω]. Si suponemos prefijada una orientación [Ω0 ] en Q0 , se dice que F preserva la orientación si [Ω0 ] = [F ∗ Ω]. Ejercicio. Pruébese que si Q es conexa entonces un difeomorfismo local F : +Q → +Q preserva o no la orientación con independencia de la que se escoja. En Rn , la orientación canónica o usual es [dx1 ∧· · ·∧dxn ]. Si F : U → V es un difeomorfismo local entre dos abiertos U, V de Rn entonces F preserva la orientación si y sólo si detJ (F ) > 0. Proposición 8.7.5 Sea Q una variedad diferenciable. Son equivalentes: (1) Q es orientable, (2) Existe un recubrimiento por entornos coordenados de Q con cambios de carta de jacobiano positivo. En este caso, escogida una orientación en Q, existe un atlas cuyas cartas coordenadas preservan la orientación de Q y la usual de R. Demostración. (1)⇒(2) Observemos previamente que, escogida una orientación, para cada entorno coordenado (U, ϕ ≡ (q 1 , . . . , q n )) con U conexo, la aplicación ϕ : U → ϕ(U ) ⊆ Rn o conserva la orientación o la invierte en todo punto. En este último caso, podemos definir la carta ϕ̃ ≡ (q 1 , . . . , qn−1 , −qn ), que sı́ la conservarı́a. El atlas ası́ formado verifica la propiedad deseada. En efecto, como la composición de dos difeomorfismos locales que preservan la orientación también preserva la orientación, cada cambio de coordenadas conserva la orientación usual de Rn , de donde se sigue el resultado. 8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN 189 (2)⇒(1) Escojamos para cada p ∈ Q la orientación inducida por cada carta del recubrimiento. Esta elección es consistente, esto es, si (U, ϕ), (W, ψ) son dos de tales cartas, la orientación inducida por ψ es la misma que por ϕ en U ∩ W (ψ = (ψ ◦ ϕ−1 ) ◦ ϕ se expresa como composición de dos difeomorfismos que preservan la orientación). 2 Ejercicio. Demuéstrese que si Q es una variedad orientable entonces admite exactamente 2c orientaciones, siendo c el número de partes conexas de Q. 8.7.3. El recubridor de dos hojas orientable Aunque existen conocidos ejemplos de variedades no orientables (cinta de Moebius, botella de Klein, superficie proyectiva real), la restricción de orientabilidad no se considera muy restrictiva por la existencia, en este caso, de un recubridor de dos hojas orientable. Definición 8.7.6 Sean Q, Q̃ dos variedades diferenciables, Q conexa. Una aplicación diferenciable Π : Q̃ → Q es recubridora si para cada p ∈ Q existe un entorno conexo U tal que Π−1 (U ) es una unión disjunta de k ∈ N ∪ {∞} abiertos conexos Π−1 (U ) = ∪ki=1 Ũi tales que cada restricción Π|Ũi es un difeomorfismo sobre U . En este caso, k es constante, y se dice que (Q̃, Π) es un recubridor de k hojas de Q. Ası́, son aplicaciones recubridoras de infinitas hojas R → S 1 (⊂ R2 ≡ C), t 7→ eit , o la proyección canónica R2 → R2 /Z2 , donde el cociente es identificable con un toro. En variable compleja, las superficies de Riemann de k hojas construidas para una función k−multivaluada son recubridoras en el sentido anterior. No es difı́cil construir una aplicación recubridora de dos hojas del cilindro (orientable) en la cinta de Moebius (no orientable). Este ejemplo se puede generalizar a cualquier variedad Q como sigue. Definamos a partir de la variedad conexa Q la siguiente nueva variedad. Como conjunto consideramos Q̃ = {(p, Op ) : p ∈ Q, Op es una orientación en Tp Q}. Para la topologı́a y la estructura diferenciable, consideramos para cada p̃ = (p, Op ) ∈ Q̃ una carta (U, ϕ) tal que U es conexo, p ∈ U y ϕ preserva la orientación Op . Definimos entonces un 190 CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES entorno coordenado (Ũ , ϕ̃) de Q̃ como ϕ̃ : Ũ → Rn (q, Oq ) 7→ ϕ(q), siendo Ũ = {(q, Oq ) : q ∈ U, Oq la orientación inducida por ϕ en q}. Se verifican entonces las siguientes propiedades: (i) Por construcción, la aplicación Π es un recubridor de dos hojas, y Q̃ es orientable; (ii) Q es orientable si y sólo si Q̃ tiene dos partes conexas. En particular, se demuestra ası́: Teorema 8.7.7 Toda variedad diferenciable no orientable conexa Q admite un recubridor de dos hojas (Q̃, Π) tal que Q̃ es orientable y conexo. Ejercicio. Una variedad producto Q1 × Q2 es orientable si y sólo si Q1 y Q2 lo son. Por último, es de señalar que la idea de la construcción del recubridor de dos hojas orientables está en la base del siguiente importante resultado, en el que el papel del conjunto de las dos orientaciones en cada punto lo pasa a desempeñar el conjunto de las clases de lazos homotópicos en cada punto. Teorema 8.7.8 Toda variedad diferenciable conexa Q admite un recubridor universal, esto es, un recubridor (Q̃, Π) tal que Q̃ es simplemente conexo. Es de remarcar que el concepto de recubridor es válido en el contexto más general de los espacios topológicos arcoconexos, sin más que reemplazar la diferenciabilidad de las aplicaciones por continuidad –en particular difeomorfismos locales por homeomorfismos locales. En este contexto también se mantiene el Teorema 8.7.8, con alguna condición topológica poco restrictiva (hay que suponer que, además de ser arcoconexo, Q verifica que todo punto admite un entorno simplemente conexo –propiedad ésta que verifica cualquier obviamente variedad). Capı́tulo 9 Teorema de Stokes El objetivo fundamental de este capı́tulo es estudiar la versión general del Teorema de Stokes, y algunas de sus aplicaciones más importantes. Para ello, previamente veremos algunos conceptos que necesitaremos para entender dicho teorema, como son las derivaciones y antiderivaciones tensoriales, y las variedades con borde. A continuación, enunciaremos y demostraremos el Teorema de Stokes, y estudiaremos algunos resultados clásicos que se derivan de él. 9.1. Derivaciones y antiderivaciones tensoriales 9.1.1. Derivación tensorial El concepto de derivación usual puede extenderse al espacio de los campos de tensores sobre una variedad. Para ello, es necesario introducir previamente el concepto de contracción, que generaliza el de traza para endomorfismos y tensores (1, 1). Definición 9.1.1 Sea V (R) un espacio vectorial de dimensión n ∈ N, y consideremos un tensor T ∈ Tr,s (V ) con r, s ≥ 0. Dada una base B = (v1 , . . . , vn ) de V se define el tensor contraı́do de T respec191 192 CAPÍTULO 9. TEOREMA DE STOKES to a los ı́ndices i−ésimo covariante y j-ésimo contravariante, Cij T ∈ Tr−1,s−1 (V ), con i ∈ {1, . . . , r}, j ∈ {1, . . . , s} como: Cij T (w1 , . . . , wr−1 , ψ 1 , . . . , ψ s−1 ) = n X T (w1 , . . . , wi−1 , vk , wi+1 , . . . , wr−1 , ψ 1 , . . . , ψ j−1 , φk , ψ j , . . . , ψ s−1 ) k=1 donde B tiene por base dual a B ∗ = (φ1 , . . . , φn ). Resulta inmediato que esta definición es independiente de la base B escogida pues, fijados los argumentos de todos los ı́ndices de T salvo el i y el j-ésimos, se tiene un tensor (1, 1) al cual se le está calculando la traza. Asimismo, resulta obvio de la definición que Cij T es un tensor (r − 1, s − 1). En adelante consideraremos el espacio vectorial y C∞ (Q)−módulo T (Q) = ⊕r,s Tr,s (Q), cuyos elementos se pueden escribir como una suma finita de elementos en cada Tr,s (Q). Definición 9.1.2 Una derivación tensorial D : T (Q) → T (Q) es una aplicación R-lineal tal que D(Tr,s (Q)) ⊂ Tr,s (Q) y verifica, para todo T, T 0 ∈ T (Q): (i) Regla de Leibniz: D(T ⊗ T 0 ) = DT ⊗ T 0 + T ⊗ DT 0 (ii) Conmutabilidad con las contracciones: D(Cij T ) = Cij DT . Nota. En esta definición, las funciones se consideran como campos tensoriales (0,0), y el producto de una función por un tensor como un producto tensorial. De hecho, la regla de Leibniz (i) generaliza a la que verifican los campos vectoriales, y ası́ D |C ∞ (Q) es identificable a un campo vectorial V ∈ X(Q). Se comprueban sin dificultad las siguientes propiedades de las derivaciones tensoriales: Propiedades: (1) Localidad. Si T, T 0 ∈ T (Q) y T = T 0 en un entorno U de p, entonces DTp = DTp0 . En particular, si D es una derivación tensorial 9.1. DERIVACIONES Y ANTIDERIVACIONES 193 sobre Q y U es un abierto, existe una única derivación tensorial DU sobre U tal que: DU (A |U ) = (DA) |U ∀A ∈ T (Q) (en adelante se usará la misma letra D para denotar DU ). Demostración. Tómese una función ρ ∈ C ∞ (Q) con soporte en U , y que sea distinta de 0 en p. Entonces ρT ≡ ρT 0 por lo que, aplicando la derivación en ambos miembros: D(ρ)T + ρD(T ) = D(ρ)T 0 + ρD(T 0 ) en todo punto. Evaluando en p y usando ρ(p) 6= 0 se sigue el resultado inmediatamente. (2) Unicidad. El valor de D sobre C ∞ (Q) y X(Q) (resp., sobre C ∞ (Q) y Λ1 (Q)), determina unı́vocamente a D. Ası́, si D y D0 son dos derivaciones tensoriales que coinciden sobre C ∞ (Q) y X(Q) (resp. sobre C ∞ (Q) y Λ1 (Q)) entonces D = D0 . Demostración. Sean ω ∈ Λ1 (Q), X ∈ X(Q). Puesto que ω(X) = C11 (ω ⊗ X), necesariamente D(ω(X)) = (Dω)(X) + ω(DX). (9.1) Ası́, determinado el valor de D sobre la función ω(X) y el campo vectorial X se deduce el valor de Dω (análogamente, si se tiene determinado D sobre la forma diferencial ω). Para el resto de campos tensoriales, la demostración se sigue con facilidad por inducción. Ası́, si T es un campo tensorial (2, 0), obsérvese que T (X, Y ) = C11 (C11 (T ⊗ X ⊗ Y )) por lo que se tendrá: (DT )(X, Y ) = D(T (X, Y )) − T (DX, Y ) − T (X, DY ). (9.2) (3) Existencia. Sea V ∈ X(Q) cualquier campo vectorial, y δ : X(Q) → X(Q) una aplicación R-lineal tal que δ(f X) = V (f )X + f δ(X), ∀f ∈ C ∞ (Q), ∀X ∈ X(Q). Entonces existe una (única) derivación tensorial D tal que D |C ∞ (Q) ≡ V y D |X(Q) ≡ δ. Demostración. Obsérvese que, si existiera tal D, su valor sobre cualquier campo tensorial quedarı́a determinado por las igualdades (9.1), (9.2) (y otras análogas obtenidas inductivamente). Basta entonces con definir D por tales igualdades. 194 CAPÍTULO 9. TEOREMA DE STOKES La siguiente derivación tensorial tiene gran interés1 , y será definida haciendo uso de la propiedad (3). Definición 9.1.3 Sea Q una variedad diferenciable. Se define la derivada de Lie según V ∈ X(Q), como la única derivación tensorial que verifica: (i) LV f = V (f ) ∀f ∈ C ∞ (Q), (ii) LV (X) = [V, X] ∀X ∈ X(Q). Ejercicio. Pruébense las siguientes propiedades de la derivada de Lie: (a) L[X,Y ] = LX ◦ LY − LY ◦ LX ∀X, Y ∈ X(Q). 0 (b) Consideremos ω ∈ Λr (Q), ω 0 ∈ Λr (Q) y X ∈ X(Q). Se verifican: (i) LX ω ∈ Λr (Q), (ii) LX (ω ∧ ω 0 ) = (LX ω) ∧ ω 0 + ω ∧ (LX ω 0 ). Ejercicio. Demuéstrese: (1) Si D una derivación tensorial, y V ≡ D |C ∞ (Q) , entonces D − LV restringido sobre X(Q) es C ∞ (Q)-lineal y, por tanto, identificable a un campo de endomorfismos. (2) Dados V ∈ X(Q) y A ∈ T1,1 (Q) existe una única derivación D tal que V = D |C ∞ (Q) y (D − LV ) |X(Q) ≡ A. 9.1.2. Antiderivación tensorial Aprovechando las propiedades de antisimetrı́a del producto exterior, es posible introducir un tipo de derivación especı́fica para los tensores antisimétricos. Definición 9.1.4 Una antiderivación de grado p ∈ Z en Λ(Q) es una aplicación R-lineal D : Λ(Q) → Λ(Q) que verifica: (i) D(Λr (Q)) ⊂ Λr+p (Q) (asuminos el convenio: Λ−r (Q) ≡ 0, ∀r ∈ N), (ii) D(ω∧ω 0 ) = (Dω)∧ω 0 +(−1)r ω∧Dω 0 (Regla de Leibniz). 0 ∀ω ∈ Λr (Q), ∀ω 0 ∈ Λr (Q) La generalidad permitida de que se pueda aumentar o disminuir en p el tipo de forma tensorial se revelará útil para antiderivaciones2 Resulta 1 También tendrán interés las derivaciones asociadas a un conexión afı́n ∇ sobre una variedad diferenciable Q (véase el Tema 10). Dada una tal ∇, la derivada covariante según V ∈ X(Q) se define como la única derivación tensorial que verifica: (i) ∇V (f ) = V (f ) ∀f ∈ C ∞ (Q), (ii) ∇V (X) = ∇V X ∀X ∈ X(Q). 2 No precisaremos una propiedad similar para derivaciones, por lo que no se admite tal posibilidad para ellas (pero compárese con el Apéndice del Tema ??). 9.1. DERIVACIONES Y ANTIDERIVACIONES 195 inmediato comprobar las siguiente propiedades de las antiderivaciones, que son análogas a las de las derivaciones tensoriales. Propiedades: (1) Localidad. Las antiderivaciones tensoriales son también operadores locales; esto es, si U es un abierto de Q y ω |U ≡ ω 0 |U entonces (Dω) |U = (Dω 0 ) |U para todo ω, ω 0 ∈ Λ(Q). En particular, (i) si f ∈ C ∞ (Q) ≡ Λ0 (Q) es constante en un entorno U de p, (Df )p ≡ 0, (ii) D define de manera natural derivaciones en cada abierto de Q. (2) “Unicidad”. Determinado el valor de D sobre C ∞ (Q) y Λ1 (Q), se determina sobre todo Λ(Q). Nos interesarán dos simples casos particulares de antiderivaciones, una de grado 1 y otra de grado -1. La primera de ellas es sólo la generalización de la diferencial estudiada en el Tema 6. Definición 9.1.5 Sea Q una variedad diferenciable de dimensión n. Se define la derivada exterior de ω como la (r +1)-forma dω ∈ Λr+1 (Q) que en coordenadas locales (U, q 1 , . . . , q n ) de Q tiene la expresión dω := X dωi1 ...ir ∧ dq i1 ∧ · · · ∧ dq ir , (9.3) 1≤i1 <···<ir ≤n P siendo ω := 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧· · ·∧dq ir , y dωi1 ...ir la diferencial usual de funciones. Repitiendo pasos análogos a los de la Proposición 6.4.2 no es difı́cil comprobar que esta definición resulta independiente de las coordenadas elegidas. Obsérvese que de la expresión (9.3) se deduce directamente que la derivada exterior sobre las funciones coincide con la diferencial usual. Para las (n − 1)-formas diferenciales, la siguiente expresión de la diferencial exterior, que usaremos más adelante, también es inmediato 196 CAPÍTULO 9. TEOREMA DE STOKES Proposición 9.1.6 Sea ω ∈ Λn−1 (Q) una (n − 1)-forma diferencial. Entonces, en coordenadas locales ω admite la expresión: ω= n X ci ∧ · · · ∧ dq n , (−1)i−1 ωi dq 1 ∧ · · · ∧ dq i=1 (donde el signo b· indica que se suprime el término que cubre), y ası́: à n ! X ∂ωi dω = dq 1 ∧ · · · ∧ dq i ∧ · · · ∧ dq n . i ∂x i=1 El siguiente resultado es general. Proposición 9.1.7 La derivada exterior satisface la igualdad d2 = 0. Demostración. Aplicando directamente la definición de diferencial exterior se tiene: ³P ´ Pn ∂ωi1 ···ir j i1 ir d(dω) = d dq ∧ dq ∧ · · · ∧ dq j 1≤i1 <···<ir ≤n ´ ³P j=1P ∂q P ∂ωi1 ···ir n n i j dq ∧ dq ∧ dq i1 ∧ · · · ∧ dq ir = 1≤i1 <···<ir ≤n j=1 i=1 ∂q i ∂q j = 0, donde se ha usado que, por la igualdad entre las derivadas cruzadas, el paréntesis del último término es nulo. 2 Ejercicio. Pruébense las siguientes caracterizaciones de la diferencial exterior: (1.) La diferencial exterior es la única antiderivación tensorial que coincide con la diferencial usual sobre las funciones y que verifica d ◦ d = 0. (2.) La diferencial exterior es la antiderivación tensorial definida, para todo ω ∈ Λr (Q), por: P dω(X0 , X1 , . . . , Xr ) = ri=0 (−1)i Xi (ω(X0 , . . . , X̂i , . . . , Xr )) P + 0≤i<j≤r (−1)i+j ω([Xi , Xj ], X0 , . . . , X̂i , . . . , X̂j , . . . , Xr ). donde el sı́mbolo ˆ sobre un argumento indica que éste ha sido suprimido. 9.1. DERIVACIONES Y ANTIDERIVACIONES 197 Proposición 9.1.8 Consideremos dos variedades diferenciables Q, Q0 y una aplicación diferenciable entre ellas F : Q0 → Q. Si ω ∈ Λ(Q) entonces se verifica d(F ∗ ω) = F ∗ dω. Demostración. Basta con considerar ω ∈ Λr (Q) para r arbitrario, y restringirnos a un abierto. Nótese previamente que si f : Q → R entonces F ∗ df = d(f ◦ F ), (9.4) ya que F ∗ df (v) P = df ◦ dF (v) = d(f ◦ F )(v) para todo v ∈ T Q. Por tanto, si ω = 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧ · · · ∧ dq ir entonces P F ∗ ω = P1≤i1 <···<ir ≤n (F ∗ ωi1 ···ir ) F ∗ dq i1 ∧ · · · ∧ F ∗ dq ir = 1≤i1 <···<ir ≤n (ωi1 ···ir ◦ F ) d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F ). En consecuencia, usando de nuevo (9.4) se deduce: P d(F ∗ ω) = 1≤i1 <···<ir ≤n d(ωi1 ···ir ◦ F ) ∧ d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F ) P = F ∗ 1≤i1 <···<ir ≤n dωi1 ···ir ∧ dq i1 ∧ · · · ∧ dq ir = F ∗ dω. 2 La otra antiderivación que también desempeñará un papel importante más adelante es el producto interior. Pero, previamente, conviene tener presente el siguiente ejercicio elemental. Ejercicio. Sea V un espacio vectorial, v ∈ V y ω ∈ Λr (V ). Se define el producto interior de ω según v, iv ω ∈ Λr−1 (V ), como: iv ω(v1 , . . . , vr−1 ) := ω(v, v1 , . . . , vr−1 ) ∀v1 , . . . , vr−1 ∈ V. Pruébese que se verifican: (i) iv : Λr (V ) → Λr−1 (V ) es una aplicación lineal, (ii) iv (ω ∧ ω 0 ) = (iv ω) ∧ ω 0 + (−1)r ω ∧ (iv ω 0 ), 0 Λr (V ). ∀ω ∈ Λr (V ), ω 0 ∈ Definición 9.1.9 Sea Q una variedad diferenciable de dimensión n. Se define el producto interior iX según X ∈ X(Q) como la única antiderivación de grado −1 tal que: (i) iX (f ) = 0 para todo f ∈ C ∞ (Q), (ii) iX (ω) = ω(X) para todo ω ∈ Λ1 (Q). 198 CAPÍTULO 9. TEOREMA DE STOKES Si bien la unicidad viene garantizada por la propiedad (2) de las antiderivaciones, para asegurar su existencia se debe aplicar el ejercicio anterior. Obsérvese que de la definición de producto interior se deduce fácilmente el siguiente resultado. Proposición 9.1.10 Si X, Y ∈ X(Q) y f, h ∈ C ∞ (Q) entonces (1) if X+hY = f iX + h iY (2) iX df = X(f ). 9.1.3. Teorema de Cartan Consideremos un campo de vectores X sobre una variedad diferenciable Q. Lema 9.1.11 El operador definido por DX := iX ◦ d + d ◦ iX : Λ(Q) → Λ(Q) es R-lineal y verifica la regla de Leibniz; esto es, DX (ω ∧ ω 0 ) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ) ∀ω, ω 0 ∈ Λ(Q). (9.5) Demostración. Dado que DX es manifiestamente lineal, basta con de0 mostrar (9.5) para ω ∈ Λr (Q), ω 0 ∈ Λr (Q). Se tiene entonces: iX ◦ d(ω ∧ ω 0 ) = iX (dω ∧ ω 0 + (−1)r ω ∧ dω 0 ) = (iX dω) ∧ ω 0 + (−1)r+1 dω ∧ (iX ω 0 ) +(−1)r (iX ω) ∧ dω 0 + (−1)2r ω ∧ iX dω 0 , (9.6) d ◦ iX (ω ∧ ω 0 ) = d((iX ω) ∧ ω 0 + (−1)r ω ∧ (iX ω 0 )) = (d ◦ iX ω) ∧ ω 0 + (−1)r−1 (iX ω) ∧ dω 0 (9.7) r 0 2r 0 +(−1) dω ∧ (iX ω ) + (−1) ω ∧ (d ◦ iX ω ). Por tanto, sumando (9.6) y (9.7), y simplificando los términos que se cancelan, se obtiene: DX (ω ∧ ω 0 ) = (iX dω) ∧ ω 0 + (d ◦ iX ω) ∧ ω 0 + (−1)2r ω ∧ (iX ◦ dω) +(−1)2r ω ∧ (d ◦ iX ω) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ). 2 Ya estamos listos para demostrar la siguiente relación debida a Cartan. 9.2. VARIEDADES CON BORDE 199 Teorema 9.1.12 (de Cartan) Dado un campo de vectores X ∈ X(Q) se verifica LX = iX ◦ d + d ◦ iX . (9.8) Demostración. Por el Lema 9.1.11 y las propiedades de unicidad de las derivaciones, basta con comprobar la igualdad (9.8) sobre C ∞ (Q) y Λ1 (Q). Ası́, si f ∈ C ∞ (Q) se tiene DX f = iX ◦ df + d ◦ iX f = iX ◦ df = X(f ) = LX (f ). Y, en el caso Y ∈ X(Q) y ω ∈ Λ1 (Q), se tiene DX ω(Y ) = (iX ◦ dω + d ◦ iX ω)(Y ) = dω(X, Y ) + d(ω(X))(Y ) = X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) + Y (ω(X)) = (LX ω)(Y ). como se querı́a. 2 Como consecuencia inmediata del Teorema de Cartan se obtiene el siguiente resultado: Corolario 9.1.13 LX y d conmutan; esto es, d LX ω = LX dω ∀X ∈ X(Q), ∀ω ∈ Λr (Q). Demostración. Aplicando el Teorema de Cartan y la Proposición 9.1.7 dos veces se tiene: dLX ω = d(iX dω + diX ω) = (d ◦ iX )dω = (LX − iX ◦ d)dω = LX dω. 2 Ejercicio. Redemuéstrese este corolario usando que (localmente) LX ω = d ∗ φ ω y d ◦ φ∗t = φ∗t ◦ d, siendo φt el flujo local de X. dt t Ejercicio. Demuéstrese la igualdad i[X,Y ] ω = LX (iY ω) − LY (iX ω). 9.2. Variedades con borde En esta sección vamos a estudiar el concepto de variedad con borde. Para ello, previamente necesitaremos algunas nociones sobre diferenciabilidad en abiertos de Rn+ . 200 CAPÍTULO 9. TEOREMA DE STOKES 9.2.1. Diferenciabilidad en abiertos de Rn+ En adelante usaremos la notación Rn+ = {(x1 , . . . , xn ) ∈ Rn : xn ≥ 0}. Si U es un abierto de Rn+ , escribiremos Int(U ) para denotar al interior de U visto como subconjunto de Rn : Int U = {(x1 , . . . , xn ) ∈ U : xn > 0}. Por otra parte, escribiremos ∂U para denotar su borde: ∂U = U \ Int U = {(x1 , . . . , xn ) ∈ U : xn = 0}. Cabe señalar que, en general, el borde ∂U no coincide con la frontera topológica de U (ni en Rn ni en Rn+ ). Definición 9.2.1 Sean U , V dos abiertos de Rn+ y F : U → V una aplicación. Diremos que F es diferenciable en x ∈ U si existen abiertos U1 y V1 de Rn con x ∈ U1 y F (x) ∈ V1 , y una aplicación diferenciable en x0 , F1 : U1 → V1 , tal que F1 |U1 ∩U = F |U1 ∩U . En este caso, definimos (dF )x0 := (dF1 )x0 : Tx0 Rn ≡ Rn → TF1 (x0 ) Rn ≡ Rn . Es fácil comprobar que esta definición es independiente de la extensión F1 escogida (d(F1 )x0 queda fijada por su valor sobre n vectores tangentes independientes, que pueden tomarse asociados a curvas definidas en ] − ², 0] o [0, ²[ incluidas en RN + ). Análogamente, se definen la diferm enciabilidad cuando V ⊂ R+ , la diferenciabilidad en (todo) U , o el concepto de difeomorfismo. En particular, si F es un difeomorfismo entonces dFx0 es biyectiva. Lema 9.2.2 Sea F : U ⊆ Rn+ → Rn+ una aplicación diferenciable: (1) Si x0 ∈ Int(U ) y F (x0 ) ∈ ∂Rn+ entonces, con las identificaciones naturales, (dF )x0 (Rn ) ⊆ ∂Rn+ . (2) Si V = F (U ) es un abierto de Rn+ y F es un difeomorfismo sobre V entonces induce por restricción los difeomorfismos Int F : IntU → IntV y ∂F : ∂U → ∂V . Demostración. (1) Como F (x0 ) ∈ ∂Rn+ , se tiene para todo v ∈ Tx0 Rn y t ∈ R: 0 ≤ xn (F (x0 + tv)) = xn (F (x0 ) + dFx0 (tv) + o(tv)) = xn (dFx0 (tv)) + xn (o(tv)), (9.9) 9.2. VARIEDADES CON BORDE 201 donde lı́mt→0 o(tv) = 0. Por tanto, multiplicando ambos miembros de t (9.9) por 1/t y tomando lı́mite t → 0+ , se obtiene xn (dFx0 (v)) ≥ 0. (9.10) Ahora bien, dado que (9.10) se verifica para todo v, en particular se verifica para −v. Luego, −xn (dFx0 (v)) = xn (dFx0 (−v)) ≥ 0. Por tanto, xn (dFx0 (v)) = 0 para todo v ∈ Tx0 Rn . Esto es, dFx0 (Rn ) ⊆ ∂Rn+ . (2) Del apartado (1) se sigue que F (Int(U )) ⊂ IntV y F −1 (IntV ) ⊂ IntU . Luego se puede definir IntF : IntU → IntV , que es necesariamente un difeomorfismo. Por ser F biyectiva, también se puede definir ∂F : ∂U → ∂V , que es también biyectiva. Para demostrar que ∂F (definida entre abiertos de Rn−1 ) es un difeomorfismo, nótese que si x0 ∈ ∂U entonces c1 µ i ¶ .. ∂F C . = (9.11) (x ) , 0 ∂xj cn−1 i,j 0 ... 0 c donde F i ≡ xi ◦ F , C = ³ ´ ∂(∂F )i (x0 ) ∂xj i,j y c > 0. Por tanto, todas las derivadas parciales de ∂F existen, son diferenciables y forman una matriz no singular. 2 Nota. Es de remarcar que, si se supone sólo que F sea sólo un homeomorfismo, entonces sigue siendo cierto que se inducen por restricción homeomorfismos Int F : IntU → IntV y ∂F : ∂U → ∂V , si bien la prueba de este resultado (basado en el “Teorema de la Invariancia del Dominio”) es mucho más difı́cil de demostrar. 9.2.2. Concepto de variedad con borde La definición de variedad (diferenciable) con borde resulta completamente análoga a la de variedad diferenciable, con la única salvedad de que las cartas locales toman ahora valores en Rn+ . 202 CAPÍTULO 9. TEOREMA DE STOKES Ası́, una variedad diferenciable con borde es una variedad topológica con borde (un espacio topológico Q, Hausdorff y ANII, localmente homeomorfo a Rn+ ) dotado de una estructura diferenciable, esto es, un atlas maximal cuyos cambios de carta son diferenciables, en el sentido de la subsección anterior. Obsérvese que, por el Lema 9.2.2 (2), el hecho de que, para una carta coordenada (U, ϕ), el punto ϕ(p) pertenezca a ∂Rn+ o no, es independiente de la carta escogida. Ello permite distinguir entre los puntos del interior y del borde de Q: Definición 9.2.3 Sea A = {(Uα , ϕα ) : α ∈ I} un atlas de Q. Se definen los conjuntos interior y borde de Q como: IntQ := ∪α∈I ϕ−1 α (Intϕα (Uα )) ∂Q := ∪α∈I ϕ−1 α (∂ϕα (Uα )), respectivamente. Se comprueba con facilidad que si U es un abierto de Q entonces IntU := U ∩ IntQ y ∂U = U ∩ ∂Q. Es más, del Lema 9.2.2 (2) también se deduce inmediatamente: Proposición 9.2.4 Sea Q una variedad con borde de dimensión n. Entonces: (i) IntQ es una variedad diferenciable (sin borde) de dimensión n. (ii) Si no es vacı́o, el borde ∂Q es una variedad diferenciable (sin borde) de dimensión n − 1, que admite como atlas diferenciable las cartas formadas por la restricción a ∂Q de las (n−1) primeras coordenadas de cada carta de Q. El concepto de aplicación diferenciable entre variedades con borde se mantiene de manera completamente análoga al del caso sin borde. Ello incluye la diferenciabilidad de curvas del tipo γ : [a, b[→ Q ó γ : ]a, b] → Q, que se pueden usar para definir los vectores tangentes (además de mediante derivaciones o por coordenadas). En cualquier caso, el espacio tangente en un punto p ∈ Q resulta completamente análogo al caso sin borde. Nótese que si p ∈ IntQ entonces, de manera natural, Tp Q ≡ Tp (IntQ). Si p ∈ ∂Q entonces Tp Q también es un 9.2. VARIEDADES CON BORDE 203 espacio vectorial de dimensión n, pudiendo identificarse Tp ∂Q como un subespacio vectorial de Tp Q de dimensión n − 1. De hecho, dada un entorno coordenado (U, q 1 , . . . , q n ), para cada p ∈ Q se induce una base de vectores tangentes Pn i en∂ Tp Q, con lo que todo vector tangente en p se escribe como i=1 a ( ∂qi ). Si p ∈ ∂Q, los vectores tangentes con coordenada an = 0 se identifican con vectores tangentes a ∂Q en p, con lo que se puede escribir Tp (∂Q) ⊂ Tp Q. Usando la expresión (9.11), se comprueba directamente: si, en una carta coordenada, la n-ésima coordenada de un vector tangente v a un punto p del borde es mayor que cero (resp. menor que cero), ello también ocurre cualquier otra carta coordenada que contenga a p. Ello permite introducir las siguientes definiciones. Definiciones 9.2.5 Sea p P ∈ ∂Q y v ∈ Tp Q. Para un entorno coordei n nado de p, escribamos v = n−1 i=1 a ∂q i |p + a ∂q n |p . Diremos que: (i) v apunta al interior si an > 0, (ii) v es tangente a ∂Q si an = 0, (iii) v apunta al exterior si an < 0. En particular, ∂qn |p apunta siempre al interior. Ejercicio. Sean α : [0, ²[→ Q, β :] − ², 0] → Q dos curvas diferenciables con α(0) = β(0) = p ∈ ∂Q. Demuéstrese que: (i) α0 (0) no apunta al exterior, (ii) β 0 (0) no apunta al interior. Por último, resulta obvio: Proposición 9.2.6 Sea F : Q → Q0 un difeomorfismo entre dos variedades con borde. Entonces se inducen por restricción los difeomorfismos IntF : IntQ → IntQ0 ∂F : ∂Q → ∂Q0 . 204 9.2.3. CAPÍTULO 9. TEOREMA DE STOKES Orientación en el borde La orientabilidad en una variedad con borde Q se define de modo análogo al caso sin borde, estudiado en el Tema 8 (recuérdese que el espacio tangente en los puntos del borde es de la misma dimensión que la variedad), esto es, mediante: (i) elementos de volumen ; (ii) atlas cuyos cambios de carta tienen jacobiano positivo; (iii) elecciones (diferenciables) de bases ordenadas; (iv) existencia de un generador del C ∞ (Q)-módulo Λn (Q). Además, de (ii) y teniendo en cuenta la expresión (9.11), se comprueba directamente que si Q es orientable entonces ∂Q también lo es. Con más precisión, vamos a mostrar ahora cómo una orientación sobre Q induce una sobre ∂Q. Esencialmente, el problema se soluciona en cada espacio tangente mediante la siguiente definición. Proposición 9.2.7 Sean (V, [ω]) un espacio vectorial orientado de dimensión n, H ⊂ V un hiperplano y V ext ⊂ V \ U una de las dos partes conexas de V \ U . Existe una única orientación que verifica: si B 0 = (e2 , . . . , en ) de H está positivamente orientada (respecto a [ω] y V ext ) si la base BN = (N, e2 , . . . , en ) (o, equivalentemente, (e2 , . . . , en , (−1)n−1 N )) está positivamente orientada en (V, [ω]), donde N es cualquier vector de V ext . Además, esta orientación coincide con la definida por iN ω |H , para cualquier N ∈ V ext . Llamaremos a esta orientación sobre H la orientación inducida por ext V y [ω]. Demostración. Basta con demostrar que la orientación ası́ definida por B 0 en H resulta independiente tanto B 0 como del vector N escogidos. Ası́ si B̄ 0 es otra base de H y N̄ ∈ V ext , la matriz de cambio de base verifica: a1 0 ... 0 a2 M (IdV , BN ← B̄N̄ ) = , con a1 > 0. .. 0 0 . M (IdV , B ← B̄ ) an 9.2. VARIEDADES CON BORDE 205 Esto es, la orientación de BN y BN̄ coincide si y sólo si coincide la de B 0 y B̄ 0 , como se querı́a. Por último, iN ω |H (e02 , . . . , e0n ) = ω(N, e02 , . . . , e0n ) > 0, por lo que la orientación inducida en H coincide con la definida por iN ω|h . 2 En una variedad con borde orientada (Q, [ω]), podemos repetir en el espacio tangente de cada p ∈ ∂Q la construcción anterior, de modo que induzcamos una orientación en ∂Q. Ası́, tomamos V = Tp Q, H = Tp ∂Q ⊂ Tp Q y consideramos sobre Tp ∂Q la orientación inducida por [ωp ] y V ext = {N ∈ Tp Q : N apunta al exterior}. Obsérvese que en cualquier carta (U, q 1 , . . . , q n ) coordenada alrededor de p, el campo −∂/∂q n apunta al exterior, por lo que la orientación inducida sobre ∂Q ∩ U coincide con la restricción de i−∂qn ω (lo que demuestra la diferenciabilidad de la orientación). En resumen: Definición 9.2.8 Sea (Q, [ω]) una n−variedad con borde orientada de dimensión n. Se define la orientación inducida sobre ∂Q tomando, para cada p = ∂Q cualquier vector tangente Np que apunte al exterior (p. ej., Np = −∂/∂q n |p ), y definiendo la orientación equivalentemente como: (1.) La definida por la clase de equivalencia de iN ωp |Tp ∂Q (2.) Aquélla para la cual una base B 0 = (e2 , . . . , en ) ⊂ Tp (∂Q) está positivamente orientada si y sólo si (N, e2 , . . . , en ) está positivamente orientada en Tp Q. Ejercicio. Identificando Rn−1 con el hiperplano ∂Rn+ de Rn , compruébese que la orientación en ∂Rn+ inducida de la usual de Rn , coincide con la usual de Rn−1 si y sólo si n es par. Por otra parte, no debe olvidarse que la orientación en Q no sólo induce una orientación en su borde sino también, trivialmente, una en Int Q. Observaciones finales: (1) Los conceptos de partición de la unidad y métrica (no degenerada) se traspasan directamente a variedades con borde3 . 3 Para ésta y otras propiedades puede resultar útil, dada una variedad con borde Q, construir su “variedad doble” Q̂. Ésta se define como dos copias de Q con los 206 CAPÍTULO 9. TEOREMA DE STOKES (2) Si Q es una variedad con borde entonces trivialmente ∂Q tiene medida nula. Por tanto, todo sistema coordenado c.p.d. de IntQ también lo es de Q, y toda variedad con borde admite un sistema coordenado c.p.d. (3) Como consecuencia, fijada una orientación en Q (resp. una métrica no degenerada en Q) se puede definir la integración de una n-forma (resp. una función) de modo análogo al caso sin borde (y obteniéndose que esta integral coincide con la integral sobre Int Q). (4) Todo lo que se ha visto en esta sección se traspasa sin dificultad a las variedades con borde anguloso (o a trozos); esto es, variedades topológicas que son “localmente difeomorfas” a abiertos de Rnm = {(x1 , . . . , xn ) ∈ Rn : xm ≥ 0, . . . , xn ≥ 0}. Es de señalar, empero, que éste es un concepto que, a diferencia del de variedad con borde, sólo tiene sentido para variedades diferenciables, y no para topológicas. Ejercicio. Si Q es una variedad (orientable o no) con borde, pruébese que existe un campo diferenciable N que apunta al exterior y que está definido sobre todo ∂Q. 9.3. Teorema de Stokes En esta sección damos la versión general del Teorema de Stokes que, esencialmente, se puede ver como una generalización a variedades de dimensión arbitraria de la Regla de Barrow clásica. Por la importancia de este resultado, rebajaremos los requisitos de diferenciabilidad que habitualmente hemos usado. puntos análogos de los bordes identificados. Ası́, IntQ se puede visualizar como un abierto de Q̂, cuya frontera topológica coincide con la hipersuperficie regular ∂Q. Un recubrimiento abierto de Q induce naturalmente uno de Q̂, y una partición de la unidad subordinada a este recubrimiento de Q̂ induce por restricción una del recubrimiento original. No obstante, debe tenerse presente que un campo tensorial (v.gr., una métrica riemanniana) no tiene por qué poderse extender de manera diferenciable de Q a la variedad doble. 9.3. TEOREMA DE STOKES 207 Teorema 9.3.1 (de Stokes): Sea +Q una variedad con borde orientada de dimensión n ≥ 2, i : ∂Q → Q la inclusión del borde en la variedad, y ω una n − 1 forma continua sobre Q que sea diferenciable C 1 en IntQ. Si el soporte sop ω es compacto, entonces Z Z ∗ iω= d ω, +∂Q +Q donde +∂Q denota al borde de Q con la orientación inducida por +Q. R En particular, si Q es una variedad sin borde entonces +Q d ω = 0. Demostración. Sea {(Uα , ϕα )}α∈I un recubrimiento por entornos coordenados de Q y {ρi }i∈N una partición de la unidad subordinada, sop ρP i ⊂ Ui , i ∈ N. Puesto que sop ω es compacto, podemos suponer ω = ki=1 ρi ω. En particular, Z k Z X d(ρi ω). dω = +Q +Q i=1 De la linealidad de esta igualdad, basta con probar el resultado para cada uno de los k sumandos. Esto es, sin perdida de generalidad, podemos suponer sop ω incluido en un entorno coordenado (U, ϕ). Podemos asumir que ϕ : U → ϕ(U ) ⊂ Rn+ está positivamente orientada. Además, se verifica la igualdad i ◦ ∂ϕ−1 = ϕ−1 ◦ ĩ, siendo ĩ : ∂(ϕ(U )) ⊂ ∂Rn+ ,→ ϕ(U ) ⊂ Rn+ . En consecuencia, Z Z Z −1∗ dω = ϕ dω = d(ϕ−1∗ ω) n n +Q +R+ +R+ y Z Z i∗ ω = +∂Q Z = Z +∂ R −1 ∗ n + +∂ R (i ◦ ∂ϕ ) ω = n + (∂ϕ−1 )∗ i∗ ω −1 n + +∂ R (ϕ Z ∗ ◦ ĩ) ω = n + +∂ R ĩ∗ (ϕ−1∗ ω). Luego no resulta restrictivo suponer que ω es una (n − 1)-forma sobre Rn+ , por lo que simplificaremos (ϕ−1∗ ω) por ω. Podemos escribir entonces (Proposición 9.1.6): ω= n X ci ∧ · · · ∧ dxn . (−1)i−1 ωi dx1 ∧ · · · ∧ dx i=1 208 CAPÍTULO 9. TEOREMA DE STOKES En este caso, P i dω = ni=1 ∂ω dx1 ∧ · · · ∧ dxi ∧ · · · ∧ dxn ∂xi i∗ ω = (−1)n−1 ωn (x1 , . . . , xn−1 , 0) dx1 ∧ · · · ∧ dxn−1 |∂ Rn . + Integrando: Z n + +R = dω = n + R µZ i=1 ∂xi dx1 · · · dxn ¶ ∂ωi i ci · · · dxn dx dx1 · · · dx i n−2 R ×R+ −∞ ∂x ¶ µZ ∞ Z ∂ωn n + n−1 dx dx1 · · · dxn−1 . n ∂x 0 R n−1 Z X i=1 à n ! X ∂ωi Z +∞ Ahora por la compacidad de sopω, la primera sumatoria es nula R bi ∂ωbien, i i ( −ai ∂xi dx = 0 para ai , bi suficientemente grande). n último sumando serı́a cero, esto es, R Si sop ω ∩ ∂R+ = ∅ también el n n dω = 0. Pero si sop ω ∩ ∂R + 6= ∅: +R + ¡R ∞ ∂ωn n ¢ 1 R R ∂ωn n n−1 dω = = dx dx · · · dxn−1 n 0 ∂xn +R RR+ ∂x R = − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 . R n + Pero esta integral coincide con, R R n i∗ ω n (−1)n−1 ω (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 = +∂ R+ +∂ R+ Rn n n−1 1 n−1 n−1 ωn (x , . . . , x = (−1) (−1) , 0) dx1 · · · dxn−1 R R = − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 . como se querı́a. 2 Observaciones: (1) El Teorema de Stokes también se verifica para una variedad sin borde de dimensión 1, El caso unidimensional con borde, esto es, esencialmente, cuando Q = [a, b], también se puede deducir como un caso lı́mite, reobteniéndose ası́ la Regla de Barrow. En efecto, para Q = [a, b] basta con definir, para cada función (0forma) f sobre Q, su integral en un punto x del borde de Q 9.4. PRIMERAS APLICACIONES 209 como f (x). Aplicando estrictamente la definición de orientación inducida, ésta será la usual en b y la opuesta en a, esto es: Z Z Z Z Z f= f+ f = − f + f = −f (a) + f (b). +∂Q +{a} +{b} a b Mientras que, como df = f 0 dx: Z Z b df = +Q f 0 dx. a (2) Cabe señalar que el Teorema de Stokes también se verifica para una variedad con borde anguloso, adaptándose la prueba de manera sencilla. 9.4. Primeras aplicaciones Veamos a continuación algunas consecuencias inmediatas del Teorema de Stokes. 9.4.1. Fórmula de Green-Riemann en el plano Aplicando el Teorema de Stokes a una 1-forma diferencial general ω = P dx + Qdy sobre R2 , se deduce el siguiente resultado: Teorema 9.4.1 Sea D un abierto de R2 tal que su cierre D sea una variedad con borde, y sean P, Q dos funciones diferenciables en D y continuas en D, con soporte compacto. Entonces ¶ Z Z µ ∂Q ∂P − (P dx + Qdy) = dx ∧ dy. ∂x ∂y +∂D +D Obsérvese que el miembro izquierdo no es más que una integral ordinaria de una función (con soporte compacto en D) sobre D. El miembro derecho se puede escribir como la circulación de la 1-forma ω sobre una curva γ que parametrice (cada parte conexa de) +∂D “en sentido positivo” (esto es, de modo que al recorrerla “D quede a la izquierda”). Puesto que el soporte es compacto, no supone pérdida de generalidad 210 CAPÍTULO 9. TEOREMA DE STOKES considerar que el dominio de la curva también lo es, γ : [a, b] → R2 . La circulación se reescribe entonces como: Z Z X 2 2 Z b X dxi ∗ ∗ i γ ω= (ωi ◦ γ)γ (dx ) = (ωi ◦ γ) dt dt [a,b] [a,b] i=1 i=1 a Z b dx dy + Q(x(t), y(t)) )dt. dt dt a Resulta especialmente interesante el caso en el que +∂D puede parametrizarse con una curva de Jordan diferenciable, esto es, una curva diferenciable γ : [a, b] → R2 , cerrada γ(a) = γ(b), cuya restricción a [a, b[ es inyectiva, y tal que además γ 0 (a) = γ 0 (b).4 En particular, obsérvese que para calcular el área D basta con tomar ω = −ydx o bien ω = xdy en el Teorema 9.4.1, obteniéndose: = (P (x(t), y(t)) Corolario 9.4.2 El área de la región D encerrada por la curva de Jordan γ : [a, b] → R2 , se puede calcular como Z b Z b Z 1 b 0 0 x(t)y (t)dt = − y(t)x (t)dt = (x(t)y 0 (t) − y(t)x0 (t))dt, 2 a a a (9.12) siendo γ(t) = (x(t), y(t)). Ejercicio. Aplı́quese (9.12) para calcular el área de la superficie de la elipse. 9.4.2. Teorema integral de Cauchy Consideremos de nuevo un abierto D del plano complejo C(≡ R2 ) tal que su clausura D sea una variedad con borde, y sea f : D → C, f (x, y) = f1 (x, y) + i f2 (x, y) una función diferenciable en D y continua en D, con soporte compacto. Se verifica entonces el siguiente resultado: 4 Esta igualdad de los vectores tangentes en los extremos no es necesaria, pues se puede aplicar el Teorema de Stokes para variedades con borde anguloso; más aún, por este motivo también basta con que γ sea diferenciable a trozos en [a, b]. El celebrado “Teorema de la curva de Jordan” permite afirmar que toda curva diferenciable de Jordan es el borde parametrizado de un abierto conexo D cuya adherencia es una variedad con borde compacta; recı́procamente, el borde de todo tal abierto es parametrizable por una curva diferenciable de Jordan. 9.4. PRIMERAS APLICACIONES 211 Teorema 9.4.3 (integral de Cauchy) Si f es holomorfa entonces Z Z Z f (z)dz := (f1 dx − f2 dy) + i (f1 dy + f2 dx) ∂D ∂D ∂D es nula. Demostración. Obsérvese que el integrando es, al menos formalmente, la “1-forma compleja”: ω(z) := f (z)dz = (f1 + if2 )(z) (dx + idy) = (f1 dx − f2 dy) + i(f2 dx + f1 dy) = ω1 + iω2 , siendo ω1 = f1 dx − f2 dy ω2 = f2 dx + f1 dy. dos 1-formas diferenciales ordinarias sobre R2 . De las ecuaciones de Cauchy-Riemann para f es directo comprobar que dωi = 0, i = 1, 2. En consecuencia, aplicando el Teorema de Stokes a las 1-formas ωi , i = 1, 2, se obtiene: R R R (f dx − f dy) = ω = 1 2 1 R+∂D R+∂D R+D dω1 = 0 (f dy + f dx) = ω = dω2 = 0, 2 +∂D 1 +∂D 2 +D lo que concluye la prueba. 2 9.4.3. Teorema clásico de Stokes Recordemos que habı́amos definido el rotacional rot X de un campo vectorial X sobre una variedad riemanniana (Q, g) como la 2-forma: rotX = d(X [ ). Por tanto, se deduce ahora directamente la siguiente versión intrı́nseca del Teorema de Stokes: Teorema 9.4.4 (Stokes clásico intrı́nseco.) Sea (+Q, g) una variedad riemanniana orientada bidimensional con borde. Si X ∈ X(Q) tiene soporte compacto entonces Z Z rot X = X [. (9.13) +Q +∂Q 212 CAPÍTULO 9. TEOREMA DE STOKES Obsérvese que el miembro derecho de la igualdad no es más que la circulación de X [ a lo largo del borde, por lo que si éste se reparametriza con una curva de Jordan γ : [a, b] → Q podemos escribir: Z Z b [ X = +∂Q g(γ 0 , X)dt. (9.14) a Supongamos ahora que, además, Q es una superficie regular S de R3 o, con más generalidad, de cualquier variedad orientada de dimensión 3, (+Q̃, h·, ·i) y g la métrica h·, ·i restringida a Q. Observemos que la orientación de S determina un campo vectorial normal unitario N , mediante N = E1 ×E2 , donde (E1 , E2 ) es cualquier base ortonormal local de campos positivamente orientados sobre S; esto es, N queda caracterizado porque (N, E1 , E2 ) es en cada punto una base ortonormal positivamente orientada en R3 (obsérvese que, recı́procamente, la elección de un vector normal unitario selecciona la orientación de S). Usando en este ambiente la definición del rotacional como un campo vectorial (véase el Apéndice), se tiene: hRot X, Y × Zi = rot X(Y, Z) ∀Y, Z ∈ X(Q). En consecuencia (compruébese aplicando ambos miembros sobre (E1 , E2 )): rot X = hRot X, N iµg (9.15) donde µg es el elemento de volumen métrico orientado sobre S. Por tanto, teniendo en cuenta (9.14) y (9.15), el Teorema Clásico de Stokes se reescribe, para superficies regulares de R3 o, en general, (+Q̃, h·, ·i): Z Z b hRot X, N i = (S,µg ) g(γ 0 , X)dt, (9.16) a donde la curva de Jordan γ que parametriza el borde ∂S se recorre de modo que, en todo punto, la base ordenada formada por el normal exterior a S, la velocidad γ 0 y el vector normal a la superficie N estén positivamente orientados en R3 (“un sacacorchos que girara en el sentido de γ avanzarı́a en el sentido de N ”). 9.4. PRIMERAS APLICACIONES 213 Por último, es de remarcar que la igualdad anterior no sólo es válida cuando el campo X ∈ X(Q) (el cual, para superficies embebidas -como la regular S-, siempre se puede obtener por restricción de otro definido en un entorno de Q en Q̃), sino también para un campo arbitrario X̃ ∈ X(Q̃) que, sobre los puntos de S, no sea necesariamente tangente a S. Para comprobarlo, escribamos (cada entorno de) S como imagen inversa de un valor regular de una función F , siendo S = Sc=0 , Sc = F −1 (c). Podemos considerar N como un campo vectorial unitario definido en un entorno de S y que sea ortogonal a cada superficie Sc (de hecho, componiendo F con una función apropiada ψ para normalizar, se tiene N =grad(ψ ◦ F )), y escribir X̃ = X + hX̃, N iN , donde X es tangente a cada superficie Sc . Entonces claramente hγ 0 , X̃i = g(γ 0 , X), y, de rotX̃ = rotX + d(hγ 0 , X̃i)N se sigue: hRotX̃, N i = hRotX, N i. Por tanto, usando (9.16) se tiene, en resumen: Teorema 9.4.5 (Stokes clásico extrı́nseco). Sea S una superficie regular de R3 (o de cualquier 3-variedad riemanniana orientada), orientada por un vector unitario normal N , y eventualmente con borde, cada una de sus partes conexas parametrizada con una curva γi : [ai , bi ] → ∂S,de modo que γi0 pertenezca en cada punto a la orientación inducida. Para cada campo X̃ ∈ X(Q) se considera la función flujo del rotacional a través de S: hRotX̃, N i : S → R. Si la intersección del soporte de X̃ y S es compacta, se tiene entonces: Z hRot X̃, N i = (S,µg ) XZ i bi ai hγi0 , X̃idt, (9.17) (donde la sumatoria se extiende a lo más a un número finito de sumandos). 214 9.5. CAPÍTULO 9. TEOREMA DE STOKES Teorema de la Divergencia Fijado un elemento de volumen Ω0 , la derivada de Lie respecto a un campo vectorial LX Ω0 da una medida de cómo el elemento de volumen varı́a con el flujo de X. Esta medida puede hacerse cuantitativa, pues LX Ω0 es una n−forma diferencial y, por tanto, expresable como una función por el propio Ω0 . Definición 9.5.1 Sea Ω0 un elemento de volumen sobre la variedad Q. La divergencia del campo vectorial X ∈ X(Q) se define como la función divΩ0 X ∈ C ∞ (Q) que verifica: LX Ω0 = divΩ0 X · Ω0 . En una variedad semi-riemanniana orientada, divX se refiere a la divergencia obtenida con respecto al elemento de volumen métrico orientado. Más aún, al ser claramente independiente de la orientación escogida, divX es definible también para variedades semi-riemannianas no orientables (véase el Tema ?? para una definición directa -Definición ??). Ejercicio. Obténganse expresiones en coordenadas cartesianas, cilı́ndricas y esféricas, para la divergencia de campos vectoriales sobre R3 con respecto al elemento de volumen usual. El siguiente resultado es una consecuencia especialmente relevante del Teorema de Stokes. Teorema 9.5.2 (de la Divergencia). Sean (+Q, g) una variedad riemanniana con borde orientada, y X un campo vectorial sobre Q con soporte compacto. Entonces Z Z divX µg = g(X, N ) µi∗ g , (9.18) +Q +∂Q donde N es el campo normal que apunta al exterior, y µi∗ g denota el elemento de volumen métrico iN µg sobre ∂Q para la orientación inducida. Demostración. Mediante una cálculo directo y usando el Teorema de Cartan se tiene (div X)µg = LX µg = iX dµg + d iX µg = d iX µg , (9.19) 9.5. TEOREMA DE LA DIVERGENCIA 215 la última igualdad por ser dµg una (n + 1)-forma diferencial. Por otra parte, si X ∈ X(Q) y v2 , . . . , vn ∈ Tp (∂Q) entonces (iX µg )(v2 , . . . , vn ) = µg (X, v2 , . . . , vn ) = g(X, N ) µg (N, v2 , . . . , vn ) = g(X, N ) iN µg (v2 , . . . , vn ) = g(X, N ) µi∗ g (v2 , . . . , vn ). Por tanto, iX µg = g(X, N )µi∗ g . (9.20) Teniendo en cuenta que iX µg tiene soporte compacto, la igualdad (9.18) se deduce de aplicar directamente a esta (n − 1) forma el Teorema de Stokes, usando (9.19) y (9.20). 2 Una consecuencia conocida de este teorema es la fórmula de GaussOstogradski, que se obtiene cuando Q es el cierre de un abierto acotado D de Rn , y se considera la métrica usual. Esto es, Z X Z n ∂X i = hX, N i, i D i=1 ∂x ∂D donde D̄ es compacto. Observaciones: (1) La fórmula de Gauss-Ostogradski (y, en general, el Teorema de la Divergencia) admite una interpretación muy intuitiva en términos de teorı́a de fluidos. En efecto, si D̄ es una región compacta de R3 y X el campo de velocidades de un fluido, el miembro derecho (flujo de X a través de ∂D) representa la cantidad de fluido que sale por ∂D por unidad de tiempo. Si el fluido es incompresible (divX ≡ 0), entonces el miembro izquierdo es nulo “la cantidad de fluido que entra en cualquier región compacta D por unidad de tiempo es igual a la que sale”. Si p ∈ Q es un manantial, div Xp > 0 (resp. sumidero, div Xp < 0) entonces en cualquier bola compacta B alrededor de p lo suficientemente pequeña, el R signo de div X se mantiene constante y hX, N i > 0 (resp. ∂B R hX, N i < 0) representa la cantidad de fluido que mana de ∂B B al exterior (resp. que se suma al de B desde el exterior) por unidad de tiempo. (2) Puesto que tanto la divergencia de X, como la integración de funciones o el concepto de normal exterior son independientes de 216 CAPÍTULO 9. TEOREMA DE STOKES la orientación escogida, podemos escribir la igualdad Z Z divX = g(X, N ) (Q,g) (9.21) (∂Q,i∗ g) incluso cuando (Q, g) no sea orientable (en este caso, (9.21) se puede probar pasando al recubridor de dos hojas orientable). (3) También se puede dar una versión del Teorema de la Divergencia para un elemento de volumen arbitrario. En efecto, sin más que usar el Teorema de Cartan y el de Stokes se tiene: Z Z divΩ0 X = iX Ω0 . (Q,Ω0 ) 9.6. +∂Q Algunas aplicaciones del T. de la Divergencia A lo largo de esta sección, consideraremos Rn dotado de sus elementos geométricos usuales, y Q = D̄ será una n−variedad con borde compacta obtenida como la adherencia de un abierto D. Denotaremos al borde por5 S = ∂Q, y a su campo normal exterior por N . Dado p ∈ Rn , denotaremos p̄ al propio p visto como vector tangente en Tp Rn . Cálculo de volumenes de Rn : P Consideremos en Rn el campo vectorial X = ni=1 xi ∂/∂xi . Un cálculo directo muestra: div X = n. Por tanto, el Teorema de la Divergencia proporciona la siguiente fórmula para el volumen de D (y Q): Z 1 vol(D) = hp, Np i. n S Caracterización de superficies que contienen al origen de R3 : 5 Un resultado conocido afirma que si S es una hipersuperficie conexa compacta n n embebida en R , entonces R \S tiene dos partes conexas, una de ellas (la “interior”) acotada D, de modo que Q = D̄ es una variedad con borde en las condiciones de arriba. 9.6. APLICACIONES DEL T. DE LA DIVERGENCIA 217 Consideremos en R3 \{0} con la métrica inducida por la usual, el campo de vectores Xp = 1 p = 2 (x∂x + y∂y + z∂z ). 3 2 kpk (x + y + z 2 )3/2 Un cálculo directo muestra que divX = 0. En Rconsecuencia, aplicando el Teorema de la Divergencia obtenemos que ∂B(0,r) g(X, N ) es independiente del radio r escogido, donde B(0, r) es la bola de centro 0 y radio r, y N apunta al exterior de la bola. Computando el valor de esta integral para r = 1 se obtiene inmediatamente 4π, que coincide con el valor del área de la superficie ∂B(0, 1) = S 2 (1). Ası́, si S es cualquier superficie compacta embebida en R3 \ {0} y D es su dominio interior en R3 , se tiene, de nuevo por el Teorema de la Divergencia, ½ Z 0 si (0, 0, 0) 6∈ D, g(X, N ) = 4π si (0, 0, 0) ∈ D, S donde N apunta al exterior de D. Por tanto, el valor de esta integral caracteriza las superficies que contienen al origen de R3 . Ley de Gauss del campo electromagnético: Esta ley es sólo una reformulación del resultado anterior. Se define el campo eléctrico E producido en un punto p ∈ R3 por una carga puntual de magnitud q situada en el origen como E := q p , 4π²0 kpk3 donde ²0 > 0 es una constante (dieléctrica del vacı́o). Salvo una constante, E coincide con el campo X del apartado anterior. Por tanto, tomando una superficie S compacta y embebida en R3 que contenga al origen, se sigue la siguiente igualdad conocida como Ley de Gauss: Z q g(E, N ) = . ²0 S Nota. Cabe señalar que la Ley de Gauss lleva naturalmente a postular la igualdad (una de las Leyes de Maxwell) div E = ρ , ²0 ρ densidad de carga. 218 CAPÍTULO 9. TEOREMA DE STOKES Ángulo solido: Llamamos ángulo sólido a la 2-forma en R3 \ {0} definida por: Ωsol = ip/|p|3 Ω0 = x dy ∧ dz + y dz ∧ dx + z dx ∧ dy , (x2 + y 2 + z 2 )3/2 donde Ω0 = dx ∧ dy ∧ dz es el elemento de volumen métrico orientado usual. Obsérvese entonces que Ωsol (vp , wp ) = 1 1 Ω0 (p, vp , wp ) = 3 hp, vp × wp i 3 |p| |p| para todo p ∈ R3 − {0} y todo vp , wp ∈ Tp R3 . Un cálculo directo permite demostrar: dΩsol = 0. Por otra parte, en coordenadas esféricas el ángulo sólido admite la siguiente expresión sencilla: Ωsol = i 12 ∂r Ω0 = senθ dθ ∧ dφ. r Estudiemos a continuación la relación del ángulo sólido con la superficie de las esferas. Consideremos la esfera S 2 (r), centrada en el origen de radio r > 0. Una base ortonormal positivamente orientada de Tp R3 , p ∈ S 2 (r), es µ ¶ ∂ 1 ∂ 1 ∂ BR 3 = , , ∂r r ∂θ rsenθ ∂φ (válida siempre que θ 6= nπ, n ∈ Z). En consecuencia, una base ortonormal de Tp S 2 (r), positivamente orientada con la orientación inducida sobre S 2 (r) como borde de B(0, r), es ¶ µ 1 ∂ 1 ∂ , , BS 2 (r) = r ∂θ rsenθ ∂φ cuya dual es BS∗ 2 (r) = (r dθ, rsenθ dφ). Ası́, la métrica inducida en S 2 (r) es h, i |S 2 (r) = r2 (dθ2 + sen2 θdφ2 ), 9.6. APLICACIONES DEL T. DE LA DIVERGENCIA 219 y el elemento de volumen positivamente orientado µ0 sobre S 2 (r), también calculable inmediatamente de BS∗ 2 (r) : µ0 = r2 senθ dθ ∧ dφ = r2 Ωsol en T S 2 (r). Esta última igualdad permite caracterizar a Ωsol mediante: ½ Ωsol (vp , wp ) = r12 µ0 (vp , wp ) si vp , wp ∈ Tp S 2 (r) Ωsol (vp , ∂r |p ) = 0 para todo vp ∈ Tp R3 . (9.22) Estamos en condiciones de establecer la siguiente definición: Definición 9.6.1 Sea S una superficie con borde compacta y orientada de R3 − {0}. Se define el ángulo sólido subtendido por +S desde el origen como: Z i∗ Ωsol , ^sol (+S) = +S 3 donde i : S ,→ R − {0} es la inclusión. Justificación. Supongamos que: (a) la superficie S ⊂ R3 \ {0} es tal que cada semirrecta r que parte del origen corta a S transversalmente a lo sumo una vez y, (b) en este caso, si r = {λv0 : λ > 0} corta a S en p0 , la orientación inducida de la usual de R3 por el vector v0 (visto como vector transverso a Tp0 S en Tp0 R3 ) coincide con la orientación positiva de Tp0 S. Sea C(S) la unión de las semirrectas que cortan a S. Desde el punto de vista clásico, se define el ángulo sólido subtendido por S como el área de S 2 (1) ∩ C(S). De la caracterización (9.22) se deduce entonces: Z 2 Área(S (1) ∩ C(S)) = i∗ Ωsol . +S En la Definición 9.6.1 se incluye este caso, y cuando la orientación inducida por v0 es negativa, el área se computa de manera negativa. La caracterización de las superficies compactas que incluyen al origen puede reformularse ahora como: Teorema 9.6.2 Sea S ⊂ R3 \ {0} una superficie compacta sin borde, que encierra un abierto D de R3 , y orientada con la orientación inducida por D. Entonces ½ 0 si (0, 0, 0) 6∈ D ^sol (S) = 4π si (0, 0, 0) ∈ D. 220 CAPÍTULO 9. TEOREMA DE STOKES Teorema de Arquı́medes: Suponiendo a R3 dotada con la métrica usual, consideremos la función presión P : R3 → R definida por: ½ −cz si z ≤ 0 (x, y, z) 7→ 0 si z > 0, siendo la constante c > 0 la densidad por atracción gravitatoria que, en términos de magnitudes fı́sicas tı́picas, es igual a c = ρ g0 , siendo ρ la “densidad (constante) de masa del fluido” y g0 la aceleración gravitatoria (digamos g0 = 90 8 m/s2 ). Supongamos que el “sólido rı́gido” Q = D̄ está incluido en la región z < 0. Para cada q ∈ S = ∂Q se define la fuerza ejercida por el fluido en q como Fq = −P Nq = czNq , siendo Nq el vector unitario normal exterior. Consideremos el campo ∂ ∂ ∂ vectorial F = F x ∂x + F y ∂y + F z ∂z ası́ definido sobre S, y definamos el empuje del fluido sobre Q como la terna, E = (E x , E y , E z ): Z Z Z x x y y z E = F , E = F , E = F z. S S S Aplicando directamente el Teorema de la Divergencia, se obtiene el siguiente resultado clásico. Teorema 9.6.3 (de Arquı́medes). Con la notación introducida E x = E y = 0, E z = c vol(Q) = ρg0 vol(Q). Esto es, todo cuerpo sólido (representado por la variedad compacta con borde Q) sumergido en un fluido (subespacio z < 0) experimenta un empuje vertical hacia arriba E igual al peso del fluido que desaloja. Demostración. Sea Z = cz ∂/∂z. Entonces div Z = c y F z = cz· hN, ∂/∂zi = hN, Zi. Luego, por el Teorema de la Divergencia, Z Z z E = hZ, N i = c = c vol(Q). S D Si X = cz ∂/∂x, Y = cz ∂/∂y entonces div X = div Y = 0 y F x = hN, Xi, F y = hN, Y i. Luego, por el Teorema de la Divergencia, Z x E = div X = 0, Q y y análogamente E = 0. 2 9.7. FÓRMULAS DE GREEN 9.7. 221 Fórmulas de Green Para cualquier variedad semi-riemanniana, se define el laplaciano de una función f como: ∆f = div(gradf ). Sea Q una variedad riemanniana con borde, y N un campo normal unitario sobre ∂Q que apunta al exterior. Primera Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h) es compacto, entonces Z Z Z f g(∇h, N )µi∗ g . g(∇f, ∇h)µg = f ∆h µg + ∂Q Q Q En particular, si ∂Q = ∅ entonces Z Z f ∆h µg = − g(∇f, ∇h)µg . Q Q Demostración. Aplı́quese el Teorema de la Divergencia teniendo presente la igualdad div(f ∇h) = f div∇h + g(∇f, ∇h). 2 Obsérvese que si f ≡ 1 entonces se reobtiene el Teorema de la Divergencia para ∇h. Segunda Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h) y sop(h∇f ) son compactos, entonces Z Z Z f ∆h µg − h∆f µg = g(f ∇h − h∇f, N )µi∗ g . Q Q ∂Q En particular, si ∂Q = ∅ entonces Z Z f ∆h µg = h∆f µg . Q Q Demostración. Escrı́base también la Primera Fórmula de Green intercambiando los papeles de f y h, y réstense las dos expresiones. 2 Las fórmulas anteriores se mantienen válidas para métricas no degeneradas (siempre que i∗ g también sea una métrica no degenerada sobre ∂Q, al menos c.p.d.) Sin embargo, el siguiente resultado fundamental usa fuertemente el carácter definido de la métrica. 222 CAPÍTULO 9. TEOREMA DE STOKES Teorema 9.7.1 Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde. Si h ∈ C ∞ (Q) es tal que ∆h ≥ 0 ó ∆h ≤ 0 sobre todo Q, entonces h es constante. Demostración. Consideremos el caso ∆h ≥ 0 (si ∆h ≤ 0 úsese que ∆(−h) = −∆h ≥ 0). Puesto que Q es compacta, podemos escoger c ≥ 0 (c ∈ R) tal que hc = h + c ≥ 0; obsérvese que ∇hc = ∇h y ∆hc = ∆h. Tomando f = hc en la Primera Fórmula de Green se tiene Z Z hc ∆h µg + g(∇h, ∇h) = 0. Q Q Como al ser g riemanniana los integrandos de ambos sumandos son no negativos, éstos deben anularse. Por tanto, g(∇h, ∇h) ≡ 0, y ∇h ≡ 0. 2 Nota. A una función h con ∆h ≡ 0 se le llama armónica, si ∆h ≥ 0 subarmónica, y si ∆h ≤ 0 superarmónica. Por el teorema anterior, las únicas funciones subarmónicas o superarmónicas que admite la variedad riemanniana compacta Q son las constantes. Consecuencias: Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde: R (1) Si definimos hf, hi := Q f h µg , obtenemos un producto escalar sobre C ∞ (Q). Por la Segunda Fórmula de Green, el operador ∆ : C ∞ (Q) → C ∞ (Q) es autoadjunto para h, i. Además, por el Corolario 9.7.1, Nucl∆ ≡ R(≡ funciones constantes), y una R condición necesaria para que f ∈ Im∆ es que Q f µg = 0. De hecho, mirando la igualdad ∆u = f como una ecuación donde f es conocida y u es la incógnita, la anterior es una condición necesaria para la existencia de soluciones (que puede demostrarse es también suficiente). (2) Consideremos los autovalores del laplaciano, esto es, los escalares µ ∈ R tales que ∆u = µ u para alguna función no constante u ∈ C ∞ (Q). Multiplicando esta igualdad por u y aplicando la Primera Fórmula de Green, se tiene Z Z 2 µ u µg + g(∇u, ∇u) = 0. Q Q 9.8. APÉNDICE: PRODUCTO VECTORIAL 223 Pero la primera y segunda integral son no negativas (y claramente distintas de cero). Por tanto, necesariamente µ < 0. De hecho, es posible demostrar que estos autovalores forman una sucesión divergente a −∞. 9.8. Apéndice: producto vectorial y rotacional 9.8.1. Isomorfismos especiales en (V 3 (R), µ0 ). Sea V (R) un n−espacio vectorial con un elemento de volumen fijado µ0 . Entonces, existe un isomorfismo entre V (R) y Λn−1 (V ), canónicamente asociado a µ0 ; concretamente, el isomorfismo que a cada vector v le hace corresponder el tensor antisimétrico iv µ0 Ası́, para n = 3 podemos escribir este isomorfismo como V 3 → Λ2 (V 3 ) v 7→ iv µ0 = µ0 (v, ·, ·). (9.23) Por otra parte, en dimension 3, a la aplicación V3×V3×V3 →R (u, v, w) 7→ µ0 (u, v, w), (9.24) la denominaremos “producto mixto” Si fijamos los vectores (u, v), la aplicación V → R, w 7→ µ0 (u, v, w), es una forma lineal. Cuando µ0 es el elemento de volumen métrico orientado para un producto escalar, h·, ·i, al sostenido de esta forma lineal se le llama, producto vectorial de u y v, que se denota por u × v. Esto es, se define u × v = (iv (iu µ0 ))] , con lo que el producto vectorial queda caracterizado por la igualdad: hu × v, wi = µ0 (u, v, w), ∀w ∈ V. (9.25) Por supuesto, todo esto resulta extensible punto a punto a los espacios tangentes en variedades de dimensión 3. 224 CAPÍTULO 9. TEOREMA DE STOKES Ejercicio. En R3 con la métrica riemanniana y orientación usuales, obténganse expresiones para el producto vectorial de dos campos vectoriales en coordenadas cilı́ndricas y esféricas. 9.8.2. El rotacional Consideremos ahora una variedad semi-riemanniana (Q, g) y un campo vectorial X ∈ X(Q). Recordemos (Sección 7.3) que la 2-forma diferencial rotacional se definı́a como rotX=dX [ . Supongamos ahora que en Q se fija una orientación, y el correspondiente elemento de volumen métrico orientado µg . En dimensión n = 3, el inverso del isomorfismo (9.23) permite definir ahora el campo vectorial rotacional de X, RotX ∈ X(Q), que se caracteriza como: iRotX µg = rotX = dX [ . Ası́, usando (9.25), también se tiene la caracterización: µg (RotX, Y, Z) = g(RotX, Y × Z) = rotX(Y, Z) = Y g(X, Z) − Zg(X, Y ) − g(X, [Y, Z]), válida para cualesquiera campos vectoriales Y, Z. En particular, si Y, Z fueran campos coordenados, el último término no aparecerı́a, y si además Y = ∂i , Z = ∂j fueran ortonormales para una métrica g riemanniana (lo cual sólo sucede en el caso particular de que la métrica sea isométrica a la usual de R3 , en algún abierto), entonces: µg (RotX, ∂i , ∂j ) = ∂i X j − ∂j X i . Ejercicio. En R3 con la métrica riemanniana y orientación usuales, obténganse expresiones para el rotacional de un campo vectorial en coordenadas cilı́ndricas y esféricas. Capı́tulo 10 Conexiones afines En este capı́tulo introducimos un elemento nuevo sobre una variedad: el concepto de conexión afı́n. A partir de él se pueden definir varios conceptos de interés geométrico: la derivada covariante a lo largo de una curva, el transporte paralelo, las geodésicas y la aplicación exponencial (además de la curvatura que estudiaremos en el capı́tulo siguiente). Describiremos brevemente estos conceptos y hallaremos expresiones en coordenadas para todos ellos a partir de los sı́mbolos de Christoffel de la conexión. 10.1. Concepto de conexión afı́n Hasta ahora, dada una variedad diferenciable arbitraria sabemos derivar una función f con respecto a una dirección del espacio tangente v, pero no sabemos derivar un campo de vectores Y . Un primer intento para definir esta derivación serı́a el corchete de Lie que, si bien permitirı́a hablar de la derivada de un campo Y en la dirección de otro campo V , no permite derivar en la dirección del vector v en un punto. Esto es, puede ocurrir que para V, Ṽ ∈ X(Q) con v = Vp = Ṽp se tenga [V, Y ]p 6= [Ṽ , Y ]p . Para tratar de definir esta derivación consideremos en primer lugar n R con el sistema usual de coordenadas (x1 , . . . , xn ). Todo campo de 225 226 CAPÍTULO 10. CONEXIONES AFINES vectores Y ∈ X(Rn ) puede escribirse como: Y = n X Yi i=1 ∂ , ∂xi con Y i : Rn → R diferenciable ∀i ∈ {1, . . . , n}. Si vp ∈ Tp Rn entonces podemos definir la derivada de Y en la dirección de vp como n X ∂ vp (Y ) := vp (Y i ) i |p . ∂x i=1 Obviamente, esta definición depende del sistema de coordenadas escogido. Ası́, en una variedad arbitraria Q donde no exista un sistema de coordenadas privilegiado la anterior definición carece de sentido. Por tanto, se hace necesario abstraer las propiedades deseables de esta definición de manera que sea aplicable a una variedad Q arbitraria. Definición 10.1.1 Sea Q una variedad diferenciable. Una conexión afı́n sobre Q es una aplicación ∇, ∇ : X(Q) × X(Q) → X(Q) (X, Y ) 7→ ∇X Y que verifica: (1) Es R-lineal con respecto a la segunda variable, esto es, ∇X (aY + bY ) = a∇X Y + b∇X Y , ∀a, b ∈ R, ∀X, Y, Y ∈ X(Q). (2) Verifica la regla de Leibniz del producto con respecto a la segunda variable: ∇X (f Y ) = X(f )Y + f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q). (3) Es R-lineal con respecto a la primera variable, esto es, ∇aX+bX (Y ) = a∇X Y + b∇X Y, ∀a, b ∈ R, ∀X, X, Y ∈ X(Q). (4) Es C ∞ (Q)-lineal con respecto a la primera variable, esto es, ∇f X Y = f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q). 10.1. CONCEPTO DE CONEXIÓN AFÍN 227 Si, además, se verifica ∇X Y − ∇Y X = [X, Y ], ∀X, Y ∈ X(Q) entonces se dice que la conexión es simétrica. Al par (Q, ∇) lo llamaremos variedad afı́n. Observaciones: (1) Es inmediato comprobar que el corchete de Lie sobre Q [·, ·] : X(Q) × X(Q) → X(Q) (X, Y ) 7→ [X, Y ] no es una conexión afı́n puesto que no verifica la propiedad (4) (en cambio, sı́ verifica el resto de las propiedades). (2) Del axioma (2) queda claro que (si dim Q > 0) la conexión afı́n no es C ∞ (Q)-lineal con respecto a la segunda variable. Sı́ lo es, sin embargo, respecto de la primera variable (propiedad (4)). Comprobemos ahora que con una conexión afı́n sı́ es posible definir la derivada de Y en la dirección de un vector tangente v. En adelante, simplificaremos sistemáticamente la notación siendo consistentes con: ∂i ≡ ∂/∂q i . Proposición 10.1.2 Sean X, X ∈ X(Q) tales que Xp = X p para cierto p ∈ Q. Entonces (∇X Y )p = (∇X Y )p , ∀Y ∈ X(Q). Demostración. Sean X, X ∈ X(Q) tales que Xp = X p . Si (U, q 1 , . . . , q n ) es un entorno coordenado de Q alrededor de p entonces podemos escribir: n n X X i i X ∂i , X= X= X ∂i , i=1 i=1 Ahora bien, por la propiedad (4) de la Definición 10.1.1 P ∇X Y = ∇(Pni=1 X i ∂i ) Y = ni=1 X i ∇∂i Y, ∇X Y = ∇(Pn i=1 X i Y = ∂i ) Pn i i=1 X ∇∂i Y. (10.1) 228 CAPÍTULO 10. CONEXIONES AFINES i Por tanto, como X i (p) = X (p) se tiene (∇X Y )p = n X i X (p)(∇∂i Y )p = i=1 n X i X (p)(∇∂i Y )p = (∇X Y )p . 2 i=1 Gracias a este resultado podemos definir la derivada ∇vp Y , vp ∈ Tp Q. En efecto, para computar dicha derivada basta con calcular (∇X Y )p , siendo X ∈ X(Q) tal que Xp = vp . Nota. Al escribir los campos X e Y en coordenadas en la demostración anterior, se plantea la dificultad de que estas expresiones no estén definidas sobre todo Q. En este caso, en rigor, no tiene sentido escribir (10.1) aplicando los axiomas de la Definición 10.1.1. Esta dificultad se puede salvar porque de estos axiomas se deduce que si X, Y ∈ X(Q) coinciden, respectivamente, con X, Y ∈ X(Q) en un entorno U de p, entonces ∇X Y = ∇X Y sobre U . En particular, si se define una conexión sobre una variedad, ésta queda definida sobre cualquier abierto suyo. La prueba de estos resultados usa la existencia de “funciones meseta” alrededor de cualquier punto p (véase [O’N, Proposition 2.2, Lemma 2.3] para más detalles). Ejercicio. Pruébese que la aplicación ∇0 : X(Rn ) × X(Rn ) → X(Rn ) definida usando las coordenadas usuales de Rn por (X, Y ) 7→ ∇0X Y n X n X ∂ ∂Y j ∂ := X(Y ) j = Xi i , ∂x ∂x ∂xj j=1 i,j=1 j P P siendo X = ni=1 X i ∂x∂ i , Y = nj=1 Y j ∂x∂ j , es una conexión afı́n simétrica sobre Rn . Definición 10.1.3 Dada una variedad afı́n (Q, ∇) se dice que X ∈ X(Q) es paralelo si ∇X ≡ 0; esto es, si ∇v X = 0, ∀v ∈ T Q. Una variedad afı́n puede no admitir campos paralelos. Ejercicio. Determı́nense todos los campos paralelos de (Rn , ∇0 ). 10.2. SÍMBOLOS DE CHRISTOFFEL 10.2. 229 Sı́mbolos de Christoffel Sean (Q, ∇) una variedad afı́n y (U, q 1 , . . . , q n ) un entorno coordenado de Q. Como sabemos, el conjunto (∂1 ≡ ∂/∂q 1 , . . . , ∂n ≡ /∂q n ) es una base de campos sobre U , y dado que ∇∂i ∂j también es un campo sobre U , podemos expresarlo punto a punto como combinación lineal de los campos coordenados (∂1 , . . . , ∂n ). En consecuencia, existen n3 funciones diferenciables Γkij , i, j, k ∈ {1, . . . , n} sobre U tales que ∇∂i ∂j = n X Γkij ∂k . (10.2) k=1 Definición 10.2.1 Las funciones Γkij , i, j, k ∈ {1, . . . , n} dadas por la expresión (10.2) reciben el nombre de sı́mbolos de Christoffel de ∇ en las coordenadas (q 1 , . . . , q n ). Propiedades: (1) Los valores de Γkij , i, j, k ∈ {1, . . . ,P n} determinan laPconexión ∇ sobre el abierto U . En efecto, si X = ni=1 X i ∂i , Y = nj=1 Y j ∂j entonces P P ∇X Y = ∇(Pni=1 X i ∂i ) ( nj=1 Y j ∂j ) = ni,j=1 X i ∇∂i (Y j ∂j ) P P P = ni,j=1 X i (∂i Y j ∂j + Y j ∇∂i ∂j ) = ni,j=1 X i (∂i Y j ∂j + Y j nk=1 Γkij ∂k ), (mientras que en la segunda igualdad se usa el axioma (4), en la tercera se usa el (2); para la última igualdad se ha usado (10.2)). En consecuencia, conociendo los sı́mbolos de Christoffel podemos computar la conexión afı́n sobre dos campos cualesquiera. (2) Recı́procamente, fijado un entorno coordenado (U, q 1 , . . . , q n ) y 3 n funciones diferenciables arbitrarias Γkij , i, j, k ∈ {1, . . . , n} sobre U , existe una única conexión afı́n ∇ sobre U cuyos sı́mbolos de Christoffel en coordedanadas (q 1 , . . . , q n ) son Γkij . Concretamente, ∇ viene dado por la expresión ! à n n X X Γkij ∂k , X, Y ∈ X(U ). ∇X Y := X i ∂i Y j ∂j + Y j i,j=1 k=1 En particular, si en Rn tomamos coordenadas usuales y Γkij ≡ 0, ∀i, j, k, reobtenemos la conexión usual ∇0 . 230 CAPÍTULO 10. CONEXIONES AFINES (3) Sean Γkij los sı́mbolos de Christoffel de una conexión ∇ sobre Q para un entorno coordenado (U, q 1 , . . . , q n ). Se verifica que ∇ es simétrica en U (véase la Definición 10.1.1) si y sólo si Γkij = Γkji para todo i, j, k. (En consecuencia, la simetrı́a de los sı́mbolos de Christoffel no depende de las coordenadas elegidas). Demostración de (3). Probémoslo en primer lugar para campos coordenados. Dado que [∂i , ∂j ] = 0, computando directamente se tiene: ∇∂i ∂j − ∇∂j ∂i = n X Γkij ∂k − n X Γkji ∂k = (Γkij − Γkji )∂k , k=1 k=1 k=1 n X que es nulo si y sólo si Γkij = Γkji para todo i, j, k. Para campos cualesquiera basta con expresar dichos campos en términos de los coordenados y reducir la prueba al caso anterior. (4) Sea ∇ una conexión sobre Q y sean (q 1 , . . . , q n ), (q 1 , . . . , q n ) dos sistemas coordenados sobre un mismo abierto U ⊆ Q. La relación k existente entre los sı́mbolos de Christoffel Γkij y Γij asociados a los respectivos sistemas coordenados es: s Γij n n X X ∂q l ∂q m ∂q s r ∂q s ∂ 2 q r + Γ . = ∂q r ∂q i ∂q j l,m,r=1 ∂q i ∂q j ∂q r lm r=1 (10.3) En particular, la expresión (10.3) muestra que una conexión no se puede considerar como un campo tensorial ya que, debido al término en derivadas segundas, las funciones Γkij no se transforman como las coordenadas de un tensor. Demostración de (4). Por definición de los sı́mbolos de Christoffel P ∇∂i ∂j = nk=1 Γkij ∂k P k ∇∂ i ∂ j = nk=1 Γij ∂ k . P Pn ∂ql ∂q l ∂ Ahora bien, como ∂ k ≡ ∂q∂k = nl=1 ∂q k ∂q l ≡ l=1 ∂q k ∂l se tiene P Pn m ∂q l ∂q m ∇∂ i ∂ j = ∇Pn ∂ql ∂ ( nm=1 ∂q j ∂m ) = i ∇∂l ( ∂q j ∂m ) l,m=1 ∂q ∂q l=1 ∂q i l P Pn ∂ 2 qm ∂q l ∂q m r = nm=1 ∂q i ∂q j ∂m + l,m,r=1 ∂q i ∂q j Γl,m ∂r . Por otra parte, ∇∂ i ∂ j = n X k=1 k Γij ∂ k = n X k,r=1 k Γij ∂q r ∂r . ∂q k 10.3. DERIVADA COVARIANTE 231 Igualando la componente r-ésima de cada expresión se obtiene: n X k Γij k=1 Pero Pn ∂q r ∂q s r=1 ∂q k ∂q r bros de (10.4) por = n X ∂q r ∂ 2qr ∂q l ∂q m r = + Γ . ∂q i ∂q j l,m=1 ∂q i ∂q j lm ∂q k ∂q s ∂q k (10.4) = δks . Por tanto, multiplicando los dos miem- ∂q s ∂q r y sumando en r obtenemos finalmente: à n ! n n X X ∂q s X k ∂q r s k s Γij = Γij δk = Γ ∂q r k=1 ij ∂q k r=1 k=1 à ! n n X X ∂q l ∂q m r ∂ 2qr ∂q s = + Γ . 2 i j i j lm r ∂q ∂q ∂q ∂q ∂q r=1 l,m=1 Ejemplo. Como ya indicamos los sı́mbolos de Christoffel de R2 para ∇0 en coordenadas usuales son todos nulos. Sin embargo, en coordenadas polares se tiene (compruébese directamente de (10.3)): ∇0∂ρ ∂ρ = 0, 10.3. ∇0∂θ ∂θ = −ρ∂ρ , 1 ∇0∂θ ∂ρ = ∂θ . ρ Derivada covariante Sean (Q, ∇) una variedad afı́n y γ : I → Q, I =]a, b[ una curva diferenciable. Como ya vimos, si X ∈ X(Q) entonces tiene sentido escribir ∇v X para cualquier vector tangente v ∈ T Q. En particular, podemos escribir ∇γ 0 (t) X, ∀t ∈ I. Definición 10.3.1 Llamamos derivada covariante de X ∈ X(Q) a lo largo de γ : I → Q a la aplicación DX dt : I → TQ t 7→ ∇γ 0 (t) X ∈ Tγ(t) Q. Usando las propiedades de la conexión afı́n de la Sección 10.1 se obtienen las siguientes: (1) La derivada covariante es R-lineal, esto es, DX DX D(aX + bX) =a +b . dt dt dt 232 CAPÍTULO 10. CONEXIONES AFINES (2) Se verifica la regla de Leibniz del producto, esto es, D(f X) DX d(f ◦ γ) DX = γ 0 (f )X + f = X +f . dt dt dt dt Estudiemos a continuación la expresión Pn eni coordenadas1 de la derivada covariante. Supongamos que X = i=1 X ∂i y γ(t) = (q (t), . . . , q n (t)). Entonces γ 0 (t) = (q̇ 1 (t), . . . , q̇ n (t)) ∈ Tγ(t) Q, es decir, 0 γ (t) = n X j=1 q̇ j (t) ∂ |γ(t) . ∂q j Por tanto, P DX (:= ∇γ 0 (t) X) = nk=1 ∇γ 0 (t) (X k ∂k ) dt Pn P = k=1 γ 0 (t)(X k )∂k + ni=1 X i ∇γ 0 (t) ∂i P P k = nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t)∇(∂j |γ(t) ) ∂i P P P k = nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t) nk=1 Γkij (γ(t))∂k . En conclusión, su expresión en coordenadas queda: à ! n n X DX d(X k ◦ γ) X i (t) = + X (γ(t))q̇ j (t)Γkij (γ(t)) ∂k |γ(t) . dt dt i,j=1 k=1 (10.5) La definición de derivada covariante se puede extender a campos vectoriales sobre γ más generales de la siguiente manera: Definición 10.3.2 Dada una curva diferenciable γ : I → Q decimos que X̂ es un campo sobre γ si es una aplicación diferenciable X̂ : I → T Q t 7→ X̂(t) tal que X̂(t) ∈ Tγ(t) Q, ∀t ∈ I (esto es, tal que π ◦ X̂ = γ siendo π : T Q → Q la proyección canónica). Por ejemplo, si X ∈ X(Q) entonces la aplicación diferenciable X ◦ γ : I → TQ t 7→ Xγ(t) , (10.6) 10.3. DERIVADA COVARIANTE 233 Figura 20 es un campo sobre γ. Ahora bien, no todos los campos sobre una curva son restricciones a esa curva de un campo definido sobre toda la variedad (véase la Figura 20). A partir de (10.5) se comprueba que la derivada covariante de un campo a lo largo de una curva γ sólo depende de los valores del campo sobre dicha curva. Esto permite definir la derivada covariante a lo largo de γ de un campo X̂ sobre γ que no provenga necesariamente P de un campo definido sobre toda la variedad. En efecto, si X̂(t) = ni=1 X̂ i (t) ∂q∂ i |γ(t) entonces definimos n X DX̂ (t) := dt k=1 à ! n X dX̂ k (t) + X̂ i (t)q̇ j (t)Γkij (γ(t)) ∂k |γ(t) . (10.7) dt i,j=1 Esta definición es independiente de las coordenadas elegidas, al coincidir con (10.5). En resumen, para cualquier campo vectorial X̂ sobre una curva γ hemos definido un nuevo campo vectorial DdtX̂ también sobre γ que representa la “derivada de X̂ en la dirección de γ 0 (t)”, para todo t ∈ I. 234 CAPÍTULO 10. CONEXIONES AFINES 10.4. Transporte paralelo Definición 10.4.1 Sea X̂ : I → T Q un campo de vectores sobre una curva γ. Diremos que X̂ es paralelo si DdtX̂ ≡ 0. A continuación veremos que existe una única manera de “transportar paralelamente” un vector v a lo largo de una curva γ. En efecto: Teorema 10.4.2 Fijados una curva γ : I → Q y un vector v ∈ Tγ(t0 ) Q, t0 ∈ I, existe un único campo de vectores V sobre γ tal que V (t0 ) = v y DV ≡ 0. dt Idea de la demostración. Tomemos coordenadas alrededor de γ(t0 ). La prueba se reduce entonces a resolver el sistema de n ecuaciones diferenciales de primer orden n dV k (t) X i + V (t)q̇ j (t)Γkij (γ(t)) = 0, dt i,j=1 k = 1, . . . , n, (10.8) con condiciones iniciales V i (t0 ) = v i , ∀i ∈ {1, . . . , n}. Pero esto se reduce a aplicar los teoremas clásicos de existencia y unicidad para tales ecuaciones1 . El resultado se puede extender entonces a toda la curva, recubriendo su imagen por entornos coordenados. 2 Ejemplo. En Rn las ecuaciones de transporte paralelo de un campo V , V (t0 ) = v, a lo largo de una curva en coordenadas usuales son: dV k (t) ≡ 0, dt V k (t0 ) = v k , k = 1, . . . , n. Obviamente, estas ecuaciones admiten como única solución V k (t) ≡ v k = cte, ∀t ∈ I. Ello coincide con la idea intuitiva de lo que debe ser transportar un vector paralelamente en R2 ó R3 . Denotemos por Ttt0 (v) al vector de Tγ(t) Q obtenido por transporte paralelo de v ∈ Tγ(t0 ) Q a lo largo de γ. Entonces se verifican las siguientes propiedades: 1 Véase, por ejemplo, el Teorema 1 del Capı́tulo 2 de “Ecuaciones diferenciales II”, Ediciones Pirámide, S.A., 1996 (C. Fernández, J. M. Ruiz). 10.4. TRANSPORTE PARALELO 235 (1) La aplicación transporte paralelo Ttt0 : Tγ(t0 ) Q → Tγ(t) Q v 7→ Ttt0 (v) es un isomorfismo de espacios vectoriales (esencialmente, la linealidad se debe a la del sistema (10.8) y la inyectividad a la unicidad de soluciones de (10.8) para cada v). (2) Si (e1 , . . . , en ) es una base de Tγ(t0 ) Q y E1 , . . . , En son los correspondientes campos sobre γ obtenidos por transporte paralelo de los vectores e1 , . . . , en , respectivamente, entonces cualquier campo paralelo V sobre γ puede escribirse como V = n X ai Ei , ai ∈ R, ∀i ∈ {1, . . . , n}. i=1 (3) Se verifica la igualdad Ttt21 ◦ Ttt10 = Ttt20 , ∀t0 , t1 , t2 ∈ I. (4) Es posible reconstruir la conexión a partir del transporte paralelo. En efecto, para cada campo X ∈ X(Q) y cada curva γ en Q, el campo de vectores ∇γ 0 (t) X se puede expresar en términos de la aplicación transporte paralelo de la siguiente manera: ∇γ 0 (t) X = limh→0 Ttt+h (Xγ(t+h) ) − Xγ(t) h (véase, p. ej., [Sp1, Chapter 6, Proposition 3]). Ejercicio. Demuéstrese: (1) Sea X ∈ X(Q) un campo paralelo para la conexión ∇ (Definición 10.1.3). Para cualquier curva γ, X̂ = X ◦γ es paralelo (Definición 10.4.1). (2) Sean X, Y ∈ X(Q) dos campos paralelos. Si Q es conexa y Xp = Yp para algún p ∈ Q entonces X = Y . (3) Si Q es conexa entonces los campos paralelos sobre Q forman un espacio vectorial de dimensión menor o igual que n. 236 CAPÍTULO 10. CONEXIONES AFINES 10.5. Geodésicas Hasta ahora, para una curva diferenciable γ(t) en Q hemos definido su velocidad γ 0 (t) pero no su aceleración. A continuación veremos cómo la conexión permite definir esta última y, con ella, el concepto de geodésica. Definición 10.5.1 Sea (Q, ∇) una variedad afı́n y γ : I → Q una curva diferenciable. Llamaremos aceleración de γ a la derivada covariante 0 de su velocidad Dγ . dt Diremos que γ es una geodésica si tiene aceleración nula Dγ 0 /dt ≡ 0, esto es, si el campo de vectores γ 0 (t) sobre γ es un campo paralelo. Obsérvese que para definir los conceptos de aceleración y geodésica ha sido necesario introducir previamente la conexión afı́n. Estudiemos a continuación la ecuación que define las geodésicas en coordenadas. Dado un entorno coordenado (U, q 1 , . . . , q n ) de Q y un campo X̂ a lo largo de una curva γ en U , la expresión de la derivada covariante viene dada por (10.7). Por tanto, si tomamos X̂ ≡ γ 0 entonces à ! n n 0 2 k X X Dγ dq ∂ (t) = (t) + q̇ i (t)q̇ j (t)Γkij (γ(t)) |γ(t) . 2 dt dt ∂q k i,j=1 k=1 En consecuencia, γ será una geodésica si y sólo si se verifica: n X d2 q k (t) + Γkij (γ(t))q̇ i (t)q̇ j (t) = 0, dt2 i,j=1 ∀k ∈ {1, . . . , n}. (10.9) Ejemplo. Si tomamos coordenadas usuales en (Rn , ∇0 ) entonces (10.9) se reduce a d 2 xk = 0, ∀k ∈ {1, . . . , n} dt2 y, por tanto, las geodésicas son rectas afines xk (t) = ak · t + bk , ∀k ∈ {1, . . . , n}. En cambio, en las coordenadas polares de R2 las ecuaciones de las geodésicas adoptan la expresión: ρ̈ − ρθ̇2 = 0, ρθ̈ + 2ρ̇θ̇ = 0. 10.6. CONEXIONES SIMÉTRICAS 237 Como en la demostración del Teorema 10.4.2, si aplicamos los teoremas clásicos de existencia y unicidad de soluciones de ecuaciones diferenciales a (10.9) obtenemos: Teorema 10.5.2 Sea (Q, ∇) una variedad afı́n. Para cada t0 ∈ R, p ∈ Q y v ∈ Tp Q, existe una única geodésica γ :]a, b[→ Q tal que (i) γ(t0 ) = p, γ 0 (t0 ) = v, y (ii) γ es inextensible (o maximal), esto es, no existe otra geodésica γ que verifique (i) y cuyo dominio de definición contenga estrictamente a ]a, b[. Grosso modo, lo que se está diciendo es que el punto y la velocidad iniciales determinan la geodésica. Una propiedad relevante que pueden presentar las geodésicas es la completitud: Definición 10.5.3 Si una geodésica inextensible tiene dominio de definición todo R entonces se dice que es completa. Una variedad cuyas geodésicas inextensibles son todas completas se dice que es una variedad geodésicamente completa. Por ejemplo, Rn con la conexión usual es completa. Sin embargo, la bola de centro 0 y radio r(< ∞) no lo es. Nota. Las velocidades de las geodésicas proporcionan las curvas integrales de un campo vectorial G sobre la variedad tangente, G ∈ X(T Q). Ello permite descubrir algunas analogı́as entre los conceptos aquı́ estudiados para las geodésicas y los vistos en el Tema 5 para las curvas integrales de cualquier campo vectorial. 10.6. Conexiones simétricas Si observamos con detenimiento las ecuaciones de las geodésicas, encontramos que el término ẋi ẋj va multiplicado por (Γkij + Γkji ) para cada par de ı́ndices i, j. Esto implica que las sumas (Γkij + Γkji ) están determinadas por las geodésicas. Además, si la conexión es simétrica entonces se tiene Γkij + Γkji = 2Γkij . Por tanto, las geodésicas determinan los sı́mbolos de Christoffel y, en consecuencia, también la conexión. Por otra parte, aunque una conexión ∇ no sea simétrica, siempre ˆ simétrica a partir de ∇ que tenga es posible construir otra conexión ∇ sus mismas geodésicas. 238 CAPÍTULO 10. CONEXIONES AFINES Proposición 10.6.1 Dada una conexión no simétrica ∇, existe una ˆ cuyas geodésicas coinciden con las de ∇. única conexión simétrica ∇ Esquema de la demostración. Paso 1. Para toda conexión afı́n ∇ se define su torsión como Tor(X, Y ) = ∇X Y − ∇Y X − [X, Y ], X, Y ∈ X(Q). Es fácil comprobar que Tor(·, ·) es un campo de tensores 2-covariante, 1-contravariante, no nulo y antisimétrico (Tor(X, Y ) = −Tor(Y, X)). ˆ := ∇ − 1 Tor(·, ·), esto es, ∇ ˆ X Y = ∇X Y − Paso 2. Definimos ∇ 2 1 ˆ también es una conexión ya Tor(X, Y ), ∀X, Y ∈ X(Q). Entonces ∇ 2 que, en general, si a una conexión se le suma un tensor tipo (2, 1), se obtiene otra conexión. ˆ es Paso 3. De la antisimetrı́a del tensor Tor(·, ·) es claro que ∇ simétrica. En efecto, ˆ XY − ∇ ˆ Y X = ∇X Y − ∇Y X − 1 Tor(X, Y ) + 1 Tor(Y, X) ∇ 2 2 = ∇X Y − ∇Y X − Tor(X, Y ) = [X, Y ]. Paso 4. Dado que ˆ X X = ∇X X − 1 Tor(X, X) = ∇X X, ∇ 2 (la última igualdad por la antisimetrı́a de Tor) las geodésicas para ambas conexiones coinciden. 2 10.7. Aplicación exponencial Consideremos una reparametrización arbitraria γ(s) = γ(t(s)) de una geodésica no constante γ(t). Entonces ¶ µ ¶2 µ D dt 0 d2 t 0 dt Dγ 0 Dγ 0 (s) = γ (t(s)) = 2 · γ (t(s)) + · (t(s)). ds ds ds ds ds dt 2 d t Por tanto, γ seguirá siendo una geodésica si y sólo si ds 2 (s) ≡ 0, es decir, si y sólo si t(s) = a · s + b, a, b ∈ R. Por otra parte, observemos que si las geodésicas inextensibles γv , 0 (0) = h · γh·v , h ∈ R\{0} verifican γv (0) = γh·v (0), γv0 (0) = v, γh·v 0 v entonces ambas geodésicas tienen la misma imagen y γh·v (s) ≡ h· γv0 (hs). 10.7. APLICACIÓN EXPONENCIAL 239 Lema 10.7.1 Sea (Q, ∇) una variedad afı́n y consideremos un punto p ∈ Q. Existe un entorno abierto U de 0 en Tp Q tal que para todo v ∈ U la (única) geodésica inextensible γv tal que γv0 (0) = v está definida en t = 1. La demostración puede consultarse en [O’N, Chapter 3, Lemma 27]2 . Teorema 10.7.2 Sea (Q, ∇) una variedad afı́n y consideremos un punto p ∈ Q. Existe un entorno U0 de 0 en Tp Q y un entorno Up de p en Q tal que la aplicación exponencial expp : U0 (⊆ Tp Q) → Up (⊆ Q) v 7→ γv (1) está bien definida y es un difeomorfismo de U0 en Up . Esquema de la demostración. Se basa en los siguientes puntos: (1) por el Lema 10.7.1 la aplicación expp está bien definida en algún abierto U de 0 ∈ Tp Q; (2) es diferenciable porque está construida a partir de soluciones de ecuaciones diferenciales; (3) su diferencial en 0, (d expp )0 : T0 (Tp Q) → Tp Q, (10.10) es biyectiva; de hecho, (d expp )0 es, esencialmente, la identidad, con la identificación natural entre un espacio vectorial y su tangente en un punto (véase [Subsección 3.2.2, Ejemplo (1)]); (4) como (d expp )0 es biyectiva, podemos obtener el entorno en cuestión U0 ⊆ U usando el Teorema de la Función Inversa [Capı́tulo 4, Sección 4.4]. 2 Observaciones: (1) El Teorema 10.7.2 proporciona un entorno coordenado (Up , n exp−1 p ) que contiene a p ∈ Q (identificando Tp Q con R mediante cualquier isomorfismo vectorial). (2) Las geodésicas que pasan por p, escritas en estas coordenadas, se corresponden con lı́neas rectas que pasan por el origen de Rn . En particular, esto implica Γkij (p) + Γkji (p) = 0 para todo i, j, k y, si ∇ es simétrica, Γkij (p) = 0 para todo i, j, k. Nota. Una discusión clásica en Relatividad General es la del “principio de equivalencia”, según el cual los observadores en caı́da libre 2 Para la idea intuitiva téngase en cuenta que si la geodésica γv puede definirse en, digamos, t = t0 > 0 entonces la geodésica γt0 v (t) podrá definirse hasta t = 1. 240 CAPÍTULO 10. CONEXIONES AFINES pueden tomar coordenadas (t, x, y, z) tales que “infinitesimalmente” (“en primer orden de aproximación”) las leyes de la Fı́sica se escriben igual que para los observadores inerciales de la Relatividad Especial. La formulación matemática de este principio es la siguiente. La gravedad determina una conexión afı́n sobre el espacio-tiempo y, por tanto, sus geodésicas. Los observadores en caı́da libre seguirán geodésicas de esta conexión y, si miden cuidadosamente, lo harán usando la aplicación exponencial. Por ello, en sus coordenadas los sı́mbolos de Christoffel se anulan a lo largo de esa geodésica con lo que, en primer orden, considerarán sı́mbolos de Christoffel nulos, igual que si se hallaran en (Rn , ∇0 ). Capı́tulo 11 Curvatura El concepto de curvatura resulta esencial para entender la geometrı́a de una variedad semi-riemanniana. No obstante, la formulación abstracta de la curvatura como tensor, aunque muy simple matemáticamente, resulta muy alejada de la intuición geométrica. Inicialmente, en este tema se define el tensor curvatura y se estudian sus propiedades algebraicas elementales, incluyendo sus contracciones tı́picas -el tensor de Ricci y la curvatura escalar- (Secciones 11.1– 11.5), para hacer luego un breve recorrido intuitivo (Sección 11.6) que justifique el significado de este tensor. 11.1. Concepto de curvatura Sea (Q, g) una variedad semi-riemanniana y ∇(≡ ∇g ) la conexión de Levi-Civita de g. Definimos el tensor de curvatura como la aplicación: R : X(Q) × X(Q) × X(Q) → X(Q) (X, Y, Z) 7→ R(X, Y )Z que viene dado por la expresión R(X, Y )Z := ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z. 241 242 CAPÍTULO 11. CURVATURA Otra manera de expresar el tensor de curvatura es R(X, Y ) = [∇X , ∇Y ] − ∇[X,Y ] , expresión donde queda de manifiesto que R mide la falta de conmutatividad entre ∇X ∇Y y ∇Y ∇X . Señalamos que el término ∇[X,Y ] (que no aparece si X, Y son campos coordenados) es necesario para que R sea C ∞ (Q)-lineal en cada una de sus variables. Por tanto, tiene sentido computar R(up , vp )wp ∈ Tp Q ∀up , vp , wp ∈ Tp Q. y considerar a la curvatura como un campo tensorial 3 covariante, 1 contravariante. En coordenadas locales (U, q 1 , . . . , q n ) el tensor de curvatura adopta la expresión R= n X i,j,k,l=1 l Ri,j,k dq i ⊗ dq j ⊗ dq k ⊗ ∂ , ∂q l l donde Ri,j,k = dq l (R(∂/∂q i , ∂/∂q j , ∂/∂q k )). Teniendo en cuenta que à à !! X ∂Γljk X X Γljk ∂l ) = ∇∂i (∇∂j ∂k ) = ∇∂i ( ∂ + Γljk Γm , il ∂m i l ∂q m l l i se deduce fácilmente que la expresión de los coeficientes Rjkl en coordenadas locales es: i Rkjl n n X X ∂ i ∂ i i m = k Γjl − k Γlj + Γlm Γjk − Γikm Γm lj . ∂q ∂q m=1 m=1 Conviene destacar la dependencia de estos coeficientes respecto de Γkij y ∂l Γkij , es decir, respecto de gij , ∂k gij y ∂l ∂k gij . 11.2. Tensor de curvatura 4-covariante El tensor de curvatura R tiene sentido para cualquier variedad dotada de una conexión afı́n arbitraria. Sin embargo, como nos restringiremos a conexiones de Levi-Civita, podemos usar la correspondiente métrica g para subir y bajar ı́ndices. Ası́, a partir del tensor de 11.3. CURVATURA SECCIONAL 243 curvatura R podemos obtener un tensor tipo (4, 0) equivalente al anterior sin más que aplicar a R el sostenido ]. Es decir, podemos definir el campo tensorial R] : X(Q)4 → C ∞ (Q) (X, Y, Z, W ) 7→ R] (X, Y, Z, W ) := g(R(X, Y )Z, W ). Obviamente, para reobtener el tensor de curvatura a partir de éste basta con subir ı́ndices, [Sección 7, Apéndice 1]. De ahora en adelante abusaremos de la notación escribiendo también R en lugar de R] . El tensor de curvatura R presenta las siguientes simetrı́as: (1) Es un tensor antisimétrico en las dos primeras variables, esto es, R(X, Y, Z, W ) = −R(Y, X, Z, W ), ∀X, Y, Z, W ∈ X(Q). (2) Es antisimétrico en las dos últimas variables, esto es, R(X, Y, Z, W ) = −R(X, Y, W, Z), ∀X, Y, Z, W ∈ X(Q). (3) Es simétrico dos a dos en las dos primeras variables con las dos últimas, esto es, R(X, Y, Z, W ) = R(Z, W, X, Y ), ∀X, Y, Z, W ∈ X(Q). (4) Verifica la primera identidad de Bianchi, esto es, R(X, Y )Z + R(Z, X)Y + R(Y, Z)X = 0, 11.3. ∀X, Y, Z, W ∈ X(Q). Curvatura seccional Sea (Q, g) una variedad semi-riemanniana y consideremos un plano tangente a dicha variedad Π = Gen{u, v} ⊆ Tp Q tal que g |Π sea no degenerada. Definición 11.3.1 La curvatura seccional Ks del plano Π se define como R(u, v, v, u) . (11.1) Ks (Π) = g(u, u)g(v, v) − g(u, v)2 244 CAPÍTULO 11. CURVATURA Observaciones: (1) La expresión (11.1) se simplifica si tomamos u, v tales que formen una base ortonormal de Π, ya que en este caso el denominador pasa a ser ±1. (2) Cuando g |Π es euclı́dea el denominador coincide con el cuadrado del área del paralelogramo generado por u, v. En efecto, si α(u, v) es el ángulo formado por u y v entonces g(u, u)g(v, v) − g(u, v)2 = kuk2 kvk2 − kuk2 kvk2 cos2 (α(u, v)) = kuk2 kvk2 sen2 (α(u, v)). Además, si g es riemanniana entonces g |Π es no degenerada para cualquier plano Π. (3) El valor de la curvatura seccional de un plano Π es independiente de los vectores u, v elegidos. En efecto, si u = au + bv y v = cu + dv con ad − bc 6= 0 entonces R(u,v,v,u) (ad−bc)2 R(u,v,v,u) = 2 g(u,u)g(v,v)−g(u,v) (ad−bc)2 (g(u,u)g(v,v)−g(u,v)2 ) R(u,v,v,u) = g(u,u)g(v,v)−g(u,v)2 . (4) La curvatura seccional Ks (Π) para todo plano no degenerado Π tangente a Q en p determina el tensor de curvatura R en p. Por tanto, resulta equivalente conocer R y Ks (véase, v. gr., [Sp1, Chapter 4D, Proposition 8] o [O’N, pág. 79]). 11.4. Tensor de Ricci Sea (Q, g) una variedad semi-riemanniana y R su tensor de curvatura. Para cada Y, Z ∈ X(Q) consideramos el campo de endomorfismos p 7→ R(·, Yp )Zp , siendo R(·, Yp )Zp : Tp Q → Tp Q Xp 7→ R(Xp , Yp )Zp . Definición 11.4.1 Se define el tensor de Ricci de (Q, g) como el tensor (2, 0) Ric : X(Q) × X(Q) → C ∞ (Q) (Y, Z) 7→ Ric(Y, Z), 11.5. CURVATURA ESCALAR 245 definido por Ric(Y, Z) : Q → R p 7→ traza R(·, Yp )Zp . Si se computa esta traza en términos de la métrica se obtiene: Ric(Y, := traza R(·, Yp )Zp P Pn Z)(p) ij = i,j=1 g g(R(∂i , Yp )Zp , ∂j ) = ni,j=1 g ij R(∂i , Yp , Zp , ∂j ). Propiedades: (1) El tensor de Ricci es simétrico, esto es, Ric(Y, Z) = Ric(Z, Y ) (esto es fácil de comprobar a partir de las simetrı́as de R, véase la Sección 11.2). Además, salvo signo es el único tensor (2, 0) no nulo que se obtiene como contracción del tensor de curvatura. (2) En el caso riemanniano la “media” de las curvaturas seccionales de todos los planos que contienen a vp ∈ Tp Q − {0} es 1 Ric(vp , vp ) . n − 1 g(vp , vp ) (11.2) La propiedad (2) se formula con más precisión como sigue. Sea Bp = (e1 , . . . , en ) una base ortonormal de Tp Q con e1 = vp /kvp k, y sean Πi , i ≥ 2 los planos tangentes generados por e1 y ei . Entonces se tiene Ric(vp ,vp ) = Ric(e , e ) = Pn R(e , e , e , e ) 1 1 i 1 1 i i=1 g(vp ,vp ) Pn P R(ei ,e1 ,e1 ,ei ) = i=2 g(ei ,ei )g(e1 ,e1 )−g(e1 ,ei )2 = ni=2 Ks (Πi ), donde en la penúltima igualdad se ha usado que g(ei , ei )g(e1 , e1 ) − g(ei , e1 )2 = 1, i = 2, . . . , n. Por tanto, al dividir por n − 1 se obtiene la media de las curvaturas seccionales de los planos Π2 , . . . , Πn para cualquier elección ortogonal de (e2 , . . . , en ). 11.5. Curvatura escalar Dado que el tensor de Ricci de una variedad semi-riemanniana (Q, g) es de tipo (2, 0), su contracción métrica tiene sentido (véase [Tema 7, Apéndice 1]). 246 CAPÍTULO 11. CURVATURA Definición 11.5.1 Se define la curvatura escalar S de (Q, g) como la contracción métrica de su tensor de Ricci. En coordenadas (U, q 1 , . . . , q n ) la curvatura escalar en p adopta la expresión n X S(p) = g ij (p)Ric(∂i |p , ∂j |p ), ∀p ∈ U. i,j=1 Ası́, si {e1 , . . . , en } es una base ortonormal de Tp Q y g es riemanniana entonces n X Sp ≡ S(p) = Ric(ei , ei )p . i=1 Por tanto, en este caso n1 Sp es una “media” de las curvaturas de Ricci en p. Ahora bien, como (11.2) es la media de las curvaturas seccionales de los planos que contienen a vp , en el caso riemanniano la expresión 1 Sp n(n − 1) puede entenderse como la media de las curvaturas seccionales de todos los planos contenidos en p. Nota. Las definiciones del tensor de curvatura (3,1) y del tensor de Ricci tienen sentido para cualquier conexión afı́n ∇ (no necesariamente de Levi-Civita). Sin embargo, tanto la curvatura seccional como la escalar precisan de la métrica g para su definición. 11.6. Significado de la curvatura Aunque la construcción algebraica de R, Ric y S es simple, su significado geométrico no es obvio, y tiene detrás una larga historia de desarrollos matemáticos. En esta sección intentaremos dar un breve apunte de su significado. Para fijar ideas nos restringiremos en esta sección a una métrica g riemanniana. 11.6.1. Orı́genes geométricos Sea γ : I → R2 una curva plana unitaria (kγ 0 (t)k = 1). A continuación, consideremos la circunferencia tangente a dicha curva en γ(t0 ) 11.6. SIGNIFICADO DE LA CURVATURA 247 que mejor se aproxime a ella, esto es, aquélla que, parametrizada como curva unitaria, tenga velocidad y aceleración coincidentes con las de γ en γ(t0 ). Se define la curvatura C(γ(t0 )) de γ en γ(t0 ) como 1/r siendo r el radio de dicha circunferencia. Obsérvese que, como g0 (γ 0 (t), γ 0 (t)) es constante, se tiene 2g0 (γ 00 (t), γ 0 (t)) = 0, es decir, γ 00 (t)⊥γ 0 (t), ∀t. El centro de la circunferencia que más se aproxima queda entonces sobre la recta que pasa por γ(t0 ) con vector director γ 00 (t0 ), y su radio es r = 1/kγ 00 (t0 )k. Como caso lı́mite, la curvatura se define como 0 si γ 00 (t0 ) = 0 (r = ∞). 1 Observación. Esta definición de curvatura se extiende fácilmente al caso de curvas en R3 . En este caso, aunque la curva unitaria γ : I → R3 no esté contenida en un plano, el plano afı́n que pasa por γ(t0 ) generado por γ 0 (t0 ) y γ 00 (t0 ) es el que más se aproxima a γ en γ(t0 ). Ası́, puede definirse la curvatura de γ en t0 como kγ 00 (t0 )k, y mantenerse su interpretación como inversa del radio de circunferencia que más se aproxima a γ en γ(t0 ). Figura 24 Consideremos a continuación una superficie S incluida en R3 . Nuestro objetivo ahora será definir su curvatura en un punto p ∈ S. Sea vp ∈ Tp S un vector unitario y sea γvp la geodésica en S con velocidad 1 Estas afirmaciones no son difı́ciles de demostrar. En cualquier caso, para todo 3 lo referente a curvatura de curvas y superficies en R remitimos al libro clásico de M.P. do Carmo [dC2] 248 CAPÍTULO 11. CURVATURA inicial vp . Considerando a γvp como una curva en R3 , puede demostrarse que su aceleración en p es perpendicular a Tp S, por ser una geodésica en S. Obviamente, podemos aplicar la definición anterior para calcular C(γvp (t0 )) = 1/r. Además, usando que la curva está contenida en S, es posible asociar un signo a la curvatura como sigue. Escojamos un vector unitario Np normal a la superficie en p (Np ∈ Tp R3 es ortogonal a Tp S). El centro Ovp de la circunferencia estará en la recta que pasa por p con vector director Np , concretamente o en p + rNp o en p − rNp . En el primer caso, consideraremos a la curvatura con signo positivo y, en caso contrario, negativo. Esto es, definimos: Figura 25 ½ C Np (γvp (t0 )) = kγv00p (t0 )k −kγv00p (t0 )k si Ovp = p + rNp si Ovp = p − rNp . Nota. Aunque en una superficie no orientable de R3 (como la cinta de Möebius) no existe un campo normal globalmente definido N , sı́ podemos definir un vector normal en cada punto y, por tanto, mantener la anterior definición punto a punto. Calculemos la curvatura con signo de todas las geodésicas unitarias contenidas en S que pasan por p. Existirán dos direcciones tales que estas curvaturas sean máxima y mı́nima. Denotemos entonces a estas curvaturas principales como: Cmax = Max{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1} Cmin = Min{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1}. 11.6. SIGNIFICADO DE LA CURVATURA 249 Obsérvese que Cmax , Cmin se calculan “extrı́nsecamente” a S, esto es, viendo a S somo una superficie dentro de R3 , por lo que no tienen un significado “intrı́nseco” (calculable a partir de la geometrı́a de S como variedad riemanniana). Además, Cmax , Cmin también dependen del normal Np escogido –aunque su producto es independiente de éste. Por otra parte, como S es una variedad riemanniana de dimensión 2 (con la métrica inducida de la usual de R3 ), cada punto p ∈ S tiene asociada una única curvatura seccional KS (p) = Ks (Πp ) correspondiente al único plano Πp = Tp S contenido en el espacio tangente a p (véase la Sección 11.3). Pues bien, ambas curvaturas se relacionan de la siguiente manera (Teorema Egregium de Gauss): Para toda superficie S ⊂ R3 se verifica KS (p) = Cmin · Cmax , donde KS (p)(:= Ks (Tp S)) denota la curvatura seccional de S en p. Es decir, el producto de las curvaturas principales de una superficie S ⊂ R3 en cada punto p es una propiedad intrı́nseca a la superficie, computable exclusivamente del valor de la métrica sobre ella y, de hecho, igual a KS (p). Por ejemplo, en cualquier punto de la esfera de radio r se tiene Cmax = Cmin = 1r y, por tanto, KS ≡ r12 . Para el cilindro de radio de la base a, se tiene Cmax = 1/a y Cmin = 0, luego KS ≡ 0. Estudiemos ahora el caso más general en que (Q, g) es una variedad riemanniana n-dimensional. Sea Πp un plano de Tp Q y consideremos un abierto U0 ⊆ Tp Q tal que expp : U0 ⊆ Tp Q → Up ⊆ Q es un difeomorfismo. Consideremos la superficie S = expp (Πp ∩ U0 ) que contiene a p. Se puede demostrar entonces que la curvatura seccional Ks (Πp ) coincide con la curvatura de S en p con la métrica restringida2 , KS (p). Ası́, el tensor de curvatura R en cada punto p “contiene la información” de todas las curvaturas en p de todas las superficies que podemos construir de este modo. Recı́procamente, estas curvaturas determinan al tensor curvatura, pues a partir de la curvatura seccional Ks (Πp ) de cada uno de los planos Πp tangentes a p es posible determinar el tensor de curvatura R en p (véase la Sección 11.3). 2 Esto se mantiene válido si g es semi-riemanniana y el plano Πp no degenerado. 250 CAPÍTULO 11. CURVATURA Extrı́nseco Extrı́nseco Extrı́nseco l Intrı́nseco Intrı́nseco Intrı́nseco Intrı́nseco 11.6.2. Curvatura de curvas C(γ(t0 )) Curvatura (con signo) de curvas en una superficie S ⊂ R3 con un normal fijado; curvaturas principales Cmin , Cmax Producto de curvaturas máxima y mı́nima de S en p l T. Egregium Curvatura seccional KS (p) = Ks (Tp S) Curvatura seccional de variedades riemannianas bidimensionales KS (p) = Ks (Πp ), para el único plano Πp = Tp S Curvatura seccional de cada plano tangente a una variedad riemanniana Ks (Πp ), Πp ⊂ Tp Q, que coincide con la de la subvariedad riemanniana bidimensional S = expp (Πp ) en p Tensor curvatura R (que equivale a Ks (Πp ) para todo Πp ) Cómo la curvatura determina la métrica Una vez estudiado el origen del tensor de curvatura, conviene entender cómo la curvatura determina la métrica. De nuevo, nos restringiremos a una variedad riemanniana (Q, g) aunque, esencialmente, lo que sigue también valdrá para una variedad semi-riemanniana arbitraria: Resultado 1. “La curvatura es una segunda derivada de la métrica”. Sea p ∈ Q y consideremos coordenadas normales (q 1 , . . . , q n ) asociadas a expp : U0 ⊆ Tp Q → Up ⊆ Q, siendo expp |U0 un difeomorfismo y U0 un abierto estrellado, gij (p) = δij y Γkij (p) = 0, ∀i, j, k ∈ {1, . . . , n}. (11.3) Como q 1 (p) = · · · = q n (p) = 0, se verifica el siguiente desarrollo de Taylor de gij : 1 gij (q 1 , . . . , q n ) = δij + Rijkl (p)q k q l + O(kqk3 ). 3 11.6. SIGNIFICADO DE LA CURVATURA 251 Para ello basta con tener en cuenta la expresión de los sı́mbolos de Christoffel en términos de la métrica y usar (11.3) (véase [Sa, Chapter II, Proposition 3.1]). Resultado 2. “La curvatura determina la métrica”. Sean g, g 0 dos 0 métricas riemannianas sobre una variedad conexa Q. Si Rg = Rg sobre todo Q y gp = gp0 en un punto p ∈ Q entonces g = g 0 .3 Por supuesto, dos variedades isométricas (Q, g), (Q0 , g 0 ) (Sección 7.5) tienen “iguales curvaturas” R, R0 ; esto es, al inducir mediante la isometrı́a F : Q → Q0 el tensor curvatura R de Q en Q0 se obtiene R0 , o: R0 (dFp vp , dFp wp )dFp up ) = dFp (R(vp , wp )up ), para todo vp , wp , up ∈ Tp Q, ∀p ∈ Q. Resultado 3. “La curvatura mide cuánto se aleja localmente una geometrı́a de la de Rn ”. Existen diversos resultados en esta dirección. Como un ejemplo sencillo, sea (Q, g) una variedad riemanniana con R ≡ 0. Entonces para cada p ∈ Q existen coordenadas (Up , q 1 , . . . , q n ) tales que g(∂/∂q i , ∂/∂q j ) = δij en todo Up ; esto es, la carta coordenada ϕ : Up → ϕ(Up ) ⊂ Rn es una isometrı́a. Este resultado se puede ver como un caso muy particular, o bien del Resultado 2 anterior, o bien de un Teorema clásico de Cartan (véase, p. ej., [Sa, II, Theorem 3.2]). Ası́, curvatura nula implica “localmente isométrico” a Rn (pero no globalmente, piénsese en el cilindro). Resultado 4. “Geometrı́as no-euclı́deas modelo”. Se definen los siguientes espacios modelo de curvatura constante C y dimensión n: (i) Para C = 0, Rn . (ii) Para C > 0, la esfera Sn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 : g0 ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = r2 }, √ con r = 1/ C, siendo g0 la métrica riemanniana usual de Rn+1 y la métrica de Sn (r) la inducida. (iii) Para C < 0, el espacio hiperbólico Hn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 : gL ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = −r2 , xn+1 > 0} 3 Véase v.gr. 1.7.18 en J.A. Wolf, “Spaces of constant curvature”, Mc Graw-Hill Co. NY (1967). 252 CAPÍTULO 11. CURVATURA √ con r = 1/ −C, siendo gL la métrica lorentziana usual de Rn+1 y la de Hn la inducida (que es riemanniana). Ası́, por ejemplo, para n = 2 se tiene4 H2 (r) = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 = −r2 , z > 0}, p esto es, z = r2 + x2 + y 2 . Teorema 11.6.1 Toda variedad riemanniana (Q, g) de curvatura constante C es localmente isométrica al espacio modelo de esa misma curvatura. Si, además, Q es 11.6.3. Ecuación de Jacobi Justifiquemos a continuación que la curvatura se halla ı́ntimamente relacionada con la velocidad con la que las geodésicas se aproximan o se separan entre sı́. En efecto, consideremos una variedad riemanniana (Q, g) y sea γ : [0, 1] → Q una geodésica con kγ 0 k = 1. Consideremos una variación de γ por geodésicas, esto es, una aplicación diferenciable ] − ², ²[×[0, 1] → Q (s, t) 7→ γs (t) (11.4) tal que (i) γ0 = γ, y (ii) γs es una geodésica para cada s. Para esa variación se define el campo variacional asociado, o campo de Jacobi, como el campo sobre γ J(t) = d |s=0 γs (t). ds En ocasiones se dice que J(t) es la “variación infinitesimal” de γ ante la variación (“finita”) (11.4), escribiéndose δγ(t) en lugar de J(t). Se expresa ası́ que J(t) mide, hasta primer orden, cómo se desvı́an las + Este espacio es isométrico al famoso semiplano de Poincaré (R × R , g = (dx2 + dy 2 )/y 2 ). 4 11.6. SIGNIFICADO DE LA CURVATURA 253 geodésicas próximas a una dada. Se puede comprobar que el campo de Jacobi J(t) verifica la ecuación D2 J + R(J, γ 0 )γ 0 = 0, dt2 2 que se conoce como ecuación de Jacobi. Por tanto, el término g( Ddt2J , J) está ı́ntimamente relacionado con la curvatura seccional del plano Πt = Gen{γ 0 (t), J(t)}, ya que, vı́a la ecuación de Jacobi, se tiene g( D2 J , J) = −g(R(J, γ 0 )γ 0 , J) = −Ks (Πt )(g(γ 0 , γ 0 )g(J, J) − g(γ 0 , J)2 ). dt2 Ası́, si la curvatura seccional es positiva (y g es riemanniana) las geodésicas próximas tenderán a juntarse más que en el espacio euclı́deo (Rn , h·, ·i), y si es negativa, tenderán a separarse más que en dicho espacio. Esta interpretación puede extenderse al Ricci. Si, por ejemplo, en lugar de suponer que la curvatura seccional sea positiva suponemos sólo que el tensor de Ricci sea definido positivo, entonces las geodésicas próximas a γ se acercarán “en promedio” más que en Rn , aunque eventualmente puede haber direcciones con Ks (Πt ) < 0 y en las que las geodésicas próximas se alejen más. 11.6.4. Otras propiedades Existen otras propiedades que caracterizan la curvatura. Ası́, por ejemplo, sea (Q, g) una variedad riemanniana y Πp un plano incluido en Tp Q. Consideremos expp : Πp ∩ U0 → S ⊂ Q de manera que S sea una superficie. Consideremos en Πp ∩ U0 la circunferencia centrada en 0 y de radio r. Sea Cr la imagen de esa circunferencia por expp , cuya longitud L(Cr ) se computa usando la métrica g. Entonces: limr→0 π 2πr − L(Cr ) = Ks (Πp ). r3 3 (11.5) Por otra parte, en el Tema 8 se muestra que la métrica g permite introducir una medida (área en dimensión 2, volumen en dimensión 3) de cualquier subconjunto abierto o cerrado de (Q, g) (véase también la nota al final de la Sección ??). Si denotamos por A0 (r) = πr2 y A(r) 254 CAPÍTULO 11. CURVATURA a las áreas de la circunferencia usual de radio r (en Tp Q) y de Cr en expp (Πp ∩ U0 ), respectivamente, se verifica: Ks (Πp ) = limr→0 12 A0 (r) − A(r) . r2 A0 (r) (11.6) Grosso modo, a mayor curvatura menor longitud y área que las esperadas en Rn . Las fórmulas (11.5) y (11.6) permiten conocer si el espacio está curvado en un punto p a partir de “mediciones infinitesimales de longitud y área alrededor de p”. Ası́, los eventuales habitantes de un espacio curvado podrán percatarse de su curvatura a partir de mediciones de longitudes y áreas. Capı́tulo 12 Algunas notas sobre Relatividad En este capı́tulo se describen muy brevemente los ambientes matemáticos de la Relatividad Especial y General. Mostraremos cómo los diferentes objetos geométricos introducidos encajan en el marco de la Relatividad, resultando imprescindible toda la maquinaria matemática estudiada para el caso de la Relatividad General. Sin mayores pretensiones, nuestro objetivo es doble: ayudar a conectar los diferentes lenguajes fı́sico y matemático que aparecen en la literatura sobre Relatividad, y estimular la curiosidad e interés rigurosos por esta teorı́a. 12.1. Relatividad Especial 12.1.1. Espacios vectoriales lorentzianos Recordemos que todo espacio vectorial lorentziano (V, h·, ·i) de dimensión n + 1 es isométrico al espacio de Lorentz-Minkowski Ln+1 , que se define como Rn+1 dotado con la métrica usual lorentziana η ≡ (−, +, . . . , +). Denotaremos por (t = x0 , x1 , . . . , xn ) a las coordenadas usuales de Ln+1 , por lo que en ellas se tiene: η00 = −1, ηij = δij , 255 ∀i, j ∈ {1, . . . , n}. 256 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD El caso de mayor p interés fı́sico es, por supuesto, n = 3. De ahora en adelante a |hv, vi| lo denotaremos por kvk, aunque no verifica, obviamente, las propiedades de una norma. Diremos que un vector v ∈ V es: hv, vi < 0 temporal hv, vi = 0, v 6= 0 luminoso si hv, vi ≤ 0, v 6= 0 causal espacial hv, vi > 0 ó v = 0. No es difı́cil comprobar (obsérvese la Figura 26 para L3 ) que los vectores causales de (V, h·, ·i) junto con el vector v = 0 forman dos conos. Si elegimos uno de estos conos C ↑ y lo llamamos cono futuro, diremos que el espacio vectorial lorentziano está orientado temporalmente, y al otro cono C ↓ se le llama cono pasado. En Ln+1 elegimos como cono futuro al superior, esto es, C ↑ = {a = (a0 , . . . , an ) ∈ Ln+1 : ha, ai ≤ 0, a0 ≥ 0}. Figura 26 Fijada una variedad lorentziana (Q, g), a una elección “continua” de un cono para cada Tp Q (isométrico a Ln+1 , aunque no de modo 12.1. RELATIVIDAD ESPECIAL 257 canónico) se le llama una orientación temporal de la variedad. Una variedad lorentziana que admita una orientación temporal (no todas la admiten) se dice que es temporalmente orientable. Si Q es conexa y temporalmente orientable, tal orientación temporal estará fijada por la elección del cono en un punto cualquiera p ∈ Q. Llamamos transformaciones de Lorentz en Ln+1 a cada una de sus isometrı́as vectoriales, esto es, a los isomorfismos vectoriales f : Ln+1 → Ln+1 que verifican η(u, v) = η(f (u), f (v)), ∀u, v ∈ Ln+1 . Esto equivale a que f aplique bases ortonormales en bases ortonormales de manera ordenada. Matricialmente, esta condición se reduce a (ηij ) = At · (ηij ) · A, (12.1) donde ηij = η(vi , vj ) y A = M (f, B) = (f (v0 ), f (v1 ), . . . , f (vn )), donde cada f (vi ) se escribe por columnas y B = (v0 , . . . , vn ) es cualquier base ortonormal de Ln+1 . Conviene señalar que, en general, las transformaciones de Lorentz no conservan la elección hecha para los conos temporales, esto es, tal vez f (C ↑ ) = C ↓ . A una transformación de Lorentz que sı́ respete los conos temporales, esto es, tal que f (C ↑ ) = C ↑ (y, por tanto, f (C ↓ ) = C ↓ ) se le llama ortocrona. Si, además, det f > 0 entonces se dice que es propia. Claramente, el conjunto de las transformaciones de Lorentz junto con la operación de composición tiene una estructura de grupo. El estudio de las isometrı́as vectoriales de un espacio vectorial lorentziano (V, h·, ·i) de dimensión n+1 equivale al estudio de las transformaciones de Lorentz de Ln+1 . 12.1.2. El grupo de Lorentz El estudio de las transformaciones de Lorentz equivale al de las matrices que verifican (12.1). Ası́ llamamos grupo de Lorentz de dimensión n + 1 a: O1 (n + 1) = {A ∈ Gl(n + 1, R) : At (ηij )A = (ηij )}. Retomando la subsección anterior, es inmediato ahora comprobar que una transformación de Lorentz f con matriz en una base ortonormal 258 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD A ∈ O1 (n + 1) y elementos (aij ), i, j ∈ {0, 1, . . . , n} será ortocrona si y sólo si a00 > 0. Además, como η(e0 , e0 ) = −1 y −1 = η(f (e0 ), f (e0 )) = −(a00 )2 + n X (a0i )2 , i=1 necesariamente se tiene que |a00 | ≥ 1. Denotamos por O1↑ (n + 1) (resp. O1+ (n+1), O1+↑ (n+1)) al subgrupo de O1 (n+1) formado por las matrices con a00 ≥ 1 (resp. det A = 1, que verifican ambas condiciones). Para cualquier espacio vectorial lorentziano (V, h·, ·i) las isometrı́as vectoriales de V se corresponden, fijada una base ortonormal, con los elementos de O1 (n + 1). En el caso n = 1 el grupo de Lorentz puede computarse explı́citamente con facilidad, obteniéndose: ½µ ¶ ¾ ² · cosh θ ν · senh θ O1 (2) = : θ ∈ R, ², ν ∈ {1, −1} . (12.2) ² · senh θ ν · cosh θ Ejercicio. Demuéstrese (12.2). Obsérvese que si ² = ν = 1 entonces las correspondientes transformaciones son ortocronas propias, esto es, pertenecientes a O1+↑ (2). Adicionalmente, podemos usar la siguiente expresión para las matrices en O1+↑ (2): µ cosh θ senh θ senh θ cosh θ ¶ µ = cosh θ · 1 tagh θ tagh θ 1 ¶ . Usando entonces que cosh2 θ − senh2 θ = 1 y definiendo v = tagh θ, que verifica |v| < 1, obtenemos ½ O1+↑ (2) = 1 √ 1 − v2 µ 1 v v 1 ¶ ¾ : v ∈] − 1, 1[ . (12.3) Con más generalidad, no es difı́cil demostrar que si f es una transformación de Lorentz de (V, h·, ·i) y Π es un subespacio invariante por f (esto es, f (Π) ⊆ Π) entonces el subespacio ortogonal a Π (es decir, Π⊥ = {v ∈ V : hv, wi = 0, ∀w ∈ Π}) también lo es (f (Π⊥ ) ⊆ Π⊥ ). Ello permite dar la siguiente definición: 12.1. RELATIVIDAD ESPECIAL 259 Definición 12.1.1 Sea f una isometrı́a de un espacio vectorial lorentziano (V, h, i) de dimensión n + 1. Diremos que f es una transformación de Lorentz pura o “boost” (resp. isometrı́a espacial pura) si f admite un subespacio Π invariante por f que verifica: tiene dimensión 2 (resp. dimensión n), la métrica restricción g |Π es lorentziana (resp. euclı́dea) y la restricción de la isometrı́a al subespacio ortogonal f |Π⊥ es la identidad. En dimensión 4 se puede demostrar que para toda transformación de Lorentz propia ortocrona f existe un “boost” f1 y una isometrı́a espacial pura f2 tales que f = f1 ◦ f2 . Además, al ser f2 esencialmente una isometrı́a vectorial (y que conserva la orientación) en un espacio vectorial Π de dimensión 3, f2 restringido a alguna recta R ⊂ Π es la identidad, por lo que f2 puede considerarse como una rotación pura en el plano P ⊂ Π ortogonal a R. Esto es, “f se puede escribir como composición de un “boost” y una rotación” –aunque el plano espacial P en el que transcurre la rotación no es necesariamente ortogonal al plano temporal en el que transcurre el “boost”. Ası́, muchas de las propiedades más caracterı́sticas de las transformaciones de Lorentz se pueden estudiar en dimensión 2. 12.1.3. L4 como modelo de espaciotiempo Reflexionemos en primer lugar sobre por qué el plano fı́sico admite como modelo matemático al plano euclı́deo R2 ≡ (R2 , dx21 + dx22 ). Esencialmente, esto significa: (a) El plano fı́sico P admite una estructura de variedad riemanniana (o de espacio afı́n euclı́deo) de dimensión 2 que es isométrica a R2 . (b) Existe una manera fı́sica de construir una tal isometrı́a I : P → R2 . A la postre, digamos: se puede “fijar un origen, unos ejes ortogonales y unidades” en el plano fı́sico y “proyectar” cada punto sobre los ejes coordenados, obteniendo ası́ el elemento deseado de R2 . 260 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD Es de señalar que esta isometrı́a no es única. Sin embargo, si fijamos una entonces podemos trabajar indistintamente con P ó R2 . Además, cuando se tienen dos de tales isometrı́as I, I 0 : P → R2 existe una isometrı́a R de R2 tal que I 0 = R ◦ I; esto es, todo el estudio se acaba reduciendo al de R2 . En Relatividad Especial se postula que el conjunto de todos los eventos (o sucesos “aquı́-ahora”) del espaciotiempo admite como modelo fı́sico al espacio de Minkowski L4 con su orientación temporal futura. La necesidad de este postulado se puede comprobar a posteriori, ya que permite modelar la constancia de la velocidad de la luz. Como en el caso del plano fı́sico tal postulado significa: (a) El espaciotiempo como conjunto de sucesos admite una estructura de variedad lorentziana (Q, g) (o de espacio afı́n lorentziano) de dimensión 4 y orientada temporalmente que es isométrica a L4 (mediante una isometrı́a que respeta los conos futuros, es decir, una isometrı́a ortocrona). (b) Existe una manera fı́sica de construir esa isometrı́a. Sin embargo, (b) resulta ahora menos intuitivo y precisa de discusiones fı́sicas. Resumiendo, se admite que dicha isometrı́a se construye usando la existencia de observadores inerciales en el espaciotiempo (Q, g). Cada uno de estos observadores describe una geodésica (recta afı́n) r(t) tal que r0 (t) pertenece al cono futuro y g(r0 (t), r0 (t)) = −1. En cada instante t0 el observador percibe como espacio en reposo el hiperplano afı́n Π(t0 ) que es ortogonal a r(t) en r(t0 ). Este hiperplano podrá considerarse entonces como una variedad riemanniana (o un espacio afı́n euclı́deo) isométrica a R3 (Figura 27). Si nos restringimos a una dimensión espacial, una vez que el observador fija la isometrı́a dicho observador “se ve a sı́ mismo” como una recta con vector director e0 = (1, 0) de L2 , siendo su “espacio en reposo” una recta de vector director e1 = (0, 1). Otro observador será visto por el primero como otra recta de vector director temporal e00 ∈ C ↑ , y tendrá como espacio en reposo una recta distinta con vector director e01 que será ortogonal a e00 . La matriz de cambio de base entre (e0 , e1 ) y (e00 , e01 ) pertenecerá a O1↑ (2). 12.1. RELATIVIDAD ESPECIAL 261 Figura 27 12.1.4. La constancia de la velocidad de la luz En la aceptación histórica de Ln+1 , n = 3, como modelo del espaciotiempo en Relatividad Especial, el problema de la velocidad de la luz, que comentaremos brevemente, representó un papel central. Por simplicidad puede suponerse n = 1, aunque los desarrollos matemáticos que siguen pueden extenderse para un n arbitrario. En contra de la intuición newtoniana clásica, tanto argumentos teóricos como evidencias experimentales sugerı́an postular que la velocidad de la luz es finita y la misma para todos los observadores (inerciales). Los argumentos teóricos se basaban en los siguientes tres hechos: (1) las ecuaciones de Maxwell proporcionan la velocidad de la luz -o de cualquier onda electromagnética- con respecto a su medio de propagación (no respecto a la fuente que la origina), (2) la luz se propaga en el vacı́o y (3) el vacı́o parece ser el mismo para todos los observadores inerciales. Ası́, la velocidad de la luz respecto al vacı́o predicha por las ecuaciones 262 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD de Maxwell debı́a ser la misma que midieran todos los observadores inerciales, independientemente de su movimiento relativo. La evidencia experimental de este hecho se halló con el célebre experimento de Michelson-Morley. En el marco de la Mecánica Newtoniana, la existencia de esta velocidad c igual para todos los observadores resultaba absurda: si un observador inercial mide como velocidad de la luz c, otro observador inercial que se mueva a una velocidad v respecto al primero en la dirección y sentido de propagación de la luz deberı́a medir como velocidad de la luz c − v. Veamos cómo esta velocidad de propagación constante (digamos c = 1, en unidades apropiadas) es modelable en Relatividad Especial. Supongamos, como al final de la subsección anterior, que se tienen dos observadores inerciales, el primero de los cuales toma coordenadas de modo que describe al espaciotiempo como Ln+1 , y la recta que él mismo describe se corresponde con r(t) = t(1, 0) (≡ t(1, 0, . . . , 0)), siendo e0 ≡ r0 (0) = (1, 0). Supondremos por simplicidad que la recta s que describe el segundo observador corta a r en el origen, esto es, se escribe en las coordenadas del primero como s(t) = te00 , siendo e00 = (t0 , x0 ) ∈ C ↑ cualquier vector temporal unitario que apunte al futuro. La n-upla v = x0 /t0 se interpreta (bien como definición matemática, bien como postulado fı́sico) como la velocidad del observador asociado a e00 medida por el observador e0 . Ahora bien, como −1 = η(e00 , e00 ) = −t20 + kx0 k2 se tiene kvk2 = 1 − 1/t20 y, por tanto, esta velocidad es siempre menor que 1. Sea ahora u = (u0 , u1 ) ∈ C ↑ un vector luminoso (u0 > 0, ku1 k = |u0 |). El cociente v = u1 /u0 verifica kvk = 1 al ser 0 = η(u, u) = u20 −u21 . Este hecho es de vital importancia para nuestro modelo, porque permite postular que las trayectorias de los rayos de luz se describen mediante geodésicas (rectas afines) luminosas de L4 que apuntan al futuro: cualquier observador inercial medirá como velocidad de esa geodésica en sus coordenadas v = u1 /u0 de modo que siempre kvk = 1. Más aún, como demostró el propio Einstein, la descripción unificada ~ y magnético B ~ como componentes de una de los campos eléctrico E 2-forma diferencial (véase la Subsección 6.2.1) permite una descripción sencilla de las ecuaciones de Maxwell y de todo el electromagnetismo. 12.1. RELATIVIDAD ESPECIAL 12.1.5. 263 Algunas consecuencias del modelo Admitiendo L4 como modelo del espaciotiempo, debemos ser consistentes con él. Ello provoca algunas consecuencias que inicialmente pueden resultar sorprendentes. Históricamente, la más conocida de ellas es la identidad entre masa (en reposo) y energı́a, a través de la famosa ecuación de Einstein E = mc2 . Podemos intuir la necesidad de una relación de este tipo porque para una partı́cula en movimiento, el momento p~ = (px , py , pz ) y la energı́a E medidos por un observador inercial no pueden tener un significado intrı́nseco (no se transforman separadamente como las coordenadas de ningún tensor sobre L4 ). Resulta ası́ natural postular que no son más que componentes de un vector (E, p~). El escalar h(E, p~), (E, p~)i precisa entonces de alguna interpretación fı́sica, y diversos análogos con la energı́a cinética clásica hacen natural postular h(E, p~), (E, p~)i = −m2 (≡ −m2 c4 ), siendo m la masa que medirı́a un observador para el que la partı́cula estuviera en reposo. Describimos brevemente a continuación otras consecuencias, éstas puramente geométricas. Dilatación del tiempo. Supongamos que los observadores e00 y e0 asignan coordenadas (T 0 , 0) y (T, X), respectivamente, al evento P , con T 0 > 0 (Figura 28). Entonces, aplicando la métrica η al vector OP obtenemos η(OP , OP ) = −(T 0 )2 para el observador e00 . Para el observador e0 se tiene, en cambio, η(OP , OP ) = −T 2 + X 2 . Igualando ambas expresiones se tiene: T 2 = (T 0 )2 + X 2 y, por tanto, T > T 0 . Más aún, dividiendo en ambos miembros por T 2 se tiene µ 0 ¶2 T 1= + v2, T siendo v la velocidad relativa del observador e00 respecto del observador e0 . En consecuencia, 1 T =√ T 0. 1 − v2 Desigualdad triangular. Consideremos un triángulo lorentziano OP Q en L4 (Figura 29). Se verifica el siguiente teorema: si OP , OQ 264 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD Figura 28 y P Q son temporales y apuntan al futuro entonces kOQk ≥ kOP k + kP Qk, (12.4) con igualdad si y sólo si los vectores son colineales. Esta desigualdad recibe el nombre de desigualdad triangular, y se deduce análogamente a la conocida desigualdad triangular euclı́dea (kOQk ≤ kOP k + kP Qk). Fı́sicamente, (12.4) se interpreta como que el tiempo medido por el observador e00 que sigue la trayectoria desde O hasta Q es mayor que el medido por el observador que sigue la trayectoria OP y luego P Q. (Esta conclusión produce la popular “paradoja de los gemelos”.) Contracción de la longitud. Consideremos una varilla V de longitud L = kOP k que está en reposo respecto del observador e0 . Para el observador e00 la varilla tendrá longitud L0 y estará en movimiento 0 (véase la Figura 30). Esta longitud L0 será igual a la del segmento OP , intersección del espacio en reposo de e00 (generado por {e01 }) con todas las rectas temporales Rx = {(t, x) : t ∈ R} generadas por cada uno de los puntos de la varilla (0, x) para x ∈ [0, L]. Por tanto, 0 0 η(OP , OP ) = (L0 )2 . 12.2. RELATIVIDAD GENERAL 265 Figura 29 Como P 0 = (T, L) en las coordenadas del observador e0 , se tiene 0 0 η(OP , OP ) = −T 2 + L2 . En consecuencia, √ L0 = −T 2 + L2 y, por tanto, L02 < L2 . Más aún, téngase en cuenta que e00 es ortogonal a e01 , por lo que las coordenadas de e00 determinadas por e0 son proporcionales a (L, T ). La velocidad de e00 medida por e0 es entonces v = T /L. Ası́, de la expresión anterior para L0 se tiene: √ L0 = 1 − v 2 · L. 12.2. Relatividad General 12.2.1. El modelo matemático En Relatividad General, esto es, el modelo obtenido cuando se incorporan los efectos de la gravedad a la Relatividad Especial, se postula que el espaciotiempo fı́sico (o una región “macroscópicamente grande” de él) admite una estructura de variedad de Lorentz conexa temporalmente orientada de dimensión 4. Esto se corresponde con el paso (a) de la Subsección 12.1.3, con la importante diferencia de que ahora no está prefijado de antemano el modelo matemático de variedad a la que es isométrico el espaciotiempo. Por eso, el paso (b) de esa subsección debe llevarse a cabo desentrañando a la vez a qué variedad lorentziana temporalmente orientable concreta es isométrico el espaciotiempo. 266 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD Figura 30 Para esto no existen reglas fijas, pero sı́ se aceptan algunas prescripciones: (i) Cada observador se modela como una curva temporal (unitaria) γ dirigida hacia el futuro; si el observador está en caı́da libre entonces describe una geodésica (el vector velocidad de la geodésica es temporal, unitario y apunta en la dirección del cono futuro en cada punto). (ii) Si γ(t) es un observador, en cada instante t0 podemos considerar el hiperplano Π ortogonal a γ 0 (t0 ) en Tγ(t0 ) Q (Π serı́a el “espacio en reposo infinitesimal” de γ 0 (t0 )) , y la hipersuperficie expγ(t0 ) (Π) constituye el “espacio en reposo” del observador γ en t0 (al menos para distancias “suficientemente pequeñas”). (iii) Las partı́culas aceleradas vienen representadas por curvas temporales que apuntan al futuro (su normalización, en lugar de unitaria, se suele escoger igual a la masa en reposo en cada instante). (iv) Los rayos de luz se describen como geodésicas luminosas que apuntan también al futuro (la luz no está acelerada1 ). Es de señalar que el tensor de curvatura desempeña ahora un papel crucial, puesto que determina cómo se comportan las geodésicas. Como veremos más adelante (Subsección 12.2.4), este tensor vendrá determinado por la materia y la energı́a. 1 Sin embargo, no existe una interpretación fı́sica clara para las geodésicas espaciales. 12.2. RELATIVIDAD GENERAL 12.2.2. 267 Causalidad Consideremos una variedad de Lorentz orientada temporalmente (Q, g). Si p, q ∈ (Q, g), se definen las siguientes relaciones de causalidad: futuro cronológico (q << p) futuro causal estricto (q < p) p está en el de q pasado cronológico (p << q) pasado causal (p ≤ q) si existe una curva diferenciable a trozos, temporal y dirigida al futuro causal y dirigida al futuro temporal y dirigida al pasado causal y dirigida al pasado que parte de p y llega a q. La notación p ≤ q significa que o bien p < q o bien p = q. Se pueden comprobar relaciones del tipo: p << q, q << r =⇒ p << r p << q, q ≤ r =⇒ p << r p ≤ q, q ≤ r =⇒ p ≤ r, etc. Llamaremos ası́ futuro cronológico de p, I + (p), (resp. futuro causal de p, J + (p)) a: I + (p) = {q ∈ Q : p << q} J + (p) = {q ∈ Q : p ≤ q} Para los pasados cronológico I − (p) o causal J − (p) las definiciones son análogas. La estructura causal del espaciotiempo tiene un enorme interés tanto fı́sico como geométrico, pudiendo presentar los futuros y pasados multitud de posibilidades. Ası́, observemos que en el espaciotiempo de Minkowski los conos aparecen como en la Figura 31, por lo que el conjunto J + (p) acaba intersecando a toda geodésica temporal dirigida hacia el futuro r(t). Sin embargo, en un espaciotiempo en el que los conos se distribuyan como en la Figura 32, ocurre que si p está a la derecha de la lı́nea L (el “horizonte de sucesos”) entonces J + (p) no interseca la región a la izquierda de L. De hecho, un observador como 268 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD γ1 , que parte del punto q a la izquierda de L, una vez que atraviese L no volverá a cruzar esta lı́nea, perdiendo todo contacto con la región izquierda de L. Ası́, γ1 sólo podrá encontrarse con γ2 si éste también se decide a cruzar L (sabiendo que entonces γ2 tampoco la volverá a poder cruzar). Figura 31 Para un espaciotiempo se suele admitir que se verifican diferentes condiciones de causalidad. De todas, la más básica y menos restrictiva es la condición de cronologı́a, esto es, que no existan curvas temporales cerradas (a través de las cuales un observador podrı́a viajar a su propio pasado). Por último, señalemos la siguiente cuestión técnica. Sea Ω > 0 una función diferenciable sobre Q. A la métrica de Lorentz g 0 = Ωg se le llama métrica conforme a g mediante Ω. Claramente, dos métricas conformes presentan los mismos vectores luminosos y, por tanto, la misma causalidad (la causalidad es un “invariante conforme”). Además, si dos métricas lorentzianas g, g 0 tienen iguales vectores luminosos (y, por tanto, igual causalidad) entonces un bonito razonamiento algebraico muestra que son conformes (véase, por ejemplo, [BEE, Theorem 2.3]; el resultado es válido en cualquier dimensión n, con la salvedad para n = 2 de que el factor Ω puede ser también siempre negativo). Esto 12.2. RELATIVIDAD GENERAL 269 Figura 32 sugiere definir clases conformes de métricas mediante la relación de equivalencia: g ∼ g 0 si y sólo si existe Ω > 0 tal que g 0 = Ωg. La estructura conforme de un espaciotiempo equivale a la causal (conjunto de los conos luminosos futuros en cada punto), y existen múltiples propiedades fı́sicas y geométricas (trayectorias de rayos luminosos, tensor de Weyl, etc.) que dependen sólo de ella. 12.2.3. Propiedades maximizantes de las geodésicas causales En el casop lorentziano, la longitud de una curva γ : [a, b] → Q se deRb fine como a |g(γ 0 (t), γ 0 (t))|dt. Aunque ahora no existe una distancia asociada como en el caso riemanniano (Sección ??), se puede definir un concepto con ciertas analogı́as para curvas causales dirigidas al futuro. En primer lugar, obsérvese que no podemos usar como distancia entre dos puntos relacionados causalmente p, q , p ≤ q el ı́nfimo de las longitudes de las curvas causales que los conectan, puesto que éste siempre serı́a cero (bastarı́a con coger curvas que fuesen luminosas en casi todo 270 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD su trayecto). Por el contrario, lo que se hace es tomar el supremo de las longitudes de tales curvas. Aunque este supremo puede ser ∞ (por ejemplo, si existiera una curva temporal cerrada que pasase por p y q), condiciones de causalidad poco restrictivas implican su acotación. Este supremo recibe el nombre de distancia lorentziana o separación temporal d(p, q) definido por: Sup{L (γ) : γ curva causal dirigida al futuro que conecta p y q}, que puede tomar cualquier valor en [0, ∞] (si p 6≤ q entonces se define d(p, q) = 0). Con esta definición se prueban algunas analogı́as entre las propiedades minimizantes de las geodésicas en geometrı́a riemanniana y las correspondientes maximizantes en geometrı́a lorentziana. La más relevante de ellas es la desigualdad triangular invertida: d(p, q) + d(q, r) ≤ d(p, r). Sin embargo, también hay notables diferencias: ası́ d(p, q) = 0 no implica p = q y, en general, d(p, q) 6= d(q, p) (de hecho, si d(p, q) = d(q, p) entonces necesariamente d(p, q) ∈ {0, ∞}). Las analogı́as se extienden a las propiedades que relacionaban geodésicas y longitud en el caso riemanniano. Ası́, si en el caso riemanniano (Sección ??) las geodésicas minimizan localmente la longitud (en Rn+1 globalmente), en el caso lorentziano las geodésicas causales la maximizan localmente (en Ln+1 globalmente). Fı́sicamente, la longitud de una curva causal se identifica con el tiempo medido por un observador que la recorra (“tiempo propio” del observador). Por tanto, un observador en caı́da libre γ medirı́a un tiempo mayor que el de cualquier otro observador ρ “próximo”2 que siga una curva temporal no geodésica, Figura 33. (Esta es la versión más general de la “paradoja de los gemelos”.) 12.2.4. Ecuación de Einstein Como ya sabemos, cada espaciotiempo viene modelado por una variedad de Lorentz orientada temporalmente de dimensión 4. Ası́, una vez fijada la variedad de Lorentz es posible establecer la causalidad, la velocidad de las partı́culas, las trayectorias de los rayos de luz, etc. Basta con que ρ y γ caigan en un mismo entorno normal, ası́, en L necesaria la restricción de que ρ sea “próximo”. 2 n+1 no es 12.2. RELATIVIDAD GENERAL 271 Figura 33 Ahora bien, ¿qué es lo que determina la métrica g que modela al espaciotiempo (y su estructura topológica y diferenciable)? Parece fı́sicamente razonable que sea la energı́a, considerada en sentido amplio, es decir, abarcando el momento, la masa, etc. La ecuación de Einstein relaciona conceptos geométricos asociados a g, como el tensor de Ricci y la curvatura escalar, con conceptos fı́sicos como la energı́a y el momento. La energı́a del espaciotiempo fı́sico permite construir un campo de tensores T de tipo (2, 0) y simétrico, que llamaremos tensor impulso -energı́a, atendiendo a lo siguiente: para cada base ortonormal (e0 , e1 , e2 , e3 ) en Tp Q el término T (e0 , e0 ) medirá la densidad de energı́a en ese punto para cualquier observador con velocidad e0 en p; el término T (e0 , ei ) medirá la densidad de momento lineal en la dirección ei , y T (ei , ej ) la densidad de presión en la dirección ej sobre la superficie en e⊥ 0 ortogonal a ei . Se tiene ası́ la matriz 4 × 4: T (e0 , e0 ) T (e0 , ei ) , T (e0 , ej ) T (ei , ej ) donde T (ei , ej ), i, j ∈ {1, 2, 3} es una matriz 3 × 3. En principio, este tensor, que se construye a partir de la distribución de energı́a del espaciotiempo, debiera determinar su geometrı́a. La igualdad esperada 272 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD entre elementos asociados a g y T es la ecuación de Einstein: 1 Ric − Sg + Λg = T, 2 (12.5) donde Λ ∈ R es la constante cosmológica. Además (siempre que no se entre en consideraciones cuánticas como las referentes a la energı́a del vacı́o), se acepta que la constante cosmológica Λ debe ser 0, por lo que la ecuación de Einstein se supondrá en adelante: 1 Ric − Sg = T. 2 (12.6) Hay varios argumentos fı́sicos de plausibilidad en favor de (12.5)3 , pero esta ecuación debe admitirse como un postulado, sin demostración formal. Si se describe una región del espaciotiempo que esté vacı́a, sin materia o energı́a de ningún tipo, la ecuación (12.6) queda Ric−(1/2)Sg = 0. Al tomar la traza en esta igualdad se tiene (en dimensión 4): S − 21 4S = −S = 0. En conclusión, la ecuación de Einstein en el vacı́o (con Λ = 0) queda Ric ≡ 0. (12.7) Observaciones: (1) Vı́a la ecuación de Einstein, el tensor energı́a-impulso proporciona esencialmente el tensor de Ricci. Ahora bien, el tensor de curvatura R tiene “más componentes” que el de Ricci. En efecto, en dimensión 4 o superior, a partir de R se puede construir el llamado tensor de Weyl C el cual, conjuntamente con el Ricci, determina R. El tensor de Weyl es un “invariante conforme”, esto es, depende sólo de la causalidad; ası́, dos métricas conformes tendrán el mismo tensor de Weyl (véase el final de la Subsección 12.2.2). Se tiene entonces que el tensor de Ricci (determinado por las ecuaciones de Einstein) junto con el tensor de Weyl (determinado por la causalidad) sı́ determinan el tensor de curvatura 3 Ası́: (i) tomando un lı́mite apropiado se reobtiene la ecuación de Poisson de la Mecánica Newtoniana; (ii) a partir de la ecuación deP Einstein es posible deducir n leyes de conservación (div T = 0, siendo div T (v) = i,j=1 g ij (∇ei T )(v, ej )), sin necesidad de imposiciones adicionales, como en el caso de la Mecánica Newtoniana; (iii) la ecuación (12.6) se corresponde con propiedades extremales para variaciones apropiadas de S. 12.2. RELATIVIDAD GENERAL 273 R que, como vimos en la Subsección 11.6.2, caracteriza esencialmente la métrica. (2) Ya establecimos que T (e0 , e0 ) es la densidad de energı́a. Parece razonable suponer que ésta sea positiva, esto es, T (e0 , e0 ) ≥ 0 para todo e0 temporal unitario. La condición equivalente T (v, v) ≥ 0 para todo v temporal (y, por continuidad, también para todo v luminoso) recibe el nombre de condición débil de energı́a. En particular, si u es luminoso entonces de (12.6) se tiene 0 ≤ T (u, u) = Ric(u, u). (3) Existen otros tipos de condiciones esperables sobre el comportamiento de T o Ric. Por ejemplo, la condición, muy usada: Ric(v, v) ≥ 0 para todo v temporal, (12.8) recibe el nombre de condición de convergencia temporal, y se interpreta diciendo que la gravedad, en promedio, atrae. Tal interpretación se debe a la relación estudiada en la Subsección 11.6.3 entre curvatura y geodésicas por medio de la ecuación de Jacobi. 12.2.5. Modelos cosmológicos de Robertson-Walker Sea (QC , gC ) la variedad riemanniana modelo de curvatura constante C y dimensión 3, esto es, un plano (C = 0), esfera (C > 0) o espacio hiperbólico (C < 0), Subsección 11.6.2. Sea I ⊆ R un intervalo real y f : I → R una función diferenciable positiva. Se define el espaciotiempo de Robertson-Walker asociado como la variedad producto I × QC dotada de la métrica g = −dt2 + f 2 (t)gC , donde t (función tiempo universal) es la proyección de I × QC sobre I. Usando la identificación natural T(t0 ,x0 ) (I × QC ) ≡ Tt0 I × Tx0 QC , cada vector v ∈ T(t0 ,x0 ) (I × QC ) puede escribirse como v = (vt0 , vx0 ) con vt0 ∈ Tt0 I y vx0 ∈ Tx0 QC . Se tiene ası́: g(v, w) = −vt0 wt0 + f 2 (t0 )gC (vx0 , wx0 ). 274 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD Los espaciotiempos de Robertson-Walker son los modelos más simples que describen a gran escala el Universo fı́sico y, pese a su sencillez, hay buenos argumentos fı́sicos de plausibilidad a su favor4 . Para las métricas tipo g = −dt2 + f 2 (t)gC que aparecen en este tipo de modelos no resulta difı́cil computar el tensor de Ricci y la curvatura escalar, ası́ como escribir la ecuación de Einstein. De hecho, dependiendo de la función f y resolviendo las correspondientes ecuaciones de Einstein, aparecerán distintas posibilidades para f (universos de Friedmann, suponiendo que T es el correspondiente a un “fluido perfecto”). La condición de convergencia temporal (12.8) tiene importantes consecuencias en los espaciotiempos de Robertson-Walker. En efecto, si esta condición se verifica entonces Ric(∂t , ∂t ) ≥ 0. (12.9) Ahora bien, no es difı́cil comprobar que esta condición equivale a que f sea cóncava, esto es: f 00 ≤ 0. (12.10) Ejercicio. Compruébese que (12.9) implica (12.10). De (12.10) se sigue necesariamente que si f no es constante entonces el intervalo de definición I de f no puede ser todo R, ya que f debe ser positiva. Es más, si f 0 (t0 ) > 0 para cierto t0 ∈ I entonces I =]a, b[ está acotado por la izquierda, esto es, −∞ < a < b ≤ ∞. Esta conclusión es relevante, porque, efectivamente, se cree5 que actualmente el Universo se está expandiendo, (esto es, f 0 (t0 ) > 0 para el tiempo universal actual t0 ), lo que sugiere que el tiempo universal tuvo un principio: la Gran Explosión o Big Bang (Figura 34). Ideas de este tipo se hallan presentes en los célebres (y mucho más generales) teoremas de singularidades de Hawking y Penrose. 4 Entre ellos: (1) cada hipersuperficie a t ≡ t0 constante, dotada de la métrica espacial g = f 2 (t0 )gC , es isótropa y homogénea, lo que coincide a gran escala con la estructura observada del universo; (2) es un dato experimental aceptado que, a gran escala, el universo se va enfriando, lo que permite identificar la función tiempo universal t con, esencialmente, la inversa de la temperatura media del universo. 5 Debido al corrimiento al rojo del espectro de las estrellas, por el efecto Doppler. 12.2. RELATIVIDAD GENERAL 275 Figura 34 Posibilidades para f (> 0) si f 00 ≤ 0 y f no es constante. Si f 0 (t0 ) > 0 para algún t0 ∈ I, necesariamente el extremo inicial a debe ser finito. 12.2.6. Espaciotiempo de Schwarzschild La caracterı́stica más sorprendente del espaciotiempo de Schwarzschild es que conduce a la aparición de una singularidad fı́sica que, a diferencia de las que eventualmente pueden tener los espaciotiempos de Robertson-Walker, estarı́a presente en el Universo actual, debido a la evolución natural de muchas estrellas. Muy grosso modo, podemos decir que aparece una singularidad fı́sica cuando se dan simultáneamente los siguientes elementos: (1) Existen geodésicas temporales incompletas. Por ejemplo, en el caso de un espaciotiempo Robertson-Walker las geodésicas temporales s 7→ (s, x0 ) son incompletas (hacia el pasado) cuando I =]a, b[, a > −∞. (2) El espaciotiempo es inextensible, esto es, no se puede considerar como un abierto propio de un espaciotiempo mayor. (3) Existe algún “invariante” o función (escalar) asociado al tensor de curvatura que diverja a lo largo de alguna geodésica temporal Pn ijkl Rijkl , incompleta γ (un ejemplo de invariante es i,j,k,l=1 R 6 pero no una coordenada concreta Rijkl ). 6 No obstante, la divergencia de alguna coordenada Rijkl para una “tetrada 276 CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD El espaciotiempo de Schwarzschild modela el campo gravitatorio generado fuera de una estrella con simetrı́a esférica que no rota. Concretamente, se trata de la variedad Q = R×]2m, ∞[×S 2 dotada de la métrica7 µ ¶ 2m 1 2 2 2 2 2 g =− 1− dt2 + 2m dr + r (dθ + sen θdφ ). r 1− r La constante m > 0 admite la interpretación de masa de la estrella. En r = 2m (radio de Schwarzschild) la métrica es singular. Sin embargo, no se trata de una singularidad fı́sica (sino de un horizonte de sucesos). De hecho, si consideramos la región 0 < r < 2m dotada formalmente de la misma métrica, que vuelve a ser una variedad de Lorentz (“agujero negro de Schwarzschild”), es posible “pegar por el borde” ésta con la región r > 2m de manera que desaparezca la singularidad en r = 2m. De manera más precisa, existe un espaciotiempo mayor (K, g) (espaciotiempo de Kruskal) tal que dos abiertos suyos K + , K − son isométricos, respectivamente, a las regiones r > 2m y 0 < r < 2m, estando K + y K − separados por una hipersuperficie en la que g está bien definida. Sin embargo, el agujero negro de Schwarzschild (y, por tanto, el espaciotiempo de Kruskal) presenta una singularidad, que sı́ es fı́sica (en el sentido del principio de esta subsección), en r = 0. El estudio de la evolución estelar muestra que, para estrellas con una masa superior a cierta cantidad crı́tica, el espaciotiempo de Kruskal, incluido el agujero negro de Schwarzschild, puede tomarse como un modelo apropiado de su campo gravitatorio (véase, p. ej., [HE]). paralela” (base de campos sobre γ obtenida por transporte paralelo) sı́ se considera “invariante”, al ser esta propiedad independiente de la tetrada escogida. 7 Las principales condiciones de plausibilidad de este modelo son las siguientes: (1) el Ricci de g es nulo, lo que permite modelar el campo fuera de la estrella, esto es, el vacı́o que rodea la estrella, véase (12.7); (2) la coordenada t se puede interpretar como una coordenada temporal, siendo los coeficientes de la métrica independientes de ella, lo que da idea de una situación estacionaria; (3) cada hipersuperficie a t constante es ortogonal a ∂t (su espacio en reposo), y tiene simetrı́a esférica; (4) asintóticamente, cuando r → ∞, la métrica tiende a la del espacio4 tiempo de Minkowski L . Esencialmente, estas condiciones fijan al espaciotiempo de Schwarzschild unı́vocamente. Bibliografı́a [AM] Abraham R., Marsden J.E., Foundations of Mechanics, (2a Edic.) Advanced Book Program, Perseus Books, Cambridge, Massachusets, 1978. [AMR] Abraham R., Marsden J.E., Ratiu T., Manifolds, tensors, analysis and applications, Addison-Wesley Pub. Co., 1983. [Ar] Armstrong M.A., Topologı́a Básica, Reverté, Barcelona, 1987. [Bu] Burke W.L., Applied Differential Geometry, Cambridge Univ. Press, 1985. [BEE] Beem J. K., Ehrlich P. E., Easley K. L., Global Lorentzian Geometry, Monographs Textbooks Pure Appl. Math. 202 (Dekker Inc., New York, 1996). [dC1] do Carmo M., Riemannian Geometry, Birkhäuser Boston, 1992. [dC2] do Carmo M., Geometrı́a Diferencial de curvas y superficies, Alianza Universidad Textos, 1994. [CM] Curtis W.D., Miller F.R., Differential Manifolds and Theoretical Physics, Academic Press, 1985. [GM] Gamboa J. M., Ruiz J. M., Introducción al estudio de las Variedades Diferenciables, Sanz y Torres, Madrid, 1988. [HE] Hawking S. W., Ellis G. F. R., The Large Scale Structure of Space-time, (Cambridge: Cambridge University Press) 1973. 277 278 BIBLIOGRAFÍA [O’N] O’Neill B., Semi-Riemannian Geometry with applications to Relativity, Series in Pure and Applied Math. 103 Academic Press, N.Y. (1983). [Sa] Sakai T., Riemannian Geometry, Editorial Board, 1996. [Sp1] Spivak M., A Comprehensive Introduction to Differential Geometry, Volume II, Publish or Perish, INC., Boston, 1970. [Sp2] Spivak M., Cálculo en variedades, Reverté, 1970.