Introducción a la GEOMETRÍA DIFERENCIAL DE

Transcripción

Introducción a la
GEOMETRÍA DIFERENCIAL
DE VARIEDADES
Miguel Sánchez Caja
José Luis Flores Dorado
Depto. Geometrı́a y Topologı́a,
Universidad de Granada, 2003
Déposito Legal: GR-1558/04
Índice general
1. Topologı́a básica
1.1. Generalidades . . . . . . . . .
1.2. Construcción de topologı́as . .
1.3. Axiomas de numerabilidad . .
1.4. Lı́mites. Espacios Hausdorff .
1.5. Continuidad . . . . . . . . . .
1.6. Espacios topológicos métricos
1.7. Conexión y arcoconexión . . .
1.8. Compacidad . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2. El concepto de variedad diferenciable
2.1. Concepto de variedad topológica . . .
2.2. Variedades diferenciables . . . . . . .
2.3. Aplicaciones diferenciables . . . . . .
2.4. Hipersuperficies regulares de Rn . . .
2.5. Subvariedades regulares de Rn . . . .
2.6. Apéndice 1: atlas en §2 . . . . . . . .
2.7. Apéndice 2: coordenadas en R3 . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
8
9
10
12
16
18
.
.
.
.
.
.
.
23
23
26
31
34
38
41
44
3. Espacio tangente
3.1. Concepto de vector tangente . . . . . . . . . . . . . . .
3.1.1. Vector tangente como clase de equivalencia de
curvas . . . . . . . . . . . . . . . . . . . . . . .
3.1.2. Vector tangente por coordenadas . . . . . . . .
3.1.3. Vector tangente como derivación . . . . . . . . .
3.2. Estructura del espacio tangente . . . . . . . . . . . . .
3.2.1. Vectores tangentes inducidos por los entornos coordenados . . . . . . . . . . . . . . . . . . . . .
i
49
49
50
52
53
55
56
ii
ÍNDICE GENERAL
3.2.2. Estructura de espacio vectorial de
3.3. Variedad tangente . . . . . . . . . . . . .
3.4. Apéndice: Mecánica Lagrangiana . . . .
3.4.1. Lagrangianas . . . . . . . . . . .
3.4.2. Curvas crı́ticas de la acción . . .
4. Aplicaciones diferenciables
4.1. Diferencial de una función . . . .
4.1.1. Concepto . . . . . . . . .
4.1.2. Expresión en coordenadas
4.1.3. Cambio de coordenadas .
4.2. El espacio cotangente . . . . . . .
4.3. Diferencial de una aplicación . . .
4.4. Teoremas fundamentales . . . . .
4.5. Apéndice: el espacio dual . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Campos vectoriales
5.1. Concepto de campo vectorial . . . . . . .
5.2. Estructura de los campos vectoriales . .
5.3. Paralelizabilidad . . . . . . . . . . . . .
5.4. Curvas integrales. Flujos . . . . . . . . .
5.5. Grupo uniparamétrico de difeomorfismos
5.6. Corchete de Lie . . . . . . . . . . . . . .
5.7. Apéndice: Grupos y Álgebras de Lie . . .
Tp Q
. . .
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
60
62
63
64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
69
69
69
70
71
73
76
79
.
.
.
.
.
.
.
85
85
86
87
89
91
95
99
.
.
.
.
.
.
.
.
.
.
.
.
105
105
105
107
108
111
111
112
112
116
117
118
118
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. Tensores y formas diferenciales
6.1. Tensores en un espacio vectorial . . . . . . . . . . . .
6.1.1. Concepto . . . . . . . . . . . . . . . . . . . .
6.1.2. Producto tensorial . . . . . . . . . . . . . . .
6.1.3. Tensores tipo (r, s) con r + s = 2 . . . . . . .
6.1.4. Tensores tipo (r, s) . . . . . . . . . . . . . . .
6.1.5. Tensores simétricos y antisimétricos tipo (2, 0)
6.2. Tensores sobre variedades . . . . . . . . . . . . . . .
6.2.1. Tensores en un espacio vectorial tangente . . .
6.2.2. Campos tensoriales . . . . . . . . . . . . . . .
6.3. Formas diferenciales . . . . . . . . . . . . . . . . . .
6.4. La diferencial exterior . . . . . . . . . . . . . . . . .
6.4.1. Formas exactas . . . . . . . . . . . . . . . . .
ÍNDICE GENERAL
iii
6.4.2. Diferencial de formas. Lema de Poincaré
6.5. Circulación de una forma diferencial . . . . . . .
6.6. Apéndice 1: conexión simple . . . . . . . . . . .
6.7. Apéndice 2: Termodinámica . . . . . . . . . . .
7. Campos tensoriales métricos
7.1. Métricas riemannianas y lorentzianas . . . .
7.2. Gradiente de una función . . . . . . . . . . .
7.3. Campos conservativos e irrotacionales . . . .
7.4. Circulación de un campo vectorial . . . . . .
7.5. Isometrı́as . . . . . . . . . . . . . . . . . . .
7.6. Distancia en el caso riemanniano . . . . . .
7.7. Apéndice 1: bemol y sostenido . . . . . . . .
7.8. Apéndice 2: M. Lagrangiana y Hamiltoniana
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
122
125
127
.
.
.
.
.
.
.
.
131
131
135
137
138
139
141
142
144
8. Integración en Variedades
155
8.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . 156
8.2. Integración de n−formas diferenciales . . . . . . . . . . 159
8.2.1. El problema de la integración sobre una variedad 159
8.2.2. Integración de n-formas en entornos coordenados 161
8.2.3. Integración general de n−formas . . . . . . . . 163
8.2.4. Particiones de la unidad e integración . . . . . . 165
8.3. Integración de funciones . . . . . . . . . . . . . . . . . 167
8.3.1. Elementos de volumen e integración de funciones 167
8.3.2. Integración en variedades semi-riemannianas . . 167
8.4. Teorı́a de la medida . . . . . . . . . . . . . . . . . . . . 169
8.4.1. Nota previa sobre la integral de Riemann . . . . 169
8.4.2. Medida de Lebesgue . . . . . . . . . . . . . . . 171
8.4.3. Integral de Lebesgue en Rn . . . . . . . . . . . 172
8.4.4. Conjuntos de medida nula y espacio de medida
en una variedad . . . . . . . . . . . . . . . . . . 175
8.4.5. Integración en una variedad . . . . . . . . . . . 176
8.5. Apéndice 1: álgebra exterior sobre V (R) . . . . . . . . 178
8.6. Apéndice 2: Elementos de volumen en V (R) . . . . . . 183
8.6.1. Elemento de volumen y orientación . . . . . . . 183
8.6.2. Determinante de un endomorfismo . . . . . . . 184
8.6.3. El elemento de volumen métrico orientado . . . 185
8.7. Apéndice 3: r−formas y orientación . . . . . . . . . . . 186
iv
ÍNDICE GENERAL
8.7.1. El álgebra de r−formas diferenciales . . . . . . 186
8.7.2. Orientación de una variedad . . . . . . . . . . . 187
8.7.3. El recubridor de dos hojas orientable . . . . . . 189
9. Teorema de Stokes
9.1. Derivaciones y antiderivaciones . . . . . . . .
9.1.1. Derivación tensorial . . . . . . . . . . .
9.1.2. Antiderivación tensorial . . . . . . . .
9.1.3. Teorema de Cartan . . . . . . . . . . .
9.2. Variedades con borde . . . . . . . . . . . . . .
9.2.1. Diferenciabilidad en abiertos de Rn+ . .
9.2.2. Concepto de variedad con borde . . . .
9.2.3. Orientación en el borde . . . . . . . . .
9.3. Teorema de Stokes . . . . . . . . . . . . . . .
9.4. Primeras aplicaciones . . . . . . . . . . . . . .
9.4.1. Fórmula de Green-Riemann en el plano
9.4.2. Teorema integral de Cauchy . . . . . .
9.4.3. Teorema clásico de Stokes . . . . . . .
9.5. Teorema de la Divergencia . . . . . . . . . . .
9.6. Aplicaciones del T. de la Divergencia . . . . .
9.7. Fórmulas de Green . . . . . . . . . . . . . . .
9.8. Apéndice: producto vectorial . . . . . . . . . .
9.8.1. Isomorfismos especiales en (V 3 (R), µ0 ).
9.8.2. El rotacional . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
191
191
191
194
198
199
200
201
204
206
209
209
210
211
214
216
221
223
223
224
.
.
.
.
.
.
.
225
225
229
231
234
236
237
238
11.Curvatura
11.1. Concepto de curvatura . . . . . . . . . . . . . . . . . .
11.2. Tensor de curvatura 4-covariante . . . . . . . . . . . .
11.3. Curvatura seccional . . . . . . . . . . . . . . . . . . . .
241
241
242
243
10.Conexiones afines
10.1. Concepto de conexión afı́n
10.2. Sı́mbolos de Christoffel . .
10.3. Derivada covariante . . . .
10.4. Transporte paralelo . . . .
10.5. Geodésicas . . . . . . . . .
10.6. Conexiones simétricas . . .
10.7. Aplicación exponencial . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
11.4. Tensor de Ricci . . . . . . . . . . . . .
11.5. Curvatura escalar . . . . . . . . . . . .
11.6. Significado de la curvatura . . . . . . .
11.6.1. Orı́genes geométricos . . . . . .
11.6.2. Cómo la curvatura determina la
11.6.3. Ecuación de Jacobi . . . . . . .
11.6.4. Otras propiedades . . . . . . . .
v
. . . . .
. . . . .
. . . . .
. . . . .
métrica
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12.Algunas notas sobre Relatividad
12.1. Relatividad Especial . . . . . . . . . . . . . . . . .
12.1.1. Espacios vectoriales lorentzianos . . . . . . .
12.1.2. El grupo de Lorentz . . . . . . . . . . . . .
12.1.3. L4 como modelo de espaciotiempo . . . . . .
12.1.4. La constancia de la velocidad de la luz . . .
12.1.5. Algunas consecuencias del modelo . . . . . .
12.2. Relatividad General . . . . . . . . . . . . . . . . . .
12.2.1. El modelo matemático . . . . . . . . . . . .
12.2.2. Causalidad . . . . . . . . . . . . . . . . . .
12.2.3. Maximización por geodésicas causales . . . .
12.2.4. Ecuación de Einstein . . . . . . . . . . . . .
12.2.5. Modelos cosmológicos de Robertson-Walker
12.2.6. Espaciotiempo de Schwarzschild . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
244
245
246
246
250
252
253
.
.
.
.
.
.
.
.
.
.
.
.
.
255
255
255
257
259
261
263
265
265
267
269
270
273
275
vi
ÍNDICE GENERAL
Nota introductoria
El presente volumen recoge los apuntes del curso “Fı́sica Matemática III:
Ga Diferencial y Variedades” impartido por el primero de los autores en
la licenciatura de Fı́sica desde el año 00/01. Su objetivo es ofrecer una
introducción rápida a la Geometrı́a Diferencial que provea al estudiante de una base geométrica para la Mecánica Racional, la Relatividad
General y otras ramas de la Fı́sica.
Con este objetivo, hacemos especial hincapié en la reflexión sobre
los conceptos y estructuras geométricas, ilustrándolos con ejemplos comunes en Fı́sica. Las demostraciones también están orientadas a este
fin, por lo que se seleccionan aquéllas que permiten profundizar en los
conceptos o resolver problemas concretos. No obstante, aunque se excluyan demostraciones, a menudo se dan esquemas o ideas intuitivas
de ellas, que aporten más seguridad a los conocimientos adquiridos.
Estos apuntes también se han revelado útiles para alumnos de Matemáticas como los de doctorado, los cuales, una vez concluida la licenciatura, han necesitado reordenar sus conocimientos geométricos. No
obstante, conviene que los lectores de formación matemática tengan
presente las siguientes dos advertencias:
(1) El objetivo de las frecuentes “Notas” o “Apéndices” sobre cuestiones de motivación fı́sica no es enseñar éstas a quien se las tope por
primera vez: si éste es el caso, resulta preferible saltárselas. Su modesto
objetivo es permitir, a quien ya las ha estudiado alguna vez (aunque,
probablemente, con un lenguaje muy diferente) ubicarlas en el contexto
geométrico apropiado.
(2) Aunque los conceptos se suelen definir del modo intrı́nseco “libre
de coordenadas” usual en la Matemática moderna, se hace especial
hincapié en las expresiones en coordenadas (incluso desde el punto
de vista de los fundamentos). Ello suele ser especialmente útil para
vii
viii
ÍNDICE GENERAL
los fı́sicos, pero no creemos que deba obviarlo un matemático. Por el
contrario, en nuestra opinión, éste debe adquirir suficiente soltura en
cálculos concretos usando coordenadas.
Partimos de un conocimiento básico de Cálculo Diferencial e Integral
en varias variables, ası́ como de Álgebra Lineal. No obstante, algunos
temas de ésta, que no suelen conocerse con mucha profundidad (espacio
dual, tensores) se repasan en secciones especı́ficas. No presuponemos,
sin embargo, ningún conocimiento previo de topologı́a, por lo que,
brevemente, el Tema 1 se dedica a ella.
Aparte de este primer tema sobre topologı́a, y del último, que proporciona una introducción geométrica a la Teorı́a de la Relatividad, el
volumen puede dividirse en cuatro partes:
Parte I. Temas 2–4. Se introducen los “fundamentos” del concepto de
variedad, mostrando cómo el Cálculo Diferencial puede extenderse a
espacios mucho más generales que los abiertos de Rn . Merece comentarse:
(a) Aunque el concepto de variedad diferenciable pueda introducirse
de manera bastante más directa (“conjunto dotado de un atlas diferenciable maximal”) preferimos detenernos primero en el de variedad
topológica. La topologı́a que subyace a toda variedad diferenciable origina muchas de sus propiedades, y los preliminares del Tema 1 permiten
entenderla con rigor.
(b) Tampoco presuponemos un conocimiento previo de superficies
de R3 , por lo que éstas y, en general, las subvariedades de Rn , aparecerán a menudo como ejemplos de variedades. Sin embargo, aunque se
estudien en particular sus propiedades, nuestro punto de vista es el de
la geometrı́a intrı́nseca, al resultar ésta esencial en los fundamentos de
la Fı́sica Teórica. La geometrı́a extrı́nseca de curvas y superficies, mucho más intuitiva (y de utilidad práctica en problemas más cotidianos)
no la desarrollamos por razones de espacio. No obstante, hay excelentes
manuales sobre ella, como el libro de do Carmo [dC2]. Recomendamos
al alumno que nunca la haya estudiado, consultar la bibliografı́a para
formarse una mejor idea de conjunto, y para que su aproximación a la
Geometrı́a Diferencial resulte más gradual.
(c) Los vectores tangentes y aplicaciones diferenciables se introducen de diversas maneras, progresivamente más abstractas, ası́: vectores como clases de equivalencia de curvas / vectores por coordenadas
ÍNDICE GENERAL
ix
/ derivaciones. A pesar de las redundancias y poca economı́a lógica que
esto supone, creemos que ası́ se hacen más asimilables esos conceptos.
Parte II. Temas 5–7. Se estudian objetos geométricos elementales sobre
una variedad diferenciable, hasta un primer contacto con la geometrı́a
riemanniana. Aparte del tratamiento algebraico de campos tensoriales
sobre la variedad, se introducen: (i) campos vectoriales (curvas integrales, flujos), (ii) formas diferenciales (circulación, formas cerradas y
exactas) y (iii) métricas riemannianas o, con más generalidad, semiriemannianas. Ponemos especial interés en mostrar cómo, fijada una
tal métrica, los conceptos asociados a formas diferenciales pueden aplicarse a campos vectoriales (y viceversa). La utilidad de las métricas
riemannianas, y su fácil asimilación intuitiva, hacen que anticipemos
algunos conceptos, como el de distancia asociada, que se estudian con
más detalle posteriormente. Ası́, al terminar esta segunda parte, el lector habrá adquirido unas nociones mı́nimas de geometrı́a riemanniana.
Parte III. Temas 8–9. Se estudia integración en variedades, tanto desde
el punto de vista de la integración de n-formas diferenciales en variedades orientadas, como del de la integración de funciones en un espacio
de medida, definido éste de manera natural a partir de una métrica
semi-riemanniana. El motivo de desarrollar ambos enfoques se debe a
que el alumno, probablemente, se tropezará antes o después con los
dos, aunque en las referencias al uso suelan escoger sólo uno. Se pretende, pues, que se adquiera una visión de conjunto sobre integración.
Los conceptos relacionados de álgebra exterior de formas diferenciales y
orientación (para el primer enfoque) o de integración de Lebesgue (para
el segundo) se explican sucintamente. En el Tema 9, dedicado al Teorema de Stokes, también desarrollamos los conceptos de derivaciones y
antiderivaciones tensoriales. Muchas de las consecuencias del Teorema
de Stokes tienen utilidad práctica, tanto en partes de la Fı́sica (electromagnetismo, Teorı́as de Campos...) como más puramente matemáticas
(cálculo de áreas, valores propios del laplaciano...), y nos centramos en
las más clásicas.
La Parte III resulta independiente de la Parte IV posterior, con lo
que el lector interesado en ésta puede leerla directamente después de
la I y II, sin pérdida de continuidad.
Parte IV. Temas 10–11. Se estudia la conexión de Levi-Civita asociada
a una métrica (y, en general, conexiones afines), ası́ como sus elemen-
x
ÍNDICE GENERAL
tos geométricos asociados: derivada covariante, geodésicas, curvatura...
Estos conceptos matemáticos son más sutiles que el de métrica riemanniana, y su desarrollo histórico fue largo y complejo. De ahı́ que
hayamos preferido sacrificar (parcialmente) la intuición, introduciendo
los conceptos de una manera “lógicamente económica”. No obstante,
se intenta justificar la naturalidad de las definiciones, aunque sea a
posteriori. Ası́, p. ej., el Tema 11 concluye con un repaso puramente
intuitivo del concepto de curvatura en Geometrı́a, con el objetivo de
hacer más asimilable la muy abstracta definición de (tensor) curvatura
de una variedad riemanniana.
Concluimos con un tema introductorio a la Relatividad General (y,
por completitud, también a la Especial). Se pretende ilustrar ası́ la
aplicabilidad de la geometrı́a aprendida a esta parte fundamental de
la Fı́sica, que la genialidad de Einstein pudo desarrollar gracias a la
Geometrı́a Diferencial preexistente.
No queremos terminar sin expresar nuestra gratitud a nuestros alumnos
quienes, con agudas preguntas y disparatados comentarios, han ayudado en buena medida a enfocar estos apuntes. En particular, agradecemos a Jorge de Blas Mateo que nos prestara sus apuntes correspondientes al primer año en que impartimos la asignatura.
Los autores somos conscientes de la no escasa dificultad que, probablemente, hallarán los alumnos a quienes en primer lugar se dirige
el presente volumen. Pero les animamos a perseverar: si, como decı́a
Galileo, el libro de la Naturaleza está escrito “in lingua matematica”
pocas tareas resultarán tan gratificantes como dominar esta lengua.
Capı́tulo 1
Topologı́a básica
1.1.
Generalidades
Intuitivamente la Topologı́a es la rama de las matemáticas que estudia las propiedades de los objetos que se conservan cuando estos se
deforman sin “cortar” ni “pegar” (con la excepción de que es posible
“cortar” si luego se “pega” por el mismo sitio). Por ejemplo, la superficie de una bola es topológicamente equivalente a la de una pelota de
rugby o la de una barra, aunque no lo es a la de un toro, puesto que este
último tiene un agujero. Este último es topológicamente equivalente a
un toro “anudado” como el de la Figura 1. En el presente capı́tulo estudiaremos algunos preliminares topológicos, que pueden encontrarse
en cualquier libro elemental de Topologı́a (p. ej., véase [AMR, Chapter
1] o [Ar]).
1
2
CAPÍTULO 1. TOPOLOGÍA BÁSICA
Figura 1
Definiciones 1.1.1 Dado un conjunto X diremos que una colección
de subconjuntos τ de X es una topologı́a si verifica:
(i) ∅, X ∈ τ .
(ii) Si U, V ∈ τ entonces U ∩ V ∈ τ (o, equivalentemente, la intersección finita de elementos de τ pertenece a τ ).
(iii) La unión arbitraria de elementos de τ pertenece a τ .
Al par (X, τ ) lo llamaremos espacio topológico. A cada elemento de la
topologı́a τ lo llamaremos abierto.
Ejemplos:
(1) Dado un conjunto X definimos la topologı́a trivial de X como
τ = {X, ∅}.
(2) Dado un conjunto X definimos la topologı́a discreta de X como
τ = P(X) (conjunto de las partes de X, esto es, colección de
todos los subconjuntos de X).
1.1. GENERALIDADES
3
(3) Dado X = R definimos la topologı́a usual τ de R como la colección de todos los conjuntos que son intervalos abiertos o uniones
arbitrarias de ellos.
(4) Dado X = R2 definimos la topologı́a usual de R2 como la colección de todos los rectángulos sin borde ]a, b[×]a0 , b0 [ o uniones
arbitrarias de ellos. Ello es claramente generalizable a Rn , n ∈ N,
cuyos abiertos para la topologı́a usual se definen como uniones
arbitrarias de n−rectángulos, cada uno de éstos definido como el
producto cartesiano de n intervalos abiertos. Salvo especificación
contraria, Rn se considerará dotado siempre de la topologı́a usual.
Como ejemplo veamos que (3) es una topologı́a. Obviamente, se verifican los axiomas (i) (∅ =]a, a[, R =] − ∞, ∞[) y (iii). Por tanto, sólo
resta comprobar (ii). Para ello es suficiente demostrar que si U, V son
abiertos y x ∈ U ∩ V entonces existe un intervalo abierto Ix ⊆ U ∩ V
tal que x ∈ Ix (pues en este caso U ∩ V = ∪x∈U ∩V Ix ∈ τ ). Como x ∈ U
(resp. x ∈ V ), que es abierto, existe ]a1 , b1 [⊆ U (resp. ]a2 , b2 [⊆ V ) tal
que x ∈]a1 , b1 [ (resp. x ∈]a2 , b2 [). Por tanto, basta tomar Ix =]a, b[ con
a = Max{a1 , a2 }, b = Min{b1 , b2 }.
Definición 1.1.2 Sea (X, τ ) un espacio topológico, decimos que A ⊆
X es cerrado si su complemento en X (es decir, X − A = {x ∈ X :
x 6∈ A}) es abierto.
Ejemplos:
(1) ∅ y X son cerrados.
(2) En R con la topologı́a usual el subconjunto [0, 1] es cerrado ya
que R − [0, 1] =] − ∞, 0[∩]1, ∞[ es abierto. Sin embargo, los subconjuntos [0, 1[ y ]0, 1[∪[2, 7] no son cerrados ni abiertos.
(3) En un conjunto arbitrario X con la topologı́a trivial los únicos
subconjuntos cerrados o abiertos son ∅ y X.
(4) En un conjunto arbitrario X con la topologı́a discreta todo subconjunto es cerrado y abierto.
(5) En R3 se ha definido la topologı́a usual como la colección de todos
los subconjuntos del tipo ]a1 , b1 [×]a2 , b2 [×]a3 , b3 [ (3-rectángulos)
4
o uniones arbitrarias de ellos. No es difı́cil comprobar que la esfera
unidad S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} ⊂ R3 es un
cerrado.
Las propiedades de los cerrados se deducen inmediatamente de las
definiciones:
(1) ∅ y X son cerrados.
(2) La intersección arbitraria de cerrados es un cerrado.
(3) Si U y V son cerrados entonces U ∪ V también lo es (o, equivalentemente, la unión finita de cerrados es un cerrado).
Definiciones 1.1.3 Sea (X, τ ) un espacio topológico. Un entorno abierto de x ∈ X es un abierto U tal que x ∈ U . Un entorno de x es un
conjunto N ⊆ X que contiene a un entorno abierto de x.
Definiciones 1.1.4 Sean (X, τ ) un espacio topológico, A ⊆ X y x ∈
X. Diremos que:
(1) x es un punto interior de A si existe un entorno de x incluido en
A. Usaremos la notación Å= {x ∈ A : x es punto interior de A}.
(2) x es un punto adherente de A si todo entorno de x interseca a A.
Usaremos la notación A = {x ∈ X : x es punto adherente de A}.
Se dice que A es denso en X is A = X.
(3) x es un punto frontera de A si es adherente de A y de X − A.
Usaremos la notación ∂A = {x ∈ X : x es punto frontera de A}.
(4) x es un punto de acumulación de A si todo entorno de x interseca
a A en puntos distintos de x. Usaremos la notación A0 = {x ∈
X : x es punto de acumulación de A}.
(5) x es un punto aislado de A si existe un entorno N de x tal
que N ∩ A = {x}. Usaremos la notación Ais(A) = {x ∈ A :
x es punto aislado de A}.
Ejercicio. Clasifı́quense los puntos del subconjunto A ⊂ R2 de la
Figura 2 definido como la unión del punto p, la curva γ (con un extremo
incluido) y la región interior de la curva ρ junto con parte de esta curva.
Algunas propiedades inmediatas:
1.2. CONSTRUCCIÓN DE TOPOLOGÍAS
5
Figura 2
(1) Å ⊆ A ⊆ A
(2) ∂A = A ∩ (X − A)
(3) A = A ∪ ∂A =Å∪∂A
(4) Å coincide con la unión de todos los abiertos incluidos en A (Å
es el abierto “más grande” incluido en A).
(5) A coincide con la intersección de todos los cerrados que contienen
a A (A es el “menor cerrado” que contiene a A).
Ejercicio. Clasifı́quense los puntos del conjunto A = [0, 1[∪{7}∪ (] −
3, 0[−] − 2, −1[) ⊂ R.
Ejercicio. Clasifı́quense los puntos de un subconjunto arbitrario A ⊆
X con cardinal mayor que 1 cuando se considera para X: (i) la topologı́a
discreta, (ii) la topologı́a trivial.
1.2.
Algunos modos de construcción de
topologı́as
Existen diferentes modos de definir una topologı́a sobre un conjunto
X que pueden ser útiles dependiendo de la manera en que viene dado
dicho conjunto:
6
A. Bases topológicas. Dado un espacio topológico (X, τ ) una base
topológica o de entornos suya es un conjunto de abiertos B ⊆ τ tal
que todo abierto (no vacı́o) U ∈ τ se puede expresar como unión de
elementos de B.
Ejemplos:
(1) En R con la topologı́a usual una base topológica es la colección
de todos los intervalos abiertos de R.
(2) En Rn con la topologı́a usual una base topológica es la colección
de todos los n-rectángulos abiertos de Rn .
(3) En Rn con la topologı́a usual una base topológica es la colección
de todas las bolas abiertas Bp (r) = {x ∈ Rn : kx − pk < r}, p ∈
Rn , r > 0.
No es difı́cil comprobar que, dado un conjunto X y una colección arbitraria B de subconjuntos de X tal que X = ∪B∈B B, se verifica: B
es una base topológica para alguna topologı́a τ de X si y sólo si para
cualesquiera B1 , B2 ∈ B la intersección B1 ∩ B2 se puede escribir como
unión de elementos de B. En este caso1 , τ está determinada de manera
única, y sus abiertos se construyen como uniones de elementos de B.
B. Subespacios topológicos. Dado un espacio topológico (X, τ )
y un subconjunto A ⊆ X definimos la topologı́a inducida en A por τ
como la topologı́a de A: τA = {A ∩ U : U ∈ τ }. Ası́ todo subconjunto arbitrario de R3 (por ejemplo, superficies como la esfera S 2 =
{(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}) tiene una topologı́a natural, que
es la inducida por la usual de R3 . Cabe destacar que los abiertos de A
con τA no tienen por qué ser abiertos de X con τ . Ası́, p. ej.: (a) los
abiertos de S 2 no lo son de R3 (salvo el ∅), o (b) un abierto de [0, 1]
(con la topologı́a inducida de R) es ]1/2, 1].
C. Topologı́a producto. Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos, se define la topologı́a producto en X × X 0 como aquella topologı́a
1
En el caso de que no se verificara esta condición, se puede demostrar que los
elementos de B junto con las intersecciones finitas de ellos (y, eventualmente, el
total X), determinan una base topológica; se dice entonces que B es una subbase
topológica. La topologı́a ası́ generada se puede caracterizar como la menos fina (la
que tiene menos abiertos) de entre las que contienen a B o, equivalentemente, como
la intersección de todas las topologı́as que contienen a B
1.2. CONSTRUCCIÓN DE TOPOLOGÍAS
7
que admite por base topológica los productos U × U 0 , donde U, U 0 son
abiertos de τ, τ 0 , respectivamente. Por ejemplo, la topologı́a usual de
R2 coincide con la topologı́a producto de R × R.
D. Topologı́a cociente. Dado un espacio topológico (X, τ ) y una
relación de equivalencia ∼ definida en X, sea X/ ∼ el conjunto cociente, esto es, el conjunto de todas las clases de equivalencia, y π la
proyección canónica, es decir,
π : X → X/ ∼
x 7→ [x],
donde [x] denota la clase de equivalencia de x. Definimos la topologı́a
cociente en X/ ∼ como aquélla que tiene por abiertos los subconjuntos
del tipo U ⊂ X/ ∼ tales que π −1 (U ) es un abierto de τ . En efecto,
es inmediato comprobar que ası́ se define una topologı́a, usando: (i)
π −1 (∅) = ∅, π −1 (X/ ∼) = X, (ii) π −1 (U ∩ V ) = π −1 (U ) ∩ π −1 (V ) y
(iii) π −1 (∪α Uα ) = ∪α π −1 (Uα ).
Ejemplos:
(1) En X = [0, 1] ⊂ R definimos la relación de equivalencia: x ∼ x
para todo x ∈ [0, 1] y 0 ∼ 1, 1 ∼ 0. El espacio topológico cociente
se puede visualizar como2 una circunferencia.
(2) En X = R2 definimos la relación de equivalencia (x, y) ∼ (x0 , y 0 )
si x − x0 ∈ Z y y − y 0 ∈ Z. El espacio topológico cociente R2 / ∼
se puede visualizar como un toro.
(3) En el subespacio topológico [0, 1] × [0, 1] de R2 se considera la
relación de equivalencia que se obtiene a partir de identificar cada
(0, y) con (1, y), ∀y ∈ [0, 1]. El cociente puede visualizarse como
un cilindro (con “borde” y sin “tapas”). Si se considera la relación
de equivalencia que se obtiene a partir de identificar cada (0, y)
con (1, 1−y) el cociente puede visualizarse como la popular cinta
de Moebius (que es una superficie de R3 con una sola cara, un
solo borde, y para la que no existe una elección continua posible
2
De manera rigurosa, la expresión “poder visualizar como” significa “ser homeomorfo a” (siendo el codominio del homeomorfismo un subespacio topológico de
R3 ); véase la Definición 1.5.3.
8
de un vector normal en cada punto). Si en la cinta de Moebius
además se identifica cada (x, 0) con (x, 1) el cociente (botella de
Klein) no puede visualizarse propiamente como una superficie de
R3 .
1.3.
Axiomas de numerabilidad
Una condición implı́cita en muchas topologı́as es la siguiente:
Definición 1.3.1 Un espacio topológico (X, τ ) verifica el segundo axioma de numerabilidad (ANII) si admite una base topológica numerable,
es decir, finita o con el cardinal de N.
Aún más, esta condición puede relajarse:
Definición 1.3.2 Un espacio topológico (X, τ ) verifica el primer axioma de numerabilidad (ANI) si cada punto x ∈ X admite una base numerable de entornos, esto es, una sucesión de entornos abiertos {Un }n
(que puede elegirse de manera que Un+1 ⊂ Un para todo n) tal que:
para todo entorno N de x existe un n ∈ N tal que Un ⊂ N .
Observaciones:
(1) No es difı́cil comprobar: ANII⇒ANI. De hecho, la sucesión {Un }n
desempeña el papel de “base topológica numerable” alrededor de
x.
(2) R (y, en general, Rn ) con la topologı́a usual es ANII (y, por tanto,
ANI). En efecto, una base numerable de la topologı́a usual de R
es B = {]x−², x+²[: x, ² ∈ Q} (recordemos que Q es numerable).
(3) R con la topologı́a discreta es ANI pero no es ANII. En efecto,
dado x ∈ R tómese, en la definición de ANI, Un ≡ {x} ∀ n ∈ N.
Sin embargo, cualquier base de la topologı́a discreta de R debe
contener a cada uno de los números reales como abierto suyo y,
por tanto, no puede ser numerable (el cardinal de R es mayor
que el de N).
1.4. LÍMITES. ESPACIOS HAUSDORFF
1.4.
9
Lı́mites. Espacios Hausdorff
Definición 1.4.1 Sea (X, τ ) un espacio topológico y {xn }n ⊆ X una
sucesión de elementos de X. Diremos que {xn }n converge a x ∈ X
si para todo entorno N de x existe un n0 ∈ N tal que xn ∈ N para
todo n ≥ n0 . En este caso diremos que x es un lı́mite de {xn }n y
escribiremos {xn }n → x.
Ejemplos:
(1) La sucesión {1/n}n ⊂ R converge a 0 con la topologı́a usual.
(2) Consideremos en un conjunto X la topologı́a trivial. Entonces
cualquier sucesión de X converge a cualquier elemento de X.
Ası́, el lı́mite de una sucesión puede no ser único.
El problema de la posible falta de unicidad de los lı́mites, entre otros,
se evita con el siguiente concepto.
Definición 1.4.2 Se dice que un espacio topológico (X, τ ) es Hausdorff (ó T2 ) si para cualesquiera x, y ∈ X x 6= y, existen entornos
Nx , Ny de x e y, respectivamente, tales que Nx ∩ Ny = ∅.
Proposición 1.4.3 En todo espacio topológico Hausdorff (X, τ ) el lı́mite de una sucesión convergente es único.
Demostración. Supongamos, por reducción al absurdo, que una sucesión {xn }n ⊆ X satisface {xn }n → x, {xn }n → y, siendo x 6= y. Como
X es Hausdorff existen entornos Nx , Ny de x e y respectivamente que
son disjuntos. En consecuencia, existe un n0 (resp. n00 ) tal que xn ∈ Nx
(resp. xn ∈ Ny ) si n ≥ n0 (resp. n ≥ n00 ). Entonces, si n = Max{n0 , n00 }
tenemos que xn ∈ Nx ∩ Ny , lo que contradice que Nx ∩ Ny = ∅. 2
Es inmediato comprobar que todo subespacio topológico de un espacio topológico Hausdorff es también Hausdorff.
Ejemplos:
(1) Rn con la topologı́a usual (y todos sus subconjuntos con la topologı́a inducida) es Hausdorff.
(2) Obviamente, ningún conjunto X con cardinal mayor que uno y
dotado de la topologı́a trivial es Hausdorff. Todo conjunto con la
topologı́a discreta es Hausdorff.
10
(3) Sea X = R ∪ {00 } donde 00 es un elemento que no pertenece a
R, y consideremos la topologı́a que tiene por base la colección
formada por: (a) los abiertos de R (con la topologı́a usual) y
(b) los subconjuntos que resultan de tomar los abiertos de R
que contienen al 0, y reemplazar 0 por 00 . Esta topologı́a no es
Hausdorff: los puntos 0 y 00 no se pueden “separar” por entornos.
1.5.
Continuidad
Definición 1.5.1 Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos y f :
X → X 0 una aplicación entre ellos. Se dice que f es continua en
x0 ∈ X si para todo entorno abierto U 0 de f (x0 ) existe un entorno
abierto U de x0 tal que f (U ) ⊆ U 0 . Diremos que f es continua si lo es
en todos los puntos de X (véase la Figura 3).
Figura 3
Por supuesto, en la definición anterior podemos reemplazar la expresión “entorno abierto” por “entorno” (compruébese). También es fácil
comprobar:
Proposición 1.5.2 Una aplicación entre dos espacios topológicos f :
X → X 0 es continua si y sólo si f −1 (U 0 ) es abierto de (X, τ ) para todo
abierto U 0 de (X 0 , τ 0 ).
1.5. CONTINUIDAD
11
Definición 1.5.3 La aplicación f : X → X 0 se dice que es un homeomorfismo si es biyectiva y tanto f como f −1 son continuas.
Dos espacios topológicos (X, τ ), (X 0 , τ 0 ) son homeomorfos si existe
un homeomorfismo entre ellos (f : X → X 0 o, equivalentemente, g :
X 0 → X).
El concepto de homeomorfismo es uno el modo riguroso de expresar
la idea de cuándo dos espacios topológicos son “equivalentes” y que
tratábamos de apuntar con ideas intuitivas al principio de este capı́tulo, como las de que dos espacios topológicos son “equivalentes” si se
pueden obtener uno de otro deformando sin cortar ni pegar3 . Dos espacios topológicos homeomorfos poseen las mismas propiedades topológicas.
Observaciones: Sean (X, τ ), (X 0 , τ 0 ) y (X 00 , τ 00 ) tres espacios topológicos.
(1) La composición g ◦ f : X → X 00 de dos aplicaciones continuas
f : X → X 0 y g : X 0 → X 00 es también continua.
(2) La restricción f |A⊆X : A → X 0 de una aplicación continua f :
X → X 0 es también continua (consideramos la topologı́a inducida
en A por X). Ası́, por ejemplo, la inclusión i : A ⊆ X → X es
continua ya que coincide con la restricción a A de la aplicación
identidad en X. También son continuas las aplicaciones
ix00 : X → X × X 0
x 7→ (x, x00 )
ix0 : X 0 → X × X 0
x0 7→ (x0 , x0 ).
para cada x00 ∈ X 0 , x0 ∈ X.
(3) En el espacio topológico producto de (X, τ ) y (X 0 , τ 0 ) son continuas las proyecciones:
p : X × X0 → X
(x, x0 ) 7→ x
p0 : X × X 0 → X 0
(x, x0 ) 7→ x0 .
En efecto, la continuidad de p es consecuencia de que si U es un
abierto de (X, τ ) entonces f −1 (U ) = U × X 0 es un abierto de
X × X 0.
3
Otro concepto relevante en este contexto es el de equivalencia homotópica, en
el que no entraremos.
12
(4) Si (X, τ ) es un espacio topológico entonces la proyección π :
X → X/ ∼ es continua (consideramos la topologı́a cociente para
X/ ∼). En efecto, por la definición de la topologı́a cociente, si
U es un abierto de X/ ∼ entonces π −1 (U ) es un abierto de X.
Más aún, dado otro espacio topológico (X 0 , τ 0 ), una aplicación
f : (X/ ∼) → X 0 será continua si y sólo si lo es la composición
f ◦ π : X → X 0.
Ejercicio. (1) Sean (X, τ ) un espacio topológico ANI, A ⊆ X y
x ∈ X. Pruébese que x ∈ A si y sólo si existe una sucesión {xn }n ⊆ A
que converge a x.
(2) Sea f : X → X 0 una aplicación entre dos espacios topológicos
siendo (X, τ ) ANI, y sea x0 ∈ X. Pruébese que f es continua en x0 si
y sólo si para toda sucesión {xn }n ⊆ X que converge a x0 la sucesión
{f (xn )}n converge a f (x0 ).
(3) Compruébese que la relación “ser homeomorfo a” en la clase de
todos los espacios topológicos es de equivalencia.
1.6.
Espacios topológicos métricos
En el espacio euclı́deo Rn estamos familiarizados
con el uso de la
P
distancia (usual) definida por d0 (x, y) = ( ni=1 (xi −yi )2 )1/2 , siendo x =
(x1 , . . . , xn ) e y = (y1 , . . . , yn ) dos puntos cualesquiera de Rn . Veamos
cómo se puede generalizar este concepto a conjuntos arbitrarios:
Definición 1.6.1 En un conjunto X definimos una distancia o métrica como una aplicación d : X × X → R que verifica:
(i) d(x, y) ≥ 0 para todo x, y ∈ X, con igualdad si y sólo si x = y.
(ii) d(x, y) = d(y, x) para todo x, y ∈ X.
(iii) d(x, z) ≤ d(x, y) + d(y, z) para todo x, y, z ∈ X.
En este caso al par (X, d) se le llama espacio métrico.
Es inmediato comprobar que cada A ⊂ X hereda una distancia por
restricción de d a A × A. Se dice entonces que A (o, más propiamente,
A con la restricción de la distancia) es un subespacio métrico de X.
1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS
13
Ejemplo. Una distancia en R2 muy distinta a la usual es la siguiente
aplicación d0 : R2 × R2 → R (“distancia de la Renfe”):
½
kx − yk
si x, y están en una recta que pasa por (0, 0),
0
d (x, y) =
kxk + kyk en caso contrario.
Definiciones 1.6.2 Sea (X, d) un espacio métrico y x0 ∈ X. Definimos la bola abierta de centro x0 y radio r ≥ 0 como Bx0 (r) = {x ∈
X : d(x, x0 ) < r}. Análogamente, definimos la bola cerrada de centro
x0 y radio r ≥ 0 como B x0 (r) = {x ∈ X : d(x, x0 ) ≤ r}.
Definición 1.6.3 Sea (X, d) un espacio métrico. Llamaremos topologı́a métrica asociada a (o inducida por) d en X a aquélla que admite
por base topológica todas las bolas abiertas (de cualquier centro y de
cualquier radio) para dicha métrica.
Ejercicio. (1) Pruébese que las bolas abiertas constituyen, efectivamente, una base para una topologı́a.
(2) Sea U un abierto de (X, d) para la topologı́a métrica. Pruébese
que para todo x ∈ U existe un ² > 0 tal que Bx (²) ⊂ U .
Es fácil comprobar que la topologı́a inducida por una métrica es siempre ANI y Hausdorff, aunque no necesariamente ANII.
Ejemplo. Sea X un conjunto y consideremos la distancia
½
0 si x = y,
d(x, y) =
1 si x 6= y.
La topologı́a asociada a d es la discreta. Por tanto, si X no es numerable, la topologı́a asociada no resultará ANII.
Un espacio topológico (X, τ ) se dice metrizable si existe alguna distancia d cuya topologı́a métrica sea τ . Estaremos especialmente interesados en tales espacios topológicos, pero destaquemos que, en general, la
distancia d no está fijada de modo único o canónico por τ .
Ejemplo. En R2 (y en cualquier Rn ) la topologı́a métrica asociada a la
distancia usual d0 es la topologı́a usual. Considérese la nueva distancia
sobre R2 , d((x, y), (x0 , y 0 )) = |x − x0 | + |y − y 0 | (¿cómo son sus bolas?).
La topologı́a métrica asociada a d también coincide con la usual. Sin
14
embargo, la topologı́a métrica asociada a la “distancia de la Renfe” d0
es diferente.
Todo espacio métrico (X, d) se considerará siempre como espacio topológico métrico, esto es, como una terna (X, d, τ ) donde τ es la topologı́a
métrica asociada a d. Para espacios topológicos métricos podemos reescribir los conceptos de lı́mite y continuidad. Las siguientes dos proposiciones se pueden comprobar con facilidad.
Proposición 1.6.4 Sea (X, d) un espacio métrico. Una sucesión {xn }n
⊆ X converge a x0 ∈ X si y sólo si para todo ² > 0 existe un n0 ∈ N
tal que si n ≥ n0 entonces d(xn , x0 ) < ².
Nótese que el lı́mite, si existe, es único pues la topologı́a métrica es
Hausdorff.
Proposición 1.6.5 Sean (X, d), (X 0 , d0 ) dos espacios métricos, f :
X → X 0 una aplicación y x0 ∈ X. Son equivalentes:
(i) f es continua en x0 .
(ii) Si {xn }n ⊆ X converge a x0 entonces {f (xn )}n converge a f (x0 ).
(iii) Para todo ² > 0 existe un δ > 0 tal que si d(x, x0 ) < δ entonces
d0 (f (x), f (x0 )) < ².
Nótese que la equivalencia entre (i) y (ii) se mantiene en todo espacio
topológico ANI (véase el ejercicio de la Sección 1.5).
Definición 1.6.6 De un homeomorfismo f : X → X 0 entre dos espacios métricos (X, d), (X 0 , d0 ) que verifique d(x, y) = d0 (f (x), f (y)),
para todo x, y ∈ X, se dice que es una isometrı́a. En este caso, se dice
que los dos espacios métricos son isométricos.
Espacios métricos isométricos tienen iguales todas sus propiedades relativas a la distancia. La relación “ser isométrico a” en la clase de todos
los espacios métricos es de equivalencia.
Ejercicio. Compruébese que, en la definición de isometrı́a, la inyectividad de f , y la continuidad tanto de f como de su inversa, se pueden
deducir del resto de las condiciones.
Dos conceptos que podemos definir en espacios métricos pero no en
topológicos son los siguientes de sucesión de Cauchy y completitud.
1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS
15
Definición 1.6.7 Sea (X, d) un espacio métrico. Diremos que una
sucesión {xn }n ⊆ X es de Cauchy si para todo ² > 0 existe un n0 ∈ N
tal que si n, m ≥ n0 entonces d(xn , xm ) < ².
Claramente toda sucesión convergente es de Cauchy, pero el recı́proco
no es cierto.
Definición 1.6.8 Se dice que un espacio métrico (X, d) es completo
si toda sucesión de Cauchy es convergente.
Ejemplos:
(1) El espacio euclı́deo Rn con la distancia usual es completo. Con
la topologı́a inducida sus bolas cerradas B x0 (r) son completas (y
las abiertas Bx0 (r) no, para ningún x0 ∈ Rn , r > 0).
(2) El conjunto de los números racionales Q con la distancia inducida
por la usual de R no es completo4 .
Obsérvese que los conceptos de completitud o de sucesión de Cauchy
dependen (a diferencia de los de convergencia o continuidad) no sólo
de la topologı́a sino también de la métrica. Ası́, aunque varias distancias generen la misma topologı́a métrica τ , una misma sucesión {xn }n
puede ser de Cauchy para una de ellas y no para las otras. Pero {xn }n
será convergente si y sólo si lo es para la topologı́a τ ; por tanto, si
{xn }n es convergente también será de Cauchy para todas las métricas
con topologı́a métrica asociada τ .
Ejercicio. Se dice que una aplicación entre dos espacios métricos
f : X → X 0 es uniformemente continua si
∀² > 0, ∃δ > 0 : d(x, y) < δ ⇒ d0 (f (x), f (y)) < ².
Compruébese que si f es uniformemente continua:
(a) es continua, y
(b) la imagen por f de una sucesión de Cauchy en (X, d) es una
sucesión de Cauchy en (X 0 , d0 ).
Muéstrese con un contraejemplo que si f verifica (a) y (b) no tiene por
qué ser uniformemente continua.
De hecho, R puede verse como la “completación” de Q -intuitivamente, como el
espacio que se obtiene añadiendo a Q el mı́nimo de puntos necesarios para obtener
un espacio completo-; el concepto de completación se puede generalizar a cualquier
espacio métrico.
4
16
1.7.
Conexión y arcoconexión
Definición 1.7.1 Decimos que un espacio topológico (X, τ ) es conexo
si los únicos subconjuntos de X que son a la vez abiertos y cerrados
son el vacı́o y el total.
Observación. Nótese que encontrar un subconjunto A ⊆ X, A 6= ∅, X
que sea abierto y cerrado equivale a encontrar dos subconjuntos de X
abiertos (o cerrados) U, V no vacı́os, disjuntos y tales que X = U ∪ V .
Por ejemplo, en R3 el subconjunto A definido como la unión de una
esfera y un plano que no sean tangentes ni secantes es no conexo.
Definición 1.7.2 Sea (X, τ ) un espacio topológico y A ⊆ X. Diremos
que A es una parte o componente conexa de X si el único subconjunto
conexo de X que contiene a A es el propio A.
Por ejemplo, las componentes conexas de Q son cada uno de sus elementos ya que ningún subconjunto A ⊆ Q con más de un elemento
es conexo. En efecto, sean r1 , r2 ∈ A, r1 < r2 , y sea a ∈ R − Q con
r1 < a < r2 . En ese caso, los subconjuntos no vacı́os U =] − ∞, a[∩A y
V =]a, ∞[∩A son abiertos de A, disjuntos y tales que A = U ∪ V , por
tanto, A no es conexo.
Supondremos conocido de la estructura de R que los subconjuntos
conexos de R coinciden con los intervalos (de cualquier tipo: abiertos,
cerrados, semiabiertos, acotados, no acotados...).
Ejercicio. Sea X un conjunto con cardinal mayor que 1 y considérense las topologı́as trivial y discreta. ¿Con cuáles de ellas es X
conexo?
Definición 1.7.3 Dado un espacio topológico (X, τ ) definimos un arco ϕ en X como una aplicación continua ϕ : [a, b] → X, −∞ < a <
b < ∞. Si x = ϕ(a) y y = ϕ(b) diremos que dicho arco conecta x con
y.
En esta definición se puede normalizar el dominio de los arcos suponiendo siempre [a, b] = [0, 1].
Definición 1.7.4 Un espacio topológico (X, τ ) se dice que es arcoconexo si cualesquiera x, y ∈ X se pueden conectar con un arco en X.
1.7. CONEXIÓN Y ARCOCONEXIÓN
17
Un ejemplo sencillo de espacio topológico arcoconexo (y, por tanto
conexo; véase la siguiente proposición) es Rn con la topologı́a usual.
En efecto, para cualesquiera x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn el
arco (segmento cerrado) ϕ : [0, 1] → Rn , ϕ(t) = x − t(x − y) conecta x
con y.
Proposición 1.7.5 Todo espacio topológico (X, τ ) arcoconexo es conexo.
Demostración. Supongamos, por reducción al absurdo, que no es conexo. Entonces existen abiertos disjuntos no vacı́os U, V tales que
X = U ∪ V . Como X es arcoconexo existe un arco ϕ : [0, 1] → X
que conecta x ∈ U con y ∈ V . En consecuencia, los subconjuntos
ϕ−1 (U ) y ϕ−1 (V ) son abiertos de [0, 1] (ya que ϕ es continua), disjuntos (ya que U ∩ V = ∅), no vacı́os (0 ∈ ϕ−1 (U ),1 ∈ ϕ−1 (V )) y tales que
[0, 1] = ϕ−1 (U ) ∪ ϕ−1 (V ) (ya que X = U ∪ V ), lo que contradice que
el intervalo [0, 1] es conexo. 2
Ejemplo. El subconjunto X = {(x, y) ∈ R2 : y = sen πx , 0 < x ≤
1} ∪ {(0, y) : −1 ≤ y ≤ 1} ⊂ R2 con la topologı́a inducida de R2 es
un ejemplo tı́pico de espacio topológico conexo que no es arcoconexo
(véase la Figura 4).
Figura 4
18
Teorema 1.7.6 Sean (X, τ ), (X 0 , τ 0 ) espacios topológicos y f : X →
X 0 una aplicación continua. Si X es conexo entonces f (X) también es
conexo.
Demostración. Supongamos, por reducción al absurdo, que f (X) no
es conexo. Entonces existen abiertos disjuntos U 0 , V 0 ⊆ X 0 tales que
f (X) ⊆ U 0 ∪ V 0 , U 0 ∩ f (X) 6= ∅ y V 0 ∩ f (X) 6= ∅. Como f es continua,
U = f −1 (U 0 ) y V = f −1 (V 0 ) son abiertos no vacı́os de X. Además,
U ∩ V = ∅ y X = U ∪ V . Luego X no es conexo, lo que contradice
nuestra hipótesis. 2
Obsérvese que el Teorema de Bolzano clásico se obtiene de este
resultado sin más que tomar X = [a, b], X 0 = R y suponer f (a) · f (b) <
0. En efecto, en ese caso al ser f ([a, b]) un conexo de R, este conjunto
tiene que ser otro intervalo y, necesariamente, 0 pertenecerá a él.
Ejercicio. Pruébese que si f : X → X 0 es continua y X es arcoconexo
entonces f (X) es arcoconexo.
1.8.
Compacidad
Definición 1.8.1 Dado un espacio topológico (X, τ ) llamamos recubrimiento abierto U de (X, τ ) a una colección de abiertos de X cuya
unión sea todo X. Un subrecubrimiento de U es un subconjunto Ũ ⊆ U
tal que Ũ también es un recubrimiento abierto de X.
Definición 1.8.2 Decimos que un espacio topológico (X, τ ) es compacto si para todo recubrimiento abierto suyo U existe un subrecubrimiento U f ⊆ U con un número finito de elementos.
Dos propiedades tı́picas de los espacios compactos son las siguientes:
Proposición 1.8.3 Sea (X, τ ) un espacio topológico compacto:
(1) Si A ⊆ X es cerrado entonces A es compacto.
(2) Si (X 0 , τ 0 ) es otro espacio topológico y f : X → X 0 es continua
entonces Imf = {f (x) : x ∈ X}(= f (X)) es compacto.
1.8. COMPACIDAD
19
Demostración. (1) Nótese que cada abierto UA de A se puede escribir
como UA = U ∩ A, donde U es un abierto de X. Dado cualquier
recubrimiento abierto de A, UA , consideremos el conjunto U formado
por los abiertos U de X con U ∩ A ∈ UA . Como A es cerrado, X − A es
un abierto de X; por tanto, U ∪ (X − A) es un recubrimiento abierto
de X. Al ser X compacto, podemos extraer un subrecubrimiento finito
U f de U ∪ {X − A}, y el conjunto UAf = {U ∩ A|U ∈ (U f − (X − A))}
es un subrecubrimiento finito de UA .
(2) Para cualquier recubrimiento abierto U 0 de f (X), se considera el
recubrimiento abierto de X: U = {f −1 (U 0 )|U 0 ∈ U 0 }. Tomando ahora
un subrecubrimiento finito de U y, para cada abierto Ui , i = 1, . . . k,
de este subrecubrimiento, un abierto Ui0 ∈ U 0 con f (Ui ) = Ui0 , se extrae
el subrecubrimiento finito {U10 , . . . , Uk0 } de U 0 . 2
Proposición 1.8.4 Sea (X, τ ) un espacio topológico Hausdorff. Si K ⊆
X es compacto entonces K es cerrado en X.
Demostración. Probaremos que X − K es abierto. Para ello, basta con
demostrar que, fijado y ∈ X − K existe un entorno abierto Uy tal que
Uy ∩ K = ∅. Por ser X Hausdorff para cada x ∈ K existen entornos
abiertos Ux , Ux0 de x e y, respectivamente, tales que Ux ∩ Ux0 = ∅. En
consecuencia, UK = {Ux ∩ K : x ∈ K} es un recubrimiento abierto de
K. Pero como K es compacto podemos extraer un subrecubrimiento
finito UKf = {Ux1 ∩ K, . . . , Uxn ∩ K}. Por tanto, un entorno abierto de y
que satisface las propiedades requeridas es Uy = Ux0 1 ∩· · ·∩Ux0 n ⊆ X−K.
2
Relacionada con la compacidad se halla la siguiente propiedad.
Definición 1.8.5 Un espacio topológico (X, τ ) se dice que es secuencialmente compacto si cualquier sucesión {xn }n ⊆ X admite una parcial5 convergente.
En los espacios topológicos que nos interesarán, compacidad y compacidad secuencial coinciden.
Teorema 1.8.6 (Bolzano-Weierstrass). Sea (X, τ ) un espacio topológico metrizable y ANII. Entonces, X es compacto si y sólo si X es
secuencialmente compacto.
Esto es, una sucesión del tipo {xσ(n) }n , donde σ : N → N es una aplicación
estrictamente creciente.
5
20
La prueba, bajo hipótesis más refinadas, puede consultarse, por ejemplo, en [AMR, Proposition 1.5.5].
Ejercicio. Sea (X, d) un espacio métrico. Demuéstrese: (i) si una
sucesión de Cauchy admite una parcial convergente entonces converge;
(ii) si (X, d) es secuencialmente compacto entonces debe ser completo.
Analicemos con más detalle el concepto de compacidad en espacios
métricos.
Definiciones 1.8.7 Sea (X, d) un espacio métrico y ∅ 6= A ⊆ X.
Definimos el diámetro de A como diam(A) =Sup{d(x, y) : x, y ∈ A} ∈
[0, ∞]. Ası́, diremos que A está acotado si diam(A) < ∞.
Nótese que el diámetro de las bolas (abiertas o cerradas) de Rn es dos
veces su radio.
Proposición 1.8.8 Sea (X, d) un espacio métrico y K ⊆ X compacto.
Entonces K es cerrado y acotado.
Demostración. Por la Proposición 1.8.4, K es cerrado (recordemos
que todo espacio métrico es Hausdorff). Para probar que es acotado, fijemos xo ∈ K y consideremos su recubrimiento abierto UK =
{Bx0 (n) ∩ K : n ∈ N}. Como K es compacto podemos extraer un subrecubrimiento finito y, por tanto, K ⊂ Bx0 (n0 ) para algún n0 . Luego
diam(K) ≤diam(Bx0 (n0 )) ≤ 2n0 . 2
Señalemos que, en general, no es cierto que si K ⊆ X es cerrado
y acotado ello implique que sea compacto (por ejemplo, tómese K =
X = R con la distancia d(x, y) = 1 si x 6= y)6 . Sin embargo, ello ocurre
en Rn con la topologı́a usual, esto es :
Teorema 1.8.9 (Heine-Borel) Los conjuntos compactos de Rn son los
cerrados y acotados.
La demostración no es difı́cil teniendo en cuenta: (a) por la Proposición 1.8.3 basta con probar que un n-rectángulo cerrado y acotado
[a1 , b1 ]×· · ·×[an , bn ] que contenga A es compacto, (b) [a1 , b1 ] es secuencialmente compacto y, razonando inductivamente tomando sucesiones
parciales, el n-rectángulo también lo será, (c) por el Teorema 1.8.6, el
6
Menos trivialmente: en un espacio de Hilbert de dimensión ∞ la bola cerrada
de centro el vector 0 y radio 1 no es compacta.
1.8. COMPACIDAD
21
n-rectángulo es compacto (más detalles pueden consultarse, p. ej., en
[AMR, 1.5.9]).
Corolario 1.8.10 Sea (X, τ ) un espacio topológico compacto y f :
X → R continua. Entonces f admite un máximo y un mı́nimo absolutos.
Demostración. En efecto, como X es compacto también lo es su imagen
f (X) ⊂ R (Proposición 1.8.3(2)). Entonces f (X) es cerrada y acotada.
Por ser acotada Supf < ∞ y, por ser cerrada, Supf = Maxf (para el
mı́nimo absoluto se razona análogamente). 2
En particular, este resultado se da cuando X = [a, b], generalizándose una propiedad elemental conocida de las funciones continuas.
22
Capı́tulo 2
El concepto de variedad
diferenciable
2.1.
Concepto de variedad topológica
Definición 2.1.1 Una variedad topológica de dimensión n ∈ N es un
espacio topológico Hausdorff y ANII1 Q(≡ (Q, τ )), Q 6= ∅, que es localmente homeomorfo a Rn en el siguiente sentido (véase la Figura 5):
para cada punto p ∈ Q existen un entorno abierto U de p
y un abierto Θ de Rn que son homeomorfos, esto es, tales
que ∃ ϕ : U → Θ ⊆ Rn homeomorfismo.
Dada una variedad topológica Q, introducimos los siguientes conceptos:
– (U, ϕ) es un entorno coordenado de p (o bien, una carta coordenada o unas coordenadas locales alrededor de p).
– Sea π i : Rn → R, π i (x1 , . . . , xn ) = xi , entonces a q i ≡ π i ◦ϕ : U ⊆
Q → R le llamaremos coordenada i-ésima. También usaremos la
notación (U, ϕ) ≡ (U, q 1 , . . . , q n ).
1
Muchos autores no imponen el requisito de ser ANII. En la práctica, para
nosotros, no será restrictivo (véase la Observación (4) más adelante).
23
24CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Figure 5
– Una colección de entornos coordenados A = {(Uα , ϕα ) : α ∈ I}
es un atlas (topológico) si Q = ∪α∈I Uα .
Observaciones:
(1) En la definición se ha supuesto que la dimensión es un número
natural (n ≥ 1). Como caso lı́mite admitiremos n = 0 asumiendo R0 := {1} (si Q es localmente homeomorfo a R0 entonces
tendrá la topologı́a discreta).
(2) La dimensión de la variedad es única, porque un espacio topológico no puede ser localmente homeomorfo a Rn y Rm , n 6= m a
la vez. Esto se debe a que ningún abierto (6= ∅) de Rn puede ser
homeomorfo a ningún abierto de Rm . Aunque muy intuitivo, la
prueba de este resultado no es en absoluto trivial2 .
(3) Un espacio topológico que sea localmente homeomorfo a Rn puede
no ser Hausdorff. De hecho, el ejemplo no trivial de espacio
topológico no Hausdorff que vimos en el capı́tulo anterior, al final
de la Sección 1.4, prueba que ser localmente homeomorfo a R no
implica ser Hausdorff.
2
Es una consecuencia de un resultado clásico en Topologı́a, el Teorema de Invariancia Dominio. Sin embargo, la unicidad de la dimensión de las variedades
diferenciables, que estudiaremos más adelante, sı́ se puede probar con facilidad a
partir del Teorema de la Función Inversa.
2.1. CONCEPTO DE VARIEDAD TOPOLÓGICA
25
(4) La hipótesis relativa al axioma ANII puede no imponerse en principio, si bien otras hipótesis “muy razonables” pueden acabar implicándolo. De hecho, es posible demostrar que, fijadas las otras
hipótesis de la definición de variedad, equivale exigir: (1) Q es
ANII y (2) la topologı́a de Q es metrizable con un conjunto numerable de partes conexas3 .
Ejercicio. Sea (Q, τ ) un espacio topológico localmente homeomorfo a
Rn . Pruébese: (i) Q es ANI, (ii) Q es conexo si y sólo si es arco-conexo,
(iii) las partes conexas de Q son abiertas y cerradas en Q (¿ocurre lo
mismo con las partes conexas del conjunto de los racionales Q?)
Por supuesto, Rn (o cualquier abierto suyo no vacı́o) es una variedad
topológica de dimensión n. En efecto, para probarlo basta considerar
como atlas A = {(Rn , Id)} (Id: aplicación identidad). Sin embargo,
en ocasiones resulta útil usar otros entornos coordenados como, por
ejemplo, las coordenadas polares sobre R2 , las coordenadas esféricas
o bien las cilı́ndricas sobre R3 , etc. (véase el Apéndice 2). Como un
ejemplo explı́cito menos trivial, en el Apéndice 1 construimos dos atlas
sobre la esfera.
En una variedad topológica (Q, τ ) consideremos dos cartas (U, ϕ),
(Ũ , ϕ̃) tales que U ∩ Ũ 6= ∅ y tomemos p ∈ U ∩ Ũ . Entonces, a partir
de los homeomorfismos
ϕ |U ∩Ũ : U ∩ Ũ → ϕ(U ∩ Ũ )
ϕ̃ |U ∩Ũ : U ∩ Ũ → ϕ̃(U ∩ Ũ )
podemos construir los homeomorfismos
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn .
A estos homeomorfismos se les llama cambios de carta o de coordenadas
3
La metrizabilidad también equivale a la propiedad topológica llamada paracompacidad, que muchos autores usan en lugar de ANII. Ası́, cuando se usa la paracompacidad en lugar de ANII, se permite un conjunto no numerable de partes conexas.
Esta generalidad no es de mucha utilidad práctica (y resulta incluso contraproducente en algunos contextos, como los resultados de unicidad para la topologı́a de
subvariedades).
Figura 6
Observación. De acuerdo con la notación ya introducida (U, ϕ) ≡
(U, q 1 , . . . , q n ), (Ũ , ϕ̃) ≡ (Ũ , q̃ 1 , . . . , q̃ n ) se suele usar la notación
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 ≡ (q̃ 1 (q 1 , . . . , q n ), . . . , q̃ n (q 1 , . . . , q n ))
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 ≡ (q 1 (q̃ 1 , . . . , q̃ n ), . . . , q n (q̃ 1 , . . . , q̃ n )).
Ası́, para el ejemplo de las coordenadas polares en R2 (Apéndice 2) se
tienen los siguientes cambios de coordenadas:
(x(ρ, θ), y(ρ, θ));
(ρ(x, y), θ(x, y));
2.2.
x(ρ, θ) = ρpcos θ, y(ρ, θ) = ρsenθ,
ρ(x, y) = x2 + y 2 , θ(x, y) = 2 · arc tan
x+
√y
x2 +y 2
.
Variedades diferenciables
Definiciones 2.2.1 Sea (Q, τ ) una variedad topológica de dimensión n:
(1) Diremos que un cambio de cartas entre (U, ϕ) y (Ũ , ϕ̃) es diferenciable C r , r ∈ N ∪ {∞} si las aplicaciones
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn
son diferenciables C r . (Si U ∩ Ũ = ∅ el correspondiente cambio
de coordenadas será diferenciable C ∞ por definición.)
2.2. VARIEDADES DIFERENCIABLES
27
(2) Diremos que un atlas A = {(Uα , ϕα ) : α ∈ I} es diferenciable C r
si todos sus cambios de carta son diferenciables C r .
Por simplicidad de lenguaje, de ahora en adelante por “diferenciable”
entenderemos “diferenciable C ∞ ” para los cambios de carta.
Definición 2.2.2 Diremos que un atlas D de Q es una estructura
diferenciable si es un atlas diferenciable (C ∞ ) maximal en el siguiente
sentido:
Si (U, ϕ) es un entorno coordenado de Q cuyos cambios
de cartas con todos los elementos de D son diferenciables
entonces (U, ϕ) ∈ D.
Observaciones:
(1) Cualquier atlas diferenciable A determina una única estructura
diferenciable D(A) tal que A ⊆ D(A).
(2) Dados dos atlas diferenciables A, B se tiene que D(A) = D(B)
si y sólo si A ∪ B es un atlas diferenciable.
Definición 2.2.3 Una variedad diferenciable de dimensión n es una
terna (Q, τ, D) donde (Q, τ ) es una variedad topológica de dimension
n y D una estructura diferenciable.
De ahora en adelante, cuando digamos que Q es una variedad diferenciable realmente nos estaremos refiriendo a la terna (Q, τ, D).
Observación. Una misma variedad topológica puede admitir más
de una estructura diferenciable. En efecto, consideremos la variedad
topológica Q = R y los atlas A = {(R, Id)}, B = {(R, x3 )}. Si consideramos los cambios de carta entre (U, ϕ) = (R, Id) y (Ũ , ϕ̃) = (R, x3 )
tenemos:
ϕ̃ ◦ ϕ−1 : R → R
x 7→ x3
ϕ ◦ ϕ̃−1 : R → R
x 7→ x1/3 .
Vemos que ϕ ◦ ϕ̃−1 no es diferenciable en cero y, por tanto, D(A) 6=
D(B). De ahora en adelante cuando hablemos de Rn como variedad
diferenciable asumiremos como estructura diferenciable la generada por
el atlas A = {(Rn , Id)}.
En el Apéndice 1 construimos explı́citamente dos atlas diferenciables naturales sobre la esfera. Ambos generan la misma estructura diferenciable la cual, por defecto, será la que consideremos sobre la esfera.
Es digno de reflexión que, aunque en la práctica baste con trabajar
con un atlas diferenciable, resulte conceptualmente necesario considerar “estructuras diferenciables” en la definición de variedad.
Consideremos ahora otros ejemplos:
Ejemplos de variedades diferenciables:
(1) Construyamos una estructura de variedad diferenciable en cualquier espacio vectorial real de dimensión n, V n (R), definiendo
tanto la topologı́a como la estructura diferenciable. Sea B =
(v1 , . . . , vn ) una base ordenada cualquiera de V n . Consideremos
la aplicación biyectiva FB que a cada vector le hace corresponder
sus coordenadas en B, esto es:
FB−1 : Rn → V n
P
(a1 , . . . , an ) 7→ ni=1 ai vi .
Si tomamos otra base distinta B̃ = (ṽ1 , . . . , ṽn ) podemos considerar igualmente la aplicación biyectiva
FB̃−1 : Rn → V n
P
(a1 , . . . , an ) 7→ ni=1 ai ṽi .
Entonces la aplicación FB ◦ FB̃−1 : Rn → Rn es biyectiva y lineal
(en particular, continua y diferenciable). Obviamente, lo mismo
ocurre con la aplicación FB̃ ◦ FB−1 . Por tanto se trata de un homeomorfismo. Diremos que U ⊆ V n es un abierto de V n si FB (U )
(y, por tanto, FB̃ (U ) para cualquier otra base B̃) es un abierto
de Rn . De esta forma queda definida una topologı́a sobre V n , que
resulta independiente de la base escogida. Por construcción, V n
es homeomorfo a Rn y, por tanto, Hausdorff y ANII, además de
una variedad topológica de dimensión n. Si tomamos como entornos coordenados A = {(V n , FB ) : B base de V n } entonces los
cambios de carta son las aplicaciones FB ◦ FB̃−1 que, como hemos
visto, son diferenciables. Por tanto, A es un atlas diferenciable
que genera una estructura diferenciable para V n .
2.2. VARIEDADES DIFERENCIABLES
29
(2) El conjunto de las matrices reales de orden m × n, Mm×n (R) es
una variedad diferenciable de orden m·n. En efecto, basta dotarla
de la estructura diferenciable de Rm·n bajo la identificación natural Mm×n (R) ≡ Rm·n .
(3) Si tenemos dos espacios vectoriales reales V n (R), V m (R) entonces
el conjunto de todas las aplicaciones lineales L(V n , V m ) = {f :
V n → V m : f es lineal} es una variedad diferenciable de dimensión n·m. En efecto, esto es inmediato de (1) y de que L(V n , V m )
tiene estructura de espacio vectorial de dimensión n · m. Una forma natural de definir un atlas es fijar dos bases B y B 0 de V n y
V m , respectivamente, y considerar la aplicación biyectiva
f : L(V n , V m ) → Mm×n (R)
f 7→ M (f, B 0 ← B)
que asocia a cada aplicación lineal f su representación matricial
con respecto a las bases B y B 0 . (Esta aplicación permite definir
una topologı́a y una estructura diferenciable para L(V n , V m ) a
partir de las de Mm×n (R) tal y como se hizo en (1) a partir de
Rn .)
(4) Un abierto U (6= ∅) de una variedad diferenciable Q de dimensión
n es también una variedad diferenciable de dimensión n. En efecto, basta tomar la restricción a U de la topologı́a y los elementos
de la estructura diferenciable de Q.
Por ejemplo, el grupo lineal general de orden n sobre R, Gl(n, R) =
{A ∈ Mn×n (R) : det(A) 6= 0} ⊂ Mn×n (R) es un abierto de
Mn×n (R). De hecho, Gl(n, R) = det−1 (R − {0}) siendo
det : Mn×n (R) → R
A 7→ det(A)
una aplicación continua. Por tanto, Gl(n, R) es una variedad diferenciable de dimensión n2 .
(5) Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 ,
respectivamente, entonces Q × Q0 admite una estructura natural
de variedad diferenciable de dimensión n + n0 . En efecto, dadas
dos cartas coordenadas (U, ϕ), ϕ : U → ϕ(U ) ⊆ Rn y (U 0 , ϕ0 ),
0
ϕ0 : U 0 → ϕ0 (U 0 ) ⊆ Rn de Q y Q0 , respectivamente, tomamos
como carta coordenada de Q × Q0
ϕ × ϕ0 : U × U 0 ⊆ Q × Q0 → ϕ(U ) × ϕ0 (U 0 ) ⊆ Rn × Rn
(p, p0 ) 7→ (ϕ(p), ϕ0 (p0 )).
0
Fácilmente se comprueba que si las ϕ, ϕ0 tienen cambios de carta
diferenciables entonces también los tienen ϕ × ϕ0 .
En particular, son variedades diferenciables de dimension 2 el
toro S 1 × S 1 o el cilindro S 1 × R.
Notas al concepto de variedad diferenciable:
(1) Si en lugar de considerar espacios localmente homeomorfos a Rn
los consideramos localmente homeomorfos al semiplano superior
Rn+ = {(x1 , . . . , xn ) : xn ≥ 0} entonces podemos hablar de una
variedad topológica (o diferenciable, en su caso) con borde. De los
puntos que, en algún entorno coordenado (y, por tanto, en todo
entorno coordenado), tienen su última coordenada nula se dice
que están en el borde. Obsérvese que el concepto de diferenciabilidad entre abiertos de Rn se extiende naturalmente a abiertos
de Rn+ .4 Análogamente, si se toman homeomorfismos con abiertos de {(x1 , . . . , xn ) : xi ≥ 0 ∀i ∈ {1, . . . , n}} y con cambios de
carta diferenciables entonces hablamos de variedad diferenciable
con borde anguloso (o diferenciable a trozos).
(2) Si en lugar de considerar espacios localmente homeomorfos a Rn
los consideramos localmente homeomorfos a Cn , con cambios de
carta holomorfos, entonces tendremos una variedad compleja de
dimensión (compleja) n. Las superficies de Riemann son variedades complejas de dimensión 1.
(3) En general, los posibles estados de un sistema fı́sico (no cuántico
y discreto) tienen intrı́nsecamente una estructura de variedad
diferenciable de dimensión n (= número de “grados de libertad”
del sistema).
4
Profundizaremos en las variedades con borde dentro del contexto del Teorema
de Stokes, Subsección 9.2.
2.3. APLICACIONES DIFERENCIABLES
31
Más concretamente, en Fı́sica (Mecánica, Termodinámica, Relatividad...) es frecuente suponer, al menos implı́citamente, que el
conjunto X de los estados de un sistema fı́sico5 admite para cada
estado un subconjunto U ⊆ X que contiene a dicho estado y una
aplicación biyectiva ϕ : U ⊆ X → Θ ⊆ Rn ; esto es, podemos
describir ese estado en función de coordenadas en un abierto Θ
de Rn . Más aún, se supone que los cambios de coordenadas son
diferenciables.
Veamos que es suficiente con estos elementos para definir una estructura de variedad diferenciable, salvo por los requisitos topológicos Hausdorff y ANII. Para definir la topologı́a en X, tomaremos como base de abiertos de X los subconjuntos ϕ−1 (Θ0 ), siendo
Θ0 cualquier abierto de Rn en el codominio de ϕ. En consecuencia,
obtenemos un espacio topológico (X, τ ) que, por construcción, es
localmente homeomorfo a Rn , y además estará dotado de un atlas
diferenciable.
El requisito de que la variedad sea Hausdorff siempre se supone
para la topologı́a τ , al menos, implı́citamente (pues se da por
hecho que se pueden tomar coordenadas que separen entornos de
dos estados distintos). Como se comentó, la hipótesis ANII no
es en principio imprescindible. Pero, suele haber otras hipótesis
más o menos implı́citas para X que acaban por implicar que
sea ANII (matemáticamente, como ya hemos visto, basta con
que la topologı́a sea métrica y que X tenga un conjunto numerable de partes conexas; fı́sicamente, parece lógico pensar que
una topologı́a que no quedara constructivamente determinada en
un conjunto numerable de pasos se escaparı́a a las posibilidades
reales de medición).
2.3.
Aplicaciones diferenciables entre variedades. Difeomorfismos
Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 ,
respectivamente, y f : Q → Q0 una aplicación continua en p ∈ Q.
5
En el caso “extremo” de la Relatividad el sistema fı́sico serı́a el espacio y
tiempo, y sus “estados” los “eventos” aquı́-ahora.
De la definición de aplicación continua en un punto que vimos en el
capı́tulo anterior se tiene que para cada entorno coordenado (U 0 , ϕ0 ) de
Q0 que contenga a f (p) existe un entorno coordenado (U, ϕ) de Q que
contiene a p tal que f (U ) ⊆ U 0 . En consecuencia, podemos considerar
la aplicación “f vista en coordenadas”, esto es, ϕ0 ◦ f ◦ ϕ−1 : ϕ(U ) ⊆
0
Rn → Rn , que será continua en p por ser composición de continuas
Figura 7
Definición 2.3.1 Sean Q, Q0 dos variedades diferenciables de dimensiones n, n0 , respectivamente. Diremos que una aplicación f : Q → Q0
continua en p ∈ Q es diferenciable en este punto si para un par de entornos coordenados (U, ϕ) y (U 0 , ϕ0 ) de p y f (p), respectivamente, tales
0
que f (U ) ⊆ U 0 se tiene que la aplicación ϕ0 ◦f ◦ϕ−1 : ϕ(U ) ⊆ Rn → Rn
es diferenciable en ϕ(p).
Observación. En la Definición 2.3.1 se puede sustituir la expresión
“un par” por “cualesquiera”. En efecto, supongamos que ϕ0 ◦ f ◦ ϕ−1 es
diferenciable en ϕ(p) y probemos que, para cualesquiera otros entornos
coordenados (Ũ , ϕ̃) y (Ũ 0 , ϕ̃0 ) de p y f (p), respectivamente, también se
tiene que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en ϕ̃(p). En un entorno de ϕ̃(p)
podemos escribir:
ϕ̃0 ◦ f ◦ ϕ̃−1 = (ϕ̃0 ◦ ϕ0−1 ) ◦ (ϕ0 ◦ f ◦ ϕ−1 ) ◦ (ϕ ◦ ϕ̃−1 ).
(2.1)
2.3. APLICACIONES DIFERENCIABLES
33
Como ϕ̃0 ◦ ϕ0−1 y ϕ ◦ ϕ̃−1 son diferenciables en todos los puntos de su
dominio (son cambios de carta) y ϕ0 ◦ f ◦ ϕ−1 es diferenciable en ϕ(p)
(por hipótesis), se tiene de (2.1) que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en
ϕ̃(p).
Observación. En principio tiene sentido definir si f es diferenciable
C s , s ∈ N∪{∞}, en p. Ello se debe a que los cambios de carta en Q y Q0
0
son C ∞ . Si sólo fueran C r y C r , respectivamente, sólo tendrı́a sentido
definir que f es diferenciable C s , para s ≤ Min{r, r0 }. En cualquier
caso, también supondremos por simplicidad que “f es diferenciable”
significa que lo es C ∞ , salvo que se indique explı́citamente lo contrario.
Ejercicio. Comprobar usando la definición que la aplicación f : S 2 ⊂
R3 → R, f (x, y, z) = z es diferenciable.
Definición 2.3.2 Dadas dos variedades diferenciables Q, Q0 se dice
que una aplicación f : Q → Q0 es un difeomorfismo si f es biyectiva y
f , f −1 son diferenciables.
El nombre difeomorfismo local se extiende al caso de que sólo se pueda
asegurar sobre f que, para cada p ∈ Q, existen entornos abiertos U de
p y U 0 = f (U ) de f (p), tales que la restricción de f a U y U 0 sea un
difeomorfismo.
Definición 2.3.3 Dos variedades diferenciables Q, Q0 son difeomorfas
si existe un difeomorfismo f : Q → Q0 .
Ejercicio. Probar que las variedades diferenciables (R, D(A)), (R, D(B))
con A = {(R, Id)}, B = {(R, x3 )} son difeomorfas.
Observaciones:
(1) El espacio euclı́deo Rn admite infinitas estructuras diferenciables
compatibles con la topologı́a usual. Además, si n 6= 4 todas ellas son difeomorfas. Curiosamente, existen infinitas estructuras
diferenciables sobre R4 que no son difeomorfas6 .
(2) Toda variedad diferenciable (¡ANII!) conexa de dimensión 1 es
difeomorfa a R ó a S 1 .
6
La prueba de estos hechos es realmente difı́cil.
2.4.
Hipersuperficies regulares de
n
R
Consideremos un abierto U ⊆ R2 y una aplicación f : U → R
diferenciable. Definimos el grafo de f como el subconjunto Graf(f ) =
{(x, y, f (x, y)) : (x, y) ∈ U } ⊆ R3 . De manera natural, Graf(f ) es una
variedad diferenciable de dimensión 2, pues podemos considerar como
carta global la proyección
πz : Graf(f ) → U
(x, y, f (x, y)) 7→ (x, y).
Ası́, por ejemplo, en la esfera S 2 ⊂ R3 cada “casquete” Uz± (véase el
Apéndice 1) puede verse como una variedad diferenciable de este tipo,
es decir, como grafos de las aplicaciones
f± : U ⊆ R2 → R p
(x, y) 7→ ± 1 − x2 − y 2
siendo U = {(x, y) ∈ R2 : x2 + y 2 < 1}. De esta manera, la carta global
πz arriba definida coincide con las aplicaciones
2
±
ϕ±
z : Uz → U ⊆ R
(x, y, f± (x, y)) 7→ (x, y)
en el Apéndice 1. Para generalizar esta situación conviene ver S 2 como
la “solución” de la ecuación F (x, y, z) := x2 + y 2 + z 2 = 1. Obsérvese
que en las cartas (Uz± , ϕ±
z ) hemos podido despejar la variable z de esta
= 2z 6= 0 en
ecuación. De hecho, esto se ha podido hacer porque ∂F
∂z
todo Uz± .
Con más generalidad, sea U un abierto de R3 , F : U → R diferenciable, c0 ∈ Im(F ) y p0 ∈ F −1 (c0 ). Si ∂F
(p0 ) 6= 0 entonces el Teorema de la
∂z
Función Implı́cita (véase el Teorema 2.5.2) permite encontrar abiertos
Vz ⊆ R3 y Dz ⊆ R2 , y una aplicación diferenciable φz : Dz ⊆ R2 → R
tales que F −1 (c0 )∩Vz = {(x, y, φz (x, y)) : (x, y) ∈ Dz }. Obviamente, lo
mismo ocurre si cambiamos el papel de la variable z con el de la variable x ó y. Esto es, en los puntos donde alguna de las parciales de F es
distinta de 0, la proyección sobre el correspondiente plano coordenado
sirve de carta local (véase la Figura 8).
Además, si dos parciales son distintas de cero en p0 entonces los
cambios de carta resultan ser diferenciables. En efecto, veamos explı́citamente cómo son estos cambios de carta cuando las coordenadas
2.4. HIPERSUPERFICIES REGULARES DE RN
35
Figura 8
con parciales distintas de cero son z e y. En primer lugar, para la
coordenada z tenemos
πz : F −1 (c0 ) ∩ Vz ∩ Vy → Dz0 ⊆ R2
(x, y, z) 7→ (x, y)
y
πz−1 : Dz0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy
(x, y) 7→ (x, y, φz (x, y)),
donde φz (x, y) es la función diferenciable dada en el Teorema de la
Función Implı́cita por ser ∂F
(p0 ) 6= 0 (Dz0 es algún entorno apropiado
∂z
de πz (p0 ) –cualquiera incluido en Dz ∩ πz (Vy )). Análogamente para la
coordenada y:
πy : F −1 (c0 ) ∩ Vz ∩ Vy → Dy0 ⊆ R2
(x, y, z) 7→ (x, z)
y
πy−1 : Dy0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy
(x, z) 7→ (x, φy (x, z), z),
donde φy (x, z) es la función dada en el Teorema de la Función Implı́cita
por ser ∂F
(p0 ) 6= 0. Entonces, los cambios de carta son:
∂y
πz ◦ πy−1 : Dy0 ⊆ R2 → Dz0 ⊆ R2
(x, z) 7→ (x, φy (x, z))
y
πy ◦ πz−1 : Dz0 ⊆ R2 → Dy0 ⊆ R2
(x, y) 7→ (x, φz (x, y)),
que son diferenciables por serlo sus componentes. Obviamente, este
razonamiento puede generalizarse al caso en que el espacio ambiente
es Rn , lo que permite demostrar la Proposición 2.4.2 con la siguiente
definición previa:
Definición 2.4.1 Sea F : U ⊆ Rn → R diferenciable (U abierto) y
sea c0 ∈ Im(F ). Diremos que c0 es un valor regular de F si para todo
∂F
∂F
p ∈ F −1 (c0 ) se tiene que gradF (p) = ( ∂x
1 (p), . . . , ∂xn (p)) 6= 0 (esto es,
al menos una parcial es distinta de cero).
Proposición 2.4.2 Si c0 ∈ R es un valor regular de una aplicación
diferenciable F : U ⊆ Rn → R entonces F −1 (c0 ) admite una estructura
de variedad diferenciable de dimensión n−1, con un atlas diferenciable
generado por las proyecciones sobre los hiperplanos coordenados.
(Remarcamos que en esta proposición estamos considerando la topologı́a inducida de Rn , y el atlas diferenciable para F −1 (c0 ) se define por
las proyecciones sobre el plano xi ≡ 0 de un entorno de cada punto
∂F
p ∈ F −1 (c0 ) con ∂x
i (p) 6= 0, como acabamos de justificar.)
Definición 2.4.3 Si c0 es un valor regular de F : U ⊆ Rn → R
entonces a la hipersuperficie dada por F −1 (c0 ) le llamaremos hipersuperficie regular de Rn .
Ejemplos:
(1) La esfera Sqn0 (r) de centro q0 ∈ Rn+1 y radio r > 0. En efecto, si
q0 = (a1 , . . . , an+1 ) ∈ Rn+1 entonces Sqn0 (r) se define como:
{(x1 , . . . , xn+1 ) ∈ Rn+1 : (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 = r2 }.
2.4. HIPERSUPERFICIES REGULARES DE RN
37
Sea F : Rn+1 → R la función
F (x1 , . . . , xn+1 ) = (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 .
Para ver que es una hipersuperficie regular de Rn+1 debemos
∂F
i
probar que r2 es un valor regular de F . Ahora bien, ∂x
i = 2(x −
∂F
i
i
ai ) y, por tanto, ∂x
i = 0 si y sólo si x = a para todo i. Como
n
n
q0 6∈ Sq0 (r), se tiene que Sq0 (r) es una hipersuperficie regular.
(2) Se prueba análogamente que en R3 el elipsoide de semiejes a, b, c >
0 y centro q0 = (a1 , a2 , a3 )
F (x, y, z) :=
(x − a1 )2 (y − a2 )2 (z − a3 )2
+
+
=1
a2
b2
c2
es una hipersuperficie regular de R3 .
(3) Análogamente, también lo es el hiperboloide de una hoja en R3
para r > 0:
F (x, y, z) := x2 + y 2 − z 2 = r2
(4) En general, resulta válida la idea intuitiva de que cualquier superficie “suave” S en R3 es una hipersuperficie regular, siempre
que se le pueda asignar de manera continua un vector normal
N . Para convencerse de ello, la idea consiste esencialmente en
tomar como función F la que a cada punto de R3 la asigna la
distancia “con signo” (positiva en el sentido al que apunta N y
negativa en el contrario) del punto a la superficie. Entonces F es
diferenciable en un entorno de S, y admite como valor regular el
0 (S = F −1 (0)), véase la Figura 9.
Proposición 2.4.4 Si Q = F −1 (c0 ) ⊆ Rn es una hipersuperficie regular y f : Rn → R es una aplicación diferenciable entonces f |Q : Q → R
es también diferenciable.
Demostración. Es continua por ser la restricción a Q de una aplicación continua. Para ver que es diferenciable, sea p0 ∈ Q y, digamos,
∂F
(p0 ) 6= 0. Consideremos para p0 la carta generada por la Proposición
∂xi
2.4.2, esto es,
πxi : Vxi ∩ F −1 (c0 ) → Dxi ⊆ Rn−1
(x1 , . . . , xn ) 7→ (x1 , . . . , xi−1 , xi+1 , . . . , xn )
Figura 9
−1
para abiertos Vxi , Dxi . Se tiene, πx−1
(c0 ) con:
i : Dxi → Vxi ∩ F
(x1 , . . . , xi−1 , xi+1 , . . . , xn ) 7→
(x , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ),
1
siendo φxi la función dada por el Teorema de la Función Implı́cita
(sobre el codominio R consideramos como carta la identidad Id). Por
tanto,
1
i−1
Id ◦ f ◦ πx−1
, xi+1 , . . . , xn )
i (x , . . . , x
= f (x1 , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ),
que es diferenciable por ser composición de diferenciables. 2
2.5.
Subvariedades regulares de
n
R
Definición 2.5.1 Sea F : U ⊆ Rn → Rm (n ≥ m) diferenciable
(C ∞ ) y sea c0 ∈ Im(F ). Se dice que c0 es un valor regular de F si la
diferencial de F en p, (d F )p , tiene rango máximo m para todo p ∈
F −1 (c0 ).
i
Esto es, la matriz ( ∂F
(p))i,j ∈ Mm×n (R) tiene rango m para todo
∂xj
−1
p ∈ F (c0 ).
2.5. SUBVARIEDADES REGULARES DE RN
39
∂F
Si m = 1 entonces la matriz anterior se reduce a grad F (p) = ( ∂x
1 (p),
∂F
. . . , ∂xn (p)) y, por tanto, reobtenemos la definición de valor regular de
la sección anterior. Nuestro objetivo será ahora generalizar la Proposición 2.4.2 para mostrar que la imagen inversa de cualquier valor regular
es una variedad diferenciable.
i
(p))i,j tiene rango m entonces habrá alguna
Observemos que si ( ∂F
∂xj
submatriz cuadrada de orden m con determinante distinto de 0. Esto
es, podremos escoger m columnas (que supondremos son las m últimas)
tales que el correspondiente determinante es distinto de 0. En este caso,
el Teorema de la Función Implı́cita permite asegurar que en la ecuación
F (x1 , . . . , xn−m , xn−m+1 , . . . , xn ) = c0 las variables xn−m+1 , . . . , xn son
“despejables” como función de las n − m primeras x1 , . . . , xn−m . Esto
es, la proyección sobre las n − m primeras variables sirve como carta
local en F −1 (c0 ) y, además, los cambios de carta resultan diferenciables.
Con más precisión, recordemos ese teorema:
Teorema 2.5.2 (Teorema de la Función Implı́cita): Consideremos los
abiertos U ⊆ Rn−m , V ⊆ Rm y U × V ⊆ Rn . Supongamos que F :
U × V ⊆ Rn → Rm es diferenciable y que (x0 , y0 ) ∈ U × V es tal que la
diferencial respecto de las variables en V de F (dy F )(x0 ,y0 ) : Rm → Rm
es un isomorfismo (lineal). Entonces existe un entorno U0 de x0 y W0
de c0 := F (x0 , y0 ) y una aplicación g : U0 × W0 → V diferenciable tal
que F (x, g(x, c)) = c para todo x ∈ U0 y c ∈ W0 .
Si llamamos
gc0 : U0 → V
x 7→ g(x, c0 )
entonces F (x, gc0 (x)) = c0 para todo x ∈ U0 , y la coordenada y se
despeja en función de la x (y = gc0 (x)).
Razonando entonces como en la sección anterior y usando el Teorema 2.5.2 se obtiene la siguiente generalización de las Proposiciones
2.4.2 y 2.4.4:
Teorema 2.5.3 Sea F : U ⊆ Rn → Rm diferenciable y c0 ∈ Im(F )
un valor regular. Entonces Q = F −1 (c0 ) es una variedad topológica, y
las proyecciones sobre los subespacios coordenados de dimensión n − m
generan canónicamente una estructura diferenciable. Además, si f :
U ⊆ Rn → Q0 es diferenciable entonces también lo es f |Q .
(Como en la Proposición 2.4.2, a fin de generar un atlas diferenciable
se entiende aquı́ que, para cada p ∈ Q, si las columnas i1 , . . . , im de
dFp son independientes entonces se toma como función coordenada en
un entorno de p la proyección sobre las otras n − m variables.) A las
variedades ası́ obtenidas las llamaremos subvariedades regulares de Rn .
Ejemplo. Consideremos el grupo ortonormal de dimensión 2
O(2, R) = {A ∈ M2×2 (R) : A · At = Id} ⊂ R4 .
Veamos que O(2, R) es una variedad diferenciable de dimensión 1. En
primer lugar tenemos que M2×2 (R) ≡ R4 . Ahora
µ bien, A
¶ ∈ O(2, R) si
a
b
y sólo si A · At = Id, es decir, si y sólo si A =
≡ (a, b, c, d)
c d
verifica
a 2 + b2 = 1
ac + bd = 0
c2 + d2 = 1.
Por tanto, si definimos
F : R4 → R3
(a, b, c, d) 7→ (a2 + b2 , ac + bd, c2 + d2 ),
tenemos que O(2, R) = F −1 (1, 0, 1). Basta con comprobar que (1, 0, 1)
es un valor regular de F , esto es, que el rango de (d F )A es 3 para todo
A ∈ O(2, R). En primer lugar, observemos que


2a 2b 0 0
(d F )A =  c d a b  ∈ M3×4 (R).
(2.2)
0 0 2c 2d
Ahora bien, como A · At = Id se tiene que det(A) = ±1 6= 0 y las dos
primeras columnas de (d F )A son independientes. Además también se
obtiene que c y d no se anulan simultáneamente, por lo que el rango de (d F )A es 3. En consecuencia, tomando como coordenada sobre
O(2, R) la proyección al elemento c (cuando c 6= 0) o d (cuando d 6= 0)
obtenemos un atlas para O(2, R).
Notas: (1) O(2, R) puede estudiarse más detenidamente como sigue.
Si definimos
O+ (2, R) = {A ∈ O(2, R) : det(A) = 1}
O− (2, R) = {A ∈ O(2, R) : det(A) = −1}
2.6. APÉNDICE 1: ATLAS EN §2
41
entonces se puede comprobar:
µ
¶
cos θ −senθ
+
O (2, R) = {
: θ ∈ R}
µ senθ cos θ ¶
cos θ senθ
O− (2, R) = {
: θ ∈ R}.
senθ − cos θ
Los conjuntos O+ (2, R) y O− (2, R) son las dos partes conexas de O(2, R).
El grupo O(2, R) se reduce, por tanto, a dos copias de S 1 . En general,
O(n, R) = {A ∈ Mn×n (R) : AAt = Idn } es una variedad diferenciable
de dimensión n(n − 1)/2 que tiene dos componentes conexas. Además,
O(n, R) s compacto, al identificarse con un subconjunto cerrado y aco2
tado de Rn .
(2) O(n, R) con el producto usual de matrices es un caso especial
de grupo de Lie; esto es, de grupo algebraico G ≡ (G, ·) dotado de una
estructura de variedad diferenciable, y tal que las aplicaciones
G×G→G
(g, h) 7→ g · h
y
G→G
g 7→ g −1
son diferenciables7 .
2.6.
Apéndice 1: dos atlas explı́citos sobre
la esfera
La Proposición 2.4.2 ó el Teorema 2.5.3 permiten concluir que la
esfera S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} es una (hiper)superficie
regular de R3 . Sin embargo, en este apéndice comprobaremos directamente que es una variedad topológica de dimensión 2 suministrando, de
hecho, dos atlas diferenciables de interés que generan dicha estructura
diferenciable. Sean
Uz+ = {(x, y, z) ∈ S 2 : z > 0} ⊂ R3 (casquete superior de la esfera)
Θ = {(x, y) ∈ R2 : x2 + y 2 < 1} ⊂ R2 ,
dos abiertos de S 2 y R2 , respectivamente, y definamos la aplicación
+
ϕ+
z : Uz → Θ
(x, y, z) 7→ (x, y)
7
La teorı́a de grupos de Lie es muy precisa y, en particular, muestra que las
hipótesis de esta definición son algo redundantes.
que es continua, ya que coincide con la restricción a Uz+ de la proyección
πz : R2 × R → R2
((x, y), z) 7→ (x, y),
+
es decir, ϕ+
z = πz |Uz+ . La aplicación ϕz obviamente admite por inversa
a la aplicación
−1
(ϕ+
: Θ ⊂ R2 → Uz+ ⊂p
R3
z)
(x, y) 7→ (x, y, 1 − x2 − y 2 ),
que es continua puesto que cada componente suya lo es. En consecuencia, hemos encontrado un entorno coordenado para cada punto
p ∈ Uz+ .
Para el abierto Uz− = {(x, y, z) ∈ S 2 : z < 0} (casquete inferior)
repetimos el mismo proceso pero ahora con
−
ϕ−
z : Uz → Θ
(x, y, z) 7→ (x, y)
−1
(ϕ−
: Θ → Uz−
z)
p
(x, y) 7→ (x, y, − 1 − x2 − y 2 ).
Para completar nuestro atlas debemos cubrir el ecuador. Para ello consideramos en primer lugar los abiertos Uy+ = {(x, y, z) ∈ S 2 : y > 0} y
Uy− = {(x, y, z) ∈ S 2 : y < 0} con
+
ϕ+
y : Uy → Θ
(x, y, z) 7→ (x, z)
−1
(ϕ+
: Θ → Uy+
y)
√
(x, z) 7→ (x, 1 − x2 − z 2 , z)
y
−
ϕ−
y : Uy → Θ
(x, y, z) 7→ (x, z)
−1
(ϕ−
: Θ → Uy−
y)
√
(x, z) 7→ (x, − 1 − x2 − z 2 , z),
respectivamente. Por último, para cubrir los puntos (1, 0, 0), (−1, 0, 0) ∈
S 2 tomamos los abiertos Ux+ = {(x, y, z) ∈ S 2 : x > 0} y Ux− =
{(x, y, z) ∈ S 2 : x < 0} con
+
ϕ+
x : Ux → Θ
(x, y, z) 7→ (y, z)
−1
: Θ → Ux+ p
(ϕ+
x)
(y, z) 7→ ( 1 − y 2 − z 2 , y, z)
y
−
ϕ−
x : Ux → Θ
(x, y, z) 7→ (y, z)
−1
: Θ → Ux− p
(ϕ−
x)
(y, z) 7→ (− 1 − y 2 − z 2 , y, z),
2.6. APÉNDICE 1: ATLAS EN §2
43
respectivamente. En conclusión, el atlas para toda la esfera S 2 queda
−
−
+
+
−
−
+
+
−
−
AS 2 = {(Uz+ , ϕ+
z ), (Uz , ϕz ), (Uy , ϕy ), (Uy , ϕy ), (Ux , ϕx ), (Ux , ϕx )}.
2
Por tanto, S es una variedad topológica. De la forma explı́cita de
los cambios de carta resulta inmediato comprobar que el atlas AS 2 es
diferenciable.
Podemos optimizar el número de elementos que componen un atlas
para S 2 proyectando estereográficamente. En efecto, lo haremos para
el caso general de la esfera n-dimensional S n (de nuevo centrada en
el origen y de radio 1 por comodidad). Sean N = (0, . . . , 0, 1) (polo
norte) y S = (0, . . . , 0, −1) (polo sur). Como primer entorno coordenado consideramos el abierto U N = S n − {N } junto con la proyección
estereográfica desde N , ϕN : U N → Rn , esto es, ϕN es la aplicación
que lleva cada elemento (x1 , . . . , xn+1 ) de U N al punto de corte con
el plano xn+1 ≡ 0 de la recta que pasa por N y por (x1 , . . . , xn+1 ).
Explı́citamente,
ϕN : U + → Rn
(x1 , . . . , xn+1 ) 7→
1
(x1 , . . . , xn ).
1−xn+1
Análogamente, consideremos el abierto U S = S n − {S} junto con la
proyección estereográfica desde S,
ϕS : U S → Rn
(x1 , . . . , xn+1 ) 7→
1
(x1 , . . . , xn ).
1+xn+1
Entonces (U N , ϕN ) y (U S , ϕS ) completan un atlas para la esfera S n .
Ejercicio. Compruébese: (1) ϕN , ϕS son homeomorfismos, (2) su
cambio de cartas es diferenciable y (3) el atlas A = {(U N , ϕN ), (U S , ϕS )}
genera la misma estructura diferenciable en S n que la ya estudiada.
Nota. Para n = 2 se tiene el cambio de cartas ϕS ◦ (ϕN )−1 : R2 −
{(0, 0)} → R2 − {(0, 0)}, (u, v) → (u, v)/(u2 + v 2 ). Esta aplicación (y
su inversa) no son sólo diferenciables sino también anti-holomorfas. Si
en lugar de ϕS tomamos la aplicación ϕ̃S = s ◦ ϕS donde s(u, v) =
(v, u), ∀(u, v) ∈ R2 , el cambio de cartas ϕ̃S ◦ (ϕN )−1 (y su inverso) resulta holomorfo. En consecuencia, el atlas A = {(U N , ϕN ), (U S , ϕ̃S )}
es holomorfo y S 2 admite una estructura de variedad compleja de dimensión 1 (esfera de Riemann) –véase la nota al concepto de variedad
(2) al final de la Sección 2.2.
Observación. Señalemos que no existe un atlas con una única carta
para S n (ni para ninguna otra variedad compacta). Si existiera dicho
atlas entonces tendrı́amos un homeomorfismo ϕ : S n → Θ, siendo Θ
un abierto de Rn . Pero S n es compacto luego, como ϕ es continua,
también Θ = ϕ(S n ) es compacto. En consecuencia, Θ es un cerrado
(y abierto) de Rn , es decir, Θ = Rn por ser Rn es conexo. Esto es una
contradicción puesto que Rn no es acotado y, por tanto, no puede ser
compacto.
2.7.
Apéndice 2: coordenadas polares, cilı́ndricas y esféricas
Coordenadas polares sobre R2 : Estas coordenadas vienen definidas
de la siguiente manera. Consideremos como carta el abierto U = R2 −
{(x, 0) ∈ R2 : x ≤ 0} junto con la aplicación
ϕ : U ⊂ R2 →]0, ∞[×] − π, π[
(x, y) 7→ (ρ(x, y), θ(x, y)),
p
donde ρ(x, y) = x2 + y 2 y θ(x, y) es el único real de ] − π, π[ tal que
x = ρ · cos θ e y = ρ · senθ (por tanto, la inversa de ϕ es ϕ−1 (ρ, θ) =
(ρ · cos θ, ρ · senθ)). Existen diferentes modos de determinar la función
θ(x, y) de manera explı́cita:

arc tan xy
si x > 0



π

si x = 0, y > 0
 2
y
π + arc tan x
si x < 0, y > 0
θ(x, y) =

π

−
si x = 0, y < 0


 2
−π + arc tan xy
si x < 0, y < 0
o más compactamente:
θ(x, y) = 2 · arc tan
y
p
x + x2 + y 2
para todo (x, y) ∈ R2 − {(x, 0) : x ≤ 0}.
Coordenadas cilı́ndricas sobre R3 : Para definir estas coordenadas
consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto
2.7. APÉNDICE 2: COORDENADAS EN R3
45
con la aplicación
ϕ : U ⊂ R3 →]0, ∞[×] − π, π[×R
(x, y, z) 7→ (ρ(x, y), θ(x, y), z),
donde ρ(x, y) y θ(x, y) se definen como en las coordenadas polares. Por
tanto, la correspondiente inversa es ϕ−1 (ρ, θ, z) = (ρ · cos θ, ρ · senθ, z).
Coordenadas esféricas sobre R3 : Para definir estas coordenadas
consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto
con la aplicación
ϕ : U ⊂ R3 →]0, ∞[×]0, π[×] − π, π[
(x, y, z) 7→ (r(x, y, z), θ(x, y, z), φ(x, y, z)),
p
donde r(x, y, z) = x2 + y 2 + z 2 , y θ(x, y, z) y φ(x, y, z) son los únicos
reales de ]0, π[ y ] − π, π[, respectivamente, tales que x = r · senθ · cos φ
e y = r · senθ · senφ. Por tanto, en este caso ϕ−1 (r, θ, φ) = (r · senθ ·
cos φ, r · senθ · senφ, r · cos θ).
Ejercicios
Ejercicio 1. Razonar si todo espacio topológico X localmente homeomorfo a Rn es necesariamente T1 (esto es, para cada par de puntos
x, y ∈ X, existe un entorno de x que no contiene a y, y un entorno de
y que no contiene a x.)
Ejercicio 2. Se considera la aplicación ϕ : R+ × R → R2 − {(0, 0)},
(ρ, θ) → (ρ cos θ, ρsenθ). Compruébese que ϕ es un difeomorfismo local
y suprayectivo. ¿Es ϕ un difeomorfismo global?
Ejercicio 3. Si Q es una variedad diferenciable, pruébese que cada
carta ϕ : U −→ ϕ(U ) de Q es un difeomorfismo entre las variedades
diferenciables U y ϕ(U ).
Ejercicio 4. Dado un número real ² > 0 (ó ² = ∞), demuéstrese que
todo punto p de una variedad diferenciable Q de dimensión n tiene una
carta (U, ϕ) tal que ϕ(p) = 0 y ϕ(U ) = B0 (²) = {x ∈ Rn : kxk < ²}.
Ejercicio 5. Se consideran en R+ =]0, ∞[ los atlas A1 = {(R+ , IdR+ )},
A2 = {(R+ , ln)}, A3 = {(R+ , exp)}, A4 = {(R+ , x3 )}, A5 = {(R+ , (x−
1)3 )}, donde ln es la aplicación logaritmo neperiano y exp la exponencial. ¿Cuáles de ellos definen iguales estructuras diferenciables?
Ejercicio 6. Sea S 2 la esfera unitaria centrada en (0, 0, 0) de R3 y sea
ϕN : S 2 − {(0, 0, 1)} −→ R2 la proyección estereográfica desde el polo
norte (0, 0, 1). Calcúlense las cordenadas, con respecto a esta carta, del
punto ( √13 , √13 , √13 ) de S 2 . ¿Qué punto de S 2 tiene coordenadas (0, 0)
con respecto a esta carta?
Ejercicio 7. Sean Q y Q0 variedades diferenciables y sean π : Q ×
Q0 −→ Q y π 0 : Q × Q0 −→ Q0 las correspondientes proyecciones; es
decir, π(p, p0 ) = p y π 0 (p, p0 ) = p0 , ∀(p, p0 ) ∈ Q × Q0 . Pruébese que π y
π 0 son aplicaciones diferenciables. Si Q00 es otra variedad diferenciable
y F : Q00 −→ Q × Q0 es una aplicación, pruébese que F es diferenciable
si y sólo si π ◦ F y π 0 ◦ F son diferenciables.
Ejercicio 8. Con las mismas notaciones del problema anterior, para
cada (p, p0 ) ∈ Q × Q0 consideremos las aplicaciones ip0 : Q −→ Q × Q0 ,
ip0 (q) = (q, p0 ), ∀q ∈ Q, y jp : Q0 −→ Q × Q0 , jp (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 .
Pruébese que ip0 y jp son aplicaciones diferenciables.
Ejercicio 9. Si F : Q −→ N y F 0 : Q0 −→ N 0 son aplicaciones
diferenciables, pruébese que F × F 0 : Q × Q0 −→ N × N 0 , definida por
(F × F 0 )(p, p0 ) = (F (p), F 0 (p0 )), es también diferenciable.
Ejercicio 10. Se consideran las aplicaciones F, G : R2 −→ R2 , dadas
por
F (x, y) = (xey + y, xey − y)
G(x, y) = (ex cos(y), ex sen(y)).
¿Es F (resp. G) un difeomorfismo?
Ejercicio 11. Encuéntrese un difeomorfismo entre el paraboloide
grafo de la función z = x2 + y 2 y el hiperboloide grafo de la función
z = x2 − y 2 .
Ejercicio 12. Demuéstrese que todos los intervalos abiertos de R son
difeomorfos.
Ejercicio 13. Demuéstrese que dos esferas de Rn+1 con centros y
radios arbitrarios son difeomorfas.
Ejercicio 14. Se considera al subconjunto de R3 , S = {(x, y, z) :
yex + zey + yez = −1}. ¿Es S una superficie regular de R3 ?
2.7. APÉNDICE 2: COORDENADAS EN R3
47
Ejercicio 15. Sean A, B, C ∈ R\{0}. Determı́nense los valores regulares de la función sobre R3 , f (x, y, z) = Ax2 + Bxy + Czy.
Ejercicio 16. En la esfera S 2 se considera la relación de equivalencia
p ∼ q si y sólo si q = ±p, ∀p, q ∈ S 2 . Denotaremos por P2 (R) al espacio
cociente S 2 / ∼ (espacio proyectivo real bidimensional). Pruébese que,
con la topologı́a cociente, P2 (R) es una variedad topológica de dimensión 2. Demuéstrese que admite una estructura diferenciable tal que
la correspondiente proyección canónica desde S 2 es un difeomorfismo
local (esta estructura diferenciable es única). Generalizar a cualquier
dimensión n ∈ N.
Ejercicio 17. Consideremos la esfera unidad de dimensión 1, S 1 ,
como los números complejos de módulo 1, es decir, S 1 = {z ∈ C :
|z| = 1}.
(1) Pruébese que la aplicación F : S 1 −→ S 1 , definida por F (z) = z 2 ,
∀z ∈ S 1 , es diferenciable, sobreyectiva y coincide sobre cada par
de puntos antı́podas de S 1 .
(2) Si F̃ : P1 (R) −→ S 1 es la aplicación inducida por F en el cociente,
pruébese que F̃ es un difeomorfismo.
Capı́tulo 3
Espacio tangente
3.1.
Concepto de vector tangente a una
variedad Q en un punto p
Consideremos una superficie S ⊂ R3 y una curva diferenciable
γ(t) = (x(t), y(t), z(t)) ⊂ S. Obviamente, podemos definir la velocidad de la curva γ(t) en t = 0 como γ 0 (0) = (x0 (0), y 0 (0), z 0 (0)) ∈ R3 .
De este modo, si γ(0) = p entonces el vector γ 0 (0) será “tangente” a la
superficie S en p. Esto es, la velocidad de la curva en p está contenida
en el plano tangente a S en p, si pensamos en γ 0 (0) como un vector
con “origen” el punto p (véase la Figura 10).
Ejercicio. Sea S un superficie de R3 obtenida como imagen inversa
de un valor regular para alguna función f : R3 → R, S = F −1 (c0 ).
Demuéstrese que la ecuación implı́cita del plano afı́n que es tangente
a S en un punto p0 = (x0 , y0 , z0 ) ∈ S es:
∂f
∂f
∂f
(p0 )(x − x0 ) +
(p0 )(y − y0 ) +
(p0 )(z − z0 ) = 0.
∂x
∂y
∂z
Generalı́cese a subvariedades regulares de Rn .
49
50
CAPÍTULO 3. ESPACIO TANGENTE
Figura 10
Con más generalidad, consideremos ahora una variedad diferenciable arbitraria Q de dimensión n y un punto p ∈ Q. El objetivo de
este capı́tulo es dar una definición razonable de espacio tangente a la
variedad Q en el punto p, ası́ como el estudio de la estructura de dicho espacio. En general, asociaremos a cada punto p de una variedad
n-dimensional Q, su espacio tangente, que será un espacio vectorial
también de dimensión n.
Como primera aproximación, en esta sección introduciremos los
conceptos de vector y espacio tangente a una variedad en un punto de
tres formas diferentes, cada vez más abstractas, aunque equivalentes.
3.1.1.
Vector tangente como clase de equivalencia
de curvas
Consideremos en adelante una variedad diferenciable Q de dimensión n y fijemos un punto p ∈ Q. Sea
Cp = {γ :] − ²γ , ²γ [→ Q : ²γ > 0, γ(0) = p, γ diferenciable},
esto es, Cp es el conjunto de curvas contenidas Q que pasan por p donde,
para simplificar el lenguaje, suponemos que cada curva pasa por p en 0
y está definida en algún entorno abierto simétrico de 0. Establecemos
en Cp una relación de equivalencia como sigue. Diremos que dos curvas
γ, ρ ∈ Cp son equivalentes si para algún entorno coordenado (U, ϕ =
(q 1 , . . . , q n )) de p se verifica dtd |t=0 (ϕ ◦ γ)(t) = dtd |t=0 (ϕ ◦ ρ)(t)
3.1. CONCEPTO DE VECTOR TANGENTE
51
(obsérvese que ϕ(γ(0)) = ϕ(ρ(0)) = ϕ(p)). Es decir, las curvas son
equivalentes si coinciden los vectores tangentes en Rn de ambas curvas
vistas en coordenadas (véase la Figura 11).
Figura 11
Observación. Esta definición es independiente del entorno coordenado escogido. En efecto, sea (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) otro entorno coordej
nado de p y denotemos por ∂∂qq̃ i (p) la i-ésima parcial de q̃ j ◦ ϕ−1 , esto
es,
∂ q̃ j
∂(q̃ j ◦ ϕ−1 )
(p)
=
(ϕ(p)),
∂q i
∂xi
donde ∂x∂ j denota la parcial j-ésima usual para funciones definidas en
Rn . Entonces
d
| (q̃ j ◦ γ)(t)
= d |t=0 [(q̃ j ◦ ϕ−1 ) ◦ (ϕ´◦ γ)](t)
dt t=0
Pn ³ ∂ q̃j dt d
= i=1 ∂qi (p) · dt |t=0 (q i ◦ γ)(t)
(y, si γ y ρ están relacionadas usando (U, ϕ))
´
P ³ j
= ni=1 ∂∂qq̃ i (p) · dtd |t=0 (q i ◦ ρ)(t) =
d
|
dt t=0
(q̃ j ◦ ρ)(t)
para todo j y, por tanto, dtd |t=0 (ϕ̃◦γ)(t) = dtd |t=0 (ϕ̃◦ρ)(t). Nótese que
la relación entre dtd |t=0 (ϕ̃ ◦ γ)(t) y dtd |t=0 (ϕ ◦ γ)(t) es, matricialmente,
 d
  ∂ q̃1
  d

∂ q̃ 1
1
1
.
.
.
|
(q̃
◦
γ)(t)
|
(q
◦
γ)(t)
1
n
t=0
t=0
∂q
∂q
dt
dt

  .. . .

..
..
.  

= .
.
. ..  ·
.
.
d
d
n
n
∂ q̃ n
∂ q̃ n
| (q̃ ◦ γ)(t)
| (q ◦ γ)(t)
. . . ∂qn
dt t=0
dt t=0
∂q 1
p
(3.1)
52
Es inmediato comprobar que el concepto de curvas equivalentes
proporciona una relación de equivalencia. Estamos pues en condiciones
de establecer la primera definición de vector tangente.
Definición 3.1.1 Llamaremos vector tangente a Q en p (como clase
de curvas) a cada una de las clases de equivalencia definidas por ∼ en
Cp .
Ası́, denotaremos por [γ] al vector tangente representado por la curva
γ, esto es, la clase de equivalencia de γ. En consecuencia,
Definición 3.1.2 Llamaremos espacio tangente a Q en p al conjunto
Cp / ∼.
Por simplicidad de notación (y por las expresiones en coordenadas que
veremos en la próxima subsección) escribiremos γ 0 (0) = [γ].
3.1.2.
Vector tangente por coordenadas
Consideremos, en la variedad diferenciable Q, dos curvas γ, ρ ∈ Cp .
En este caso, si fijamos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) se
tiene:
d
|
dt t=0
d
|
dt t=0
ϕ ◦ γ(t) = ( dtd |t=0 q 1 ◦ γ(t), . . . , dtd |t=0 q n ◦ γ(t)) = (a1 , . . . , an )
ϕ ◦ ρ(t) = ( dtd |t=0 q 1 ◦ ρ(t), . . . , dtd |t=0 q n ◦ ρ(t)) = (b1 , . . . , bn )
y se verifica
γ ∼ ρ ⇔ (a1 , . . . , an ) = (b1 , . . . , bn ).
Esto es, fijado un sistema de coordenadas (U, ϕ) cada vector tangente
[γ] se puede identificar con una n-upla (a1 , . . . , an ) ∈ Rn . Además, si
tomamos otra carta coordenada (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )), al mismo vector
tangente [γ] le asignamos la n-upla:
d
d
d
|t=0 ϕ̃ ◦ γ(t) = ( |t=0 q̃ 1 ◦ γ(t), . . . ,
|t=0 q̃ n ◦ γ(t)) = (ã1 , . . . , ãn ),
dt
dt
dt
que, aunque es distinta de (a1 , . . . , an ), se relaciona con ella mediante
la igualdad (3.1). Podemos establecer la siguiente definición alternativa
de vector tangente:
3.1. CONCEPTO DE VECTOR TANGENTE
53
Definición 3.1.3 Un vector tangente a Q en p (por coordenadas) es
una aplicación que a cada entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de
p le hace corresponder un elemento (a1 , . . . , an ) ∈ Rn , de modo tal que
dado otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) el nuevo elemento
(ã1 , . . . , ãn ) ∈ Rn asignado verifica
  ∂ q̃1
ã1
∂q 1
 ..   ..
 . = .
∂ q̃ n
ãn
∂q 1


a1
..  ·  ..  ,
.   . 
∂ q̃ n
an
∂q n
(3.2)
∀i ∈ {1, . . . , n}.
(3.3)
∂ q̃ 1
∂q n
...
..
.
...


p
o, equivalentemente,
n
X
∂ q̃ i
ã =
(p) · aj
j
∂q
j=1
i
Resulta inmediato comprobar que las Definiciones 3.1.1 y 3.1.3 son
equivalentes. Además, de la linealidad de (3.2) queda de manifiesto la
estructura de espacio vectorial de dimensión n (a partir de la suma y el
producto por escalares usuales en Rn ) de que está dotado el conjunto
de todos los vectores tangentes a p.
La Definición 3.1.3 formaliza la idea clásica en Fı́sica de que un
vector es asignar a cada sistema de coordenadas un elemento de Rn
“que se transforma como un vector” (esto es, verificándose (3.3)).
3.1.3.
Vector tangente como derivación
Introducimos ahora un nuevo concepto de vector tangente basándonos
en la existencia de un “modo de derivar funciones” para cada vector
tangente a Q en p; es lo que generaliza la derivada direccional en Rn .
Más concretamente, sea γ ∈ Cp y consideremos su vector tangente asociado [γ]. Si f : Q → R es una aplicación diferenciable (C ∞ ) entonces
podemos considerar f ◦ γ :] − ²γ , ²γ [→ R y calcular dtd |t=0 (f ◦ γ)(t). A
este número real lo llamaremos derivada direccional de f en la dirección del vector tangente [γ]. Comprobemos, en primer lugar, que esta
derivada es independiente del representante escogido en la clase [γ].
Esto es,
Lema 3.1.4 Si γ ∼ ρ entonces
d
|
dt t=0
(f ◦ γ)(t) =
d
|
dt t=0
(f ◦ ρ)(t).
54
Demostración. Si (U, ϕ = (q 1 , . . . , q n )) es un sistema de coordenadas
en p entonces dtd |t=0 (f ◦ γ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t). Entonces,
aplicando la regla de la cadena,
Pn ∂(f ◦ϕ−1 )
d
−1
(ϕ(p)) · dtd |t=0 (q j ◦ γ)(t)
|
(f
◦
ϕ
)
◦
(ϕ
◦
γ)(t)
=
t=0
j=1
dt
∂xj
Pn ∂(f ◦ϕ−1 )
= j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j ◦ ρ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ ρ)(t)
= dtd |t=0 (f ◦ ρ)(t).
2
Por tanto, cada clase de equivalencia proporciona una única derivada
direccional en p.
De la prueba del Lema 3.1.4 resulta inmediato comprobar que si el
vector tangente [γ] viene dado por coordenadas entonces la derivada
P
◦ϕ−1 )
direccional de f es igual a i ai ∂(f∂x
(ϕ(p)), en la notación de la
i
Definición 3.1.3.
Consideremos el conjunto C ∞ (Q) = {f : Q → R : f es diferenciable C ∞ }. De manera natural, en este conjunto se pueden definir las
operaciones f + g, f · g y a · f , siendo f, g ∈ C ∞ (Q) y a ∈ R. De
hecho, (C ∞ (Q), +, ·) tiene estructura de anillo unitario conmutativo
y (C ∞ (Q), +, ·R) tiene estructura de espacio vectorial. Si fijamos un
vector tangente en p, [γ] = vp , podemos definir la aplicación:
Dvp : C ∞ (Q) → R
f 7→ Dvp (f ) ≡ vp (f ),
(3.4)
siendo vp (f ) = dtd |t=0 (f ◦γ)(t) la derivada direccional de f con respecto
a vp . La aplicación (3.4) verifica las siguientes propiedades:
(1) Es R-lineal:
Dvp (a·f +b·g) = a·Dvp (f )+b·Dvp (g),
∀f, g ∈ C ∞ (Q), ∀a, b ∈ R.
(2) Verifica la regla de Leibniz del producto en p:
Dvp (f · g) = (Dvp f ) · g(p) + f (p) · Dvp (g),
∀f, g ∈ C ∞ (Q)
Demostración de (2). Si vp = [γ], entonces
Dvp (f · g) = dtd |t=0 ((f · g) ◦ γ)(t) = dtd |t=0 ((f ◦ γ) · (g ◦ γ))(t) =
( dtd |t=0 (f ◦ γ)(t)) · g(γ(0)) + f (γ(0)) · ( dtd |t=0 (g ◦ γ)(t)) =
Dvp (f ) · g(p) + f (p) · Dvp (g). 2
3.2. ESTRUCTURA DEL ESPACIO TANGENTE
55
Ahora estamos en condiciones de establecer nuestra última definición
de vector tangente.
Definición 3.1.5 Sea Q una variedad diferenciable y p ∈ Q. Un vector tangente en p a Q (como derivación) es una aplicación Dvp :
C ∞ (Q) → R tal que:
(1) Es R-lineal.
(2) Verifica la regla de Leibniz del producto en p.
Observaciones:
(1) Obviamente, cada vector tangente según las anteriores definiciones proporciona un vector tangente como derivación. Más aún,
el recı́proco también es cierto. Esto es, si tenemos un vector tangente como derivación vp = Dvp entonces existe un único vector
tangente [γ] tal que1 :
Dvp (f ) = vp (f ) =
d
|t=0 (f ◦ γ)(t) ∀f ∈ C ∞ (Q).
dt
(2) Si dos funciones f , g coinciden en un entorno V de p se puede
demostrar que Dvp f = Dvp g. En consecuencia, un vector tangente en p como derivación también proporciona una aplicación
C ∞ (V ) → R, R-lineal y que verifica la regla del producto, para
todo entorno V de p.
Esta tercera definición de vector tangente a p es la más abstracta de
las tres, aunque también la más cómoda desde el punto de vista puramente matemático. En adelante diremos que “vp es un vector tangente
a p” y usaremos cualesquiera de las tres definiciones, según conveniencia.
3.2.
Estructura del espacio tangente
En adelante denotaremos por Tp Q el conjunto de todos los vectores
tangentes en p a Q, y lo llamaremos espacio tangente en p a Q.
1
Véase [O’N, Capı́tulo 1]; en la próxima sección veremos explı́citamente cómo
un vector tangente como derivación puede expresarse por coordenadas o como clase
de equivalencia de curvas.
56
3.2.1.
Vectores tangentes inducidos por los entornos
coordenados
Sea Q una variedad n-dimensional y consideremos un punto p ∈
Q. Existe una manera natural de asociar a cada entorno coordenado
(U, ϕ = (q 1 , . . . , q n )) n vectores tangentes en p a Q. En efecto, fijado
i ∈ {1, . . . , n} consideremos el vector ei = (0, . . . , 1(i) , . . . , 0) ∈ Rn .
Definimos la recta ri :
ri : R → Rn
t 7→ ϕ(p) + t · ei .
A continuación, tomemos la preimagen por ϕ de la recta ri anterior:
γi :] − ², ²[ → Q
t 7→ ϕ−1 (ϕ(p) + t · ei ).
Obtenemos ası́ n vectores tangentes en p, [γi ], i = 1, . . . , n, para cada
entorno coordenado. Observemos que
d
d
|t=0 (ϕ ◦ γi )(t) =
|t=0 (ϕ(p) + t · ei ) = ei .
dt
dt
Es decir, el vector de Rn asociado al vector tangente por coordenadas
[γi ] mediante (U, ϕ) vuelve a ser ei (véase la Figura 12).
Figura 12
Observemos además que en este caso la derivación asociada a vp ≡ [γi ]
es
Dvp : C ∞ (Q) → R
∂(f ◦ϕ−1 )
∂f
(ϕ(p)).
f 7→ ∂q
i (p) :=
∂xi
57
En efecto:
Dvp (f ) = dtd |t=0 (f ◦ γi )(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γi )(t)
P
◦ϕ−1 )
= nj=1 ∂(f∂x
(ϕ(p)) · dtd |t=0 q j ◦ ϕ−1 (ϕ(p) + tei )
j
Pn ∂(f ◦ϕ−1 )
◦ϕ−1 )
(ϕ(p)),
= j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j (p) + δij t) = ∂(f∂x
i
donde recordemos que q j = xj ◦ ϕ y δij es la delta de Kronecker. Esto
justifica que de ahora en adelante sigamos la notación Dvp ≡ ∂q∂ i |p
siempre que vp = [γi ].
En resumen, fijado un entorno coordenado (U, ϕ = (q 1 , . . . , q n ))
hemos obtenido n derivaciones en p,
∂
∂q i
|p : C ∞ (Q) → R
∂f
f 7→ ∂q
i (p)
i = 1, . . . , n.
Ejemplo. Consideremos la aplicación f : R2 → R, f (x, y) = x2 +
y. Consideremos coordenadas polares (U, ϕ = (ρ, θ)) con U = R2 −
{(x, 0) : x ≤ 0}. Si tomamos p = (0, 1) entonces ϕ(p) = (ρ(p), θ(p)) =
∂
∂
(1, π/2). Por tanto, para los vectores tangentes ∂ρ
|p y ∂θ
|p tenemos:
∂
|
∂ρ p
∂
∂θ
∂
(f ) = ∂f
(p) ∂ρ
|(1,π/2) (ρ2 cos2 θ + ρsenθ)
∂ρ
= (2ρ cos2 θ + senθ) |(1,π/2) = 1.
∂
|p (f ) = ∂f
(p) = ∂θ
|(1,π/2) (ρ2 cos2 θ + ρsenθ)
∂θ
2
= (−ρ sen2θ + ρ cos θ) |(1,π/2) = 0.
Ejercicio. Para Q = R2 y coordenadas usuales (x, y), compruébese
∂
∂
que ∂x
|p y ∂y
|p coinciden con las derivadas parciales usuales en p.
3.2.2.
Estructura de espacio vectorial de Tp Q
Cuando estudiamos el concepto de vector tangente por coordenadas
llamamos la atención sobre la estructura de espacio vectorial de dimensión n del espacio tangente. La estructura de espacio vectorial resulta
también obvia (no tanto su dimensionalidad) tratando los vectores tangentes como derivaciones. En efecto, si vp , wp ∈ Tp Q entonces la suma
vp + wp : C ∞ (Q) → R
f 7→ vp (f ) + wp (f ),
58
y el producto por un escalar λ ∈ R
λ · vp : C ∞ (Q) → R
f 7→ λ · vp (f ),
verifica todas las propiedades de espacio vectorial. El siguiente resultado permite trabajar con facilidad en coordenadas.
Proposición 3.2.1 Para cada entorno coordenado (U, ϕ = (q 1 , . . . , q n ))
de p ∈ Q se tiene que Bpϕ = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) es una base de Tp Q.
P
Además, si vp ∈ Tp Q entonces vp = ni=1 vp (q i ) ∂q∂ i |p .
Demostración. Ya vimos que para cada entorno coordenado (U, ϕ) se
tiene el isomorfismo natural


v1


vp 7→  ...  ∈ Rn .
vn
En particular, ∂q∂ i |p → ei ∈ Rn . Por tanto, Bpϕ se aplica en la base usual
P
de Rn y, es entonces una base. Más aún, si vp = ni=1 v i ∂q∂ i |p entonces
j
vp (q ) =
n
X
i=1
v
i ∂q
j
∂q i
(p) =
n
X
v i δij = v j .
i=1
2
En particular, si (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) es otro entorno coordenado
de p ∈ Q entonces ∂q∂ j |p se puede escribir como combinación lineal de
elementos de la base Bpϕ̃ = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ). Con más precisión:
n
X ∂ q̃ i
∂
∂
|
=
(p) i |p .
p
j
j
∂q
∂q
∂ q̃
i=1
(3.5)
Observaciones:
(1) La expresión (3.5) se reduce a aplicar la regla de la cadena evaluando en la correspondiente función. En efecto,
∂
∂q j
−1
−1
−1
∂(f ◦ϕ )
∂f
|p (f ) = ∂q
(ϕ(p)) = ∂(f ◦ϕ̃ ∂x◦jϕ̃◦ϕ ) (ϕ(p))
j |p =
∂xj
Pn ∂ q̃i
P
◦ϕ̃−1
∂ q̃ i
∂
(ϕ̃(p)) ∂q
= ni=1 ∂f∂x
i
j (p) =
i=1 ∂q j (p) ∂ q̃ i |p (f ).
(3.6)
59
(2) También seguiremos la notación v i = q̇ i (vp )(= vp (q i )). Por tanto,
i
q̃˙ (vp ) =
n
X
∂ q̃ i
(p) · q̇ j (vp )
j
∂q
j=1
(3.7)
(o, más brevemente, si se da por supuesto el vector vp entonces
P
i
∂ q̃ i j
q̃˙ = nj=1 ∂q
j q̇ ).
Ejemplos:
(1) En R2 consideramos las coordenadas usuales ϕ = (x, y). Fijemos
p0 ∈ R2 y consideremos la base del espacio tangente en p0 Bp0 =
∂
∂
( ∂x
|p0 , ∂y
|p0 ). Tenemos pues las aplicaciones
C ∞ (R2 ) → R,
f 7→
∂f
(p )
∂x 0
|p0 : C ∞ (R2 ) → R,
f 7→
∂f
(p0 ).
∂y
∂
| :
∂x p0
∂
∂y
Además, dado vp0 ∈ Tp0 R2 se tiene
vp0 = a
∂
∂
|p0 +b
|p
∂x
∂y 0
con
a = vp0 (x) ≡ ẋ(vp0 )
b = vp0 (y) ≡ ẏ(vp0 ).
Se puede establecer por tanto un isomorfismo canónico
ip0 : R2 → Tp0 R2
∂
∂
(a, b) 7→ (a ∂x
|p0 +b ∂y
|p0 ).
Obviamente, esto es extensible a Rn . De hecho, podemos trabajar
indistintamente con Rn o con su tangente Tp0 Rn vı́a el isomorfismo canónico ip0 anterior.
Más aún, en todo espacio vectorial V (R) existe una identificación
natural entre Tv V y V , ∀v ∈ V . En efecto, fijado v ∈ V , para
cada w ∈ V se tiene una curva t 7→ v + tw que define un vector
tangente wv ∈ Tv V . Se tiene entonces un isomorfismo natural
Tv V → V
wv 7→ w.
Sin embargo, nada similar a estas identificaciones ocurre en variedades diferenciables arbitrarias.
60
(2) Si tomamos coordenadas polares (ρ, θ) en un abierto U de R2 que
contenga a p0 = (ρ0 cos θ0 , ρ0 senθ0 ) ∈ R2 y consideramos la base
∂
∂
( ∂ρ
|p0 , ∂θ
|p0 ) del espacio tangente Tp0 R2 tenemos
∂
| = ∂x
| ∂ |
∂ρ p0
∂ρ p0 ∂x p0
+ ∂y
|
∂ρ p0
∂
∂y
∂
∂
|p0 = cos θ0 ∂x
|p0 +senθ0 ∂y
|p0
∂
∂θ
+ ∂y
|
∂θ p0
∂
∂y
∂
∂
|p0 = −ρ0 senθ0 ∂x
|p0 +ρ0 cos θ0 ∂y
|p0 .
|p0 =
∂x
| ∂ |
∂θ p0 ∂x p0
∂
∂
∂
|p0 , ∂θ
|p0 ) es una base de Tp0 R2 . Si escribimos êρ = ∂ρ
|p0 ,
Ası́, ( ∂ρ
1 ∂
êθ = ρ0 ∂θ |p0 e identificamos (êρ , êθ ) vı́a ip0 con una base de R2 ,
esta base es ortonormal para el producto euclı́deo usual.
∂
∂
Ejercicio. Calcular las coordenadas del vector vp = v 1 ∂x
|p +v 2 ∂y
|p ∈
2
∂
∂
Tp R en la base ( ∂ρ |p , ∂θ |p ).
3.3.
Variedad tangente
Sea Q una variedad diferenciable de dimensión n. Definimos el espacio o variedad tangente a Q como T Q = ∪p∈Q Tp Q. Consideremos la
proyección π : T Q → Q, π(vp ) = p. Nuestro objetivo es demostrar que
cada entorno coordenado de Q induce un entorno coordenado en T Q de
modo que T Q resulta ser, de manera natural, una variedad diferenciable de dimensión 2n. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado
de Q. Definimos
ϕT : π −1 (U )(⊆ T Q) → ϕ(U ) × Rn (⊆ Rn × Rn ≡ R2n )
vp 7→ (ϕ(p), (vp (q 1 ), . . . , vp (q n )))
≡ ((q 1 (p), . . . , q n (p)), (q̇ 1 (vp ), . . . , q̇ n (vp )).
(3.8)
Claramente, ϕT es biyectiva. Consideraremos en T Q la única topologı́a
tal que cada ϕT es un homeomorfismo, esto es, la que admite como
base topológica los subconjuntos de T Q que se pueden escribir como
(ϕT )−1 (V ), para algún ϕT construido como (3.8) y algún abierto V
de ϕ(U ) ⊆ Rn . Esta topologı́a resulta ser Hausdorff y ANII, siendo
además T Q localmente homeomorfo a R2n . Ası́, T Q es una variedad
topológica de dimensión 2n, donde cada (π −1 (U ), ϕT ) es obviamente
un entorno coordenado. Si ahora tomamos otro entorno coordenado
(Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) de Q, y definimos la correspondiente aplicación
ϕ̃T : π −1 (Ũ ) → ϕ̃(Ũ ) × Rn (⊂ R2n ),
3.3. VARIEDAD TANGENTE
61
se tiene ϕ̃T ◦ (ϕT )−1 : ϕ(U ∩ Ũ ) × Rn → ϕ̃(U ∩ Ũ ) × Rn
1
n
((q 1 , . . . , q n ), (q̇ 1 , . . . , q̇ n )) 7→ ((q̃ 1 (q), . . . , q̃ n (q)), (q̃˙ (q, q̇), . . . , q̃˙ (q, q̇)),
donde q = (q 1 , . . . , q n ), q̇ = (q̇ 1 , . . . , q̇ n ). Obviamente, ϕ̃T ◦ (ϕT )−1 es
i
diferenciable y q̃˙ (q, q̇) viene determinado por (3.7). En conclusion,
Teorema 3.3.1 T Q es una variedad diferenciable de dimensión 2n.
Observación. T Q es localmente difeomorfo a Q × Rn ; de hecho, dos
variedades arbitrarias de la misma dimensión k son localmente difeomorfas (por ser difeomorfas a Rk localmente). Sin embargo, no son
necesariamente globalmente difeomorfos.
Ejemplos:
(1) Consideremos R2 y T R2 . La aplicación
R2 × R2 → T R2
∂
∂
(x0 , y0 , a, b) 7→ a ∂x
|(x0 ,y0 ) +b ∂y
|(x0 ,y0 )
es un difeomorfismo entre R4 y T R2 . Análogamente, la aplicación
V × V → TV
(v, w) 7→ (v, α0 (0)),
con α(t) = v + tw, determina un difeomorfismo entre V × V y
TV .
(2) Justifiquemos que también T S 1 es difeomorfo a S 1 × R. Consideremos primero el vector tangente en cada punto de R2
−y
∂
∂
|(x,y) +x
|(x,y) .
∂x
∂y
Este vector coincide con el vector coordenado
∂
∂
∂
|(x,y) = −ρsen(θ(x, y))
|(x,y) +ρ cos(θ(x, y))
|(x,y)
∂θ
∂x
∂y
en el dominio de definición de las polares. De ahı́ que, sin posibil∂
idad de confusión, podamos denotarlo ∂θ
|(x,y) para todo (x, y) ∈
2
R −{(0, 0)}. En particular, sobre todo punto de S 1 , podemos ver
62
∂
∂θ
|(x,y) como la clase de equivalencia de la curva θ 7→ (cos(θ +
θ0 ), sen(θ + θ0 )) ∈ S 1 , con x = cos θ0 , y = senθ0 . Fácilmente se
comprueba entonces que
S1 × R → T S1
∂
((x, y), a) 7→ a ∂θ
|(x,y)
es un difeomorfismo.
(3) Sin embargo, la variedad T S 2 , tangente a la esfera bidimensional
S 2 , no es difeomorfa a S 2 × R2 (véase la Sección 5.3).
Por último, señalemos que cada curva γ(t) en Q determina un vector tangente [γ] ≡ γ 0 (0) en γ(0) o, con más generalidad, un vector
tangente γ 0 (t0 ) en cada punto t0 de su dominio de definición (formalmente, γ 0 (t0 ) := [γ(t + t0 ]). Ası́, cada curva γ(t) en Q genera una curva
γ 0 (t) en TQ.
3.4.
Apéndice: notas sobre Mecánica Lagrangiana
A continuación, vamos a aplicar estos conceptos al estudio de los
sistemas lagrangianos. Recordemos que para una partı́cula que describe
una curva x(t) en R3 con energı́a cinética T = (1/2)m k x0 (t) k2 y
energı́a potencial V (x(t), t), la lagrangiana se define como
1
L(x, ẋ, t) = m k ẋ k2 −V (x, t),
2
que es una función explı́cita de la posición, la velocidad y también del
tiempo t (en el caso de que lo sea V ). Si, p. ej., la trayectoria de la
partı́cula está restringida a pasar por una superficie S ⊂ R3 , es natural
pensar que el sistema “pierde un grado de libertad”, y la lagrangiana
será una función con dominio la superficie, junto con todos los planos
tangentes a ella posibles, más, eventualmente, el tiempo. Esta situación
se puede generalizar y abstraer progresivamente, lo que conduce a los
siguientes conceptos.
3.4. APÉNDICE: MECÁNICA LAGRANGIANA
3.4.1.
63
Lagrangianas
Con bastante generalidad, se postula que el espacio de configuración de un sistema mecánico es una variedad diferenciable arbitraria
Q siendo entonces la lagrangiana una función sobre T Q o, con más
generalidad (lagrangianas dependientes del tiempo),
L : T Q × R → R,
donde la coordenada natural de R en T Q × R o “tiempo” se usará para
parametrizar las curvas bajo consideración (fórmula (3.9)). El dominio
de definición de la lagrangiana es pues una variedad producto N =
T Q × R, donde usualmente se trabaja con coordenadas tipo (q, q̇, t),
esto es, coordenadas (q, q̇) ≡ ϕT como en (3.8) junto a la coordenada
usual de R.
Tiene sentido pues considerar ∂L
, ∂L y ∂L
. Sea
∂q ∂ q̇
∂t
γ:I⊂R →Q
t 7→ γ(t)
una curva diferenciable (tomando coordenadas podemos escribir t →
q(t)). Esta curva induce a su vez curvas en T Q y en N = T Q × R:
I ⊂ R → TQ
t 7→ γ 0 (t)
I ⊂ R → TQ × R
t 7→ (γ 0 (t), t).
(3.9)
En coordenadas esta última aplicación se suele escribir (q(t), q̇(t), t),
donde cada q̇ i (t) es igual a la componente i-ésima del vector tangente
γ 0 (t), que coincide con la derivada de q i (t) ≡ q i (γ(t)) en cada t ∈ I,
dq i
(t) ∀t ∈ I.
dt
Obsérvese que, en general, si ρ(t) = (q(t), q̇(t), t) es una curva definida
directamente en N = T Q × R entonces se tiene
q̇ i (t) =
=
(t)
ρ̇(t)(L) = d(L◦ρ)
dt
dq̇ i
∂L
∂L
i=1 ( ∂q i (q(t), q̇(t), t) dt (t) + ∂ q̇ i (q(t), q̇(t), t) dt (t) +
Pn
dq i
∂L
(q(t), q̇(t), t)).
∂t
Pero sólo cuando la curva ρ(t) es del tipo ρ(t) = γ 0 (t) para alguna
curva γ(t) de Q se puede escribir
dq̇ i
d2 q i
dq i
= q̇ i (t);
= 2.
dt
dt
dt
64
3.4.2.
Curvas crı́ticas de la acción
Es sabido que, en la deducción variacional de las Recuaciones de
t
Euler-Lagrange, se considera el funcional acción A(γ) = t01 L(γ 0 (t), t)dt
sobre curvas diferenciales γ : [t0 , t1 ] → Q. La compacidad de [t0 , t1 ]
(concretamente, la existencia de un “número de Lebesgue”) permite
hallar un número finito de entornos coordenados (U (α) , q (α) ) y una partición del intervalo t0 = s0 < s1 < . . . < sk = t1 tal que γ([si , si+1 ]) ⊂
U (αi ) para algún αi . Ası́, tiene sentido escribir
Z t1
k Z si
X
0
A(γ) =
L(γ (t), t)dt =
L(q (αi ) (t), q̇ (αi ) (t), t)dt
t0
i=1
si−1
para poder deducir expresiones manejables en coordenadas.
Tı́picamente, en Mecánica Lagrangiana se consideran curvas que
conectan dos puntos fijos p0 , p1 ∈ Q, y que son crı́ticas para el funcional
acción A en el siguiente sentido. Sea γ una curva que conecta p0 con
p1 ,
γ : [t0 , t1 ] → Q,
γ(t0 ) = p0 , γ(t1 ) = p1 .
Una variación de γ es una aplicación diferenciable
] − ², ²[×[t0 , t1 ] → Q,
(s, t) 7→ γs (t)
para algún ² > 0, que verifica γ0 (t) = γ(t), ∀t ∈ [t0 , t1 ] (en ocasiones,
también conviene permitir que el intervalo de definición de γs dependa
de s, por lo que el dominio de la variación se generaliza subsecuentemente). La variación se llama de extremos fijos si
γs (t0 ) = p0 ,
γs (t1 ) = p1 ,
∀s ∈] − ², ²[.
Para cada s fijo, la curva t 7→ γs (t) es una curva longitudinal de la
variación. Para cada t fijo, la curva s 7→ γs (t) es una curva transversal;
esta curva determina en s = 0 un vector tangente V (t) para cada t. A
la curva en T Q
t 7→ V (t)
se le llama campo variacional o variación infinitesimal de γ. Obsérvese
que la variación de γ en Q induce una variación de γ 0 en T Q:
] − ², ²[×[t0 , t1 ] → T Q,
(s, t) 7→ γs0 (t),
(3.10)
3.4. APÉNDICE: MECÁNICA LAGRANGIANA
65
donde γs0 (t) denota al vector tangente en γs (t) determinado por la
curva longitudinal γs (a su vez, esta variación induce trivialmente una
en T Q × R). Se dice que γ es una curva crı́tica para A si para toda
variación de γ en el conjunto de curvas que se esté considerando se
tiene
dA(γs )
|s=0 = 0.
ds
No es difı́cil demostrar que las curvas crı́ticas para variacioness de extremos fijos coinciden con las que, escritas en cualesquiera coordenadas,
satisfacen las ecuaciones de Euler-Lagrange:
d
dt
µ
∂L
∂ q̇ i
¶
−
∂L
= 0.
∂q i
Ejercicios
Ejercicio 1. Razonar por qué se puede identificar Tp R2 con R2 , ∀ p ∈
R2 .
Ejercicio 2. Calcúlese una base de T(1,1,2) Q, siendo Q el paraboloide
dado por la gráfica de la función z = x2 + y 2 .
Ejercicio 3. Calcúlese una base de T( √1 ,0,√2) Q, siendo Q el elipsoide
2
de ecuación
2
x2 + y 2 + z4 = 1.
Ejercicio 4. Sea Q una variedad, p ∈ Q y v ∈ Tp Q. Demuéstrese:
(i) Si f ∈ C ∞ (Q) es constante entonces v(f ) = 0.
(ii) Si f, g ∈ C ∞ (Q) coinciden en un entorno de p entonces v(f ) =
v(g).
Ejercicio 5. Se consideran las coordenadas cilı́ndricas definidas en
[Tema 2, Apéndice 2]. Escrı́banse ∂/∂ρ|p , ∂/∂θ|p y ∂/∂z|p como combinación lineal de la base de Tp R3 inducida por las coordenadas usuales
(cartesianas) de R3 .
Ejercicio 6. Sean U = {(x, y, z) : z > 0} y f : U → R la aplicación
definida por f (x, y, z) = 3 x + y/z. Calcular qué valor toman sobre
f las derivaciones asociadas a las coordenadas cilı́ndricas en el punto
p = (1, 1, 3).
66
Ejercicio 7. Sean p = (3, 4, 2) ∈ R3 y vp = −∂x + 3 ∂y − 2 ∂z ∈ Tp R3 .
Hállese la expresion de vp en coordenadas cilı́ndricas.
Ejercicio 8. Dado p = (0, 1, 1) ∈ R3 , se considera vp = −2 ∂ρ + ∂θ −
∂z ∈ Tp R3 . Calcúlese la expresión de vp en coordenadas cartesianas.
Ejercicio 9. Sea F : R3 −→ R2 la aplicación definida por
F (x, y, z) = (x2 + y 2 , z 2 ).
Discutir si c = (1, 1) es un valor regular de F , y en tal caso, determinar
la dimensión de la subvariedad regular Q = F −1 (c), y hallar T(1,0,1) Q.
Ejercicio 10. Dada la aplicación F : R4 −→ R3 , definida por
F (x, y, z, t) = (2 x + y, t, z),
estudiar si Q = F −1 (c) es una subvariedad regular de R4 , con c =
(0, 1, 1), y en caso afirmativo, calcular T(1,−2,1,1) Q.
Ejercicio 5. Idem para las coordenadas esféricas ϕ = (r, θ, φ) definidas
en ese mismo apéndice.
Capı́tulo 4
Aplicaciones diferenciables
entre variedades
En este capı́tulo pretendemos generalizar el concepto de diferencial
de una aplicación diferenciable entre espacios euclı́deos a aplicaciones
entre variedades arbitrarias. Para ello partiremos del conocimiento previo de algunas nociones sobre el espacio dual, que se desarrollan en el
Apéndice. Más aún, definiremos las variedades cotangentes, que sirven
de dominio natural a la Mecánica Hamiltoniana, y generalizaremos
algunos teoremas fundamentales sobre aplicaciones diferenciables.
Recordemos que, dada una función diferenciable de dos variables reales
f : R2 → R, el plano tangente a su gráfica en un punto (x0 , y0 , f (x0 , y0 ))
admite la expresión
z − z0 =
∂f
∂f
(x0 , y0 )(x − x0 ) +
(x0 , y0 )(y − y0 ).
∂x
∂y
Este plano se suele escribir como una diferencial en (x0 , y0 ) ∈ R2 ,
dz ≡ (df )(x0 ,y0 ) =
∂f
∂f
(x0 , y0 )dx +
(x0 , y0 )dy.
∂x
∂y
Esta diferencial puede interpretarse como una función lineal sobre
67
68
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
T(x0 ,y0 ) R2 . En efecto, tomando un vector tangente arbitrario
v = v1
∂
∂
|(x0 ,y0 ) +v 2
|(x ,y ) ∈ T(x0 ,y0 ) R2
∂x
∂y 0 0
se tiene
(df )(x0 ,y0 ) (v) = v 1
∂f
∂f
(x0 , y0 ) + v 2 (x0 , y0 ) ∈ R,
∂x
∂y
véase la Figura 13.
Figura 13
En la Sección 4.1 se va a extender este punto de vista a cualquier
función real sobre Q lo que, en particular, permitirá definir la variedad
cotangente, Sección 4.2. En la Sección 4.3 extenderemos el concepto de
diferencial a cualquier aplicación entre dos variedades.
4.1. DIFERENCIAL DE UNA FUNCIÓN
69
4.1.
Diferencial de una función sobre una
variedad
4.1.1.
Concepto
Sea vp = [γ] un vector tangente a Q en p. Recordemos que para
f ∈ C ∞ (Q) habı́amos definido la derivada de f en la dirección de
vp como vp (f ) = dtd |t=0 (f ◦ γ) ∈ R. En consecuencia, para cada
f ∈ C ∞ (Q) se tiene la aplicación
dfp : Tp Q → R
vp 7→ vp (f )
(4.1)
a la que denominaremos diferencial de f en p. Como muestra la siguiente proposición, la aplicación dfp es una forma lineal sobre Tp Q
(véase (1) del Apéndice). En efecto,
Proposición 4.1.1 La aplicación dfp definida en (4.1) es lineal, esto
es, dfp ∈ Tp Q∗ .
Demostración.
dfp (avp +bwp ) = (avp +bwp )(f ) = avp (f )+bwp (f ) = a·dfp (vp )+b·dfp (wp )
para todo vp , wp ∈ Tp Q y todo a, b ∈ R. 2
Ası́, la aplicación dfp extiende a la diferencial usual de funciones
reales, y representa la mejor aproximación lineal a f en p.
4.1.2.
Expresión en coordenadas
A continuación estudiaremos bases de Tp Q∗ asociadas a entornos
coordenados, y determinaremos la expresión en coordenadas de la diferencial de f : Q → R.
Fijemos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de la variedad
Q. La base canónica de Tp Q asociada a dicho entorno es Bpϕ = ( ∂q∂ 1 |p
, . . . , ∂q∂n |p ).
Proposición 4.1.2 La base dual de Bpϕ (véase (2) del Apéndice) es
Bpϕ∗ = (dqp1 , . . . , dqpn ).
70
Demostración. Obsérvese en primer lugar que q i : U ⊆ Q → R es, obviamente, diferenciable, por lo que, efectivamente dqpi define un elemento
de Tp Q∗ . El resultado se deduce por tanto de:
dqpj (
∂q j
∂
|
)
=
(p) = δij
p
∂q i
∂q i
∀i, j ∈ {1, . . . , n}.
2
Podemos ahora considerar la matriz de dfp asociada a Bpϕ , esto es,
(siguiendo el Apéndice), las coordenadas de dfp en Bpϕ∗ . Usando que
∂
∂f
|p (f ) = i (p) ∀i ∈ {1, . . . , n}
i
∂q
∂q
dicha matriz queda:
µ
¶
∂
∂
M (dfp , {1} ←
= dfp ( 1 |p ), . . . , dfp ( n |p )
∂q
∂q
µ
¶
∂f
∂f
=
(p), . . . , n (p) .
∂q 1
∂q
Bpϕ )
Ası́,
n
X
∂f
dfp =
(p)dqpi ,
i
∂q
i=1
(4.2)
y si vp ∈ Tp Q entonces
n
n
X
X
∂f
∂f
i
dfp (vp ) =
(p) · dqp (vp ) =
(p) · vpi ,
i
i
∂q
∂q
i=1
i=1
donde vp =
4.1.3.
Pn
i=1
vpi ∂q∂ i |p .
Cambio de coordenadas
Tomemos ahora otro sistema de coordenadas (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n ))
alrededor de p. Para estas coordenadas se verifica igualmente
dfp =
n
X
∂f
(p)dq̃pi .
i
∂
q̃
i=1
4.2. EL ESPACIO COTANGENTE
71
Ahora bien, por (4.2) el cambio de base entre Bpϕ∗ y Bpϕ̃∗ queda (compárese con el Apéndice (3)):
dqpi =
n
X
∂q i
(p)dq̃pj .
j
∂
q̃
j=1
En consecuencia, de la anterior ecuación se tiene fácilmente la siguiente relación entre las parciales de f con respecto a las distintas coordenadas:
Pn ∂qi
Pn ∂qi
∂f
∂
∂
∂
(p)
=
df
(
|
)
=
df
(
(p)
|
)
=
p
p
p
p
j
j
j
i
i=1 ∂ q̃
i=1 ∂ q̃ j (p)dfp ( ∂q i |p )
∂ q̃
∂q
Pn ∂ q̃ ∂qi
∂f
= i=1 ∂ q̃j (p) ∂q
i (p).
Se obtiene ası́ la relación entre las coordenadas de dfp en Bpϕ̃∗ y Bpϕ∗ .
4.2.
El espacio cotangente
El desarrollo de la sección anterior es aplicable a cualquier forma lineal sobre Tp Q. Ası́, si fijamos un entorno coordenado (U, ϕ =
(q 1 , . . . , q n )) de p ∈ Q y consideramos las bases Bpϕ y Bpϕ∗ entonces a
cada φ ∈ Tp Q∗ le corresponden n números reales (b1 , . . . , bn ) tales que
φ=
n
X
bi · dqpi .
i=1
Estos n números reales son las coordenadas de φ en Bpϕ∗ y vienen dados
por la expresión
bi = φ(
∂
|p ) ∀i ∈ {1, . . . , n}.
∂q i
Si tomamos otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) la forma
lineal φ tendrá coordenadas (b̃1 , . . . , b̃n ), deduciéndose la relación
b̃j =
n
X
∂q i
(p)bi .
j
∂
q̃
i=1
(4.3)
Como ocurrı́a con los vectores tangentes, esta relación permite definir
cada elemento del espacio dual Tp Q∗ por coordenadas como una n-upla
72
asignada a cada entorno coordenado de p que se transforma según (4.3)
frente a cambios de coordenadas.
Análogamente al caso del espacio tangente, llamamos espacio o
variedad cotangente de Q a T Q∗ = ∪p Tp Q∗ . Este espacio también se
considera dotado de una estructura natural de variedad diferenciable,
definiéndose un atlas diferenciable como sigue. Sea π : T Q∗ → Q,
π(αp ) = p, la proyección canónica, y (U, ϕ) un entorno coordenado de
Q. Definimos
ϕC : π −1 (U ) → ϕ(U ) × Rn (⊆ R2n )
αp 7→ (q 1 (p), . . . , q n (p), p1 (αp ), . . . , pn (αp )),
P
donde pi (αp ) = αp ( ∂q∂ i |p ), esto es, αp = ni=1 pi (αp )dqpi .
(4.4)
Nota. En Mecánica Hamiltoniana se parte de la variedad de configuración Q, de su espacio cotangente T Q∗ (o espacio de fases) y de una
hamiltoniana H : T Q∗ × R → R. A las coordenadas pi se les llama
momentos generalizados. Análogamente al caso lagrangiano (Sección
3.4), en Mecánica Hamiltoniana se pueden calcular curvas crı́ticas de
la hamiltoniana (u otros funcionales relacionados con ella) para diversos tipos de variaciones. Esto es, curvas en T Q∗
ρ : [t0 , t1 ] → T Q∗ , ρ(t) = (q(t), p(t))
tales que para cualquier variación
] − ², ²[×[t0 , t1 ] → T Q∗
(s, t) 7→ ρs (t)
(en la clase de curvas que se considere) la función
µ Z t1
¶
Z t1
A(ρs ) =
H(ρs (t), t)dt ≡
H(qs (t), ps (t), t)dt
t0
t0
verifique dA
| = 0. Pero, a diferencia del caso lagrangiano, tanto la
ds s=0
curva ρ(t) como la variación ρs (t) se toman directamente en T Q∗ , esto
es, no se construyen a partir de curvas de Q (compárese con (3.10)).
La consecuencia de esta “mayor libertad” en las variaciones, es que las
ecuaciones de Hamilton
∂H
dq i
(t) =
(q(t), p(t), t);
dt
∂pi
dpi
∂H
(t) = − i (q(t), p(t), t),
dt
∂q
(4.5)
4.3. DIFERENCIAL DE UNA APLICACIÓN
73
(que caracterizan localmente a curvas extremales apropiadas), son 2n
ecuaciones de primer orden –en lugar de n ecuaciones de segundo, como
en el caso lagrangiano.
4.3.
Diferencial de una aplicación entre
variedades
En esta sección introduciremos el concepto de diferencial de una
aplicación entre dos variedades arbitrarias. Sean Q, Q0 dos variedades
diferenciables y F : Q → Q0 una aplicación diferenciable entre ellas.
Es claro que si vp = [γ] ∈ Tp Q entonces [F ◦ γ] ∈ TF (p) Q0 . Pues bien,
llamamos diferencial de F en p a la aplicación
dFp : Tp Q → TF (p) Q0
[γ] 7→ [F ◦ γ],
véase la Figura 14.
Figura 14
Observación. Para comprobar que esta definición es consistente, debemos tener en cuenta lo siguiente:
74
(1) La definición es independiente de la curva de la clase [γ] que se
elija. En efecto, supongamos que m y n son las dimensiones de
Q y Q0 , respectivamente. Sean (U, ϕ = (q 1 , . . . , q m )) y (U 0 , ϕ0 =
(q 01 , . . . , q 0n )) entornos coordenados alrededor de p y de F (p),
respectivamente. Si vp = [γ] ∈ Tp Q entonces
d
|
dt t=0
(ϕ0 ◦ F ◦ γ)(t) = dtd |t=0 (ϕ0 ◦ F ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t)
P
∂(ϕ0 ◦F ◦ϕ−1 )
= m
(ϕ(p)) dtd |t=0 (q j ◦ γ)(t).
j=1
∂xj
(4.6)
d
Ahora bien, si γ ∼ ρ (esto es, vp = [γ] = [ρ]) entonces dt |t=0
(q j ◦ γ)(t) = dtd |t=0 (q j ◦ ρ)(t) ∀j. En consecuencia, de (4.6)
deducimos que la definición de diferencial sólo depende del vector
vp y no del representante de la clase.
(2) Esta definición es consistente con la definición de diferencial que
vimos para una función real f : Q → R. En efecto, esto se ve
fácilmente gracias a la identificación entre R y Tf (p) R, ya que
dfp (vp ) = vp (f ) =
d
|t=0 (f ◦ γ) ∈ Tf (p) R ≡ R.
dt
De ahora en adelante usaremos la notación
q 0i ◦ F ≡ F i
1
n
∂
|
(ϕ0 ◦ F ◦ ϕ−1 ) = ( ∂F
, . . . , ∂F
)(p).
∂xj ϕ(p)
∂q j
∂q j
Con esta notación dFp (vp ) adopta la expresión:
Ã m
!
n
X
X ∂F i
∂
dFp (vp ) =
(p)v j
| ,
j
0i F (p)
∂q
∂q
i=1
j=1
P
j ∂
donde vp = m
j=1 v ∂q j |p . Esto es, matricialmente las coordenadas de
0
dFp (vp ) en la base Bpϕ = ( ∂q∂01 |p , . . . , ∂q∂0n |p ) son

 ∂F 1
 
∂F 1
1
.
.
.
v
1
m
∂q
∂q
 ..
..  ·  ..  .
..
(4.7)
 .
.
.   . 
m
∂F n
∂F n
v
. . . ∂qm
∂q 1
p
De hecho, (4.7) puede considerarse como definición de dFp , aplicable
directamente cuando los vectores tangentes se dan por coordenadas.
4.3. DIFERENCIAL DE UNA APLICACIÓN
75
De todo lo anterior resulta inmediato que dFp : Tp Q → TF (p) Q0 es
lineal. La siguiente proposición relaciona los vectores tangentes dFp (vp )
y vp vistos como derivaciones.
Proposición 4.3.1 Si vp ∈ Tp Q y F : Q → Q0 es una aplicación
diferenciable entonces
dFp (vp ) : C ∞ (Q0 ) → R
g 7→ vp (g ◦ F ).
(4.8)
Demostración. Si vp = [γ] entonces dFp (vp ) = [F ◦ γ]. Por tanto,
dFp (vp )(g) =
d
d
|t=0 g ◦ (F ◦ γ) =
|t=0 (g ◦ F ) ◦ γ = vp (g ◦ F ). 2
dt
dt
Figura 15
Obviamente, (4.8) también puede tomarse como definición de dFp ,
aplicable directamente a vectores dados como derivaciones.
Ejemplos:
(1) Para una función diferenciable F : Rm → Rn , si identificamos los
espacios tangentes Tp Rm , TF (p) Rn con Rm , Rn (véase (4.7)), respectivamente, entonces la definición de diferencial (dF )p coincide
con la usual entre Rm y Rn .
76
(2) Consideremos la circunferencia S 1 ⊂ R2 ≡ C (véase la Sección
3.3) y la aplicación diferenciable F : S 1 → S 1 , F (z) = z 2 , ∀z ∈ C.
Para calcular dFp0 , p0 ∈ S 1 , tomamos como coordenada en torno
a p0 el “ángulo” θ y consideramos la curva θ → (cos θ, senθ) ∈
S 1 ⊂ R2 . Si θ0 es tal que p0 = (cos θ0 , senθ0 ) entonces:
dFp0 (
∂
d
|p0 ) =
|θ F (cos θ, senθ)
∂θ
dθ 0
d
∂
|θ0 (cos 2θ, sen2θ) = 2
|F (p0 ) ,
dθ
∂θ
donde recordemos (véase [Sección 3.3, Ejemplo (2)])
=
∂
∂
∂
|p0 = −senθ0
|p0 + cos θ0
|p .
∂θ
∂x
∂y 0
(3) Consideremos una subvariedad regular Q ⊂ Rn+p y una aplicación F : Q → Q0 que sea restricción de otra aplicación F̄ :
Rn+p → Q0 . Se verifica entonces
dFp = dF̄p |Tp Q .
Ası́, por ejemplo, la aplicación F : S 2 → S 2 , F (x) = −x es la
restricción a S 2 de la aplicación F̄ : R3 → R3 , F̄ (x) = −x. Como,
salvo identificación, dF̄p = −Id3 , se tiene
Ã n
!
n
X ∂
X
∂
i
dFp
a
|p = −
ai i |(−p)
i
∂x
∂x
i=1
i=1
para cualquier vector tangente
4.4.
Pn
i=1
ai ∂x∂ i |p ∈ Tp S 2 .
Teoremas fundamentales
En esta sección enunciaremos con generalidad en variedades arbitrarias algunos teoremas fundamentales relacionados con las aplicaciones diferenciables. Esencialmente, sus demostraciones se reducen a
las de los correspondientes teoremas entre espacios euclı́deos, una vez
escritos los enunciados en coordenadas.
4.4. TEOREMAS FUNDAMENTALES
77
Teorema (Regla de la cadena): Consideremos dos aplicaciones
diferenciables entre variedades F : Q → Q0 y G : Q0 → Q00 y consideremos sus respectivas diferenciales dFp : Tp Q → TF (p) Q0 y dGF (p) :
TF (p) Q0 → TG(F (p)) Q00 con p ∈ Q. Se verifica entonces:
d(G ◦ F )p = dGF (p) ◦ dFp .
Teorema de la Función Inversa: Sea F : Q → Q0 una aplicación
diferenciable y p0 ∈ Q. Supongamos que (dF )p0 : Tp0 Q → TF (p0 ) Q0
es biyectiva (por lo que, necesariamente, dim Q =dim Q0 ). Entonces
existen entornos coordenados U de p0 y U 0 de F (p0 ) tales que F (U ) =
U 0 y la restricción de F a U es biyectiva con inversa diferenciable; esto
es,
F |U : U → U 0
p 7→ F (p)
−1
es un difeomorfismo. Además, d(F |−1
U )F (p0 ) = (dFp0 ) .
(Obsérvese que F es un difeomorfismo local si y sólo si (dF )p es
biyectiva para todo p ∈ Q.)
Teorema de la Función Implı́cita: Sea F : Q → Q0 una aplicación diferenciable y q ∈ ImF (⊆ Q0 ) un valor regular de F , esto es,
tal que para todo p ∈ F −1 (q) se tiene que dFp : Tp Q → TF (p) Q0 es
suprayectiva. Entonces F −1 (q) es una variedad topológica de dimensión dim Q−dim Q0 ≥ 0 y admite una estructura diferenciable natural
a partir de las cartas de Q. A cada variedad diferenciable obtenida mediante este teorema la llamaremos subvariedad de Q asociada al valor
regular q de F .
Observación 4.4.1 Sobre el Teorema de la Función Implı́cita merece
tenerse en cuenta lo siguiente:
(1) Sean, n = dim Q, m = dim Q0 . Como en el Teorema 2.5.3, para
construir un atlas diferenciable en F −1 (q) se entiende que, para cada
p ∈ F −1 (q) y cada entorno coordenado (U, ϕ) de Q alrededor de p, si
las columnas i1 , . . . , im de dFp en esas coordenadas son independientes
entonces se deben escoger las otras n − m funciones coordenadas de ϕ.
(2) Como en la [Sección 4.3, Ejemplo (3)], la restricción de cualquier
aplicación diferenciable definida sobre Q a una subvariedad suya es
también diferenciable. Además, el espacio tangente a F −1 (q) en cada
punto p ∈ F −1 (q) puede verse como un subespacio de Tp Q.
78
Observemos que, en el Teorema de la Función Inversa, dFp0 es biyectiva,
mientras que en el Teorema de la Función Implı́cita dFp es sobreyectiva.
Si dFp es inyectiva entonces existen entornos U de p y U 0 de F (p)
tales que la restricción
F |U : U → U 0
p 7→ F (p)
es inyectiva. Esto es, F |U es un embebimiento en el sentido que definimos a continuación:
Definiciones 4.4.2 Sea F : Q → Q0 una aplicación diferenciable.
(1) F es una inmersión si dFp es inyectiva para todo p ∈ Q. En este
caso diremos que (Q, F ) es una subvariedad inmersa en Q0 .
(2) F es un embebimiento si, además, F es un homeomorfismo sobre su imagen F (Q). En este caso diremos que (Q, F ) es una
subvariedad embebida en Q0 .
En este último caso, F (Q) no es sólo una variedad topológica (con la
topologı́a inducida de Q0 ) sino que la estructura diferenciable de Q se
induce sobre F (Q) de modo que Q y F (Q) son variedades difeomorfas.
Una subvariedad embebida es entonces equivalente a una subvariedad
en el siguiente sentido: una variedad Q incluida en otra variedad Q0 es
una subvariedad de ésta si la inclusión i : Q → Q0 es un embebimiento.
Ejemplo. Consideremos tres curvas γi :]0, 1[→ R2 , γi0 (t) 6= 0 ∀t ∈
]0, 1[, i = 1, 2, 3, cuyas imágenes y sentido de recorrido aparecen en la
Figura 16. La curva γ1 es una inmersión, con lo que (]0, 1[, γ1 ) es una
subvariedad inmersa en R2 . La curva γ2 es una inmersión inyectiva,
aunque no un embebimiento. Finalmente, la curva γ3 sı́ resulta ser un
embebimiento, y su imagen una subvariedad.
Nota. Recordemos que en Mecánica Lagrangiana se postula que el
espacio de configuración de un sistema fı́sico es una variedad diferenciable Q. El espacio de estados del sistema queda entonces modelado
por la variedad tangente T Q. En ocasiones, existen “ligaduras” sobre
los posibles estados del sistema, que se representan mediante una función F : T Q → Rk (o, más generalmente, F : T Q → Q0 ). En este
caso se supone que los estados del sistema caen en F −1 (c) ⊂ T Q, para
4.5. APÉNDICE: EL ESPACIO DUAL
79
Figura 16
algún valor regular c ∈ Rk . Cuando existe una subvariedad S de Q tal
que T S = F −1 (c) entonces se dice que las ligaduras son holónomas o
integrables. En caso contrario, se dice que son anholónomas.
4.5.
Apéndice: el espacio dual
(1) Concepto de dual algebraico.
Sea V (R) un espacio vectorial real de dimensión n. Se define el
espacio dual V ∗ (R) de V (R) como:
V ∗ (R) := (L(V, R) =){φ : V → R : φ lineal}.
A cada elemento del dual φ ∈ V ∗ (R) se le llama forma lineal. El espacio
dual V ∗ (R), dotado de sus operaciones naturales, es un espacio vectorial de dimensión n(= dim V · dim R). Si fijamos una base ordenada
de V (R) B = (v1 , . . . , vn ) y tomamos {1} como base de R(R) entonces
para cada φ ∈ V ∗ (R) podemos calcular la matriz de la aplicación φ expresada en dichas bases M (φ, B, {1})(≡ M (φ, {1} ← B)),
que
Pnmatriz
i
resulta ser igual a (φ(v1 ) . . . φ(vn )). De esta forma, si v = i=1 a vi ∈ V
entonces


1
a
n
X


φ(v) =
φ(vi )ai = (φ(v1 ) . . . φ(vn )) ·  ... 
i=1
an
80


a1


= M (φ, {1} ← B) ·  ...  ∈ R.
an
(2) Base dual.
Consideremos los espacios vectoriales V (R), V ∗ (R) y fijemos una
base B = (v1 , . . . , vn ) de V (R). Es conocido el siguiente resultado:
Teorema 4.5.1 Existe una única base B ∗ = (φ1 , . . . , φn ) de V ∗ (R)
que verifica
φi (vj ) = δji ∀i, j ∈ {1, . . . , n}.
A esta base B ∗ se la llama base dual de la base B. Además, para los
elementos de esta base se tiene
M (φ1 , {1} ← B) = (1, 0, . . . , 0)
..
..
.
.
M (φn , {1} ← B) = (0, 0, . . . , 1).
∗
Fijada la base B =P(v1 , . . . , vn ) P
y su base dual B
= (φ1 , . . . , φn ) se
P
n
n
n
verifica φj (v) = φj ( i=1 ai vi ) = i=1 ai φj (vi ) = i=1 ai δij = aj . Esto
es,
n
X
1
n
v = φ (v)v1 + · · · + φ (v)vn =
φi (v)vi , ∀v ∈ V.
Análogamente, si φ ∈ V ∗ y φ =
bj . Esto es,
1
i=1
Pn
i
i=1 bi φ
n
φ = φ(v1 )φ + · · · + φ(vn )φ =
n
X
entonces φ(vj ) =
φ(vi )φi ,
Pn
∀φ ∈ V ∗ .
i
i=1 bi δj
=
(4.9)
i=1
(3) Cambio de base dual.
Sean B = (v1 , . . . , vn ), B = (v̄1 , . . . , v̄n ) dos bases de V (R) y
1
n
∗
B ∗ = (φ1 , . . . , φn ), B P= (φ , . . . , φ ) sus respectivas bases duales.
Supongamos que v j = ni=1 aij vi , j ∈ {1, . . . , n}, es decir,

a11 . . . a1n


=  ... . . . ...  .
an1 . . . ann

M (IdV , B ← B) = (aij )i,j
81
P
Como consecuencia, si v ∈ V y v = ni=1 ai vi
P
ai = ni=1 aij aj . Esto es,



a1

 .. 
 .  = M (IdV , B ← B) · 
an
=
Pn
j=1
aj v j entonces

a1
..  .
. 
an
Comprobemos a continuación
∗
M (IdV ∗ , B ← B ∗ ) = M (IdV , B ← B)t .
(4.10)
P
Obsérvese que, si escribimos φk = nj=1 bkj φ̄j entonces los elementos de
∗
la matriz (bkj ) serán los de la matriz M (Id, , B ← B ∗ ), pero el ı́ndice
superior indicará ahora columna y no fila (como en (aij )). Ası́, (4.10)
se sigue de bkj = φk (v̄j ) = akj (la primera igualdad por (4.9).
Pn
Pn
j
i
Como consecuencia de (4.10), si ϕ =
b
ϕ
=
i
i=1
j=1 bj ϕ se
tiene
n
X
b̄j =
aij bi ,
i=1
(o bien, directamente, bj = ϕ(v j ) =
Pn
i=1
aij ϕ(vi ) =
Pn
i=1
aij bi ).
(4) Trasposición de una aplicación lineal.
Sean V (R), V 0 (R) dos espacios vectoriales y f : V → V 0 una aplicación lineal entre ellos. Para cada φ0 ∈ V 0∗ (R) podemos definir la
aplicación φ0 ◦ f : V → R. Como φ0 ◦ f es una composición de aplicaciones lineales se tiene que φ0 ◦ f es también lineal y, por tanto,
φ0 ◦ f ∈ V ∗ (R).
Definición 4.5.2 Definimos la aplicación traspuesta f t de la aplicación lineal f : V → V 0 como la aplicación
f t : V 0∗ → V ∗
φ0 7→ f t (φ0 ) := φ0 ◦ f.
Se tiene entonces el siguiente resultado:
Teorema 4.5.3 La aplicación traspuesta f t de una aplicación lineal
f : V → V 0 verifica:
(i) Es lineal.
82
(ii) Si B y B 0 son bases de V y V 0 , respectivamente, entonces
M (f t , B ∗ ← B 0∗ ) = M (f, B 0 ← B)t .
(iii) La aplicación trasposición
t : L(V, V 0 ) → L(V 0∗ , V ∗ )
f 7→ f t
es lineal. De hecho, es un isomorfismo de espacios vectoriales.
(5) Teorema de reflexividad.
Sean V (R) y V ∗ (R) un espacio vectorial y su dual, respectivamente. Podemos considerar el dual de V ∗ (R), o bidual de V (R): V ∗∗ (R) =
(V ∗ (R))∗ . Estos tres espacios vectoriales tienen igual dimensión y, por
tanto, son isomorfos. Sin embargo, mientras que no existe ningún isomorfismo canónico general entre V (R) y V ∗ (R), sı́ podemos definir uno
entre V (R) y V ∗∗ (R). Ello, en la práctica, equivale a considerar ambos
espacios como iguales.
Concretamente, fijado un vector v ∈ V definimos la aplicación
Φv : V ∗ → R
φ 7→ φ(v)
que es lineal y, por tanto, pertenece al bidual V ∗∗ (R). No es difı́cil
comprobar:
Teorema 4.5.4 (de Reflexividad). La aplicación
Φ : V → V ∗∗
v 7→ Φv
es un isomorfismo de espacios vectoriales.
Otro modo de construir este isomorfismo es el siguiente (pruébese como
ejercicio). Sean B, B dos bases de V (R). Existe un único isomorfismo
F : V → V ∗ que, de manera ordenada, aplica B en B ∗ . Análogamente,
existe un único isomorfismo G : V ∗ → V ∗∗ que aplica B ∗ en B ∗∗ . Con
B obtenemos análogamente isomorfismos F , G. En general, F 6= F
y G 6= G. Sin embargo, G ◦ F = G ◦ F , y ambos coinciden con el
isomorfismo que proporciona el Teorema de Reflexividad.
83
Una consecuencia inmediata del Teorema de Reflexividad es que
cualquier base B 0 = (φ1 , . . . , φn ) de V ∗ (R) es la base dual de una única
base B de V (R). En efecto, si tomamos la base dual de B 0 , podemos
escribir B 0∗ = (Φv1 , . . . , Φvn ) donde B = (v1 , . . . , vn ) es una base de
V (R). Entonces, se comprueba fácilmente que B ∗ = B 0 .
Ejercicios
Ejercicio 1. (a) Si F : Rn −→ Rm es una aplicación lineal, compruébese que, con las identificaciones usuales de Tp (Rk ) con Rk , se
tiene (dF )p = F , ∀p ∈ Rn .
(b) Sea Q una subvariedad de R3 . Si φ ∈ (R3 )∗ y f : Q −→ R
es la función diferenciable sobre Q dada por f (p) = φ(p), ∀p ∈ Q,
compruébese que (df )p (v) = φ(v), ∀v ∈ Tp Q.
Ejercicio 2. Se consideran las aplicaciones f : R2 −→ R2 , g : R2 −→
R3 , dadas por
f (x, y) = (x2 − 2y, 4x3 y 2 ),
g(x, y) = (x2 y + y 2 , 2 − 2y 3 , yex )
Calcúlese: (a) la matriz de (df )(1,0) en coordenadas cartesianas; (b)
∂
∂
ı́dem para (d(g ◦ f ))(1,0) ; (c) el valor de (df )(1,0) (2 ∂x
− ∂y
).
Ejercicio 3. Sea f : S 2 −→ R la función dada por f (x, y, z) =
2x − y + z. Calcúlese (df )p (v), siendo p = ( √12 , √12 , 0) y v = (1, −1, 1).
Ejercicio 4. Sean Q y Q0 variedades diferenciables, Q×Q0 la variedad
producto de Q por Q0 , (p, p0 ) ∈ Q × Q0 y f ∈ C ∞ (Q × Q0 ). Pruébese:
v(f ) = v1 (f ◦ ip0 ) + v2 (f ◦ ip )
donde v ∈ T(p,p0 ) (Q × Q0 ), v1 = (dπQ )(p,p0 ) (v), v2 = (dπQ0 )(p,p0 ) (v),
πQ , πQ0 son las proyecciones de Q × Q0 en Q y Q0 , respectivamente,
e ip0 : Q −→ Q × Q0 , ip : Q0 −→ Q × Q0 son las inclusiones ip0 (q) =
(q, p0 ), ∀q ∈ Q, ip (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 .
Ejercicio 5. Sea F : Q −→ Q0 una aplicación diferenciable entre las
variedades Q y Q0 . Supongamos que (dF )p = 0 (aplicación lineal nula)
∀p ∈ Q. Pruébese que si Q es conexa entonces F es constante.
84
Ejercicio 6. Si f, f 0 : Q −→ R son dos funciones diferenciables sobre
una variedad conexa Q tales que (df )p = (df 0 )p , ∀p ∈ Q, y f (p0 ) =
f 0 (p0 ) para un punto fijo p0 ∈ Q, pruébese que f = f 0 .
Ejercicio 7. Fijada una aplicación diferenciable F : Q → Q0 con
diferencial en p dFp : Tp Q → TF (p) Q0 llamaremos codiferencial δFp de
F a la aplicación traspuesta (dFp )t . ¿Cuál es su dominio y codominio?
Sean F : Q −→ Q0 , y G : Q0 −→ Q00 aplicaciones diferenciables
entre las variedades Q, Q0 y Q00 . Pruébese la siguiente regla de la cadena
para la codiferencial de una composición: δ(G ◦ F )p = (δF )p ◦ (δG)F (p) ,
∀p ∈ Q.
Ejercicio 8. Sea α : Tp (S 2 ) −→ R, p = (−1, 0, 0), dada por α(0, a, b) =
2a+b. Si (U, ϕ) es una carta de S 2 con p ∈ U , calcúlese las coordenadas
de α en la correspondiente base ((dq 1 )p , (dq 2 )p ) de T∗p (S 2 ).
Ejercicio 9. Dada una función diferenciable f : S 2 −→ R tal que
(df )p0 6= 0, p0 ∈ S 2 , pruébese que existe una carta (U, ϕ), con p0 ∈ U ,
tal que una de sus coordenadas coincide con f sobre U .
Ejercicio 10. Sea F : Q −→ Q0 una aplicación diferenciable. Supongamos que (dF )p0 es biyectiva. Pruébese que para cada sistema
de coordenadas (x1 , . . . , xn ) en un entorno abierto de F (p0 ) en Q0 , las
funciones x1 ◦ F, ..., xn ◦ F son un sistema de coordenadas en un cierto
entorno abierto de p0 en Q.
Ejercicio 11. Dada la aplicación f : R3 −→ R definida por
f (x, y, z) = x ez + 2,
calcúlese (df )p en coordenadas cartesianas, cilı́ndricas y esféricas, en
cada punto p ∈ R3 donde éstas se hallen definidas.
Ejercicio 12. Sea O ⊂ R3 un abierto, y f : O → R una aplicación diferenciable que admite un valor regular a. Sea S = f −1 (a)
la correspondiente superficie regular de R3 . Compruébese que Tp S =
Nuc((df )p ), donde, con las identificaciones usuales, Nuc((df )p ) = {v ∈
R3 : (df )p (v) = 0}).
Capı́tulo 5
Campos vectoriales
5.1.
Concepto de campo vectorial
Sean Q una variedad diferenciable, T Q su variedad tangente y π :
T Q → Q la proyección canónica. Un campo vectorial X sobre Q es una
aplicación que asigna a cada punto p ∈ Q un vector tangente a Q en
ese punto, Xp ∈ Tp Q. Esto es, una aplicación X : Q → T Q tal que
π ◦ X = IdQ .
Un campo X se dice diferenciable (resp. continuo) si X es diferenciable C ∞ (resp. continua) como aplicación entre variedades. Ası́,
si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) entonces X, que puede
escribirse
∂
∂
Xp ≡ X(p) = X 1 (p) 1 |p + · · · + X n (p) n |p ∀p ∈ U,
∂q
∂q
será diferenciable en p0 ∈ U si y sólo si X 1 , . . . , X n son aplicaciones
diferenciables en p0 .
En particular, observemos que sobre el abierto U las coordenadas
inducen n campos vectoriales diferenciables ∂q∂ 1 , . . . , ∂q∂n (campos coordenados) en función de los cuales podemos expresar cualquier otro
campo sobre U . Como en el caso de variedades y aplicaciones entre variedades, de ahora en adelante supondremos, salvo mención explı́cita
85
86
CAPÍTULO 5. CAMPOS VECTORIALES
de lo contrario, que los campos vectoriales son “diferenciables”, por lo
que omitiremos esta palabra.
Ejemplos:
(1) Campos vectoriales sobre RnP
. Todo campo vectorial X sobre Rn
se puede escribir como X = ni=1 f i · ∂x∂ i , donde f i ∈ C ∞ (Rn ) y
(∂/∂x1 , . . . , ∂/∂xn ) son los campos coordenados asociados a las
coordenadas usuales (x1 , . . . , xn ).
(2) Campos vectoriales sobre la esfera S n . Con las identificaciones
naturales, Tp S n puede verse como un hiperplano de Rn+1 ortogonal a p con el producto escalar usual h·, ·i. En consecuencia,
dar un campo vectorial sobre S n equivale a dar una aplicación
diferenciable X : S n → Rn+1 tal que hp, X(p)i = 0 para todo
p ∈ S n.
5.2.
Estructura de los campos vectoriales
Denotaremos por X(Q) al conjunto de todos los campos vectoriales
sobre Q. Veamos cuáles son las operaciones naturales en X(Q).
(1) Suma:
X(Q) × X(Q) → X(Q)
(X, Y ) 7→ X + Y,
definida por (X + Y )p = Xp + Yp para todo p ∈ Q.
(2) Producto por escalares (reales):
R × X(Q) → X(Q)
(a, X) 7→ a · X,
definido por (a · X)p = a · Xp para todo p ∈ Q.
(3) Producto por funciones:
C ∞ (Q) × X(Q) → X(Q)
(f, X) 7→ f · X,
definido por (f · X)p = f (p) · Xp para todo p ∈ Q.
El conjunto X(Q) dotado de las dos primeras operaciones tiene estructura de espacio vectorial real de dimensión ∞ (salvo que Q tenga
5.3. PARALELIZABILIDAD
87
dimensión 0, en cuyo caso X(Q) ≡ 0). Por otra parte, X(Q) con la
primera y la tercera operación verifica propiedades formalmente análogas a las de un espacio vectorial sobre C ∞ (Q). Ahora bien, C ∞ (Q)
no es un cuerpo, ya que no existe inverso respecto al producto para
funciones que, sin ser idénticamente nulas, se anulen en algún punto de
la variedad. De hecho, C ∞ (Q) sólo tiene estructura de anillo unitario
conmutativo. Se dice entonces que X(Q) es un módulo sobre el anillo
C ∞ (Q).
Fijado un campo vectorial X ∈ X(Q), para cada función f ∈
∞
C (Q) podemos definir la aplicación
X(f ) : Q → R
p 7→ Xp (f ).
P
Si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) y X = ni=1 X i ∂q∂ i entonces
!
Ã n
n
X
X
∂f
∂
i
(f ) =
X i i ∈ C ∞ (Q).
X(f ) =
X
i
∂q
∂q
i=1
i=1
En consecuencia, para cada X ∈ X(Q) tenemos una aplicación
C ∞ (Q) → C ∞ (Q)
f 7→ X(f )
que es R-lineal y verifica la regla de Leibniz, esto es:
X(f · g) = X(f ) · g + f · X(g).
5.3.
Paralelizabilidad
Fijados r campos vectoriales X1 , . . . , Xr ∈ X(Q) diremos que son
independientes (punto a punto) si el conjunto de vectores {X1 (p), . . . , Xr (p)}
⊂ Tp Q es linealmente independiente para todo p ∈ Q. En este caso
necesariamente r ≤ n (n = dim Q). Obviamente, si son independientes
y r = n entonces el conjunto {X1 (p), . . . , Xn (p)} es una base de cada
espacio tangente Tp Q. En este caso diremos que {X1 , . . . , Xn } es una
base (global) de campos vectoriales (o bien una referencia móvil). En
general, no tienen por qué existir r campos independientes sobre toda
la variedad, por lo que existen variedades que no admiten una base
global de campos.
88
Definición 5.3.1 De una variedad diferenciable Q que admita una
base global de campos vectoriales se dice que es paralelizable. En caso
contrario, diremos que es no-paralelizable.
En caso de que una variedad Q sea paralelizable y {X1 , . . . , Xn } sea
una base global suya podemos establecer el isomorfismo de espacios
vectoriales:
C ∞ (Q)n → X(Q)
P
(f 1 , . . . , f n ) 7→ ni=1 f i Xi .
Obviamente, en este caso la aplicación
Q × Rn → T Q P
(p, a1 , . . . , an ) 7→ ni=1 ai Xi (p).
es un difeomorfismo entre Q×Rn y T Q. Es decir, en las variedades paralelizables el correspondiente espacio tangente se reduce esencialmente
a Q × Rn .
Ejemplos:
(1) Ejemplos sencillos de variedades paralelizables son Rn (véase
[Sección 3.3, Ejemplo (1)]), cualquier espacio vectorial y cualquier abierto de un entorno coordenado. No es difı́cil visualizar
que un toro también es una variedad paralelizable.
(2) La esfera 1-dimensional S 1 ⊂ R2 también es paralelizable. En
∂
∂
∂
efecto, una base de campos global suya es ∂θ
= −y ∂x
+ x ∂y
,
[Sección 3.3, Ejemplo (2)].
(3) Las esferas de dimensión par S 2n ⊂ R2n+1 en cambio no admiten
campos vectoriales sin ceros, esto es, sin que se anulen en algún
punto1 . En consecuencia, estas esferas S 2n no son paralelizables.
(4) Para las esferas impares S 2n+1 ⊂ R2n+2 sı́ existen campos vectoriales que no se anulan. En efecto, basta tomar como campo
vectorial X en cada p = (p1 , . . . , p2n+2 ) ∈ S 2n+1 :
X(p) = (p2 , −p1 , . . . , p2n+2 , −p2n+1 ) ∈ Tp S 2n+1 (⊂ Tp R2n+2 ).
1
Esta propiedad, relacionada con el clásico Teorema del Punto Fijo de Brouwer,
puede interpretarse intuitivamente como la imposibilidad de “peinar una esfera
peluda sin hacer remolinos”.
5.4. CURVAS INTEGRALES. FLUJOS
5.4.
89
Curvas integrales. Flujos
Definición 5.4.1 Sea Q una variedad diferenciable, X ∈ X(Q) un
campo vectorial y γ : I → Q, I =]a, b[⊆ R una curva diferenciable.
Diremos que γ es una curva integral de X si γ 0 (t) = Xγ(t) para todo
t ∈ I.
Toda curva integral de X se puede extender como curva integral hasta un (único) dominio máximo. Más formalmente, la curva integral
γ : I → Q es inextensible o maximal si no existe otra curva integral
γ̃ : J → Q tal que I
J y γ = γ̃ |I . Como veremos, toda curva integral determinará una única maximal por lo que, en adelante,
consideraremos siempre curvas integrales inextensibles.
Una curva integral de X (inextensible) γ : I → Q es completa si
I = R, e incompleta en caso contrario. En el primer caso, diremos
que X es completo a lo largo de γ. Diremos que X es completo si es
completo a lo largo de todas sus curvas integrales.
∂
Ejemplo. Consideremos en R2 el campo X = ∂x
. Sus curvas integrales
son del tipo γ(x0 ,y0 ) (t) = (x0 , y0 )+(t, 0), t ∈ R. Por tanto, X es completo
sobre R2 . Sin embargo, resulta obvio que ∂/∂x es incompleto sobre el
abierto ]0, ∞[×R.
Estudiemos a continuación cómo se determinan localmente las curvas integrales de un campo vectorial. Sea X ∈ X(Q) un campo vectorial
y (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q. Nuestro objetivo
es encontrar una curva integral γ : I → Q de X. Ahora bien, si componemos con ϕ, esto equivale a encontrar una solución del sistema de
ecuaciones diferenciales sobre U de primer orden:
dq i
(t) = X i (q(t)) ∀i ∈ {1, . . . , n}.
dt
(5.1)
De los teoremas clásicos de existencia de soluciones para sistemas de
ecuaciones diferenciales se deduce que, si fijamos una condición inicial
ϕ(γ(t0 )) = ϕ(p0 ), p0 ∈ U (esto es, q 1 (t0 ) = p10 , . . . , q n (t0 ) = pn0 con
p10 , . . . , pn0 ∈ R), existe ² > 0 tal que el sistema de ecuaciones (5.1)
admite solución en ]t0 − ², t0 + ²[. Además, esta solución es única en
el sentido de que para cualquier otra solución con la misma condición
inicial en t0 y definida en un intervalo J, las dos soluciones coinciden
en J∩]t0 − ², t0 + ²[. Más aún, ello acaba implicando la existencia de
90
una única curva integral maximal. Por otra parte, si γ(t) es una curva
integral de un campo X entonces también lo es la curva γ̃(t) = γ(t+t0 ),
por lo que no será restrictivo suponer, como haremos en adelante, t0 =
0 ∈ I. En conclusión,
Teorema 5.4.2 Fijado un campo vectorial X ∈ X(Q), para cada p ∈
Q existe una única curva integral inextensible de X, γp :]ap , bp [→ Q,
tal que γp (0) = p (0 ∈]ap , bp [).
Ejemplo. Consideremos sobre R2 el campo vectorial X = xy ∂/∂x. Si
imponemos que γ(t) sea una curva integral de X entonces obtenemos
el sistema de ecuaciones
x0 (t) = x(t)y(t)
y 0 (t) = 0.
Si suponemos γ(0) = (x0 , y0 ) ∈ R2 entonces este sistema tiene por
solución
x(t) = x0 ey0 ·t
y(t) = y0
para todo t ∈ R. En particular, se deduce que X es completo.
∂
Ejercicio. Consideremos sobre R el campo de vectores X = xm ∂x
,
m ∈ N. Hállense sus curvas integrales y compruébese si es completo o
no (discútase según el valor de m).
Del ejercicio anterior se deduce que, incluso en R, existen campos vectoriales completos e incompletos. Ello ocurre en toda variedad (de dimensión mayor que 0) excepto en las compactas. De hecho, es posible demostrar que: si Q es compacta entonces todo campo vectorial
X ∈ X(Q) es completo (véase, v. gr., [O’N, Lemma 1.56]).
Intimamente relacionado con las curvas integrales aparece el concepto de flujo de un campo vectorial.
Definición 5.4.3 Consideremos un campo vectorial completo X ∈
X(Q). Definimos el flujo φ de X como la aplicación
φ: R×Q→Q
(t, p) 7→ φt (p) = γp (t),
donde γp es la curva integral de X dada en el Teorema 5.4.2.
5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS
91
El flujo φt de X para cada t consiste por tanto en desplazar cada punto
a lo largo de sus curvas integrales en un valor t de su parámetro. Si
visualizamos el campo vectorial como el campo de las velocidades de
un fluido, φt determina hacia dónde se mueve cada partı́cula del fluido
tras un tiempo t.
Debido a la variación diferenciable de las soluciones de (5.1) con
las condiciones iniciales, tanto φt como la aplicación flujo φ son diferenciables. Más aún, se verifican las siguientes propiedades:
(1) φ0 = Id.
(2) φs ◦ φt = φs+t , ∀t, s ∈ R (en efecto, φs ◦ φt (p) = φs (γp (t)) =
γp (t + s) = φt+s (p)).
(3) φ−t = (φt )−1 , ∀t ∈ R (en particular, cada φt es biyectiva para
todo t ∈ R).
Por otra parte, si X no es completo entonces para cada p ∈ Q existe
un entorno abierto U de p y un ² > 0 tal que la aplicación
φ :] − ², ²[×U → Q
(t, p) 7→ φt (p) = γp (t)
está bien definida y es diferenciable. En este caso, la aplicación φ verifica propiedades análogas a las anteriores:
(1’) φ0 (p) = p, ∀p ∈ U .
(2’) φs ◦ φt = φs+t , siempre que s, t, s + t ∈] − ², ²[.
(3’) Para cada t, φt es inyectiva, y puede escogerse un entorno abierto
V ⊂ U de cada p0 ∈ U fijo tal que φt (V ) ⊂ U . Restringiendo
entonces, φt : V → φt (V ) ⊂ U , se tiene φ−t = (φt )−1 .
5.5.
Grupo uniparamétrico de difeomorfismos
En esta sección vamos a introducir el concepto de grupo uniparamétrico de difeomorfismos, que, como veremos, abstrae la noción de flujo.
Sea X ∈ X(Q) un campo completo y consideremos su flujo global φ.
92
Entonces G = {φt : t ∈ R} es un conjunto de difeomorfismos de Q que
con la operación de composición tiene estructura de grupo (véanse las
propiedades (1), (2) y (3) de la sección anterior). Es más, se trata de
un grupo conmutativo ya que
φt ◦ φs = φt+s = φs+t = φs ◦ φt .
Además, la aplicación
(R, +) → (G, ◦)
t 7→ φt
es entonces un epimorfismo de grupos. Las propiedades del flujo global
φ se pueden abstraer mediante el siguiente concepto:
Definición 5.5.1 Sea Q una variedad diferenciable. Llamaremos grupo
uniparamétrico de difeomorfismos de Q a toda aplicación diferenciable
Φ: R×Q→Q
(t, p) 7→ Φt (p)
que verifique: (i) Φ0 = IdQ , (ii) Φs+t = Φs ◦ Φt .
Obsérvese que de (i) e (ii) se tiene IdQ = Φt−t = Φt ◦ Φ−t ; por tanto,
Φt : Q → Q es biyectiva con inversa Φ−t . Ası́, el conjunto de difeomorfismos GΦ = {Φt : t ∈ R} tiene estructura de grupo respecto a la
composición.
Obviamente, el flujo φ de un campo completo X es un grupo uniparamétrico de difeomorfismos de Q. Es más, el recı́proco también se
verifica:
Teorema 5.5.2 Fijado un grupo uniparamétrico de difeomorfismos Φ
en Q, existe un campo vectorial completo X sobre Q cuyo flujo asociado
φ coincide con Φ.
Al campo X ası́ definido se le llamará generador infinitesimal del
grupo Φ.
Demostración. Todo se reduce a definir sobre Q un campo vectorial X
cuyas curvas integrales sean del tipo t → Φt (p). Consideremos pues el
campo X determinado en cada punto p por:
Xp =
d
|t=0 Φt (p).
dt
5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS
93
Para demostrar que t 7→ Φt (p) es una curva integral de X, basta comprobar que:
d
|t=t0 Φt (p) = XΦt0 (p) ∀t0 ∈ R.
dt
En efecto,
d
d
d
|t=t0 Φt (p) =
|t=0 Φt+t0 (p) =
|t=0 Φt (Φt0 (p)) = XΦt0 (p) . 2
dt
dt
dt
Observaciones:
(1) El generador infinitesimal X de Φ es invariante por Φ; esto es,
verifica la propiedad XΦt0 (p) = (dΦt0 )p Xp para todo t0 . En efecto,
XΦt0 (p) =
d
d
|t=0 Φt0 +t (p) =
|t=0 Φt0 (Φt (p)) = (dΦt0 )p Xp .
dt
dt
(2) Las curvas del tipo t 7→ Φt (p) son inyectivas o se cierran sobre
sı́ mismas, ya que son curvas integrales de un campo (el generador
infinitesimal). Estas curvas reciben el nombre de órbitas del grupo
uniparamétrico (véase la Figura 17).
Ejemplo. Consideremos en Q = R3 ó Q
respecto al eje z, Φ : R × Q → Q
  

x
cos θ −senθ
θ,  y  7→  senθ cos θ
z
0
0
= S 2 las rotaciones con
  
0
x


0
y .
·
1
z
Es directo comprobar que se trata de un grupo uniparamétrico de
difeomorfismos de Q. Su generador infinitesimal es
d
|θ=0 Φθ (x, y, z) =
dθ

 

x cos θ − ysenθ
−y
 xsenθ + y cos θ  =  x  ∈ T(x,y,z) Q,
z
0
X(x,y,z) =
d
|θ=0
dθ
94
Figura 17
∂
∂
+ x ∂y
.
es decir, el campo vectorial X = −y ∂x
Nota. Conviene destacar que un grupo uniparamétrico Φ : R×Q → Q
induce otro grupo uniparamétrico en el espacio tangente a Q que viene
dado por la expresión
R × TQ → TQ
(t, vp ) 7→ dΦt (vp ) ∈ TΦt (p) Q.
Obviamente, también se induce un grupo uniparamétrico sobre N =
T Q × R sin más que dejar constante la componente en R. Diremos que
una función F : Q → R es invariante por Φ si F (p) = F (Φt (p)) para todo t ∈ R. Análogamente, diremos que una función L : N = T Q × R →
R es invariante por Φ si lo es por el grupo uniparamétrico inducido en
T Q × R (en el sentido anterior). Por el Teorema de Noether clásico se
sabe que, si una lagrangiana es invariante por un grupo uniparamétrico, entonces sus curvas extremales admiten una cantidad conservada
(momento lineal, momento angular, energı́a, etc. -véase la última sección del Tema 7).
5.6. CORCHETE DE LIE
5.6.
95
Corchete de Lie de campos vectoriales
Consideremos una base de campos de vectores {X1 , . . . , Xn } sobre
un abierto U de una variedad Q. Fijado un punto p ∈ Q nos preguntamos si existen coordenadas (q 1 , . . . , q n ) alrededor de p tales que
Xi =
∂
∂q i
∀i ∈ {1, . . . , n}
(5.2)
sobre U . Para responder a esta pregunta consideremos una función
f ∈ C ∞ (Q). Podemos construir entonces funciones Xi (f ) ∈ C ∞ (Q)
y, repitiendo el proceso, Xj (Xi (f )) ∈ C ∞ (Q). Si la base de campos
proviniese de un sistema de coordenadas entonces se verificarı́a (5.2)
y, por tanto,
µ
¶
∂f
∂2f
∂
=
.
Xj (Xi (f )) = j
∂q
∂q i
∂q j ∂q i
Del Lema de Schwarz se deduce entonces que
Xj (Xi (f )) =
∂ 2f
∂ 2f
=
= Xi (Xj (f )).
∂q j ∂q i
∂q i ∂q j
Por tanto, una condición necesaria para que una base de campos vectoriales sea localmente de campos coordenados (esto es, que verifique
(5.2) en un entorno de cada p ∈ Q), es que se verifique:
Xi (Xj (f )) = Xj (Xi (f )) ∀f ∈ C ∞ (Q) ∀i, j ∈ {1, . . . , n}.
La justificación de que esta propiedad es suficiente conduce a la siguiente definición, de interés propio:
Definición 5.6.1 Si X, Y ∈ X(Q), definimos su corchete de Lie en
un punto p ∈ Q como la aplicación
[X, Y ]p : C ∞ (Q) → R
f 7→ Xp (Y (f )) − Yp (X(f )).
(5.3)
Observemos que de esta definición se puede deducir fácilmente la identidad de Leibniz para el producto:
[X, Y ]p (f · g) = f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ).
96
En efecto,
[X, Y ]p (f · g) = Xp (Y (f · g)) − Yp (X(f · g))
= Xp (g · Y (f ) + f · Y (g)) − Yp (g · X(f ) + f · X(g))
= Xp (g) · Yp (f ) + g(p) · Xp (Y (f )) + Xp (f ) · Yp (g) + f (p) · Xp (Y (g))
−Yp (g) · Xp (f ) − g(p) · Yp (X(f )) − Yp (f ) · Xp (g) − f (p) · Yp (X(g))
= f (p) · (Xp (Y (g)) − Yp (X(g))) + g(p) · (Xp (Y (f )) − Yp (X(f )))
= f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ).
Puesto que [X, Y ]p es también R-lineal, se tiene que (5.3) define un
vector tangente a Q en cada punto p como derivación. Resumiendo:
Proposición 5.6.2 Si X, Y ∈ X(Q) entonces [X, Y ]p ∈ Tp Q. Además,
[X, Y ] : Q → T Q
p 7→ [X, Y ]p
es un campo vectorial sobre Q.
Veamos qué expresión adquiere el corchete de Lie en coordenadas
locales. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q y sean X,
Y dos campos de vectores sobre Q. Expresados en estas coordenadas
se tiene:
n
n
X
X
∂
i ∂
X=
X
Y =
Y i i.
i
∂q
∂q
i=1
i=1
Pn
Si escribimos en coordenadas [X, Y ] = k=1 [X, Y ]k ∂q∂k , entonces
=
[X, Y ]k = [X, Y ](q k ) = X(Y (q k )) − Y (X(q k ))
P
P
P
k ))
k
k
k
i ∂(Y (q ))
− ni=1 Y i ∂(X(q
= ni=1 X i ∂Y
− ni=1 Y i ∂X
.
i=1 X
∂q i
∂q i
∂q i
∂q i
Pn
Por tanto, el corchete de Lie en coordenadas locales queda:
¶
n µ
k
k
X
∂
i ∂Y
i ∂X
[X, Y ] =
X
−
Y
.
i
i
k
∂q
∂q
∂q
i,k=1
(5.4)
Propiedades del corchete de Lie:
(1) El corchete de Lie de campos es un corchete de Lie “abstracto”.
Esto quiere decir que es una aplicación
[·, ·] : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ [X, Y ]
que verifica las siguientes propiedades:
5.6. CORCHETE DE LIE
97
(i) Es lineal en cada variable, esto es,
[aX + bX 0 , Y ] = a[X, Y ] + b[X 0 , Y ]
[X, aY + bY 0 ] = a[X, Y ] + b[X, Y 0 ]
para todo X, X 0 , Y, Y 0 ∈ X(Q) y todo a, b ∈ R.
(ii) Es antisimétrico, esto es,
[X, Y ] = −[Y, X] ∀X, Y ∈ X(Q).
(iii) Verifica la identidad de Jacobi, esto es,
[X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 ∀X, Y, Z ∈ X(Q).
Un espacio vectorial dotado de una operación que verifique las
propiedades (i), (ii), (iii) anteriores recibe el nombre de álgebra
de Lie. En consecuencia, (X(Q), [·, ·]) es un álgebra de Lie (de
dimensión ∞ si dim Q > 0).
(2) Dos campos X, Y ∈ X(Q) verifican [X, Y ] = 0 si y sólo si para
cualesquiera flujos φ, ψ de X, Y , respectivamente, se tiene φs ◦
ψt = ψt ◦ φs en su dominio de definición. En este caso se dice que
X e Y conmutan.
La siguiente expresión del corchete de Lie permite entender esta
propiedad. Sea φ el flujo del campo X ∈ X(Q). Consideremos
la aplicación φ−t y su diferencial dφ−t : Tφt (p) Q → Tp Q. Si Y ∈
X(Q), tiene sentido comparar los vectores Yp y (dφ−t )φt (p) Yφt (p) .
Se verifica entonces (véase la Figura 18):
[X, Y ]p = limt→0
(dφ−t )φt (p) Yφt (p) − Yp
.
t
Esto es, el corchete de Lie mide lo que “varı́a infinitesimalmente”
el campo Y a lo largo de las curvas integrales de X.
(3) El corchete de Lie se preserva por aplicaciones diferenciables. Es
decir, si F : Q → Q0 es diferenciable, y X, Y ∈ X(Q), X 0 , Y 0 ∈
X(Q0 ) verifican XF0 (p) = dFp Xp , YF0 (p) = dFp Yp , para todo p ∈ Q,
entonces dFp [Xp , Yp ] = [XF0 (p) , YF0 (p) ].
98
Figura 18
El siguiente resultado resuelve el problema que planteaban las bases
de campos y con el que iniciamos esta sección:
Teorema 5.6.3 (Frobenius). Sea {X1 , . . . , Xr } un conjunto de campos
vectoriales independientes sobre una variedad Q. Son equivalentes:
(i) [Xi , Xj ] = 0 para todo i, j ∈ {1, . . . , r}.
(ii) Para cada p ∈ Q existe un entorno coordenado (U, q 1 , . . . , q n ) tal
que Xi = ∂q∂ i para todo i ∈ {1, . . . , r}.
En particular, si r = n, una base de campos {X1 , . . . , Xn } es localmente
una base de campos coordenados si y sólo si [Xi , Xj ] = 0 ∀i, j ∈
{1, . . . , n}.
Idea de la demostración. La implicación (ii) ⇒ (i) es inmediata de la
discusión al comienzo de esta sección. Para la implicación (i) ⇒ (ii)
(i)
consideremos para simplificar el caso r = n. Sean φt flujos locales de
Xi , i = 1, . . . , n, definidos en un entorno de p para todo t ∈] − ², ²[.
Consideremos la aplicación
F :] − ², ²[n → Q
(1)
(n)
(t1 , . . . , tn ) 7→ φt1 ◦ · · · ◦ φtn (p).
Claramente, dF ( ∂t∂ i |(0,...,0) ) = Xi (p), ∀i ∈ {1, . . . , n}. En consecuencia, por el Teorema de la Función Inversa existen entornos Θ de (0, . . . , 0)
5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE
99
y U de p tales que la restricción F |Θ : Θ → U es un difeomorfismo. El entorno coordenado en cuestión será entonces (U, (F |Θ )−1 ≡
(q 1 , . . . , q n )). Para comprobar que, efectivamente, Xi = ∂q∂ i , se usa la
conmutatividad de los flujos (para más detalles véase, p. ej., [AM,
2.2.26]). 2
5.7.
Apéndice: Grupos y Álgebras de Lie
Recordemos que un grupo de Lie (G, ·) es una variedad diferenciable
G de dimensión finita n con una operación que la dota de estructura
de grupo y tal que las aplicaciones
G×G→G
(g, h) 7→ g · h
G→G
g 7→ g −1
son diferenciables [Sección 2.5, Nota (2)].
En todo grupo de Lie (G, ·) se pueden definir las traslaciones por la
izquierda como sigue: fijado g ∈ G la traslación por la izquierda según
g es
Lg : G → G
h 7→ g · h.
Obviamente, las aplicaciones Lg , g ∈ G son difeomorfismos. Un campo vectorial X ∈ X(G) se dice que es invariante por la izquierda si
(dLg )h Xh = Xg·h para todo g, h ∈ G.
Una manera de construir campos invariantes por la izquierda es
la siguiente: sea e ∈ G el elemento neutro del grupo y sea v ∈ Te G,
entonces el campo vectorial X v dado por Xgv = (dLg )e v es diferenciable
e invariante por la izquierda. De hecho, todo campo invariante por la
izquierda puede construirse de este modo.
El conjunto G = {X ∈ X(G) : X es invariante por la izquierda}
con las operaciones usuales es un espacio vectorial. De hecho, la aplicación
Te G → G
v 7→ X v
es un isomorfismo de espacios vectoriales, por lo que G también tiene
dimensión n. Ası́, si (v1 , . . . , vn ) es una base de Te G entonces (X v1 , . . . ,
X vn ) ≡ (X1 , . . . , Xn ) es una base de campos sobre todo el grupo de
100
P
Lie G. En particular, G es paralelizable. Más aún, si X = ni=1 f i Xi ∈
X(G) entonces X ∈ G si y sólo si f i ≡ cte para todo i.
Un hecho destacable es que el corchete de Lie preserva los campos
invariantes por la izquierda, esto es:
X1 , X2 ∈ G =⇒ [X1 , X2 ] ∈ G
(debido a que dLg [X1 , X2 ] = [dLg X1 , dLg X2 ] = [X1 , X2 ], véase [Sección 5.6, Propiedad (3)]). Como consecuencia, (G, [·, ·]) es un algebra
de Lie de dimensión finita n. Además,
para los elementos de la base
P
(X1 , . . . , Xn ) se tiene [Xi , Xj ] = nk=1 ckij Xk , donde los ckij ∈ R determinan el álgebra (salvo isomorfismos) y se denominan constantes de
estructura del grupo en la base (X1 , . . . , Xn ).
La teorı́a de grupos de Lie estudia detalladamente cómo las propiedades del álgebra de Lie (G, [·, ·]) determinan el grupo de Lie G
(al menos localmente). Una simplificación importante se debe a que,
esencialmente, todo grupo de Lie es isomorfo a un subgrupo de matrices regulares (Teorema de Ado), siendo el corchete de Lie identificable
con el conmutador de las matrices en el espacio tangente a la matriz
identidad.
Ejercicio. Compruébese que el álgebra de Lie del grupo de las matrices ortonormales O(n, R) = {A ∈ Gl(n, R) : A · At = In } es identificable al espacio vectorial de las matrices antisimétricas n × n.
Ejercicios
∂
∂
Ejercicio 1. Se considera el campo vectorial X = (x−y) ∂x
−2xz ∂y
+
3
∂
sobre R . Calcúlese X(f ), siendo f (x, y, z) = 2x − y + z.
∂z
∂
∂
Ejercicio 2. Se considera el campo vectorial X = x ∂x
− y ∂y
sobre
2
R . Exprésese como combinación lineal de los campos coordenados
originados por las coordenadas polares usuales (ρ, θ).
Ejercicio 3. Sobre R2 se consideran los campos de vectores:
X = (x + y)
∂
∂
−
,
∂x ∂y
Y = (y 2 + 1)
∂
∂
+x .
∂x
∂y
(i) Pruébese que son independientes en cada punto.
101
∂
∂
(ii) Si Z = (x2 + y 2 ) ∂x
+ (x2 − y 2 ) ∂y
, encuéntrense f1 , f2 ∈ C ∞ (R2 )
tales que Z = f1 · X + f2 · Y .
Ejercicio 4. (a) Encuéntrese un campo vectorial sobre S 2 que se
anule exactamente en dos puntos.
(b) Encuéntrese un campo vectorial sobre S 2 que se anule exactamente
en un punto.
Ejercicio 5. Compruébese que, con las identificaciones usuales, la
aplicación X : S 2 −→ R3 , X(x, y, z) = (xz, yz, z 2 − 1) define un campo
vectorial sobre S 2 . Tómense las coordenadas x, y sobre el hemisferio
z > 0 y calcúlense las coordenadas de X en los correspondientes campos coordenados.
Ejercicio 6. Se consideran los campos de vectores sobre R2
X=x
∂
∂
+
,
∂x ∂y
Y =y
∂
∂
+x .
∂x
∂y
Calcúlese [X, Y ].
Ejercicio 7. Compruébese que para todo X, Y ∈ X(Q) y todo f, g ∈
X(Q) se verifica:
[f X, gY ] = f g[X, Y ] + f (X(g))Y − g(Y (f ))X.
Ejercicio 8. Sea F : Q −→ Q0 un difeomorfismo. Para cada X ∈
X(Q) compruébese que
(F∗ (X))q0 := (dF )F −1 (q0 ) (XF −1 (q0 ) ),
∀q 0 ∈ Q0
define un campo vectorial sobre Q0 .
Pruébese que F∗ ([X, Y ]) = [F∗ (X), F∗ (Y )]0 , ∀X, Y ∈ X(Q), donde
[, ] y [, ]0 son los respectivos corchetes de Lie en Q y Q0 .
Ejercicio 9. Compruébese que la aplicación Φ : R × R2 −→ R2 ,
Φ(t, x, y) = (xe2t , ye−3t ), es un grupo uniparamétrico de difeomorfismos
de R2 . Determı́nese el campo vectorial que induce.
P
Ejercicio 10. Se considera el campo vectorial sobre Rn , X = ni=1 ai ∂x∂ i ,
ai ∈ R, 1 ≤ i ≤ n. Pruébese que X admite como grupo uniparamétrico
102
global asociado a la aplicación Φ : R × Rn −→ Rn , Φ(t, p) = p + tv,
siendo v = (a1 , ..., an ).
∂
∂
Ejercicio 11. Se considera el campo vectorial X = y ∂x
−x ∂y
∈ X(R2 )
¿Admite un grupo uniparamétrico global?
Ejercicio 12. En la variedad Q = R2 − {(0, 0)} se considera el campo X = x∂x − y∂y . Calcúlense y dibújense sus curvas integrales. Determı́nese su flujo. ¿Es X completo?
Ejercicio 13. En R2 se considera el campo de vectores X = y ∂∂x −
(y + 1) ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo?
Ejercicio 14. Se considera la aplicación φ : R × R2 → R2 ,
φ(t, (x, y)) =
¢
1¡
(x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t .
2
(i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 .
(ii) Calcúlese su generador infinitesimal X.
(iii) ¿Es X completo?
Ejercicio 15. En R3 se considera el campo de vectores,
X = (x2 − y)
∂
∂
∂
− 2xz
+y .
∂x
∂y
∂z
Calcúlese X(f ), siendo f (x, y, z) = x + y + z.
Ejercicio 16. En R3 se consideran los campos vectoriales:
X1 = y∂z − z∂y ,
X2 = z∂x − x∂z ,
X3 = x∂y − y∂x .
(i) Compruébese que inducen, por restricción, tres campos vectoriales sobre cualquier esfera S centrada en el origen. ¿Forman
una base de campos (referencia móvil) sobre R3 ? ¿Y sobre S?
Calcúlense todos los corchetes [Xi , Xj ], i, j = 1, 2, 3.
(ii) Sea φ(i) el flujo de cada Xi y considérese la aplicación ψ : R ×
(2)
(1)
S → S, ψ(t, p) = φt ◦ φ2t (p). ¿Es un grupo uniparamétrico de
difeomorfismos? Calcúlese el campo generado como ∂ψ(t, p)/∂t|0 .
103
Ejercicio 17. En R2 se consideran los siguientes tres campos vectoriales:
X = ∂ x + x2 ∂ y ,
Y = x2 ∂ x + ∂ y
Z = [[X, Y ], ∂y ] + [[∂y , X], Y ].
Calcúlense sus curvas integrales. ¿Cuáles de ellos son completos?
Ejercicio 18. En R3 se consideran los campos de vectores:
X = ∂y ,
Y = zy∂x + 3∂y − xy∂z .
Calcúlense las curvas integrales de Z = [X, Y ]. ¿Es Z completo?
Ejercicio 19. Se considera la aplicación φ : R × R2 → R2 ,
φ(t, (x, y)) =
¢
1¡
(x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t .
2
(i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 .
(ii) Calcúlese su generador infinitesimal X.
(iii) ¿Es X completo?
Ejercicio 20. Se considera el campo vectorial sobre R2 , X = x ∂∂x −
y 2 ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo?
Ejercicio 21. Dada una función diferenciable no constante y que no
se anule f : R −→ R, se considera el campo vectorial X sobre R,
d
Xy = f (y) dx
|y , ∀y ∈ R. Hállense todos los campos que conmutan con
d
.
X, y compruébese que, salvo el nulo, ninguno de ellos conmuta con dx
Ejercicio 22. Se considera en R3 un sistema de ecuaciones en derivadas parciales
∂z
= g(x, y, z),
∂x
∂z
= h(x, y, z),
∂y
y se le asocian los campos
X=
∂
∂
+g ,
∂x
∂z
Y =
∂
∂
+h .
∂y
∂z
Demuéstrese que si el sistema admite una solución z = f (x, y), entonces
los campos X, Y son una paralelización de la variedad z = f (x, y) tal
que [X, Y ] = 0.
104
Capı́tulo 6
Campos tensoriales y formas
diferenciales
En este tema comprobamos en primer lugar que no sólo el concepto de
vector tangente induce el de campo vectorial, sino que toda el álgebra
tensorial sobre un espacio vectorial induce los correspondientes campos
y operaciones tensoriales sobre la variedad.
A continuación, nos centramos por su particular interés en las
r−formas diferenciales para r = 1, 2, e introducimos los conceptos
de 1-formas cerradas y exactas, y de circulación de una 1-forma a lo
largo de una curva. El estudio general de r−formas diferenciales se
pospone hasta el estudio de Integración en Variedades (Temas 8 y 9),
que resulta independiente del resto.
6.1.
Tensores en un espacio vectorial
6.1.1.
Concepto
Definición 6.1.1 Sea V (R) un espacio vectorial. Un tensor r veces
covariante y s veces contravariante (o tipo (r, s)) sobre V (R) es una
aplicación
T : V r × (V ∗ )s → R
(u1 , . . . , ur , φ1 , . . . , φs ) 7→ T (u1 , . . . , ur , φ1 , . . . , φs )
105
106
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
que es multilineal, esto es, lineal en cada una de sus r + s variables.
Denotaremos por Tr,s (V ) al conjunto de los tensores tipo (r, s) sobre
V (R). De manera natural se puede definir en este conjunto una suma
y un producto por escalares reales. Concretamente,
(1) si T, T 0 ∈ Tr,s (V ) entonces T + T 0 (∈ Tr,s (V )) se define por:
(T + T 0 )(y 1 , . . . , y r , φ1 , . . . , φs ) =
T (y 1 , . . . , y r , φ1 , . . . , φs ) + T 0 (y 1 , . . . , y r , φ1 , . . . , φs );
(2) si T ∈ Tr,s (V ), a ∈ R entonces a · T (∈ Tr,s (V )) se define por:
(a · T )(y 1 , . . . , y r , φ1 , . . . , φs ) = a · T (y 1 , . . . , y r , φ1 , . . . , φs ).
Se comprueba fácilmente que (Tr,s (V ), +, ·R) tiene estructura de espacio vectorial.
Ejemplos:
(1) Claramente, T1,0 (V ) = V ∗ y T0,1 (V ) = V ∗∗ . Ahora bien, puesto
que por el Teorema de Reflexividad podemos identificar V ∗∗ con
el propio V , podemos considerar T0,1 (V ) = V . Por tanto, un
vector v se correspondelos con el tensor 1-contravariante:
v : V∗ →R
φ 7→ φ(v).
(2) Los métricas g : V × V → R sobre V (R) se definen como tensores
2-covariantes y simétricos; esto es, tales que verifican g(u, v) =
g(v, u), ∀u, v ∈ V (véase el Tema siguiente).
2
(3) Consideremos la aplicación det : Rn → R definida por
¯
¯




¯ a11 . . . a1n ¯
a1n
a11
¯
¯
¯
¯ .. . .
 .. 
 .. 
.
.
( .  , . . . ,  . ) 7→ ¯ .
. . ¯.
¯
¯
¯ an1 . . . ann ¯
ann
an1
Es directo comprobar que det∈ Tn,0 (Rn ).
6.1. TENSORES EN UN ESPACIO VECTORIAL
107
(4) Sea f : V → V un endomorfismo de espacios vectoriales y consideremos la aplicación
Tf : V × V ∗ → R
(u, φ) 7→ φ(f (u)).
Se demuestra fácilmente Tf ∈ T1,1 (V ). Es más, la aplicación
End(V ) → T1,1 (V )
f 7→ Tf
es un isomorfismo de espacios vectoriales. Por tanto, es posible
asociar una traza a un tensor tipo (1, 1) sin más que calcular
la de su endomorfismo correspondiente. Concretamente, si B =
(v1 , . . . , vn ) es una base de V :
traza Tf := traza f =
n
X
φi (f (vi )) =
i=1
n
X
Tf (vi , φi ),
i=1
que resulta independiente de la base B escogida.
Por completitud, se define también T0,0 (V ) = R, de modo que el concepto de tensor incluye simultánemente los de escalar, vector, forma
lineal y endomorfismo.
6.1.2.
Producto tensorial
El producto tensorial resultará útil para estudiar tensores tipo (r, s)
a partir de tensores de tipo inferior en r ó s. El objetivo final será poder
estudiar todos los tensores a partir de los (1,0) (vectores) y (0,1) (formas lineales).
Definición 6.1.2 Sean T ∈ Tr,s (V ) y T 0 ∈ Tr0 ,s0 (V ). Se define el producto tensorial de T por T 0 como
0
0
T ⊗ T 0 : V r+r × (V ∗ )s+s → R
0
0
((u1 , . . . , ur+r0 ), (φ1 , . . . , φs+s )) 7→ T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ),
siendo
0
T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ) =
0
= T (u1 , . . . , ur , φ1 , . . . , φs ) · T 0 (ur+1 , . . . , ur+r0 , φs+1 , . . . , φs+s ).
108
Propiedades. Se comprueba fácilmente:
(1) T ⊗ T 0 es multilineal y, por tanto, T ⊗ T 0 ∈ Tr+r0 ,s+s0 (V ).
(2) La operación producto tensorial es lineal en cada variable en el
siguiente sentido:
(aT + bT ) ⊗ T 0 = a(T ⊗ T 0 ) + b(T ⊗ T 0 )
0
0
T ⊗ (aT 0 + bT ) = a(T ⊗ T 0 ) + b(T ⊗ T )
0
para todo T, T ∈ Tr,s y T 0 , T ∈ Tr0 ,s0 .
(3) La operación producto tensorial es asociativa (aunque no conmutativa).
6.1.3.
Tensores tipo (r, s) con r + s = 2
Consideremos en primer lugar el espacio vectorial T2,0 (V ). Acabamos
de ver que si φ, ψ ∈ V ∗ (= T1,0 (V )) entonces φ ⊗ ψ ∈ T2,0 (V ), siendo (φ ⊗ ψ)(v, w) = φ(v) · ψ(w), ∀v, w ∈ V . Consideremos fijada una
base B = (v1 , . . . , vn ) de V , y su correspondiente base dual B ∗ =
(φ1 , . . . , φn ). Nuestro objetivo será demostrar que una base de T2,0 (V )
es el conjunto de todos los productos tensoriales de elementos de B ∗ ,
esto es
B2,0 = {φi ⊗ φj : i, j ∈ {1, . . . , n}}.
P
Lema 6.1.3 Si T = ni,j=1 tij φi ⊗φj ∈ T2,0 (V ) entonces tkl = T (vk , vl )
para todo k, l ∈ {1, . . . , n}.
Demostración.
T (vk , vl ) =
n
X
i,j=1
i
j
tij (φ ⊗ φ )(vk , vl ) =
n
X
tij δki δlj = tkl . 2
i,j=1
Teorema 6.1.4 (1) El conjunto B2,0 es una base del espacio T2,0 (V )
y, por tanto, dim T2,0 = n2 .
(2) La coordenada (k, l) de un tensor T en la base B2,0 coincide con
T (vk , vl ).
109
Demostración. (1) En primer
que B2,0 es linealmente
Pnlugar veamos
i
j
independiente. En efecto, si i,j=1 tij φ ⊗ φ = T0 ≡ 0 entonces, por el
Lema 6.1.3, tij = T0 (vi , vj ) = 0, ∀i, j. Para demostrar que B2,0 es un
sistema de generadores
basta comprobar que para todo T ∈ T2,0 (V )
Pn
se tiene T =
t φi ⊗ φj , siendo tij = T (vi , vj ). En efecto, si
i,j=1
Pn i
Pnij j
u = i=1 a vi , v = j=1 b vj entonces
n
n
n
X
X
X
i
j
T (u, v) = T (
a vi ,
b vj ) =
T (vi , vj )ai bj
i=1
=
n
X
j=1
Ã
tij ai bj =
i,j=1
n
X
i,j=1
!
tij φi ⊗ φj
(u, v)
i,j=1
(2) Inmediato del Lema 6.1.3. 2
Observación. Las coordenadas tij de T en B2,0 se pueden escribir de
modo matricial


T (v1 , v1 ) . . . T (v1 , vn )


..
..
...
MB (T ) = (tij )i,j = 
.
.
.
T (vn , v1 ) . . . T (vn , vn )
Se comprueba entonces:


b1


T (u, v) = (a1 , . . . , an )MB (T )  ...  .
bn
Observación. Todos los tensores tipo (2, 0) se pueden escribir como
productos tensoriales del tipo φ ⊗ ψ o sumas finitas de ellos. Esto lleva
a usar a veces la notación T2,0 (V ) = V ∗ ⊗ V ∗ (producto directo de V ∗
por V ∗ ).
Ejercicio. Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ con n ≥ 2. Pruébese
que no existen φ, ψ ∈ V ∗ tales que φ ⊗ ψ = φ1 ⊗ φ2 + φ2 ⊗ φ1 .
Un desarrollo análogo al que hemos hecho para T2,0 (V ) se puede
llevar a cabo para T0,2 (V ), T1,1 (V ). Ası́, consideremos el espacio vectorial T0,2 (V ). Dados dos vectores u, v ∈ V (≡ T0,1 (V )) ahora también
110
podemos definir la aplicación
u⊗v :V∗×V∗ →R
(φ, ψ) 7→ φ(u) · ψ(v).
En consecuencia, fijada una base B = (v1 , . . . , vn ) de V y su correspondiente base dual B ∗ = (φ1 , . . . , φn ), podemos construir el conjunto
B0,2 = {vi ⊗ vj : i, j ∈ {1, . . . , n}} de manera que se verifica:
Lema 6.1.5 Si T =
Pn
i,j=1
tij vi ⊗ vj entonces tkl = T (φk , φl ).
(2) La coordenada (k, l) de un tensor T en la base B0,2 coincide con
T (φk , φl ).
Observación. Se suele usar la notación T0,2 (V ) ≡ V ⊗ V .
Finalmente, consideremos el espacio vectorial T1,1 (V ). Dados φ ∈
V y u ∈ V podemos definir
∗
φ⊗u:V ×V∗ →R
(v, ψ) 7→ φ(v) · ψ(u).
Para el conjunto B1,1 = {φj ⊗vi : i, j ∈ {1, . . . , n}} se verifica entonces:
Lema 6.1.7 Si T =
Pn
i j
i,j=1 tj φ
⊗ vi entonces tlk = T (vk , φl ).
(2) La coordenada (k, l) de un tensor T correspondiente al elemento
l
φ ⊗ vk de la base B1,1 coincide con T (vl , φk ).
Observación. Según la definición general de producto tensorial que
estamos considerando, se verifica φ ⊗ u = u ⊗ φ. Por tanto, indistintamente se suelen usar las notaciones T1,1 (V ) ≡ V ⊗ V ∗ ≡ V ∗ ⊗ V .
6.1.4.
111
Tensores tipo (r, s)
Consideremos r formas lineales ψ 1 , . . . , ψ r en V ∗ y s vectores u1 , . . . , us
en V . Usando la asociatividad de ⊗ puede escribirse inequı́vocamente
ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us ∈ Tr,s (V ). Explı́citamente,
ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us : V r × (V ∗ )s → R
(w1 , . . . , wr , ρ1 , . . . , ρs ) 7→ ψ 1 (w1 ) · · · ψ r (wr ) · ρ1 (u1 ) · · · ρs (us ).
Para construir una base de Tr,s (V ) consideramos una base B = (v1 , . . . , vn )
de V y su base dual B ∗ = (φ1 , . . . , φn ) de V ∗ . Definimos entonces
Br,s = {φi1 ⊗· · ·⊗φir ⊗vj1 ⊗· · ·⊗vjs : i1 , . . . , ir , j1 , . . . , js ∈ {1, . . . , n}}.
Argumentos análogos a los del caso r + s = 2 permiten demostrar:
Teorema 6.1.9 (1) Br,s es una base de Tr,s (V ) y, por tanto, dim Tr,s (V ) =
nr+s .
(2) Si T ∈ Tr,s (V ) satisface
T =
n
X
...js
tji11...i
· φi1 ⊗ · · · ⊗ φir ⊗ vj1 ⊗ · · · ⊗ vjs
r
i1 ,...,js =1
...js
entonces tji11...i
= T (vi1 , . . . , vir , φj1 , . . . , φjs ).
r
,...,js
Abusando del lenguaje se suele decir que los escalares tji11,...,i
son las
r
coordenadas de T en B (en lugar de en Br,s ).
6.1.5.
Tensores simétricos y antisimétricos tipo (2, 0)
Definiciones 6.1.10 (1) Diremos que un tensor T ∈ T2,0 (V ) es simétrico si T (x, y) = T (y, x), ∀x, y ∈ V .
(2) Diremos que un tensor T ∈ T2,0 (V ) es antisimétrico si T (x, y) =
−T (y, x), ∀x, y ∈ V .
En caso de tensores tipo (0, 2) se puede dar una definición análoga; en
cambio, para tensores tipo (1, 1) esto no tiene sentido.
Proposición 6.1.11 Sea T ∈ T2,0 (V ). Son equivalentes:
(i) T es simétrico (resp. antisimétrico).
112
(ii) Existe una base B = (v1 , . . . , vn ) de V tal que T (vi , vj ) = T (vj , vi )
(resp. T (vi , vj ) = −T (vj , vi )), ∀i, j ∈ {1, . . . , n}.
(iii) Cualquier base verifica la propiedad (ii).
Demostración. Las implicaciones (i) ⇒ (iii) y (iii) ⇒ (ii) son triviales.
Para (ii) ⇒ (i) téngase en cuenta lo siguiente:
n
n
X
X
i
T (x, y) = T (
a vi ,
aj vj )
i=1
=
n
X
i,j=1
i j
a b T (vi , vj ) =
n
X
j=1
ai bj T (vj , vi ) = T (y, x). 2
i,j=1
Observación: Si φ, ψ ∈ V ∗ entonces el tensor φ⊗ψ+ψ⊗φ es simétrico
mientras que el tensor φ ⊗ ψ − ψ ⊗ φ es antisimétrico.
Definición 6.1.12 Si φ, ψ ∈ V ∗ se define su producto exterior como
el tensor antisimétrico φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ.
Es fácil probar que se verifican la siguientes propiedades:
S
A
(1) Tanto T2,0
(V ) = {T ∈ T2,0 (V ) : T es simétrico} como T2,0
(V ) =
{T ∈ T2,0 (V ) : T es antisimétrico} son subespacios vectoriales de
T2,0 (V ).
S
(2) Se verifica la descomposición en suma directa T2,0 (V ) = T2,0
(V )⊕
A
S
A
S
A
T2,0 (V ) (esto es, T2,0 (V ) = T2,0 (V )+ T2,0 (V ) y T2,0 (V ) ∩ T2,0 (V ) = {0}.)
(3) Si B = (φ1 , . . . , φn ) es una base de V ∗ entonces los conjuntos
S
A
B2,0
= {φi ⊗ φj + φj ⊗ φi : 1 ≤ i ≤ j ≤ n} y B2,0
= {φi ∧ φj =
S
φi ⊗ φj − φj ⊗ φi : 1 ≤ i < j ≤ n} son bases de los espacios T2,0
(V ) y
A
T2,0 , respectivamente. Por tanto, la dimensión del primero es n(n+1)/2
y la del segundo n(n − 1)/2.
6.2.
Tensores sobre variedades
6.2.1.
Tensores en un espacio vectorial tangente
Sea Q una variedad diferenciable y p ∈ Q. Consideremos el espacio vectorial tangente Tp Q y sea (U, ϕ = (q 1 , . . . , q n )) un entorno
6.2. TENSORES SOBRE VARIEDADES
113
coordenado de p. Para estas coordenadas podemos construir las bases
Bp = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) y Bp∗ = (dqp1 , . . . , dqpn ), y a partir de ellas, los
tensores dqpi ⊗dqpj ∈ T2,0 (Tp Q), dqpi ⊗ ∂q∂ j |p ∈ T1,1 (Tp Q), etc. Como vimos
en la Subsección 6.1.3, estos tensores permiten construir las bases de los
correspondientes espacios tensoriales (T2,0 (Tp Q), T1,1 (Tp Q)). Con más
generalidad (Subsección 6.1.4), si Tp ∈ Tr,s (Tp Q), existirán números
...js
reales tji11...i
tales que
r
Tp =
n
X
,...,js
tji11,...,i
· dqpi1 ⊗ · · · ⊗ dqpir ⊗
r
i1 ,...,js =1
∂
∂
|p ⊗ · · · ⊗ j s |p ,
j
1
∂q
∂q
,...,js
donde tji11,...,i
= Tp ( ∂q∂i1 |p , . . . , ∂q∂ir |p , dqpj1 , . . . , dqpjs ) (coordenadas de T
r
en Bp ).
Para estudiar cómo cambian las coordenadas del tensor ante cambios de base, supongamos que (Ũ , ϕ̃ = (q̃1 , . . . , q̃n )) es otro entorno
coordenado alrededor de p. Entonces las nuevas bases asociadas a esas
coordenadas son B̃p = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ) y B̃p∗ = (dq̃p1 , . . . , dq̃pn ). Por
tanto, debemos hallar la relación existente entre las coordenadas de Tp
en las diferentes bases de tensores inducidas por Bp y B̃p . Para ello,
supongamos en primer lugar que Tp ∈ T2,0 (Tp Q), entonces
Tp =
n
X
tij ·
dqpi
⊗
dqpj
=
i,j=1
Ahora bien,
n
X
t̃kl · dq̃pk ⊗ dq̃pl .
k,l=1
Pn
∂
|
=
p
k
∂ q̃
Pni=1
∂
| = j=1
∂ q̃ l p
∂q i
(p) ∂q∂ i |p
∂ q̃ k
∂q j
(p) ∂q∂ j |p ,
∂ q̃ l
luego
P P
t̃kl = Tp ( ∂∂q̃k |p , ∂∂q̃l |p ) = ni=1 nj=1
P
i
j
(p)tij .
= ni,j=1 ∂∂qq̃k (p) ∂q
∂ q̃ l
j
∂q i
(p) ∂q
(p)
∂ q̃ k
∂ q̃ l
· Tp ( ∂q∂ i |p , ∂q∂ j |p )
Esto es,
n
X
∂q j
∂q i
t̃kl =
(p)
(p)tij
k
l
∂
q̃
∂
q̃
i,j=1
∀k, l ∈ {1, . . . , n}.
114
Ejercicio. (1) En el caso de que Tp sea un tensor 2 contravariante,
compruébese que la transformación análoga de coordenadas es
n
X
∂ q̃ l
∂ q̃ k
(p)
(p)tij
t̃ =
i
j
∂q
∂q
i,j=1
kl
∀k, l ∈ {1, . . . , n}.
(2) Supongamos que la transformación de coordenadas q̃ i (q 1 , . . . , q n )
es afı́n, esto es:



 

q̃ 1
q1
q01
 .. 
 .   . 
(6.1)
 .  = A ·  ..  +  .. 
q̃ n
qn
q0n
para alguna matriz regular A = (aji )i,j y q01 , . . . , q0n ∈ R fijos. Escribiendo la matriz inversa como A−1 = (bji )i,j , muéstrese que se verifica:
kl
t̃ =
n
X
i,j=1
aki alj tij ,
t̃kl =
n
X
bik bjl tij
i,j=1
para todo k, l ∈ {1, . . . , n}. ¿Qué sucede si A es una matriz ortonormal,
A ∈ O(n, R)?
(3) Repı́tanse los dos puntos anteriores cuando Tp es un tensor (1,1).
A continuación, consideremos el caso general Tp ∈ Tr,s (Tp Q). Ahora
,...,js
s
tenemos coordenadas tji11,...,i
y t̃lk11,...,l
,...,kr en las bases inducidas por Bp y
r
B̃p , respectivamente. La relación entre ambas queda:
∂
∂
s
l1
ls
t̃lk11,...,l
,...,kr = Tp ( ∂ q̃ k1 |p , . . . , ∂ q̃ kr |p , dq̃p , . . . , dq̃p )
Pn ∂qi1
P
ir
= Tp ( i1 =1 ∂ q̃k1 (p) ∂ q̃∂i1 |p , . . . , nir =1 ∂∂qq̃kr (p) ∂q∂ir |p ,
Pn ∂ q̃ls
Pn ∂ q̃l1
j1
js
js =1 ∂q js (p)dqp ).
j1 =1 ∂q j1 (p)dqp , . . . ,
Por tanto, usando la multilinealidad de los tensores se tiene
s
t̃lk11,...,l
,...,kr =
n
X
i1 ,...,js
∂q i1
∂q ir
∂ q̃ l1
∂ q̃ ls
...js
(p)
·
·
·
(p)
·
(p)
·
·
·
(p) · tji11...i
. (6.2)
r
k1
kr
j1
js
∂
q̃
∂
q̃
∂q
∂q
=1
La expresión (6.2) proporciona la definición clásica por coordenadas
de tensor (r, s) en p, esto es: una asignación de nr+s números reales a
cada entorno coordenado de p que se transforma según (6.2).
6.2. TENSORES SOBRE VARIEDADES
115
Observación. La elección de las posiciones de los ı́ndices (“contravariantes” arriba, “covariantes” abajo) facilita recordar mnemotécnicamente expresiones tensoriales generales como (6.2): (i) siempre que hay un
sumatorio de dos ı́ndices, uno de ellos aparece arriba y otro abajo, (ii)
si un ı́ndice queda suelto (sin sumarse en él) en uno de los miembros de
la igualdad, también quedará suelto en el otro, y en la misma posición.
Nota (Sobre el electromagnetismo en Relatividad Especial). Clásicamente se suponı́a que cada observador inercial O medı́a en cada instante de
tiempo t y en cada punto p del espacio fı́sico ordinario tridimensional
~ t (p) ≡
(al que asigna unas coordenadas (x, y, z)), un campo eléctrico E
~
~
~
E(t, x, y, z) y un campo magnético Bt (p) ≡ B(t, x, y, z). Otro obser~ 0 (p) ≡ E
~ 0 (t, x0 , y 0 , z 0 ) y un
vador inercial O0 medirá un campo eléctrico E
t
~ t0 (p) ≡ B
~ 0 (t, x0 , y 0 , z 0 ). Si, por ejemplo, O0 se mueve
campo magnético B
a lo largo del eje x de O con velocidad constante v, desde el punto de
vista de Galileo la transformación de coordenadas que los observadores
inerciales encuentran para los puntos del espacio fı́sico es:
x0 = x − vt
y0 = y
z 0 = z.
(6.3)
Nótese que t desempeña el papel de un parámetro (igual para O y O’)
independiente de p. Ası́,
∂
∂
|p =
|p ;
∂x
∂x0
∂
∂
|p = 0 |p ;
∂y
∂y
∂
∂
|p = 0 |p .
∂z
∂z
(6.4)
Si los campos eléctrico y magnético fueran vectores sobre el espacio
~ t (p) = E
~ t0 (p), B
~ t (p) = B
~ t0 (p) y
fı́sico medibles por O y O0 , entonces E
~ t (p) y B
~ t (p)
las igualdades (6.4) conducirı́an a que las coordenadas de E
0
deberı́an ser las mismas para O y O . Por el contrario, se sabe de las
distintas leyes de la electrodinámica que ello no ocurre ası́. Es mérito de
Einstein percatarse del siguiente hecho. Consideremos el tiempo como
una coordenada más (esto es, ahora la variedad Q es el espacio-tiempo
fı́sico, formado por todos los “eventos” espacio-temporales) y consideremos las ternas (E 1 , E 2 , E 3 ), (B 1 , B 2 , B 3 ) obtenidas de las mediciones
~ x, y, z), B(t,
~ x, y, z) por cada observador inercial O. Podemos
de E(t,
construir el tensor electromagnético F para O, definido por la matriz
116
de coordenadas :

0
E1
E2
E3
 −E 1
0
B 3 −B 2 
.
(Fij ) = 
 −E 2 −B 3
0
B1 
−E 3 B 2 −B 1
0

Supongamos ahora que, entre cada dos observadores inerciales O, O0
la transformación de coordenadas (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) asignada a
un mismo evento espacio-temporal, en lugar de verificar la transformación galileana (6.3) (más la implı́cita t = t0 ), verifica la igualdad
(6.1) para alguna matriz A en el grupo de Lorentz (esto es, tal que
AηAt = η, donde η es la matriz diagonal -1,+1,+1,+1). Entonces “la
matriz (Fij )i,j se transforma como un tensor entre observadores inerciales”, esto es: el tensor electromagnético F construido por O en
~ x, y, z), B(t,
~ x, y, z) coin(t, x, y, z) a partir de sus mediciones de E(t,
cide con el tensor electromagnético F 0 construido por cualquier otro
observador inercial O0 en ese punto a partir de sus propias mediciones
~ 0 (t0 , x0 , y 0 , z 0 ), B
~ 0 (t0 , x0 , y 0 , z 0 ).
de E
6.2.2.
Campos tensoriales
Un campo tensorial T tipo (r, s) sobre una variedad Q es una asignación de un tensor Tp ∈ Tr,s (Tp Q) a cada punto p ∈ Q. Dado el campo T y un entorno coordenado (U, ϕ = (q 1 , . . . , q n )), existen funciones
,...,js
tji11,...,i
, i1 , . . . , js ∈ {1, . . . , n} definidas en U tales que
r
Tp =
n
X
i1 ,...,js =1
,...,js
tji11,...,i
(p)·dqpi1 ⊗· · ·⊗dqpir ⊗
r
∂
∂
|p ⊗ · · ·⊗ js |p
j
1
∂q
∂q
∀p ∈ U.
Diremos que el campo tensorial T es continuo (resp. diferenciable C r )
...js
en p si todas las funciones tij11...i
son continuas (resp. diferenciables
r
r
C ) en p. A partir de ahora adoptaremos el convenio de llamar campos
tensoriales a aquéllos que son diferenciables C ∞ .
Observación. Recordemos que habı́amos definido un campo de vectores como una aplicación X : Q → T Q tal que π ◦ X = IdQ , siendo
π(vp ) = p para todo p ∈ Q. Una definición análoga puede darse para
campos tensoriales en general. Para ello, consideramos:
Tr,s (Q) ≡ ∪p∈Q Tr,s (Tp Q),
6.3. FORMAS DIFERENCIALES
117
que, de forma natural, es una variedad de dimensión n + nr+s , Un
campo tensorial tipo (r, s) es una aplicación T : Q → Tr,s (Q) tal que
πr,s ◦ T = IdQ , siendo πr,s : Tr,s (Q) → Q la proyección canónica, esto
es, πr,s (Tp ) = p, ∀Tp ∈ Tr,s (Q). Denotamos por Xr,s (Q) al conjunto de
todos los campos tensoriales (diferenciables) (r, s) sobre Q. Al igual
que X(Q), también Xr,s (Q) tiene estructura de espacio vectorial (de
dimensión infinita si dim Q > 0) y de C ∞ (Q)-módulo.
Definición 6.2.1 Sea T un campo tensorial tipo (2, 0) sobre Q. Diremos que T es simétrico (resp. antisimétrico) si Tp es simétrico (resp.
antisimétrico) para todo p ∈ Q; esto es, si
Tp (vp , wp ) = Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q
(resp. Tp (vp , wp ) = −Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q).
Ejercicio. Consideremos el campo tensorial sobre R2
g = dx ⊗ dx + dy ⊗ dy(≡ dx2 + dy 2 ).
Escrı́banse sus coordenadas en la base inducida por las coordenadas
polares.
6.3.
Formas diferenciales
Definición 6.3.1 Una forma diferencial (tipo (1, 0) ó 1-forma diferencial) α es un campo de formas lineales, esto es, de tensores tipo
(1, 0).
Denotaremos por Λ1 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales.
Ahora podemos reobtener el concepto de variedad cotangente a Q
(definida ya en la Sección 4.2) sin más que tener en cuenta T1,0 (Q) =
T Q∗ .De nuevo, Λ1 (Q) es un espacio vectorial (de dimensión ∞) y un
C ∞ (Q)-módulo. La diferente notación introducida hasta ahora se resume en el siguiente esquema:
(r, s) cualquiera
Tr,s (Q)
Xr,s (Q)
r = 0, s = 1
TQ
X(Q)
r = 1, s = 0
T Q∗
Λ1 (Q).
118
1
Además, si α ∈
(Q) y (U, q 1 , . . . , q n ) es un entorno coordenado de Q
PΛ
n
entonces α = i=1 αi dq i , siendo αi = α( ∂q∂ i ).
Un ejemplo relevante de forma de diferencial es la diferencial de una
función f ∈ C ∞ (Q) esto es, df ∈ Λ1 (Q).
Definición 6.3.2 Una forma diferencial (2, 0) o 2-forma diferencial Ω
sobre una variedad Q es un campo tensorial tipo (2, 0) que es antisimétrico, esto es, tal que Ωp (vp , wp ) = −Ωp (wp , vp ), ∀vp , wp ∈ Tp Q y
∀p ∈ Q.
Denotaremos por Λ2 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales.
Recordemos que si φ, ψ ∈ Tp Q entonces φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ es
un tensor (2, 0) antisimétrico y, obviamente, el producto ∧ se extiende
naturalmente a formas diferenciales. Además, si Ω ∈ Λ2 (Q) entonces
Ω=
n
X
Ωij dq i ⊗ dq j ,
i,j=1
donde Ωij = Ω( ∂q∂ i , ∂q∂ j ) = −Ω( ∂q∂ j , ∂q∂ i ) = −Ωji . Ası́,
Ω=
X
Ωij dq i ∧ dq j ,
1≤i<j≤n
siendo Ωii = 0 para todo i.
Nota. En general, para todo entero r no negativo se puede definir el
concepto de r-forma diferenciable sin más que extender el concepto de
antisimetrı́a a tensores tipo (r, 0) (si r = 0 se define Λ0 (Q) ≡ C ∞ (Q)).
Ası́, el espacio vectorial y C ∞ (Q)-módulo de todas las r-formas diferenciales sobre Q se denota por Λr (Q).
6.4.
La diferencial exterior
6.4.1.
Formas exactas
Definición 6.4.1 Diremos que una forma diferencial α ∈ Λ1 (Q) es
exacta si existe una función f ∈ C ∞ (Q) tal que α = df .
6.4. LA DIFERENCIAL EXTERIOR
119
Una
interesante consiste en cuándo una forma diferencial α =
Pn cuestión
i
i=1 αi dq es exacta. Obsérvese que, en caso afirmativo,
n
X
∂f i
dq ,
α=
i
∂q
i=1
f ∈ C ∞ (Q)
y, por tanto,
∂αi
∂ 2f
∂ 2f
∂αj
=
=
=
.
j
j
i
i
j
∂q
∂q ∂q
∂q ∂q
∂q i
Esto es, si α es exacta entonces en cualquier sistema de coordenadas:
∂αi
∂αj
=
j
∂q
∂q i
∀i, j ∈ {1, . . . , n}.
(6.5)
Más adelante veremos que la condición (6.5) no sólo es una condición necesaria para que α sea exacta sino que, localmente, también
es suficiente (Teorema 6.4.6). Pero antes definiremos el concepto de
diferencial de una forma, que, como veremos, extiende al de una función. Este concepto nos permitirá comprobar que la igualdad (6.5) es
independiente de coordenadas, esto es, si para unas coordenadas sobre un abierto U se verifica (6.5), entonces también se verifica para
cualesquiera otras coordenadas en U .
6.4.2.
Diferencial de formas. Lema de Poincaré
Pn
i
Sea α =
i=1 αi dq la expresión de una forma diferencial en un
entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de Q. Por analogı́a con la
diferencial de una función, no resulta extraño definir la diferencial exterior de α (en esas coordenadas) como
dα =
n
X
dαi ∧ dq i .
i=1
Obsérvese que dαi =
Pn
∂αi
j
j=1 ∂q j dq ,
dα =
por lo que
n X
n
X
∂αi
i=1 j=1
∂q j
· dq j ∧ dq i ,
(6.6)
120
o también,
X
dα =
(
1≤i<j≤n
∂αi ∂αj
− i ) · dq j ∧ dq i .
∂q j
∂q
(6.7)
Sin embargo, para que esta definición sea consistente, debe resultar
independiente de coordenadas, como comprobamos a continuación.
Proposición 6.4.2 Sea α ∈ Λ1 (Q), y sean (U, ϕ = (q 1 , . . . , q n )),
(Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) do entornos coordenados con U ∩ Ũ 6= ∅, escribiéndose en U ∩ Ũ :
α=
n
X
αi dq i =
i=1
Entonces:
n
X
j=1
n
X
α̃j dq̃ j .
j=1
j
dα̃j ∧ dq̃ =
n
X
dαk ∧ dq k .
(6.8)
k=1
Llamaremos diferencial exterior dα de α a la 2-forma diferencial definida en cada entorno coordenado por la expresión (6.8).
Demostración. Como
Ã n
!
µ
¶
µ
¶ X
n
n
k
X
X
∂
∂q ∂
∂q k
∂
∂q k
α̃j = α
=α
=
α
=
αk ,
∂ q̃ j
∂ q̃ j ∂q k
∂ q̃ j
∂q k
∂ q̃ j
k=1
k=1
k=1
(que es un caso particular de (6.2)) se tiene:
Ã n
!
¶
n
n µ
X
X
∂ X ∂q k
∂ 2qk
∂q k ∂αk
l
dα̃j =
α dq̃ =
α + j
dq̃ l .
l
j k
l ∂ q̃ j k
l
∂
q̃
∂
q̃
∂
q̃
∂
q̃
∂
q̃
l=1
k=1
k,l=1
En consecuencia,
P
Pn
2 k
k ∂α
j
k
= nj,k,l=1 ( ∂∂q̃l ∂q q̃j αk + ∂q
)dq̃ l ∧ dq̃ j
j=1 dα̃j ∧ dq̃
∂ q̃ j ∂ q̃ l
Pn
P
k
k
= k,l,j=1 ( ∂α
dq̃ l ) ∧ ( ∂q
dq̃ j ) = nk=1 dαk ∧ dq k ,
∂ q̃ j
∂ q̃ l
donde se ha usado que
n
X
∂ 2qk
dq̃ l ∧ dq̃ j = 0
l ∂ q̃ j
∂
q̃
l,j=1
6.4. LA DIFERENCIAL EXTERIOR
121
por la antisimetrı́a de ∧. 2
El siguiente resultado caracteriza a la diferencial exterior, y puede
tomarse como definición alternativa de ella.
Teorema 6.4.3 Sea α ∈ Λ1 (Q), y X, Y ∈ X(Q). Entonces:
dα(X, Y ) = X(α(Y )) − Y (α(X)) − α([X, Y ]).
Demostración. Resulta inmediato de (6.7) en el caso de que X, Y sean
campos coordenados. Para el caso general, obsérvese que cada miembro es C ∞ (Q)−lineal en X e Y , esto es, resulta equivalente en cada
miembro multiplicar por f ∈ C ∞ (Q) que reemplazar X (resp. Y ) por
f X (resp. f Y ) . 2
Ejercicio. Demuéstrese que la aplicación diferencial exterior d : Λ1 (Q) →
Λ2 (Q) es lineal y verifica:
d(f α) = df ∧ α + f dα, ∀f ∈ Λ0 (Q), ∀α ∈ Λ1 (Q).
Podemos caracterizar ahora la igualdad (6.5).
Definición 6.4.4 Diremos que una forma diferencial α ∈ Λ1 (Q) es
cerrada si dα = 0, esto es, si en cualesquiera coordenadas verifica
(6.5).
De la discusión al comienzo de la Subsección 6.4.1 se tiene:
Corolario 6.4.5 Si α ∈ Λ1 (Q) es exacta (α = df ) entonces α es
cerrada (dα = 0).
Veamos a continuación un recı́proco parcial de este resultado.
Teorema 6.4.6 (Lema de Poincaré). Sea α ∈ Λ1 (Q) una forma diferencial cerrada. Para cada p ∈ Q existe un entorno abierto V de p y
una función f : V → R tal que α = df sobre V .
Demostración. Consideremos un entorno coordenado (U, ϕ = (q 1 , . . . ,
q n )) de p ∈ Q tal que ϕ(p) = 0. Sea δ > 0 tal que ]−δ, δ[n ⊂ ϕ(U ) ⊆ Rn ,
y tomemos V = ϕ−1 (] − δ, δ[n ). Todo se reduce a hallar una función f
tal que
∂f
= αi ∀i ∈ {1, . . . , n}.
(6.9)
∂q i
122
Ahora bien, como α es cerrada, la solución explı́cita del sistema de
ecuaciones (6.9) es:
R q1
R q2
f (q 1 , . . . , q n ) = 0 α1 (t, q 2 , . . . , q n )dt + 0 α2 (0, t, q 3 , . . . , q n )dt+
R q3
R qn
+ 0 α3 (0, 0, t, q 4 , . . . , q n )dt + . . . + 0 αn (0, . . . , 0, t)dt + C
para cualquier C ∈ R.1 2
Una cuestión interesante es “cómo de grande” puede tomarse V en
el Lema de Poincaré. De la demostración anterior resulta obvio que
si Q = Rn entonces es posible tomar V = Rn . Con más generalidad,
es posible demostrar que podemos asumir V = Q siempre que Q sea
“simplemente conexa” (véase el Apéndice 1). Concretamente:
Teorema 6.4.7 Sea Q una variedad simplemente conexa. Una forma
diferencial α ∈ Λ1 (Q) es cerrada si y sólo si es exacta.
A veces, aunque α no sea cerrada existe una función h ∈ C ∞ (Q), h > 0,
tal que h · α es cerrada. Se dice entonces que h es un factor integrante
de α. Obviamente, en este caso h verifica la ecuación
d(h · α) = dh ∧ α + hdα = 0.
Observemos que, al no anularse h, el núcleo de la forma lineal h(p)·αp :
Tp Q → R coincide con el de αp . Por otra parte, es fácil comprobar que
dos formas lineales que tengan igual núcleo son proporcionales. Dada
una forma diferencial α la colección de todos los núcleos de las correspondientes formas lineales αp , p ∈ Q determina cuándo α admite
factores integrantes. De hecho, del Teorema 6.4.3 es inmediato deducir
que si α ∈ Λ1 (Q) admite un factor integrante, entonces para cualesquiera X, Y ∈ X(Q) con α(X) ≡ α(Y ) ≡ 0 se tiene α([X, Y ]) ≡ 0.
El recı́proco también es cierto localmente; en particular, en dimensión
2 toda forma diferencial admite localmente factores integrantes.
6.5.
Circulación de una forma diferencial
Consideremos una forma diferencial α ∈ Λ1 (Q) y una curva diferenciable γ : [a, b] → Q. Es posible definir la composición:
α ◦ γ 0 (t) = αγ(t) (γ 0 (t)) ∈ R,
1
∀t ∈ [a, b],
Esto es bien sabido del estudio elemental de ecuaciones en derivadas parciales,
y se puede comprobar directamente derivando.
6.5. CIRCULACIÓN DE UNA FORMA DIFERENCIAL
123
que resulta ser una aplicación diferenciable [a, b] → R. Definimos la
circulación de α a lo largo de γ como la integral de esta aplicación:
Z
Z b
α :=
α(γ 0 (t))dt.
(6.10)
γ
a
Esta definición se extiende de manera natural al caso en el que γ sea
sólo diferenciable a trozos (véase la Sección ??, Observación (3); el integrando no estarı́a bien definido sólo en un conjunto finito de puntos).
Una consecuencia interesante de la linealidad de α es que la circulación
resulta independiente de la reparametrización de γ. Con más precisión:
Proposición 6.5.1 Consideremos una forma diferencial α ∈ Λ1 (Q),
una curva γ : [a, b] → Q y una aplicación diferenciable t : [c, d] → [a, b],
s 7→ t(s) con t(c) = a, t(d) = b. Si definimos γ̄ : [c, d] → Q como2
γ̄(s) = γ(t(s)), entonces la circulación de α a lo largo de γ coincide
con la circulación de α a lo largo de γ̄.
Demostración. Del comportamiento de la integral frente al cambio de
variable y de la linealidad de α se tiene:
Z b
Z d
Z d
dt
0
0
α(γ (t))dt =
α(γ (t(s))) ·
· ds =
α(γ̄ 0 (s))ds. 2
ds
a
c
c
Cuando γ cae dentro de un entorno coordenado (U, q 1 , . . . , q n ) se verifica:
Z b
n Z b
X
dq i (t)
0
α(γ (t))dt =
αi (q 1 (t), . . . , q n (t))
dt,
(6.11)
dt
a
a
i=1
siendo γ(t) = (q 1 (t), . . . , q n (t)). En la práctica, se suele calcular la
circulación mediante la expresión:
n Z b
X
dq i (t)
1
n
αi (q (t), . . . , q (t))
dt
dt
i=1 a
2
Cuando t0 (s) > 0 en todo punto se dice que γ̄ es una reparametrización (creciente) de γ, aunque esta hipótesis no es necesaria para la presente proposición. En
cualquier caso, la condición t(c) = a, t(d) = b implica que la derivada sea positiva
en un subconjunto de [c, d]; si reemplazamos esta condición por t(c) = b, t(d) = a
entonces el signo de la circulación a lo largo de γ̄ cambia con respecto a γ. Obsérvese
además que, en el caso de que γ(a) = γ(b), la condición t(c) = a, t(d) = b implica
intuitivamente que el “número de vueltas” con el que finalmente se recorre γ sea
igual al “número de vueltas” con el que se recorre γ̄.
124
=
n Z
X
i=1
q1i
q0i
αi (q 1 (q i ), . . . , q i , . . . , q n (q i ))dq i ,
(6.12)
(q01 , . . . , q0n ),
siendo γ(a) ≡
γ(b) ≡ (q11 , . . . , q1n ). En ocasiones, en lugar
de la expresión “circulación de α a lo largo de γ” se habla de “integral
de lı́nea (o camino) de α a lo largo de (la imagen de) γ”, con lo que se
pone más de manifiesto su invariancia ante reparametrizaciones.
Si conocemos la circulación de α a lo largo de cualquier curva entonces podemos reconstruir α. Con más precisión, de (6.11) se sigue
inmediatamente:
Proposición 6.5.2 Si vp ∈ Tp Q y si γ : [0, ²] → Q, ² > 0 es una
curva diferenciable con γ 0 (0) = vp , entonces se verifica
Rt
α(γ 0 (t))dt
0
.
α(vp ) = limt→0
t
La circulación de α a lo largo de dos curvas distintas γ y γ̃ no tiene por
qué coincidir aunque los extremos de γ y γ̃ sı́ lo hagan. Sin embargo,
esto sı́ coincide cuando α es exacta. En efecto, si α = df entonces
Z b
Z b
Z b
d(f ◦ γ)
0
0
α(γ (t))dt =
df (γ (t))dt =
dt = f (γ(b)) − f (γ(a)).
dt
a
a
a
(6.13)
De hecho, esta propiedad caracteriza a las formas diferenciales exactas:
Teorema 6.5.3 Resultan equivalentes:
(i) α es una forma diferencial exacta.
(ii) Para cualesquiera dos curvas γ : [a, b] → Q, γ̃ : [c, d] → Q con
γ(a) = γ̃(a), γ(b) = γ̃(b) la circulación de α a lo largo de γ
coincide con la circulación de α a lo largo de γ̃.
Demostración. La implicación (i) ⇒ (ii) se reduce a (6.13). Para la
recı́proca, escojamos un punto p0 en (cada parte conexa de) Q. Para
cada punto p (en esa parte conexa -y, por tanto, arcoconexa) tomamos
una curva γ : [0, b] → Q que conecte p0 con p. Definimos f escogiendo
f (p0 ) ∈ R arbitrariamente y tomando:
Z b
f (p) = f (p0 ) +
α(γ 0 (t))dt.
(6.14)
0
6.6. APÉNDICE 1: CONEXIÓN SIMPLE
125
La función f está bien definida por la hipótesis (ii). Si v = γ 0 (0) ∈
Tp0 Q, de
d(f ◦ γ)
(0), v = γ 0 (0)
dt
y (6.14) se comprueba que αp0 (v) = dfp0 (v). Para comprobar la igualdad entre α y df en cualquier otro punto p1 (de la misma parte conexa
de p0 ), basta con darse cuenta de que la igualdad (6.14) se verifica
también sustituyendo f (p0 ) por f (p1 ) y tomando curvas que conecten
p1 con cada p (fı́jese una curva γ0 que conecte p0 con p1 y yuxtapóngase
con cualquiera que conecte p1 con p). 2
Si α es cerrada pero no exacta entonces las circulaciones de α a
lo largo de γ y γ̃ no tienen por qué coincidir. Ahora bien, si γ y γ̃
son homotópicas (véase el Apéndice 1) entonces estas circulaciones
necesariamente coinciden. Una explicación intuitiva de este hecho es
que, al ser γ y γ̃ homotópicas, ambas caen en un conjunto simplemente
conexo U de Q. Por tanto, α es exacta sobre U y el resultado se sigue
del Teorema 6.5.3.
dfp (v) =
Ejercicio. Sea α una forma diferencial cerrada sobre Q = R2 \{0}.
Pruébese que es exacta si y sólo si su circulación a lo largo de la curva
γ(t) = (cos t, sent), t ∈ [0, 2π] es nula. Generalı́cese a Q igual a R2
menos un conjunto finito de puntos.
6.6.
Apéndice 1: variedades simplemente
conexas
A continuación introducimos el concepto de conexión simple. Este
concepto es aplicable a todo espacio topológico aunque, por comodidad,
puede suponerse que el espacio topológico es siempre una variedad
(topológica) Q.
Fijados p, q ∈ Q, diremos que la curva (continua) γ : [0, 1] → Q
conecta p con q si p = γ(0), q = γ(1). En el caso particular p = q,
diremos que γ es un lazo en p. Dada otra curva γ̃ : [0, 1] → Q que
conecte p y q se dice que γ y γ̃ son homotópicas si existe una aplicación
continua
H : [0, 1] × [0, 1] → Q
(s, t) 7→ γs (t)
126
tal que cada curva γs conecta p y q, ∀s ∈ [0, 1] y, además, γ0 = γ,
γ1 = γ̃. Un lazo γ en p se dice homotópico nulo si es homotópico al
lazo constantemente igual a p.
Definición 6.6.1 Una variedad3 conexa Q es simplemente conexa si
todo lazo en p es homotópico nulo, ∀p ∈ Q.
Al ser la variedad conexa, no es difı́cil comprobar que si la anterior
condición se verifica en un punto entonces se verifica en todos los puntos.
Algunos ejemplos de espacios simplemente conexos son Rn , S n con
n ≥ 2 y R3 − {p} (para cualquier p ∈ R3 ). Ejemplos de espacios que
no son simplemente conexos son S 1 , R2 − {p} y R3 − {r} donde r es
cualquier lı́nea recta.
Nota. Resulta relevante que todo espacio topológico arcoconexo Q admite (bajo hipótesis muy generales satisfechas por cualquier variedad)
un recubridor universal (Q̃, Π), donde Q̃ es un espacio topológico simplemente conexo y Π : Q̃ → Q una aplicación recubridora, esto es, un
homeomorfismo local que verifica: todo punto p ∈ Q admite un entorno
conexo V tal que Π restringido a cada parte conexa de Π−1 (V ) es un
homeomorfismo sobre V . En el caso de que Q sea una variedad diferenciable, la aplicación recubridora Π induce de manera natural una
(única) estructura diferenciable sobre Q̃, para la cual Π resulta ser un
difeomorfismo local4 .
Análogas conclusiones se derivan para el caso de variedades complejas (véase la nota al concepto de variedad anterior a la Sección
2.3). De hecho, la superficie de Riemann Q̃ que se construye en variable compleja para una función holomorfa f sobre C con singularidades aisladas, es un ejemplo tı́pico de variedad (real de dimensión
2, compleja de dimensión 1) construida de tal modo que la aplicación
3
En principio, los conceptos de homotopı́a y de conexión simple son aplicables a
todo espacio topológico, por lo que se formulan sólo con continuidad. No obstante,
en variedades se puede suponer que todos los elementos son diferenciables (o diferenciables a trozos) sin pérdida de generalidad. De hecho, toda curva continua que
conecte dos puntos fijos es homotópica a una diferenciable, y si dos curvas diferenciables son continuamente homotópicas entonces también son diferenciablemente
homotópicas.
4
Discutiremos con más detalle estas propiedades en el Tema 8, Apéndice 8.7
6.7. APÉNDICE 2: TERMODINÁMICA
127
Π : Q̃ → C\{singularidades} que identifica puntos de diversas hojas de
Q̃ resulta ser una aplicación recubridora (diferenciable compleja). Ası́,
p. ej., la superficie de Riemann Q̃ de la aplicación logaritmo neperiano,
dotada de su proyección natural Π : Q̃ → C\{0}, puede verse como el
recubridor universal de C\{0}.
6.7.
Apéndice 2: Termodinámica
Consideramos los “estados de equilibrio” de un sistema termodinámico (simple) como puntos de una variedad5 M que, por sencillez, supondremos simplemente conexa.
Cada “proceso casiestático” de un estado p ∈ M a un estado q ∈ M
se modela por una curva diferenciable γ : [a, b] → M con γ(a) = p,
γ(b) = q. El parámetro de la curva no debe interpretarse como el
tiempo (los estados son de equilibrio). Como estaremos interesados en
circulaciones de formas, por la Proposición 6.5.1 no nos importará la
reparametrización de γ.
En cada proceso casiestático γ, el fı́sico es, en principio, capaz de
calcular el calor transferido Q y el trabajo realizado L por el sistema.
La independencia de Q y L con la reparametrización de γ sugiere que
ambos son circulaciones de formas diferenciales. La Proposición 6.5.2
permitirı́a calcular entonces estas formas. Postulamos entonces que exˆ y dL,
ˆ cuyas circulaciones a lo largo
isten dos formas diferenciales, dQ
de cualquier proceso casiestático γ proporcionan, respectivamente, Q
y L. Nótese que dˆ es sólo una notación, no representa diferenciales de
ˆ dL
ˆ ∈ Λ1 (M ). La notación simplemente sugiere que el
funciones, dQ,
calor o trabajo transferidos a lo largo del proceso γ se obtiene como
una circulación a lo largo de él.
ˆ dL
ˆ pueden ser arbitrarias, con la única
En principio, las formas dQ,
restricción de que en ningún punto se anulen. Sin embargo, existen
razones fı́sicas por las que se postula que su diferencia es exacta, esto
es:
(Primer Principio de la Termodinámica.) Existe una función U , la energı́a interna del sistema termodinámico, que
verifica:
ˆ − dL
ˆ = dU.
dQ
5
En esta sección reservamos la letra Q para el calor transferido por el sistema.
128
ˆ dL
ˆ no sean cerradas, se admite que dL
ˆ es expresable
Aunque dQ,
en términos de funciones con significado fı́sico sobre M , tı́picamente
ˆ = −P dV , donde P es la presión del sistema y V : M → (0, ∞)
dL
ˆ De nuevo, exisel volumen; ası́, 1/P es un factor integrante de dL.
ˆ también debe admitir un factor
ten razones fı́sicas para creer que dQ
integrante:
(Segundo Principio de la Termodinámica). La inversa de la
temperatura T del sistema fı́sico es un factor integrante de
ˆ esto es 1 dQ
ˆ es cerrada. Al ser M simplemente conexa,
dQ,
T
podemos escribir:
1ˆ
dQ = dS
T
para una función S sobre M , a la que se le llamará entropı́a
del sistema fı́sico.
Una consecuencia del Segundo Principio de la Termodinámica es el
“Teorema de Caratheodory”, la conclusión del cual puede admitirse
como un postulado alternativo al Segundo (“Postulado de Caratheodory”). Para analizarlo téngase en cuenta el siguiente resultado general
[AMR, Section 8.4.1]:
Teorema 6.7.1 Sea M simplemente conexa y α ∈ Λ1 (M ) tal que αp 6=
0, ∀p ∈ M . Equivalen:
(i) α admite un factor integrante.
(ii) Para ningún p ∈ M existe un entorno suyo U tal que el punto p
y cada q ∈ U puedan conectarse mediante una curva γ con α ◦ γ 0 ≡ 0.
[Es fácil comprobar (i) ⇒ (ii). De hecho, si h·α = df entonces α◦γ 0 ≡ 0
equivale a df ◦ γ 0 ≡ 0, esto es, f ◦ γ ≡ constante. Por tanto, mediante
curvas γ con α ◦ γ 0 ≡ 0 sólo podremos conectar p y q si f (p) = f (q).]
Una vez admitido el Segundo Postulado de la Termodinámica, el
Teorema de Caratheodory afirma:
Para todo estado p ∈ M existen estados arbitrariamente
próximos de p (esto es, una sucesión {pn }n → p, pn ∈
M − {p}, ∀n ∈ N) que son inaccesibles desde p por vı́a
adiabática (esto es, no existe ningún proceso casiestático γ
0
ˆ
entre p y pn tal que dQ(γ
(t)) ≡ 0).
Claramente, esta conclusión es una reformulación de (i) ⇒ (ii) en el
teorema anterior.
6.7. APÉNDICE 2: TERMODINÁMICA
129
Ejercicios
Ejercicio 1. Exprésese en coordenadas cilı́ndricas el campo tensorial
sobre R3 : T = xyzdx ⊗ dz ⊗ ∂/∂y.
Ejercicio 2. Pruébese que para toda función f sobre una variedad
diferenciable Q se verifica d(df ) = 0.
Ejercicio 3. Sean α, β ∈ Λ1 (Q), Ω ∈ Λ2 (Q), f ∈ C ∞ (Q) ≡ Λ0 (Q) y
sea F : Q0 → Q diferenciable. Definimos (véase también la Definición
8.5.6.) F ∗ α : T Q0 → R por
F ∗ α(vp0 ) = α(dFp0 (vp0 )),
∀vp0 ∈ Tp0 Q0 , ∀p0 ∈ Q0 ,
y, análogamente, F ∗ Ω : T Q0 × T Q0 → R. Demuéstrese:
(i) F ∗ α ∈ Λ1 (Q0 ), F ∗ Ω ∈ Λ2 (Q0 ).
(ii) F ∗ α ∧ F ∗ β = F ∗ (α ∧ β).
(iii) d(F ∗ α) = F ∗ dα, d(f ◦ F ) = F ∗ df .
(iv) si α es cerrada (resp. exacta), F ∗ α es cerrada (resp. exacta).
Ejercicio 4. Se considera la forma diferencial α = (xdy − ydx)/(x2 +
y 2 ) sobre R2 − {(0, 0)}. ¿Es α cerrada? ¿Es exacta?
Sea Π : R+ × R → R2 − {(0, 0)}, (ρ, θ) → (ρ cos θ, ρsenθ). En la
notación del ejercicio anterior, ¿es Π∗ α cerrada? ¿Es exacta?
Ejercicio 5. En R+ × R+ se considera la 1-forma diferencial α =
y
dx + 2dy. ¿Es α cerrada o exacta? ¿Admite un factor integrante?
x
Calcúlese su circulación a lo largo del rectángulo de extremos los puntos
(1, 1), (3, 1), (3, 2), (1, 2) en sentido de giro positivo.
Ejercicio 6. En todo R2 \{0} se considera la forma diferencial que,
en el dominio de definición de las coordenadas polares, se expresa como α = ρdθ + ρ2 dρ. Sea α̂ su restricción a la circunferencia unidad.
Determı́nese si α y α̂ son cerradas o exactas. Calcúlese la circulación
de ambas a lo largo de la curva γ(t) = (cos t, sent), t ∈ [0, 3π].
Ejercicio 7. En R2 \{0} se considera la forma diferencial
α=
x2
¡ 3
¢
1
(x + xy 2 − y)dx + (yx2 + y 3 + x)dy .
2
+y
Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es
α cerrada? ¿Es exacta?
130
Ejercicio 8. Sea Q la variedad formada por R2 ×]0, ∞[ menos el eje z,
y considérense las formas diferenciales α, β ∈ Λ1 (Q) que, en el dominio
de definición de las coordenadas cilı́ndricas, vienen dadas por:
α = ρsen(2θ)dρ + ρ2 cos(2θ)dθ +
1 2
ρ sen(2θ)dz,
2z
β = z α.
(i) ¿Son α y β cerradas? ¿Son exactas?
(ii) Calcúlese la circulación de ambas a lo largo de la curva
½
(cos t, sent, 1),
t ∈ [0, 2π]
γ(t) =
(1, 0, t − 2π + 1), t ∈ [2π, 2π + 2].
Ejercicio 9. En R2 \{0} se considera la forma diferencial
µ
¶
µ
¶
y
x
α= x− 2
dx + y + 2
dy.
x + y2
x + y2
Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es
α cerrada? ¿Es exacta?
Ejercicio 10. Determı́nense las posibles funciones f ∈ C ∞ (R4 ) para
que la forma diferencial sobre R4 , µ = (y + z + t)dx + (x + z + t)dy +
(x + y + t)dz + f dt, sea cerrada, y entonces muéstrese explı́citamente
que es exacta.
Capı́tulo 7
Campos tensoriales métricos
Cuando a cada espacio tangente Tp Q de una variedad Q se le fija un
producto escalar gp se tiene una variedad semi-riemanniana (en particular, riemanniana o lorentziana según el ı́ndice del producto escalar).
Puesto que gp determina un isomorfismo canónico entre Tp Q y su espacio dual, en este capı́tulo traduciremos las propiedades de las formas
diferenciales vistas en el capı́tulo anterior a campos vectoriales. En
particular, definiremos los campos conservativos e irrotacionales como
los asociados a formas exactas y cerradas, respectivamente. También
definiremos el concepto de variedades semi-riemannianas isométricas,
que permite decidir cuándo dos variedades semi-riemannianas tienen
todas sus propiedades iguales. Finalmente, anticipamos el concepto de
distancia asociada a una métrica riemanniana, que desarrollaremos más
ampliamente en el Capı́tulo ??.
7.1.
Concepto de métrica riemanniana y
lorentziana
Sea V (R) un espacio vectorial real y h·, ·i un tensor 2-covariante y
simétrico (métrica) sobre él. Por el Teorema de Sylvester es bien sabido
que existe una base B = (v1 , . . . , vs , vs+1 , . . . vr , vr+1 , . . . , vn ) de V tal
131
132
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
que
hvi , vj i = 0 si i 6= j

 −1 si i = 1, . . . , s
1 si i = s + 1, . . . , r
y hvi , vi i =

0 si i = r + 1, . . . , n.
A las bases en las que h·, ·i adopta esta expresión se les llama ortonormales. Los valores de s, r ∈ {0, 1, . . . , n} son independientes de la base
ortonormal escogida y reciben el nombre de ı́ndice y rango de h·, ·i,
respectivamente. Se dice que h·, ·i es:
(1) no degenerado o un producto escalar si r = n. Ello ocurrirá si y
sólo si la matriz asociada (hvi , vj i)i,j es regular (su determinante
es distinto de 0) para alguna base B = (v1 , . . . , vn ) de V (y, en
este caso, la matriz es regular para cualquier base).
Equivalentemente: si un vector v ∈ V verifica hv, wi = 0 para
todo w ∈ V , entonces necesariamente v = 0.
(2) un producto escalar euclı́deo si s = 0 y r = n, o equivalentemente: hv, vi ≥ 0 ∀v ∈ V , con igualdad si y sólo si v = 0. Por
tanto, h·, ·i es no degenerado y las bases ortonormales pueden
calcularse por el procedimiento clásico de ortonormalización de
Gram-Schmidt. Obsérvese que en este caso la matriz asociada a
una base ortonormal B = (v1 , . . . , vn ) es la identidad.
(3) un producto escalar lorentziano si n ≥ 2 y la matriz (hvi , vj i)i,j
es no degenerada y con ı́ndice s = 1. En este caso, para cualquier
base ortonormal B = (v1 , . . . , vn ) se tiene la matriz:


−1 0 . . . 0
 0



(hvi , vj i) =  ..
.
 .

Idn−1
0
Definiciones 7.1.1 Sea Q una variedad diferenciable. Llamaremos
campo tensorial métrico o, simplemente, métrica sobre Q a cualquier
campo de tensores 2-covariante simétrico g sobre Q. En este caso se
dice que la métrica g es:
7.1. MÉTRICAS RIEMANNIANAS Y LORENTZIANAS
133
(1) riemanniana si gp es un producto escalar euclı́deo de Tp Q para
todo p ∈ Q.
(2) lorentziana si gp es una producto escalar lorentziano de Tp Q para
todo p ∈ Q.
(3) semi-riemanniana si gp es un producto escalar de Tp Q con ı́ndice
s constante para todo p ∈ Q1 .
Según el caso, llamaremos al par (Q, g) variedad riemanniana, lorentziana
o semi-riemanniana, respectivamente.
En adelante todas las métricas que consideremos serán semi-riemannianas,
salvo especificación contraria.
Ejemplos:
(1) La métrica riemanniana usual de Rn es
n
X
g0 = dx ⊗ dx + · · · + dx ⊗ dx ≡
(dxi )2 .
1
1
n
n
i=1
Análogamente, la métrica lorentziana usual se define como
n
X
gL = −dx ⊗dx +dx ⊗dx +· · ·+dx ⊗dx ≡ −(dx ) + (dxi )2 .
1
1
2
2
n
n
1 2
i=2
(2) Sea S una subvariedad de Rn . Como Tp S es un subespacio de
Tp Rn para todo p ∈ S, la métrica usual g0 de Rn puede restringirse a Tp S para proporcionar un producto escalar euclı́deo gpS
sobre cada Tp S. Concretamente,
gpS : Tp S × Tp S → R
(v, w) 7→ g0 (v, w).
El campo de tensores g S sobre S ası́ determinado es una métrica
riemanniana. Esto ocurre, por ejemplo, en la esfera bidimensional S 2 ⊂ R3 (ası́ como en cualquier superficie de R3 ), sobre la
1
Si Q es conexa entonces la condición de que la métrica sea no degenerada
implica que el ı́ndice sea constante.
134
que se puede inducir la métrica usual de R3 . Con más generalidad, para cualquier variedad riemaniana (Q, g), su métrica
puede inducirse por restricción a cualquier subvariedad suya S,
generándose ası́ una nueva variedad riemanniana2 (S, g S ).
(3) Consideremos sobre R2 un campo de tensores arbitrario
g = g11 (x, y)dx2 + g12 (x, y)(dx ⊗ dy + dy ⊗ dx) + g22 (x, y)dy 2 .
Si el determinante
¯
¯ g11 (x, y) g12 (x, y)
¯
¯ g12 (x, y) g22 (x, y)
¯
¯
¯
¯
es distinto de 0 en todo punto de R2 entonces g es una métrica
semi-riemanniana. Si el determinante es mayor que 0 y g11 > 0 entonces g es riemanniana. Finalmente, si el determinante es menor
que 0 entonces g es lorentziana. Esto se mantiene aun cuando
(x, y) representaran las coordenadas de cualquier variedad bidimensional (en el abierto donde estén definidas). El criterio para
comprobar cuándo es riemanniana se generaliza fácilmente a dimensiones superiores (hállese como ejercicio).
(4) Consideremos dos variedades semi-riemannianas (Q, g), (Q0 , g 0 ).
Para la variedad producto Q×Q0 se tiene la identificación natural
T(p,p0 ) (Q × Q0 ) ≡ Tp Q × Tp0 Q0 , de modo que cada vector tangente
en (p, p0 ) se puede ver como un par (vp , vp0 0 ) ∈ Tp Q × Tp0 Q0 . De
modo natural, podemos considerar g y g 0 como tensores métricos
sobre Q × Q0 y definir
(g + g 0 )((vp , vp0 0 ), (wp , wp0 0 )) = g(vp , wp ) + g 0 (vp0 0 , wp0 0 ).
Por tanto, g + g 0 es una nueva métrica semi-riemanniana cuyo
ı́ndice es la suma de los ı́ndices de g y g 0 (en particular, si ambas
son riemannianas entonces g+g 0 también lo es). Si h, f ∈ C ∞ (Q×
Q0 ), h > 0, f > 0 entonces hg + f g 0 es también una métrica semiriemanniana.
2
Si la métrica de partida g fuera semi-riemanniana, habrı́a que tener la precaución de que el campo de tensores inducido g S sobre la subvariedad no degenerase
en ningún punto. Con esta restricción, (S, g S ) también es una nueva variedad semiriemanniana, aunque no necesariamente del mismo ı́ndice que (Q, g).
7.2. GRADIENTE DE UNA FUNCIÓN
135
Puede demostrarse que toda variedad diferenciable admite una métrica
riemanniana, usando particiones de la unidad (véase el Tema 8, Sección
8.2.4).
Ejercicio. Sean (Q, g) = (R, −dt2 ), (Q0 , g 0 ) = (S 3 , gS ), donde −dt2
es la métrica opuesta a la usual de R y gS es la métrica inducida por
(R4 , g0 ) sobre la esfera S 3 . Sea
f : R × S3 → R
(t, x) 7→ f (t),
f > 0,
y consideremos sobre R × S 3 la métrica:
g = −dt2 + f 2 (t)gS
(modelo cosmológico estándar de universo finito pero ilimitado de Robertson -Walker). Compruébese:
(1) En cada base Bp = (∂t , v̂1 , v̂2 , v̂3 ) del espacio tangente Tp (R×S 3 )
tal que B̂ = (v̂1 , v̂2 , v̂3 ) es ortonormal para gS , la métrica g tiene por
matriz asociada


−1 0
...
0




 0


.
 ..

2
 .

f (t) · Id3
0
(2) La métrica g es lorentziana. Constrúyase una base ortonormal
en cada punto.
(3) La restricción de la métrica lorentziana g a cada hipersuperficie
t ≡constante es una métrica riemanniana.
(4) Si S 1 = {(x, y, z, w) ∈ S 3 : z = w = 0} es el ecuador de
S 3 , entonces S = R × S 1 es una subvariedad de R × S 3 y la métrica
lorentziana g restringida a S también es lorentziana.
(5) Existen en R × S 3 subvariedades de dimensión 1 tales que g
restringida a cualesquiera de ellas es idénticamente nula.
7.2.
Gradiente de una función
En un espacio vectorial dotado de un producto escalar los isomorfismos bemol y sostenido permiten asociar a cada vector una forma
136
lineal, y viceversa (véase el Apéndice 1). Por tanto, si (Q, g) es una
variedad semi-riemanniana, se definen de manera natural la forma diferencial bemol X [ ∈ Λ1 (Q) y el campo sostenido α] ∈ X(Q) de un
campo X ∈ X(Q) y una forma diferencial α ∈ Λ1 (Q), respectivamente.
En coordenadas (U, q 1 , . . . , q n ), dichos campos tienen la expresión:
X=
n
X
Xi
i=1
α=
n
X
∂
,
∂q i
i
αi dq ,
X[ =
n
X
gij X i dq j .
i,j=1
]
α =
i=1
n
X
g ij αi
i,j=1
∂
.
∂q j
Estamos en condiciones de establecer la siguiente definición:
Definición 7.2.1 Sea (Q, g) una variedad semi-riemanniana. Para
cada f ∈ C ∞ (Q) definimos el campo vectorial gradiente de f , grad f ,
como el campo asociado a la diferencial de f por la métrica g:
grad fp = (dfp )]
∀p ∈ Q.
Por tanto, de la expresión por coordenadas obtenida anteriormente
para el campo sostenido se tiene:
grad f =
n
X
i,j=1
g ij
∂f ∂
.
∂q i ∂q j
Discutimos a continuación algunas propiedades del gradiente que
ayudan a comprender mejor su significado. Supongamos que la función
diferenciable f : Q → R presenta un valor regular c ∈ R (esto es,
dfp 6= 0 para todo p ∈ f −1 (c)). Sea S = f −1 (c) la correspondiente
subvariedad (hipersuperficie de nivel) asociada a f . Consideremos un
vector vp ∈ Tp S arbitrario y una curva γ en S cuya velocidad inicial
coincida con vp . Entonces,
g(grad fp , vp ) = dfp (vp ) =
d
d
|t=0 f ◦ γ(t) =
|t=0 c = 0.
dt
dt
Por tanto, al ser vp ∈ Tp S arbitrario, acabamos de probar que grad fp
es perpendicular a S en p.
7.3. CAMPOS CONSERVATIVOS E IRROTACIONALES
137
Más aún, cuando g es riemanniana y γ es una curva arbitraria en Q
(no necesariamente contenida en S) tal que γ(0) = p ∈ S, |γ 0 (0)k = 1,
entonces:
d
|t=0 f ◦ γ(t) = gp (grad fp , γ 0 (0)) = kgrad fp k · cos β,
dt
siendo β el ángulo que forman grad fp y γ 0 (0) según gp . En particular, si
γ 0 (0) apunta en la dirección de grad fp entonces cos β = 1 y la derivada
anterior es máxima. En resumen, grad fp es perpendicular a S en p y
apunta en la dirección de máxima variación de f , en sentido creciente,
con módulo igual a la máxima derivada.
7.3.
Campos conservativos e irrotacionales
Definiciones 7.3.1 Sea (Q, g) una variedad semi-riemanniana.
(i) Diremos que un campo vectorial X ∈ X(Q) es conservativo si
X = grad f para alguna función f ∈ C ∞ (Q), esto es, si X [ es
exacta (X [ = df ).
(ii) Diremos que un campo vectorial X ∈ X(Q) es irrotacional si X [
es cerrada, esto es, si la 2-forma rotacional dX [ es nula.
De estas definiciones y de las propiedades de las formas cerradas y
exactas (Sección 6.4) se tiene inmediatamente:
Proposición 7.3.2 (i) Si un campo X ∈ X(Q) es conservativo entonces es irrotacional.
(ii) Si un campo X ∈ X(Q) es irrotacional entonces es localmente
conservativo, esto es, para todo p ∈ Q existe un entorno suyo V y una
función f ∈ C ∞ (V ) tal que X = grad f en V .
Cuando Q es simplemente conexa entonces puede tomarse V = Q; por
tanto, para estas variedades los campos irrotacionales coinciden con
los conservativos.
Ejemplo. En R3 con su métrica usual consideremos un campo vectorial
X = X1
∂
∂
∂
+ X2
+ X3 .
∂x
∂y
∂z
138
∂
∂
∂
definido en un abierto U ⊆ R3 . Dado que el conjunto ( ∂x
, ∂y
, ∂z
) es
3
una base ortonormal en cada punto de R se tiene:
X [ = X 1 dx + X 2 dy + X 3 dz.
Un cálculo simple muestra entonces que la 2-forma rotacional vale:
¶
µ
∂X 3 ∂X 2
[
dX =
−
dy ∧ dz
∂y
∂z
µ
¶
µ
¶
∂X 3 ∂X 1
∂X 2 ∂X 1
+
dx ∧ dz +
dx ∧ dy.
−
−
∂x
∂z
∂x
∂y
Usando las coordenadas usuales de R3 podemos definir el rotacional de
X como el siguiente campo de vectores3 :
µ
¶
µ
¶
µ
¶
∂X 3 ∂X 2 ∂
∂X 3 ∂X 1 ∂
∂X 2 ∂X 1 ∂
Rot X =
−
−
−
+
−
.
∂y
∂z
∂x
∂x
∂z
∂y
∂x
∂y
∂z
(7.1)
Claramente, dX [ = 0 si y sólo si Rot X = 0. Ası́, si X está definido
en un abierto U simplemente conexo, (p. ej., todo U = R3 ), X es
conservativo si y sólo si Rot X = 0.
7.4.
Circulación de un campo vectorial a
lo largo de una curva
Sea X un campo vectorial sobre una variedad semi-riemanniana
(Q, g) y consideremos una curva diferenciable γ : [a, b] → Q. Se tienen
3
3
Para definir el rotacional de X estamos usando la base de campos usual de
R . Como veremos en el Tema 9, para definir Rot X en cada punto p, podemos
3
usar (7.1) reemplazando las coordenadas usuales de R (y sus correspondientes
campos vectoriales coordenados) por cualesquiera otras (q 1 , q 2 , q 3 ) que verifiquen:
3
(i) Bp = (∂/∂q 1 |p , ∂/∂q 2 |p , ∂/∂q 3 |p ) es una base ortonormal de Tp R , y (ii) Bp
está “positivamente orientada” respecto a la base Bp0 en p inducida por las coordenadas cartesianas usuales, esto es, el determinante de la matriz de cambio de
base entre Bp0 y Bp es positivo (por verificarse (i), el determinante será entonces
igual a 1). La construcción del campo vectorial Rot X es entonces generalizable
de manera inmediata a cualquier variedad riemanniana (Q, g) que esté orientada y
tenga dimensión 3. En dimensión superior no existe la interpretación del rotacional
como campo vectorial (véase también la Sección ?? para más detalles).
7.5. ISOMETRÍAS
139
entonces que Xγ(t) , γ 0 (t) ∈ Tγ(t) Q, y tiene sentido considerar la aplicación diferenciable
[a, b] → R
t 7→ g(Xγ(t) , γ 0 (t)).
Definición 7.4.1 Definimos la circulación de un campo X ∈ X(Q) a
lo largo de una curva diferenciable γ en Q como la integral
Z
b
g(Xγ(t) , γ 0 (t))dt.
(7.2)
a
Obsérvese que esta definición coincide con la circulación de X [ a lo
largo de γ, esto es:
Z b
[
Xγ(t)
(γ 0 (t))dt.
a
En particular, resulta independiente de la reparametrización de γ (Proposición 6.5.1).
Por otra parte, de las propiedades de la circulación de formas
cerradas y exactas (Sección 6.5) resultan inmediatas las propiedades
análogas para la circulación de campos irrotacionales y conservativos.
Ası́, si X es conservativo entonces la circulación de X a lo largo de
una curva depende sólo de los extremos de la curva. Concretamente, la
circulación de X = grad f a lo largo de la curva γ verifica
Z
b
g(X, γ 0 )dt = f (γ(b)) − f (γ(a)).
a
Esta propiedad caracteriza a los campos conservativos (Teorema 6.5.3).
Si X fuera irrotacional pero no conservativo entonces sólo podrı́amos
asegurar que la circulación de X a lo largo de dos curvas γ, ρ con los
mismos extremos coincide si γ y ρ son homotópicas.
7.5.
Isometrı́as
Definición 7.5.1 Sean (Q, g), (Q0 , g 0 ) dos variedades semi-riemannianas.
Diremos que una aplicación diferenciable F : Q → Q0 es una isometrı́a
(entre variedades semi-riemannianas) si
140
(i) F es un difeomorfismo,
(ii) F “preserva las métricas”, esto es,
gp (vp , wp ) = gF0 (p) (dFp (vp ), dFp (wp )), ∀vp , wp ∈ Tp Q, ∀p ∈ Q.
Observemos que la condición (ii) equivale a que la aplicación dFp :
Tp Q → TF (p) Q0 sea una isometrı́a vectorial entre (Tp Q, gp ) y (TF (p) Q0 ,
gF0 (p) ) para todo p ∈ Q. De dos variedades semi-riemannianas entre las
que existe una isometrı́a se dice que son isométricas. Todas las propiedades derivadas de la métrica (y, por supuesto, de la estructura de
variedad diferenciable -en particular las propiedades topológicas) que
verifique una variedad semi-riemanniana (Q, g) las verificarán también
todas las variedades isométricas a ella. Por tanto, las propiedades asociadas a la métrica en la variedad se conservan a través de la isometrı́a.
Dadas dos variedades semi-riemannianas resulta natural preguntarse cuándo son isométricas. Por ejemplo, consideremos la esfera S 2 ⊂
R3 , un cilindro C ⊂ R3 y un plano Π ⊂ R3 como variedades riemannianas. Dos a dos no son isométricas porque no son difeomorfas globalmente (de hecho, ni siquiera son homeomorfas): la esfera es compacta y
el resto no; el cilindro no es simplemente conexo mientras que la esfera
y el plano sı́ lo son. Sin embargo, un casquete abierto de una esfera
sı́ es difeomorfo a un disco, o a algunos abiertos de un cilindro (Figura
19).
Figura 19
7.6. DISTANCIA EN EL CASO RIEMANNIANO
141
Se puede demostrar que no existen abiertos de la esfera y del plano
que sean isométricos entre sı́. Por otra parte, todo abierto simplemente
conexo del cilindro es isométrico a algún abierto del plano. En la determinación de la posible existencia de isometrı́as desempeña un papel
esencial el tensor de curvatura, que estudiaremos más adelante.
7.6.
Distancia asociada a una métrica riemanniana
Sea (Q, g) una variedad riemanniana y sea γ : [a, b] → Q una curva
diferenciable. Definimos la longitud de γ como
Z b
Z bq
0
gγ(t) (γ 0 (t), γ 0 (t))dt.
L(γ) =
kγ (t)kdt =
a
a
El concepto de longitud de una curva que acabamos de introducir sugiere la siguiente definición de distancia. Dada una variedad riemanniana
conexa (Q, g) y dos puntos p, q ∈ Q, definimos la distancia entre ellos
como:
dg (p, q) = Infγ {L(γ) : γ : [a, b] → Q, γ(a) = p, γ(b) = q}.
Aunque las propiedades de la función distancia se verán con más detalle
en el Capı́tulo ??, anticipamos ahora las dos siguientes:
(1) La aplicación dg : Q × Q → [0, ∞) es una distancia “abstracta”,
esto es, verifica las propiedades de una distancia definidas en
[Sección 1.6, Definición 1.6.1].
(2) La topologı́a asociada a la distancia dg en Q coincide con la
topologı́a de (Q, g) como variedad.
Como acabamos de ver, toda variedad riemanniana conexa (Q, g) tiene
asociado un espacio métrico (Q, dg ) que, en general, puede o no ser
completo. Por otra parte, dos variedades riemannianas isométricas son
también isométricas como espacios métricos. En particular, tendrán el
mismo diámetro, que se define (como en cualquier espacio métrico):
diam(Q) = Sup{dg (p, q) : p, q ∈ Q} ∈ [0, ∞].
142
Una cuestión que surge de manera natural es la siguiente: dados
dos puntos p, q ∈ Q, ¿existe alguna curva que conecte p y q y que
tenga longitud igual a dg (p, q)? La respuesta a esta pregunta (que es
afirmativa siempre localmente, y que lo es globalmente cuando (Q, dg )
es completo) se obtiene en términos de geodésicas, tal y como veremos
en el Tema ??.
7.7.
Apéndice 1: aplicaciones bemol y sostenido
En general, cada producto escalar h·, ·i induce un isomorfismo canónico
entre V (R) y V ∗ (R). En efecto,
Definición 7.7.1 Llamamos aplicación bemol [ (“bajar ı́ndices”) entre V (R) y V ∗ (R) asociada al producto escalar h·, ·i a la aplicación
[: V →V∗
v 7→ v [ ≡ hv, ·i,
donde
hv, ·i : V → R
w 7→ hv, wi.
Teorema 7.7.2 (1) La aplicación bemol [ es un isomorfismo entre los
espacios vectoriales V (R) y V ∗ (R).
(2) La aplicación inversa ] de [, conocida como aplicación sostenido
(subir ı́ndices), queda caracterizada por la relación hφ] , wi = φ(w),
∀φ ∈ V ∗ , ∀w ∈ V .
Demostración. (1) La linealidad es inmediata. Para la inyectividad
nótese que son equivalentes: (i) [ tiene núcleo 0, (ii) el tensor métrico
h·, ·i es no degenerado.
(2) En efecto, (φ] )[ (w) = hφ] , wi = φ(w) ∀w ∈ V . Además, esta
igualdad caracteriza a φ] por ser h·, ·i no degenerada. 2
Para dar sus expresiones en coordenadas consideremos una base B =
(v1 , . . . , vn ) de V (R) y su correspondiente base dual B ∗ = (φ1 , . . . , φn ).
7.7. APÉNDICE 1: BEMOL Y SOSTENIDO
Pn
Entonces podemos suponer que v =
Ahora bien, aj = v [ (vj ) = hv, vj i y
i=1
ai vi ∈ V y v [ =
n
X
[
aj = v (vj ) = hv, vj i =
143
Pn
j=1
gij ai ,
aj φj .
(7.3)
i=1
P
donde gij = hvi , vj i. Por tanto, v [ = ni,j=1 ai gij φj . Si denotamos por
(g ij )i,j la matriz inversa de (gij )i,j entonces multiplicando ambos miembros de la igualdad (7.3) por g jk y sumando en j obtenemos:
k
a =
n
X
aj g jk
j=1
En conclusión, si φ =
entonces
Pn
i
i=1 bi φ
]
φ =
∈ V ∗ y suponemos φ] =
n
X
bi g ij vj .
Pn
j=1
b j vj
(7.4)
i,j=1
Observación: Si h·, ·i es euclı́dea y B es una base ortonormal entonces
aj = aj para todo j ∈ {1, . . . , n}. (En el caso lorentziano la única
diferencia es a1 = −a1 ).
Este isomorfismo entre V (R) y V ∗ (R) induce isomorfismos entre tensores tipo (2, 0), (0, 2) y (1, 1) (y, en general, entre tensores tipo (r, s)
y (r0 , s0 ) con r + s = r0 + s0 ). Por ejemplo, supongamos que T es un
tensor (2, 0) y queremos construir a partir de él un tensor T̂ que sea
(0, 2). Entonces basta con definir T̂ (φ, ψ) := T (φ] , ψ ] ). Obsérvese que
la relación correspondiente en coordenadas queda:
T =
n
X
tij φi ⊗ φj ,
T̂ =
i,j=1
donde
tij =
n
X
k,l=1
n
X
tkl vk ⊗ vl ,
k,l=1
kl
gik gjl t ,
kl
t =
n
X
g ki g lj tij .
i,j=1
Además, si el producto escalar es euclı́deo y la base B ortonormal
entonces tij = tij , para todo i, j ∈ {1, . . . , n}.
144
Finalmente, recordemos que para tensores (1, 1) habı́amos definido
su traza mediante la del endomorfismo asociado, [Capı́tulo 6, Subsección 6.1.1]. Puesto que usando un producto escalar euclı́deo g podemos
asignar unı́vocamente a cada tensor 2-covariante o 2-contravariante
un tensor (1, 1), ahora también es posible definir una traza para estos tensores.
Ası́, por ejemplo, la traza de un tensor de tipo (2, 0)
Pn
T = i,j=1 tij ϕi ⊗ ϕj es:
trazag T =
n
X
i=1
tii
,
siendo
tij
=
n
X
g ik tkj .
k=1
Esto es fácilmente generalizable a tensores de tipo superior (“contracción” de tensores en un ı́ndice covariante y otro covariante -sin necesidad de g- y contracción de tensores en dos ı́ndices covariantes o dos
contravariantes -con ayuda de g).
7.8.
Apéndice 2: M. Lagrangiana frente a
Hamiltoniana
En este apéndice comentaremos la relación existente entre el formalismo lagrangiano, introducido en el apéndice del Capı́tulo 3, y el formalismo hamiltoniano, del que dimos algunos elementos en la nota final
de la Sección 4.2. Esencialmente desarrollaremos las siguientes ideas:
(1) cualquier lagrangiana L : T Q × R → R, a cada instante t fijo,
define de manera natural una aplicación (no necesariamente lineal)
Tp Q → Tp Q∗ para cada p y, por tanto, una aplicación T Q → T Q∗ ;
cuando ésta es un difeomorfismo, la lagrangiana se dice hiper-regular,
(2) las lagrangianas tı́picas L = T − V , donde T es la “energı́a
cinética” asociada a una métrica semi-riemanniana g, y V un potencial,
no sólo son hiper-regulares, sino que la aplicación que inducen entre
T Q y T Q∗ coincide con el bemol para g, independientemente de t,
(3) para cualquier lagrangiana hiper-regular, el difeomorfismo asociado T Q × R → T Q∗ × R se expresa en coordenadas (q, q̇, t) →
(q, p(q, q̇, t), t), con pi = ∂L/∂ q̇ i ; además las coordenadas en T Q × R
se inducen T Q∗ × R, y viceversa, y
(4) cuando, fijada una función L(= Lp,t ) sobre un espacio vectorial
se toman como nuevas coordenadas las derivadas parciales de L, resulta
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
145
conveniente introducir una nueva función, la transformada de Legendre
de L, que admite una interpretación geométrica natural.
Aplicación entre V y V ∗ asociada a una función sobre V
Sea V (R) un espacio vectorial, B = (v1 , . . . , vn ) una base suya,
∗
B = (φ1 , . . . , φn ) su correspondiente base dual y (x1 , . . . , xn ) (resp.
(p1 , . . . , pn )) las coordenadas sobre todo V (resp V ∗ ) inducidas por B
(resp. B ∗ ).
Sea f : V → R una aplicación diferenciable (no necesariamente
lineal) y consideremos su diferencial como una aplicación entre V y
V ∗ . Es decir,
Df : V → V ∗
u 7→ Dfu
donde Dfu : V → R coincide con la diferencial dfu : Tu V → Tf (u) R ≡ R
salvo por la identificación natural de Tu V con V . Por tanto,
Dfu =
n
X
∂f
(u)φi ,
i
∂x
i=1
o, directamente en las coordenadas introducidas,
Df (x1 , . . . , xn ) = (p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn )),
siendo
∂f 1
(x , . . . , xn ), i = 1, . . . , n.
i
∂x
Si calculamos la diferencial de Df en u0 ∈ V , se obtiene que su
matriz en las coordenadas introducidas coincide con la matriz hessiana
∂ 2 f /∂xi ∂xj en u0 . Si ésta es regular, el Teorema de la Función Inversa permite escoger entornos apropiados de u0 y Dfu0 para los que la
restricción de la aplicación Df es un difeomorfismo.
Supongamos para simplificar que Df es un difeomorfismo global entre V y V ∗ . En este caso las coordenadas (p1 , . . . , pn ) (resp. (x1 , . . . , xn ))
sobre V ∗ (resp. V ), compuestas con Df (resp. (Df )−1 ) generan unas
nuevas coordenadas en V (resp V ∗ ), y las funciones
pi (x1 , . . . , xn ) =
(p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn ))
(resp. (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))) sirven para denotar tanto la
aplicación Df (resp. (Df )−1 ), como el cambio de coordenadas en V (resp. V ∗ ) entre (x1 , . . . , xn ) y (p1 , . . . , pn ) (resp. (p1 , . . . , pn ) y (x1 , . . . , xn )).
146
Ejercicios. (1) Sean a, b, c, d, e, f ∈ R y definamos f : R2 → R por
f (x, y) = ax2 + 2bxy + cy 2 + dx + ey + f,
∀(x, y) ∈ R2 .
Calcúlese Df : R2 → R2∗ y pruébese que es un difeomorfismo global si
y sólo si
¯
¯
¯ a b ¯
¯
¯
¯ b c ¯ 6= 0.
(2) Sea g un producto escalar sobre el espacio vectorial V (R), y sea
Eg : V → R la aplicación Eg (u) = g(u, u)/2, ∀u ∈ V . Pruébese que
DEg coincide con la aplicación bemol asociada a g.
Lagrangianas regulares. Momentos generalizados
Consideremos en Mecánica Lagrangiana un espacio de configuración
Q (≡ (q 1 , . . . , q n )), el correspondiente espacio de estados T Q (≡ (q 1 , . . . ,
q n , q̇ 1 , . . . , q̇ n )), y una lagrangiana
L : TQ × R → R
(q , . . . , q , q̇ 1 , . . . , q̇ n , t) 7→ L(q, q̇, t).
1
n
Fijado (p0 , t0 ) ∈ Q × R podemos considerar la aplicación
Tp0 Q → R
vp0 7→ L(vp0 , t0 ),
(7.5)
esto es,
(q̇ 1 , . . . , q̇ n ) 7→ L(q 1 (p0 ), . . . , q n (p0 ), q̇ 1 , . . . , q̇ n , t0 ).
Como vimos en el apartado anterior, esta aplicación (de V = Tp Q a
R) induce otra con codominio el dual:
Leg(p0 ,t0 ) : Tp0 Q 7→ Tp0 Q∗
vp0 7→ v̂p0 ,
que viene definida por la diferncial, esto es:
v̂p0 : Tp0 Q → R
|
(vp0 + swp0 , t0 ).
wp0 7→ dL
ds s=0
Diremos que la lagrangiana L es regular en (p0 , t0 ) si Leg(p0 ,t0 ) es un
difeomorfismo local, esto es, si su diferencial es biyectiva en todo punto.
147
Nótese que fijado cualquier entorno coordenado (U, q 1 , . . . , q n ) de p0 la
matriz de la diferencial de Leg(p0 ,t0 ) en cada vp0 ∈ Tp0 Q resulta ser
µ 2
¶
∂ L
(vp , t0 )
,
∂ q̇ i ∂ q̇ j 0
i,j
por lo que L es regular en (p0 , t0 ) si y sólo si esta matriz (para unas
coordenadas alrededor de p0 y, por tanto, para cualesquiera) es regular
en todo vector vp0 tangente a p0 . Diremos que L es regular si es regular
en todo (p0 , t0 ) ∈ Q × R. En adelante, supondremos por simplicidad
la condición algo más fuerte de que L sea hiper-regular, esto es, que
Leg(p0 ,t0 ) sea un difeomorfismo (no sólo local, sino global) ∀(p0 , t0 ) ∈
Q × R. Por tanto, en este caso se tiene el difeomorfismo:
Leg : T Q × R → T Q∗ × R
(vp , t) 7→ (v̂p = Leg(p,t) (vp ), t).
(7.6)
Ejercicio. Sea (Q, g) una variedad semi-riemanniana y consideremos
la lagrangiana
L : TQ × R → R
(vp , t) 7→ 12 gp (vp , vp ) − V (p, t)
(7.7)
para cierta función V : Q × R → R (potencial). Demuéstrese que,
independientemente del valor de t, la aplicación Leg correspondiente
coincide con la aplicación bemol [ : T Q → T Q∗ , vp 7→ vp[ (en particular, L es hiper-regular).
Obsérvese que, al componer con el difeomorfismo Leg, las coordenadas
pi en T Q∗ sirven también como coordenadas de TQ; esto es, para cada
t ∈ R podemos usar como coordenadas de T Q:
(q 1 , . . . , q n , p1 :=
∂L
∂L
,
.
.
.
,
p
:=
).
n
∂ q̇ 1
∂ q̇ n
A estas nuevas coordenadas pi se les llama momentos generalizados.
Nótese que cada vector vp y su imagen
P v̂p por Leg tienen las mismas
coordenadas pi . De hecho, si wp = ni=1 wpi ∂∂q̇i |p entonces
v̂p (wp ) =
n
X
∂L
(q(p), q̇(vp ), t)wpi
i
∂
q̇
i=1
148
y, por tanto,
v̂p =
n
X
i=1
n
n
X ∂L
X
∂
i
(q(p),
q̇(v
),
t)dq
=
pi (vp , t)dqpi .
v̂p ( i |p )dqpi =
p
p
i
∂q
∂
q̇
i=1
i=1
Remarquemos que si tomamos coordenadas q ≡ (q 1 , . . . , q n ), una
expresión del tipo L(q, p, t) puede denotar, indistintamente: (a) la función lagrangiana L : T Q × R → R escrita en las coordenadas sobre
T Q que se obtienen componiendo Leg con las coordenadas (q, p, t) de
T Q∗ × R o (b) la función L◦Leg−1 : T Q∗ × R → R escrita en coordenadas (q, p, t). Análogamente, componiendo con Leg−1 las coordenadas
(q̇ 1 , . . . , q̇ n ) se pueden usar en T Q∗ , por lo que, para una función hamiltoniana H : T Q∗ × R → R, la expresión H(q, q̇, t) puede denotar tanto
a la función H en las coordenadas inducidas por Leg−1 como la función
H◦Leg en las coordenadas naturales de T Q × R.
La transformada de Legendre
Consideremos de nuevo el espacio vectorial V (R) y las bases B, B ∗ .
Obsérvese que en V (R) se puede definir el campo de vectores radial ρ
que a cada vector u ∈ V le hace corresponder
propio vector u visto
Pn el
i
como un elemento de Tu V ; esto es, ρ = i=1 x ∂/∂xi .
Sea f : V → R tal que Df : V → V ∗ es un difeomorfismo. La
transformada de Legendre de f se define como la aplicación L[f ] :
V ∗ → R dada por:
L[f ](φ) = (f − ρ(f )) ◦ (Df )−1 (φ),
Si φ =
Pn
i=1
∀φ ∈ V ∗ .
pi φi entonces el vector (Df )−1 (φ) tiene coordenadas
(x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))
y escribiendo directamente f, L[f ] sobre las coordenadas de u, φ:
L[f ](p1 , . . . , pn ) = f (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))
−
n
X
xi (p1 , . . . , pn )pi
(7.8)
i=1
Geométricamente, la interpretación de L[f ] es la siguiente. Dada una
forma lineal φ : V → R podemos considerar su grafo en V × R, que
149
será un hiperplano {(u, φ(u)) : u ∈ V } que pasa por el origen. Desplazando paralelamente este hiperplano podemos construir un hiperplano
tangente a la gráfica de la función f : V → R en un (único) punto
(uφ , f (uφ )). La ordenada en el origen de este hiperplano coincide con
L[f ](φ).
El principal interés geométrico de la transformada de Legendre
aparece cuando, por alguna razón, resulta conveniente usar como coordenadas las derivadas parciales de una función4 f . Si conocemos la función f (p1 , . . . , pn ) pero no el difeomorfismo Df entonces, en principio,
no podemos recuperar la función original f (x1 , . . . , xn ). Sin embargo,
si conocemos L[f ] podemos recuperar la gráfica de f como la hipersuperficie envolvente a todos los hiperplanos Hφ = {(u, φ(u) + L[f ](φ)) :
u ∈ V } obtenidos variando φ ∈ V ∗ . Se dice entonces que la transformada de Legendre de f “conserva la información” de f (al menos bajo
la hipótesis de que Df sea un difeomorfismo).
Ejercicio. (1) Se considera la función f : R → R, f (x) = x2 + 3x + 2.
(a) Calcúlese Df y compruébese que es un difeomorfismo.
(b) Calcúlese f ◦ (Df )−1 y L[f ].
(c) Sea h : R → R tal que Dh es un difeomorfismo. Compruébese:
(i) L[h] = L[f ] ⇒ h = f , (ii) existe una función h 6= f tal que
f ◦ (Df )−1 = h ◦ (Dh)−1 .
(2) Repı́tanse los puntos anteriores para f : R2 → R, f (x, y) = 2xy −
3x + 4y − 1.
La hamiltoniana como transformada de Legendre
Consideremos ahora una lagrangiana hiper-regular L. Como hemos
visto, tenemos asociado un difeomorfismo Leg entre el dominio T Q×R
de L y el dominio T Q∗ × R de las funciones hamiltonianas. Llevando a
cabo la transformada de Legendre de Leg(p0 ,t0 ) en cada (p0 , t0 ) ∈ Q × R
y cambiando el signo, generamos una función
H : T Q∗ × R → R
4
P. ej., esto ocurre frecuentemente en Termodinámica, donde las parciales de la
energı́a interna U con respecto a la entropı́a S y el volumen V son, respectivamente,
la temperatura T y la opuesta de la presión −P . P y T pueden resultar mucho más
fáciles de medir que V y (por supuesto) que S.
150
que, expresada en coordenadas, se define por:
H(q, p, t) =
n
X
pi q̇ i (q, p, t) − L(q, p, t).
(7.9)
i=1
Se dice entonces que la función H es la función hamiltoniana asociada
a la lagrangiana (hiper-regular) L.
Es bien conocido que si γ(t) ≡ (q(t)) es una curva en Q para la
cual se verifican las ecuaciones de Euler-Lagrange para L (γ es una
curva crı́tica de L ante variaciones de las q’s con extremos fijos), entonces Leg ◦γ 0 (t) = γ̂ 0 (t) ≡ (q(t), p(t)) es una curva en T Q∗ que verifica las ecuaciones de Hamilton para H (Leg ◦γ 0 (t) es una curva crı́tica
de H ante variaciones de las q y las p con extremos fijos). Por tanto, la Mecánica Lagrangiana puede verse (al menos para lagrangianas
hiper-regulares, como las del tipo (7.7)) como un caso particular de la
Hamiltoniana.
Nota sobre el Teorema de Noether
Sea Q una variedad y L una lagrangiana hiper-regular que, para
simplificar, supondremos también independiente de t (eventualmente,
t podrı́a considerarse como una coordenada más de Q). Sea Φ un
grupo uniparamétrico de difeomorfismos de Q con generador infinitesimal X Φ ∈ X(Q), y consideremos la forma diferencial asociada a X Φ ,
X̂ Φ = Leg ◦ X Φ : Q → T Q∗ . Supongamos que L es invariante por
Φ (véase la Sección 5.5); el Teorema de Noether afirma entonces que
sobre cada curva crı́tica γ(t) de la lagrangiana (aquélla que satisface
las ecuaciones de Euler-Lagrange) la función
X̂ Φ (γ 0 (t))
(7.10)
es constante (independiente de t). Esto es, (7.10) es una cantidad conservada a lo largo de la curva γ. Si L es una tı́pica lagrangiana
1
L(vp ) = gp (vp , vp ) − V (p),
2
(7.11)
esta cantidad conservada se puede escribir directamente a partir de X φ
en términos de la métrica:
X̂ Φ (γ 0 ) = g(X Φ , γ 0 ) ≡ constante[γ].
(7.12)
151
Ejemplo. Considérese una lagrangiana del tipo (7.11) para (R3 , g0 )
que sea invariante por un grupo uniparamétrico de difeomorfismos Φ.
No es difı́cil comprobar:
(a) Si Φ es el grupo de traslaciones según el eje z de R3 (esto es,
Φs (x, y, z) = (x, y, z + s), ∀x, y, z, s ∈ R) entonces X Φ = ∂/∂z,
y la cantidad conservada (7.12) para cada curva crı́tica γ(t) =
(x(t), y(t), z(t)) es ż(t) (o momento lineal según el eje z).
(b) Si Φ es el grupo de rotaciones según el eje z (definido en el ejemplo de la Sección 5.5) entonces X Φ = −y∂/∂x + x∂/∂y, y la correspondiente cantidad conservada es el momento angular según
dicho eje x(t)ẏ(t) − y(t)ẋ(t).
Ejercicios
Ejercicio 1. Sea V (R) un espacio vectorial real de dimensión 3, B =
(v1 , v2 , v3 ) una base ordenada suya y B ∗ = (φ1 , φ2 , φ3 ) su base dual. Se
consideran los tensores métricos g, g 0 sobre V definidos por sus matrices
en B:




2 1 0
1 0
0
MB (g) =  1 1 0  ,
MB (g 0 ) =  0 −3 0 
0 0 3
0 0 −1
Compruébese que g y g 0 son productos escalares y determı́nense sus
ı́ndices. Calcúlese para cada uno v [ , φ] , siendo v = 2v1 + v2 + v3 y
φ = φ1 − 3φ2 + φ3 .
Ejercicio 2. Se considera en R3 la métrica riemanniana usual y una
función f : R3 → R. Calcúlense las coordenadas de grad f en los campos coordenados inducidos por las coordenadas cartesianas, cilı́ndricas
y esféricas.
Ejercicio 3. Se considera sobre R2 el campo de tensores métrico
g = 2ex dx2 + 2senydxdy + e−x dy 2
(≡ 2ex dx ⊗ dx + seny(dx ⊗ dy + dy ⊗ dx) + e−x dy ⊗ dy).
(a) ¿Es g una métrica riemanniana? Calcúlese, si es posible, una base
de campos que sea ortonormal en todo punto.
152
(b) ¿Cuáles de los siguientes campos son conservativos?
(b1) Los campos coordenados ∂x , ∂y .
(b2) El campo vectorial
Z=
¡ −x
¢
1
x
(e
−
seny)∂
+
(2e
−
seny)∂
.
x
y
2 − sen2 y
Ejercicio 4. Para la variedad semi-riemanniana del problema anterior, calcúlense los campos vectoriales X = (dx)] , Y = (dy)] . Determı́nense las circulaciones de X e Y a lo largo de la curva γ(t) =
(et sen(πt), t3 ), t ∈ [0, 1].
Ejercicio 5. En R2 \{0} con la métrica usual se consideran los campos
X=p
1
x2
+ y2
(x∂x + y∂y ) ,
Y = (−y∂x + x∂y ) .
¿Son conservativos? (Resuélvase trabajando tanto en coordenadas cartesianas como en polares.)
Ejercicio 6. Se considera en R2 la métrica lorentziana g = dx2 −
e2x dy 2 . Calcúlense todos los puntos de R2 que pueden conectarse con
(0, 0) mediante una curva “luminosa” γ, esto es, que verifica γ 0 (t) 6=
0, g(γ 0 (t), γ 0 (t)) = 0 para todo valor de t.
Ejercicio 7. Se considera en R3 la métrica g = −ex+y (dx ⊗ dy + dy ⊗
dx) + exy dz 2 . ¿Es g riemanniana o lorentziana? Calcúlese la circulación
de ∂/∂y a lo largo de la curva
γ(t) = (1, cos t, t),
t ∈ [0, π].
Ejercicio 8. Se considera en R3 la métrica
g = exy dx2 − dx ⊗ dy − dy ⊗ dx + 2e−xy dy 2 + 4dz 2 .
¿Es g riemanniana? Sea f = xy + yz + zx. Calcúlese grad f y su
circulación a lo largo de la curva
γ(t) = (t/2, tet , sen2 2t),
t ∈ [0, π].
Ejercicio 9. Se considera sobre R × R+ el campo de tensores métrico
g = 2y 2 dxdy.
153
(i) ¿Es g riemanniana? ¿Es lorentziana?
(ii) Se consideran las nuevas coordenadas (u, v) sobre R×R+ definidas
por el cambio de cartas:
u = (x + y)/2,
v = (x − y)/2.
Obténgase la expresión de g en las coordenadas (u, v).
(iii) Se considera el campo vectorial X = A(x, y)∂x , siendo A(x, y)
una función sobre R × R+ . Determı́nense todas las posibles funciones A(x, y) para las que X sea conservativo.
(iv) Determı́nese un campo vectorial Y y una curva γ sobre R × R+
de modo que la circulación de Y a lo largo de γ sea igual a 2π +1.
Ejercicio 10. En R3 se consideran la métrica riemanniana usual g1 ,
la métrica lorentziana usual g2 , y la métrica
g3 = −dx2 − dy 2 + dz 2 .
Calcúlese el gradiente de las funciones f1 = x y z 2 y f2 = z ex y respecto
de las tres métricas.
154
Capı́tulo 8
Integración en Variedades
En este tema generalizaremos la integración usual (de Riemann o
Lebesgue) en Rn a una variedad diferenciable arbitraria. Este problema admite esencialmente dos enfoques, a priori muy distintos: a partir
de integración de n−formas (en variedades orientadas) y a partir de
la definición directa de una medida (variedades semi-riemannianas).
La primera aproximación es la que nos será más útil para el próximo tema, con múltiples aplicaciones prácticas. La segunda, empero,
también presenta ventajas: la delimitación clara del tipo de funciones
objeto de integración, que permite definir espacios de funciones “completos” de dimensión infinita, con múltiples relaciones y aplicaciones a
otras partes de la Matemática y Fı́sica.
Tras una primera motivación de los conceptos (Sección 8.1, Subsección 8.2.1), desarrollaremos en primer lugar la integración de n−formas
en variedades orientadas (Sección 8.2). La introducción de este concepto es progresiva, razonándose la cada vez mayor generalidad de
n−formas a las que se puede aplicar el concepto de integración. El resultado final se obtiene en la Subsección 8.2.4, donde se introducen las
particiones de la unidad. Este concepto requiere cierta dosis de abstracción y soltura en topologı́a, pero es importante en sı́ pues permite extender globalmente multitud de elementos definibles localmente sobre
una variedad (de hecho, esto se requerirá para la prueba del Teorema
de Stokes, en el próximo tema). No obstante, en la integración práctica
155
156
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
de una n−forma concreta se suele evitar su uso, como justificamos en
la Subsección 8.2.3.
Los elementos técnicos se desarrollan en los apéndices. Concretamente, en los Apéndices 8.5 y 8.6 se desarrollan sucintamente los elementos necesarios de álgebra de tensores antisimétricos para la integración de n−formas. En el Apéndice 8.7 se estudia el concepto de
orientación en variedades, e introducimos el concepto topológico de
espacio recubridor, que aplicamos para mostrar la existencia de un recubridor orientable.
En la Sección 8.3, definiremos la integral de una función respecto
a un elemento de volumen. Puesto que toda métrica semi-riemanniana
sobre una variedad orientada tiene canónicamente asociada un elemento de volumen, ello permite hablar de integración de funciones en variedades semi-riemannianas orientadas. Más aún, esta integración resulta
ser independiente de la orientación; de hecho, se puede extender a variedades semi-riemannianas cualesquiera (incluyendo las no-orientables).
Ello sirve como motivación a la Sección 8.4, aunque esta sección
puede leerse con independencia del resto. En ella se define un espacio
de medida sobre cualquier variedad semi-riemanniana, y la integración
de funciones sobre variedades se recupera como un caso particular de
la integración de funciones sobre un espacio de medida, en analogı́a
directa con la integración de Lebesgue en Rn .
8.1.
Motivación
Cuando se integra una función real f : U ⊆ Rn → R, se supone,
explı́cita o implı́citamente, que se sabe cómo “medir” subconjuntos
apropiados del dominio, derivándose este concepto de la estructura
peculiar de R. Ası́, para la integral de Riemann, las sumas (superiores,
inferiores) de su construcción parten del concepto de longitud de los
subintervalos y, a partir de él, de volumen de los n−rectángulos en
que se subdivide el dominio U . En la integral de Lebesgue se parte
explı́citamente del concepto de medida (construida de nuevo a partir
del concepto de longitud y volumen de intervalos y n−rectángulos)
para subconjuntos muy generales de Rn .
Este hecho debe tenerse presente para cualquier intento de definición de integración sobre una variedad. De hecho, no podremos definir
8.1. MOTIVACIÓN
157
la integración de una función hasta que no tengamos algún modo de
“medir el volumen” de subconjuntos apropiados de la variedad. Ası́,
nuestros objetivos serán: (1) abstraer primero qué significa “medir
el volumen” sobre la variedad, lo que conduce a la integración de
n−formas diferenciales, y a la integración de una función respecto
a un elemento de volumen, y (2) mostrar cómo una métrica semiriemanniana produce un modo canónico de medir volúmenes, lo que
conduce a la integración de funciones sobre variedades semirriemannianas.
Para entender mejor las futuras definiciones, conviene tener presente los siguientes aspectos de Geometrı́a elemental:
Determinante y volumen de n−paralelepı́pedos en Rn . Si se tienen
n vectores independientes {v1 , . . . , vn } en Rn se sabe por geometrı́a elemental que det0 (v1 , . . . , vn ) (el determinante de la matriz de coordenadas de (v1 , . . . , vn ) en la base usual) es, salvo signo, igual al volumen del n-paralelepı́pedo que generan. Más aún,
existen populares reglas prácticas para n = 2, 3 que permiten determinar el signo de det0 (v1 , . . . , vn ) (regla del sentido inverso del
giro de las agujas del reloj, regla del sacacorchos). Obsérvese que
det0 puede verse como un tensor antisimétrico n−covariante no
nulo sobre Rn o “elemento de volumen”. De hecho, para n = 2,
det0 = φ10 ∧ φ20 , donde (φ10 , φ20 ) es la base dual de la usual de R2 .
Por otra parte, podemos afirmar que, salvo signo (determinable
por las reglas prácticas aludidas), el producto escalar usual de Rn
determina al elemento de volumen det0 . Ası́, puede comprobarse
con facilidad para n = 2 que det0 = ±φ1 ∧ φ2 , donde (φ1 , φ2 )
es la base dual de cualquier base ortonormal de R2 . Y, para n
arbitrario, el valor de det0 (v1 , . . . , vn ) coincide, salvo signo, con
el del determinante de la matriz de coordenadas de (v1 , . . . , vn )
en cualquier base ortonormal.
En resumen, se sugieren ası́ las relaciones
Volumen de n−paralelepı́pedos ←→ elementos de volumen.
Producto escalar + fijación de signo =⇒ elemento de volumen .
Integración en superficies de Rn . Consideremos una superficie S
de R3 , obtenida como un grafo, S = {(x, y, z(x, y)) : (x, y) ∈ D}.
158
Fijemos (x0 , y0 ) ∈ D, z0 = z(x0 , y0 ), y sea R el rectángulo de
vértices (x0 ± ∆x/2, y0 ± ∆y/2). En primer orden, el área ∆A
de la porción de superficie S que se proyecta sobre R se puede
aproximar por el área dA del paralelogramo en el plano tangente
T(x0 ,y0 ,z0 ) S ⊂ R3 que se proyecta sobre R. Clásicamente, esta área
se calcula por:
s
µ ¶2 µ ¶2
dxdy
∂z
∂z
dA =
= 1+
+
(x0 , y0 ) dxdy, (8.1)
∂x
∂y
|~n · ~k|
donde ~k = ∂/∂z|(x0 ,y0 ,z0 ) , ~n es un vector unitario perpendicular
a T(x0 ,y0 ,z0 ) S, (el normalizado de ±(∂z/∂x(x0 , y0 ), ∂z/∂y(x0 , y0 ),
−1)), el producto escalar usual se denota por · , y dx = ∆x, dy =
∆y. El área de la superficie S se computa entonces integrando el
segundo miembro de (8.1) en el dominio D de (x, y). Más aún, una
vez que se tiene el concepto de área (esto es, medida o volumen
bidimensional), se puede rehacer la construcción de Riemann –o
de Lebesgue– para definir la integral de una función f : S → R.
Asi, se define la “integral de superficie” de f sobre S como:
Z
s
Z
f dA =
S
f (x, y, z(x, y))
D
µ
1+
∂z
∂x
¶2
µ
+
∂z
∂y
¶2
(x, y) dxdy.
(8.2)
No obstante, estas definiciones de área e integración parecen muy
particulares para grafos. Para indagar su posible generalidad,
pensemos ahora en el grafo S sólo como una variedad dotada de la
métrica g (obtenida por restricción de la usual de R3 ), para la cual
la proyección sobre el plano z = 0 desempeña el papel de carta
coordenada (global) ϕ(x, y, z) = (q 1 (x, y, z) = x, q 2 (x, y, z) = y).
La función “peso” |~n · ~k|−1 que aparece en (8.1), (8.2) se puede
expresar en función de la métrica g y la carta coordenada ϕ como
sigue. Sea B la base de campos coordenados inducida por ϕ,
¶ µ
¶
µ
∂
∂
∂z ∂ ∂
∂z ∂
∂
,
=
+
,
+
.
B=
∂q 1 ∂q 2
∂x ∂x ∂z ∂y ∂y ∂z
Resulta inmediato computar la matriz gij de g en la base B,
8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES
159
obteniéndose
µ
det MB (g) = 1 +
∂z
∂x
¶2
µ
+
∂z
∂y
¶2
,
que es igual a |~n · ~k|−2 . Ası́, (8.2) se reescribe:
Z
Z
p
f (q 1 , q 2 ) |det MB (g)|(q 1 , q 2 ) dq 1 dq 2 ,
f dA =
S
(8.3)
D
expresión ésta que valdrı́a también para cualesquiera otras coordenadas sobre S.
8.2.
Integración de n−formas diferenciales
8.2.1.
El problema de la integración sobre una variedad
Supongamos que nos planteamos el problema de definir la integral de una función real f sobre una variedad diferenciable Q de dimensión n. Para simplificar dicho problema, supondremos inicialmente
f ∈ C ∞ (Q) y que el soporte de f es compacto y está incluido en un
entorno coordenado (U, ϕ) de Q, sopf ⊂ U . En este caso, la función
diferenciable f ◦ ϕ−1 : ϕ(U ) ⊆ Rn → R también tiene soporte compacto incluido en Rn , pues sop(f ◦ ϕ−1 ) = ϕ(sop f ). Ingenuamente, se
podrı́a pensar en definir la integral de f sobre Q como
Z
f ◦ ϕ−1 ,
(8.4)
n
ϕ(U )⊆R
donde la integral es la usual en (abiertos de) Rn . Sin embargo, esta
definición presentarı́a un problema fundamental: no es independiente
del entorno coordenado escogido. Para comprobarlo, supongamos que
(V, ψ) es otro entorno coordenado que verifica sopf ⊂ V , y tomemos
analogamente la integral
Z
f ◦ ψ −1 .
(8.5)
ψ(Q)
160
Puesto que sop f ⊂ U ∩ V ,
Z
Z
−1
f ◦ϕ =
f ◦ ϕ−1 ,
ϕ◦ψ −1 (ψ(U ∩V ))
ϕ(U )
y, aplicando el teorema clásico de cambio de variables para la integral
usual en Rn , obtenemos:
R
R
−1
f
◦
ϕ
=
((f ◦ ϕ−1 ) ◦ (ϕ ◦ ψ −1 ))|det J(ϕ ◦ ψ −1 )|
−1
ϕ◦ψ (ψ(U ∩V ))
ψ(U
R ∩V )
= ψ(V ) (f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )|
donde J(ϕ ◦ ψ −1 ) denota la matriz jacobiana de ϕ ◦ ψ −1 . Resumiendo:
Z
Z
−1
f ◦ϕ =
(f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )|,
(8.6)
ϕ(U )
ψ(V )
y, puesto que el factor |det J(ϕ ◦ ψ −1 )| no es necesariamente igual a
1, las expresiones (8.4) y (8.5) no coinciden, en general. Ası́, el valor
(8.4) ingenuamente propuesto para la integral de f sobre Q depende
del entorno coordenado escogido, resultando este problema esencial: si
se usa sólo la estructura diferenciable de la variedad Q, no existe un
procedimiento canónico de privilegiar un entorno coordenado frente a
otro ni, tampoco, de definir la integración de funciones.
Ejercicio. Considérese en Rn el entorno coordenado (Rn , ϕ), donde
ϕ : Rn → Rn viene definida por




x1
x1
 .. 
 . 
 .  7→ A ·  ..  ,
xn
xn
siendo A ∈ Gl+ (n, R) = {A ∈ Mn×n (R) : det(A) > 0}. Compruébese
Z
Z
f =a·
f ◦ ϕ−1
n
n
R
R
donde a = det(A−1 ). En consecuencia, obténgase una definición de
integración de funciones para variedades riemannianas isométricas a
Rn .
Una posible manera de resolver el problema anteriormente apuntado es
la siguiente. Dado que los cambios de carta afectan a la integral definida
161
en (8.4) mediante el factor peso |det J(ϕ ◦ ψ −1 )|, podrı́amos tratar de
hallar un objeto matemático w que, al escribirse en coordenadas, se
transforme afectado exactamente por ese mismo factor peso; esto es,
tal que
wψ = wϕ ◦ (ϕ ◦ ψ −1 ) · |det J(ϕ ◦ ψ −1 )|.
(8.7)
De esta manera, multiplicando el integrando de (8.4) por dicho objeto
matemático, la integral permanecerı́a invariante frente a cambios de
carta. En una variedad
p semi-riemannaniana (Q, g), este objeto existe:
puede tomarse como |det MB (g)|, lo que conduce directamente a una
definición de integración de funciones que generaliza a las integrales de
superficie tipo (8.3) (véase la Sección 8.4). Pero ganaremos en perspectiva si antes centramos nuestro estudio en otro objeto matemático,
que nos permitirá identificar geométricamente el significado del factor
peso: las n-formas diferenciales.
8.2.2.
Integración de n-formas en entornos coordenados
Las r−formas diferenciales, o campos tensoriales r covariantes antisimétricos, ya fueron introducidas en el Tema 6, en el cual nos centrábamos en los casos r = 1, 2. Las propiedades de (el C ∞ (Q)-módulo
de) las r−formas diferenciales Λr (Q) resultan inmediatas a partir de
las propiedades de los tensores antisimétricos sobre un espacio vectorial
y de los campos tensoriales sobre una variedad (véanse los Apéndices
8.5, 8.7.1). En adelante necesitaremos n−formas diferenciales, esto es,
el caso de covariancia máxima no trivial r = n.
Definición 8.2.1 Consideremos un abierto U ⊆ Rn y una n-forma
diferencial ω ∈ Λn (U ), con soporte incluido en U , y expresión en coordenadas usuales:
ω = w dx1 ∧ · · · ∧ dxn ,
w ∈ C ∞ (U )
La integral de ω se define como:
Z
Z
ω :=
w,
U
U
donde en el segundo miembro se está considerando la integral usual en
Rn .
162
El siguiente resultado describe cómo se comportan las n-formas frente a
transformaciones diferenciables, y será la clave que nos permitirá extender la Definición 8.2.1 a una variedad orientada arbitraria. En efecto,
resulta inmediato (Apéndice 8.6, Proposición 8.6.4 (1)):
Lema 8.2.2 Sean U, V dos abiertos de Rn y F : U → V una aplicación diferenciable. Si ω = w dx1 ∧ · · · ∧ dxn ∈ Λn (V ) entonces la
n−forma inducida F ∗ w (Definición 8.5.6) tiene la expresión
F ∗ ω = det J(F ) · (w ◦ F ) dx1 ∧ · · · ∧ dxn .
Acabamos de comprobar por tanto que, salvo por el signo de det J(F ),
las n-formas se transforman afectadas del mismo factor peso con que lo
hacı́a la integral que proponı́amos en (8.4) (véase (8.7)). En consecuencia, se deduce ahora de la Proposición 8.6.4 (2) el siguiente resultado:
Lema 8.2.3 Sean U , V dos abiertos de Rn y F : U → V un difeomorfismo que conserva (resp. invierte) la orientación (usual de Rn ) en
todos sus puntos (Definición 8.6.2). Entonces,
½ R
Z
F ∗ω
si F conserva la orientación en todo punto,
UR
ω=
∗
− UF ω
si F invierte la orientación en todo punto.
V
Estamos ya en condiciones de introducir la definición de integral de una
n-forma diferencial en una variedad orientada arbitraria, al menos en
el caso de que el soporte de la n−forma sea compacto e incluido en un
entorno coordenado. Observemos previamente que, para una variedad
orientada, no supone ninguna pérdida de generalidad restringirnos a
entornos coordenados (U, ϕ) que preserven la orientación (Proposición
8.7.5).
Definición 8.2.4 Sea +Q una n−variedad orientada, y ω ∈ Λn (Q)
una n-forma diferencial con soporte compacto incluido en un entorno
coordenado. Se define la integral de ω en Q como:
Z
Z
ω :=
(ϕ−1 )∗ ω,
(8.8)
+Q
ϕ(U )
donde (U, ϕ ≡ (q 1 , . . . , q n )) es cualquier entorno coordenado que contiene al soporte de ω y preserva la orientación.
Por construcción, resulta inmediato ahora comprobar que esta definición es independiente del entorno coordenado que se escoja (siempre
que incluya al soporte de ω y preserve la orientación).
8.2.3.
163
Integración general de n−formas
De las varias restricciones sobre ω en la Definición 8.2.4, algunas se
imponen sólo por comodidad en la discusión, y otras tienen un carácter
más profundo. Discutimos a continuación tales restricciones, lo que
permite extender la integración a n−formas mucho más generales:
1. Orientabilidad y elección de una orientación en la variedad Q.
Aunque, como veremos en la próxima sección, esta restricción no
será necesaria para la integración de funciones, sı́ resulta esencial para la integración de n−formas. En cualquier caso, no son
suposiciones muy restrictivas (véase el Apéndice 8.7): (i) si Q
no fuera orientable admitirı́a un “recubridor de dos hojas” que
sı́ lo es, (ii) si Q es orientable y conexa admite exactamente dos
posibles orientaciones.
2. Diferenciabilidad C ∞ de ω, con soporte compacto. Estas hipótesis
se han impuesto sólo por simplicidad de lenguaje, y se pueden
relajar claramente. De hecho, en nada varı́an los argumentos anteriores que hacen consistente la Definición 8.2.4 si se supone que
las n−formas (como campos tensoriales) son sólo continuas.
Si el soporte no fuera compacto, las únicas precauciones serı́an:
(a) la n− forma sobre Rn , (ϕ−1 )∗ ω = wdx1 ∧ . . . ∧ dxn podrı́a no
ser integrable, en el sentido de que no lo sea la función w, y (b)
convendrı́a incluso admitir como posibles valores de la integral
±∞.
Se aplicarı́a entonces la solución estándar en teorı́a de la integración (compárese con la Subsección 8.4.3): (i) si w ≥ 0 se
admite la posibilidad natural de que la integral de w (y de ω)
sea infinita, y (ii) en general, se escribe w = w+ − w− donde
w+ , w− ≥ 0, y se dice que w es integrable si al menos una de las
dos integrales es finita, en cuyo caso se define
Z
Z
Z
Z
+
ω :=
w :=
w −
w− ∈ [−∞, ∞].
Q
ϕ(U )
ϕ(U )
ϕ(U )
Obsérvese que la descomposición w = w+ − w− también induce
una descomposición de ω ligada a la orientación1 ω = ω + − ω − .
1
Más intrı́nsecamente, las funciones ω ± se caracterizan por anularse en cada
164
Por último, podrı́amos extender la definición de integración incluso al caso en el que ω no sea continua, sino que generara en
coordenadas una función w que fuera sólo integrable Riemann o
Lebesgue (véase la Sección 8.4).
3. El soporte de ω cae en un entorno coordenado. A priori, esta
restricción resulta totalmente indeseable y, como veremos en la
próxima subsección, tal problema se puede resolver con la ayuda
de un nuevo elemento de interés propio: la existencia de particiones de la unidad.
No obstante, conviene tener en cuenta los siguientes hechos que
anticipamos de la Sección 8.4 y que permiten, en la práctica,
evitar completamente el uso de particiones de la unidad:
Asociada a su estructura diferenciable, en toda variedad se
pueden definir directamente los conjuntos de medida nula
(Subsección 8.4.4).
A efectos de cálculo de una integral, un subconjunto de medida nula carece de importancia, y puede obviarse.
Toda variedad Q contiene un subconjunto cerrado de medida nula N tal que Q\N admite una carta coordenada global
ϕ : Q\N → ϕ(Q\N ) ⊆ Rn , Teorema 8.4.4 (de hecho, si Q
es conexa Q\N puede tomarse difeomorfo a Rn o la bola
unidad).
Aun cuando la manera general de construir el conjunto de medida nula N y la carta ϕN puede no ser manejable en la práctica,
sı́ ocurre muy a menudo que se visualiza con facilidad un subconjunto cerrado de medida nula N , tal que Q\N es la unión de
varios abiertos conexos, cada uno de los cuales admite una carta
global (piénsese p. ej., en una esfera, eventualmente con una o
varias asas). El problema queda entonces reducido al caso de que
el soporte de ω caiga en varios entornos coordenados disjuntos.
punto al menos una de ellas, y por estar positivamente orientadas donde no se
anulan.
Obsérvese además que si w es continua (esto es, ω continua) entonces las funciones w± (y las n−formas ω ± ) son continuas, pero éstas no necesariamente son
diferenciables si w lo es. Esto ilustra las limitaciones de integrar sólo n-formas que
sean diferenciables.
8.2.4.
165
Particiones de la unidad e integración
Definición 8.2.5 Sea U ≡ {Uα }α∈I un recubrimiento abierto de una
variedad diferenciable Q. Se dice que una colección de funciones diferenciables να : Q → [0, 1], α ∈ I es una partición de la unidad sobre
Q, subordinada a U si:
(1) sop να ⊂ Uα para todo α,
(2) la colección {sop να }α∈I es localmente finita, esto es, todo punto
de Q tiene un entorno coordenado que interseca sólo a un número
finito de elementos de {sop να }α∈I ,
P
(3)
α να (p) = 1 para todo p ∈ Q.
Observaciones:
(1) En principio, la suma que aparece en la condición (3) anterior
involucrarı́a posiblemente un número infinito de sumandos. Sin
embargo, la condición (2) implica que cada p ∈ Q admite un
entorno en el cual la función να es idénticamente nula para todos
salvo para un número finito de valores del ı́ndice α. En consecuencia, la sumatoria en (3) debe entenderse siempre en cada
punto como la suma (finita) de los términos no nulos.
(2) En una variedad diferenciable (paracompacta) todo recubrimiento abierto admite una partición de la unidad.Más aún, las condiciones sobre las να implican que, aunque el conjunto de ı́ndices I
podrı́a ser no numerable, sólo un subconjunto numerable de las
να puede no ser idénticamente nulo2 .
Ejercicio. Usando la existencia de particiones de la unidad, pruébese
que toda variedad diferenciable admite una métrica riemanniana. ¿Admite también una lorentziana?
Sea (+Q, g) una variedad riemanniana orientada y consideremos un recubrimiento por entornos coordenados positivamente orientados {(Uα ,
ϕα )}α∈I de Q. Sea {να }α∈I una partición de la unidad subordinada, y
consideremos una n-forma ω.
2
De hecho, toda variedad diferenciable es Lindelöff, esto es, todo recubrimiento
abierto de Q admite un subrecubrimiento numerable.
166
Si ω tiene el soporte compacto, existe un subconjunto finito de enm
tornos {(Ui , ϕi )}i=1
tal que sop ω ⊂ ∪m
i=1 Ui . Consideremos la n-forma
wi := w · νi , cuyo soporte es compacto y está incluido en el correspondiente
R entorno coordenado (Ui , ϕi ), por lo que se tiene definida su
integral +Q wi . Definimos entonces:
Z
m Z
X
w :=
wi .
+Q
i=1
+Q
No es difı́cil comprobar que esta definición resulta independiente de los
entornos coordenados y la partición escogida.
Para incluir el caso general en que el soporte de ω no sea compacto,
podemos usar que Q siempre se puede recubrir por un conjunto numerable de entornos coordenados positivamente orientados {(Ui , ϕi )}i∈N ,
y considerar una partición de la unidad subordinada {νi }i∈N . Escribimos entonces, para evitar inconsistencias si las integrales se hicieran infinitas, ω = ω + −ω − , con ω ± positivamente orientadas y no simultáneamente distintas de 0, y definimos ωi+ = νi ω + , ωi− = νi ω − para todo
i ∈ N. Podemos dar ya la siguiente definición, donde permitiremos
además que el valor de la integral sea infinito.
Definición 8.2.6 Sea +Q una variedad orientada y ω una n-forma
sobre Q. Diremos que ω es integrable si lo son cada una de las nformas ωi+ , ωi− para todo i ∈ N y, además, al menos una de las series
∞ Z
X
i=1
+Q
ωi+ ,
∞ Z
X
i=1
+Q
ωi−
es finita.
En este caso, se define la integral de ω en (+Q, g) como
Z
∞ Z
∞ Z
X
X
+
w :=
ωi −
ωi− ∈ [−∞, ∞].
+Q
i=1
+Q
i=1
+Q
De nuevo, la integral ası́ definida resulta independiente del recubrimiento abierto y la partición escogida. Además, como apuntamos en
la subsección anterior, no sólo es aplicable al caso en que ω es diferenciable, sino también a cuando es sólo continua o, aún más, cuando
cada una de las funciones wi± generada sobre ϕi (U ) ⊆ Rn por las ωi±
es integrable en el sentido de Riemann o, con más generalidad, en el
de Lebesgue.
8.3. INTEGRACIÓN DE FUNCIONES
167
8.3.
Integración de funciones
8.3.1.
Elementos de volumen e integración de funciones
Recordemos del Apéndice 8.7 que un elemento de volumen sobre
una variedad Q no es más que una n−forma diferencial sin ceros. Si
fijamos un elemento de volumen Ω0 automáticamente consideraremos
a Q orientada por [Ω0 ], y podemos definir la integración de funciones
sobre Q como sigue:
Definición 8.3.1 Sea Q una variedad diferenciable dotada de un elemento de volumen Ω0 . Una función f sobre Q se dirá integrable si la
n−forma f Ω0 es integrable y, en este caso, definimos la integral de f
en Q respecto a Ω0 como:
Z
Z
f=
f Ω0 .
(Q,Ω0 )
(Q,+)
donde la orientación de (Q, +) es [Ω0 ].
Resulta inmediato comprobar que, si en lugar de fijar el elemento de
volumen Ω0 , fijamos −Ω0 entonces las dos integrales de f coinciden:
Z
Z
Z
Z
f=
f (−Ω0 ) =
f Ω0 =
f.
(8.9)
(Q,−Ω0 )
(Q,−)
(Q,+)
(Q,Ω0 )
Ejercicio. Compruébese que esta igualdad se mantiene si Q no es
conexa y se cambia el signo de Ω0 sólo en alguna parte conexa de Q.
8.3.2.
Integración en variedades semi-riemannianas
El concepto de integral de funciones respecto a un elemento de
volumen resulta especialmente natural desde un punto de vista semiriemanniano. En efecto, si suponemos ahora que el ambiente es una
variedad semi-riemanniana orientada (+Q, g), entonces disponemos de
un elemento de volumen canónico, sin más que aplicar a cada espacio
tangente Tp Q la Definición 8.6.5:
168
Definición 8.3.2 Se define el elemento de volumen métrico orientado
µ+
g de una variedad semi-riemanniana orientada (+Q, g) como la nforma diferencial que en cada espacio tangente Tp Q es igual al elemento
de volumen métrico orientado para (+Tp Q, gp ).
El elemento de volumen métrico orientado se calcula en coordenadas a
partir de las expresiones en el Apéndice 8.6. En efecto, para cualquier
entorno coordenado positivamente orientado (U, ϕ ≡ (q 1 , . . . , q n )) se
tiene
p
µ+
|det MB (g)| dq 1 ∧ · · · ∧ dq n ,
g =
donde B = (∂q1 , . . . , ∂qn ) (véase la Proposición 8.6.6). En particular,
esto prueba que µ+
g es diferenciable.
La Definición 8.3.1 permite ahora definir la integración de funciones
respecto a µ+
g . Por supuesto, si en Q tomamos la orientación opuesta,
+
entonces se tiene µ−
g = −µg . De la igualdad (8.9) (para cada parte
conexa de Q) se tiene que la integración es independiente de la orientación escogida, lo que conduce a la definición:
Definición 8.3.3 Sea (Q, g) una variedad semi-riemanniana orientable. Una función f sobre Q se dice integrable si, escogida una (y
entonces, para toda) orientación sobre Q, f es integrable respecto al
elemento de volumen métrico orientado µ+
g . En este caso, se define su
integral por la expresión, independiente de la orientación escogida:
Z
Z
f :=
f.
(Q,g)
(Q,µ+
g )
El siguiente ejercicio muestra que toda integral de funciones respecto
a un elemento de volumen en el sentido de la Definición 8.3.1 puede
verse como una integral en una variedad riemanniana en el sentido de
la Definición 8.3.3.
Ejercicio. Sea Q una variedad orientable y Ω un elemento de volumen
sobre ella. Pruébese que existe una métrica riemanniana g tal que (para
la orientación determinada por Ω) µ+
g = Ω. (Sugerencia: úsese que
siempre existe alguna métrica riemanniana h, y calcúlese f > 0 de
modo que se pueda tomar g = f h.)
Observación. La Definición 8.3.3 se extiende sin dificultad a variedades semi-riemannianas no orientables. Para comprobarlo, úsese: (1)
8.4. TEORÍA DE LA MEDIDA
169
el abierto de definición de cada entorno coordenado es orientable, lo
que permite definir la integración para funciones con soporte en un
entorno coordenado, (2) las particiones de la unidad (o, alternativamente, el Teorema 8.4.4) extienden esta definición al caso de que el
soporte no verifique tal condición.
8.4.
Integración a partir de la teorı́a de la
medida
Dado un subconjunto A de un conjunto X, la función caracterı́stica
de A se denotará por χA : X → R, donde χA (x) es igual a 1 para todo
x ∈ A, y a 0 en caso contrario.
8.4.1.
Nota previa sobre la integral de Riemann
Recordemos brevemente la integración de Riemann en Rn . Decimos
que un subconjunto C ⊂ Rn es un n−rectángulo o, simplemente, un
rectángulo si existen 2n constantes ai < bi , i ∈ {1, . . . , n} tales que
C = {(x1 , . . . , xn ) ∈ Rn : ai < xi < bi ∀i ∈ {1, . . . , n}}.
Para estos conjuntos se define su volumen como
vol(C) = Πni=1 (bi − ai ).
Cualquier subconjunto acotado de Rn está incluido en un rectángulo de lados suficientemente grandes, y una partición de cada uno de
los lados genera de manera natural una partición del rectángulo por
rectángulos menores. Consideremos una función f : Rn ⊆ Rn → R,
(si sólo está definida en un subconjunto, la supondremos extendida
por 0 a todo Rn ). Si suponemos que f está acotada, con f ≥ 0 y su
soporte cae dentro de un rectángulo C, se hace la siguiente construcción. Sea {C m }m∈N una sucesión de particiones de C (esto es, cada
término C m = {Ckm , k ∈ {1, . . . , km }} es un conjunto de km rectángulos obtenido del producto de particiones de cada uno de sus n−lados),
tal que el menor diámetro |C m | de las particiones de cada uno de los
n lados, tiende a cero cuando m tiende a infinito. Se dice que f es
170
integrable en el sentido de Riemann si: (a) existe el lı́mite
Z
∞
X
m
f := lı́m
f (xm
∈ [0, ∞],
k ) · vol(Ck )
n
m→∞
R
k=1
(8.10)
m
donde xm
k es cualquier punto del rectángulo Ck , y (b) este lı́mite resulta
independiente de la partición y los puntos xm
k escogidos. A esta definición se le hacen las extensiones progresivas estándar (compárese con
la Subsección 8.4.3): (i) En el caso de que el soporte no esté acotado,
se hace primero la elección C = [−L, L]n y se toma entonces el lı́mite
L → ∞; (ii) si f no está acotada, se reemplaza por fM , definida en cada punto p como el mı́nimo de {f (p), M }, y se toma el lı́mite M → ∞;
(iii) si no se verificara f ≥ 0, se escribe f = f + − f − , f + , f − ≥ 0, se
repite la construcción para f ± y, caso de que
y
R ambas
R integrales
R existan
3
+
−
no sean ∞ simultáneamente , se define: Rn f = Rn f − Rn f . Un
subconjunto A ⊆ Rn se dice medible Jordan si su función caracterı́stica
χA es integrable (lo cual ocurre si y sólo si el conjunto de sus puntos
frontera es de medida nula, en el sentido de la Subsección
R 8.4.2); en
este caso, se dice que la integral de Riemann
de
f
en
A,
f , existe si
A
R
R
existe la de f χA , y en este caso se define A f = Rn f χA .
Cuando f es continua con soporte compacto, se demuestra que el
lı́mite anterior existe, y es independiente de la sucesión de particiones
escogida. Concretamente, se prueba que el lı́mite de la suma superior
de Riemann (esto es, la sumatoria obtenida en (8.10) tomando xm
k
igual al máximo de f en el rectángulo -cerrado- Ckm ) y el de la suma
inferior de Riemann (ı́dem tomando xm
k como el mı́nimo) coinciden.
Ahora bien, la integral también está bien definida en algunas funciones
no continuas (piénsese por ejemplo en la función escalón). La clase de
las funciones para las que podemos definir la integral en el sentido de
Riemann, y ésta es finita, recibe el nombre de clase de las funciones
“integrables Riemann”.
Todo ello resulta extensible de manera más o menos directa a la
integración en variedades (semi-)riemannianas (véase [Sp2]).
Aunque a la hora práctica de realizar integrales el concepto de integración de Riemann suele resultar suficiente, éste presenta limitaciones
teóricas importantes como: (1) es fácil encontrar funciones que coinciden en todos sus puntos excepto en un conjunto numerable, una de
3
Se excluye ası́ el caso de la integral impropia de Riemann en R
171
ellas integrable Riemann y la otra no (v. gr.: función caracterı́stica de
los racionales y la idénticamente nula), (2) el espacio de las funciones
integrables Riemann
R (módulo las funciones de integral nula) dotado de
la norma k f k= Rn |f | no es completo. Estas carencias se salvan con
la integración de Lebesgue.
8.4.2.
Espacios de medida. Medida de Lebesgue
Un espacio medible es un par (X, F), donde X es un conjunto arbitrario y F es una σ-álgebra; esto es, una colección no vacı́a de subconjuntos de X que verifica las siguientes propiedades:
(a.1) ∅ ∈ F ,
(a.2) si A pertenece a F entonces su complementario Ac también,
(a.3) si {An }n es una sucesión de elementos de F entonces su unión
también pertenece a F.
Un espacio de medida es un espacio medible (X, F) dotado de una
medida; esto es, de una función real m sobre F tal que:
(m.1) m(∅) = 0,
(m.2) m(∪∞
n=1 An ) =
P∞
n=1
m(An ), siendo los An disjuntos dos a dos.
Previamente a la definición de un espacio de medida canónico en Rn ,
definimos la medida exterior de Lebesgue de un subconjunto arbitrario
A ⊂ Rn como el ı́nfimo de las sumas de los volúmenes de los rectángulos, tomado variando en el conjunto de los recubrimientos (numerables)
por rectángulos de A; esto es:
Ã∞
!
X
µ(A) = Inf {{Ci } :A⊆∪∞
vol(Ci ) .
i=1 Ci }
i∈N
i=1
En particular, se dice que un subconjunto A ⊂ Rn es de medida nula
si µ(A) = 0; o, equivalentemente, si para todo ² > 0 existe un con∞
junto
P∞ numerable de rectángulos {Ci }i=1 que recubren A y tales que
i=1 vol(Ci ) < ². Esencialmente, para la integración lo que ocurra en
un conjunto de medida nula resultará irrelevante, de ahı́ que se hable de
172
que una propiedad se verifica “casi por doquier” (c.p.d.) cuando se verifica para todos los puntos, salvo a lo más para los de un subconjunto
de medida nula.
La relación entre los conjuntos de medida nula y las aplicaciones
diferenciables se resume en el siguiente resultado:
Teorema 8.4.1 Sea F : Rn → Rn , una aplicación diferenciable:
(1) Si A ⊂ Rn es de medida nula en Rn entonces F (A) es de medida
nula en Rn .
(2) (Sard.) Si ΣF ⊂ Rn es el conjunto de los puntos crı́ticos de F ,
entonces F (ΣF ) es de medida nula en Rn .
Además, si F : Rn → Rm , y n < m entonces F (Rn ) es de medida nula
en Rm .
El conjunto P(Rn ) de las partes de Rn es obviamente una σ-álgebra de
Rn , y la medida exterior de Lebesgue es aplicable a cualquier elemento
de ella. Sin embargo, la medida exterior no verifica la propiedad (m.2)
de una medida. De ahı́ que se elijan σ-álgebras para las cuales la restricción de la medida exterior de Lebesgue sı́ proporcione una medida.
Existen dos elecciones fundamentales: (1) la σ-álgebra boreliana, esto
es, la σ-álgebra mı́nima que contiene a los abiertos de Rn , y (2) la
σ-álgebra de Lebesgue, esto es, la σ-álgebra mı́nima que contiene tanto
a los abiertos como a los conjuntos de medida nula de Rn . (Que tales
σ-álgebras mı́nimas existen se prueba tomando la intersección de todas
las σ-álgebras que contienen los subconjuntos requeridos).
Se define ası́ el espacio de medida de Lebesgue (Rn , MRn , µRn ) ≡
(Rn , M, µ), donde M es la σ-álgebra de Lebesgue, y µ es la restricción a M de la medida exterior de Lebesgue o, simplemente, medida
de Lebesgue. La clase de los conjuntos medibles Lebesgue (que, desde luego, incluye tanto a los abiertos como a los cerrados), se revela
espectacularmente grande; la construcción de un conjunto no medible
precisa del axioma de elección.
8.4.3.
Integral de Lebesgue en Rn
Una vez definido el espacio de medida de Lebesgue, vamos a definir
la clase de las funciones sobre Rn a las que, potencialmente, podremos
173
definir la integral. Intentaremos que ésta sea lo más general posible y,
eventualmente, admitiremos incluso como valor de las funciones ±∞.
Definición 8.4.2 Diremos que f : Rn → [−∞, ∞] es medible si son
subconjuntos medibles Lebesgue las preimágenes de cualquier intervalo
abierto f −1 (]y0 , y1 [), ası́ como f −1 (∞), f −1 (−∞).4
La clase de las funciones medibles no sólo incluye a las continuas, sino
que, al igual que la de los conjuntos medibles, resulta muy grande. La
medibilidad no sólo es respetada por las operaciones algebraicas elementales, sino que se conserva por paso al lı́mite. Ası́, una función f
será medible cuando exista una sucesión de funciones {fm }m∈N medibles que converge puntualmente c.p.d a f ; el lı́mite superior o inferior
de una sucesión de funciones medibles es también medible.
El proceso de definición de la integral sigue entonces los siguientes
pasos:
(1) En primer lugar, supongamos f ≥ 0 y acotada, f (Rn ) ⊂ [0, M ]
para algún real M > 0. Consideremos una sucesión de particiones {P m }m de [0, M ], P m = {ykm , k = 0, . . . , jm }, y tal que su
m
diámetro |P m | = supk {(yk+1
− ykm ) : k ∈ {0, . . . , jm − 1} tienda a
cero. Definimos la integral de f sobre Rn como:
!
Ãj −1
Z
m
X
m
m
f (yk ) · µ(Ak )
∈ [0, ∞],
f := lı́m
m→∞
Rn
k=0
−1
m
siendo Am
([ykm , yk+1
]). En efecto, se puede demostrar que
k = f
este lı́mite existe y es independiente de la sucesión de particiones
R
escogida. En particular, con esta definición se tiene Rn χA =
µ(A), para todo A ⊆ Rn medible.
4
En general, dados dos espacios medibles (X, F), (X 0 , F 0 ), una aplicación f :
X → X 0 se dice medible si f −1 (A0 ) ∈ F para todo A0 ∈ F 0 . Se puede comprobar
n
que, para el caso de que f : R → R, esta definición general incluye a la de arriba
n
siempre que en el dominio R consideremos la σ−álgebra de Lebesgue y en el
codominio la σ− álgebra boreliana (la cual, al tener menos elementos que la de
Lebesgue, en principio permite que sean admisibles como medibles más funciones).
La extensión de la σ-álgebra boreliana a [−∞, ∞] puede hacerse de manera obvia;
en cualquier caso, la definición de que f sea medible equivale a que la preimagen
de cualquier intervalo cerrado de [−∞, ∞] sea un medible.
174
(2) Si f ≥ 0 no está acotada, se define fM : Rn → [0, ∞[ como
fM (x) =Min{f (x), M }, se considera la integral de fM según el
paso anterior y se define:
Z
Z
fM .
f := lı́m
M →∞ Rn
Rn
Obsérvese que este lı́mite debe existir, pues la integral de fM (≥ 0)
crece con M .
(3) Supongamos ahora que la función medible f puede tomar valores negativos. Entonces podemos escribir f = f + − f − , donde
f + , f − : Rn → [0, ∞] son funciones medibles no negativas (cuya
integral ya hemos
En este caso, si al menos una de las
R definido).
R
dos integrales Rn f + , Rn f − es finita, se define la integral de f
por
Z
Z
Z
n
R
f :=
n
R
f+ −
n
R
f − ∈ [−∞, ∞].
(4) Se dice que una función f : Rn → [∞, ∞] es integrable L1 si
la integral de f está bien definida según el Rpaso anterior, y su
integral es finita (esto es, si f es medible y Rn |f | < ∞). Si se
establece en el espacio de las funciones integrables L1 la relación
de equivalencia f ∼
R h si y sólo si f ≡ h c.p.d. (o, equivalentemente, si y sólo si Rn |f − h| = 0) se induce en el cociente una
1
estructura
R de espacio vectorial, ası́ como la norma (norma L ):
k[f ]k = Rn |f | (es costumbre abusar de la notación y denotar
por f indistintamente a la función y a su clase de equivalencia
[f ]). Se denota por L1 (Rn ) a este espacio normado, que resulta
ser de Banach.
(5) Finalmente, señalemos que no es necesario considerar siempre
como dominio todo Rn . Ası́, cualquier función f definida en un
subconjunto medible E se supone extendida por 0 fuera de él, y
se define:
Z
Z
f :=
f χE ,
E
Rn
(en el caso de que exista el último miembro) ası́ como, de manera
obvia, el espacio L1 (E).
8.4.4.
175
Conjuntos de medida nula y espacio de medida en una variedad
Consideremos ahora una variedad semi-riemanniana (Q, g) de dimensión n. Para definir de manera análoga a Rn un espacio de medida,
debemos empezar por considerar una σ−álgebra sobre Q. La σ−álgebra, será intrı́nseca a la estructura diferenciable, e independiente de
g.
Definición 8.4.3 Un subconjunto A de la variedad diferenciable Q es
de medida nula si para todo entorno coordenado (U, ϕ) el subconjunto
ϕ(U ∩ A) es un conjunto de medida nula de Rn .
El Teorema 8.4.1(1) muestra la consistencia de esta definición, esto es,
basta con verificar que ϕ(U ∩ A) es de medida nula para un recubrimiento por entornos coordenados de A.
Es fácil entender la importancia a la hora del cómputo de una integral del siguiente resultado, que permite reducir siempre la integración
a un único entorno coordenado (entorno coordenado c.p.d.)5 :
Teorema 8.4.4 Sea Q una variedad diferenciable de dimensión n. Existe un cerrado C ⊂ M de medida nula tal que U = Q\C es difeomorfo
a un abierto de Rn .
Consecuencia inmediata de este resultado es que el Teorema 8.4.1 es
traspasable a variedades, sin más que sustituir Rn , Rm por variedades
de dimensiones n, m, resp.
Con estas definiciones, ya estamos en condiciones de definir el espacio medible para (Q, g). Definimos la σ-álgebra MQ de Q como la
σ-álgebra generada por los abiertos y los conjuntos de medida nula de
Q. A los elementos de MQ los llamaremos conjuntos medibles de la
variedad. Para cada conjunto medible A ⊆ Q, y cualquier entorno coordenado, ϕ(U ∩ A) resulta ser entonces un medible de Rn . Definimos
ası́ la medida de A como:
Z
p
|det MB (g)|χϕ(U ∩A) ,
µg (A) =
ϕ(U )
5
Aunque se puede dar una prueba directa de este teorema, existen métodos
elegantes y simples dentro del marco de la Geometrı́a Riemanniana: se toma una
métrica riemanniana completa, y se suprime su “lugar de corte”.
176
donde (U, ϕ) es cualquier entorno coordenado c.p.d. Es fácil comprobar
directamente por el teorema del cambio de variables (y se ha discutido
ya exhaustivamente en las Subsecciones 8.2.1, 8.3.2), que la medida
ası́ definida resulta independiente del entorno coordenado escogido6 .
Algunas propiedades de esta medida, que resultan inmediatas de
las de Rn , son las siguientes:
1. Si A ⊆ B ⊆ Q entonces µQ (A) ≤ µQ (B).
2. Dada una sucesión {An }n ⊆ Q, si µQ (An ) = 0 para todo n
entonces µQ (∪n An ) = 0.
3. Si A ⊂ Q verifica µQ (A) = 0 entonces su interior es vacı́o.
4. Si F : Q → Q0 es diferenciable y las dimensiones de Q, Q0 coinciden, entonces A ⊂ Q con µQ (A) = 0 implica µQ0 (F (A)) = 0.
5. Si F : Qn → Qm es diferenciable y las respectivas dimensiones
satisfacen n < m, entonces µQ0 (F (Q)) = 0.
6. Dadas las variedades Q, Q0 , y fijado un punto (q0 , q00 ) ∈ Q × Q0
definimos
iq00 : Q → Q × Q0
q 7→ (q, q00 )
jq0 : Q0 → Q × Q0
q 0 7→ (q0 , q 0 ).
Sea A ⊂ Q × Q0 . Si casi para todo q0 ∈ Q (resp. casi para todo q00 ∈ Q0 )
0
µQ0 (jq−1
(A)) = 0 (resp. µQ (i−1
q 0 (A)) = 0) entonces µQ×Q (A) = 0.
0
0
8.4.5.
Integración en una variedad
Una vez definido el espacio de medida de la variedad (Q, g), la
definición Rde función medible f : Q → [−∞, ∞], de la la integral de
Lebesgue Q f y del espacio normado de Banach L1 (Q) sigue pasos
completamente análogos a los de la Subsección 8.4.3 para Rn (basta
con reemplazar Rn , µ por Q, µg a lo largo de toda esa subsección).
6
Obsérvese que aunque, debido a la simplificación de notación para el elemento
de volumen métrico orientado, µ+
g ≡ µg , usamos ahora la misma notación para la
medida, no existe posibilidad de confusión entre ambas.
177
Más aún, las propiedades fundamentales de la integral de Lebesgue
se demuestran de manera completamente análoga en el caso de Rn y de
la variedad. Repasamos brevemente estas propiedades, formulándolas
directamente para (Q, g):
Elementales:
(i) Linealidad: si f = af1 + bf2 siendo f1 y f2 integrables
R
Lebesgue, entonces f es integrable Lebesgue y: (Q,g) f =
R
R
f + (Q,g) f2 ,
(Q,g) 1
R
R
(ii) Orden: f ≤ g entonces (Q,g) f ≤ (Q,g) g.
Conmutatividad del lı́mite con la integral:
Teorema de la Convergencia Monótona. Sea {fn }n una
sucesión no decreciente c.p.d. de funciones medibles positivas sobre (Q, g) y f : Q → [0, ∞] su lı́mite
puntual c.p.d.
Entonces, f
R
R
es medible y su integral verifica: (Q,g) f = lı́mn (Q,g) fn .
Teorema de la Convergencia Dominada. Sea {fn }n una
sucesión de funciones integrables L1 en (Q, g) tales que: (i) existe una función h integrable L1 tal que |fn | ≤ h c.p.d. para cada
n ∈ N; (ii) existe f : Q → [−∞, ∞] que es lı́mite
R puntual
R c.p.d.
de {fn }n . Entonces, f es integrable L1 y lı́mn (Q,g) fn = (Q,g) f .
Integración en variedades producto:
Para integrar en una variedad producto, usaremos la notación
estándar (diferencial respecto a una variable) para indicar si se
está integrando sólo en uno de los factores.
Teorema de Fubini. Sean (Qi , gi ), i ∈ {1, 2} dos variedades
semi-riemannianas y f : Q1 × Q2 → [−∞, ∞] una función medible.
Sean:
Z
Z
I12 =
dq1
Z
(Q1 ,g1 )
I21 =
dq2 |f (q1 , q2 )|
Z
(Q2 ,g2 )
dq2
(Q2 ,g2 )
dq1 |f (q1 , q2 )|.
(Q1 ,g1 )
178
Entonces I12 < ∞ ⇔ I21 < ∞.
En este caso, f es integrable L1 y se verifica:
Z
f (q1 , q2 ) =
(Q1 ×Q2 ,g1 +g2 )
Z
Z
Z
dq1
(Q1 ,g1 )
Z
dq2 f (q1 , q2 ) =
(Q2 ,g2 )
dq2
(Q2 ,g2 )
dq1 f (q1 , q2 ),
(Q1 ,g1 )
donde además:
(i) casi para todo q10 ∈ Q1 , la función q2 7→ fq10 (q2 ) := f (q10 , q2 )
es finita c.p.d. en Q2 y es integrable L1 ;
(ii) casi para todo q20 ∈ Q2 , la función q1 7→ fq20 (q1 ) := f (q1 , q20 )
es finita c.p.d. en Q1 y es integrable L1 ;
R
(iii) la función q1 7→ (Q2 ,g2 ) fq1 es finita c.p.d. en Q1 y es integrable L1 ;
R
(iv) la función q2 7→ (Q1 ,g1 ) fq2 es finita c.p.d. en Q2 y es integrable L1 ;
Otros resultados clásicos de teorı́a de integración permiten relacionar
integrales con derivadas (versión de la Regla de Barrow clásica, resultados que permiten permutar la integral con derivadas parciales, etc.)
8.5.
Apéndice 1: álgebra exterior sobre
V (R)
En este apéndice y el siguiente se recogen algunas notas básicas
sobre el álgebra exterior en un espacio vectorial V (R) de dimensión n,
necesarias para el desarrollo de la teorı́a de la integración de n−formas
en variedades. Esencialmente, en el presente apéndice estudiaremos
tensores antisimétricos, extendiendo nuestro estudio de los 2-covariantes
en la Sección 6.4 a los r−covariantes; en el Apéndice 2 nos centraremos
en el caso r = n.
8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R)
179
Definición 8.5.1 Diremos que un tensor r-covariante T ∈ Tr,0 (V ) es
antisimétrico si verifica:
T (y1 , . . . , yi , . . . , yj , . . . , yr ) = −T (y1 , . . . , yj , . . . , yi , . . . , yr )
1 ≤ i < j ≤ r, para todo y1 , . . . , yr ∈ V , esto es, si T es antisimétrico
respecto a cualquier par (i, j) de sus variables, i < j. El conjunto de
todos los tensores r-covariantes antisimétricos se denotará por Λr (V ).
Es directo comprobar que Λr (V ) es un subespacio vectorial de Tr,0 (V ).
Recordemos además las identificaciones Λ1 (V ) = V ∗ y Λ0 (V ) = R.
Antes de introducir el concepto de antisimetrizador para los tensores de un espacio vectorial, conviene recordar la definición, ası́ como
algunas propiedades básicas, de las permutaciones.
Definición 8.5.2 Sea S(r) = {1, 2, . . . , r} ⊂ N. Llamaremos permutación de S(r) (o de r elementos) a toda aplicación biyectiva σ :
S(r) → S(r). Al conjunto de todas las permutaciones de S(r) lo denotaremos por Sr .
Propiedades elementales:
(1) El conjunto de las permutaciones Sr junto con la operación de
composición tiene estructura de grupo abeliano. Además, su cardinal es r!
(2) Toda permutación σ ∈ Sr , se puede escribir como composición de
trasposiciones (permutaciones que actuan sobre S(r) únicamente
intercambiando dos de sus elementos). Existen muchas maneras de escribir una misma permutación σ como composición de
trasposiciones, y se pueden escoger éstas de un modo canónico
como [σ] trasposiciones “de ı́ndices contiguos”, tomadas de modo que se vayan “reordenando los ı́ndices de menor a mayor”.
En cualquier caso, el número de trasposiciones necesarias para
una σ fijada siempre será par o impar, independientemente de la
composición de trasposiciones, y se define la signatura de σ como
sig(σ) := (−1)[σ] .
(3) La aplicación sig : Sr → {−1, 1} es un homomorfismo de grupos.
La permutación σ se dice par (resp. impar) si sig(σ) = 1 (resp.
= −1).
180
Definición 8.5.3 Se define el antisimetrizador de orden r ∈ N para
el espacio vectorial V como la aplicación
hr : Tr,0 (V ) → T
r,0 (V )
P
T
7→ σ∈Sr sig(σ)T σ ,
donde T σ (y1 , . . . , yr ) := T (yσ(1) , . . . , yσ(r) ) para todo y1 , . . . , yr ∈ V .
No es difı́cil comprobar las siguientes propiedades:
Propiedades:
(1) hr es lineal y hr (T σ ) = sig(σ) hr (T ).
(2) Im hr ⊂ Λr (V ), y si T ∈ Λr (V ) entonces hr (T ) = r! T .
(3) Para todo T ∈ Tr,0 (V ), T 0 ∈ Tr0 ,0 (V ) se tiene
0
0
hr+r (hr (T ) ⊗ T 0 ) = r! hr+r (T ⊗ T 0 ),
0
0
0
hr+r (T ⊗ hr (T 0 )) = r0 ! hr+r (T ⊗ T 0 ).
0
0
0
(4) hr+r (T ⊗ T 0 ) = (−1)r·r hr+r (T 0 ⊗ T ).
Definición 8.5.4 Se definen los siguientes productos exteriores:
0
0
∧ : Λr (V ) × Λr (V ) → Λr+r (V )
(T, T 0 ) 7→ T ∧ T 0 =
0
0
1
hr+r (T
r!r0 !
⊗ T 0)
0
∧ : Λr (V ) × Λr (V ) → Λr+r (V )
1
r+r0
(T ⊗ T 0 ).
(T, T 0 ) 7→ T ∧T 0 = (r+r
0 )! h
Es inmediato comprobar que estos productos pueden expresarse del
siguiente modo:
P
P
T ∧ T 0 = k!k1 0 ! σ∈Sr+r0 sig(σ)(T ⊗ T 0 )σ = σ∈σr,r0 sig(σ)(T ⊗ T 0 )σ
P
1
0 σ
T ∧T 0 = (k+k
0 )!
σ∈Sr+r0 sig(σ)(T ⊗ T )
donde σr,r0 = {σ ∈ Sr+r0 : σ(1) < · · · < σ(r) y σ(r + 1) < · · · <
σ(r + r0 )}.
Propiedades: Los productos exteriores ∧, ∧ son:
8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R)
181
(1) bilineales (obviamente),
(2) asociativos (para lo cual resulta esencial la elección hecha de los
factores r!r0 ! o (r + r0 )!), y
(3) antisimétricos, en el siguiente sentido:
0
T ∧ T 0 = (−1)r+r T 0 ∧ T,
0
T ∧T 0 = (−1)r+r T 0 ∧T,
0
para T ∈ Λr (V ), T 0 ∈ Λr (V ). En adelante, escogeremos siempre el
producto exterior ∧.
Proposición 8.5.5 Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ , se verifican:
(i) El conjunto {φi1 ∧ · · · ∧ φir : 1 ≤ i1 < · · · < ir ≤ n} es una base
de Λr (V ).
µ ¶
n
r
si r ≤ n, y 0 si r > n.
(ii) dim Λ (V ) =
r
(iii) Si T ∈ Λr (V ) entonces:
X
T =
ti1 ...ir φi1 ∧ · · · ∧ φir ,
1≤i1 <···<ir ≤n
donde ti1 ...ir = T (vi1 , . . . , vir ) y B = (v1 , . . . , vn ) tiene por base
dual a B ∗ .
Demostración. Obviamente, (ii) se deduce directamente de (i). Para
comprobar la independencia lineal del conjunto en cuestión, supongamos que
X
ai1 ...ir φi1 ∧ · · · ∧ φir = 0.
1≤i1 <···<ir ≤n
Entonces, aplicando los dos miembros de la expresión al vector (vl1 ,
. . . , vlr ), 1 ≤ l1 < · · · < lr ≤ n, obtenemos que al1 ···lr = 0.
Finalmente, escribiendo como hasta ahora ti1 ···ir = T (vi1 , . . . , vir ):
P
T = ni1 ,...,ir =1 ti1 ,...,ir φi1 ⊗ · · · ⊗ φir
P
P
= 1≤i1 <···<ir ≤n σ∈Sr tiσ(1) ...iσ(r) φiσ(1) ⊗ · · · ⊗ φiσ(r)
P
P
= P1≤i1 <···<ir ≤n σ∈Sr sig(σ)ti1 ...ir φiσ(1) ⊗ · · · ⊗ φiσ(r)
= P1≤i1 <···<ir ≤n ti1 ...ir hr (φi1 ⊗ · · · ⊗ φir )
= 1≤i1 <···<ir ≤n ti1 ...ir φi1 ∧ · · · ∧ ϕir ,
182
lo que prueba (i) y (iii). 2
Ejercicio. Consideremos φ1 , . . . , φr ∈ V ∗ . Demuéstrese que el conjunto {φ1 , . . . , φr } es linealmente independiente si y sólo si φ1 ∧· · ·∧φr 6= 0.
Llamaremos álgebra exterior sobre V al espacio
Λ(V ) ≡ (⊕nr=0 Λr (V ), ∧),
donde el producto exterior ∧ se supone definido para cualequiera par
de elemento de Λ(V ) extendiéndolo de manera natural por bilinealidad.
Por último, justifiquemos para referencia posterior cómo es posible usar
los homomorfismos entre espacios vectoriales para transportar tensores
antisimétricos y, en general, r-covariantes, de uno a otro espacio. En
adelante, V 0 (R) será otro espacio vectorial de dimensión finita.
Definición 8.5.6 Sea F : V → V 0 lineal y T 0 ∈ Tr,0 (V 0 ). Se define el
tensor inducido o pull-back F ∗ T 0 ∈ Tr,0 (V ) de T 0 por F como
F ∗ T 0 (y1 , . . . , yr ) = T 0 (F (y1 ), . . . , F (yr )),
∀y1 , . . . yr ∈ V.
Propiedades:
(1) La aplicación F ∗ : Tr,0 (V 0 ) → Tr,0 (V ) es lineal y verifica F ∗ (Λr (V 0 ))
⊂ Λr (V ).
(2) Si F = IdV entonces F ∗ = IdTr,0 (V ) .
(3) Si se tiene otra aplicación lineal G : V 0 → V 00 entonces (G◦F )∗ =
F ∗ ◦ G∗ .
(4) Si F es biyectiva entonces (F −1 )∗ = (F ∗ )−1 . En particular, F ∗ es
biyectiva y F ∗ (Λr (V 0 )) = Λr (V ).
Se define entonces F∗ = (F −1 )∗ que, en el caso de que G también
sea biyectiva verifica: (G ◦ F )∗ = G∗ ◦ F∗ .
(5) F ∗ (T10 ∧ T20 ) = F ∗ (T10 ) ∧ F ∗ (T20 ).
8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R)
183
8.6.
Apéndice 2: Elementos de volumen
en V (R)
8.6.1.
Elemento de volumen y orientación
Si ω ∈ Λn (V ), ω 6= 0, entonces forma una base de Λn (V ). Este
hecho simple permite introducir los siguientes conceptos:
Definiciones 8.6.1 (1). Llamamos elemento de volumen de V a todo ω ∈ Λn (V ) no nulo.
(2). Consideremos la relación de equivalencia en Λn (V )−{0} definida
por: ω1 ∼ ω2 si y sólo si w1 = a w2 , a > 0. Llamamos orientación
en V a cada una de las dos únicas clases de equivalencia definidas
por ∼. Fijada una de estas clases, [ω], al par (V, [ω]) le llamaremos espacio vectorial orientado según [ω].
(3). Sea (V, [ω]) un espacio vectorial orientado. Diremos que una base
(ordenada) B = (v1 , . . . , vn ) está positivamente orientada (resp.
negativamente orientada) si su correspondiente base dual B ∗ =
(φ1 , . . . , φn ) verifica TB := φ1 ∧ · · · ∧ φn ∈ [ω] (resp. TB 6∈ [ω]). Al
tensor TB le llamaremos tensor determinante en B (y, de hecho,
TB (y1 , . . . , yn ) coincide con el determinante de la matriz cuya
columna j−ésima está formada por las coordenadas de yj en B,
para todo j).
Ejercicio. Pruébense las siguientes afirmaciones:
(i). Todo elemento de volumen ω ∈ Λn (V ) puede escribirse como un
tensor determinante para alguna base ordenada B.
(ii). Para Rn , el determinante usual de n vectores es un elemento
de volumen, que coincide con el tensor determinante en la base
usual.
(iii). Si B 0 = (v10 , . . . , vn0 ) es otra base ordenada entonces
TB 0 = det(M (IdV , B 0 ← B)) · TB .
(8.11)
donde M (IdV , B 0 ← B) es la matriz en cuyas columnas aparecen,
ordenadamente, las coordenadas de los elementos de la base B
en B 0 .
184
8.6.2.
Determinante de un endomorfismo
Definición 8.6.2 Sean (V, [ω]), (V 0 , [ω 0 ]) dos espacios vectoriales orientados. Diremos que un isomorfismo F : V → V 0 preserva las orientaciones si F ∗ ω 0 ∈ [ω].
Obsérvese que esta definición es independiente del representante ω 0
escogido. Además, si F preserva las orientaciones [ω] y [ω 0 ], entonces
también preserva las orientaciones opuestas.
El hecho de que Λn (V ) tenga dimensión 1 permite definir el determinante cuando F es un endomorfismo.
Definición 8.6.3 Sea F un endomorfismo de V y consideremos el
correspondiente endomorfismo
F ∗ : Λn (V ) → Λn (V )
w 7→ F ∗ w
del espacio vectorial monodimensional Λn (V ). Llamamos determinante
de F al único número real det F ∈ R que verifica
F ∗ = det F · IdΛn (V ) .
Esta definición coincide, para cualquier base B = (v1 , . . . , vn ), con la
del determinante usual de la matriz M (F, B) cuya columna j−ésima
está formada por las coordenadas de F (vj ) en B. De hecho, es fácil
comprobar de la Definición 8.6.3 y las propiedades del tensor TB :
Proposición 8.6.4 (1) Si F es un endomorfismo de V y B = (v1 ,
. . . , vn ) es una base ordenada suya, entonces se verifica
det F = TB (F (v1 ), . . . , F (vn )) = det(M (F, B)).
(2) Sea F un automorfismo de V . Se verifica que det F > 0 si y sólo
si F ∗ ω ∈ [ω] para algún (y, entonces, para todo) elemento de volumen
ω, esto es, si y sólo si F aplica bases positivamente orientadas en bases
positivamente orientadas.
8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R)
8.6.3.
185
El elemento de volumen métrico orientado
Consideremos ahora que, en el espacio vectorial orientado (V, [ω]),
fijamos un producto escalar g = h·, ·i.
Definición 8.6.5 Se define el elemento de volumen métrico orientado
de (V, g, [ω]) como
µ+
g := TB0 ,
donde B0 es cualquier base de V ortonormal y positivamente orientada.
Resulta inmediato de (8.11) que, en esta definición, TB0 no depende de
la base B0 (ortonormal y positivamente orientada) escogida.
Por simplicidad, omitiremos en la notación la dependencia del elemento de volumen métrico con la orientación, y escribiremos únicamente µg . No obstante, cuando nos refiramos al elemento de volumen
métrico con la orientación opuesta, escribiremos µ−
g.
Obsérvese que si fijamos una base B = (v1 , . . . , vn ) de V entonces
se tiene:
µg = µg (v1 , . . . , vn ) · TB = det(IdV , B0 ← B) · TB ,
donde B0 es cualquier base ortonormal, positivamente orientada. Ahora
bien, considerando las matrices MB (g), MB0 (g) de la métrica g en las
bases B, B0 , respectivamente, se tiene
MB (g) = M (IdV , B0 ← B)t · MB0 (g) · M (IdV , B0 ← B).
Por tanto, deducimos que
|det MB (g)| = det (M (IdV , B0 ← B))2 .
En resumen:
Proposición 8.6.6 Si B es cualquier base positivamente orientada de
(V, [ω], g), entonces:
p
µg = |det MB (g)| TB .
Por último, es de señalar que la definición de determinante de un endomofismo se puede extender a la de determinante de una aplicación
lineal entre dos espacios vectoriales métricos orientados de igual dimensión.
186
Definición 8.6.7 Sean (V, g, [ω]), (V 0 , g 0 , [ω 0 ]) dos espacios vectoriales métricos orientados de igual dimensión, y F : V → V 0 una aplicacion lineal. Se define el determinante de F como el único número real
det F ∈ R que verifica
F ∗ µg0 = det F · µg .
Obviamente, si F es un endomorfismo de V entonces las Definiciones
8.6.3 y 8.6.7 coinciden para todo g y [ω], siempre y cuando se supongan
g 0 = g y [ω 0 ] = [ω].
8.7.
Apéndice 3: r−formas y orientación
en variedades
8.7.1.
El álgebra de r−formas diferenciales
De manera inmediata, todo el álgebra de tensores antisimétricos
desarrollada en las secciones anteriores para un espacio vectorial se
traspasa a variedades diferenciables. Ası́, un un campo tensorial antisimétrico r-covariante o r−forma diferencial β ∈ Λr (Q) se escribirá en
coordenadas:
X
β=
βi1 ···ir dq i1 ∧ · · · ∧ dq ir , i1 , . . . , ir ∈ {1, . . . , n}. (8.12)
1≤i1 <···<ir ≤n
con βi1 ···ir = β(∂i1 · · · ∂ir ). Se define el álgebra exterior
Λ(Q) ≡ (⊕nr=0 Λr (Q), ∧)
entendiéndose la acción natural del producto exterior ∧ punto a punto.
Como para cualquier campo tensorial, la diferenciabilidad de cada r-forma equivale a que las funciones ai1 ···ir sean diferenciables para
cualesquiera entornos coordenados (aunque basta con que la diferenciabilidad se verifique para las cartas de un atlas). Análogamente, se
pueden definir r−formas que sean sólo continuas o medibles, según el
carácter de las funciones que inducen sus coordenadas sobre abiertos
de Rn .
8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN
8.7.2.
187
Orientación de una variedad
Dada una n−variedad Q, un elemento de volumen (resp. orientación)
sobre Q se define como una asignación diferenciable de un elemento de
volumen sobre cada Tp Q:
Definiciones 8.7.1 (1) Un elemento de volumen sobre Q es una nforma diferenciable Ω que no se anula en ningún punto.
(2) Una orientación sobre una variedad Q es una elección en cada
p ∈ Q de una orientación [ωp ] de Tp Q que resulta diferenciable en el
sentido de que para todo p ∈ Q existe un entorno Up y un elemento de
volumen Ω sobre Up tal que Ωp0 ∈ [ωp0 ] para todo p0 ∈ Up .
Proposición 8.7.2 Sea Q una variedad diferenciable. Son equivalentes:
(1) Q admite un elemento de volumen.
(2) El C ∞ (Q)-modulo Λn (Q) esta generado por un elemento Ω0 , esto
es, Λn (Q) = {f Ω0 : f ∈ C ∞ (Q)}.
(3) Q admite una orientación.
(4) Cada parte conexa de Q admite exactamente dos orientaciones.
Idea de la Demostración. Resultan inmediatas la equivalencia (2) ⇔
(1) ⇒ (3). (3) ⇒ (1) se demuestra usando una partición de la unidad
µi subordinadaPal recubrimento de los Up en la Definición 8.7.1(2), y
tomando Ω = i µi Ωpi .
Para la equivalencia con (4), obsérvese que la orientación determinada por el elemento de volumen Ω es distinta a la de −Ω. Además, si
Q es conexa no pueden existir más de dos orientaciones por (2): la determinada por f Ω0 y la determinada por −f Ω0 , para cualquier f > 0.
2
Definición 8.7.3 Una variedad diferenciable Q se dice orientable si
(alguna de) las condiciones de la Proposición 8.7.2 se verifican. En
este caso, al par (Q, [Ω]) se le llama variedad orientada, siendo Ω un
elemento de volumen y [Ω] la orientación que define.
188
Para simplificar la notación, escribiremos (Q, [Ω]) ≡ +Q, y −Q denotará la variedad orientada con la orientación opuesta. Todo abierto de
una variedad orientada se supone asimismo orientado por la restricción
de la orientación.
A continuación centraremos nuestra atención en el comportamiento de
la orientación respecto a los difeomorfismos locales y, en particular,
respecto de los entornos coordenados.
Definición 8.7.4 Sea F : Q0 → Q un difeomorfismo local y [Ω] una
orientación sobre Q. Se define la orientación inducida por F en Q0
como [F ∗ Ω]. Si suponemos prefijada una orientación [Ω0 ] en Q0 , se
dice que F preserva la orientación si [Ω0 ] = [F ∗ Ω].
Ejercicio. Pruébese que si Q es conexa entonces un difeomorfismo
local F : +Q → +Q preserva o no la orientación con independencia de
la que se escoja.
En Rn , la orientación canónica o usual es [dx1 ∧· · ·∧dxn ]. Si F : U → V
es un difeomorfismo local entre dos abiertos U, V de Rn entonces F
preserva la orientación si y sólo si detJ (F ) > 0.
Proposición 8.7.5 Sea Q una variedad diferenciable. Son equivalentes:
(1) Q es orientable,
(2) Existe un recubrimiento por entornos coordenados de Q con cambios de carta de jacobiano positivo.
En este caso, escogida una orientación en Q, existe un atlas cuyas
cartas coordenadas preservan la orientación de Q y la usual de R.
Demostración. (1)⇒(2) Observemos previamente que, escogida una
orientación, para cada entorno coordenado (U, ϕ ≡ (q 1 , . . . , q n )) con U
conexo, la aplicación ϕ : U → ϕ(U ) ⊆ Rn o conserva la orientación
o la invierte en todo punto. En este último caso, podemos definir la
carta ϕ̃ ≡ (q 1 , . . . , qn−1 , −qn ), que sı́ la conservarı́a. El atlas ası́ formado
verifica la propiedad deseada. En efecto, como la composición de dos
difeomorfismos locales que preservan la orientación también preserva la
orientación, cada cambio de coordenadas conserva la orientación usual
de Rn , de donde se sigue el resultado.
8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN
189
(2)⇒(1) Escojamos para cada p ∈ Q la orientación inducida por
cada carta del recubrimiento. Esta elección es consistente, esto es, si
(U, ϕ), (W, ψ) son dos de tales cartas, la orientación inducida por ψ
es la misma que por ϕ en U ∩ W (ψ = (ψ ◦ ϕ−1 ) ◦ ϕ se expresa como
composición de dos difeomorfismos que preservan la orientación). 2
Ejercicio. Demuéstrese que si Q es una variedad orientable entonces
admite exactamente 2c orientaciones, siendo c el número de partes
conexas de Q.
8.7.3.
El recubridor de dos hojas orientable
Aunque existen conocidos ejemplos de variedades no orientables
(cinta de Moebius, botella de Klein, superficie proyectiva real), la restricción de orientabilidad no se considera muy restrictiva por la existencia, en este caso, de un recubridor de dos hojas orientable.
Definición 8.7.6 Sean Q, Q̃ dos variedades diferenciables, Q conexa.
Una aplicación diferenciable Π : Q̃ → Q es recubridora si para cada
p ∈ Q existe un entorno conexo U tal que Π−1 (U ) es una unión disjunta
de k ∈ N ∪ {∞} abiertos conexos Π−1 (U ) = ∪ki=1 Ũi tales que cada
restricción Π|Ũi es un difeomorfismo sobre U .
En este caso, k es constante, y se dice que (Q̃, Π) es un recubridor
de k hojas de Q.
Ası́, son aplicaciones recubridoras de infinitas hojas R → S 1 (⊂ R2 ≡
C), t 7→ eit , o la proyección canónica R2 → R2 /Z2 , donde el cociente
es identificable con un toro. En variable compleja, las superficies de
Riemann de k hojas construidas para una función k−multivaluada son
recubridoras en el sentido anterior. No es difı́cil construir una aplicación
recubridora de dos hojas del cilindro (orientable) en la cinta de Moebius
(no orientable). Este ejemplo se puede generalizar a cualquier variedad
Q como sigue.
Definamos a partir de la variedad conexa Q la siguiente nueva variedad.
Como conjunto consideramos Q̃ = {(p, Op ) : p ∈ Q, Op es una
orientación en Tp Q}. Para la topologı́a y la estructura diferenciable,
consideramos para cada p̃ = (p, Op ) ∈ Q̃ una carta (U, ϕ) tal que U es
conexo, p ∈ U y ϕ preserva la orientación Op . Definimos entonces un
190
entorno coordenado (Ũ , ϕ̃) de Q̃ como
ϕ̃ : Ũ → Rn
(q, Oq ) 7→ ϕ(q),
siendo Ũ = {(q, Oq ) : q ∈ U, Oq la orientación inducida por ϕ en q}.
Se verifican entonces las siguientes propiedades:
(i) Por construcción, la aplicación Π es un recubridor de dos hojas,
y Q̃ es orientable;
(ii) Q es orientable si y sólo si Q̃ tiene dos partes conexas.
En particular, se demuestra ası́:
Teorema 8.7.7 Toda variedad diferenciable no orientable conexa Q
admite un recubridor de dos hojas (Q̃, Π) tal que Q̃ es orientable y
conexo.
Ejercicio. Una variedad producto Q1 × Q2 es orientable si y sólo si
Q1 y Q2 lo son.
Por último, es de señalar que la idea de la construcción del recubridor de dos hojas orientables está en la base del siguiente importante
resultado, en el que el papel del conjunto de las dos orientaciones en
cada punto lo pasa a desempeñar el conjunto de las clases de lazos
homotópicos en cada punto.
Teorema 8.7.8 Toda variedad diferenciable conexa Q admite un recubridor universal, esto es, un recubridor (Q̃, Π) tal que Q̃ es simplemente conexo.
Es de remarcar que el concepto de recubridor es válido en el contexto más general de los espacios topológicos arcoconexos, sin más que
reemplazar la diferenciabilidad de las aplicaciones por continuidad –en
particular difeomorfismos locales por homeomorfismos locales. En este
contexto también se mantiene el Teorema 8.7.8, con alguna condición
topológica poco restrictiva (hay que suponer que, además de ser arcoconexo, Q verifica que todo punto admite un entorno simplemente
conexo –propiedad ésta que verifica cualquier obviamente variedad).
Capı́tulo 9
Teorema de Stokes
El objetivo fundamental de este capı́tulo es estudiar la versión general
del Teorema de Stokes, y algunas de sus aplicaciones más importantes.
Para ello, previamente veremos algunos conceptos que necesitaremos
para entender dicho teorema, como son las derivaciones y antiderivaciones tensoriales, y las variedades con borde. A continuación, enunciaremos y demostraremos el Teorema de Stokes, y estudiaremos algunos
resultados clásicos que se derivan de él.
9.1.
Derivaciones y antiderivaciones tensoriales
9.1.1.
Derivación tensorial
El concepto de derivación usual puede extenderse al espacio de los
campos de tensores sobre una variedad. Para ello, es necesario introducir previamente el concepto de contracción, que generaliza el de traza
para endomorfismos y tensores (1, 1).
Definición 9.1.1 Sea V (R) un espacio vectorial de dimensión n ∈ N,
y consideremos un tensor T ∈ Tr,s (V ) con r, s ≥ 0. Dada una base B = (v1 , . . . , vn ) de V se define el tensor contraı́do de T respec191
192
CAPÍTULO 9. TEOREMA DE STOKES
to a los ı́ndices i−ésimo covariante y j-ésimo contravariante, Cij T ∈
Tr−1,s−1 (V ), con i ∈ {1, . . . , r}, j ∈ {1, . . . , s} como:
Cij T (w1 , . . . , wr−1 , ψ 1 , . . . , ψ s−1 )
=
n
X
T (w1 , . . . , wi−1 , vk , wi+1 , . . . , wr−1 , ψ 1 , . . . , ψ j−1 , φk , ψ j , . . . , ψ s−1 )
k=1
donde B tiene por base dual a B ∗ = (φ1 , . . . , φn ).
Resulta inmediato que esta definición es independiente de la base B
escogida pues, fijados los argumentos de todos los ı́ndices de T salvo el
i y el j-ésimos, se tiene un tensor (1, 1) al cual se le está calculando la
traza. Asimismo, resulta obvio de la definición que Cij T es un tensor
(r − 1, s − 1).
En adelante consideraremos el espacio vectorial y C∞ (Q)−módulo
T (Q) = ⊕r,s Tr,s (Q), cuyos elementos se pueden escribir como una suma
finita de elementos en cada Tr,s (Q).
Definición 9.1.2 Una derivación tensorial D : T (Q) → T (Q) es una
aplicación R-lineal tal que D(Tr,s (Q)) ⊂ Tr,s (Q) y verifica, para todo
T, T 0 ∈ T (Q):
(i) Regla de Leibniz: D(T ⊗ T 0 ) = DT ⊗ T 0 + T ⊗ DT 0
(ii) Conmutabilidad con las contracciones: D(Cij T ) = Cij DT .
Nota. En esta definición, las funciones se consideran como campos
tensoriales (0,0), y el producto de una función por un tensor como un
producto tensorial. De hecho, la regla de Leibniz (i) generaliza a la que
verifican los campos vectoriales, y ası́ D |C ∞ (Q) es identificable a un
campo vectorial V ∈ X(Q).
Se comprueban sin dificultad las siguientes propiedades de las derivaciones tensoriales:
Propiedades:
(1) Localidad. Si T, T 0 ∈ T (Q) y T = T 0 en un entorno U de p, entonces DTp = DTp0 . En particular, si D es una derivación tensorial
9.1. DERIVACIONES Y ANTIDERIVACIONES
193
sobre Q y U es un abierto, existe una única derivación tensorial
DU sobre U tal que:
DU (A |U ) = (DA) |U
∀A ∈ T (Q)
(en adelante se usará la misma letra D para denotar DU ).
Demostración. Tómese una función ρ ∈ C ∞ (Q) con soporte en
U , y que sea distinta de 0 en p. Entonces ρT ≡ ρT 0 por lo que,
aplicando la derivación en ambos miembros:
D(ρ)T + ρD(T ) = D(ρ)T 0 + ρD(T 0 )
en todo punto. Evaluando en p y usando ρ(p) 6= 0 se sigue el
resultado inmediatamente.
(2) Unicidad. El valor de D sobre C ∞ (Q) y X(Q) (resp., sobre C ∞ (Q)
y Λ1 (Q)), determina unı́vocamente a D.
Ası́, si D y D0 son dos derivaciones tensoriales que coinciden sobre
C ∞ (Q) y X(Q) (resp. sobre C ∞ (Q) y Λ1 (Q)) entonces D = D0 .
Demostración. Sean ω ∈ Λ1 (Q), X ∈ X(Q). Puesto que ω(X) =
C11 (ω ⊗ X), necesariamente
D(ω(X)) = (Dω)(X) + ω(DX).
(9.1)
Ası́, determinado el valor de D sobre la función ω(X) y el campo
vectorial X se deduce el valor de Dω (análogamente, si se tiene
determinado D sobre la forma diferencial ω). Para el resto de
campos tensoriales, la demostración se sigue con facilidad por
inducción. Ası́, si T es un campo tensorial (2, 0), obsérvese que
T (X, Y ) = C11 (C11 (T ⊗ X ⊗ Y )) por lo que se tendrá:
(DT )(X, Y ) = D(T (X, Y )) − T (DX, Y ) − T (X, DY ).
(9.2)
(3) Existencia. Sea V ∈ X(Q) cualquier campo vectorial, y δ : X(Q) →
X(Q) una aplicación R-lineal tal que δ(f X) = V (f )X + f δ(X),
∀f ∈ C ∞ (Q), ∀X ∈ X(Q). Entonces existe una (única) derivación
tensorial D tal que D |C ∞ (Q) ≡ V y D |X(Q) ≡ δ.
Demostración. Obsérvese que, si existiera tal D, su valor sobre
cualquier campo tensorial quedarı́a determinado por las igualdades (9.1), (9.2) (y otras análogas obtenidas inductivamente).
Basta entonces con definir D por tales igualdades.
194
La siguiente derivación tensorial tiene gran interés1 , y será definida
haciendo uso de la propiedad (3).
Definición 9.1.3 Sea Q una variedad diferenciable. Se define la derivada de Lie según V ∈ X(Q), como la única derivación tensorial que verifica: (i) LV f = V (f ) ∀f ∈ C ∞ (Q), (ii) LV (X) = [V, X] ∀X ∈ X(Q).
Ejercicio. Pruébense las siguientes propiedades de la derivada de Lie:
(a) L[X,Y ] = LX ◦ LY − LY ◦ LX ∀X, Y ∈ X(Q).
0
(b) Consideremos ω ∈ Λr (Q), ω 0 ∈ Λr (Q) y X ∈ X(Q). Se verifican:
(i) LX ω ∈ Λr (Q), (ii) LX (ω ∧ ω 0 ) = (LX ω) ∧ ω 0 + ω ∧ (LX ω 0 ).
Ejercicio. Demuéstrese:
(1) Si D una derivación tensorial, y V ≡ D |C ∞ (Q) , entonces D − LV
restringido sobre X(Q) es C ∞ (Q)-lineal y, por tanto, identificable a un
campo de endomorfismos.
(2) Dados V ∈ X(Q) y A ∈ T1,1 (Q) existe una única derivación D
tal que V = D |C ∞ (Q) y (D − LV ) |X(Q) ≡ A.
9.1.2.
Antiderivación tensorial
Aprovechando las propiedades de antisimetrı́a del producto exterior, es posible introducir un tipo de derivación especı́fica para los
tensores antisimétricos.
Definición 9.1.4 Una antiderivación de grado p ∈ Z en Λ(Q) es una
aplicación R-lineal D : Λ(Q) → Λ(Q) que verifica:
(i) D(Λr (Q)) ⊂ Λr+p (Q) (asuminos el convenio: Λ−r (Q) ≡ 0, ∀r ∈
N),
(ii) D(ω∧ω 0 ) = (Dω)∧ω 0 +(−1)r ω∧Dω 0
(Regla de Leibniz).
0
∀ω ∈ Λr (Q), ∀ω 0 ∈ Λr (Q)
La generalidad permitida de que se pueda aumentar o disminuir en p el
tipo de forma tensorial se revelará útil para antiderivaciones2 Resulta
1
También tendrán interés las derivaciones asociadas a un conexión afı́n ∇ sobre
una variedad diferenciable Q (véase el Tema 10). Dada una tal ∇, la derivada
covariante según V ∈ X(Q) se define como la única derivación tensorial que verifica:
(i) ∇V (f ) = V (f ) ∀f ∈ C ∞ (Q), (ii) ∇V (X) = ∇V X ∀X ∈ X(Q).
2
No precisaremos una propiedad similar para derivaciones, por lo que no se
admite tal posibilidad para ellas (pero compárese con el Apéndice del Tema ??).
195
inmediato comprobar las siguiente propiedades de las antiderivaciones,
que son análogas a las de las derivaciones tensoriales.
Propiedades:
(1) Localidad. Las antiderivaciones tensoriales son también operadores locales; esto es, si U es un abierto de Q y ω |U ≡ ω 0 |U entonces
(Dω) |U = (Dω 0 ) |U para todo ω, ω 0 ∈ Λ(Q). En particular,
(i) si f ∈ C ∞ (Q) ≡ Λ0 (Q) es constante en un entorno U de p,
(Df )p ≡ 0,
(ii) D define de manera natural derivaciones en cada abierto de
Q.
(2) “Unicidad”. Determinado el valor de D sobre C ∞ (Q) y Λ1 (Q),
se determina sobre todo Λ(Q).
Nos interesarán dos simples casos particulares de antiderivaciones, una
de grado 1 y otra de grado -1. La primera de ellas es sólo la generalización de la diferencial estudiada en el Tema 6.
Definición 9.1.5 Sea Q una variedad diferenciable de dimensión n.
Se define la derivada exterior de ω como la (r +1)-forma dω ∈ Λr+1 (Q)
que en coordenadas locales (U, q 1 , . . . , q n ) de Q tiene la expresión
dω :=
X
dωi1 ...ir ∧ dq i1 ∧ · · · ∧ dq ir ,
(9.3)
1≤i1 <···<ir ≤n
P
siendo ω := 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧· · ·∧dq ir , y dωi1 ...ir la diferencial
usual de funciones.
Repitiendo pasos análogos a los de la Proposición 6.4.2 no es difı́cil
comprobar que esta definición resulta independiente de las coordenadas
elegidas.
Obsérvese que de la expresión (9.3) se deduce directamente que la
derivada exterior sobre las funciones coincide con la diferencial usual. Para las (n − 1)-formas diferenciales, la siguiente expresión de la
diferencial exterior, que usaremos más adelante, también es inmediato
196
Proposición 9.1.6 Sea ω ∈ Λn−1 (Q) una (n − 1)-forma diferencial.
Entonces, en coordenadas locales ω admite la expresión:
ω=
n
X
ci ∧ · · · ∧ dq n ,
(−1)i−1 ωi dq 1 ∧ · · · ∧ dq
i=1
(donde el signo b· indica que se suprime el término que cubre), y ası́:
Ã n
!
X ∂ωi
dω =
dq 1 ∧ · · · ∧ dq i ∧ · · · ∧ dq n .
i
∂x
i=1
El siguiente resultado es general.
Proposición 9.1.7 La derivada exterior satisface la igualdad d2 = 0.
Demostración. Aplicando directamente la definición de diferencial exterior se tiene:
³P
´
Pn ∂ωi1 ···ir j
i1
ir
d(dω) = d
dq
∧
dq
∧
·
·
·
∧
dq
j
1≤i1 <···<ir ≤n
´
³P j=1P ∂q
P
∂ωi1 ···ir
n
n
i
j
dq
∧
dq
∧ dq i1 ∧ · · · ∧ dq ir
= 1≤i1 <···<ir ≤n
j=1
i=1 ∂q i ∂q j
= 0,
donde se ha usado que, por la igualdad entre las derivadas cruzadas,
el paréntesis del último término es nulo. 2
Ejercicio. Pruébense las siguientes caracterizaciones de la diferencial
exterior:
(1.) La diferencial exterior es la única antiderivación tensorial que
coincide con la diferencial usual sobre las funciones y que verifica
d ◦ d = 0.
(2.) La diferencial exterior es la antiderivación tensorial definida, para
todo ω ∈ Λr (Q), por:
P
dω(X0 , X1 , . . . , Xr ) = ri=0 (−1)i Xi (ω(X0 , . . . , X̂i , . . . , Xr ))
P
+ 0≤i<j≤r (−1)i+j ω([Xi , Xj ], X0 , . . . , X̂i , . . . , X̂j , . . . , Xr ).
donde el sı́mbolo ˆ sobre un argumento indica que éste ha sido
suprimido.
197
Proposición 9.1.8 Consideremos dos variedades diferenciables Q, Q0
y una aplicación diferenciable entre ellas F : Q0 → Q. Si ω ∈ Λ(Q)
entonces se verifica
d(F ∗ ω) = F ∗ dω.
Demostración. Basta con considerar ω ∈ Λr (Q) para r arbitrario, y
restringirnos a un abierto. Nótese previamente que si f : Q → R
entonces
F ∗ df = d(f ◦ F ),
(9.4)
ya que F ∗ df (v)
P = df ◦ dF (v) = d(f ◦ F )(v) para todo v ∈ T Q. Por
tanto, si ω = 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧ · · · ∧ dq ir entonces
P
F ∗ ω = P1≤i1 <···<ir ≤n (F ∗ ωi1 ···ir ) F ∗ dq i1 ∧ · · · ∧ F ∗ dq ir
= 1≤i1 <···<ir ≤n (ωi1 ···ir ◦ F ) d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F ).
En consecuencia, usando de nuevo (9.4) se deduce:
P
d(F ∗ ω) = 1≤i1 <···<ir ≤n d(ωi1 ···ir ◦ F ) ∧ d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F )
P
= F ∗ 1≤i1 <···<ir ≤n dωi1 ···ir ∧ dq i1 ∧ · · · ∧ dq ir
= F ∗ dω. 2
La otra antiderivación que también desempeñará un papel importante más adelante es el producto interior. Pero, previamente, conviene
tener presente el siguiente ejercicio elemental.
Ejercicio. Sea V un espacio vectorial, v ∈ V y ω ∈ Λr (V ). Se define
el producto interior de ω según v, iv ω ∈ Λr−1 (V ), como:
iv ω(v1 , . . . , vr−1 ) := ω(v, v1 , . . . , vr−1 ) ∀v1 , . . . , vr−1 ∈ V.
Pruébese que se verifican:
(i) iv : Λr (V ) → Λr−1 (V ) es una aplicación lineal,
(ii) iv (ω ∧ ω 0 ) = (iv ω) ∧ ω 0 + (−1)r ω ∧ (iv ω 0 ),
0
Λr (V ).
∀ω ∈ Λr (V ), ω 0 ∈
Definición 9.1.9 Sea Q una variedad diferenciable de dimensión n.
Se define el producto interior iX según X ∈ X(Q) como la única antiderivación de grado −1 tal que: (i) iX (f ) = 0 para todo f ∈ C ∞ (Q),
(ii) iX (ω) = ω(X) para todo ω ∈ Λ1 (Q).
198
Si bien la unicidad viene garantizada por la propiedad (2) de las antiderivaciones, para asegurar su existencia se debe aplicar el ejercicio
anterior.
Obsérvese que de la definición de producto interior se deduce fácilmente el siguiente resultado.
Proposición 9.1.10 Si X, Y ∈ X(Q) y f, h ∈ C ∞ (Q) entonces
(1) if X+hY = f iX + h iY
(2) iX df = X(f ).
9.1.3.
Teorema de Cartan
Consideremos un campo de vectores X sobre una variedad diferenciable Q.
Lema 9.1.11 El operador definido por DX := iX ◦ d + d ◦ iX : Λ(Q) →
Λ(Q) es R-lineal y verifica la regla de Leibniz; esto es,
DX (ω ∧ ω 0 ) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ) ∀ω, ω 0 ∈ Λ(Q).
(9.5)
Demostración. Dado que DX es manifiestamente lineal, basta con de0
mostrar (9.5) para ω ∈ Λr (Q), ω 0 ∈ Λr (Q). Se tiene entonces:
iX ◦ d(ω ∧ ω 0 ) = iX (dω ∧ ω 0 + (−1)r ω ∧ dω 0 )
= (iX dω) ∧ ω 0 + (−1)r+1 dω ∧ (iX ω 0 )
+(−1)r (iX ω) ∧ dω 0 + (−1)2r ω ∧ iX dω 0 ,
(9.6)
d ◦ iX (ω ∧ ω 0 ) = d((iX ω) ∧ ω 0 + (−1)r ω ∧ (iX ω 0 ))
= (d ◦ iX ω) ∧ ω 0 + (−1)r−1 (iX ω) ∧ dω 0
(9.7)
r
0
2r
0
+(−1) dω ∧ (iX ω ) + (−1) ω ∧ (d ◦ iX ω ).
Por tanto, sumando (9.6) y (9.7), y simplificando los términos que se
cancelan, se obtiene:
DX (ω ∧ ω 0 ) = (iX dω) ∧ ω 0 + (d ◦ iX ω) ∧ ω 0 + (−1)2r ω ∧ (iX ◦ dω)
+(−1)2r ω ∧ (d ◦ iX ω) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ). 2
Ya estamos listos para demostrar la siguiente relación debida a Cartan.
9.2. VARIEDADES CON BORDE
199
Teorema 9.1.12 (de Cartan) Dado un campo de vectores X ∈ X(Q)
se verifica
LX = iX ◦ d + d ◦ iX .
(9.8)
Demostración. Por el Lema 9.1.11 y las propiedades de unicidad de
las derivaciones, basta con comprobar la igualdad (9.8) sobre C ∞ (Q)
y Λ1 (Q). Ası́, si f ∈ C ∞ (Q) se tiene
DX f = iX ◦ df + d ◦ iX f = iX ◦ df = X(f ) = LX (f ).
Y, en el caso Y ∈ X(Q) y ω ∈ Λ1 (Q), se tiene
DX ω(Y ) = (iX ◦ dω + d ◦ iX ω)(Y ) = dω(X, Y ) + d(ω(X))(Y )
= X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) + Y (ω(X))
= (LX ω)(Y ).
como se querı́a.
2
Como consecuencia inmediata del Teorema de Cartan se obtiene el
siguiente resultado:
Corolario 9.1.13 LX y d conmutan; esto es,
d LX ω = LX dω
∀X ∈ X(Q), ∀ω ∈ Λr (Q).
Demostración. Aplicando el Teorema de Cartan y la Proposición 9.1.7
dos veces se tiene:
dLX ω = d(iX dω + diX ω) = (d ◦ iX )dω = (LX − iX ◦ d)dω = LX dω. 2
Ejercicio. Redemuéstrese este corolario usando que (localmente) LX ω =
d ∗
φ ω y d ◦ φ∗t = φ∗t ◦ d, siendo φt el flujo local de X.
dt t
Ejercicio. Demuéstrese la igualdad i[X,Y ] ω = LX (iY ω) − LY (iX ω).
9.2.
Variedades con borde
En esta sección vamos a estudiar el concepto de variedad con borde.
Para ello, previamente necesitaremos algunas nociones sobre diferenciabilidad en abiertos de Rn+ .
200
9.2.1.
Diferenciabilidad en abiertos de Rn+
En adelante usaremos la notación Rn+ = {(x1 , . . . , xn ) ∈ Rn : xn ≥
0}. Si U es un abierto de Rn+ , escribiremos Int(U ) para denotar al
interior de U visto como subconjunto de Rn :
Int U = {(x1 , . . . , xn ) ∈ U : xn > 0}.
Por otra parte, escribiremos ∂U para denotar su borde:
∂U = U \ Int U = {(x1 , . . . , xn ) ∈ U : xn = 0}.
Cabe señalar que, en general, el borde ∂U no coincide con la frontera
topológica de U (ni en Rn ni en Rn+ ).
Definición 9.2.1 Sean U , V dos abiertos de Rn+ y F : U → V una
aplicación. Diremos que F es diferenciable en x ∈ U si existen abiertos
U1 y V1 de Rn con x ∈ U1 y F (x) ∈ V1 , y una aplicación diferenciable
en x0 , F1 : U1 → V1 , tal que F1 |U1 ∩U = F |U1 ∩U . En este caso, definimos
(dF )x0 := (dF1 )x0 : Tx0 Rn ≡ Rn → TF1 (x0 ) Rn ≡ Rn .
Es fácil comprobar que esta definición es independiente de la extensión
F1 escogida (d(F1 )x0 queda fijada por su valor sobre n vectores tangentes independientes, que pueden tomarse asociados a curvas definidas
en ] − ², 0] o [0, ²[ incluidas en RN
+ ). Análogamente, se definen la diferm
enciabilidad cuando V ⊂ R+ , la diferenciabilidad en (todo) U , o el
concepto de difeomorfismo. En particular, si F es un difeomorfismo
entonces dFx0 es biyectiva.
Lema 9.2.2 Sea F : U ⊆ Rn+ → Rn+ una aplicación diferenciable:
(1) Si x0 ∈ Int(U ) y F (x0 ) ∈ ∂Rn+ entonces, con las identificaciones
naturales, (dF )x0 (Rn ) ⊆ ∂Rn+ .
(2) Si V = F (U ) es un abierto de Rn+ y F es un difeomorfismo sobre V
entonces induce por restricción los difeomorfismos Int F : IntU → IntV
y ∂F : ∂U → ∂V .
Demostración. (1) Como F (x0 ) ∈ ∂Rn+ , se tiene para todo v ∈ Tx0 Rn
y t ∈ R:
0 ≤ xn (F (x0 + tv)) = xn (F (x0 ) + dFx0 (tv) + o(tv))
= xn (dFx0 (tv)) + xn (o(tv)),
(9.9)
201
donde lı́mt→0 o(tv)
= 0. Por tanto, multiplicando ambos miembros de
t
(9.9) por 1/t y tomando lı́mite t → 0+ , se obtiene
xn (dFx0 (v)) ≥ 0.
(9.10)
Ahora bien, dado que (9.10) se verifica para todo v, en particular se
verifica para −v. Luego,
−xn (dFx0 (v)) = xn (dFx0 (−v)) ≥ 0.
Por tanto, xn (dFx0 (v)) = 0 para todo v ∈ Tx0 Rn . Esto es, dFx0 (Rn ) ⊆
∂Rn+ .
(2) Del apartado (1) se sigue que F (Int(U )) ⊂ IntV y F −1 (IntV ) ⊂
IntU . Luego se puede definir IntF : IntU → IntV , que es necesariamente un difeomorfismo. Por ser F biyectiva, también se puede definir
∂F : ∂U → ∂V , que es también biyectiva. Para demostrar que ∂F
(definida entre abiertos de Rn−1 ) es un difeomorfismo, nótese que si
x0 ∈ ∂U entonces


c1
µ i
¶

.. 
∂F

C
. 
=
(9.11)
(x
)

,
0
∂xj

cn−1 
i,j
0 ... 0
c
donde F i ≡ xi ◦ F , C =
³
´
∂(∂F )i
(x0 )
∂xj
i,j
y c > 0. Por tanto, todas
las derivadas parciales de ∂F existen, son diferenciables y forman una
matriz no singular. 2
Nota. Es de remarcar que, si se supone sólo que F sea sólo un homeomorfismo, entonces sigue siendo cierto que se inducen por restricción
homeomorfismos Int F : IntU → IntV y ∂F : ∂U → ∂V , si bien la
prueba de este resultado (basado en el “Teorema de la Invariancia del
Dominio”) es mucho más difı́cil de demostrar.
9.2.2.
Concepto de variedad con borde
La definición de variedad (diferenciable) con borde resulta completamente análoga a la de variedad diferenciable, con la única salvedad
de que las cartas locales toman ahora valores en Rn+ .
202
Ası́, una variedad diferenciable con borde es una variedad topológica
con borde (un espacio topológico Q, Hausdorff y ANII, localmente
homeomorfo a Rn+ ) dotado de una estructura diferenciable, esto es, un
atlas maximal cuyos cambios de carta son diferenciables, en el sentido
de la subsección anterior.
Obsérvese que, por el Lema 9.2.2 (2), el hecho de que, para una
carta coordenada (U, ϕ), el punto ϕ(p) pertenezca a ∂Rn+ o no, es independiente de la carta escogida. Ello permite distinguir entre los puntos
del interior y del borde de Q:
Definición 9.2.3 Sea A = {(Uα , ϕα ) : α ∈ I} un atlas de Q. Se
definen los conjuntos interior y borde de Q como:
IntQ := ∪α∈I ϕ−1
α (Intϕα (Uα ))
∂Q := ∪α∈I ϕ−1
α (∂ϕα (Uα )),
respectivamente.
Se comprueba con facilidad que si U es un abierto de Q entonces
IntU := U ∩ IntQ y ∂U = U ∩ ∂Q. Es más, del Lema 9.2.2 (2) también
se deduce inmediatamente:
Proposición 9.2.4 Sea Q una variedad con borde de dimensión n.
Entonces:
(i) IntQ es una variedad diferenciable (sin borde) de dimensión n.
(ii) Si no es vacı́o, el borde ∂Q es una variedad diferenciable (sin
borde) de dimensión n − 1, que admite como atlas diferenciable
las cartas formadas por la restricción a ∂Q de las (n−1) primeras
coordenadas de cada carta de Q.
El concepto de aplicación diferenciable entre variedades con borde se
mantiene de manera completamente análoga al del caso sin borde. Ello
incluye la diferenciabilidad de curvas del tipo γ : [a, b[→ Q ó γ :
]a, b] → Q, que se pueden usar para definir los vectores tangentes
(además de mediante derivaciones o por coordenadas). En cualquier
caso, el espacio tangente en un punto p ∈ Q resulta completamente
análogo al caso sin borde. Nótese que si p ∈ IntQ entonces, de manera
natural, Tp Q ≡ Tp (IntQ). Si p ∈ ∂Q entonces Tp Q también es un
203
espacio vectorial de dimensión n, pudiendo identificarse Tp ∂Q como
un subespacio vectorial de Tp Q de dimensión n − 1.
De hecho, dada un entorno coordenado (U, q 1 , . . . , q n ), para cada
p ∈ Q se induce una base de vectores tangentes
Pn i en∂ Tp Q, con lo que
todo vector tangente en p se escribe como i=1 a ( ∂qi ). Si p ∈ ∂Q, los
vectores tangentes con coordenada an = 0 se identifican con vectores
tangentes a ∂Q en p, con lo que se puede escribir Tp (∂Q) ⊂ Tp Q.
Usando la expresión (9.11), se comprueba directamente: si, en una
carta coordenada, la n-ésima coordenada de un vector tangente v a
un punto p del borde es mayor que cero (resp. menor que cero), ello
también ocurre cualquier otra carta coordenada que contenga a p. Ello
permite introducir las siguientes definiciones.
Definiciones 9.2.5 Sea p P
∈ ∂Q y v ∈ Tp Q. Para un entorno coordei
n
nado de p, escribamos v = n−1
i=1 a ∂q i |p + a ∂q n |p . Diremos que:
(i) v apunta al interior si an > 0,
(ii) v es tangente a ∂Q si an = 0,
(iii) v apunta al exterior si an < 0.
En particular, ∂qn |p apunta siempre al interior.
Ejercicio. Sean α : [0, ²[→ Q, β :] − ², 0] → Q dos curvas diferenciables con α(0) = β(0) = p ∈ ∂Q. Demuéstrese que:
(i) α0 (0) no apunta al exterior,
(ii) β 0 (0) no apunta al interior.
Por último, resulta obvio:
Proposición 9.2.6 Sea F : Q → Q0 un difeomorfismo entre dos variedades con borde. Entonces se inducen por restricción los difeomorfismos
IntF : IntQ → IntQ0
∂F : ∂Q → ∂Q0 .
204
9.2.3.
Orientación en el borde
La orientabilidad en una variedad con borde Q se define de modo
análogo al caso sin borde, estudiado en el Tema 8 (recuérdese que el
espacio tangente en los puntos del borde es de la misma dimensión que
la variedad), esto es, mediante:
(i) elementos de volumen ;
(ii) atlas cuyos cambios de carta tienen jacobiano positivo;
(iii) elecciones (diferenciables) de bases ordenadas;
(iv) existencia de un generador del C ∞ (Q)-módulo Λn (Q).
Además, de (ii) y teniendo en cuenta la expresión (9.11), se comprueba
directamente que si Q es orientable entonces ∂Q también lo es. Con
más precisión, vamos a mostrar ahora cómo una orientación sobre Q
induce una sobre ∂Q. Esencialmente, el problema se soluciona en cada
espacio tangente mediante la siguiente definición.
Proposición 9.2.7 Sean (V, [ω]) un espacio vectorial orientado de dimensión n, H ⊂ V un hiperplano y V ext ⊂ V \ U una de las dos partes
conexas de V \ U .
Existe una única orientación que verifica: si B 0 = (e2 , . . . , en ) de H
está positivamente orientada (respecto a [ω] y V ext ) si la base BN =
(N, e2 , . . . , en ) (o, equivalentemente, (e2 , . . . , en , (−1)n−1 N )) está positivamente orientada en (V, [ω]), donde N es cualquier vector de V ext .
Además, esta orientación coincide con la definida por iN ω |H , para
cualquier N ∈ V ext .
Llamaremos a esta orientación sobre H la orientación inducida por
ext
V
y [ω].
Demostración. Basta con demostrar que la orientación ası́ definida por
B 0 en H resulta independiente tanto B 0 como del vector N escogidos.
Ası́ si B̄ 0 es otra base de H y N̄ ∈ V ext , la matriz de cambio de base
verifica:


a1 0
...
0




 a2

M (IdV , BN ← B̄N̄ ) = 
 , con a1 > 0.
 ..

0
0
 .

M (IdV , B ← B̄ )
an
205
Esto es, la orientación de BN y BN̄ coincide si y sólo si coincide la de
B 0 y B̄ 0 , como se querı́a.
Por último, iN ω |H (e02 , . . . , e0n ) = ω(N, e02 , . . . , e0n ) > 0, por lo que
la orientación inducida en H coincide con la definida por iN ω|h . 2
En una variedad con borde orientada (Q, [ω]), podemos repetir en el
espacio tangente de cada p ∈ ∂Q la construcción anterior, de modo
que induzcamos una orientación en ∂Q. Ası́, tomamos V = Tp Q, H =
Tp ∂Q ⊂ Tp Q y consideramos sobre Tp ∂Q la orientación inducida por
[ωp ] y V ext = {N ∈ Tp Q : N apunta al exterior}.
Obsérvese que en cualquier carta (U, q 1 , . . . , q n ) coordenada alrededor de p, el campo −∂/∂q n apunta al exterior, por lo que la orientación
inducida sobre ∂Q ∩ U coincide con la restricción de i−∂qn ω (lo que demuestra la diferenciabilidad de la orientación). En resumen:
Definición 9.2.8 Sea (Q, [ω]) una n−variedad con borde orientada
de dimensión n. Se define la orientación inducida sobre ∂Q tomando,
para cada p = ∂Q cualquier vector tangente Np que apunte al exterior
(p. ej., Np = −∂/∂q n |p ), y definiendo la orientación equivalentemente
como:
(1.) La definida por la clase de equivalencia de iN ωp |Tp ∂Q
(2.) Aquélla para la cual una base B 0 = (e2 , . . . , en ) ⊂ Tp (∂Q) está positivamente orientada si y sólo si (N, e2 , . . . , en ) está positivamente orientada en Tp Q.
Ejercicio. Identificando Rn−1 con el hiperplano ∂Rn+ de Rn , compruébese que la orientación en ∂Rn+ inducida de la usual de Rn , coincide
con la usual de Rn−1 si y sólo si n es par.
Por otra parte, no debe olvidarse que la orientación en Q no sólo induce
una orientación en su borde sino también, trivialmente, una en Int Q.
Observaciones finales:
(1) Los conceptos de partición de la unidad y métrica (no degenerada) se traspasan directamente a variedades con borde3 .
3
Para ésta y otras propiedades puede resultar útil, dada una variedad con borde
Q, construir su “variedad doble” Q̂. Ésta se define como dos copias de Q con los
206
(2) Si Q es una variedad con borde entonces trivialmente ∂Q tiene
medida nula. Por tanto, todo sistema coordenado c.p.d. de IntQ
también lo es de Q, y toda variedad con borde admite un sistema
coordenado c.p.d.
(3) Como consecuencia, fijada una orientación en Q (resp. una métrica no degenerada en Q) se puede definir la integración de una
n-forma (resp. una función) de modo análogo al caso sin borde
(y obteniéndose que esta integral coincide con la integral sobre
Int Q).
(4) Todo lo que se ha visto en esta sección se traspasa sin dificultad a
las variedades con borde anguloso (o a trozos); esto es, variedades
topológicas que son “localmente difeomorfas” a abiertos de Rnm =
{(x1 , . . . , xn ) ∈ Rn : xm ≥ 0, . . . , xn ≥ 0}. Es de señalar, empero,
que éste es un concepto que, a diferencia del de variedad con
borde, sólo tiene sentido para variedades diferenciables, y no para
topológicas.
Ejercicio. Si Q es una variedad (orientable o no) con borde, pruébese
que existe un campo diferenciable N que apunta al exterior y que
está definido sobre todo ∂Q.
9.3.
Teorema de Stokes
En esta sección damos la versión general del Teorema de Stokes que,
esencialmente, se puede ver como una generalización a variedades de
dimensión arbitraria de la Regla de Barrow clásica. Por la importancia
de este resultado, rebajaremos los requisitos de diferenciabilidad que
habitualmente hemos usado.
puntos análogos de los bordes identificados. Ası́, IntQ se puede visualizar como un
abierto de Q̂, cuya frontera topológica coincide con la hipersuperficie regular ∂Q.
Un recubrimiento abierto de Q induce naturalmente uno de Q̂, y una partición de
la unidad subordinada a este recubrimiento de Q̂ induce por restricción una del
recubrimiento original. No obstante, debe tenerse presente que un campo tensorial
(v.gr., una métrica riemanniana) no tiene por qué poderse extender de manera
diferenciable de Q a la variedad doble.
9.3. TEOREMA DE STOKES
207
Teorema 9.3.1 (de Stokes): Sea +Q una variedad con borde orientada de dimensión n ≥ 2, i : ∂Q → Q la inclusión del borde en la
variedad, y ω una n − 1 forma continua sobre Q que sea diferenciable
C 1 en IntQ.
Si el soporte sop ω es compacto, entonces
Z
Z
∗
iω=
d ω,
+∂Q
+Q
donde +∂Q denota al borde de Q con la orientación inducida
por +Q.
R
En particular, si Q es una variedad sin borde entonces +Q d ω = 0.
Demostración. Sea {(Uα , ϕα )}α∈I un recubrimiento por entornos coordenados de Q y {ρi }i∈N una partición de la unidad subordinada,
sop ρP
i ⊂ Ui , i ∈ N. Puesto que sop ω es compacto, podemos suponer
ω = ki=1 ρi ω. En particular,
Z
k Z
X
d(ρi ω).
dω =
+Q
+Q
i=1
De la linealidad de esta igualdad, basta con probar el resultado para cada uno de los k sumandos. Esto es, sin perdida de generalidad,
podemos suponer sop ω incluido en un entorno coordenado (U, ϕ).
Podemos asumir que ϕ : U → ϕ(U ) ⊂ Rn+ está positivamente
orientada. Además, se verifica la igualdad i ◦ ∂ϕ−1 = ϕ−1 ◦ ĩ, siendo
ĩ : ∂(ϕ(U )) ⊂ ∂Rn+ ,→ ϕ(U ) ⊂ Rn+ . En consecuencia,
Z
Z
Z
−1∗
dω =
ϕ dω =
d(ϕ−1∗ ω)
n
n
+Q
+R+
+R+
y
Z
Z
i∗ ω =
+∂Q
Z
=
Z
+∂ R
−1 ∗
n
+
+∂ R
(i ◦ ∂ϕ ) ω =
n
+
(∂ϕ−1 )∗ i∗ ω
−1
n
+
+∂ R
(ϕ
Z
∗
◦ ĩ) ω =
n
+
+∂ R
ĩ∗ (ϕ−1∗ ω).
Luego no resulta restrictivo suponer que ω es una (n − 1)-forma sobre Rn+ , por lo que simplificaremos (ϕ−1∗ ω) por ω. Podemos escribir
entonces (Proposición 9.1.6):
ω=
n
X
ci ∧ · · · ∧ dxn .
(−1)i−1 ωi dx1 ∧ · · · ∧ dx
i=1
208
En este caso,
P
i
dω = ni=1 ∂ω
dx1 ∧ · · · ∧ dxi ∧ · · · ∧ dxn
∂xi
i∗ ω = (−1)n−1 ωn (x1 , . . . , xn−1 , 0) dx1 ∧ · · · ∧ dxn−1 |∂ Rn .
+
Integrando:
Z
n
+
+R
=
dω =
n
+
R
µZ
i=1
∂xi
dx1 · · · dxn
¶
∂ωi i
ci · · · dxn
dx dx1 · · · dx
i
n−2
R ×R+
−∞ ∂x
¶
µZ ∞
Z
∂ωn n
+ n−1
dx dx1 · · · dxn−1 .
n
∂x
0
R
n−1 Z
X
i=1
Ã n
!
X ∂ωi
Z
+∞
Ahora
por la compacidad de sopω, la primera sumatoria es nula
R bi ∂ωbien,
i
i
( −ai ∂xi dx = 0 para ai , bi suficientemente grande).
n
último sumando serı́a cero, esto es,
R Si sop ω ∩ ∂R+ = ∅ también el
n
n dω = 0. Pero si sop ω ∩ ∂R
+ 6= ∅:
+R
+
¡R ∞ ∂ωn n ¢ 1
R
R
∂ωn
n
n−1
dω
=
=
dx dx · · · dxn−1
n
0 ∂xn
+R
RR+ ∂x
R
= − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 .
R
n
+
Pero esta integral coincide con,
R
R
n i∗ ω
n (−1)n−1 ω (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1
=
+∂ R+
+∂ R+
Rn
n
n−1
1
n−1
n−1 ωn (x , . . . , x
= (−1) (−1)
, 0) dx1 · · · dxn−1
R
R
= − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 .
como se querı́a. 2
Observaciones:
(1) El Teorema de Stokes también se verifica para una variedad sin
borde de dimensión 1, El caso unidimensional con borde, esto
es, esencialmente, cuando Q = [a, b], también se puede deducir
como un caso lı́mite, reobteniéndose ası́ la Regla de Barrow. En
efecto, para Q = [a, b] basta con definir, para cada función (0forma) f sobre Q, su integral en un punto x del borde de Q
9.4. PRIMERAS APLICACIONES
209
como f (x). Aplicando estrictamente la definición de orientación
inducida, ésta será la usual en b y la opuesta en a, esto es:
Z
Z
Z
Z
Z
f=
f+
f = − f + f = −f (a) + f (b).
+∂Q
+{a}
+{b}
a
b
Mientras que, como df = f 0 dx:
Z
Z
b
df =
+Q
f 0 dx.
a
(2) Cabe señalar que el Teorema de Stokes también se verifica para una variedad con borde anguloso, adaptándose la prueba de
manera sencilla.
9.4.
Primeras aplicaciones
Veamos a continuación algunas consecuencias inmediatas del Teorema de Stokes.
9.4.1.
Fórmula de Green-Riemann en el plano
Aplicando el Teorema de Stokes a una 1-forma diferencial general
ω = P dx + Qdy sobre R2 , se deduce el siguiente resultado:
Teorema 9.4.1 Sea D un abierto de R2 tal que su cierre D sea una
variedad con borde, y sean P, Q dos funciones diferenciables en D y
continuas en D, con soporte compacto. Entonces
¶
Z
Z µ
∂Q ∂P
−
(P dx + Qdy) =
dx ∧ dy.
∂x
∂y
+∂D
+D
Obsérvese que el miembro izquierdo no es más que una integral ordinaria de una función (con soporte compacto en D) sobre D. El miembro
derecho se puede escribir como la circulación de la 1-forma ω sobre
una curva γ que parametrice (cada parte conexa de) +∂D “en sentido
positivo” (esto es, de modo que al recorrerla “D quede a la izquierda”).
Puesto que el soporte es compacto, no supone pérdida de generalidad
210
considerar que el dominio de la curva también lo es, γ : [a, b] → R2 . La
circulación se reescribe entonces como:
Z
Z X
2
2 Z b
X
dxi
∗
∗
i
γ ω=
(ωi ◦ γ)γ (dx ) =
(ωi ◦ γ)
dt
dt
[a,b]
[a,b] i=1
i=1 a
Z
b
dx
dy
+ Q(x(t), y(t)) )dt.
dt
dt
a
Resulta especialmente interesante el caso en el que +∂D puede parametrizarse
con una curva de Jordan diferenciable, esto es, una curva diferenciable
γ : [a, b] → R2 , cerrada γ(a) = γ(b), cuya restricción a [a, b[ es inyectiva, y tal que además γ 0 (a) = γ 0 (b).4 En particular, obsérvese que para
calcular el área D basta con tomar ω = −ydx o bien ω = xdy en el
Teorema 9.4.1, obteniéndose:
=
(P (x(t), y(t))
Corolario 9.4.2 El área de la región D encerrada por la curva de
Jordan γ : [a, b] → R2 , se puede calcular como
Z b
Z b
Z
1 b
0
0
x(t)y (t)dt = −
y(t)x (t)dt =
(x(t)y 0 (t) − y(t)x0 (t))dt,
2
a
a
a
(9.12)
siendo γ(t) = (x(t), y(t)).
Ejercicio. Aplı́quese (9.12) para calcular el área de la superficie de
la elipse.
9.4.2.
Teorema integral de Cauchy
Consideremos de nuevo un abierto D del plano complejo C(≡ R2 )
tal que su clausura D sea una variedad con borde, y sea f : D → C,
f (x, y) = f1 (x, y) + i f2 (x, y) una función diferenciable en D y continua
en D, con soporte compacto. Se verifica entonces el siguiente resultado:
4
Esta igualdad de los vectores tangentes en los extremos no es necesaria, pues
se puede aplicar el Teorema de Stokes para variedades con borde anguloso; más
aún, por este motivo también basta con que γ sea diferenciable a trozos en [a, b].
El celebrado “Teorema de la curva de Jordan” permite afirmar que toda curva
diferenciable de Jordan es el borde parametrizado de un abierto conexo D cuya
adherencia es una variedad con borde compacta; recı́procamente, el borde de todo
tal abierto es parametrizable por una curva diferenciable de Jordan.
211
Teorema 9.4.3 (integral de Cauchy) Si f es holomorfa entonces
Z
Z
Z
f (z)dz :=
(f1 dx − f2 dy) + i
(f1 dy + f2 dx)
∂D
∂D
∂D
es nula.
Demostración. Obsérvese que el integrando es, al menos formalmente,
la “1-forma compleja”:
ω(z) := f (z)dz = (f1 + if2 )(z) (dx + idy)
= (f1 dx − f2 dy) + i(f2 dx + f1 dy) = ω1 + iω2 ,
siendo
ω1 = f1 dx − f2 dy
ω2 = f2 dx + f1 dy.
dos 1-formas diferenciales ordinarias sobre R2 . De las ecuaciones de
Cauchy-Riemann para f es directo comprobar que dωi = 0, i = 1, 2.
En consecuencia, aplicando el Teorema de Stokes a las 1-formas ωi ,
i = 1, 2, se obtiene:
R
R
R
(f
dx
−
f
dy)
=
ω
=
1
2
1
R+∂D
R+∂D
R+D dω1 = 0
(f
dy
+
f
dx)
=
ω
=
dω2 = 0,
2
+∂D 1
+∂D 2
+D
lo que concluye la prueba. 2
9.4.3.
Teorema clásico de Stokes
Recordemos que habı́amos definido el rotacional rot X de un campo
vectorial X sobre una variedad riemanniana (Q, g) como la 2-forma:
rotX = d(X [ ).
Por tanto, se deduce ahora directamente la siguiente versión intrı́nseca
del Teorema de Stokes:
Teorema 9.4.4 (Stokes clásico intrı́nseco.) Sea (+Q, g) una variedad
riemanniana orientada bidimensional con borde. Si X ∈ X(Q) tiene
soporte compacto entonces
Z
Z
rot X =
X [.
(9.13)
+Q
+∂Q
212
Obsérvese que el miembro derecho de la igualdad no es más que la
circulación de X [ a lo largo del borde, por lo que si éste se reparametriza
con una curva de Jordan γ : [a, b] → Q podemos escribir:
Z
Z
b
[
X =
+∂Q
g(γ 0 , X)dt.
(9.14)
a
Supongamos ahora que, además, Q es una superficie regular S de R3
o, con más generalidad, de cualquier variedad orientada de dimensión
3, (+Q̃, h·, ·i) y g la métrica h·, ·i restringida a Q.
Observemos que la orientación de S determina un campo vectorial
normal unitario N , mediante N = E1 ×E2 , donde (E1 , E2 ) es cualquier
base ortonormal local de campos positivamente orientados sobre S;
esto es, N queda caracterizado porque (N, E1 , E2 ) es en cada punto
una base ortonormal positivamente orientada en R3 (obsérvese que,
recı́procamente, la elección de un vector normal unitario selecciona la
orientación de S).
Usando en este ambiente la definición del rotacional como un campo
vectorial (véase el Apéndice), se tiene:
hRot X, Y × Zi = rot X(Y, Z) ∀Y, Z ∈ X(Q).
En consecuencia (compruébese aplicando ambos miembros sobre (E1 ,
E2 )):
rot X = hRot X, N iµg
(9.15)
donde µg es el elemento de volumen métrico orientado sobre S. Por
tanto, teniendo en cuenta (9.14) y (9.15), el Teorema Clásico de Stokes
se reescribe, para superficies regulares de R3 o, en general, (+Q̃, h·, ·i):
Z
Z
b
hRot X, N i =
(S,µg )
g(γ 0 , X)dt,
(9.16)
a
donde la curva de Jordan γ que parametriza el borde ∂S se recorre
de modo que, en todo punto, la base ordenada formada por el normal exterior a S, la velocidad γ 0 y el vector normal a la superficie N
estén positivamente orientados en R3 (“un sacacorchos que girara en
el sentido de γ avanzarı́a en el sentido de N ”).
213
Por último, es de remarcar que la igualdad anterior no sólo es
válida cuando el campo X ∈ X(Q) (el cual, para superficies embebidas -como la regular S-, siempre se puede obtener por restricción de
otro definido en un entorno de Q en Q̃), sino también para un campo
arbitrario X̃ ∈ X(Q̃) que, sobre los puntos de S, no sea necesariamente tangente a S. Para comprobarlo, escribamos (cada entorno de)
S como imagen inversa de un valor regular de una función F , siendo
S = Sc=0 , Sc = F −1 (c). Podemos considerar N como un campo vectorial unitario definido en un entorno de S y que sea ortogonal a cada superficie Sc (de hecho, componiendo F con una función apropiada ψ para
normalizar, se tiene N =grad(ψ ◦ F )), y escribir X̃ = X + hX̃, N iN ,
donde X es tangente a cada superficie Sc . Entonces claramente
hγ 0 , X̃i = g(γ 0 , X),
y, de rotX̃ = rotX + d(hγ 0 , X̃i)N se sigue:
hRotX̃, N i = hRotX, N i.
Por tanto, usando (9.16) se tiene, en resumen:
Teorema 9.4.5 (Stokes clásico extrı́nseco). Sea S una superficie regular de R3 (o de cualquier 3-variedad riemanniana orientada), orientada
por un vector unitario normal N , y eventualmente con borde, cada una
de sus partes conexas parametrizada con una curva γi : [ai , bi ] → ∂S,de
modo que γi0 pertenezca en cada punto a la orientación inducida. Para
cada campo X̃ ∈ X(Q) se considera la función flujo del rotacional a
través de S:
hRotX̃, N i : S → R.
Si la intersección del soporte de X̃ y S es compacta, se tiene entonces:
Z
hRot X̃, N i =
(S,µg )
XZ
i
bi
ai
hγi0 , X̃idt,
(9.17)
(donde la sumatoria se extiende a lo más a un número finito de sumandos).
214
9.5.
Teorema de la Divergencia
Fijado un elemento de volumen Ω0 , la derivada de Lie respecto a un
campo vectorial LX Ω0 da una medida de cómo el elemento de volumen
varı́a con el flujo de X. Esta medida puede hacerse cuantitativa, pues
LX Ω0 es una n−forma diferencial y, por tanto, expresable como una
función por el propio Ω0 .
Definición 9.5.1 Sea Ω0 un elemento de volumen sobre la variedad
Q. La divergencia del campo vectorial X ∈ X(Q) se define como la
función divΩ0 X ∈ C ∞ (Q) que verifica:
LX Ω0 = divΩ0 X · Ω0 .
En una variedad semi-riemanniana orientada, divX se refiere a la divergencia obtenida con respecto al elemento de volumen métrico orientado. Más aún, al ser claramente independiente de la orientación escogida, divX es definible también para variedades semi-riemannianas
no orientables (véase el Tema ?? para una definición directa -Definición
??).
Ejercicio. Obténganse expresiones en coordenadas cartesianas, cilı́ndricas y esféricas, para la divergencia de campos vectoriales sobre R3
con respecto al elemento de volumen usual.
El siguiente resultado es una consecuencia especialmente relevante
del Teorema de Stokes.
Teorema 9.5.2 (de la Divergencia). Sean (+Q, g) una variedad riemanniana con borde orientada, y X un campo vectorial sobre Q con
soporte compacto. Entonces
Z
Z
divX µg =
g(X, N ) µi∗ g ,
(9.18)
+Q
+∂Q
donde N es el campo normal que apunta al exterior, y µi∗ g denota
el elemento de volumen métrico iN µg sobre ∂Q para la orientación
inducida.
Demostración. Mediante una cálculo directo y usando el Teorema de
Cartan se tiene
(div X)µg = LX µg = iX dµg + d iX µg = d iX µg ,
(9.19)
9.5. TEOREMA DE LA DIVERGENCIA
215
la última igualdad por ser dµg una (n + 1)-forma diferencial. Por otra
parte, si X ∈ X(Q) y v2 , . . . , vn ∈ Tp (∂Q) entonces
(iX µg )(v2 , . . . , vn ) = µg (X, v2 , . . . , vn ) = g(X, N ) µg (N, v2 , . . . , vn )
= g(X, N ) iN µg (v2 , . . . , vn ) = g(X, N ) µi∗ g (v2 , . . . , vn ).
Por tanto,
iX µg = g(X, N )µi∗ g .
(9.20)
Teniendo en cuenta que iX µg tiene soporte compacto, la igualdad (9.18)
se deduce de aplicar directamente a esta (n − 1) forma el Teorema de
Stokes, usando (9.19) y (9.20). 2
Una consecuencia conocida de este teorema es la fórmula de GaussOstogradski, que se obtiene cuando Q es el cierre de un abierto acotado
D de Rn , y se considera la métrica usual. Esto es,
Z X
Z
n
∂X i
=
hX, N i,
i
D i=1 ∂x
∂D
donde D̄ es compacto.
Observaciones:
(1) La fórmula de Gauss-Ostogradski (y, en general, el Teorema de la
Divergencia) admite una interpretación muy intuitiva en términos de teorı́a de fluidos. En efecto, si D̄ es una región compacta de
R3 y X el campo de velocidades de un fluido, el miembro derecho
(flujo de X a través de ∂D) representa la cantidad de fluido que
sale por ∂D por unidad de tiempo. Si el fluido es incompresible
(divX ≡ 0), entonces el miembro izquierdo es nulo “la cantidad
de fluido que entra en cualquier región compacta D por unidad
de tiempo es igual a la que sale”. Si p ∈ Q es un manantial,
div Xp > 0 (resp. sumidero, div Xp < 0) entonces en cualquier
bola compacta B alrededor de p lo suficientemente
pequeña, el
R
signo
de
div
X
se
mantiene
constante
y
hX,
N
i
> 0 (resp.
∂B
R
hX, N i < 0) representa la cantidad de fluido que mana de
∂B
B al exterior (resp. que se suma al de B desde el exterior) por
unidad de tiempo.
(2) Puesto que tanto la divergencia de X, como la integración de
funciones o el concepto de normal exterior son independientes de
216
la orientación escogida, podemos escribir la igualdad
Z
Z
divX =
g(X, N )
(Q,g)
(9.21)
(∂Q,i∗ g)
incluso cuando (Q, g) no sea orientable (en este caso, (9.21) se
puede probar pasando al recubridor de dos hojas orientable).
(3) También se puede dar una versión del Teorema de la Divergencia
para un elemento de volumen arbitrario. En efecto, sin más que
usar el Teorema de Cartan y el de Stokes se tiene:
Z
Z
divΩ0 X =
iX Ω0 .
(Q,Ω0 )
9.6.
+∂Q
Algunas aplicaciones del T. de la Divergencia
A lo largo de esta sección, consideraremos Rn dotado de sus elementos geométricos usuales, y Q = D̄ será una n−variedad con borde
compacta obtenida como la adherencia de un abierto D. Denotaremos al borde por5 S = ∂Q, y a su campo normal exterior por N . Dado
p ∈ Rn , denotaremos p̄ al propio p visto como vector tangente en Tp Rn .
Cálculo de volumenes de Rn :
P
Consideremos en Rn el campo vectorial X = ni=1 xi ∂/∂xi . Un cálculo
directo muestra: div X = n. Por tanto, el Teorema de la Divergencia
proporciona la siguiente fórmula para el volumen de D (y Q):
Z
1
vol(D) =
hp, Np i.
n S
Caracterización de superficies que contienen al origen de
R3 :
5
Un resultado conocido afirma que si S es una hipersuperficie conexa compacta
n
n
embebida en R , entonces R \S tiene dos partes conexas, una de ellas (la “interior”) acotada D, de modo que Q = D̄ es una variedad con borde en las condiciones
de arriba.
9.6. APLICACIONES DEL T. DE LA DIVERGENCIA
217
Consideremos en R3 \{0} con la métrica inducida por la usual, el campo
de vectores
Xp =
1
p
= 2
(x∂x + y∂y + z∂z ).
3
2
kpk
(x + y + z 2 )3/2
Un cálculo directo muestra que divX = 0. En Rconsecuencia, aplicando
el Teorema de la Divergencia obtenemos que ∂B(0,r) g(X, N ) es independiente del radio r escogido, donde B(0, r) es la bola de centro 0 y
radio r, y N apunta al exterior de la bola. Computando el valor de esta
integral para r = 1 se obtiene inmediatamente 4π, que coincide con el
valor del área de la superficie ∂B(0, 1) = S 2 (1). Ası́, si S es cualquier
superficie compacta embebida en R3 \ {0} y D es su dominio interior
en R3 , se tiene, de nuevo por el Teorema de la Divergencia,
½
Z
0 si (0, 0, 0) 6∈ D,
g(X, N ) =
4π si (0, 0, 0) ∈ D,
S
donde N apunta al exterior de D. Por tanto, el valor de esta integral
caracteriza las superficies que contienen al origen de R3 .
Ley de Gauss del campo electromagnético:
Esta ley es sólo una reformulación del resultado anterior. Se define
el campo eléctrico E producido en un punto p ∈ R3 por una carga
puntual de magnitud q situada en el origen como
E :=
q
p
,
4π²0 kpk3
donde ²0 > 0 es una constante (dieléctrica del vacı́o). Salvo una constante, E coincide con el campo X del apartado anterior. Por tanto,
tomando una superficie S compacta y embebida en R3 que contenga al
origen, se sigue la siguiente igualdad conocida como Ley de Gauss:
Z
q
g(E, N ) = .
²0
S
Nota. Cabe señalar que la Ley de Gauss lleva naturalmente a postular
la igualdad (una de las Leyes de Maxwell)
div E =
ρ
,
²0
ρ densidad de carga.
218
Ángulo solido:
Llamamos ángulo sólido a la 2-forma en R3 \ {0} definida por:
Ωsol = ip/|p|3 Ω0 =
x dy ∧ dz + y dz ∧ dx + z dx ∧ dy
,
(x2 + y 2 + z 2 )3/2
donde Ω0 = dx ∧ dy ∧ dz es el elemento de volumen métrico orientado
usual. Obsérvese entonces que
Ωsol (vp , wp ) =
1
1
Ω0 (p, vp , wp ) = 3 hp, vp × wp i
3
|p|
|p|
para todo p ∈ R3 − {0} y todo vp , wp ∈ Tp R3 .
Un cálculo directo permite demostrar:
dΩsol = 0.
Por otra parte, en coordenadas esféricas el ángulo sólido admite la
siguiente expresión sencilla:
Ωsol = i 12 ∂r Ω0 = senθ dθ ∧ dφ.
r
Estudiemos a continuación la relación del ángulo sólido con la superficie
de las esferas. Consideremos la esfera S 2 (r), centrada en el origen de
radio r > 0. Una base ortonormal positivamente orientada de Tp R3 ,
p ∈ S 2 (r), es
µ
¶
∂ 1 ∂
1 ∂
BR 3 =
,
,
∂r r ∂θ rsenθ ∂φ
(válida siempre que θ 6= nπ, n ∈ Z). En consecuencia, una base
ortonormal de Tp S 2 (r), positivamente orientada con la orientación inducida sobre S 2 (r) como borde de B(0, r), es
¶
µ
1 ∂
1 ∂
,
,
BS 2 (r) =
r ∂θ rsenθ ∂φ
cuya dual es BS∗ 2 (r) = (r dθ, rsenθ dφ). Ası́, la métrica inducida en S 2 (r)
es
h, i |S 2 (r) = r2 (dθ2 + sen2 θdφ2 ),
9.6. APLICACIONES DEL T. DE LA DIVERGENCIA
219
y el elemento de volumen positivamente orientado µ0 sobre S 2 (r), también calculable inmediatamente de BS∗ 2 (r) :
µ0 = r2 senθ dθ ∧ dφ = r2 Ωsol
en T S 2 (r).
Esta última igualdad permite caracterizar a Ωsol mediante:
½
Ωsol (vp , wp ) = r12 µ0 (vp , wp ) si vp , wp ∈ Tp S 2 (r)
Ωsol (vp , ∂r |p ) = 0
para todo vp ∈ Tp R3 .
(9.22)
Estamos en condiciones de establecer la siguiente definición:
Definición 9.6.1 Sea S una superficie con borde compacta y orientada de R3 − {0}. Se define el ángulo sólido subtendido por +S desde el
origen como:
Z
i∗ Ωsol ,
^sol (+S) =
+S
3
donde i : S ,→ R − {0} es la inclusión.
Justificación. Supongamos que: (a) la superficie S ⊂ R3 \ {0} es tal
que cada semirrecta r que parte del origen corta a S transversalmente
a lo sumo una vez y, (b) en este caso, si r = {λv0 : λ > 0} corta a S
en p0 , la orientación inducida de la usual de R3 por el vector v0 (visto
como vector transverso a Tp0 S en Tp0 R3 ) coincide con la orientación
positiva de Tp0 S. Sea C(S) la unión de las semirrectas que cortan a S.
Desde el punto de vista clásico, se define el ángulo sólido subtendido
por S como el área de S 2 (1) ∩ C(S). De la caracterización (9.22) se
deduce entonces:
Z
2
Área(S (1) ∩ C(S)) =
i∗ Ωsol .
+S
En la Definición 9.6.1 se incluye este caso, y cuando la orientación
inducida por v0 es negativa, el área se computa de manera negativa.
La caracterización de las superficies compactas que incluyen al origen puede reformularse ahora como:
Teorema 9.6.2 Sea S ⊂ R3 \ {0} una superficie compacta sin borde, que encierra un abierto D de R3 , y orientada con la orientación
inducida por D. Entonces
½
0 si (0, 0, 0) 6∈ D
^sol (S) =
4π si (0, 0, 0) ∈ D.
220
Teorema de Arquı́medes:
Suponiendo a R3 dotada con la métrica usual, consideremos la función
presión P : R3 → R definida por:
½
−cz si z ≤ 0
(x, y, z) 7→
0
si z > 0,
siendo la constante c > 0 la densidad por atracción gravitatoria que,
en términos de magnitudes fı́sicas tı́picas, es igual a c = ρ g0 , siendo ρ
la “densidad (constante) de masa del fluido” y g0 la aceleración gravitatoria (digamos g0 = 90 8 m/s2 ). Supongamos que el “sólido rı́gido”
Q = D̄ está incluido en la región z < 0. Para cada q ∈ S = ∂Q se
define la fuerza ejercida por el fluido en q como
Fq = −P Nq = czNq ,
siendo Nq el vector unitario normal exterior. Consideremos el campo
∂
∂
∂
vectorial F = F x ∂x
+ F y ∂y
+ F z ∂z
ası́ definido sobre S, y definamos
el empuje del fluido sobre Q como la terna, E = (E x , E y , E z ):
Z
Z
Z
x
x
y
y
z
E =
F , E =
F , E =
F z.
S
S
S
Aplicando directamente el Teorema de la Divergencia, se obtiene el
siguiente resultado clásico.
Teorema 9.6.3 (de Arquı́medes). Con la notación introducida
E x = E y = 0,
E z = c vol(Q) = ρg0 vol(Q).
Esto es, todo cuerpo sólido (representado por la variedad compacta con
borde Q) sumergido en un fluido (subespacio z < 0) experimenta un
empuje vertical hacia arriba E igual al peso del fluido que desaloja.
Demostración. Sea Z = cz ∂/∂z. Entonces div Z = c y F z = cz·
hN, ∂/∂zi = hN, Zi. Luego, por el Teorema de la Divergencia,
Z
Z
z
E = hZ, N i =
c = c vol(Q).
S
D
Si X = cz ∂/∂x, Y = cz ∂/∂y entonces div X = div Y = 0 y F x =
hN, Xi, F y = hN, Y i. Luego, por el Teorema de la Divergencia,
Z
x
E =
div X = 0,
Q
y
y análogamente E = 0.
2
9.7. FÓRMULAS DE GREEN
9.7.
221
Fórmulas de Green
Para cualquier variedad semi-riemanniana, se define el laplaciano
de una función f como:
∆f = div(gradf ).
Sea Q una variedad riemanniana con borde, y N un campo normal
unitario sobre ∂Q que apunta al exterior.
Primera Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h)
es compacto, entonces
Z
Z
Z
f g(∇h, N )µi∗ g .
g(∇f, ∇h)µg =
f ∆h µg +
∂Q
Q
Q
En particular, si ∂Q = ∅ entonces
Z
Z
f ∆h µg = − g(∇f, ∇h)µg .
Q
Q
Demostración. Aplı́quese el Teorema de la Divergencia teniendo presente la igualdad
div(f ∇h) = f div∇h + g(∇f, ∇h). 2
Obsérvese que si f ≡ 1 entonces se reobtiene el Teorema de la Divergencia para ∇h.
Segunda Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h)
y sop(h∇f ) son compactos, entonces
Z
Z
Z
f ∆h µg −
h∆f µg =
g(f ∇h − h∇f, N )µi∗ g .
Q
Q
∂Q
En particular, si ∂Q = ∅ entonces
Z
Z
f ∆h µg =
h∆f µg .
Q
Q
Demostración. Escrı́base también la Primera Fórmula de Green intercambiando los papeles de f y h, y réstense las dos expresiones. 2
Las fórmulas anteriores se mantienen válidas para métricas no degeneradas (siempre que i∗ g también sea una métrica no degenerada
sobre ∂Q, al menos c.p.d.) Sin embargo, el siguiente resultado fundamental usa fuertemente el carácter definido de la métrica.
222
Teorema 9.7.1 Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde. Si h ∈ C ∞ (Q) es tal que ∆h ≥ 0 ó ∆h ≤ 0 sobre
todo Q, entonces h es constante.
Demostración. Consideremos el caso ∆h ≥ 0 (si ∆h ≤ 0 úsese que
∆(−h) = −∆h ≥ 0). Puesto que Q es compacta, podemos escoger
c ≥ 0 (c ∈ R) tal que hc = h + c ≥ 0; obsérvese que ∇hc = ∇h y
∆hc = ∆h. Tomando f = hc en la Primera Fórmula de Green se tiene
Z
Z
hc ∆h µg +
g(∇h, ∇h) = 0.
Q
Q
Como al ser g riemanniana los integrandos de ambos sumandos son no
negativos, éstos deben anularse. Por tanto, g(∇h, ∇h) ≡ 0, y ∇h ≡ 0.
2
Nota. A una función h con ∆h ≡ 0 se le llama armónica, si ∆h ≥ 0
subarmónica, y si ∆h ≤ 0 superarmónica. Por el teorema anterior, las
únicas funciones subarmónicas o superarmónicas que admite la variedad riemanniana compacta Q son las constantes.
Consecuencias: Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde:
R
(1) Si definimos hf, hi := Q f h µg , obtenemos un producto escalar
sobre C ∞ (Q). Por la Segunda Fórmula de Green, el operador
∆ : C ∞ (Q) → C ∞ (Q) es autoadjunto para h, i. Además, por
el Corolario 9.7.1, Nucl∆ ≡ R(≡ funciones constantes),
y una
R
condición necesaria para que f ∈ Im∆ es que Q f µg = 0. De
hecho, mirando la igualdad ∆u = f como una ecuación donde
f es conocida y u es la incógnita, la anterior es una condición
necesaria para la existencia de soluciones (que puede demostrarse
es también suficiente).
(2) Consideremos los autovalores del laplaciano, esto es, los escalares
µ ∈ R tales que
∆u = µ u
para alguna función no constante u ∈ C ∞ (Q). Multiplicando esta
igualdad por u y aplicando la Primera Fórmula de Green, se tiene
Z
Z
2
µ u µg +
g(∇u, ∇u) = 0.
Q
Q
9.8. APÉNDICE: PRODUCTO VECTORIAL
223
Pero la primera y segunda integral son no negativas (y claramente
distintas de cero). Por tanto, necesariamente µ < 0. De hecho,
es posible demostrar que estos autovalores forman una sucesión
divergente a −∞.
9.8.
Apéndice: producto vectorial y rotacional
9.8.1.
Isomorfismos especiales en (V 3 (R), µ0 ).
Sea V (R) un n−espacio vectorial con un elemento de volumen fijado
µ0 . Entonces, existe un isomorfismo entre V (R) y Λn−1 (V ), canónicamente asociado a µ0 ; concretamente, el isomorfismo que a cada vector
v le hace corresponder el tensor antisimétrico iv µ0
Ası́, para n = 3 podemos escribir este isomorfismo como
V 3 → Λ2 (V 3 )
v 7→ iv µ0 = µ0 (v, ·, ·).
(9.23)
Por otra parte, en dimension 3, a la aplicación
V3×V3×V3 →R
(u, v, w) 7→ µ0 (u, v, w),
(9.24)
la denominaremos “producto mixto” Si fijamos los vectores (u, v), la
aplicación
V → R, w 7→ µ0 (u, v, w),
es una forma lineal. Cuando µ0 es el elemento de volumen métrico
orientado para un producto escalar, h·, ·i, al sostenido de esta forma
lineal se le llama, producto vectorial de u y v, que se denota por u × v.
Esto es, se define
u × v = (iv (iu µ0 ))] ,
con lo que el producto vectorial queda caracterizado por la igualdad:
hu × v, wi = µ0 (u, v, w),
∀w ∈ V.
(9.25)
Por supuesto, todo esto resulta extensible punto a punto a los espacios
tangentes en variedades de dimensión 3.
224
Ejercicio. En R3 con la métrica riemanniana y orientación usuales,
obténganse expresiones para el producto vectorial de dos campos vectoriales en coordenadas cilı́ndricas y esféricas.
9.8.2.
El rotacional
Consideremos ahora una variedad semi-riemanniana (Q, g) y un
campo vectorial X ∈ X(Q). Recordemos (Sección 7.3) que la 2-forma
diferencial rotacional se definı́a como rotX=dX [ . Supongamos ahora
que en Q se fija una orientación, y el correspondiente elemento de
volumen métrico orientado µg .
En dimensión n = 3, el inverso del isomorfismo (9.23) permite
definir ahora el campo vectorial rotacional de X, RotX ∈ X(Q), que
se caracteriza como:
iRotX µg = rotX = dX [ .
Ası́, usando (9.25), también se tiene la caracterización:
µg (RotX, Y, Z) = g(RotX, Y × Z)
= rotX(Y, Z) = Y g(X, Z) − Zg(X, Y ) − g(X, [Y, Z]),
válida para cualesquiera campos vectoriales Y, Z. En particular, si
Y, Z fueran campos coordenados, el último término no aparecerı́a, y
si además Y = ∂i , Z = ∂j fueran ortonormales para una métrica
g riemanniana (lo cual sólo sucede en el caso particular de que la
métrica sea isométrica a la usual de R3 , en algún abierto), entonces:
µg (RotX, ∂i , ∂j ) = ∂i X j − ∂j X i .
Ejercicio. En R3 con la métrica riemanniana y orientación usuales,
obténganse expresiones para el rotacional de un campo vectorial en
coordenadas cilı́ndricas y esféricas.
Capı́tulo 10
Conexiones afines
En este capı́tulo introducimos un elemento nuevo sobre una variedad: el concepto de conexión afı́n. A partir de él se pueden definir
varios conceptos de interés geométrico: la derivada covariante a lo largo
de una curva, el transporte paralelo, las geodésicas y la aplicación exponencial (además de la curvatura que estudiaremos en el capı́tulo
siguiente). Describiremos brevemente estos conceptos y hallaremos expresiones en coordenadas para todos ellos a partir de los sı́mbolos de
Christoffel de la conexión.
10.1.
Concepto de conexión afı́n
Hasta ahora, dada una variedad diferenciable arbitraria sabemos
derivar una función f con respecto a una dirección del espacio tangente v, pero no sabemos derivar un campo de vectores Y . Un primer
intento para definir esta derivación serı́a el corchete de Lie que, si bien
permitirı́a hablar de la derivada de un campo Y en la dirección de otro
campo V , no permite derivar en la dirección del vector v en un punto.
Esto es, puede ocurrir que para V, Ṽ ∈ X(Q) con v = Vp = Ṽp se tenga
[V, Y ]p 6= [Ṽ , Y ]p .
Para tratar de definir esta derivación consideremos en primer lugar
n
R con el sistema usual de coordenadas (x1 , . . . , xn ). Todo campo de
225
226
CAPÍTULO 10. CONEXIONES AFINES
vectores Y ∈ X(Rn ) puede escribirse como:
Y =
n
X
Yi
i=1
∂
,
∂xi
con Y i : Rn → R diferenciable ∀i ∈ {1, . . . , n}.
Si vp ∈ Tp Rn entonces podemos definir la derivada de Y en la dirección
de vp como
n
X
∂
vp (Y ) :=
vp (Y i ) i |p .
∂x
i=1
Obviamente, esta definición depende del sistema de coordenadas escogido. Ası́, en una variedad arbitraria Q donde no exista un sistema
de coordenadas privilegiado la anterior definición carece de sentido.
Por tanto, se hace necesario abstraer las propiedades deseables de esta
definición de manera que sea aplicable a una variedad Q arbitraria.
Definición 10.1.1 Sea Q una variedad diferenciable. Una conexión
afı́n sobre Q es una aplicación ∇,
∇ : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ ∇X Y
que verifica:
(1) Es R-lineal con respecto a la segunda variable, esto es,
∇X (aY + bY ) = a∇X Y + b∇X Y , ∀a, b ∈ R, ∀X, Y, Y ∈ X(Q).
(2) Verifica la regla de Leibniz del producto con respecto a la segunda
variable:
∇X (f Y ) = X(f )Y + f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q).
(3) Es R-lineal con respecto a la primera variable, esto es,
∇aX+bX (Y ) = a∇X Y + b∇X Y, ∀a, b ∈ R, ∀X, X, Y ∈ X(Q).
(4) Es C ∞ (Q)-lineal con respecto a la primera variable, esto es,
∇f X Y = f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q).
10.1. CONCEPTO DE CONEXIÓN AFÍN
227
Si, además, se verifica
∇X Y − ∇Y X = [X, Y ], ∀X, Y ∈ X(Q)
entonces se dice que la conexión es simétrica. Al par (Q, ∇) lo llamaremos variedad afı́n.
Observaciones:
(1) Es inmediato comprobar que el corchete de Lie sobre Q
[·, ·] : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ [X, Y ]
no es una conexión afı́n puesto que no verifica la propiedad (4)
(en cambio, sı́ verifica el resto de las propiedades).
(2) Del axioma (2) queda claro que (si dim Q > 0) la conexión afı́n
no es C ∞ (Q)-lineal con respecto a la segunda variable. Sı́ lo es,
sin embargo, respecto de la primera variable (propiedad (4)).
Comprobemos ahora que con una conexión afı́n sı́ es posible definir la
derivada de Y en la dirección de un vector tangente v. En adelante,
simplificaremos sistemáticamente la notación siendo consistentes con:
∂i ≡ ∂/∂q i .
Proposición 10.1.2 Sean X, X ∈ X(Q) tales que Xp = X p para cierto p ∈ Q. Entonces
(∇X Y )p = (∇X Y )p ,
∀Y ∈ X(Q).
Demostración. Sean X, X ∈ X(Q) tales que Xp = X p . Si (U, q 1 , . . . , q n )
es un entorno coordenado de Q alrededor de p entonces podemos escribir:
n
n
X
X
i
i
X ∂i ,
X=
X=
X ∂i ,
i=1
i=1
Ahora bien, por la propiedad (4) de la Definición 10.1.1
P
∇X Y = ∇(Pni=1 X i ∂i ) Y = ni=1 X i ∇∂i Y,
∇X Y = ∇(Pn
i=1
X
i
Y =
∂i )
Pn
i
i=1 X ∇∂i Y.
(10.1)
228
i
Por tanto, como X i (p) = X (p) se tiene
(∇X Y )p =
n
X
i
X (p)(∇∂i Y )p =
i=1
n
X
i
X (p)(∇∂i Y )p = (∇X Y )p . 2
i=1
Gracias a este resultado podemos definir la derivada ∇vp Y , vp ∈
Tp Q. En efecto, para computar dicha derivada basta con calcular (∇X Y )p ,
siendo X ∈ X(Q) tal que Xp = vp .
Nota. Al escribir los campos X e Y en coordenadas en la demostración
anterior, se plantea la dificultad de que estas expresiones no estén
definidas sobre todo Q. En este caso, en rigor, no tiene sentido escribir
(10.1) aplicando los axiomas de la Definición 10.1.1. Esta dificultad se
puede salvar porque de estos axiomas se deduce que si X, Y ∈ X(Q)
coinciden, respectivamente, con X, Y ∈ X(Q) en un entorno U de p, entonces ∇X Y = ∇X Y sobre U . En particular, si se define una conexión
sobre una variedad, ésta queda definida sobre cualquier abierto suyo.
La prueba de estos resultados usa la existencia de “funciones meseta”
alrededor de cualquier punto p (véase [O’N, Proposition 2.2, Lemma
2.3] para más detalles).
Ejercicio. Pruébese que la aplicación ∇0 : X(Rn ) × X(Rn ) → X(Rn )
definida usando las coordenadas usuales de Rn por
(X, Y ) 7→
∇0X Y
n
X
n
X
∂
∂Y j ∂
:=
X(Y ) j =
Xi i
,
∂x
∂x ∂xj
j=1
i,j=1
j
P
P
siendo X = ni=1 X i ∂x∂ i , Y = nj=1 Y j ∂x∂ j , es una conexión afı́n simétrica sobre Rn .
Definición 10.1.3 Dada una variedad afı́n (Q, ∇) se dice que X ∈
X(Q) es paralelo si ∇X ≡ 0; esto es, si
∇v X = 0,
∀v ∈ T Q.
Una variedad afı́n puede no admitir campos paralelos.
Ejercicio. Determı́nense todos los campos paralelos de (Rn , ∇0 ).
10.2. SÍMBOLOS DE CHRISTOFFEL
10.2.
229
Sı́mbolos de Christoffel
Sean (Q, ∇) una variedad afı́n y (U, q 1 , . . . , q n ) un entorno coordenado de Q. Como sabemos, el conjunto (∂1 ≡ ∂/∂q 1 , . . . , ∂n ≡ /∂q n ) es
una base de campos sobre U , y dado que ∇∂i ∂j también es un campo
sobre U , podemos expresarlo punto a punto como combinación lineal
de los campos coordenados (∂1 , . . . , ∂n ). En consecuencia, existen n3
funciones diferenciables Γkij , i, j, k ∈ {1, . . . , n} sobre U tales que
∇∂i ∂j =
n
X
Γkij ∂k .
(10.2)
k=1
Definición 10.2.1 Las funciones Γkij , i, j, k ∈ {1, . . . , n} dadas por la
expresión (10.2) reciben el nombre de sı́mbolos de Christoffel de ∇ en
las coordenadas (q 1 , . . . , q n ).
Propiedades:
(1) Los valores de Γkij , i, j, k ∈ {1, . . . ,P
n} determinan laPconexión
∇ sobre el abierto U . En efecto, si X = ni=1 X i ∂i , Y = nj=1 Y j ∂j
entonces
P
P
∇X Y = ∇(Pni=1 X i ∂i ) ( nj=1 Y j ∂j ) = ni,j=1 X i ∇∂i (Y j ∂j )
P
P
P
= ni,j=1 X i (∂i Y j ∂j + Y j ∇∂i ∂j ) = ni,j=1 X i (∂i Y j ∂j + Y j nk=1 Γkij ∂k ),
(mientras que en la segunda igualdad se usa el axioma (4), en la tercera
se usa el (2); para la última igualdad se ha usado (10.2)). En consecuencia, conociendo los sı́mbolos de Christoffel podemos computar la
conexión afı́n sobre dos campos cualesquiera.
(2) Recı́procamente, fijado un entorno coordenado (U, q 1 , . . . , q n ) y
3
n funciones diferenciables arbitrarias Γkij , i, j, k ∈ {1, . . . , n} sobre U ,
existe una única conexión afı́n ∇ sobre U cuyos sı́mbolos de Christoffel
en coordedanadas (q 1 , . . . , q n ) son Γkij . Concretamente, ∇ viene dado
por la expresión
!
Ã
n
n
X
X
Γkij ∂k , X, Y ∈ X(U ).
∇X Y :=
X i ∂i Y j ∂j + Y j
i,j=1
k=1
En particular, si en Rn tomamos coordenadas usuales y Γkij ≡ 0, ∀i, j, k,
reobtenemos la conexión usual ∇0 .
230
(3) Sean Γkij los sı́mbolos de Christoffel de una conexión ∇ sobre
Q para un entorno coordenado (U, q 1 , . . . , q n ). Se verifica que ∇ es
simétrica en U (véase la Definición 10.1.1) si y sólo si Γkij = Γkji para
todo i, j, k. (En consecuencia, la simetrı́a de los sı́mbolos de Christoffel
no depende de las coordenadas elegidas).
Demostración de (3). Probémoslo en primer lugar para campos coordenados. Dado que [∂i , ∂j ] = 0, computando directamente se tiene:
∇∂i ∂j − ∇∂j ∂i =
n
X
Γkij ∂k
−
n
X
Γkji ∂k
=
(Γkij − Γkji )∂k ,
k=1
k=1
k=1
n
X
que es nulo si y sólo si Γkij = Γkji para todo i, j, k. Para campos cualesquiera basta con expresar dichos campos en términos de los coordenados y reducir la prueba al caso anterior.
(4) Sea ∇ una conexión sobre Q y sean (q 1 , . . . , q n ), (q 1 , . . . , q n )
dos sistemas coordenados sobre un mismo abierto U ⊆ Q. La relación
k
existente entre los sı́mbolos de Christoffel Γkij y Γij asociados a los
respectivos sistemas coordenados es:
s
Γij
n
n
X
X
∂q l ∂q m ∂q s r
∂q s ∂ 2 q r
+
Γ .
=
∂q r ∂q i ∂q j l,m,r=1 ∂q i ∂q j ∂q r lm
r=1
(10.3)
En particular, la expresión (10.3) muestra que una conexión no se
puede considerar como un campo tensorial ya que, debido al término
en derivadas segundas, las funciones Γkij no se transforman como las
coordenadas de un tensor.
Demostración de (4). Por definición de los sı́mbolos de Christoffel
P
∇∂i ∂j = nk=1 Γkij ∂k
P
k
∇∂ i ∂ j = nk=1 Γij ∂ k .
P
Pn ∂ql
∂q l ∂
Ahora bien, como ∂ k ≡ ∂q∂k = nl=1 ∂q
k ∂q l ≡
l=1 ∂q k ∂l se tiene
P
Pn
m
∂q l
∂q m
∇∂ i ∂ j = ∇Pn ∂ql ∂ ( nm=1 ∂q
j ∂m ) =
i ∇∂l ( ∂q j ∂m )
l,m=1
∂q
∂q
l=1 ∂q i l
P
Pn
∂ 2 qm
∂q l ∂q m r
= nm=1 ∂q
i ∂q j ∂m +
l,m,r=1 ∂q i ∂q j Γl,m ∂r .
Por otra parte,
∇∂ i ∂ j =
n
X
k=1
k
Γij ∂ k
=
n
X
k,r=1
k
Γij
∂q r
∂r .
∂q k
10.3. DERIVADA COVARIANTE
231
Igualando la componente r-ésima de cada expresión se obtiene:
n
X
k
Γij
k=1
Pero
Pn
∂q r
∂q s
r=1 ∂q k ∂q r
bros de (10.4) por
=
n
X
∂q r
∂ 2qr
∂q l ∂q m r
=
+
Γ .
∂q i ∂q j l,m=1 ∂q i ∂q j lm
∂q k
∂q s
∂q k
(10.4)
= δks . Por tanto, multiplicando los dos miem-
∂q s
∂q r
y sumando en r obtenemos finalmente:
Ã n
!
n
n
X
X
∂q s X k ∂q r
s
k s
Γij =
Γij δk =
Γ
∂q r k=1 ij ∂q k
r=1
k=1
Ã
!
n
n
X
X
∂q l ∂q m r
∂ 2qr
∂q s
=
+
Γ
. 2
i
j
i
j lm
r
∂q
∂q
∂q
∂q
∂q
r=1
l,m=1
Ejemplo. Como ya indicamos los sı́mbolos de Christoffel de R2 para
∇0 en coordenadas usuales son todos nulos. Sin embargo, en coordenadas polares se tiene (compruébese directamente de (10.3)):
∇0∂ρ ∂ρ = 0,
10.3.
∇0∂θ ∂θ = −ρ∂ρ ,
1
∇0∂θ ∂ρ = ∂θ .
ρ
Derivada covariante
Sean (Q, ∇) una variedad afı́n y γ : I → Q, I =]a, b[ una curva
diferenciable. Como ya vimos, si X ∈ X(Q) entonces tiene sentido
escribir ∇v X para cualquier vector tangente v ∈ T Q. En particular,
podemos escribir ∇γ 0 (t) X, ∀t ∈ I.
Definición 10.3.1 Llamamos derivada covariante de X ∈ X(Q) a lo
largo de γ : I → Q a la aplicación
DX
dt
: I → TQ
t 7→ ∇γ 0 (t) X ∈ Tγ(t) Q.
Usando las propiedades de la conexión afı́n de la Sección 10.1 se obtienen las siguientes:
(1) La derivada covariante es R-lineal, esto es,
DX
DX
D(aX + bX)
=a
+b
.
dt
dt
dt
232
(2) Se verifica la regla de Leibniz del producto, esto es,
D(f X)
DX
d(f ◦ γ)
DX
= γ 0 (f )X + f
=
X +f
.
dt
dt
dt
dt
Estudiemos a continuación la expresión
Pn eni coordenadas1 de la derivada
covariante. Supongamos que X = i=1 X ∂i y γ(t) = (q (t), . . . , q n (t)).
Entonces γ 0 (t) = (q̇ 1 (t), . . . , q̇ n (t)) ∈ Tγ(t) Q, es decir,
0
γ (t) =
n
X
j=1
q̇ j (t)
∂
|γ(t) .
∂q j
Por tanto,
P
DX
(:= ∇γ 0 (t) X)
= nk=1 ∇γ 0 (t) (X k ∂k )
dt
Pn
P
= k=1 γ 0 (t)(X k )∂k + ni=1 X i ∇γ 0 (t) ∂i
P
P
k
= nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t)∇(∂j |γ(t) ) ∂i
P
P
P
k
= nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t) nk=1 Γkij (γ(t))∂k .
En conclusión, su expresión en coordenadas queda:
Ã
!
n
n
X
DX
d(X k ◦ γ) X i
(t) =
+
X (γ(t))q̇ j (t)Γkij (γ(t)) ∂k |γ(t) .
dt
dt
i,j=1
k=1
(10.5)
La definición de derivada covariante se puede extender a campos vectoriales sobre γ más generales de la siguiente manera:
Definición 10.3.2 Dada una curva diferenciable γ : I → Q decimos
que X̂ es un campo sobre γ si es una aplicación diferenciable
X̂ : I → T Q
t 7→ X̂(t)
tal que X̂(t) ∈ Tγ(t) Q, ∀t ∈ I (esto es, tal que π ◦ X̂ = γ siendo
π : T Q → Q la proyección canónica).
Por ejemplo, si X ∈ X(Q) entonces la aplicación diferenciable
X ◦ γ : I → TQ
t 7→ Xγ(t) ,
(10.6)
10.3. DERIVADA COVARIANTE
233
Figura 20
es un campo sobre γ. Ahora bien, no todos los campos sobre una curva son restricciones a esa curva de un campo definido sobre toda la
variedad (véase la Figura 20).
A partir de (10.5) se comprueba que la derivada covariante de
un campo a lo largo de una curva γ sólo depende de los valores del
campo sobre dicha curva. Esto permite definir la derivada covariante
a lo largo de γ de un campo X̂ sobre γ que no provenga necesariamente P
de un campo definido sobre toda la variedad. En efecto, si
X̂(t) = ni=1 X̂ i (t) ∂q∂ i |γ(t) entonces definimos
n
X
DX̂
(t) :=
dt
k=1
Ã
!
n
X
dX̂ k
(t) +
X̂ i (t)q̇ j (t)Γkij (γ(t)) ∂k |γ(t) . (10.7)
dt
i,j=1
Esta definición es independiente de las coordenadas elegidas, al coincidir con (10.5).
En resumen, para cualquier campo vectorial X̂ sobre una curva
γ hemos definido un nuevo campo vectorial DdtX̂ también sobre γ que
representa la “derivada de X̂ en la dirección de γ 0 (t)”, para todo t ∈ I.
234
10.4.
Transporte paralelo
Definición 10.4.1 Sea X̂ : I → T Q un campo de vectores sobre una
curva γ. Diremos que X̂ es paralelo si DdtX̂ ≡ 0.
A continuación veremos que existe una única manera de “transportar
paralelamente” un vector v a lo largo de una curva γ. En efecto:
Teorema 10.4.2 Fijados una curva γ : I → Q y un vector v ∈
Tγ(t0 ) Q, t0 ∈ I, existe un único campo de vectores V sobre γ tal que
V (t0 ) = v y DV
≡ 0.
dt
Idea de la demostración. Tomemos coordenadas alrededor de γ(t0 ).
La prueba se reduce entonces a resolver el sistema de n ecuaciones
diferenciales de primer orden
n
dV k (t) X i
+
V (t)q̇ j (t)Γkij (γ(t)) = 0,
dt
i,j=1
k = 1, . . . , n,
(10.8)
con condiciones iniciales V i (t0 ) = v i , ∀i ∈ {1, . . . , n}. Pero esto se
reduce a aplicar los teoremas clásicos de existencia y unicidad para
tales ecuaciones1 . El resultado se puede extender entonces a toda la
curva, recubriendo su imagen por entornos coordenados. 2
Ejemplo. En Rn las ecuaciones de transporte paralelo de un campo
V , V (t0 ) = v, a lo largo de una curva en coordenadas usuales son:
dV k (t)
≡ 0,
dt
V k (t0 ) = v k ,
k = 1, . . . , n.
Obviamente, estas ecuaciones admiten como única solución V k (t) ≡
v k = cte, ∀t ∈ I. Ello coincide con la idea intuitiva de lo que debe ser
transportar un vector paralelamente en R2 ó R3 .
Denotemos por Ttt0 (v) al vector de Tγ(t) Q obtenido por transporte paralelo de v ∈ Tγ(t0 ) Q a lo largo de γ. Entonces se verifican las siguientes
propiedades:
1
Véase, por ejemplo, el Teorema 1 del Capı́tulo 2 de “Ecuaciones diferenciales
II”, Ediciones Pirámide, S.A., 1996 (C. Fernández, J. M. Ruiz).
10.4. TRANSPORTE PARALELO
235
(1) La aplicación transporte paralelo
Ttt0 : Tγ(t0 ) Q → Tγ(t) Q
v 7→ Ttt0 (v)
es un isomorfismo de espacios vectoriales (esencialmente, la linealidad
se debe a la del sistema (10.8) y la inyectividad a la unicidad de soluciones de (10.8) para cada v).
(2) Si (e1 , . . . , en ) es una base de Tγ(t0 ) Q y E1 , . . . , En son los correspondientes campos sobre γ obtenidos por transporte paralelo de los
vectores e1 , . . . , en , respectivamente, entonces cualquier campo paralelo
V sobre γ puede escribirse como
V =
n
X
ai Ei ,
ai ∈ R, ∀i ∈ {1, . . . , n}.
i=1
(3) Se verifica la igualdad Ttt21 ◦ Ttt10 = Ttt20 , ∀t0 , t1 , t2 ∈ I.
(4) Es posible reconstruir la conexión a partir del transporte paralelo. En efecto, para cada campo X ∈ X(Q) y cada curva γ en Q, el
campo de vectores ∇γ 0 (t) X se puede expresar en términos de la aplicación transporte paralelo de la siguiente manera:
∇γ 0 (t) X = limh→0
Ttt+h (Xγ(t+h) ) − Xγ(t)
h
(véase, p. ej., [Sp1, Chapter 6, Proposition 3]).
Ejercicio. Demuéstrese:
(1) Sea X ∈ X(Q) un campo paralelo para la conexión ∇ (Definición
10.1.3). Para cualquier curva γ, X̂ = X ◦γ es paralelo (Definición
10.4.1).
(2) Sean X, Y ∈ X(Q) dos campos paralelos. Si Q es conexa y Xp =
Yp para algún p ∈ Q entonces X = Y .
(3) Si Q es conexa entonces los campos paralelos sobre Q forman un
espacio vectorial de dimensión menor o igual que n.
236
10.5.
Geodésicas
Hasta ahora, para una curva diferenciable γ(t) en Q hemos definido
su velocidad γ 0 (t) pero no su aceleración. A continuación veremos cómo
la conexión permite definir esta última y, con ella, el concepto de
geodésica.
Definición 10.5.1 Sea (Q, ∇) una variedad afı́n y γ : I → Q una curva diferenciable. Llamaremos aceleración de γ a la derivada covariante
0
de su velocidad Dγ
.
dt
Diremos que γ es una geodésica si tiene aceleración nula Dγ 0 /dt ≡
0, esto es, si el campo de vectores γ 0 (t) sobre γ es un campo paralelo.
Obsérvese que para definir los conceptos de aceleración y geodésica ha
sido necesario introducir previamente la conexión afı́n.
Estudiemos a continuación la ecuación que define las geodésicas en
coordenadas. Dado un entorno coordenado (U, q 1 , . . . , q n ) de Q y un
campo X̂ a lo largo de una curva γ en U , la expresión de la derivada covariante viene dada por (10.7). Por tanto, si tomamos X̂ ≡ γ 0
entonces
Ã
!
n
n
0
2 k
X
X
Dγ
dq
∂
(t) =
(t) +
q̇ i (t)q̇ j (t)Γkij (γ(t))
|γ(t) .
2
dt
dt
∂q k
i,j=1
k=1
En consecuencia, γ será una geodésica si y sólo si se verifica:
n
X
d2 q k
(t) +
Γkij (γ(t))q̇ i (t)q̇ j (t) = 0,
dt2
i,j=1
∀k ∈ {1, . . . , n}.
(10.9)
Ejemplo. Si tomamos coordenadas usuales en (Rn , ∇0 ) entonces (10.9)
se reduce a
d 2 xk
= 0, ∀k ∈ {1, . . . , n}
dt2
y, por tanto, las geodésicas son rectas afines xk (t) = ak · t + bk , ∀k ∈
{1, . . . , n}. En cambio, en las coordenadas polares de R2 las ecuaciones
de las geodésicas adoptan la expresión:
ρ̈ − ρθ̇2 = 0,
ρθ̈ + 2ρ̇θ̇ = 0.
10.6. CONEXIONES SIMÉTRICAS
237
Como en la demostración del Teorema 10.4.2, si aplicamos los teoremas clásicos de existencia y unicidad de soluciones de ecuaciones
diferenciales a (10.9) obtenemos:
Teorema 10.5.2 Sea (Q, ∇) una variedad afı́n. Para cada t0 ∈ R,
p ∈ Q y v ∈ Tp Q, existe una única geodésica γ :]a, b[→ Q tal que
(i) γ(t0 ) = p, γ 0 (t0 ) = v, y
(ii) γ es inextensible (o maximal), esto es, no existe otra geodésica γ
que verifique (i) y cuyo dominio de definición contenga estrictamente a ]a, b[.
Grosso modo, lo que se está diciendo es que el punto y la velocidad
iniciales determinan la geodésica. Una propiedad relevante que pueden
presentar las geodésicas es la completitud:
Definición 10.5.3 Si una geodésica inextensible tiene dominio de definición todo R entonces se dice que es completa.
Una variedad cuyas geodésicas inextensibles son todas completas se
dice que es una variedad geodésicamente completa.
Por ejemplo, Rn con la conexión usual es completa. Sin embargo, la
bola de centro 0 y radio r(< ∞) no lo es.
Nota. Las velocidades de las geodésicas proporcionan las curvas integrales de un campo vectorial G sobre la variedad tangente, G ∈ X(T Q).
Ello permite descubrir algunas analogı́as entre los conceptos aquı́ estudiados para las geodésicas y los vistos en el Tema 5 para las curvas
integrales de cualquier campo vectorial.
10.6.
Conexiones simétricas
Si observamos con detenimiento las ecuaciones de las geodésicas,
encontramos que el término ẋi ẋj va multiplicado por (Γkij + Γkji ) para
cada par de ı́ndices i, j. Esto implica que las sumas (Γkij + Γkji ) están
determinadas por las geodésicas. Además, si la conexión es simétrica
entonces se tiene Γkij + Γkji = 2Γkij . Por tanto, las geodésicas determinan
los sı́mbolos de Christoffel y, en consecuencia, también la conexión.
Por otra parte, aunque una conexión ∇ no sea simétrica, siempre
ˆ simétrica a partir de ∇ que tenga
es posible construir otra conexión ∇
sus mismas geodésicas.
238
Proposición 10.6.1 Dada una conexión no simétrica ∇, existe una
ˆ cuyas geodésicas coinciden con las de ∇.
única conexión simétrica ∇
Esquema de la demostración. Paso 1. Para toda conexión afı́n ∇ se
define su torsión como
Tor(X, Y ) = ∇X Y − ∇Y X − [X, Y ],
X, Y ∈ X(Q).
Es fácil comprobar que Tor(·, ·) es un campo de tensores 2-covariante,
1-contravariante, no nulo y antisimétrico (Tor(X, Y ) = −Tor(Y, X)).
ˆ := ∇ − 1 Tor(·, ·), esto es, ∇
ˆ X Y = ∇X Y −
Paso 2. Definimos ∇
2
1
ˆ también es una conexión ya
Tor(X, Y ), ∀X, Y ∈ X(Q). Entonces ∇
2
que, en general, si a una conexión se le suma un tensor tipo (2, 1), se
obtiene otra conexión.
ˆ es
Paso 3. De la antisimetrı́a del tensor Tor(·, ·) es claro que ∇
simétrica. En efecto,
ˆ XY − ∇
ˆ Y X = ∇X Y − ∇Y X − 1 Tor(X, Y ) + 1 Tor(Y, X)
∇
2
2
= ∇X Y − ∇Y X − Tor(X, Y ) = [X, Y ].
Paso 4. Dado que
ˆ X X = ∇X X − 1 Tor(X, X) = ∇X X,
∇
2
(la última igualdad por la antisimetrı́a de Tor) las geodésicas para
ambas conexiones coinciden. 2
10.7.
Aplicación exponencial
Consideremos una reparametrización arbitraria γ(s) = γ(t(s)) de
una geodésica no constante γ(t). Entonces
¶
µ ¶2
µ
D dt 0
d2 t 0
dt
Dγ 0
Dγ 0
(s) =
γ (t(s)) = 2 · γ (t(s)) +
·
(t(s)).
ds
ds ds
ds
ds
dt
2
d t
Por tanto, γ seguirá siendo una geodésica si y sólo si ds
2 (s) ≡ 0, es
decir, si y sólo si t(s) = a · s + b, a, b ∈ R.
Por otra parte, observemos que si las geodésicas inextensibles γv ,
0
(0) = h ·
γh·v , h ∈ R\{0} verifican γv (0) = γh·v (0), γv0 (0) = v, γh·v
0
v entonces ambas geodésicas tienen la misma imagen y γh·v (s) ≡ h·
γv0 (hs).
10.7. APLICACIÓN EXPONENCIAL
239
Lema 10.7.1 Sea (Q, ∇) una variedad afı́n y consideremos un punto
p ∈ Q. Existe un entorno abierto U de 0 en Tp Q tal que para todo v ∈ U
la (única) geodésica inextensible γv tal que γv0 (0) = v está definida en
t = 1.
La demostración puede consultarse en [O’N, Chapter 3, Lemma 27]2 .
Teorema 10.7.2 Sea (Q, ∇) una variedad afı́n y consideremos un
punto p ∈ Q. Existe un entorno U0 de 0 en Tp Q y un entorno Up
de p en Q tal que la aplicación exponencial
expp : U0 (⊆ Tp Q) → Up (⊆ Q)
v 7→ γv (1)
está bien definida y es un difeomorfismo de U0 en Up .
Esquema de la demostración. Se basa en los siguientes puntos: (1) por
el Lema 10.7.1 la aplicación expp está bien definida en algún abierto
U de 0 ∈ Tp Q; (2) es diferenciable porque está construida a partir de
soluciones de ecuaciones diferenciales; (3) su diferencial en 0,
(d expp )0 : T0 (Tp Q) → Tp Q,
(10.10)
es biyectiva; de hecho, (d expp )0 es, esencialmente, la identidad, con la
identificación natural entre un espacio vectorial y su tangente en un
punto (véase [Subsección 3.2.2, Ejemplo (1)]); (4) como (d expp )0 es
biyectiva, podemos obtener el entorno en cuestión U0 ⊆ U usando el
Teorema de la Función Inversa [Capı́tulo 4, Sección 4.4]. 2
Observaciones:
(1) El Teorema 10.7.2 proporciona un entorno coordenado (Up ,
n
exp−1
p ) que contiene a p ∈ Q (identificando Tp Q con R mediante
cualquier isomorfismo vectorial).
(2) Las geodésicas que pasan por p, escritas en estas coordenadas,
se corresponden con lı́neas rectas que pasan por el origen de Rn . En
particular, esto implica Γkij (p) + Γkji (p) = 0 para todo i, j, k y, si ∇ es
simétrica, Γkij (p) = 0 para todo i, j, k.
Nota. Una discusión clásica en Relatividad General es la del “principio de equivalencia”, según el cual los observadores en caı́da libre
2
Para la idea intuitiva téngase en cuenta que si la geodésica γv puede definirse
en, digamos, t = t0 > 0 entonces la geodésica γt0 v (t) podrá definirse hasta t = 1.
240
pueden tomar coordenadas (t, x, y, z) tales que “infinitesimalmente”
(“en primer orden de aproximación”) las leyes de la Fı́sica se escriben
igual que para los observadores inerciales de la Relatividad Especial. La
formulación matemática de este principio es la siguiente. La gravedad
determina una conexión afı́n sobre el espacio-tiempo y, por tanto, sus
geodésicas. Los observadores en caı́da libre seguirán geodésicas de esta
conexión y, si miden cuidadosamente, lo harán usando la aplicación
exponencial. Por ello, en sus coordenadas los sı́mbolos de Christoffel
se anulan a lo largo de esa geodésica con lo que, en primer orden,
considerarán sı́mbolos de Christoffel nulos, igual que si se hallaran en
(Rn , ∇0 ).
Capı́tulo 11
Curvatura
El concepto de curvatura resulta esencial para entender la geometrı́a de
una variedad semi-riemanniana. No obstante, la formulación abstracta
de la curvatura como tensor, aunque muy simple matemáticamente,
resulta muy alejada de la intuición geométrica. Inicialmente, en este
tema se define el tensor curvatura y se estudian sus propiedades algebraicas elementales, incluyendo sus contracciones tı́picas -el tensor de
Ricci y la curvatura escalar- (Secciones 11.1– 11.5), para hacer luego
un breve recorrido intuitivo (Sección 11.6) que justifique el significado
de este tensor.
11.1.
Concepto de curvatura
Sea (Q, g) una variedad semi-riemanniana y ∇(≡ ∇g ) la conexión
de Levi-Civita de g. Definimos el tensor de curvatura como la aplicación:
R : X(Q) × X(Q) × X(Q) → X(Q)
(X, Y, Z) 7→ R(X, Y )Z
que viene dado por la expresión
R(X, Y )Z := ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z.
241
242
CAPÍTULO 11. CURVATURA
Otra manera de expresar el tensor de curvatura es
R(X, Y ) = [∇X , ∇Y ] − ∇[X,Y ] ,
expresión donde queda de manifiesto que R mide la falta de conmutatividad entre ∇X ∇Y y ∇Y ∇X . Señalamos que el término ∇[X,Y ] (que
no aparece si X, Y son campos coordenados) es necesario para que R
sea C ∞ (Q)-lineal en cada una de sus variables. Por tanto, tiene sentido
computar
R(up , vp )wp ∈ Tp Q ∀up , vp , wp ∈ Tp Q.
y considerar a la curvatura como un campo tensorial 3 covariante, 1
contravariante.
En coordenadas locales (U, q 1 , . . . , q n ) el tensor de curvatura adopta
la expresión
R=
n
X
i,j,k,l=1
l
Ri,j,k
dq i ⊗ dq j ⊗ dq k ⊗
∂
,
∂q l
l
donde Ri,j,k
= dq l (R(∂/∂q i , ∂/∂q j , ∂/∂q k )). Teniendo en cuenta que
Ã
Ã
!!
X ∂Γljk
X
X
Γljk ∂l ) =
∇∂i (∇∂j ∂k ) = ∇∂i (
∂ + Γljk
Γm
,
il ∂m
i l
∂q
m
l
l
i
se deduce fácilmente que la expresión de los coeficientes Rjkl
en coordenadas locales es:
i
Rkjl
n
n
X
X
∂ i
∂ i
i
m
= k Γjl − k Γlj +
Γlm Γjk −
Γikm Γm
lj .
∂q
∂q
m=1
m=1
Conviene destacar la dependencia de estos coeficientes respecto de Γkij
y ∂l Γkij , es decir, respecto de gij , ∂k gij y ∂l ∂k gij .
11.2.
Tensor de curvatura 4-covariante
El tensor de curvatura R tiene sentido para cualquier variedad
dotada de una conexión afı́n arbitraria. Sin embargo, como nos restringiremos a conexiones de Levi-Civita, podemos usar la correspondiente métrica g para subir y bajar ı́ndices. Ası́, a partir del tensor de
11.3. CURVATURA SECCIONAL
243
curvatura R podemos obtener un tensor tipo (4, 0) equivalente al anterior sin más que aplicar a R el sostenido ]. Es decir, podemos definir
el campo tensorial
R] : X(Q)4 → C ∞ (Q)
(X, Y, Z, W ) 7→ R] (X, Y, Z, W ) := g(R(X, Y )Z, W ).
Obviamente, para reobtener el tensor de curvatura a partir de éste
basta con subir ı́ndices, [Sección 7, Apéndice 1]. De ahora en adelante
abusaremos de la notación escribiendo también R en lugar de R] .
El tensor de curvatura R presenta las siguientes simetrı́as:
(1) Es un tensor antisimétrico en las dos primeras variables, esto es,
R(X, Y, Z, W ) = −R(Y, X, Z, W ),
∀X, Y, Z, W ∈ X(Q).
(2) Es antisimétrico en las dos últimas variables, esto es,
R(X, Y, Z, W ) = −R(X, Y, W, Z),
∀X, Y, Z, W ∈ X(Q).
(3) Es simétrico dos a dos en las dos primeras variables con las dos
últimas, esto es,
R(X, Y, Z, W ) = R(Z, W, X, Y ),
∀X, Y, Z, W ∈ X(Q).
(4) Verifica la primera identidad de Bianchi, esto es,
R(X, Y )Z + R(Z, X)Y + R(Y, Z)X = 0,
11.3.
∀X, Y, Z, W ∈ X(Q).
Curvatura seccional
Sea (Q, g) una variedad semi-riemanniana y consideremos un plano
tangente a dicha variedad Π = Gen{u, v} ⊆ Tp Q tal que g |Π sea no
degenerada.
Definición 11.3.1 La curvatura seccional Ks del plano Π se define
como
R(u, v, v, u)
.
(11.1)
Ks (Π) =
g(u, u)g(v, v) − g(u, v)2
244
Observaciones:
(1) La expresión (11.1) se simplifica si tomamos u, v tales que formen una base ortonormal de Π, ya que en este caso el denominador
pasa a ser ±1.
(2) Cuando g |Π es euclı́dea el denominador coincide con el cuadrado
del área del paralelogramo generado por u, v. En efecto, si α(u, v) es
el ángulo formado por u y v entonces
g(u, u)g(v, v) − g(u, v)2 = kuk2 kvk2 − kuk2 kvk2 cos2 (α(u, v))
= kuk2 kvk2 sen2 (α(u, v)).
Además, si g es riemanniana entonces g |Π es no degenerada para
cualquier plano Π.
(3) El valor de la curvatura seccional de un plano Π es independiente
de los vectores u, v elegidos. En efecto, si u = au + bv y v = cu + dv
con ad − bc 6= 0 entonces
R(u,v,v,u)
(ad−bc)2 R(u,v,v,u)
=
2
g(u,u)g(v,v)−g(u,v)
(ad−bc)2 (g(u,u)g(v,v)−g(u,v)2 )
R(u,v,v,u)
= g(u,u)g(v,v)−g(u,v)2 .
(4) La curvatura seccional Ks (Π) para todo plano no degenerado Π
tangente a Q en p determina el tensor de curvatura R en p. Por tanto,
resulta equivalente conocer R y Ks (véase, v. gr., [Sp1, Chapter 4D,
Proposition 8] o [O’N, pág. 79]).
11.4.
Tensor de Ricci
Sea (Q, g) una variedad semi-riemanniana y R su tensor de curvatura. Para cada Y, Z ∈ X(Q) consideramos el campo de endomorfismos
p 7→ R(·, Yp )Zp , siendo
R(·, Yp )Zp : Tp Q → Tp Q
Xp 7→ R(Xp , Yp )Zp .
Definición 11.4.1 Se define el tensor de Ricci de (Q, g) como el tensor (2, 0)
Ric : X(Q) × X(Q) → C ∞ (Q)
(Y, Z) 7→ Ric(Y, Z),
11.5. CURVATURA ESCALAR
245
definido por
Ric(Y, Z) : Q → R
p 7→ traza R(·, Yp )Zp .
Si se computa esta traza en términos de la métrica se obtiene:
Ric(Y,
:= traza R(·, Yp )Zp P
Pn Z)(p)
ij
= i,j=1 g g(R(∂i , Yp )Zp , ∂j ) = ni,j=1 g ij R(∂i , Yp , Zp , ∂j ).
Propiedades:
(1) El tensor de Ricci es simétrico, esto es, Ric(Y, Z) = Ric(Z, Y )
(esto es fácil de comprobar a partir de las simetrı́as de R, véase
la Sección 11.2). Además, salvo signo es el único tensor (2, 0) no
nulo que se obtiene como contracción del tensor de curvatura.
(2) En el caso riemanniano la “media” de las curvaturas seccionales
de todos los planos que contienen a vp ∈ Tp Q − {0} es
1 Ric(vp , vp )
.
n − 1 g(vp , vp )
(11.2)
La propiedad (2) se formula con más precisión como sigue. Sea Bp =
(e1 , . . . , en ) una base ortonormal de Tp Q con e1 = vp /kvp k, y sean Πi ,
i ≥ 2 los planos tangentes generados por e1 y ei . Entonces se tiene
Ric(vp ,vp ) = Ric(e , e ) = Pn R(e , e , e , e )
1 1
i 1 1 i
i=1
g(vp ,vp )
Pn
P
R(ei ,e1 ,e1 ,ei )
= i=2 g(ei ,ei )g(e1 ,e1 )−g(e1 ,ei )2 = ni=2 Ks (Πi ),
donde en la penúltima igualdad se ha usado que g(ei , ei )g(e1 , e1 ) −
g(ei , e1 )2 = 1, i = 2, . . . , n. Por tanto, al dividir por n − 1 se obtiene
la media de las curvaturas seccionales de los planos Π2 , . . . , Πn para
cualquier elección ortogonal de (e2 , . . . , en ).
11.5.
Curvatura escalar
Dado que el tensor de Ricci de una variedad semi-riemanniana
(Q, g) es de tipo (2, 0), su contracción métrica tiene sentido (véase
[Tema 7, Apéndice 1]).
246
Definición 11.5.1 Se define la curvatura escalar S de (Q, g) como la
contracción métrica de su tensor de Ricci.
En coordenadas (U, q 1 , . . . , q n ) la curvatura escalar en p adopta la expresión
n
X
S(p) =
g ij (p)Ric(∂i |p , ∂j |p ), ∀p ∈ U.
i,j=1
Ası́, si {e1 , . . . , en } es una base ortonormal de Tp Q y g es riemanniana
entonces
n
X
Sp ≡ S(p) =
Ric(ei , ei )p .
i=1
Por tanto, en este caso n1 Sp es una “media” de las curvaturas de Ricci
en p. Ahora bien, como (11.2) es la media de las curvaturas seccionales
de los planos que contienen a vp , en el caso riemanniano la expresión
1
Sp
n(n − 1)
puede entenderse como la media de las curvaturas seccionales de todos
los planos contenidos en p.
Nota. Las definiciones del tensor de curvatura (3,1) y del tensor de
Ricci tienen sentido para cualquier conexión afı́n ∇ (no necesariamente
de Levi-Civita). Sin embargo, tanto la curvatura seccional como la
escalar precisan de la métrica g para su definición.
11.6.
Significado de la curvatura
Aunque la construcción algebraica de R, Ric y S es simple, su
significado geométrico no es obvio, y tiene detrás una larga historia
de desarrollos matemáticos. En esta sección intentaremos dar un breve
apunte de su significado. Para fijar ideas nos restringiremos en esta
sección a una métrica g riemanniana.
11.6.1.
Orı́genes geométricos
Sea γ : I → R2 una curva plana unitaria (kγ 0 (t)k = 1). A continuación, consideremos la circunferencia tangente a dicha curva en γ(t0 )
11.6. SIGNIFICADO DE LA CURVATURA
247
que mejor se aproxime a ella, esto es, aquélla que, parametrizada como
curva unitaria, tenga velocidad y aceleración coincidentes con las de γ
en γ(t0 ). Se define la curvatura C(γ(t0 )) de γ en γ(t0 ) como 1/r siendo
r el radio de dicha circunferencia. Obsérvese que, como g0 (γ 0 (t), γ 0 (t))
es constante, se tiene 2g0 (γ 00 (t), γ 0 (t)) = 0, es decir, γ 00 (t)⊥γ 0 (t), ∀t. El
centro de la circunferencia que más se aproxima queda entonces sobre
la recta que pasa por γ(t0 ) con vector director γ 00 (t0 ), y su radio es
r = 1/kγ 00 (t0 )k. Como caso lı́mite, la curvatura se define como 0 si
γ 00 (t0 ) = 0 (r = ∞). 1
Observación. Esta definición de curvatura se extiende fácilmente al
caso de curvas en R3 . En este caso, aunque la curva unitaria γ : I →
R3 no esté contenida en un plano, el plano afı́n que pasa por γ(t0 )
generado por γ 0 (t0 ) y γ 00 (t0 ) es el que más se aproxima a γ en γ(t0 ).
Ası́, puede definirse la curvatura de γ en t0 como kγ 00 (t0 )k, y mantenerse
su interpretación como inversa del radio de circunferencia que más se
aproxima a γ en γ(t0 ).
Figura 24
Consideremos a continuación una superficie S incluida en R3 . Nuestro objetivo ahora será definir su curvatura en un punto p ∈ S. Sea
vp ∈ Tp S un vector unitario y sea γvp la geodésica en S con velocidad
1
Estas afirmaciones no son difı́ciles de demostrar. En cualquier caso, para todo
3
lo referente a curvatura de curvas y superficies en R remitimos al libro clásico de
M.P. do Carmo [dC2]
248
inicial vp . Considerando a γvp como una curva en R3 , puede demostrarse
que su aceleración en p es perpendicular a Tp S, por ser una geodésica
en S. Obviamente, podemos aplicar la definición anterior para calcular
C(γvp (t0 )) = 1/r. Además, usando que la curva está contenida en S,
es posible asociar un signo a la curvatura como sigue. Escojamos un
vector unitario Np normal a la superficie en p (Np ∈ Tp R3 es ortogonal
a Tp S). El centro Ovp de la circunferencia estará en la recta que pasa
por p con vector director Np , concretamente o en p + rNp o en p − rNp .
En el primer caso, consideraremos a la curvatura con signo positivo y,
en caso contrario, negativo. Esto es, definimos:
Figura 25
½
C
Np
(γvp (t0 )) =
kγv00p (t0 )k
−kγv00p (t0 )k
si Ovp = p + rNp
si Ovp = p − rNp .
Nota. Aunque en una superficie no orientable de R3 (como la cinta de
Möebius) no existe un campo normal globalmente definido N , sı́ podemos definir un vector normal en cada punto y, por tanto, mantener la
anterior definición punto a punto.
Calculemos la curvatura con signo de todas las geodésicas unitarias
contenidas en S que pasan por p. Existirán dos direcciones tales que
estas curvaturas sean máxima y mı́nima. Denotemos entonces a estas
curvaturas principales como:
Cmax = Max{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1}
Cmin = Min{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1}.
249
Obsérvese que Cmax , Cmin se calculan “extrı́nsecamente” a S, esto es,
viendo a S somo una superficie dentro de R3 , por lo que no tienen
un significado “intrı́nseco” (calculable a partir de la geometrı́a de S
como variedad riemanniana). Además, Cmax , Cmin también dependen
del normal Np escogido –aunque su producto es independiente de éste.
Por otra parte, como S es una variedad riemanniana de dimensión
2 (con la métrica inducida de la usual de R3 ), cada punto p ∈ S tiene
asociada una única curvatura seccional KS (p) = Ks (Πp ) correspondiente al único plano Πp = Tp S contenido en el espacio tangente a p
(véase la Sección 11.3). Pues bien, ambas curvaturas se relacionan de
la siguiente manera (Teorema Egregium de Gauss):
Para toda superficie S ⊂ R3 se verifica
KS (p) = Cmin · Cmax ,
donde KS (p)(:= Ks (Tp S)) denota la curvatura seccional de
S en p.
Es decir, el producto de las curvaturas principales de una superficie
S ⊂ R3 en cada punto p es una propiedad intrı́nseca a la superficie,
computable exclusivamente del valor de la métrica sobre ella y, de
hecho, igual a KS (p).
Por ejemplo, en cualquier punto de la esfera de radio r se tiene
Cmax = Cmin = 1r y, por tanto, KS ≡ r12 . Para el cilindro de radio de la
base a, se tiene Cmax = 1/a y Cmin = 0, luego KS ≡ 0.
Estudiemos ahora el caso más general en que (Q, g) es una variedad
riemanniana n-dimensional. Sea Πp un plano de Tp Q y consideremos
un abierto U0 ⊆ Tp Q tal que expp : U0 ⊆ Tp Q → Up ⊆ Q es un difeomorfismo. Consideremos la superficie S = expp (Πp ∩ U0 ) que contiene
a p. Se puede demostrar entonces que la curvatura seccional Ks (Πp )
coincide con la curvatura de S en p con la métrica restringida2 , KS (p).
Ası́, el tensor de curvatura R en cada punto p “contiene la información” de todas las curvaturas en p de todas las superficies que podemos
construir de este modo. Recı́procamente, estas curvaturas determinan
al tensor curvatura, pues a partir de la curvatura seccional Ks (Πp ) de
cada uno de los planos Πp tangentes a p es posible determinar el tensor
de curvatura R en p (véase la Sección 11.3).
2
Esto se mantiene válido si g es semi-riemanniana y el plano Πp no degenerado.
250
Extrı́nseco
Extrı́nseco
Extrı́nseco
l
Intrı́nseco
Intrı́nseco
Intrı́nseco
Intrı́nseco
11.6.2.
Curvatura de curvas C(γ(t0 ))
Curvatura (con signo) de curvas en una superficie S ⊂ R3 con un normal fijado; curvaturas principales Cmin , Cmax
Producto de curvaturas máxima y mı́nima
de S en p
l T. Egregium
Curvatura seccional KS (p) = Ks (Tp S)
Curvatura seccional de variedades riemannianas bidimensionales KS (p) = Ks (Πp ),
para el único plano Πp = Tp S
Curvatura seccional de cada plano tangente a una variedad riemanniana Ks (Πp ),
Πp ⊂ Tp Q, que coincide con la de la subvariedad riemanniana bidimensional S =
expp (Πp ) en p
Tensor curvatura R (que equivale a Ks (Πp )
para todo Πp )
Cómo la curvatura determina la métrica
Una vez estudiado el origen del tensor de curvatura, conviene entender cómo la curvatura determina la métrica. De nuevo, nos restringiremos a una variedad riemanniana (Q, g) aunque, esencialmente, lo que
sigue también valdrá para una variedad semi-riemanniana arbitraria:
Resultado 1. “La curvatura es una segunda derivada de la métrica”. Sea p ∈ Q y consideremos coordenadas normales (q 1 , . . . , q n ) asociadas a expp : U0 ⊆ Tp Q → Up ⊆ Q, siendo expp |U0 un difeomorfismo
y U0 un abierto estrellado,
gij (p) = δij
y Γkij (p) = 0,
∀i, j, k ∈ {1, . . . , n}.
(11.3)
Como q 1 (p) = · · · = q n (p) = 0, se verifica el siguiente desarrollo de
Taylor de gij :
1
gij (q 1 , . . . , q n ) = δij + Rijkl (p)q k q l + O(kqk3 ).
3
251
Para ello basta con tener en cuenta la expresión de los sı́mbolos de
Christoffel en términos de la métrica y usar (11.3) (véase [Sa, Chapter
II, Proposition 3.1]).
Resultado 2. “La curvatura determina la métrica”. Sean g, g 0 dos
0
métricas riemannianas sobre una variedad conexa Q. Si Rg = Rg sobre
todo Q y gp = gp0 en un punto p ∈ Q entonces g = g 0 .3 Por supuesto,
dos variedades isométricas (Q, g), (Q0 , g 0 ) (Sección 7.5) tienen “iguales
curvaturas” R, R0 ; esto es, al inducir mediante la isometrı́a F : Q →
Q0 el tensor curvatura R de Q en Q0 se obtiene R0 , o:
R0 (dFp vp , dFp wp )dFp up ) = dFp (R(vp , wp )up ),
para todo vp , wp , up ∈ Tp Q, ∀p ∈ Q.
Resultado 3. “La curvatura mide cuánto se aleja localmente una
geometrı́a de la de Rn ”. Existen diversos resultados en esta dirección.
Como un ejemplo sencillo, sea (Q, g) una variedad riemanniana con
R ≡ 0. Entonces para cada p ∈ Q existen coordenadas (Up , q 1 , . . . , q n )
tales que g(∂/∂q i , ∂/∂q j ) = δij en todo Up ; esto es, la carta coordenada
ϕ : Up → ϕ(Up ) ⊂ Rn es una isometrı́a. Este resultado se puede ver
como un caso muy particular, o bien del Resultado 2 anterior, o bien
de un Teorema clásico de Cartan (véase, p. ej., [Sa, II, Theorem 3.2]).
Ası́, curvatura nula implica “localmente isométrico” a Rn (pero no
globalmente, piénsese en el cilindro).
Resultado 4. “Geometrı́as no-euclı́deas modelo”. Se definen los
siguientes espacios modelo de curvatura constante C y dimensión n:
(i) Para C = 0, Rn .
(ii) Para C > 0, la esfera
Sn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 :
g0 ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = r2 },
√
con r = 1/ C, siendo g0 la métrica riemanniana usual de Rn+1
y la métrica de Sn (r) la inducida.
(iii) Para C < 0, el espacio hiperbólico
Hn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 :
gL ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = −r2 , xn+1 > 0}
3
Véase v.gr. 1.7.18 en J.A. Wolf, “Spaces of constant curvature”, Mc Graw-Hill
Co. NY (1967).
252
√
con r = 1/ −C, siendo gL la métrica lorentziana usual de Rn+1
y la de Hn la inducida (que es riemanniana). Ası́, por ejemplo,
para n = 2 se tiene4
H2 (r) = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 = −r2 , z > 0},
p
esto es, z = r2 + x2 + y 2 .
Teorema 11.6.1 Toda variedad riemanniana (Q, g) de curvatura constante C es localmente isométrica al espacio modelo de esa misma curvatura. Si, además, Q es
11.6.3.
Ecuación de Jacobi
Justifiquemos a continuación que la curvatura se halla ı́ntimamente
relacionada con la velocidad con la que las geodésicas se aproximan o
se separan entre sı́. En efecto, consideremos una variedad riemanniana
(Q, g) y sea γ : [0, 1] → Q una geodésica con kγ 0 k = 1. Consideremos
una variación de γ por geodésicas, esto es, una aplicación diferenciable
] − ², ²[×[0, 1] → Q
(s, t) 7→ γs (t)
(11.4)
tal que
(i) γ0 = γ, y
(ii) γs es una geodésica para cada s.
Para esa variación se define el campo variacional asociado, o campo de
Jacobi, como el campo sobre γ
J(t) =
d
|s=0 γs (t).
ds
En ocasiones se dice que J(t) es la “variación infinitesimal” de γ ante
la variación (“finita”) (11.4), escribiéndose δγ(t) en lugar de J(t). Se
expresa ası́ que J(t) mide, hasta primer orden, cómo se desvı́an las
+
Este espacio es isométrico al famoso semiplano de Poincaré (R × R , g =
(dx2 + dy 2 )/y 2 ).
4
253
geodésicas próximas a una dada. Se puede comprobar que el campo de
Jacobi J(t) verifica la ecuación
D2 J
+ R(J, γ 0 )γ 0 = 0,
dt2
2
que se conoce como ecuación de Jacobi. Por tanto, el término g( Ddt2J , J)
está ı́ntimamente relacionado con la curvatura seccional del plano Πt =
Gen{γ 0 (t), J(t)}, ya que, vı́a la ecuación de Jacobi, se tiene
g(
D2 J
, J) = −g(R(J, γ 0 )γ 0 , J) = −Ks (Πt )(g(γ 0 , γ 0 )g(J, J) − g(γ 0 , J)2 ).
dt2
Ası́, si la curvatura seccional es positiva (y g es riemanniana) las
geodésicas próximas tenderán a juntarse más que en el espacio euclı́deo (Rn , h·, ·i), y si es negativa, tenderán a separarse más que en
dicho espacio.
Esta interpretación puede extenderse al Ricci. Si, por ejemplo, en
lugar de suponer que la curvatura seccional sea positiva suponemos
sólo que el tensor de Ricci sea definido positivo, entonces las geodésicas
próximas a γ se acercarán “en promedio” más que en Rn , aunque eventualmente puede haber direcciones con Ks (Πt ) < 0 y en las que las
geodésicas próximas se alejen más.
11.6.4.
Otras propiedades
Existen otras propiedades que caracterizan la curvatura. Ası́, por
ejemplo, sea (Q, g) una variedad riemanniana y Πp un plano incluido
en Tp Q. Consideremos expp : Πp ∩ U0 → S ⊂ Q de manera que S sea
una superficie. Consideremos en Πp ∩ U0 la circunferencia centrada en
0 y de radio r. Sea Cr la imagen de esa circunferencia por expp , cuya
longitud L(Cr ) se computa usando la métrica g. Entonces:
limr→0
π
2πr − L(Cr )
=
Ks (Πp ).
r3
3
(11.5)
Por otra parte, en el Tema 8 se muestra que la métrica g permite
introducir una medida (área en dimensión 2, volumen en dimensión 3)
de cualquier subconjunto abierto o cerrado de (Q, g) (véase también la
nota al final de la Sección ??). Si denotamos por A0 (r) = πr2 y A(r)
254
a las áreas de la circunferencia usual de radio r (en Tp Q) y de Cr en
expp (Πp ∩ U0 ), respectivamente, se verifica:
Ks (Πp ) = limr→0 12
A0 (r) − A(r)
.
r2 A0 (r)
(11.6)
Grosso modo, a mayor curvatura menor longitud y área que las esperadas en Rn .
Las fórmulas (11.5) y (11.6) permiten conocer si el espacio está curvado en un punto p a partir de “mediciones infinitesimales de longitud
y área alrededor de p”. Ası́, los eventuales habitantes de un espacio
curvado podrán percatarse de su curvatura a partir de mediciones de
longitudes y áreas.
Capı́tulo 12
Algunas notas sobre
Relatividad
En este capı́tulo se describen muy brevemente los ambientes matemáticos de la Relatividad Especial y General. Mostraremos cómo los diferentes objetos geométricos introducidos encajan en el marco de la Relatividad, resultando imprescindible toda la maquinaria matemática
estudiada para el caso de la Relatividad General. Sin mayores pretensiones, nuestro objetivo es doble: ayudar a conectar los diferentes
lenguajes fı́sico y matemático que aparecen en la literatura sobre Relatividad, y estimular la curiosidad e interés rigurosos por esta teorı́a.
12.1.
Relatividad Especial
12.1.1.
Espacios vectoriales lorentzianos
Recordemos que todo espacio vectorial lorentziano (V, h·, ·i) de dimensión n + 1 es isométrico al espacio de Lorentz-Minkowski Ln+1 ,
que se define como Rn+1 dotado con la métrica usual lorentziana η ≡
(−, +, . . . , +). Denotaremos por (t = x0 , x1 , . . . , xn ) a las coordenadas
usuales de Ln+1 , por lo que en ellas se tiene:
η00 = −1,
ηij = δij ,
255
∀i, j ∈ {1, . . . , n}.
256
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
El caso de mayor
p interés fı́sico es, por supuesto, n = 3. De ahora
en adelante a |hv, vi| lo denotaremos por kvk, aunque no verifica,
obviamente, las propiedades de una norma. Diremos que un vector
v ∈ V es:


hv, vi < 0
temporal






hv, vi = 0, v 6= 0
luminoso
si
hv, vi ≤ 0, v 6= 0
causal






espacial
hv, vi > 0 ó v = 0.
No es difı́cil comprobar (obsérvese la Figura 26 para L3 ) que los
vectores causales de (V, h·, ·i) junto con el vector v = 0 forman dos
conos. Si elegimos uno de estos conos C ↑ y lo llamamos cono futuro,
diremos que el espacio vectorial lorentziano está orientado temporalmente, y al otro cono C ↓ se le llama cono pasado. En Ln+1 elegimos
como cono futuro al superior, esto es, C ↑ = {a = (a0 , . . . , an ) ∈ Ln+1 :
ha, ai ≤ 0, a0 ≥ 0}.
Figura 26
Fijada una variedad lorentziana (Q, g), a una elección “continua”
de un cono para cada Tp Q (isométrico a Ln+1 , aunque no de modo
12.1. RELATIVIDAD ESPECIAL
257
canónico) se le llama una orientación temporal de la variedad. Una
variedad lorentziana que admita una orientación temporal (no todas
la admiten) se dice que es temporalmente orientable. Si Q es conexa
y temporalmente orientable, tal orientación temporal estará fijada por
la elección del cono en un punto cualquiera p ∈ Q.
Llamamos transformaciones de Lorentz en Ln+1 a cada una de sus
isometrı́as vectoriales, esto es, a los isomorfismos vectoriales f : Ln+1 →
Ln+1 que verifican η(u, v) = η(f (u), f (v)), ∀u, v ∈ Ln+1 . Esto equivale
a que f aplique bases ortonormales en bases ortonormales de manera
ordenada. Matricialmente, esta condición se reduce a
(ηij ) = At · (ηij ) · A,
(12.1)
donde ηij = η(vi , vj ) y
A = M (f, B) = (f (v0 ), f (v1 ), . . . , f (vn )),
donde cada f (vi ) se escribe por columnas y B = (v0 , . . . , vn ) es cualquier base ortonormal de Ln+1 .
Conviene señalar que, en general, las transformaciones de Lorentz
no conservan la elección hecha para los conos temporales, esto es, tal
vez f (C ↑ ) = C ↓ . A una transformación de Lorentz que sı́ respete los
conos temporales, esto es, tal que f (C ↑ ) = C ↑ (y, por tanto, f (C ↓ ) =
C ↓ ) se le llama ortocrona. Si, además, det f > 0 entonces se dice que
es propia.
Claramente, el conjunto de las transformaciones de Lorentz junto
con la operación de composición tiene una estructura de grupo. El
estudio de las isometrı́as vectoriales de un espacio vectorial lorentziano
(V, h·, ·i) de dimensión n+1 equivale al estudio de las transformaciones
de Lorentz de Ln+1 .
12.1.2.
El grupo de Lorentz
El estudio de las transformaciones de Lorentz equivale al de las matrices que verifican (12.1). Ası́ llamamos grupo de Lorentz de dimensión
n + 1 a:
O1 (n + 1) = {A ∈ Gl(n + 1, R) : At (ηij )A = (ηij )}.
Retomando la subsección anterior, es inmediato ahora comprobar que
una transformación de Lorentz f con matriz en una base ortonormal
258
A ∈ O1 (n + 1) y elementos (aij ), i, j ∈ {0, 1, . . . , n} será ortocrona si y
sólo si a00 > 0. Además, como η(e0 , e0 ) = −1 y
−1 = η(f (e0 ), f (e0 )) =
−(a00 )2
+
n
X
(a0i )2 ,
i=1
necesariamente se tiene que |a00 | ≥ 1. Denotamos por O1↑ (n + 1) (resp.
O1+ (n+1), O1+↑ (n+1)) al subgrupo de O1 (n+1) formado por las matrices con a00 ≥ 1 (resp. det A = 1, que verifican ambas condiciones). Para
cualquier espacio vectorial lorentziano (V, h·, ·i) las isometrı́as vectoriales de V se corresponden, fijada una base ortonormal, con los elementos
de O1 (n + 1).
En el caso n = 1 el grupo de Lorentz puede computarse explı́citamente con facilidad, obteniéndose:
½µ
¶
¾
² · cosh θ ν · senh θ
O1 (2) =
: θ ∈ R, ², ν ∈ {1, −1} . (12.2)
² · senh θ ν · cosh θ
Ejercicio. Demuéstrese (12.2).
Obsérvese que si ² = ν = 1 entonces las correspondientes transformaciones son ortocronas propias, esto es, pertenecientes a O1+↑ (2).
Adicionalmente, podemos usar la siguiente expresión para las matrices
en O1+↑ (2):
µ
cosh θ senh θ
senh θ cosh θ
¶
µ
= cosh θ ·
1
tagh θ
tagh θ
1
¶
.
Usando entonces que cosh2 θ − senh2 θ = 1 y definiendo v = tagh θ, que
verifica |v| < 1, obtenemos
½
O1+↑ (2)
=
1
√
1 − v2
µ
1 v
v 1
¶
¾
: v ∈] − 1, 1[ .
(12.3)
Con más generalidad, no es difı́cil demostrar que si f es una transformación de Lorentz de (V, h·, ·i) y Π es un subespacio invariante por
f (esto es, f (Π) ⊆ Π) entonces el subespacio ortogonal a Π (es decir,
Π⊥ = {v ∈ V : hv, wi = 0, ∀w ∈ Π}) también lo es (f (Π⊥ ) ⊆ Π⊥ ). Ello
permite dar la siguiente definición:
259
Definición 12.1.1 Sea f una isometrı́a de un espacio vectorial lorentziano (V, h, i) de dimensión n + 1. Diremos que f es una transformación de Lorentz pura o “boost” (resp. isometrı́a espacial pura) si f
admite un subespacio Π invariante por f que verifica: tiene dimensión
2 (resp. dimensión n), la métrica restricción g |Π es lorentziana (resp.
euclı́dea) y la restricción de la isometrı́a al subespacio ortogonal f |Π⊥
es la identidad.
En dimensión 4 se puede demostrar que para toda transformación de
Lorentz propia ortocrona f existe un “boost” f1 y una isometrı́a espacial pura f2 tales que
f = f1 ◦ f2 .
Además, al ser f2 esencialmente una isometrı́a vectorial (y que conserva
la orientación) en un espacio vectorial Π de dimensión 3, f2 restringido
a alguna recta R ⊂ Π es la identidad, por lo que f2 puede considerarse
como una rotación pura en el plano P ⊂ Π ortogonal a R. Esto es,
“f se puede escribir como composición de un “boost” y una rotación”
–aunque el plano espacial P en el que transcurre la rotación no es
necesariamente ortogonal al plano temporal en el que transcurre el
“boost”. Ası́, muchas de las propiedades más caracterı́sticas de las
transformaciones de Lorentz se pueden estudiar en dimensión 2.
12.1.3.
L4 como modelo de espaciotiempo
Reflexionemos en primer lugar sobre por qué el plano fı́sico admite como modelo matemático al plano euclı́deo R2 ≡ (R2 , dx21 + dx22 ).
Esencialmente, esto significa:
(a) El plano fı́sico P admite una estructura de variedad riemanniana
(o de espacio afı́n euclı́deo) de dimensión 2 que es isométrica
a R2 .
(b) Existe una manera fı́sica de construir una tal isometrı́a I : P →
R2 . A la postre, digamos: se puede “fijar un origen, unos ejes
ortogonales y unidades” en el plano fı́sico y “proyectar” cada
punto sobre los ejes coordenados, obteniendo ası́ el elemento deseado de R2 .
260
Es de señalar que esta isometrı́a no es única. Sin embargo, si fijamos
una entonces podemos trabajar indistintamente con P ó R2 . Además,
cuando se tienen dos de tales isometrı́as I, I 0 : P → R2 existe una
isometrı́a R de R2 tal que I 0 = R ◦ I; esto es, todo el estudio se acaba
reduciendo al de R2 .
En Relatividad Especial se postula que el conjunto de todos los
eventos (o sucesos “aquı́-ahora”) del espaciotiempo admite como modelo fı́sico al espacio de Minkowski L4 con su orientación temporal
futura. La necesidad de este postulado se puede comprobar a posteriori, ya que permite modelar la constancia de la velocidad de la luz.
Como en el caso del plano fı́sico tal postulado significa:
(a) El espaciotiempo como conjunto de sucesos admite una estructura de variedad lorentziana (Q, g) (o de espacio afı́n lorentziano)
de dimensión 4 y orientada temporalmente que es isométrica a L4
(mediante una isometrı́a que respeta los conos futuros, es decir,
una isometrı́a ortocrona).
(b) Existe una manera fı́sica de construir esa isometrı́a.
Sin embargo, (b) resulta ahora menos intuitivo y precisa de discusiones
fı́sicas. Resumiendo, se admite que dicha isometrı́a se construye usando
la existencia de observadores inerciales en el espaciotiempo (Q, g). Cada uno de estos observadores describe una geodésica (recta afı́n) r(t)
tal que r0 (t) pertenece al cono futuro y g(r0 (t), r0 (t)) = −1. En cada
instante t0 el observador percibe como espacio en reposo el hiperplano
afı́n Π(t0 ) que es ortogonal a r(t) en r(t0 ). Este hiperplano podrá considerarse entonces como una variedad riemanniana (o un espacio afı́n
euclı́deo) isométrica a R3 (Figura 27).
Si nos restringimos a una dimensión espacial, una vez que el observador fija la isometrı́a dicho observador “se ve a sı́ mismo” como
una recta con vector director e0 = (1, 0) de L2 , siendo su “espacio
en reposo” una recta de vector director e1 = (0, 1). Otro observador
será visto por el primero como otra recta de vector director temporal
e00 ∈ C ↑ , y tendrá como espacio en reposo una recta distinta con vector
director e01 que será ortogonal a e00 . La matriz de cambio de base entre
(e0 , e1 ) y (e00 , e01 ) pertenecerá a O1↑ (2).
261
Figura 27
12.1.4.
La constancia de la velocidad de la luz
En la aceptación histórica de Ln+1 , n = 3, como modelo del espaciotiempo en Relatividad Especial, el problema de la velocidad de la luz,
que comentaremos brevemente, representó un papel central. Por simplicidad puede suponerse n = 1, aunque los desarrollos matemáticos
que siguen pueden extenderse para un n arbitrario.
En contra de la intuición newtoniana clásica, tanto argumentos teóricos
como evidencias experimentales sugerı́an postular que la velocidad de
la luz es finita y la misma para todos los observadores (inerciales). Los
argumentos teóricos se basaban en los siguientes tres hechos:
(1) las ecuaciones de Maxwell proporcionan la velocidad de la luz
-o de cualquier onda electromagnética- con respecto a su medio de
propagación (no respecto a la fuente que la origina),
(2) la luz se propaga en el vacı́o y
(3) el vacı́o parece ser el mismo para todos los observadores inerciales.
Ası́, la velocidad de la luz respecto al vacı́o predicha por las ecuaciones
262
de Maxwell debı́a ser la misma que midieran todos los observadores
inerciales, independientemente de su movimiento relativo. La evidencia experimental de este hecho se halló con el célebre experimento de
Michelson-Morley.
En el marco de la Mecánica Newtoniana, la existencia de esta velocidad c igual para todos los observadores resultaba absurda: si un
observador inercial mide como velocidad de la luz c, otro observador
inercial que se mueva a una velocidad v respecto al primero en la dirección y sentido de propagación de la luz deberı́a medir como velocidad
de la luz c − v. Veamos cómo esta velocidad de propagación constante
(digamos c = 1, en unidades apropiadas) es modelable en Relatividad
Especial.
Supongamos, como al final de la subsección anterior, que se tienen
dos observadores inerciales, el primero de los cuales toma coordenadas
de modo que describe al espaciotiempo como Ln+1 , y la recta que él
mismo describe se corresponde con r(t) = t(1, 0) (≡ t(1, 0, . . . , 0)),
siendo e0 ≡ r0 (0) = (1, 0). Supondremos por simplicidad que la recta
s que describe el segundo observador corta a r en el origen, esto es,
se escribe en las coordenadas del primero como s(t) = te00 , siendo
e00 = (t0 , x0 ) ∈ C ↑ cualquier vector temporal unitario que apunte al
futuro.
La n-upla v = x0 /t0 se interpreta (bien como definición matemática,
bien como postulado fı́sico) como la velocidad del observador asociado
a e00 medida por el observador e0 . Ahora bien, como −1 = η(e00 , e00 ) =
−t20 + kx0 k2 se tiene kvk2 = 1 − 1/t20 y, por tanto, esta velocidad es
siempre menor que 1.
Sea ahora u = (u0 , u1 ) ∈ C ↑ un vector luminoso (u0 > 0, ku1 k =
|u0 |). El cociente v = u1 /u0 verifica kvk = 1 al ser 0 = η(u, u) =
u20 −u21 . Este hecho es de vital importancia para nuestro modelo, porque
permite postular que las trayectorias de los rayos de luz se describen
mediante geodésicas (rectas afines) luminosas de L4 que apuntan al
futuro: cualquier observador inercial medirá como velocidad de esa
geodésica en sus coordenadas v = u1 /u0 de modo que siempre kvk = 1.
Más aún, como demostró el propio Einstein, la descripción unificada
~ y magnético B
~ como componentes de una
de los campos eléctrico E
2-forma diferencial (véase la Subsección 6.2.1) permite una descripción
sencilla de las ecuaciones de Maxwell y de todo el electromagnetismo.
12.1.5.
263
Algunas consecuencias del modelo
Admitiendo L4 como modelo del espaciotiempo, debemos ser consistentes con él. Ello provoca algunas consecuencias que inicialmente
pueden resultar sorprendentes. Históricamente, la más conocida de ellas es la identidad entre masa (en reposo) y energı́a, a través de la
famosa ecuación de Einstein E = mc2 . Podemos intuir la necesidad de
una relación de este tipo porque para una partı́cula en movimiento, el
momento p~ = (px , py , pz ) y la energı́a E medidos por un observador
inercial no pueden tener un significado intrı́nseco (no se transforman
separadamente como las coordenadas de ningún tensor sobre L4 ). Resulta ası́ natural postular que no son más que componentes de un
vector (E, p~). El escalar h(E, p~), (E, p~)i precisa entonces de alguna interpretación fı́sica, y diversos análogos con la energı́a cinética clásica
hacen natural postular h(E, p~), (E, p~)i = −m2 (≡ −m2 c4 ), siendo m la
masa que medirı́a un observador para el que la partı́cula estuviera en
reposo. Describimos brevemente a continuación otras consecuencias,
éstas puramente geométricas.
Dilatación del tiempo. Supongamos que los observadores e00 y e0
asignan coordenadas (T 0 , 0) y (T, X), respectivamente, al evento P ,
con T 0 > 0 (Figura 28).
Entonces, aplicando la métrica η al vector OP obtenemos η(OP , OP ) =
−(T 0 )2 para el observador e00 . Para el observador e0 se tiene, en cambio,
η(OP , OP ) = −T 2 + X 2 . Igualando ambas expresiones se tiene:
T 2 = (T 0 )2 + X 2
y, por tanto, T > T 0 . Más aún, dividiendo en ambos miembros por T 2
se tiene
µ 0 ¶2
T
1=
+ v2,
T
siendo v la velocidad relativa del observador e00 respecto del observador
e0 . En consecuencia,
1
T =√
T 0.
1 − v2
Desigualdad triangular. Consideremos un triángulo lorentziano
OP Q en L4 (Figura 29). Se verifica el siguiente teorema: si OP , OQ
264
Figura 28
y P Q son temporales y apuntan al futuro entonces
kOQk ≥ kOP k + kP Qk,
(12.4)
con igualdad si y sólo si los vectores son colineales. Esta desigualdad
recibe el nombre de desigualdad triangular, y se deduce análogamente a
la conocida desigualdad triangular euclı́dea (kOQk ≤ kOP k + kP Qk).
Fı́sicamente, (12.4) se interpreta como que el tiempo medido por el
observador e00 que sigue la trayectoria desde O hasta Q es mayor que
el medido por el observador que sigue la trayectoria OP y luego P Q.
(Esta conclusión produce la popular “paradoja de los gemelos”.)
Contracción de la longitud. Consideremos una varilla V de longitud L = kOP k que está en reposo respecto del observador e0 . Para
el observador e00 la varilla tendrá longitud L0 y estará en movimiento
0
(véase la Figura 30). Esta longitud L0 será igual a la del segmento OP ,
intersección del espacio en reposo de e00 (generado por {e01 }) con todas
las rectas temporales Rx = {(t, x) : t ∈ R} generadas por cada uno de
los puntos de la varilla (0, x) para x ∈ [0, L]. Por tanto,
0
0
η(OP , OP ) = (L0 )2 .
12.2. RELATIVIDAD GENERAL
265
Figura 29
Como P 0 = (T, L) en las coordenadas del observador e0 , se tiene
0
0
η(OP , OP ) = −T 2 + L2 . En consecuencia,
√
L0 = −T 2 + L2
y, por tanto, L02 < L2 . Más aún, téngase en cuenta que e00 es ortogonal a e01 , por lo que las coordenadas de e00 determinadas por e0 son
proporcionales a (L, T ). La velocidad de e00 medida por e0 es entonces
v = T /L. Ası́, de la expresión anterior para L0 se tiene:
√
L0 = 1 − v 2 · L.
12.2.
Relatividad General
12.2.1.
El modelo matemático
En Relatividad General, esto es, el modelo obtenido cuando se incorporan los efectos de la gravedad a la Relatividad Especial, se postula
que el espaciotiempo fı́sico (o una región “macroscópicamente grande”
de él) admite una estructura de variedad de Lorentz conexa temporalmente orientada de dimensión 4.
Esto se corresponde con el paso (a) de la Subsección 12.1.3, con la
importante diferencia de que ahora no está prefijado de antemano el
modelo matemático de variedad a la que es isométrico el espaciotiempo. Por eso, el paso (b) de esa subsección debe llevarse a cabo desentrañando a la vez a qué variedad lorentziana temporalmente orientable
concreta es isométrico el espaciotiempo.
266
Figura 30
Para esto no existen reglas fijas, pero sı́ se aceptan algunas prescripciones: (i) Cada observador se modela como una curva temporal
(unitaria) γ dirigida hacia el futuro; si el observador está en caı́da libre
entonces describe una geodésica (el vector velocidad de la geodésica es
temporal, unitario y apunta en la dirección del cono futuro en cada
punto). (ii) Si γ(t) es un observador, en cada instante t0 podemos considerar el hiperplano Π ortogonal a γ 0 (t0 ) en Tγ(t0 ) Q (Π serı́a el “espacio en reposo infinitesimal” de γ 0 (t0 )) , y la hipersuperficie expγ(t0 ) (Π)
constituye el “espacio en reposo” del observador γ en t0 (al menos para
distancias “suficientemente pequeñas”). (iii) Las partı́culas aceleradas
vienen representadas por curvas temporales que apuntan al futuro (su
normalización, en lugar de unitaria, se suele escoger igual a la masa
en reposo en cada instante). (iv) Los rayos de luz se describen como geodésicas luminosas que apuntan también al futuro (la luz no
está acelerada1 ).
Es de señalar que el tensor de curvatura desempeña ahora un papel
crucial, puesto que determina cómo se comportan las geodésicas. Como
veremos más adelante (Subsección 12.2.4), este tensor vendrá determinado por la materia y la energı́a.
1
Sin embargo, no existe una interpretación fı́sica clara para las geodésicas espaciales.
12.2.2.
267
Causalidad
Consideremos una variedad de Lorentz orientada temporalmente
(Q, g). Si p, q ∈ (Q, g), se definen las siguientes relaciones de causalidad:

futuro cronológico (q << p)



futuro causal estricto (q < p)
p está en el
de q
pasado cronológico (p << q)



pasado causal (p ≤ q)
si existe una curva diferenciable a trozos,

temporal y dirigida al futuro



causal y dirigida al futuro
temporal y dirigida al pasado



causal y dirigida al pasado
que parte de p y llega a q. La notación p ≤ q significa que o bien p < q
o bien p = q. Se pueden comprobar relaciones del tipo:
p << q, q << r =⇒ p << r
p << q, q ≤ r =⇒ p << r
p ≤ q, q ≤ r =⇒ p ≤ r,
etc. Llamaremos ası́ futuro cronológico de p, I + (p), (resp. futuro causal
de p, J + (p)) a:
I + (p) = {q ∈ Q : p << q}
J + (p) = {q ∈ Q : p ≤ q}
Para los pasados cronológico I − (p) o causal J − (p) las definiciones son
análogas.
La estructura causal del espaciotiempo tiene un enorme interés tanto fı́sico como geométrico, pudiendo presentar los futuros y pasados
multitud de posibilidades. Ası́, observemos que en el espaciotiempo
de Minkowski los conos aparecen como en la Figura 31, por lo que el
conjunto J + (p) acaba intersecando a toda geodésica temporal dirigida
hacia el futuro r(t). Sin embargo, en un espaciotiempo en el que los
conos se distribuyan como en la Figura 32, ocurre que si p está a la
derecha de la lı́nea L (el “horizonte de sucesos”) entonces J + (p) no
interseca la región a la izquierda de L. De hecho, un observador como
268
γ1 , que parte del punto q a la izquierda de L, una vez que atraviese L
no volverá a cruzar esta lı́nea, perdiendo todo contacto con la región
izquierda de L. Ası́, γ1 sólo podrá encontrarse con γ2 si éste también
se decide a cruzar L (sabiendo que entonces γ2 tampoco la volverá a
poder cruzar).
Figura 31
Para un espaciotiempo se suele admitir que se verifican diferentes
condiciones de causalidad. De todas, la más básica y menos restrictiva
es la condición de cronologı́a, esto es, que no existan curvas temporales
cerradas (a través de las cuales un observador podrı́a viajar a su propio
pasado).
Por último, señalemos la siguiente cuestión técnica. Sea Ω > 0 una
función diferenciable sobre Q. A la métrica de Lorentz g 0 = Ωg se le
llama métrica conforme a g mediante Ω. Claramente, dos métricas conformes presentan los mismos vectores luminosos y, por tanto, la misma
causalidad (la causalidad es un “invariante conforme”). Además, si dos
métricas lorentzianas g, g 0 tienen iguales vectores luminosos (y, por
tanto, igual causalidad) entonces un bonito razonamiento algebraico
muestra que son conformes (véase, por ejemplo, [BEE, Theorem 2.3];
el resultado es válido en cualquier dimensión n, con la salvedad para
n = 2 de que el factor Ω puede ser también siempre negativo). Esto
269
Figura 32
sugiere definir clases conformes de métricas mediante la relación de
equivalencia: g ∼ g 0 si y sólo si existe Ω > 0 tal que g 0 = Ωg. La estructura conforme de un espaciotiempo equivale a la causal (conjunto
de los conos luminosos futuros en cada punto), y existen múltiples propiedades fı́sicas y geométricas (trayectorias de rayos luminosos, tensor
de Weyl, etc.) que dependen sólo de ella.
12.2.3.
Propiedades maximizantes de las geodésicas
causales
En el casop
lorentziano, la longitud de una curva γ : [a, b] → Q se deRb
fine como a |g(γ 0 (t), γ 0 (t))|dt. Aunque ahora no existe una distancia
asociada como en el caso riemanniano (Sección ??), se puede definir un
concepto con ciertas analogı́as para curvas causales dirigidas al futuro.
En primer lugar, obsérvese que no podemos usar como distancia entre
dos puntos relacionados causalmente p, q , p ≤ q el ı́nfimo de las longitudes de las curvas causales que los conectan, puesto que éste siempre
serı́a cero (bastarı́a con coger curvas que fuesen luminosas en casi todo
270
su trayecto). Por el contrario, lo que se hace es tomar el supremo de
las longitudes de tales curvas. Aunque este supremo puede ser ∞ (por
ejemplo, si existiera una curva temporal cerrada que pasase por p y
q), condiciones de causalidad poco restrictivas implican su acotación.
Este supremo recibe el nombre de distancia lorentziana o separación
temporal d(p, q) definido por:
Sup{L (γ) : γ curva causal dirigida al futuro que conecta p y q},
que puede tomar cualquier valor en [0, ∞] (si p 6≤ q entonces se define
d(p, q) = 0). Con esta definición se prueban algunas analogı́as entre las
propiedades minimizantes de las geodésicas en geometrı́a riemanniana
y las correspondientes maximizantes en geometrı́a lorentziana. La más
relevante de ellas es la desigualdad triangular invertida:
d(p, q) + d(q, r) ≤ d(p, r).
Sin embargo, también hay notables diferencias: ası́ d(p, q) = 0 no implica p = q y, en general, d(p, q) 6= d(q, p) (de hecho, si d(p, q) = d(q, p)
entonces necesariamente d(p, q) ∈ {0, ∞}). Las analogı́as se extienden
a las propiedades que relacionaban geodésicas y longitud en el caso
riemanniano. Ası́, si en el caso riemanniano (Sección ??) las geodésicas
minimizan localmente la longitud (en Rn+1 globalmente), en el caso
lorentziano las geodésicas causales la maximizan localmente (en Ln+1
globalmente). Fı́sicamente, la longitud de una curva causal se identifica
con el tiempo medido por un observador que la recorra (“tiempo propio” del observador). Por tanto, un observador en caı́da libre γ medirı́a
un tiempo mayor que el de cualquier otro observador ρ “próximo”2 que
siga una curva temporal no geodésica, Figura 33. (Esta es la versión
más general de la “paradoja de los gemelos”.)
12.2.4.
Ecuación de Einstein
Como ya sabemos, cada espaciotiempo viene modelado por una variedad de Lorentz orientada temporalmente de dimensión 4. Ası́, una
vez fijada la variedad de Lorentz es posible establecer la causalidad,
la velocidad de las partı́culas, las trayectorias de los rayos de luz, etc.
Basta con que ρ y γ caigan en un mismo entorno normal, ası́, en L
necesaria la restricción de que ρ sea “próximo”.
2
n+1
no es
271
Figura 33
Ahora bien, ¿qué es lo que determina la métrica g que modela al espaciotiempo (y su estructura topológica y diferenciable)? Parece fı́sicamente razonable que sea la energı́a, considerada en sentido amplio, es
decir, abarcando el momento, la masa, etc. La ecuación de Einstein
relaciona conceptos geométricos asociados a g, como el tensor de Ricci y la curvatura escalar, con conceptos fı́sicos como la energı́a y el
momento.
La energı́a del espaciotiempo fı́sico permite construir un campo
de tensores T de tipo (2, 0) y simétrico, que llamaremos tensor impulso -energı́a, atendiendo a lo siguiente: para cada base ortonormal
(e0 , e1 , e2 , e3 ) en Tp Q el término T (e0 , e0 ) medirá la densidad de energı́a
en ese punto para cualquier observador con velocidad e0 en p; el término T (e0 , ei ) medirá la densidad de momento lineal en la dirección ei ,
y T (ei , ej ) la densidad de presión en la dirección ej sobre la superficie
en e⊥
0 ortogonal a ei . Se tiene ası́ la matriz 4 × 4:


T (e0 , e0 ) T (e0 , ei )

,
T (e0 , ej ) T (ei , ej )
donde T (ei , ej ), i, j ∈ {1, 2, 3} es una matriz 3 × 3. En principio, este
tensor, que se construye a partir de la distribución de energı́a del espaciotiempo, debiera determinar su geometrı́a. La igualdad esperada
272
entre elementos asociados a g y T es la ecuación de Einstein:
1
Ric − Sg + Λg = T,
2
(12.5)
donde Λ ∈ R es la constante cosmológica. Además (siempre que no se
entre en consideraciones cuánticas como las referentes a la energı́a del
vacı́o), se acepta que la constante cosmológica Λ debe ser 0, por lo que
la ecuación de Einstein se supondrá en adelante:
1
Ric − Sg = T.
2
(12.6)
Hay varios argumentos fı́sicos de plausibilidad en favor de (12.5)3 , pero
esta ecuación debe admitirse como un postulado, sin demostración formal.
Si se describe una región del espaciotiempo que esté vacı́a, sin materia o energı́a de ningún tipo, la ecuación (12.6) queda Ric−(1/2)Sg = 0.
Al tomar la traza en esta igualdad se tiene (en dimensión 4): S − 21 4S =
−S = 0. En conclusión, la ecuación de Einstein en el vacı́o (con Λ = 0)
queda
Ric ≡ 0.
(12.7)
Observaciones:
(1) Vı́a la ecuación de Einstein, el tensor energı́a-impulso proporciona esencialmente el tensor de Ricci. Ahora bien, el tensor de curvatura R tiene “más componentes” que el de Ricci. En efecto, en dimensión
4 o superior, a partir de R se puede construir el llamado tensor de Weyl
C el cual, conjuntamente con el Ricci, determina R. El tensor de Weyl
es un “invariante conforme”, esto es, depende sólo de la causalidad; ası́,
dos métricas conformes tendrán el mismo tensor de Weyl (véase el final
de la Subsección 12.2.2). Se tiene entonces que el tensor de Ricci (determinado por las ecuaciones de Einstein) junto con el tensor de Weyl
(determinado por la causalidad) sı́ determinan el tensor de curvatura
3
Ası́: (i) tomando un lı́mite apropiado se reobtiene la ecuación de Poisson de la
Mecánica Newtoniana; (ii) a partir de la ecuación deP
Einstein es posible deducir
n
leyes de conservación (div T = 0, siendo div T (v) = i,j=1 g ij (∇ei T )(v, ej )), sin
necesidad de imposiciones adicionales, como en el caso de la Mecánica Newtoniana;
(iii) la ecuación (12.6) se corresponde con propiedades extremales para variaciones
apropiadas de S.
273
R que, como vimos en la Subsección 11.6.2, caracteriza esencialmente
la métrica.
(2) Ya establecimos que T (e0 , e0 ) es la densidad de energı́a. Parece
razonable suponer que ésta sea positiva, esto es, T (e0 , e0 ) ≥ 0 para
todo e0 temporal unitario. La condición equivalente T (v, v) ≥ 0 para
todo v temporal (y, por continuidad, también para todo v luminoso)
recibe el nombre de condición débil de energı́a. En particular, si u es
luminoso entonces de (12.6) se tiene
0 ≤ T (u, u) = Ric(u, u).
(3) Existen otros tipos de condiciones esperables sobre el comportamiento de T o Ric. Por ejemplo, la condición, muy usada:
Ric(v, v) ≥ 0 para todo v temporal,
(12.8)
recibe el nombre de condición de convergencia temporal, y se interpreta
diciendo que la gravedad, en promedio, atrae. Tal interpretación se
debe a la relación estudiada en la Subsección 11.6.3 entre curvatura y
geodésicas por medio de la ecuación de Jacobi.
12.2.5.
Modelos cosmológicos de Robertson-Walker
Sea (QC , gC ) la variedad riemanniana modelo de curvatura constante C y dimensión 3, esto es, un plano (C = 0), esfera (C > 0) o
espacio hiperbólico (C < 0), Subsección 11.6.2.
Sea I ⊆ R un intervalo real y f : I → R una función diferenciable
positiva. Se define el espaciotiempo de Robertson-Walker asociado como
la variedad producto I × QC dotada de la métrica
g = −dt2 + f 2 (t)gC ,
donde t (función tiempo universal) es la proyección de I × QC sobre I.
Usando la identificación natural T(t0 ,x0 ) (I × QC ) ≡ Tt0 I × Tx0 QC ,
cada vector v ∈ T(t0 ,x0 ) (I × QC ) puede escribirse como v = (vt0 , vx0 )
con vt0 ∈ Tt0 I y vx0 ∈ Tx0 QC . Se tiene ası́:
g(v, w) = −vt0 wt0 + f 2 (t0 )gC (vx0 , wx0 ).
274
Los espaciotiempos de Robertson-Walker son los modelos más simples
que describen a gran escala el Universo fı́sico y, pese a su sencillez, hay
buenos argumentos fı́sicos de plausibilidad a su favor4 .
Para las métricas tipo g = −dt2 + f 2 (t)gC que aparecen en este
tipo de modelos no resulta difı́cil computar el tensor de Ricci y la
curvatura escalar, ası́ como escribir la ecuación de Einstein. De hecho, dependiendo de la función f y resolviendo las correspondientes
ecuaciones de Einstein, aparecerán distintas posibilidades para f (universos de Friedmann, suponiendo que T es el correspondiente a un
“fluido perfecto”).
La condición de convergencia temporal (12.8) tiene importantes
consecuencias en los espaciotiempos de Robertson-Walker. En efecto,
si esta condición se verifica entonces
Ric(∂t , ∂t ) ≥ 0.
(12.9)
Ahora bien, no es difı́cil comprobar que esta condición equivale a que
f sea cóncava, esto es:
f 00 ≤ 0.
(12.10)
Ejercicio. Compruébese que (12.9) implica (12.10).
De (12.10) se sigue necesariamente que si f no es constante entonces
el intervalo de definición I de f no puede ser todo R, ya que f debe
ser positiva. Es más, si f 0 (t0 ) > 0 para cierto t0 ∈ I entonces I =]a, b[
está acotado por la izquierda, esto es, −∞ < a < b ≤ ∞. Esta conclusión es relevante, porque, efectivamente, se cree5 que actualmente
el Universo se está expandiendo, (esto es, f 0 (t0 ) > 0 para el tiempo
universal actual t0 ), lo que sugiere que el tiempo universal tuvo un
principio: la Gran Explosión o Big Bang (Figura 34).
Ideas de este tipo se hallan presentes en los célebres (y mucho más
generales) teoremas de singularidades de Hawking y Penrose.
4
Entre ellos: (1) cada hipersuperficie a t ≡ t0 constante, dotada de la métrica
espacial g = f 2 (t0 )gC , es isótropa y homogénea, lo que coincide a gran escala con
la estructura observada del universo; (2) es un dato experimental aceptado que, a
gran escala, el universo se va enfriando, lo que permite identificar la función tiempo
universal t con, esencialmente, la inversa de la temperatura media del universo.
5
Debido al corrimiento al rojo del espectro de las estrellas, por el efecto Doppler.
275
Figura 34
Posibilidades para f (> 0) si f 00 ≤ 0 y f no es constante.
Si f 0 (t0 ) > 0 para algún t0 ∈ I, necesariamente el extremo inicial a
debe ser finito.
12.2.6.
Espaciotiempo de Schwarzschild
La caracterı́stica más sorprendente del espaciotiempo de Schwarzschild
es que conduce a la aparición de una singularidad fı́sica que, a diferencia de las que eventualmente pueden tener los espaciotiempos de
Robertson-Walker, estarı́a presente en el Universo actual, debido a la
evolución natural de muchas estrellas. Muy grosso modo, podemos decir que aparece una singularidad fı́sica cuando se dan simultáneamente
los siguientes elementos:
(1) Existen geodésicas temporales incompletas. Por ejemplo, en el
caso de un espaciotiempo Robertson-Walker las geodésicas temporales s 7→ (s, x0 ) son incompletas (hacia el pasado) cuando
I =]a, b[, a > −∞.
(2) El espaciotiempo es inextensible, esto es, no se puede considerar
como un abierto propio de un espaciotiempo mayor.
(3) Existe algún “invariante” o función (escalar) asociado al tensor
de curvatura que diverja a lo largo de alguna geodésica
temporal
Pn
ijkl
Rijkl ,
incompleta γ (un ejemplo de invariante es
i,j,k,l=1 R
6
pero no una coordenada concreta Rijkl ).
6
No obstante, la divergencia de alguna coordenada Rijkl para una “tetrada
276
El espaciotiempo de Schwarzschild modela el campo gravitatorio generado fuera de una estrella con simetrı́a esférica que no rota. Concretamente, se trata de la variedad Q = R×]2m, ∞[×S 2 dotada de la
métrica7
µ
¶
2m
1
2
2
2
2
2
g =− 1−
dt2 +
2m dr + r (dθ + sen θdφ ).
r
1− r
La constante m > 0 admite la interpretación de masa de la estrella.
En r = 2m (radio de Schwarzschild) la métrica es singular. Sin
embargo, no se trata de una singularidad fı́sica (sino de un horizonte
de sucesos). De hecho, si consideramos la región 0 < r < 2m dotada formalmente de la misma métrica, que vuelve a ser una variedad
de Lorentz (“agujero negro de Schwarzschild”), es posible “pegar por
el borde” ésta con la región r > 2m de manera que desaparezca la
singularidad en r = 2m. De manera más precisa, existe un espaciotiempo mayor (K, g) (espaciotiempo de Kruskal) tal que dos abiertos
suyos K + , K − son isométricos, respectivamente, a las regiones r > 2m
y 0 < r < 2m, estando K + y K − separados por una hipersuperficie en
la que g está bien definida.
Sin embargo, el agujero negro de Schwarzschild (y, por tanto, el
espaciotiempo de Kruskal) presenta una singularidad, que sı́ es fı́sica
(en el sentido del principio de esta subsección), en r = 0. El estudio de
la evolución estelar muestra que, para estrellas con una masa superior a
cierta cantidad crı́tica, el espaciotiempo de Kruskal, incluido el agujero
negro de Schwarzschild, puede tomarse como un modelo apropiado de
su campo gravitatorio (véase, p. ej., [HE]).
paralela” (base de campos sobre γ obtenida por transporte paralelo) sı́ se considera
“invariante”, al ser esta propiedad independiente de la tetrada escogida.
7
Las principales condiciones de plausibilidad de este modelo son las siguientes:
(1) el Ricci de g es nulo, lo que permite modelar el campo fuera de la estrella,
esto es, el vacı́o que rodea la estrella, véase (12.7); (2) la coordenada t se puede
interpretar como una coordenada temporal, siendo los coeficientes de la métrica
independientes de ella, lo que da idea de una situación estacionaria; (3) cada hipersuperficie a t constante es ortogonal a ∂t (su espacio en reposo), y tiene simetrı́a
esférica; (4) asintóticamente, cuando r → ∞, la métrica tiende a la del espacio4
tiempo de Minkowski L . Esencialmente, estas condiciones fijan al espaciotiempo
de Schwarzschild unı́vocamente.
Bibliografı́a
[AM] Abraham R., Marsden J.E., Foundations of Mechanics, (2a
Edic.) Advanced Book Program, Perseus Books, Cambridge, Massachusets, 1978.
[AMR] Abraham R., Marsden J.E., Ratiu T., Manifolds, tensors, analysis and applications, Addison-Wesley Pub. Co., 1983.
[Ar] Armstrong M.A., Topologı́a Básica, Reverté, Barcelona, 1987.
[Bu] Burke W.L., Applied Differential Geometry, Cambridge Univ.
Press, 1985.
[BEE] Beem J. K., Ehrlich P. E., Easley K. L., Global
Lorentzian Geometry, Monographs Textbooks Pure Appl. Math.
202 (Dekker Inc., New York, 1996).
[dC1] do Carmo M., Riemannian Geometry, Birkhäuser Boston,
1992.
[dC2] do Carmo M., Geometrı́a Diferencial de curvas y superficies,
Alianza Universidad Textos, 1994.
[CM] Curtis W.D., Miller F.R., Differential Manifolds and Theoretical Physics, Academic Press, 1985.
[GM] Gamboa J. M., Ruiz J. M., Introducción al estudio de las
Variedades Diferenciables, Sanz y Torres, Madrid, 1988.
[HE] Hawking S. W., Ellis G. F. R., The Large Scale Structure
of Space-time, (Cambridge: Cambridge University Press) 1973.
277
278
BIBLIOGRAFÍA
[O’N] O’Neill B., Semi-Riemannian Geometry with applications to
Relativity, Series in Pure and Applied Math. 103 Academic Press,
N.Y. (1983).
[Sa] Sakai T., Riemannian Geometry, Editorial Board, 1996.
[Sp1] Spivak M., A Comprehensive Introduction to Differential Geometry, Volume II, Publish or Perish, INC., Boston, 1970.
[Sp2] Spivak M., Cálculo en variedades, Reverté, 1970.

Introducción a la GEOMETRÍA DIFERENCIAL DE

Transcripción

Documentos relacionados

C´ALCULO Continuidad, derivabilidad y diferenciabilidad en R2. 1

Cálculo diferencial de varias variables