Introducción a la GEOMETRÍA DIFERENCIAL DE

Transcripción

Introducción a la GEOMETRÍA DIFERENCIAL DE
Introducción a la
GEOMETRÍA DIFERENCIAL
DE VARIEDADES
Miguel Sánchez Caja
José Luis Flores Dorado
Depto. Geometrı́a y Topologı́a,
Universidad de Granada, 2003
Déposito Legal: GR-1558/04
Índice general
1. Topologı́a básica
1.1. Generalidades . . . . . . . . .
1.2. Construcción de topologı́as . .
1.3. Axiomas de numerabilidad . .
1.4. Lı́mites. Espacios Hausdorff .
1.5. Continuidad . . . . . . . . . .
1.6. Espacios topológicos métricos
1.7. Conexión y arcoconexión . . .
1.8. Compacidad . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2. El concepto de variedad diferenciable
2.1. Concepto de variedad topológica . . .
2.2. Variedades diferenciables . . . . . . .
2.3. Aplicaciones diferenciables . . . . . .
2.4. Hipersuperficies regulares de Rn . . .
2.5. Subvariedades regulares de Rn . . . .
2.6. Apéndice 1: atlas en §2 . . . . . . . .
2.7. Apéndice 2: coordenadas en R3 . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
8
9
10
12
16
18
.
.
.
.
.
.
.
23
23
26
31
34
38
41
44
3. Espacio tangente
3.1. Concepto de vector tangente . . . . . . . . . . . . . . .
3.1.1. Vector tangente como clase de equivalencia de
curvas . . . . . . . . . . . . . . . . . . . . . . .
3.1.2. Vector tangente por coordenadas . . . . . . . .
3.1.3. Vector tangente como derivación . . . . . . . . .
3.2. Estructura del espacio tangente . . . . . . . . . . . . .
3.2.1. Vectores tangentes inducidos por los entornos coordenados . . . . . . . . . . . . . . . . . . . . .
i
49
49
50
52
53
55
56
ii
ÍNDICE GENERAL
3.2.2. Estructura de espacio vectorial de
3.3. Variedad tangente . . . . . . . . . . . . .
3.4. Apéndice: Mecánica Lagrangiana . . . .
3.4.1. Lagrangianas . . . . . . . . . . .
3.4.2. Curvas crı́ticas de la acción . . .
4. Aplicaciones diferenciables
4.1. Diferencial de una función . . . .
4.1.1. Concepto . . . . . . . . .
4.1.2. Expresión en coordenadas
4.1.3. Cambio de coordenadas .
4.2. El espacio cotangente . . . . . . .
4.3. Diferencial de una aplicación . . .
4.4. Teoremas fundamentales . . . . .
4.5. Apéndice: el espacio dual . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Campos vectoriales
5.1. Concepto de campo vectorial . . . . . . .
5.2. Estructura de los campos vectoriales . .
5.3. Paralelizabilidad . . . . . . . . . . . . .
5.4. Curvas integrales. Flujos . . . . . . . . .
5.5. Grupo uniparamétrico de difeomorfismos
5.6. Corchete de Lie . . . . . . . . . . . . . .
5.7. Apéndice: Grupos y Álgebras de Lie . . .
Tp Q
. . .
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
60
62
63
64
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
69
69
69
70
71
73
76
79
.
.
.
.
.
.
.
85
85
86
87
89
91
95
99
.
.
.
.
.
.
.
.
.
.
.
.
105
105
105
107
108
111
111
112
112
116
117
118
118
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. Tensores y formas diferenciales
6.1. Tensores en un espacio vectorial . . . . . . . . . . . .
6.1.1. Concepto . . . . . . . . . . . . . . . . . . . .
6.1.2. Producto tensorial . . . . . . . . . . . . . . .
6.1.3. Tensores tipo (r, s) con r + s = 2 . . . . . . .
6.1.4. Tensores tipo (r, s) . . . . . . . . . . . . . . .
6.1.5. Tensores simétricos y antisimétricos tipo (2, 0)
6.2. Tensores sobre variedades . . . . . . . . . . . . . . .
6.2.1. Tensores en un espacio vectorial tangente . . .
6.2.2. Campos tensoriales . . . . . . . . . . . . . . .
6.3. Formas diferenciales . . . . . . . . . . . . . . . . . .
6.4. La diferencial exterior . . . . . . . . . . . . . . . . .
6.4.1. Formas exactas . . . . . . . . . . . . . . . . .
ÍNDICE GENERAL
iii
6.4.2. Diferencial de formas. Lema de Poincaré
6.5. Circulación de una forma diferencial . . . . . . .
6.6. Apéndice 1: conexión simple . . . . . . . . . . .
6.7. Apéndice 2: Termodinámica . . . . . . . . . . .
7. Campos tensoriales métricos
7.1. Métricas riemannianas y lorentzianas . . . .
7.2. Gradiente de una función . . . . . . . . . . .
7.3. Campos conservativos e irrotacionales . . . .
7.4. Circulación de un campo vectorial . . . . . .
7.5. Isometrı́as . . . . . . . . . . . . . . . . . . .
7.6. Distancia en el caso riemanniano . . . . . .
7.7. Apéndice 1: bemol y sostenido . . . . . . . .
7.8. Apéndice 2: M. Lagrangiana y Hamiltoniana
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
122
125
127
.
.
.
.
.
.
.
.
131
131
135
137
138
139
141
142
144
8. Integración en Variedades
155
8.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . 156
8.2. Integración de n−formas diferenciales . . . . . . . . . . 159
8.2.1. El problema de la integración sobre una variedad 159
8.2.2. Integración de n-formas en entornos coordenados 161
8.2.3. Integración general de n−formas . . . . . . . . 163
8.2.4. Particiones de la unidad e integración . . . . . . 165
8.3. Integración de funciones . . . . . . . . . . . . . . . . . 167
8.3.1. Elementos de volumen e integración de funciones 167
8.3.2. Integración en variedades semi-riemannianas . . 167
8.4. Teorı́a de la medida . . . . . . . . . . . . . . . . . . . . 169
8.4.1. Nota previa sobre la integral de Riemann . . . . 169
8.4.2. Medida de Lebesgue . . . . . . . . . . . . . . . 171
8.4.3. Integral de Lebesgue en Rn . . . . . . . . . . . 172
8.4.4. Conjuntos de medida nula y espacio de medida
en una variedad . . . . . . . . . . . . . . . . . . 175
8.4.5. Integración en una variedad . . . . . . . . . . . 176
8.5. Apéndice 1: álgebra exterior sobre V (R) . . . . . . . . 178
8.6. Apéndice 2: Elementos de volumen en V (R) . . . . . . 183
8.6.1. Elemento de volumen y orientación . . . . . . . 183
8.6.2. Determinante de un endomorfismo . . . . . . . 184
8.6.3. El elemento de volumen métrico orientado . . . 185
8.7. Apéndice 3: r−formas y orientación . . . . . . . . . . . 186
iv
ÍNDICE GENERAL
8.7.1. El álgebra de r−formas diferenciales . . . . . . 186
8.7.2. Orientación de una variedad . . . . . . . . . . . 187
8.7.3. El recubridor de dos hojas orientable . . . . . . 189
9. Teorema de Stokes
9.1. Derivaciones y antiderivaciones . . . . . . . .
9.1.1. Derivación tensorial . . . . . . . . . . .
9.1.2. Antiderivación tensorial . . . . . . . .
9.1.3. Teorema de Cartan . . . . . . . . . . .
9.2. Variedades con borde . . . . . . . . . . . . . .
9.2.1. Diferenciabilidad en abiertos de Rn+ . .
9.2.2. Concepto de variedad con borde . . . .
9.2.3. Orientación en el borde . . . . . . . . .
9.3. Teorema de Stokes . . . . . . . . . . . . . . .
9.4. Primeras aplicaciones . . . . . . . . . . . . . .
9.4.1. Fórmula de Green-Riemann en el plano
9.4.2. Teorema integral de Cauchy . . . . . .
9.4.3. Teorema clásico de Stokes . . . . . . .
9.5. Teorema de la Divergencia . . . . . . . . . . .
9.6. Aplicaciones del T. de la Divergencia . . . . .
9.7. Fórmulas de Green . . . . . . . . . . . . . . .
9.8. Apéndice: producto vectorial . . . . . . . . . .
9.8.1. Isomorfismos especiales en (V 3 (R), µ0 ).
9.8.2. El rotacional . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
191
191
191
194
198
199
200
201
204
206
209
209
210
211
214
216
221
223
223
224
.
.
.
.
.
.
.
225
225
229
231
234
236
237
238
11.Curvatura
11.1. Concepto de curvatura . . . . . . . . . . . . . . . . . .
11.2. Tensor de curvatura 4-covariante . . . . . . . . . . . .
11.3. Curvatura seccional . . . . . . . . . . . . . . . . . . . .
241
241
242
243
10.Conexiones afines
10.1. Concepto de conexión afı́n
10.2. Sı́mbolos de Christoffel . .
10.3. Derivada covariante . . . .
10.4. Transporte paralelo . . . .
10.5. Geodésicas . . . . . . . . .
10.6. Conexiones simétricas . . .
10.7. Aplicación exponencial . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ÍNDICE GENERAL
11.4. Tensor de Ricci . . . . . . . . . . . . .
11.5. Curvatura escalar . . . . . . . . . . . .
11.6. Significado de la curvatura . . . . . . .
11.6.1. Orı́genes geométricos . . . . . .
11.6.2. Cómo la curvatura determina la
11.6.3. Ecuación de Jacobi . . . . . . .
11.6.4. Otras propiedades . . . . . . . .
v
. . . . .
. . . . .
. . . . .
. . . . .
métrica
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12.Algunas notas sobre Relatividad
12.1. Relatividad Especial . . . . . . . . . . . . . . . . .
12.1.1. Espacios vectoriales lorentzianos . . . . . . .
12.1.2. El grupo de Lorentz . . . . . . . . . . . . .
12.1.3. L4 como modelo de espaciotiempo . . . . . .
12.1.4. La constancia de la velocidad de la luz . . .
12.1.5. Algunas consecuencias del modelo . . . . . .
12.2. Relatividad General . . . . . . . . . . . . . . . . . .
12.2.1. El modelo matemático . . . . . . . . . . . .
12.2.2. Causalidad . . . . . . . . . . . . . . . . . .
12.2.3. Maximización por geodésicas causales . . . .
12.2.4. Ecuación de Einstein . . . . . . . . . . . . .
12.2.5. Modelos cosmológicos de Robertson-Walker
12.2.6. Espaciotiempo de Schwarzschild . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
244
245
246
246
250
252
253
.
.
.
.
.
.
.
.
.
.
.
.
.
255
255
255
257
259
261
263
265
265
267
269
270
273
275
vi
ÍNDICE GENERAL
Nota introductoria
El presente volumen recoge los apuntes del curso “Fı́sica Matemática III:
Ga Diferencial y Variedades” impartido por el primero de los autores en
la licenciatura de Fı́sica desde el año 00/01. Su objetivo es ofrecer una
introducción rápida a la Geometrı́a Diferencial que provea al estudiante de una base geométrica para la Mecánica Racional, la Relatividad
General y otras ramas de la Fı́sica.
Con este objetivo, hacemos especial hincapié en la reflexión sobre
los conceptos y estructuras geométricas, ilustrándolos con ejemplos comunes en Fı́sica. Las demostraciones también están orientadas a este
fin, por lo que se seleccionan aquéllas que permiten profundizar en los
conceptos o resolver problemas concretos. No obstante, aunque se excluyan demostraciones, a menudo se dan esquemas o ideas intuitivas
de ellas, que aporten más seguridad a los conocimientos adquiridos.
Estos apuntes también se han revelado útiles para alumnos de Matemáticas como los de doctorado, los cuales, una vez concluida la licenciatura, han necesitado reordenar sus conocimientos geométricos. No
obstante, conviene que los lectores de formación matemática tengan
presente las siguientes dos advertencias:
(1) El objetivo de las frecuentes “Notas” o “Apéndices” sobre cuestiones de motivación fı́sica no es enseñar éstas a quien se las tope por
primera vez: si éste es el caso, resulta preferible saltárselas. Su modesto
objetivo es permitir, a quien ya las ha estudiado alguna vez (aunque,
probablemente, con un lenguaje muy diferente) ubicarlas en el contexto
geométrico apropiado.
(2) Aunque los conceptos se suelen definir del modo intrı́nseco “libre
de coordenadas” usual en la Matemática moderna, se hace especial
hincapié en las expresiones en coordenadas (incluso desde el punto
de vista de los fundamentos). Ello suele ser especialmente útil para
vii
viii
ÍNDICE GENERAL
los fı́sicos, pero no creemos que deba obviarlo un matemático. Por el
contrario, en nuestra opinión, éste debe adquirir suficiente soltura en
cálculos concretos usando coordenadas.
Partimos de un conocimiento básico de Cálculo Diferencial e Integral
en varias variables, ası́ como de Álgebra Lineal. No obstante, algunos
temas de ésta, que no suelen conocerse con mucha profundidad (espacio
dual, tensores) se repasan en secciones especı́ficas. No presuponemos,
sin embargo, ningún conocimiento previo de topologı́a, por lo que,
brevemente, el Tema 1 se dedica a ella.
Aparte de este primer tema sobre topologı́a, y del último, que proporciona una introducción geométrica a la Teorı́a de la Relatividad, el
volumen puede dividirse en cuatro partes:
Parte I. Temas 2–4. Se introducen los “fundamentos” del concepto de
variedad, mostrando cómo el Cálculo Diferencial puede extenderse a
espacios mucho más generales que los abiertos de Rn . Merece comentarse:
(a) Aunque el concepto de variedad diferenciable pueda introducirse
de manera bastante más directa (“conjunto dotado de un atlas diferenciable maximal”) preferimos detenernos primero en el de variedad
topológica. La topologı́a que subyace a toda variedad diferenciable origina muchas de sus propiedades, y los preliminares del Tema 1 permiten
entenderla con rigor.
(b) Tampoco presuponemos un conocimiento previo de superficies
de R3 , por lo que éstas y, en general, las subvariedades de Rn , aparecerán a menudo como ejemplos de variedades. Sin embargo, aunque se
estudien en particular sus propiedades, nuestro punto de vista es el de
la geometrı́a intrı́nseca, al resultar ésta esencial en los fundamentos de
la Fı́sica Teórica. La geometrı́a extrı́nseca de curvas y superficies, mucho más intuitiva (y de utilidad práctica en problemas más cotidianos)
no la desarrollamos por razones de espacio. No obstante, hay excelentes
manuales sobre ella, como el libro de do Carmo [dC2]. Recomendamos
al alumno que nunca la haya estudiado, consultar la bibliografı́a para
formarse una mejor idea de conjunto, y para que su aproximación a la
Geometrı́a Diferencial resulte más gradual.
(c) Los vectores tangentes y aplicaciones diferenciables se introducen de diversas maneras, progresivamente más abstractas, ası́: vectores como clases de equivalencia de curvas / vectores por coordenadas
ÍNDICE GENERAL
ix
/ derivaciones. A pesar de las redundancias y poca economı́a lógica que
esto supone, creemos que ası́ se hacen más asimilables esos conceptos.
Parte II. Temas 5–7. Se estudian objetos geométricos elementales sobre
una variedad diferenciable, hasta un primer contacto con la geometrı́a
riemanniana. Aparte del tratamiento algebraico de campos tensoriales
sobre la variedad, se introducen: (i) campos vectoriales (curvas integrales, flujos), (ii) formas diferenciales (circulación, formas cerradas y
exactas) y (iii) métricas riemannianas o, con más generalidad, semiriemannianas. Ponemos especial interés en mostrar cómo, fijada una
tal métrica, los conceptos asociados a formas diferenciales pueden aplicarse a campos vectoriales (y viceversa). La utilidad de las métricas
riemannianas, y su fácil asimilación intuitiva, hacen que anticipemos
algunos conceptos, como el de distancia asociada, que se estudian con
más detalle posteriormente. Ası́, al terminar esta segunda parte, el lector habrá adquirido unas nociones mı́nimas de geometrı́a riemanniana.
Parte III. Temas 8–9. Se estudia integración en variedades, tanto desde
el punto de vista de la integración de n-formas diferenciales en variedades orientadas, como del de la integración de funciones en un espacio
de medida, definido éste de manera natural a partir de una métrica
semi-riemanniana. El motivo de desarrollar ambos enfoques se debe a
que el alumno, probablemente, se tropezará antes o después con los
dos, aunque en las referencias al uso suelan escoger sólo uno. Se pretende, pues, que se adquiera una visión de conjunto sobre integración.
Los conceptos relacionados de álgebra exterior de formas diferenciales y
orientación (para el primer enfoque) o de integración de Lebesgue (para
el segundo) se explican sucintamente. En el Tema 9, dedicado al Teorema de Stokes, también desarrollamos los conceptos de derivaciones y
antiderivaciones tensoriales. Muchas de las consecuencias del Teorema
de Stokes tienen utilidad práctica, tanto en partes de la Fı́sica (electromagnetismo, Teorı́as de Campos...) como más puramente matemáticas
(cálculo de áreas, valores propios del laplaciano...), y nos centramos en
las más clásicas.
La Parte III resulta independiente de la Parte IV posterior, con lo
que el lector interesado en ésta puede leerla directamente después de
la I y II, sin pérdida de continuidad.
Parte IV. Temas 10–11. Se estudia la conexión de Levi-Civita asociada
a una métrica (y, en general, conexiones afines), ası́ como sus elemen-
x
ÍNDICE GENERAL
tos geométricos asociados: derivada covariante, geodésicas, curvatura...
Estos conceptos matemáticos son más sutiles que el de métrica riemanniana, y su desarrollo histórico fue largo y complejo. De ahı́ que
hayamos preferido sacrificar (parcialmente) la intuición, introduciendo
los conceptos de una manera “lógicamente económica”. No obstante,
se intenta justificar la naturalidad de las definiciones, aunque sea a
posteriori. Ası́, p. ej., el Tema 11 concluye con un repaso puramente
intuitivo del concepto de curvatura en Geometrı́a, con el objetivo de
hacer más asimilable la muy abstracta definición de (tensor) curvatura
de una variedad riemanniana.
Concluimos con un tema introductorio a la Relatividad General (y,
por completitud, también a la Especial). Se pretende ilustrar ası́ la
aplicabilidad de la geometrı́a aprendida a esta parte fundamental de
la Fı́sica, que la genialidad de Einstein pudo desarrollar gracias a la
Geometrı́a Diferencial preexistente.
No queremos terminar sin expresar nuestra gratitud a nuestros alumnos
quienes, con agudas preguntas y disparatados comentarios, han ayudado en buena medida a enfocar estos apuntes. En particular, agradecemos a Jorge de Blas Mateo que nos prestara sus apuntes correspondientes al primer año en que impartimos la asignatura.
Los autores somos conscientes de la no escasa dificultad que, probablemente, hallarán los alumnos a quienes en primer lugar se dirige
el presente volumen. Pero les animamos a perseverar: si, como decı́a
Galileo, el libro de la Naturaleza está escrito “in lingua matematica”
pocas tareas resultarán tan gratificantes como dominar esta lengua.
Capı́tulo 1
Topologı́a básica
1.1.
Generalidades
Intuitivamente la Topologı́a es la rama de las matemáticas que estudia las propiedades de los objetos que se conservan cuando estos se
deforman sin “cortar” ni “pegar” (con la excepción de que es posible
“cortar” si luego se “pega” por el mismo sitio). Por ejemplo, la superficie de una bola es topológicamente equivalente a la de una pelota de
rugby o la de una barra, aunque no lo es a la de un toro, puesto que este
último tiene un agujero. Este último es topológicamente equivalente a
un toro “anudado” como el de la Figura 1. En el presente capı́tulo estudiaremos algunos preliminares topológicos, que pueden encontrarse
en cualquier libro elemental de Topologı́a (p. ej., véase [AMR, Chapter
1] o [Ar]).
1
2
CAPÍTULO 1. TOPOLOGÍA BÁSICA
Figura 1
Definiciones 1.1.1 Dado un conjunto X diremos que una colección
de subconjuntos τ de X es una topologı́a si verifica:
(i) ∅, X ∈ τ .
(ii) Si U, V ∈ τ entonces U ∩ V ∈ τ (o, equivalentemente, la intersección finita de elementos de τ pertenece a τ ).
(iii) La unión arbitraria de elementos de τ pertenece a τ .
Al par (X, τ ) lo llamaremos espacio topológico. A cada elemento de la
topologı́a τ lo llamaremos abierto.
Ejemplos:
(1) Dado un conjunto X definimos la topologı́a trivial de X como
τ = {X, ∅}.
(2) Dado un conjunto X definimos la topologı́a discreta de X como
τ = P(X) (conjunto de las partes de X, esto es, colección de
todos los subconjuntos de X).
1.1. GENERALIDADES
3
(3) Dado X = R definimos la topologı́a usual τ de R como la colección de todos los conjuntos que son intervalos abiertos o uniones
arbitrarias de ellos.
(4) Dado X = R2 definimos la topologı́a usual de R2 como la colección de todos los rectángulos sin borde ]a, b[×]a0 , b0 [ o uniones
arbitrarias de ellos. Ello es claramente generalizable a Rn , n ∈ N,
cuyos abiertos para la topologı́a usual se definen como uniones
arbitrarias de n−rectángulos, cada uno de éstos definido como el
producto cartesiano de n intervalos abiertos. Salvo especificación
contraria, Rn se considerará dotado siempre de la topologı́a usual.
Como ejemplo veamos que (3) es una topologı́a. Obviamente, se verifican los axiomas (i) (∅ =]a, a[, R =] − ∞, ∞[) y (iii). Por tanto, sólo
resta comprobar (ii). Para ello es suficiente demostrar que si U, V son
abiertos y x ∈ U ∩ V entonces existe un intervalo abierto Ix ⊆ U ∩ V
tal que x ∈ Ix (pues en este caso U ∩ V = ∪x∈U ∩V Ix ∈ τ ). Como x ∈ U
(resp. x ∈ V ), que es abierto, existe ]a1 , b1 [⊆ U (resp. ]a2 , b2 [⊆ V ) tal
que x ∈]a1 , b1 [ (resp. x ∈]a2 , b2 [). Por tanto, basta tomar Ix =]a, b[ con
a = Max{a1 , a2 }, b = Min{b1 , b2 }.
Definición 1.1.2 Sea (X, τ ) un espacio topológico, decimos que A ⊆
X es cerrado si su complemento en X (es decir, X − A = {x ∈ X :
x 6∈ A}) es abierto.
Ejemplos:
(1) ∅ y X son cerrados.
(2) En R con la topologı́a usual el subconjunto [0, 1] es cerrado ya
que R − [0, 1] =] − ∞, 0[∩]1, ∞[ es abierto. Sin embargo, los subconjuntos [0, 1[ y ]0, 1[∪[2, 7] no son cerrados ni abiertos.
(3) En un conjunto arbitrario X con la topologı́a trivial los únicos
subconjuntos cerrados o abiertos son ∅ y X.
(4) En un conjunto arbitrario X con la topologı́a discreta todo subconjunto es cerrado y abierto.
(5) En R3 se ha definido la topologı́a usual como la colección de todos
los subconjuntos del tipo ]a1 , b1 [×]a2 , b2 [×]a3 , b3 [ (3-rectángulos)
4
CAPÍTULO 1. TOPOLOGÍA BÁSICA
o uniones arbitrarias de ellos. No es difı́cil comprobar que la esfera
unidad S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} ⊂ R3 es un
cerrado.
Las propiedades de los cerrados se deducen inmediatamente de las
definiciones:
(1) ∅ y X son cerrados.
(2) La intersección arbitraria de cerrados es un cerrado.
(3) Si U y V son cerrados entonces U ∪ V también lo es (o, equivalentemente, la unión finita de cerrados es un cerrado).
Definiciones 1.1.3 Sea (X, τ ) un espacio topológico. Un entorno abierto de x ∈ X es un abierto U tal que x ∈ U . Un entorno de x es un
conjunto N ⊆ X que contiene a un entorno abierto de x.
Definiciones 1.1.4 Sean (X, τ ) un espacio topológico, A ⊆ X y x ∈
X. Diremos que:
(1) x es un punto interior de A si existe un entorno de x incluido en
A. Usaremos la notación Å= {x ∈ A : x es punto interior de A}.
(2) x es un punto adherente de A si todo entorno de x interseca a A.
Usaremos la notación A = {x ∈ X : x es punto adherente de A}.
Se dice que A es denso en X is A = X.
(3) x es un punto frontera de A si es adherente de A y de X − A.
Usaremos la notación ∂A = {x ∈ X : x es punto frontera de A}.
(4) x es un punto de acumulación de A si todo entorno de x interseca
a A en puntos distintos de x. Usaremos la notación A0 = {x ∈
X : x es punto de acumulación de A}.
(5) x es un punto aislado de A si existe un entorno N de x tal
que N ∩ A = {x}. Usaremos la notación Ais(A) = {x ∈ A :
x es punto aislado de A}.
Ejercicio. Clasifı́quense los puntos del subconjunto A ⊂ R2 de la
Figura 2 definido como la unión del punto p, la curva γ (con un extremo
incluido) y la región interior de la curva ρ junto con parte de esta curva.
Algunas propiedades inmediatas:
1.2. CONSTRUCCIÓN DE TOPOLOGÍAS
5
Figura 2
(1) Å ⊆ A ⊆ A
(2) ∂A = A ∩ (X − A)
(3) A = A ∪ ∂A =Å∪∂A
(4) Å coincide con la unión de todos los abiertos incluidos en A (Å
es el abierto “más grande” incluido en A).
(5) A coincide con la intersección de todos los cerrados que contienen
a A (A es el “menor cerrado” que contiene a A).
Ejercicio. Clasifı́quense los puntos del conjunto A = [0, 1[∪{7}∪ (] −
3, 0[−] − 2, −1[) ⊂ R.
Ejercicio. Clasifı́quense los puntos de un subconjunto arbitrario A ⊆
X con cardinal mayor que 1 cuando se considera para X: (i) la topologı́a
discreta, (ii) la topologı́a trivial.
1.2.
Algunos modos de construcción de
topologı́as
Existen diferentes modos de definir una topologı́a sobre un conjunto
X que pueden ser útiles dependiendo de la manera en que viene dado
dicho conjunto:
6
CAPÍTULO 1. TOPOLOGÍA BÁSICA
A. Bases topológicas. Dado un espacio topológico (X, τ ) una base
topológica o de entornos suya es un conjunto de abiertos B ⊆ τ tal
que todo abierto (no vacı́o) U ∈ τ se puede expresar como unión de
elementos de B.
Ejemplos:
(1) En R con la topologı́a usual una base topológica es la colección
de todos los intervalos abiertos de R.
(2) En Rn con la topologı́a usual una base topológica es la colección
de todos los n-rectángulos abiertos de Rn .
(3) En Rn con la topologı́a usual una base topológica es la colección
de todas las bolas abiertas Bp (r) = {x ∈ Rn : kx − pk < r}, p ∈
Rn , r > 0.
No es difı́cil comprobar que, dado un conjunto X y una colección arbitraria B de subconjuntos de X tal que X = ∪B∈B B, se verifica: B
es una base topológica para alguna topologı́a τ de X si y sólo si para
cualesquiera B1 , B2 ∈ B la intersección B1 ∩ B2 se puede escribir como
unión de elementos de B. En este caso1 , τ está determinada de manera
única, y sus abiertos se construyen como uniones de elementos de B.
B. Subespacios topológicos. Dado un espacio topológico (X, τ )
y un subconjunto A ⊆ X definimos la topologı́a inducida en A por τ
como la topologı́a de A: τA = {A ∩ U : U ∈ τ }. Ası́ todo subconjunto arbitrario de R3 (por ejemplo, superficies como la esfera S 2 =
{(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}) tiene una topologı́a natural, que
es la inducida por la usual de R3 . Cabe destacar que los abiertos de A
con τA no tienen por qué ser abiertos de X con τ . Ası́, p. ej.: (a) los
abiertos de S 2 no lo son de R3 (salvo el ∅), o (b) un abierto de [0, 1]
(con la topologı́a inducida de R) es ]1/2, 1].
C. Topologı́a producto. Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos, se define la topologı́a producto en X × X 0 como aquella topologı́a
1
En el caso de que no se verificara esta condición, se puede demostrar que los
elementos de B junto con las intersecciones finitas de ellos (y, eventualmente, el
total X), determinan una base topológica; se dice entonces que B es una subbase
topológica. La topologı́a ası́ generada se puede caracterizar como la menos fina (la
que tiene menos abiertos) de entre las que contienen a B o, equivalentemente, como
la intersección de todas las topologı́as que contienen a B
1.2. CONSTRUCCIÓN DE TOPOLOGÍAS
7
que admite por base topológica los productos U × U 0 , donde U, U 0 son
abiertos de τ, τ 0 , respectivamente. Por ejemplo, la topologı́a usual de
R2 coincide con la topologı́a producto de R × R.
D. Topologı́a cociente. Dado un espacio topológico (X, τ ) y una
relación de equivalencia ∼ definida en X, sea X/ ∼ el conjunto cociente, esto es, el conjunto de todas las clases de equivalencia, y π la
proyección canónica, es decir,
π : X → X/ ∼
x 7→ [x],
donde [x] denota la clase de equivalencia de x. Definimos la topologı́a
cociente en X/ ∼ como aquélla que tiene por abiertos los subconjuntos
del tipo U ⊂ X/ ∼ tales que π −1 (U ) es un abierto de τ . En efecto,
es inmediato comprobar que ası́ se define una topologı́a, usando: (i)
π −1 (∅) = ∅, π −1 (X/ ∼) = X, (ii) π −1 (U ∩ V ) = π −1 (U ) ∩ π −1 (V ) y
(iii) π −1 (∪α Uα ) = ∪α π −1 (Uα ).
Ejemplos:
(1) En X = [0, 1] ⊂ R definimos la relación de equivalencia: x ∼ x
para todo x ∈ [0, 1] y 0 ∼ 1, 1 ∼ 0. El espacio topológico cociente
se puede visualizar como2 una circunferencia.
(2) En X = R2 definimos la relación de equivalencia (x, y) ∼ (x0 , y 0 )
si x − x0 ∈ Z y y − y 0 ∈ Z. El espacio topológico cociente R2 / ∼
se puede visualizar como un toro.
(3) En el subespacio topológico [0, 1] × [0, 1] de R2 se considera la
relación de equivalencia que se obtiene a partir de identificar cada
(0, y) con (1, y), ∀y ∈ [0, 1]. El cociente puede visualizarse como
un cilindro (con “borde” y sin “tapas”). Si se considera la relación
de equivalencia que se obtiene a partir de identificar cada (0, y)
con (1, 1−y) el cociente puede visualizarse como la popular cinta
de Moebius (que es una superficie de R3 con una sola cara, un
solo borde, y para la que no existe una elección continua posible
2
De manera rigurosa, la expresión “poder visualizar como” significa “ser homeomorfo a” (siendo el codominio del homeomorfismo un subespacio topológico de
R3 ); véase la Definición 1.5.3.
8
CAPÍTULO 1. TOPOLOGÍA BÁSICA
de un vector normal en cada punto). Si en la cinta de Moebius
además se identifica cada (x, 0) con (x, 1) el cociente (botella de
Klein) no puede visualizarse propiamente como una superficie de
R3 .
1.3.
Axiomas de numerabilidad
Una condición implı́cita en muchas topologı́as es la siguiente:
Definición 1.3.1 Un espacio topológico (X, τ ) verifica el segundo axioma de numerabilidad (ANII) si admite una base topológica numerable,
es decir, finita o con el cardinal de N.
Aún más, esta condición puede relajarse:
Definición 1.3.2 Un espacio topológico (X, τ ) verifica el primer axioma de numerabilidad (ANI) si cada punto x ∈ X admite una base numerable de entornos, esto es, una sucesión de entornos abiertos {Un }n
(que puede elegirse de manera que Un+1 ⊂ Un para todo n) tal que:
para todo entorno N de x existe un n ∈ N tal que Un ⊂ N .
Observaciones:
(1) No es difı́cil comprobar: ANII⇒ANI. De hecho, la sucesión {Un }n
desempeña el papel de “base topológica numerable” alrededor de
x.
(2) R (y, en general, Rn ) con la topologı́a usual es ANII (y, por tanto,
ANI). En efecto, una base numerable de la topologı́a usual de R
es B = {]x−², x+²[: x, ² ∈ Q} (recordemos que Q es numerable).
(3) R con la topologı́a discreta es ANI pero no es ANII. En efecto,
dado x ∈ R tómese, en la definición de ANI, Un ≡ {x} ∀ n ∈ N.
Sin embargo, cualquier base de la topologı́a discreta de R debe
contener a cada uno de los números reales como abierto suyo y,
por tanto, no puede ser numerable (el cardinal de R es mayor
que el de N).
1.4. LÍMITES. ESPACIOS HAUSDORFF
1.4.
9
Lı́mites. Espacios Hausdorff
Definición 1.4.1 Sea (X, τ ) un espacio topológico y {xn }n ⊆ X una
sucesión de elementos de X. Diremos que {xn }n converge a x ∈ X
si para todo entorno N de x existe un n0 ∈ N tal que xn ∈ N para
todo n ≥ n0 . En este caso diremos que x es un lı́mite de {xn }n y
escribiremos {xn }n → x.
Ejemplos:
(1) La sucesión {1/n}n ⊂ R converge a 0 con la topologı́a usual.
(2) Consideremos en un conjunto X la topologı́a trivial. Entonces
cualquier sucesión de X converge a cualquier elemento de X.
Ası́, el lı́mite de una sucesión puede no ser único.
El problema de la posible falta de unicidad de los lı́mites, entre otros,
se evita con el siguiente concepto.
Definición 1.4.2 Se dice que un espacio topológico (X, τ ) es Hausdorff (ó T2 ) si para cualesquiera x, y ∈ X x 6= y, existen entornos
Nx , Ny de x e y, respectivamente, tales que Nx ∩ Ny = ∅.
Proposición 1.4.3 En todo espacio topológico Hausdorff (X, τ ) el lı́mite de una sucesión convergente es único.
Demostración. Supongamos, por reducción al absurdo, que una sucesión {xn }n ⊆ X satisface {xn }n → x, {xn }n → y, siendo x 6= y. Como
X es Hausdorff existen entornos Nx , Ny de x e y respectivamente que
son disjuntos. En consecuencia, existe un n0 (resp. n00 ) tal que xn ∈ Nx
(resp. xn ∈ Ny ) si n ≥ n0 (resp. n ≥ n00 ). Entonces, si n = Max{n0 , n00 }
tenemos que xn ∈ Nx ∩ Ny , lo que contradice que Nx ∩ Ny = ∅. 2
Es inmediato comprobar que todo subespacio topológico de un espacio topológico Hausdorff es también Hausdorff.
Ejemplos:
(1) Rn con la topologı́a usual (y todos sus subconjuntos con la topologı́a inducida) es Hausdorff.
(2) Obviamente, ningún conjunto X con cardinal mayor que uno y
dotado de la topologı́a trivial es Hausdorff. Todo conjunto con la
topologı́a discreta es Hausdorff.
10
CAPÍTULO 1. TOPOLOGÍA BÁSICA
(3) Sea X = R ∪ {00 } donde 00 es un elemento que no pertenece a
R, y consideremos la topologı́a que tiene por base la colección
formada por: (a) los abiertos de R (con la topologı́a usual) y
(b) los subconjuntos que resultan de tomar los abiertos de R
que contienen al 0, y reemplazar 0 por 00 . Esta topologı́a no es
Hausdorff: los puntos 0 y 00 no se pueden “separar” por entornos.
1.5.
Continuidad
Definición 1.5.1 Sean (X, τ ), (X 0 , τ 0 ) dos espacios topológicos y f :
X → X 0 una aplicación entre ellos. Se dice que f es continua en
x0 ∈ X si para todo entorno abierto U 0 de f (x0 ) existe un entorno
abierto U de x0 tal que f (U ) ⊆ U 0 . Diremos que f es continua si lo es
en todos los puntos de X (véase la Figura 3).
Figura 3
Por supuesto, en la definición anterior podemos reemplazar la expresión “entorno abierto” por “entorno” (compruébese). También es fácil
comprobar:
Proposición 1.5.2 Una aplicación entre dos espacios topológicos f :
X → X 0 es continua si y sólo si f −1 (U 0 ) es abierto de (X, τ ) para todo
abierto U 0 de (X 0 , τ 0 ).
1.5. CONTINUIDAD
11
Definición 1.5.3 La aplicación f : X → X 0 se dice que es un homeomorfismo si es biyectiva y tanto f como f −1 son continuas.
Dos espacios topológicos (X, τ ), (X 0 , τ 0 ) son homeomorfos si existe
un homeomorfismo entre ellos (f : X → X 0 o, equivalentemente, g :
X 0 → X).
El concepto de homeomorfismo es uno el modo riguroso de expresar
la idea de cuándo dos espacios topológicos son “equivalentes” y que
tratábamos de apuntar con ideas intuitivas al principio de este capı́tulo, como las de que dos espacios topológicos son “equivalentes” si se
pueden obtener uno de otro deformando sin cortar ni pegar3 . Dos espacios topológicos homeomorfos poseen las mismas propiedades topológicas.
Observaciones: Sean (X, τ ), (X 0 , τ 0 ) y (X 00 , τ 00 ) tres espacios topológicos.
(1) La composición g ◦ f : X → X 00 de dos aplicaciones continuas
f : X → X 0 y g : X 0 → X 00 es también continua.
(2) La restricción f |A⊆X : A → X 0 de una aplicación continua f :
X → X 0 es también continua (consideramos la topologı́a inducida
en A por X). Ası́, por ejemplo, la inclusión i : A ⊆ X → X es
continua ya que coincide con la restricción a A de la aplicación
identidad en X. También son continuas las aplicaciones
ix00 : X → X × X 0
x 7→ (x, x00 )
ix0 : X 0 → X × X 0
x0 7→ (x0 , x0 ).
para cada x00 ∈ X 0 , x0 ∈ X.
(3) En el espacio topológico producto de (X, τ ) y (X 0 , τ 0 ) son continuas las proyecciones:
p : X × X0 → X
(x, x0 ) 7→ x
p0 : X × X 0 → X 0
(x, x0 ) 7→ x0 .
En efecto, la continuidad de p es consecuencia de que si U es un
abierto de (X, τ ) entonces f −1 (U ) = U × X 0 es un abierto de
X × X 0.
3
Otro concepto relevante en este contexto es el de equivalencia homotópica, en
el que no entraremos.
12
CAPÍTULO 1. TOPOLOGÍA BÁSICA
(4) Si (X, τ ) es un espacio topológico entonces la proyección π :
X → X/ ∼ es continua (consideramos la topologı́a cociente para
X/ ∼). En efecto, por la definición de la topologı́a cociente, si
U es un abierto de X/ ∼ entonces π −1 (U ) es un abierto de X.
Más aún, dado otro espacio topológico (X 0 , τ 0 ), una aplicación
f : (X/ ∼) → X 0 será continua si y sólo si lo es la composición
f ◦ π : X → X 0.
Ejercicio. (1) Sean (X, τ ) un espacio topológico ANI, A ⊆ X y
x ∈ X. Pruébese que x ∈ A si y sólo si existe una sucesión {xn }n ⊆ A
que converge a x.
(2) Sea f : X → X 0 una aplicación entre dos espacios topológicos
siendo (X, τ ) ANI, y sea x0 ∈ X. Pruébese que f es continua en x0 si
y sólo si para toda sucesión {xn }n ⊆ X que converge a x0 la sucesión
{f (xn )}n converge a f (x0 ).
(3) Compruébese que la relación “ser homeomorfo a” en la clase de
todos los espacios topológicos es de equivalencia.
1.6.
Espacios topológicos métricos
En el espacio euclı́deo Rn estamos familiarizados
con el uso de la
P
distancia (usual) definida por d0 (x, y) = ( ni=1 (xi −yi )2 )1/2 , siendo x =
(x1 , . . . , xn ) e y = (y1 , . . . , yn ) dos puntos cualesquiera de Rn . Veamos
cómo se puede generalizar este concepto a conjuntos arbitrarios:
Definición 1.6.1 En un conjunto X definimos una distancia o métrica como una aplicación d : X × X → R que verifica:
(i) d(x, y) ≥ 0 para todo x, y ∈ X, con igualdad si y sólo si x = y.
(ii) d(x, y) = d(y, x) para todo x, y ∈ X.
(iii) d(x, z) ≤ d(x, y) + d(y, z) para todo x, y, z ∈ X.
En este caso al par (X, d) se le llama espacio métrico.
Es inmediato comprobar que cada A ⊂ X hereda una distancia por
restricción de d a A × A. Se dice entonces que A (o, más propiamente,
A con la restricción de la distancia) es un subespacio métrico de X.
1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS
13
Ejemplo. Una distancia en R2 muy distinta a la usual es la siguiente
aplicación d0 : R2 × R2 → R (“distancia de la Renfe”):
½
kx − yk
si x, y están en una recta que pasa por (0, 0),
0
d (x, y) =
kxk + kyk en caso contrario.
Definiciones 1.6.2 Sea (X, d) un espacio métrico y x0 ∈ X. Definimos la bola abierta de centro x0 y radio r ≥ 0 como Bx0 (r) = {x ∈
X : d(x, x0 ) < r}. Análogamente, definimos la bola cerrada de centro
x0 y radio r ≥ 0 como B x0 (r) = {x ∈ X : d(x, x0 ) ≤ r}.
Definición 1.6.3 Sea (X, d) un espacio métrico. Llamaremos topologı́a métrica asociada a (o inducida por) d en X a aquélla que admite
por base topológica todas las bolas abiertas (de cualquier centro y de
cualquier radio) para dicha métrica.
Ejercicio. (1) Pruébese que las bolas abiertas constituyen, efectivamente, una base para una topologı́a.
(2) Sea U un abierto de (X, d) para la topologı́a métrica. Pruébese
que para todo x ∈ U existe un ² > 0 tal que Bx (²) ⊂ U .
Es fácil comprobar que la topologı́a inducida por una métrica es siempre ANI y Hausdorff, aunque no necesariamente ANII.
Ejemplo. Sea X un conjunto y consideremos la distancia
½
0 si x = y,
d(x, y) =
1 si x 6= y.
La topologı́a asociada a d es la discreta. Por tanto, si X no es numerable, la topologı́a asociada no resultará ANII.
Un espacio topológico (X, τ ) se dice metrizable si existe alguna distancia d cuya topologı́a métrica sea τ . Estaremos especialmente interesados en tales espacios topológicos, pero destaquemos que, en general, la
distancia d no está fijada de modo único o canónico por τ .
Ejemplo. En R2 (y en cualquier Rn ) la topologı́a métrica asociada a la
distancia usual d0 es la topologı́a usual. Considérese la nueva distancia
sobre R2 , d((x, y), (x0 , y 0 )) = |x − x0 | + |y − y 0 | (¿cómo son sus bolas?).
La topologı́a métrica asociada a d también coincide con la usual. Sin
14
CAPÍTULO 1. TOPOLOGÍA BÁSICA
embargo, la topologı́a métrica asociada a la “distancia de la Renfe” d0
es diferente.
Todo espacio métrico (X, d) se considerará siempre como espacio topológico métrico, esto es, como una terna (X, d, τ ) donde τ es la topologı́a
métrica asociada a d. Para espacios topológicos métricos podemos reescribir los conceptos de lı́mite y continuidad. Las siguientes dos proposiciones se pueden comprobar con facilidad.
Proposición 1.6.4 Sea (X, d) un espacio métrico. Una sucesión {xn }n
⊆ X converge a x0 ∈ X si y sólo si para todo ² > 0 existe un n0 ∈ N
tal que si n ≥ n0 entonces d(xn , x0 ) < ².
Nótese que el lı́mite, si existe, es único pues la topologı́a métrica es
Hausdorff.
Proposición 1.6.5 Sean (X, d), (X 0 , d0 ) dos espacios métricos, f :
X → X 0 una aplicación y x0 ∈ X. Son equivalentes:
(i) f es continua en x0 .
(ii) Si {xn }n ⊆ X converge a x0 entonces {f (xn )}n converge a f (x0 ).
(iii) Para todo ² > 0 existe un δ > 0 tal que si d(x, x0 ) < δ entonces
d0 (f (x), f (x0 )) < ².
Nótese que la equivalencia entre (i) y (ii) se mantiene en todo espacio
topológico ANI (véase el ejercicio de la Sección 1.5).
Definición 1.6.6 De un homeomorfismo f : X → X 0 entre dos espacios métricos (X, d), (X 0 , d0 ) que verifique d(x, y) = d0 (f (x), f (y)),
para todo x, y ∈ X, se dice que es una isometrı́a. En este caso, se dice
que los dos espacios métricos son isométricos.
Espacios métricos isométricos tienen iguales todas sus propiedades relativas a la distancia. La relación “ser isométrico a” en la clase de todos
los espacios métricos es de equivalencia.
Ejercicio. Compruébese que, en la definición de isometrı́a, la inyectividad de f , y la continuidad tanto de f como de su inversa, se pueden
deducir del resto de las condiciones.
Dos conceptos que podemos definir en espacios métricos pero no en
topológicos son los siguientes de sucesión de Cauchy y completitud.
1.6. ESPACIOS TOPOLÓGICOS MÉTRICOS
15
Definición 1.6.7 Sea (X, d) un espacio métrico. Diremos que una
sucesión {xn }n ⊆ X es de Cauchy si para todo ² > 0 existe un n0 ∈ N
tal que si n, m ≥ n0 entonces d(xn , xm ) < ².
Claramente toda sucesión convergente es de Cauchy, pero el recı́proco
no es cierto.
Definición 1.6.8 Se dice que un espacio métrico (X, d) es completo
si toda sucesión de Cauchy es convergente.
Ejemplos:
(1) El espacio euclı́deo Rn con la distancia usual es completo. Con
la topologı́a inducida sus bolas cerradas B x0 (r) son completas (y
las abiertas Bx0 (r) no, para ningún x0 ∈ Rn , r > 0).
(2) El conjunto de los números racionales Q con la distancia inducida
por la usual de R no es completo4 .
Obsérvese que los conceptos de completitud o de sucesión de Cauchy
dependen (a diferencia de los de convergencia o continuidad) no sólo
de la topologı́a sino también de la métrica. Ası́, aunque varias distancias generen la misma topologı́a métrica τ , una misma sucesión {xn }n
puede ser de Cauchy para una de ellas y no para las otras. Pero {xn }n
será convergente si y sólo si lo es para la topologı́a τ ; por tanto, si
{xn }n es convergente también será de Cauchy para todas las métricas
con topologı́a métrica asociada τ .
Ejercicio. Se dice que una aplicación entre dos espacios métricos
f : X → X 0 es uniformemente continua si
∀² > 0, ∃δ > 0 : d(x, y) < δ ⇒ d0 (f (x), f (y)) < ².
Compruébese que si f es uniformemente continua:
(a) es continua, y
(b) la imagen por f de una sucesión de Cauchy en (X, d) es una
sucesión de Cauchy en (X 0 , d0 ).
Muéstrese con un contraejemplo que si f verifica (a) y (b) no tiene por
qué ser uniformemente continua.
De hecho, R puede verse como la “completación” de Q -intuitivamente, como el
espacio que se obtiene añadiendo a Q el mı́nimo de puntos necesarios para obtener
un espacio completo-; el concepto de completación se puede generalizar a cualquier
espacio métrico.
4
16
1.7.
CAPÍTULO 1. TOPOLOGÍA BÁSICA
Conexión y arcoconexión
Definición 1.7.1 Decimos que un espacio topológico (X, τ ) es conexo
si los únicos subconjuntos de X que son a la vez abiertos y cerrados
son el vacı́o y el total.
Observación. Nótese que encontrar un subconjunto A ⊆ X, A 6= ∅, X
que sea abierto y cerrado equivale a encontrar dos subconjuntos de X
abiertos (o cerrados) U, V no vacı́os, disjuntos y tales que X = U ∪ V .
Por ejemplo, en R3 el subconjunto A definido como la unión de una
esfera y un plano que no sean tangentes ni secantes es no conexo.
Definición 1.7.2 Sea (X, τ ) un espacio topológico y A ⊆ X. Diremos
que A es una parte o componente conexa de X si el único subconjunto
conexo de X que contiene a A es el propio A.
Por ejemplo, las componentes conexas de Q son cada uno de sus elementos ya que ningún subconjunto A ⊆ Q con más de un elemento
es conexo. En efecto, sean r1 , r2 ∈ A, r1 < r2 , y sea a ∈ R − Q con
r1 < a < r2 . En ese caso, los subconjuntos no vacı́os U =] − ∞, a[∩A y
V =]a, ∞[∩A son abiertos de A, disjuntos y tales que A = U ∪ V , por
tanto, A no es conexo.
Supondremos conocido de la estructura de R que los subconjuntos
conexos de R coinciden con los intervalos (de cualquier tipo: abiertos,
cerrados, semiabiertos, acotados, no acotados...).
Ejercicio. Sea X un conjunto con cardinal mayor que 1 y considérense las topologı́as trivial y discreta. ¿Con cuáles de ellas es X
conexo?
Definición 1.7.3 Dado un espacio topológico (X, τ ) definimos un arco ϕ en X como una aplicación continua ϕ : [a, b] → X, −∞ < a <
b < ∞. Si x = ϕ(a) y y = ϕ(b) diremos que dicho arco conecta x con
y.
En esta definición se puede normalizar el dominio de los arcos suponiendo siempre [a, b] = [0, 1].
Definición 1.7.4 Un espacio topológico (X, τ ) se dice que es arcoconexo si cualesquiera x, y ∈ X se pueden conectar con un arco en X.
1.7. CONEXIÓN Y ARCOCONEXIÓN
17
Un ejemplo sencillo de espacio topológico arcoconexo (y, por tanto
conexo; véase la siguiente proposición) es Rn con la topologı́a usual.
En efecto, para cualesquiera x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn el
arco (segmento cerrado) ϕ : [0, 1] → Rn , ϕ(t) = x − t(x − y) conecta x
con y.
Proposición 1.7.5 Todo espacio topológico (X, τ ) arcoconexo es conexo.
Demostración. Supongamos, por reducción al absurdo, que no es conexo. Entonces existen abiertos disjuntos no vacı́os U, V tales que
X = U ∪ V . Como X es arcoconexo existe un arco ϕ : [0, 1] → X
que conecta x ∈ U con y ∈ V . En consecuencia, los subconjuntos
ϕ−1 (U ) y ϕ−1 (V ) son abiertos de [0, 1] (ya que ϕ es continua), disjuntos (ya que U ∩ V = ∅), no vacı́os (0 ∈ ϕ−1 (U ),1 ∈ ϕ−1 (V )) y tales que
[0, 1] = ϕ−1 (U ) ∪ ϕ−1 (V ) (ya que X = U ∪ V ), lo que contradice que
el intervalo [0, 1] es conexo. 2
Ejemplo. El subconjunto X = {(x, y) ∈ R2 : y = sen πx , 0 < x ≤
1} ∪ {(0, y) : −1 ≤ y ≤ 1} ⊂ R2 con la topologı́a inducida de R2 es
un ejemplo tı́pico de espacio topológico conexo que no es arcoconexo
(véase la Figura 4).
Figura 4
18
CAPÍTULO 1. TOPOLOGÍA BÁSICA
Teorema 1.7.6 Sean (X, τ ), (X 0 , τ 0 ) espacios topológicos y f : X →
X 0 una aplicación continua. Si X es conexo entonces f (X) también es
conexo.
Demostración. Supongamos, por reducción al absurdo, que f (X) no
es conexo. Entonces existen abiertos disjuntos U 0 , V 0 ⊆ X 0 tales que
f (X) ⊆ U 0 ∪ V 0 , U 0 ∩ f (X) 6= ∅ y V 0 ∩ f (X) 6= ∅. Como f es continua,
U = f −1 (U 0 ) y V = f −1 (V 0 ) son abiertos no vacı́os de X. Además,
U ∩ V = ∅ y X = U ∪ V . Luego X no es conexo, lo que contradice
nuestra hipótesis. 2
Obsérvese que el Teorema de Bolzano clásico se obtiene de este
resultado sin más que tomar X = [a, b], X 0 = R y suponer f (a) · f (b) <
0. En efecto, en ese caso al ser f ([a, b]) un conexo de R, este conjunto
tiene que ser otro intervalo y, necesariamente, 0 pertenecerá a él.
Ejercicio. Pruébese que si f : X → X 0 es continua y X es arcoconexo
entonces f (X) es arcoconexo.
1.8.
Compacidad
Definición 1.8.1 Dado un espacio topológico (X, τ ) llamamos recubrimiento abierto U de (X, τ ) a una colección de abiertos de X cuya
unión sea todo X. Un subrecubrimiento de U es un subconjunto Ũ ⊆ U
tal que Ũ también es un recubrimiento abierto de X.
Definición 1.8.2 Decimos que un espacio topológico (X, τ ) es compacto si para todo recubrimiento abierto suyo U existe un subrecubrimiento U f ⊆ U con un número finito de elementos.
Dos propiedades tı́picas de los espacios compactos son las siguientes:
Proposición 1.8.3 Sea (X, τ ) un espacio topológico compacto:
(1) Si A ⊆ X es cerrado entonces A es compacto.
(2) Si (X 0 , τ 0 ) es otro espacio topológico y f : X → X 0 es continua
entonces Imf = {f (x) : x ∈ X}(= f (X)) es compacto.
1.8. COMPACIDAD
19
Demostración. (1) Nótese que cada abierto UA de A se puede escribir
como UA = U ∩ A, donde U es un abierto de X. Dado cualquier
recubrimiento abierto de A, UA , consideremos el conjunto U formado
por los abiertos U de X con U ∩ A ∈ UA . Como A es cerrado, X − A es
un abierto de X; por tanto, U ∪ (X − A) es un recubrimiento abierto
de X. Al ser X compacto, podemos extraer un subrecubrimiento finito
U f de U ∪ {X − A}, y el conjunto UAf = {U ∩ A|U ∈ (U f − (X − A))}
es un subrecubrimiento finito de UA .
(2) Para cualquier recubrimiento abierto U 0 de f (X), se considera el
recubrimiento abierto de X: U = {f −1 (U 0 )|U 0 ∈ U 0 }. Tomando ahora
un subrecubrimiento finito de U y, para cada abierto Ui , i = 1, . . . k,
de este subrecubrimiento, un abierto Ui0 ∈ U 0 con f (Ui ) = Ui0 , se extrae
el subrecubrimiento finito {U10 , . . . , Uk0 } de U 0 . 2
Proposición 1.8.4 Sea (X, τ ) un espacio topológico Hausdorff. Si K ⊆
X es compacto entonces K es cerrado en X.
Demostración. Probaremos que X − K es abierto. Para ello, basta con
demostrar que, fijado y ∈ X − K existe un entorno abierto Uy tal que
Uy ∩ K = ∅. Por ser X Hausdorff para cada x ∈ K existen entornos
abiertos Ux , Ux0 de x e y, respectivamente, tales que Ux ∩ Ux0 = ∅. En
consecuencia, UK = {Ux ∩ K : x ∈ K} es un recubrimiento abierto de
K. Pero como K es compacto podemos extraer un subrecubrimiento
finito UKf = {Ux1 ∩ K, . . . , Uxn ∩ K}. Por tanto, un entorno abierto de y
que satisface las propiedades requeridas es Uy = Ux0 1 ∩· · ·∩Ux0 n ⊆ X−K.
2
Relacionada con la compacidad se halla la siguiente propiedad.
Definición 1.8.5 Un espacio topológico (X, τ ) se dice que es secuencialmente compacto si cualquier sucesión {xn }n ⊆ X admite una parcial5 convergente.
En los espacios topológicos que nos interesarán, compacidad y compacidad secuencial coinciden.
Teorema 1.8.6 (Bolzano-Weierstrass). Sea (X, τ ) un espacio topológico metrizable y ANII. Entonces, X es compacto si y sólo si X es
secuencialmente compacto.
Esto es, una sucesión del tipo {xσ(n) }n , donde σ : N → N es una aplicación
estrictamente creciente.
5
20
CAPÍTULO 1. TOPOLOGÍA BÁSICA
La prueba, bajo hipótesis más refinadas, puede consultarse, por ejemplo, en [AMR, Proposition 1.5.5].
Ejercicio. Sea (X, d) un espacio métrico. Demuéstrese: (i) si una
sucesión de Cauchy admite una parcial convergente entonces converge;
(ii) si (X, d) es secuencialmente compacto entonces debe ser completo.
Analicemos con más detalle el concepto de compacidad en espacios
métricos.
Definiciones 1.8.7 Sea (X, d) un espacio métrico y ∅ 6= A ⊆ X.
Definimos el diámetro de A como diam(A) =Sup{d(x, y) : x, y ∈ A} ∈
[0, ∞]. Ası́, diremos que A está acotado si diam(A) < ∞.
Nótese que el diámetro de las bolas (abiertas o cerradas) de Rn es dos
veces su radio.
Proposición 1.8.8 Sea (X, d) un espacio métrico y K ⊆ X compacto.
Entonces K es cerrado y acotado.
Demostración. Por la Proposición 1.8.4, K es cerrado (recordemos
que todo espacio métrico es Hausdorff). Para probar que es acotado, fijemos xo ∈ K y consideremos su recubrimiento abierto UK =
{Bx0 (n) ∩ K : n ∈ N}. Como K es compacto podemos extraer un subrecubrimiento finito y, por tanto, K ⊂ Bx0 (n0 ) para algún n0 . Luego
diam(K) ≤diam(Bx0 (n0 )) ≤ 2n0 . 2
Señalemos que, en general, no es cierto que si K ⊆ X es cerrado
y acotado ello implique que sea compacto (por ejemplo, tómese K =
X = R con la distancia d(x, y) = 1 si x 6= y)6 . Sin embargo, ello ocurre
en Rn con la topologı́a usual, esto es :
Teorema 1.8.9 (Heine-Borel) Los conjuntos compactos de Rn son los
cerrados y acotados.
La demostración no es difı́cil teniendo en cuenta: (a) por la Proposición 1.8.3 basta con probar que un n-rectángulo cerrado y acotado
[a1 , b1 ]×· · ·×[an , bn ] que contenga A es compacto, (b) [a1 , b1 ] es secuencialmente compacto y, razonando inductivamente tomando sucesiones
parciales, el n-rectángulo también lo será, (c) por el Teorema 1.8.6, el
6
Menos trivialmente: en un espacio de Hilbert de dimensión ∞ la bola cerrada
de centro el vector 0 y radio 1 no es compacta.
1.8. COMPACIDAD
21
n-rectángulo es compacto (más detalles pueden consultarse, p. ej., en
[AMR, 1.5.9]).
Corolario 1.8.10 Sea (X, τ ) un espacio topológico compacto y f :
X → R continua. Entonces f admite un máximo y un mı́nimo absolutos.
Demostración. En efecto, como X es compacto también lo es su imagen
f (X) ⊂ R (Proposición 1.8.3(2)). Entonces f (X) es cerrada y acotada.
Por ser acotada Supf < ∞ y, por ser cerrada, Supf = Maxf (para el
mı́nimo absoluto se razona análogamente). 2
En particular, este resultado se da cuando X = [a, b], generalizándose una propiedad elemental conocida de las funciones continuas.
22
CAPÍTULO 1. TOPOLOGÍA BÁSICA
Capı́tulo 2
El concepto de variedad
diferenciable
2.1.
Concepto de variedad topológica
Definición 2.1.1 Una variedad topológica de dimensión n ∈ N es un
espacio topológico Hausdorff y ANII1 Q(≡ (Q, τ )), Q 6= ∅, que es localmente homeomorfo a Rn en el siguiente sentido (véase la Figura 5):
para cada punto p ∈ Q existen un entorno abierto U de p
y un abierto Θ de Rn que son homeomorfos, esto es, tales
que ∃ ϕ : U → Θ ⊆ Rn homeomorfismo.
Dada una variedad topológica Q, introducimos los siguientes conceptos:
– (U, ϕ) es un entorno coordenado de p (o bien, una carta coordenada o unas coordenadas locales alrededor de p).
– Sea π i : Rn → R, π i (x1 , . . . , xn ) = xi , entonces a q i ≡ π i ◦ϕ : U ⊆
Q → R le llamaremos coordenada i-ésima. También usaremos la
notación (U, ϕ) ≡ (U, q 1 , . . . , q n ).
1
Muchos autores no imponen el requisito de ser ANII. En la práctica, para
nosotros, no será restrictivo (véase la Observación (4) más adelante).
23
24CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Figure 5
– Una colección de entornos coordenados A = {(Uα , ϕα ) : α ∈ I}
es un atlas (topológico) si Q = ∪α∈I Uα .
Observaciones:
(1) En la definición se ha supuesto que la dimensión es un número
natural (n ≥ 1). Como caso lı́mite admitiremos n = 0 asumiendo R0 := {1} (si Q es localmente homeomorfo a R0 entonces
tendrá la topologı́a discreta).
(2) La dimensión de la variedad es única, porque un espacio topológico no puede ser localmente homeomorfo a Rn y Rm , n 6= m a
la vez. Esto se debe a que ningún abierto (6= ∅) de Rn puede ser
homeomorfo a ningún abierto de Rm . Aunque muy intuitivo, la
prueba de este resultado no es en absoluto trivial2 .
(3) Un espacio topológico que sea localmente homeomorfo a Rn puede
no ser Hausdorff. De hecho, el ejemplo no trivial de espacio
topológico no Hausdorff que vimos en el capı́tulo anterior, al final
de la Sección 1.4, prueba que ser localmente homeomorfo a R no
implica ser Hausdorff.
2
Es una consecuencia de un resultado clásico en Topologı́a, el Teorema de Invariancia Dominio. Sin embargo, la unicidad de la dimensión de las variedades
diferenciables, que estudiaremos más adelante, sı́ se puede probar con facilidad a
partir del Teorema de la Función Inversa.
2.1. CONCEPTO DE VARIEDAD TOPOLÓGICA
25
(4) La hipótesis relativa al axioma ANII puede no imponerse en principio, si bien otras hipótesis “muy razonables” pueden acabar implicándolo. De hecho, es posible demostrar que, fijadas las otras
hipótesis de la definición de variedad, equivale exigir: (1) Q es
ANII y (2) la topologı́a de Q es metrizable con un conjunto numerable de partes conexas3 .
Ejercicio. Sea (Q, τ ) un espacio topológico localmente homeomorfo a
Rn . Pruébese: (i) Q es ANI, (ii) Q es conexo si y sólo si es arco-conexo,
(iii) las partes conexas de Q son abiertas y cerradas en Q (¿ocurre lo
mismo con las partes conexas del conjunto de los racionales Q?)
Por supuesto, Rn (o cualquier abierto suyo no vacı́o) es una variedad
topológica de dimensión n. En efecto, para probarlo basta considerar
como atlas A = {(Rn , Id)} (Id: aplicación identidad). Sin embargo,
en ocasiones resulta útil usar otros entornos coordenados como, por
ejemplo, las coordenadas polares sobre R2 , las coordenadas esféricas
o bien las cilı́ndricas sobre R3 , etc. (véase el Apéndice 2). Como un
ejemplo explı́cito menos trivial, en el Apéndice 1 construimos dos atlas
sobre la esfera.
En una variedad topológica (Q, τ ) consideremos dos cartas (U, ϕ),
(Ũ , ϕ̃) tales que U ∩ Ũ 6= ∅ y tomemos p ∈ U ∩ Ũ . Entonces, a partir
de los homeomorfismos
ϕ |U ∩Ũ : U ∩ Ũ → ϕ(U ∩ Ũ )
ϕ̃ |U ∩Ũ : U ∩ Ũ → ϕ̃(U ∩ Ũ )
podemos construir los homeomorfismos
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn .
A estos homeomorfismos se les llama cambios de carta o de coordenadas
(véase la Figura 6).
3
La metrizabilidad también equivale a la propiedad topológica llamada paracompacidad, que muchos autores usan en lugar de ANII. Ası́, cuando se usa la paracompacidad en lugar de ANII, se permite un conjunto no numerable de partes conexas.
Esta generalidad no es de mucha utilidad práctica (y resulta incluso contraproducente en algunos contextos, como los resultados de unicidad para la topologı́a de
subvariedades).
26CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Figura 6
Observación. De acuerdo con la notación ya introducida (U, ϕ) ≡
(U, q 1 , . . . , q n ), (Ũ , ϕ̃) ≡ (Ũ , q̃ 1 , . . . , q̃ n ) se suele usar la notación
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 ≡ (q̃ 1 (q 1 , . . . , q n ), . . . , q̃ n (q 1 , . . . , q n ))
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 ≡ (q 1 (q̃ 1 , . . . , q̃ n ), . . . , q n (q̃ 1 , . . . , q̃ n )).
Ası́, para el ejemplo de las coordenadas polares en R2 (Apéndice 2) se
tienen los siguientes cambios de coordenadas:
(x(ρ, θ), y(ρ, θ));
(ρ(x, y), θ(x, y));
2.2.
x(ρ, θ) = ρpcos θ, y(ρ, θ) = ρsenθ,
ρ(x, y) = x2 + y 2 , θ(x, y) = 2 · arc tan
x+
√y
x2 +y 2
.
Variedades diferenciables
Definiciones 2.2.1 Sea (Q, τ ) una variedad topológica de dimensión n:
(1) Diremos que un cambio de cartas entre (U, ϕ) y (Ũ , ϕ̃) es diferenciable C r , r ∈ N ∪ {∞} si las aplicaciones
ϕ̃ ◦ (ϕ |U ∩Ũ )−1 : ϕ(U ∩ Ũ ) ⊆ Rn → ϕ̃(U ∩ Ũ ) ⊆ Rn
ϕ ◦ (ϕ̃ |U ∩Ũ )−1 : ϕ̃(U ∩ Ũ ) ⊆ Rn → ϕ(U ∩ Ũ ) ⊆ Rn
son diferenciables C r . (Si U ∩ Ũ = ∅ el correspondiente cambio
de coordenadas será diferenciable C ∞ por definición.)
2.2. VARIEDADES DIFERENCIABLES
27
(2) Diremos que un atlas A = {(Uα , ϕα ) : α ∈ I} es diferenciable C r
si todos sus cambios de carta son diferenciables C r .
Por simplicidad de lenguaje, de ahora en adelante por “diferenciable”
entenderemos “diferenciable C ∞ ” para los cambios de carta.
Definición 2.2.2 Diremos que un atlas D de Q es una estructura
diferenciable si es un atlas diferenciable (C ∞ ) maximal en el siguiente
sentido:
Si (U, ϕ) es un entorno coordenado de Q cuyos cambios
de cartas con todos los elementos de D son diferenciables
entonces (U, ϕ) ∈ D.
Observaciones:
(1) Cualquier atlas diferenciable A determina una única estructura
diferenciable D(A) tal que A ⊆ D(A).
(2) Dados dos atlas diferenciables A, B se tiene que D(A) = D(B)
si y sólo si A ∪ B es un atlas diferenciable.
Definición 2.2.3 Una variedad diferenciable de dimensión n es una
terna (Q, τ, D) donde (Q, τ ) es una variedad topológica de dimension
n y D una estructura diferenciable.
De ahora en adelante, cuando digamos que Q es una variedad diferenciable realmente nos estaremos refiriendo a la terna (Q, τ, D).
Observación. Una misma variedad topológica puede admitir más
de una estructura diferenciable. En efecto, consideremos la variedad
topológica Q = R y los atlas A = {(R, Id)}, B = {(R, x3 )}. Si consideramos los cambios de carta entre (U, ϕ) = (R, Id) y (Ũ , ϕ̃) = (R, x3 )
tenemos:
ϕ̃ ◦ ϕ−1 : R → R
x 7→ x3
ϕ ◦ ϕ̃−1 : R → R
x 7→ x1/3 .
Vemos que ϕ ◦ ϕ̃−1 no es diferenciable en cero y, por tanto, D(A) 6=
D(B). De ahora en adelante cuando hablemos de Rn como variedad
diferenciable asumiremos como estructura diferenciable la generada por
el atlas A = {(Rn , Id)}.
28CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
En el Apéndice 1 construimos explı́citamente dos atlas diferenciables naturales sobre la esfera. Ambos generan la misma estructura diferenciable la cual, por defecto, será la que consideremos sobre la esfera.
Es digno de reflexión que, aunque en la práctica baste con trabajar
con un atlas diferenciable, resulte conceptualmente necesario considerar “estructuras diferenciables” en la definición de variedad.
Consideremos ahora otros ejemplos:
Ejemplos de variedades diferenciables:
(1) Construyamos una estructura de variedad diferenciable en cualquier espacio vectorial real de dimensión n, V n (R), definiendo
tanto la topologı́a como la estructura diferenciable. Sea B =
(v1 , . . . , vn ) una base ordenada cualquiera de V n . Consideremos
la aplicación biyectiva FB que a cada vector le hace corresponder
sus coordenadas en B, esto es:
FB−1 : Rn → V n
P
(a1 , . . . , an ) 7→ ni=1 ai vi .
Si tomamos otra base distinta B̃ = (ṽ1 , . . . , ṽn ) podemos considerar igualmente la aplicación biyectiva
FB̃−1 : Rn → V n
P
(a1 , . . . , an ) 7→ ni=1 ai ṽi .
Entonces la aplicación FB ◦ FB̃−1 : Rn → Rn es biyectiva y lineal
(en particular, continua y diferenciable). Obviamente, lo mismo
ocurre con la aplicación FB̃ ◦ FB−1 . Por tanto se trata de un homeomorfismo. Diremos que U ⊆ V n es un abierto de V n si FB (U )
(y, por tanto, FB̃ (U ) para cualquier otra base B̃) es un abierto
de Rn . De esta forma queda definida una topologı́a sobre V n , que
resulta independiente de la base escogida. Por construcción, V n
es homeomorfo a Rn y, por tanto, Hausdorff y ANII, además de
una variedad topológica de dimensión n. Si tomamos como entornos coordenados A = {(V n , FB ) : B base de V n } entonces los
cambios de carta son las aplicaciones FB ◦ FB̃−1 que, como hemos
visto, son diferenciables. Por tanto, A es un atlas diferenciable
que genera una estructura diferenciable para V n .
2.2. VARIEDADES DIFERENCIABLES
29
(2) El conjunto de las matrices reales de orden m × n, Mm×n (R) es
una variedad diferenciable de orden m·n. En efecto, basta dotarla
de la estructura diferenciable de Rm·n bajo la identificación natural Mm×n (R) ≡ Rm·n .
(3) Si tenemos dos espacios vectoriales reales V n (R), V m (R) entonces
el conjunto de todas las aplicaciones lineales L(V n , V m ) = {f :
V n → V m : f es lineal} es una variedad diferenciable de dimensión n·m. En efecto, esto es inmediato de (1) y de que L(V n , V m )
tiene estructura de espacio vectorial de dimensión n · m. Una forma natural de definir un atlas es fijar dos bases B y B 0 de V n y
V m , respectivamente, y considerar la aplicación biyectiva
f : L(V n , V m ) → Mm×n (R)
f 7→ M (f, B 0 ← B)
que asocia a cada aplicación lineal f su representación matricial
con respecto a las bases B y B 0 . (Esta aplicación permite definir
una topologı́a y una estructura diferenciable para L(V n , V m ) a
partir de las de Mm×n (R) tal y como se hizo en (1) a partir de
Rn .)
(4) Un abierto U (6= ∅) de una variedad diferenciable Q de dimensión
n es también una variedad diferenciable de dimensión n. En efecto, basta tomar la restricción a U de la topologı́a y los elementos
de la estructura diferenciable de Q.
Por ejemplo, el grupo lineal general de orden n sobre R, Gl(n, R) =
{A ∈ Mn×n (R) : det(A) 6= 0} ⊂ Mn×n (R) es un abierto de
Mn×n (R). De hecho, Gl(n, R) = det−1 (R − {0}) siendo
det : Mn×n (R) → R
A 7→ det(A)
una aplicación continua. Por tanto, Gl(n, R) es una variedad diferenciable de dimensión n2 .
(5) Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 ,
respectivamente, entonces Q × Q0 admite una estructura natural
de variedad diferenciable de dimensión n + n0 . En efecto, dadas
dos cartas coordenadas (U, ϕ), ϕ : U → ϕ(U ) ⊆ Rn y (U 0 , ϕ0 ),
30CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
0
ϕ0 : U 0 → ϕ0 (U 0 ) ⊆ Rn de Q y Q0 , respectivamente, tomamos
como carta coordenada de Q × Q0
ϕ × ϕ0 : U × U 0 ⊆ Q × Q0 → ϕ(U ) × ϕ0 (U 0 ) ⊆ Rn × Rn
(p, p0 ) 7→ (ϕ(p), ϕ0 (p0 )).
0
Fácilmente se comprueba que si las ϕ, ϕ0 tienen cambios de carta
diferenciables entonces también los tienen ϕ × ϕ0 .
En particular, son variedades diferenciables de dimension 2 el
toro S 1 × S 1 o el cilindro S 1 × R.
Notas al concepto de variedad diferenciable:
(1) Si en lugar de considerar espacios localmente homeomorfos a Rn
los consideramos localmente homeomorfos al semiplano superior
Rn+ = {(x1 , . . . , xn ) : xn ≥ 0} entonces podemos hablar de una
variedad topológica (o diferenciable, en su caso) con borde. De los
puntos que, en algún entorno coordenado (y, por tanto, en todo
entorno coordenado), tienen su última coordenada nula se dice
que están en el borde. Obsérvese que el concepto de diferenciabilidad entre abiertos de Rn se extiende naturalmente a abiertos
de Rn+ .4 Análogamente, si se toman homeomorfismos con abiertos de {(x1 , . . . , xn ) : xi ≥ 0 ∀i ∈ {1, . . . , n}} y con cambios de
carta diferenciables entonces hablamos de variedad diferenciable
con borde anguloso (o diferenciable a trozos).
(2) Si en lugar de considerar espacios localmente homeomorfos a Rn
los consideramos localmente homeomorfos a Cn , con cambios de
carta holomorfos, entonces tendremos una variedad compleja de
dimensión (compleja) n. Las superficies de Riemann son variedades complejas de dimensión 1.
(3) En general, los posibles estados de un sistema fı́sico (no cuántico
y discreto) tienen intrı́nsecamente una estructura de variedad
diferenciable de dimensión n (= número de “grados de libertad”
del sistema).
4
Profundizaremos en las variedades con borde dentro del contexto del Teorema
de Stokes, Subsección 9.2.
2.3. APLICACIONES DIFERENCIABLES
31
Más concretamente, en Fı́sica (Mecánica, Termodinámica, Relatividad...) es frecuente suponer, al menos implı́citamente, que el
conjunto X de los estados de un sistema fı́sico5 admite para cada
estado un subconjunto U ⊆ X que contiene a dicho estado y una
aplicación biyectiva ϕ : U ⊆ X → Θ ⊆ Rn ; esto es, podemos
describir ese estado en función de coordenadas en un abierto Θ
de Rn . Más aún, se supone que los cambios de coordenadas son
diferenciables.
Veamos que es suficiente con estos elementos para definir una estructura de variedad diferenciable, salvo por los requisitos topológicos Hausdorff y ANII. Para definir la topologı́a en X, tomaremos como base de abiertos de X los subconjuntos ϕ−1 (Θ0 ), siendo
Θ0 cualquier abierto de Rn en el codominio de ϕ. En consecuencia,
obtenemos un espacio topológico (X, τ ) que, por construcción, es
localmente homeomorfo a Rn , y además estará dotado de un atlas
diferenciable.
El requisito de que la variedad sea Hausdorff siempre se supone
para la topologı́a τ , al menos, implı́citamente (pues se da por
hecho que se pueden tomar coordenadas que separen entornos de
dos estados distintos). Como se comentó, la hipótesis ANII no
es en principio imprescindible. Pero, suele haber otras hipótesis
más o menos implı́citas para X que acaban por implicar que
sea ANII (matemáticamente, como ya hemos visto, basta con
que la topologı́a sea métrica y que X tenga un conjunto numerable de partes conexas; fı́sicamente, parece lógico pensar que
una topologı́a que no quedara constructivamente determinada en
un conjunto numerable de pasos se escaparı́a a las posibilidades
reales de medición).
2.3.
Aplicaciones diferenciables entre variedades. Difeomorfismos
Sean Q y Q0 dos variedades diferenciables de dimensiones n y n0 ,
respectivamente, y f : Q → Q0 una aplicación continua en p ∈ Q.
5
En el caso “extremo” de la Relatividad el sistema fı́sico serı́a el espacio y
tiempo, y sus “estados” los “eventos” aquı́-ahora.
32CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
De la definición de aplicación continua en un punto que vimos en el
capı́tulo anterior se tiene que para cada entorno coordenado (U 0 , ϕ0 ) de
Q0 que contenga a f (p) existe un entorno coordenado (U, ϕ) de Q que
contiene a p tal que f (U ) ⊆ U 0 . En consecuencia, podemos considerar
la aplicación “f vista en coordenadas”, esto es, ϕ0 ◦ f ◦ ϕ−1 : ϕ(U ) ⊆
0
Rn → Rn , que será continua en p por ser composición de continuas
(véase la Figura 7).
Figura 7
Definición 2.3.1 Sean Q, Q0 dos variedades diferenciables de dimensiones n, n0 , respectivamente. Diremos que una aplicación f : Q → Q0
continua en p ∈ Q es diferenciable en este punto si para un par de entornos coordenados (U, ϕ) y (U 0 , ϕ0 ) de p y f (p), respectivamente, tales
0
que f (U ) ⊆ U 0 se tiene que la aplicación ϕ0 ◦f ◦ϕ−1 : ϕ(U ) ⊆ Rn → Rn
es diferenciable en ϕ(p).
Observación. En la Definición 2.3.1 se puede sustituir la expresión
“un par” por “cualesquiera”. En efecto, supongamos que ϕ0 ◦ f ◦ ϕ−1 es
diferenciable en ϕ(p) y probemos que, para cualesquiera otros entornos
coordenados (Ũ , ϕ̃) y (Ũ 0 , ϕ̃0 ) de p y f (p), respectivamente, también se
tiene que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en ϕ̃(p). En un entorno de ϕ̃(p)
podemos escribir:
ϕ̃0 ◦ f ◦ ϕ̃−1 = (ϕ̃0 ◦ ϕ0−1 ) ◦ (ϕ0 ◦ f ◦ ϕ−1 ) ◦ (ϕ ◦ ϕ̃−1 ).
(2.1)
2.3. APLICACIONES DIFERENCIABLES
33
Como ϕ̃0 ◦ ϕ0−1 y ϕ ◦ ϕ̃−1 son diferenciables en todos los puntos de su
dominio (son cambios de carta) y ϕ0 ◦ f ◦ ϕ−1 es diferenciable en ϕ(p)
(por hipótesis), se tiene de (2.1) que ϕ̃0 ◦ f ◦ ϕ̃−1 es diferenciable en
ϕ̃(p).
Observación. En principio tiene sentido definir si f es diferenciable
C s , s ∈ N∪{∞}, en p. Ello se debe a que los cambios de carta en Q y Q0
0
son C ∞ . Si sólo fueran C r y C r , respectivamente, sólo tendrı́a sentido
definir que f es diferenciable C s , para s ≤ Min{r, r0 }. En cualquier
caso, también supondremos por simplicidad que “f es diferenciable”
significa que lo es C ∞ , salvo que se indique explı́citamente lo contrario.
Ejercicio. Comprobar usando la definición que la aplicación f : S 2 ⊂
R3 → R, f (x, y, z) = z es diferenciable.
Definición 2.3.2 Dadas dos variedades diferenciables Q, Q0 se dice
que una aplicación f : Q → Q0 es un difeomorfismo si f es biyectiva y
f , f −1 son diferenciables.
El nombre difeomorfismo local se extiende al caso de que sólo se pueda
asegurar sobre f que, para cada p ∈ Q, existen entornos abiertos U de
p y U 0 = f (U ) de f (p), tales que la restricción de f a U y U 0 sea un
difeomorfismo.
Definición 2.3.3 Dos variedades diferenciables Q, Q0 son difeomorfas
si existe un difeomorfismo f : Q → Q0 .
Ejercicio. Probar que las variedades diferenciables (R, D(A)), (R, D(B))
con A = {(R, Id)}, B = {(R, x3 )} son difeomorfas.
Observaciones:
(1) El espacio euclı́deo Rn admite infinitas estructuras diferenciables
compatibles con la topologı́a usual. Además, si n 6= 4 todas ellas son difeomorfas. Curiosamente, existen infinitas estructuras
diferenciables sobre R4 que no son difeomorfas6 .
(2) Toda variedad diferenciable (¡ANII!) conexa de dimensión 1 es
difeomorfa a R ó a S 1 .
6
La prueba de estos hechos es realmente difı́cil.
34CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
2.4.
Hipersuperficies regulares de
n
R
Consideremos un abierto U ⊆ R2 y una aplicación f : U → R
diferenciable. Definimos el grafo de f como el subconjunto Graf(f ) =
{(x, y, f (x, y)) : (x, y) ∈ U } ⊆ R3 . De manera natural, Graf(f ) es una
variedad diferenciable de dimensión 2, pues podemos considerar como
carta global la proyección
πz : Graf(f ) → U
(x, y, f (x, y)) 7→ (x, y).
Ası́, por ejemplo, en la esfera S 2 ⊂ R3 cada “casquete” Uz± (véase el
Apéndice 1) puede verse como una variedad diferenciable de este tipo,
es decir, como grafos de las aplicaciones
f± : U ⊆ R2 → R p
(x, y) 7→ ± 1 − x2 − y 2
siendo U = {(x, y) ∈ R2 : x2 + y 2 < 1}. De esta manera, la carta global
πz arriba definida coincide con las aplicaciones
2
±
ϕ±
z : Uz → U ⊆ R
(x, y, f± (x, y)) 7→ (x, y)
en el Apéndice 1. Para generalizar esta situación conviene ver S 2 como
la “solución” de la ecuación F (x, y, z) := x2 + y 2 + z 2 = 1. Obsérvese
que en las cartas (Uz± , ϕ±
z ) hemos podido despejar la variable z de esta
= 2z 6= 0 en
ecuación. De hecho, esto se ha podido hacer porque ∂F
∂z
todo Uz± .
Con más generalidad, sea U un abierto de R3 , F : U → R diferenciable, c0 ∈ Im(F ) y p0 ∈ F −1 (c0 ). Si ∂F
(p0 ) 6= 0 entonces el Teorema de la
∂z
Función Implı́cita (véase el Teorema 2.5.2) permite encontrar abiertos
Vz ⊆ R3 y Dz ⊆ R2 , y una aplicación diferenciable φz : Dz ⊆ R2 → R
tales que F −1 (c0 )∩Vz = {(x, y, φz (x, y)) : (x, y) ∈ Dz }. Obviamente, lo
mismo ocurre si cambiamos el papel de la variable z con el de la variable x ó y. Esto es, en los puntos donde alguna de las parciales de F es
distinta de 0, la proyección sobre el correspondiente plano coordenado
sirve de carta local (véase la Figura 8).
Además, si dos parciales son distintas de cero en p0 entonces los
cambios de carta resultan ser diferenciables. En efecto, veamos explı́citamente cómo son estos cambios de carta cuando las coordenadas
2.4. HIPERSUPERFICIES REGULARES DE RN
35
Figura 8
con parciales distintas de cero son z e y. En primer lugar, para la
coordenada z tenemos
πz : F −1 (c0 ) ∩ Vz ∩ Vy → Dz0 ⊆ R2
(x, y, z) 7→ (x, y)
y
πz−1 : Dz0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy
(x, y) 7→ (x, y, φz (x, y)),
donde φz (x, y) es la función diferenciable dada en el Teorema de la
Función Implı́cita por ser ∂F
(p0 ) 6= 0 (Dz0 es algún entorno apropiado
∂z
de πz (p0 ) –cualquiera incluido en Dz ∩ πz (Vy )). Análogamente para la
coordenada y:
πy : F −1 (c0 ) ∩ Vz ∩ Vy → Dy0 ⊆ R2
(x, y, z) 7→ (x, z)
y
πy−1 : Dy0 ⊆ R2 → F −1 (c0 ) ∩ Vz ∩ Vy
(x, z) 7→ (x, φy (x, z), z),
36CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
donde φy (x, z) es la función dada en el Teorema de la Función Implı́cita
por ser ∂F
(p0 ) 6= 0. Entonces, los cambios de carta son:
∂y
πz ◦ πy−1 : Dy0 ⊆ R2 → Dz0 ⊆ R2
(x, z) 7→ (x, φy (x, z))
y
πy ◦ πz−1 : Dz0 ⊆ R2 → Dy0 ⊆ R2
(x, y) 7→ (x, φz (x, y)),
que son diferenciables por serlo sus componentes. Obviamente, este
razonamiento puede generalizarse al caso en que el espacio ambiente
es Rn , lo que permite demostrar la Proposición 2.4.2 con la siguiente
definición previa:
Definición 2.4.1 Sea F : U ⊆ Rn → R diferenciable (U abierto) y
sea c0 ∈ Im(F ). Diremos que c0 es un valor regular de F si para todo
∂F
∂F
p ∈ F −1 (c0 ) se tiene que gradF (p) = ( ∂x
1 (p), . . . , ∂xn (p)) 6= 0 (esto es,
al menos una parcial es distinta de cero).
Proposición 2.4.2 Si c0 ∈ R es un valor regular de una aplicación
diferenciable F : U ⊆ Rn → R entonces F −1 (c0 ) admite una estructura
de variedad diferenciable de dimensión n−1, con un atlas diferenciable
generado por las proyecciones sobre los hiperplanos coordenados.
(Remarcamos que en esta proposición estamos considerando la topologı́a inducida de Rn , y el atlas diferenciable para F −1 (c0 ) se define por
las proyecciones sobre el plano xi ≡ 0 de un entorno de cada punto
∂F
p ∈ F −1 (c0 ) con ∂x
i (p) 6= 0, como acabamos de justificar.)
Definición 2.4.3 Si c0 es un valor regular de F : U ⊆ Rn → R
entonces a la hipersuperficie dada por F −1 (c0 ) le llamaremos hipersuperficie regular de Rn .
Ejemplos:
(1) La esfera Sqn0 (r) de centro q0 ∈ Rn+1 y radio r > 0. En efecto, si
q0 = (a1 , . . . , an+1 ) ∈ Rn+1 entonces Sqn0 (r) se define como:
{(x1 , . . . , xn+1 ) ∈ Rn+1 : (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 = r2 }.
2.4. HIPERSUPERFICIES REGULARES DE RN
37
Sea F : Rn+1 → R la función
F (x1 , . . . , xn+1 ) = (x1 − a1 )2 + · · · + (xn+1 − an+1 )2 .
Para ver que es una hipersuperficie regular de Rn+1 debemos
∂F
i
probar que r2 es un valor regular de F . Ahora bien, ∂x
i = 2(x −
∂F
i
i
ai ) y, por tanto, ∂x
i = 0 si y sólo si x = a para todo i. Como
n
n
q0 6∈ Sq0 (r), se tiene que Sq0 (r) es una hipersuperficie regular.
(2) Se prueba análogamente que en R3 el elipsoide de semiejes a, b, c >
0 y centro q0 = (a1 , a2 , a3 )
F (x, y, z) :=
(x − a1 )2 (y − a2 )2 (z − a3 )2
+
+
=1
a2
b2
c2
es una hipersuperficie regular de R3 .
(3) Análogamente, también lo es el hiperboloide de una hoja en R3
para r > 0:
F (x, y, z) := x2 + y 2 − z 2 = r2
(4) En general, resulta válida la idea intuitiva de que cualquier superficie “suave” S en R3 es una hipersuperficie regular, siempre
que se le pueda asignar de manera continua un vector normal
N . Para convencerse de ello, la idea consiste esencialmente en
tomar como función F la que a cada punto de R3 la asigna la
distancia “con signo” (positiva en el sentido al que apunta N y
negativa en el contrario) del punto a la superficie. Entonces F es
diferenciable en un entorno de S, y admite como valor regular el
0 (S = F −1 (0)), véase la Figura 9.
Proposición 2.4.4 Si Q = F −1 (c0 ) ⊆ Rn es una hipersuperficie regular y f : Rn → R es una aplicación diferenciable entonces f |Q : Q → R
es también diferenciable.
Demostración. Es continua por ser la restricción a Q de una aplicación continua. Para ver que es diferenciable, sea p0 ∈ Q y, digamos,
∂F
(p0 ) 6= 0. Consideremos para p0 la carta generada por la Proposición
∂xi
2.4.2, esto es,
πxi : Vxi ∩ F −1 (c0 ) → Dxi ⊆ Rn−1
(x1 , . . . , xn ) 7→ (x1 , . . . , xi−1 , xi+1 , . . . , xn )
38CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Figura 9
−1
para abiertos Vxi , Dxi . Se tiene, πx−1
(c0 ) con:
i : Dxi → Vxi ∩ F
(x1 , . . . , xi−1 , xi+1 , . . . , xn ) 7→
(x , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ),
1
siendo φxi la función dada por el Teorema de la Función Implı́cita
(sobre el codominio R consideramos como carta la identidad Id). Por
tanto,
1
i−1
Id ◦ f ◦ πx−1
, xi+1 , . . . , xn )
i (x , . . . , x
= f (x1 , . . . , φxi (x1 , . . . , xi−1 , xi+1 , . . . , xn ), . . . , xn ),
que es diferenciable por ser composición de diferenciables. 2
2.5.
Subvariedades regulares de
n
R
Definición 2.5.1 Sea F : U ⊆ Rn → Rm (n ≥ m) diferenciable
(C ∞ ) y sea c0 ∈ Im(F ). Se dice que c0 es un valor regular de F si la
diferencial de F en p, (d F )p , tiene rango máximo m para todo p ∈
F −1 (c0 ).
i
Esto es, la matriz ( ∂F
(p))i,j ∈ Mm×n (R) tiene rango m para todo
∂xj
−1
p ∈ F (c0 ).
2.5. SUBVARIEDADES REGULARES DE RN
39
∂F
Si m = 1 entonces la matriz anterior se reduce a grad F (p) = ( ∂x
1 (p),
∂F
. . . , ∂xn (p)) y, por tanto, reobtenemos la definición de valor regular de
la sección anterior. Nuestro objetivo será ahora generalizar la Proposición 2.4.2 para mostrar que la imagen inversa de cualquier valor regular
es una variedad diferenciable.
i
(p))i,j tiene rango m entonces habrá alguna
Observemos que si ( ∂F
∂xj
submatriz cuadrada de orden m con determinante distinto de 0. Esto
es, podremos escoger m columnas (que supondremos son las m últimas)
tales que el correspondiente determinante es distinto de 0. En este caso,
el Teorema de la Función Implı́cita permite asegurar que en la ecuación
F (x1 , . . . , xn−m , xn−m+1 , . . . , xn ) = c0 las variables xn−m+1 , . . . , xn son
“despejables” como función de las n − m primeras x1 , . . . , xn−m . Esto
es, la proyección sobre las n − m primeras variables sirve como carta
local en F −1 (c0 ) y, además, los cambios de carta resultan diferenciables.
Con más precisión, recordemos ese teorema:
Teorema 2.5.2 (Teorema de la Función Implı́cita): Consideremos los
abiertos U ⊆ Rn−m , V ⊆ Rm y U × V ⊆ Rn . Supongamos que F :
U × V ⊆ Rn → Rm es diferenciable y que (x0 , y0 ) ∈ U × V es tal que la
diferencial respecto de las variables en V de F (dy F )(x0 ,y0 ) : Rm → Rm
es un isomorfismo (lineal). Entonces existe un entorno U0 de x0 y W0
de c0 := F (x0 , y0 ) y una aplicación g : U0 × W0 → V diferenciable tal
que F (x, g(x, c)) = c para todo x ∈ U0 y c ∈ W0 .
Si llamamos
gc0 : U0 → V
x 7→ g(x, c0 )
entonces F (x, gc0 (x)) = c0 para todo x ∈ U0 , y la coordenada y se
despeja en función de la x (y = gc0 (x)).
Razonando entonces como en la sección anterior y usando el Teorema 2.5.2 se obtiene la siguiente generalización de las Proposiciones
2.4.2 y 2.4.4:
Teorema 2.5.3 Sea F : U ⊆ Rn → Rm diferenciable y c0 ∈ Im(F )
un valor regular. Entonces Q = F −1 (c0 ) es una variedad topológica, y
las proyecciones sobre los subespacios coordenados de dimensión n − m
generan canónicamente una estructura diferenciable. Además, si f :
U ⊆ Rn → Q0 es diferenciable entonces también lo es f |Q .
40CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
(Como en la Proposición 2.4.2, a fin de generar un atlas diferenciable
se entiende aquı́ que, para cada p ∈ Q, si las columnas i1 , . . . , im de
dFp son independientes entonces se toma como función coordenada en
un entorno de p la proyección sobre las otras n − m variables.) A las
variedades ası́ obtenidas las llamaremos subvariedades regulares de Rn .
Ejemplo. Consideremos el grupo ortonormal de dimensión 2
O(2, R) = {A ∈ M2×2 (R) : A · At = Id} ⊂ R4 .
Veamos que O(2, R) es una variedad diferenciable de dimensión 1. En
primer lugar tenemos que M2×2 (R) ≡ R4 . Ahora
µ bien, A
¶ ∈ O(2, R) si
a
b
y sólo si A · At = Id, es decir, si y sólo si A =
≡ (a, b, c, d)
c d
verifica
a 2 + b2 = 1
ac + bd = 0
c2 + d2 = 1.
Por tanto, si definimos
F : R4 → R3
(a, b, c, d) 7→ (a2 + b2 , ac + bd, c2 + d2 ),
tenemos que O(2, R) = F −1 (1, 0, 1). Basta con comprobar que (1, 0, 1)
es un valor regular de F , esto es, que el rango de (d F )A es 3 para todo
A ∈ O(2, R). En primer lugar, observemos que


2a 2b 0 0
(d F )A =  c d a b  ∈ M3×4 (R).
(2.2)
0 0 2c 2d
Ahora bien, como A · At = Id se tiene que det(A) = ±1 6= 0 y las dos
primeras columnas de (d F )A son independientes. Además también se
obtiene que c y d no se anulan simultáneamente, por lo que el rango de (d F )A es 3. En consecuencia, tomando como coordenada sobre
O(2, R) la proyección al elemento c (cuando c 6= 0) o d (cuando d 6= 0)
obtenemos un atlas para O(2, R).
Notas: (1) O(2, R) puede estudiarse más detenidamente como sigue.
Si definimos
O+ (2, R) = {A ∈ O(2, R) : det(A) = 1}
O− (2, R) = {A ∈ O(2, R) : det(A) = −1}
2.6. APÉNDICE 1: ATLAS EN §2
41
entonces se puede comprobar:
µ
¶
cos θ −senθ
+
O (2, R) = {
: θ ∈ R}
µ senθ cos θ ¶
cos θ senθ
O− (2, R) = {
: θ ∈ R}.
senθ − cos θ
Los conjuntos O+ (2, R) y O− (2, R) son las dos partes conexas de O(2, R).
El grupo O(2, R) se reduce, por tanto, a dos copias de S 1 . En general,
O(n, R) = {A ∈ Mn×n (R) : AAt = Idn } es una variedad diferenciable
de dimensión n(n − 1)/2 que tiene dos componentes conexas. Además,
O(n, R) s compacto, al identificarse con un subconjunto cerrado y aco2
tado de Rn .
(2) O(n, R) con el producto usual de matrices es un caso especial
de grupo de Lie; esto es, de grupo algebraico G ≡ (G, ·) dotado de una
estructura de variedad diferenciable, y tal que las aplicaciones
G×G→G
(g, h) 7→ g · h
y
G→G
g 7→ g −1
son diferenciables7 .
2.6.
Apéndice 1: dos atlas explı́citos sobre
la esfera
La Proposición 2.4.2 ó el Teorema 2.5.3 permiten concluir que la
esfera S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} es una (hiper)superficie
regular de R3 . Sin embargo, en este apéndice comprobaremos directamente que es una variedad topológica de dimensión 2 suministrando, de
hecho, dos atlas diferenciables de interés que generan dicha estructura
diferenciable. Sean
Uz+ = {(x, y, z) ∈ S 2 : z > 0} ⊂ R3 (casquete superior de la esfera)
Θ = {(x, y) ∈ R2 : x2 + y 2 < 1} ⊂ R2 ,
dos abiertos de S 2 y R2 , respectivamente, y definamos la aplicación
+
ϕ+
z : Uz → Θ
(x, y, z) 7→ (x, y)
7
La teorı́a de grupos de Lie es muy precisa y, en particular, muestra que las
hipótesis de esta definición son algo redundantes.
42CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
que es continua, ya que coincide con la restricción a Uz+ de la proyección
πz : R2 × R → R2
((x, y), z) 7→ (x, y),
+
es decir, ϕ+
z = πz |Uz+ . La aplicación ϕz obviamente admite por inversa
a la aplicación
−1
(ϕ+
: Θ ⊂ R2 → Uz+ ⊂p
R3
z)
(x, y) 7→ (x, y, 1 − x2 − y 2 ),
que es continua puesto que cada componente suya lo es. En consecuencia, hemos encontrado un entorno coordenado para cada punto
p ∈ Uz+ .
Para el abierto Uz− = {(x, y, z) ∈ S 2 : z < 0} (casquete inferior)
repetimos el mismo proceso pero ahora con
−
ϕ−
z : Uz → Θ
(x, y, z) 7→ (x, y)
−1
(ϕ−
: Θ → Uz−
z)
p
(x, y) 7→ (x, y, − 1 − x2 − y 2 ).
Para completar nuestro atlas debemos cubrir el ecuador. Para ello consideramos en primer lugar los abiertos Uy+ = {(x, y, z) ∈ S 2 : y > 0} y
Uy− = {(x, y, z) ∈ S 2 : y < 0} con
+
ϕ+
y : Uy → Θ
(x, y, z) 7→ (x, z)
−1
(ϕ+
: Θ → Uy+
y)
√
(x, z) 7→ (x, 1 − x2 − z 2 , z)
y
−
ϕ−
y : Uy → Θ
(x, y, z) 7→ (x, z)
−1
(ϕ−
: Θ → Uy−
y)
√
(x, z) 7→ (x, − 1 − x2 − z 2 , z),
respectivamente. Por último, para cubrir los puntos (1, 0, 0), (−1, 0, 0) ∈
S 2 tomamos los abiertos Ux+ = {(x, y, z) ∈ S 2 : x > 0} y Ux− =
{(x, y, z) ∈ S 2 : x < 0} con
+
ϕ+
x : Ux → Θ
(x, y, z) 7→ (y, z)
−1
: Θ → Ux+ p
(ϕ+
x)
(y, z) 7→ ( 1 − y 2 − z 2 , y, z)
y
−
ϕ−
x : Ux → Θ
(x, y, z) 7→ (y, z)
−1
: Θ → Ux− p
(ϕ−
x)
(y, z) 7→ (− 1 − y 2 − z 2 , y, z),
2.6. APÉNDICE 1: ATLAS EN §2
43
respectivamente. En conclusión, el atlas para toda la esfera S 2 queda
−
−
+
+
−
−
+
+
−
−
AS 2 = {(Uz+ , ϕ+
z ), (Uz , ϕz ), (Uy , ϕy ), (Uy , ϕy ), (Ux , ϕx ), (Ux , ϕx )}.
2
Por tanto, S es una variedad topológica. De la forma explı́cita de
los cambios de carta resulta inmediato comprobar que el atlas AS 2 es
diferenciable.
Podemos optimizar el número de elementos que componen un atlas
para S 2 proyectando estereográficamente. En efecto, lo haremos para
el caso general de la esfera n-dimensional S n (de nuevo centrada en
el origen y de radio 1 por comodidad). Sean N = (0, . . . , 0, 1) (polo
norte) y S = (0, . . . , 0, −1) (polo sur). Como primer entorno coordenado consideramos el abierto U N = S n − {N } junto con la proyección
estereográfica desde N , ϕN : U N → Rn , esto es, ϕN es la aplicación
que lleva cada elemento (x1 , . . . , xn+1 ) de U N al punto de corte con
el plano xn+1 ≡ 0 de la recta que pasa por N y por (x1 , . . . , xn+1 ).
Explı́citamente,
ϕN : U + → Rn
(x1 , . . . , xn+1 ) 7→
1
(x1 , . . . , xn ).
1−xn+1
Análogamente, consideremos el abierto U S = S n − {S} junto con la
proyección estereográfica desde S,
ϕS : U S → Rn
(x1 , . . . , xn+1 ) 7→
1
(x1 , . . . , xn ).
1+xn+1
Entonces (U N , ϕN ) y (U S , ϕS ) completan un atlas para la esfera S n .
Ejercicio. Compruébese: (1) ϕN , ϕS son homeomorfismos, (2) su
cambio de cartas es diferenciable y (3) el atlas A = {(U N , ϕN ), (U S , ϕS )}
genera la misma estructura diferenciable en S n que la ya estudiada.
Nota. Para n = 2 se tiene el cambio de cartas ϕS ◦ (ϕN )−1 : R2 −
{(0, 0)} → R2 − {(0, 0)}, (u, v) → (u, v)/(u2 + v 2 ). Esta aplicación (y
su inversa) no son sólo diferenciables sino también anti-holomorfas. Si
en lugar de ϕS tomamos la aplicación ϕ̃S = s ◦ ϕS donde s(u, v) =
(v, u), ∀(u, v) ∈ R2 , el cambio de cartas ϕ̃S ◦ (ϕN )−1 (y su inverso) resulta holomorfo. En consecuencia, el atlas A = {(U N , ϕN ), (U S , ϕ̃S )}
es holomorfo y S 2 admite una estructura de variedad compleja de dimensión 1 (esfera de Riemann) –véase la nota al concepto de variedad
(2) al final de la Sección 2.2.
44CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Observación. Señalemos que no existe un atlas con una única carta
para S n (ni para ninguna otra variedad compacta). Si existiera dicho
atlas entonces tendrı́amos un homeomorfismo ϕ : S n → Θ, siendo Θ
un abierto de Rn . Pero S n es compacto luego, como ϕ es continua,
también Θ = ϕ(S n ) es compacto. En consecuencia, Θ es un cerrado
(y abierto) de Rn , es decir, Θ = Rn por ser Rn es conexo. Esto es una
contradicción puesto que Rn no es acotado y, por tanto, no puede ser
compacto.
2.7.
Apéndice 2: coordenadas polares, cilı́ndricas y esféricas
Coordenadas polares sobre R2 : Estas coordenadas vienen definidas
de la siguiente manera. Consideremos como carta el abierto U = R2 −
{(x, 0) ∈ R2 : x ≤ 0} junto con la aplicación
ϕ : U ⊂ R2 →]0, ∞[×] − π, π[
(x, y) 7→ (ρ(x, y), θ(x, y)),
p
donde ρ(x, y) = x2 + y 2 y θ(x, y) es el único real de ] − π, π[ tal que
x = ρ · cos θ e y = ρ · senθ (por tanto, la inversa de ϕ es ϕ−1 (ρ, θ) =
(ρ · cos θ, ρ · senθ)). Existen diferentes modos de determinar la función
θ(x, y) de manera explı́cita:

arc tan xy
si x > 0



π

si x = 0, y > 0
 2
y
π + arc tan x
si x < 0, y > 0
θ(x, y) =

π

−
si x = 0, y < 0


 2
−π + arc tan xy
si x < 0, y < 0
o más compactamente:
θ(x, y) = 2 · arc tan
y
p
x + x2 + y 2
para todo (x, y) ∈ R2 − {(x, 0) : x ≤ 0}.
Coordenadas cilı́ndricas sobre R3 : Para definir estas coordenadas
consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto
2.7. APÉNDICE 2: COORDENADAS EN R3
45
con la aplicación
ϕ : U ⊂ R3 →]0, ∞[×] − π, π[×R
(x, y, z) 7→ (ρ(x, y), θ(x, y), z),
donde ρ(x, y) y θ(x, y) se definen como en las coordenadas polares. Por
tanto, la correspondiente inversa es ϕ−1 (ρ, θ, z) = (ρ · cos θ, ρ · senθ, z).
Coordenadas esféricas sobre R3 : Para definir estas coordenadas
consideramos el abierto U = R3 − {(x, y, z) ∈ R3 : x ≤ 0, y = 0} junto
con la aplicación
ϕ : U ⊂ R3 →]0, ∞[×]0, π[×] − π, π[
(x, y, z) 7→ (r(x, y, z), θ(x, y, z), φ(x, y, z)),
p
donde r(x, y, z) = x2 + y 2 + z 2 , y θ(x, y, z) y φ(x, y, z) son los únicos
reales de ]0, π[ y ] − π, π[, respectivamente, tales que x = r · senθ · cos φ
e y = r · senθ · senφ. Por tanto, en este caso ϕ−1 (r, θ, φ) = (r · senθ ·
cos φ, r · senθ · senφ, r · cos θ).
Ejercicios
Ejercicio 1. Razonar si todo espacio topológico X localmente homeomorfo a Rn es necesariamente T1 (esto es, para cada par de puntos
x, y ∈ X, existe un entorno de x que no contiene a y, y un entorno de
y que no contiene a x.)
Ejercicio 2. Se considera la aplicación ϕ : R+ × R → R2 − {(0, 0)},
(ρ, θ) → (ρ cos θ, ρsenθ). Compruébese que ϕ es un difeomorfismo local
y suprayectivo. ¿Es ϕ un difeomorfismo global?
Ejercicio 3. Si Q es una variedad diferenciable, pruébese que cada
carta ϕ : U −→ ϕ(U ) de Q es un difeomorfismo entre las variedades
diferenciables U y ϕ(U ).
Ejercicio 4. Dado un número real ² > 0 (ó ² = ∞), demuéstrese que
todo punto p de una variedad diferenciable Q de dimensión n tiene una
carta (U, ϕ) tal que ϕ(p) = 0 y ϕ(U ) = B0 (²) = {x ∈ Rn : kxk < ²}.
Ejercicio 5. Se consideran en R+ =]0, ∞[ los atlas A1 = {(R+ , IdR+ )},
A2 = {(R+ , ln)}, A3 = {(R+ , exp)}, A4 = {(R+ , x3 )}, A5 = {(R+ , (x−
46CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
1)3 )}, donde ln es la aplicación logaritmo neperiano y exp la exponencial. ¿Cuáles de ellos definen iguales estructuras diferenciables?
Ejercicio 6. Sea S 2 la esfera unitaria centrada en (0, 0, 0) de R3 y sea
ϕN : S 2 − {(0, 0, 1)} −→ R2 la proyección estereográfica desde el polo
norte (0, 0, 1). Calcúlense las cordenadas, con respecto a esta carta, del
punto ( √13 , √13 , √13 ) de S 2 . ¿Qué punto de S 2 tiene coordenadas (0, 0)
con respecto a esta carta?
Ejercicio 7. Sean Q y Q0 variedades diferenciables y sean π : Q ×
Q0 −→ Q y π 0 : Q × Q0 −→ Q0 las correspondientes proyecciones; es
decir, π(p, p0 ) = p y π 0 (p, p0 ) = p0 , ∀(p, p0 ) ∈ Q × Q0 . Pruébese que π y
π 0 son aplicaciones diferenciables. Si Q00 es otra variedad diferenciable
y F : Q00 −→ Q × Q0 es una aplicación, pruébese que F es diferenciable
si y sólo si π ◦ F y π 0 ◦ F son diferenciables.
Ejercicio 8. Con las mismas notaciones del problema anterior, para
cada (p, p0 ) ∈ Q × Q0 consideremos las aplicaciones ip0 : Q −→ Q × Q0 ,
ip0 (q) = (q, p0 ), ∀q ∈ Q, y jp : Q0 −→ Q × Q0 , jp (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 .
Pruébese que ip0 y jp son aplicaciones diferenciables.
Ejercicio 9. Si F : Q −→ N y F 0 : Q0 −→ N 0 son aplicaciones
diferenciables, pruébese que F × F 0 : Q × Q0 −→ N × N 0 , definida por
(F × F 0 )(p, p0 ) = (F (p), F 0 (p0 )), es también diferenciable.
Ejercicio 10. Se consideran las aplicaciones F, G : R2 −→ R2 , dadas
por
F (x, y) = (xey + y, xey − y)
G(x, y) = (ex cos(y), ex sen(y)).
¿Es F (resp. G) un difeomorfismo?
Ejercicio 11. Encuéntrese un difeomorfismo entre el paraboloide
grafo de la función z = x2 + y 2 y el hiperboloide grafo de la función
z = x2 − y 2 .
Ejercicio 12. Demuéstrese que todos los intervalos abiertos de R son
difeomorfos.
Ejercicio 13. Demuéstrese que dos esferas de Rn+1 con centros y
radios arbitrarios son difeomorfas.
Ejercicio 14. Se considera al subconjunto de R3 , S = {(x, y, z) :
yex + zey + yez = −1}. ¿Es S una superficie regular de R3 ?
2.7. APÉNDICE 2: COORDENADAS EN R3
47
Ejercicio 15. Sean A, B, C ∈ R\{0}. Determı́nense los valores regulares de la función sobre R3 , f (x, y, z) = Ax2 + Bxy + Czy.
Ejercicio 16. En la esfera S 2 se considera la relación de equivalencia
p ∼ q si y sólo si q = ±p, ∀p, q ∈ S 2 . Denotaremos por P2 (R) al espacio
cociente S 2 / ∼ (espacio proyectivo real bidimensional). Pruébese que,
con la topologı́a cociente, P2 (R) es una variedad topológica de dimensión 2. Demuéstrese que admite una estructura diferenciable tal que
la correspondiente proyección canónica desde S 2 es un difeomorfismo
local (esta estructura diferenciable es única). Generalizar a cualquier
dimensión n ∈ N.
Ejercicio 17. Consideremos la esfera unidad de dimensión 1, S 1 ,
como los números complejos de módulo 1, es decir, S 1 = {z ∈ C :
|z| = 1}.
(1) Pruébese que la aplicación F : S 1 −→ S 1 , definida por F (z) = z 2 ,
∀z ∈ S 1 , es diferenciable, sobreyectiva y coincide sobre cada par
de puntos antı́podas de S 1 .
(2) Si F̃ : P1 (R) −→ S 1 es la aplicación inducida por F en el cociente,
pruébese que F̃ es un difeomorfismo.
48CAPÍTULO 2. EL CONCEPTO DE VARIEDAD DIFERENCIABLE
Capı́tulo 3
Espacio tangente
3.1.
Concepto de vector tangente a una
variedad Q en un punto p
Consideremos una superficie S ⊂ R3 y una curva diferenciable
γ(t) = (x(t), y(t), z(t)) ⊂ S. Obviamente, podemos definir la velocidad de la curva γ(t) en t = 0 como γ 0 (0) = (x0 (0), y 0 (0), z 0 (0)) ∈ R3 .
De este modo, si γ(0) = p entonces el vector γ 0 (0) será “tangente” a la
superficie S en p. Esto es, la velocidad de la curva en p está contenida
en el plano tangente a S en p, si pensamos en γ 0 (0) como un vector
con “origen” el punto p (véase la Figura 10).
Ejercicio. Sea S un superficie de R3 obtenida como imagen inversa
de un valor regular para alguna función f : R3 → R, S = F −1 (c0 ).
Demuéstrese que la ecuación implı́cita del plano afı́n que es tangente
a S en un punto p0 = (x0 , y0 , z0 ) ∈ S es:
∂f
∂f
∂f
(p0 )(x − x0 ) +
(p0 )(y − y0 ) +
(p0 )(z − z0 ) = 0.
∂x
∂y
∂z
Generalı́cese a subvariedades regulares de Rn .
49
50
CAPÍTULO 3. ESPACIO TANGENTE
Figura 10
Con más generalidad, consideremos ahora una variedad diferenciable arbitraria Q de dimensión n y un punto p ∈ Q. El objetivo de
este capı́tulo es dar una definición razonable de espacio tangente a la
variedad Q en el punto p, ası́ como el estudio de la estructura de dicho espacio. En general, asociaremos a cada punto p de una variedad
n-dimensional Q, su espacio tangente, que será un espacio vectorial
también de dimensión n.
Como primera aproximación, en esta sección introduciremos los
conceptos de vector y espacio tangente a una variedad en un punto de
tres formas diferentes, cada vez más abstractas, aunque equivalentes.
3.1.1.
Vector tangente como clase de equivalencia
de curvas
Consideremos en adelante una variedad diferenciable Q de dimensión n y fijemos un punto p ∈ Q. Sea
Cp = {γ :] − ²γ , ²γ [→ Q : ²γ > 0, γ(0) = p, γ diferenciable},
esto es, Cp es el conjunto de curvas contenidas Q que pasan por p donde,
para simplificar el lenguaje, suponemos que cada curva pasa por p en 0
y está definida en algún entorno abierto simétrico de 0. Establecemos
en Cp una relación de equivalencia como sigue. Diremos que dos curvas
γ, ρ ∈ Cp son equivalentes si para algún entorno coordenado (U, ϕ =
(q 1 , . . . , q n )) de p se verifica dtd |t=0 (ϕ ◦ γ)(t) = dtd |t=0 (ϕ ◦ ρ)(t)
3.1. CONCEPTO DE VECTOR TANGENTE
51
(obsérvese que ϕ(γ(0)) = ϕ(ρ(0)) = ϕ(p)). Es decir, las curvas son
equivalentes si coinciden los vectores tangentes en Rn de ambas curvas
vistas en coordenadas (véase la Figura 11).
Figura 11
Observación. Esta definición es independiente del entorno coordenado escogido. En efecto, sea (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) otro entorno coordej
nado de p y denotemos por ∂∂qq̃ i (p) la i-ésima parcial de q̃ j ◦ ϕ−1 , esto
es,
∂ q̃ j
∂(q̃ j ◦ ϕ−1 )
(p)
=
(ϕ(p)),
∂q i
∂xi
donde ∂x∂ j denota la parcial j-ésima usual para funciones definidas en
Rn . Entonces
d
| (q̃ j ◦ γ)(t)
= d |t=0 [(q̃ j ◦ ϕ−1 ) ◦ (ϕ´◦ γ)](t)
dt t=0
Pn ³ ∂ q̃j dt d
= i=1 ∂qi (p) · dt |t=0 (q i ◦ γ)(t)
(y, si γ y ρ están relacionadas usando (U, ϕ))
´
P ³ j
= ni=1 ∂∂qq̃ i (p) · dtd |t=0 (q i ◦ ρ)(t) =
d
|
dt t=0
(q̃ j ◦ ρ)(t)
para todo j y, por tanto, dtd |t=0 (ϕ̃◦γ)(t) = dtd |t=0 (ϕ̃◦ρ)(t). Nótese que
la relación entre dtd |t=0 (ϕ̃ ◦ γ)(t) y dtd |t=0 (ϕ ◦ γ)(t) es, matricialmente,
 d
  ∂ q̃1
  d

∂ q̃ 1
1
1
.
.
.
|
(q̃
◦
γ)(t)
|
(q
◦
γ)(t)
1
n
t=0
t=0
∂q
∂q
dt
dt

  .. . .

..
..
.  

= .
.
. ..  ·
.
.
d
d
n
n
∂ q̃ n
∂ q̃ n
| (q̃ ◦ γ)(t)
| (q ◦ γ)(t)
. . . ∂qn
dt t=0
dt t=0
∂q 1
p
(3.1)
52
CAPÍTULO 3. ESPACIO TANGENTE
Es inmediato comprobar que el concepto de curvas equivalentes
proporciona una relación de equivalencia. Estamos pues en condiciones
de establecer la primera definición de vector tangente.
Definición 3.1.1 Llamaremos vector tangente a Q en p (como clase
de curvas) a cada una de las clases de equivalencia definidas por ∼ en
Cp .
Ası́, denotaremos por [γ] al vector tangente representado por la curva
γ, esto es, la clase de equivalencia de γ. En consecuencia,
Definición 3.1.2 Llamaremos espacio tangente a Q en p al conjunto
Cp / ∼.
Por simplicidad de notación (y por las expresiones en coordenadas que
veremos en la próxima subsección) escribiremos γ 0 (0) = [γ].
3.1.2.
Vector tangente por coordenadas
Consideremos, en la variedad diferenciable Q, dos curvas γ, ρ ∈ Cp .
En este caso, si fijamos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) se
tiene:
d
|
dt t=0
d
|
dt t=0
ϕ ◦ γ(t) = ( dtd |t=0 q 1 ◦ γ(t), . . . , dtd |t=0 q n ◦ γ(t)) = (a1 , . . . , an )
ϕ ◦ ρ(t) = ( dtd |t=0 q 1 ◦ ρ(t), . . . , dtd |t=0 q n ◦ ρ(t)) = (b1 , . . . , bn )
y se verifica
γ ∼ ρ ⇔ (a1 , . . . , an ) = (b1 , . . . , bn ).
Esto es, fijado un sistema de coordenadas (U, ϕ) cada vector tangente
[γ] se puede identificar con una n-upla (a1 , . . . , an ) ∈ Rn . Además, si
tomamos otra carta coordenada (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )), al mismo vector
tangente [γ] le asignamos la n-upla:
d
d
d
|t=0 ϕ̃ ◦ γ(t) = ( |t=0 q̃ 1 ◦ γ(t), . . . ,
|t=0 q̃ n ◦ γ(t)) = (ã1 , . . . , ãn ),
dt
dt
dt
que, aunque es distinta de (a1 , . . . , an ), se relaciona con ella mediante
la igualdad (3.1). Podemos establecer la siguiente definición alternativa
de vector tangente:
3.1. CONCEPTO DE VECTOR TANGENTE
53
Definición 3.1.3 Un vector tangente a Q en p (por coordenadas) es
una aplicación que a cada entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de
p le hace corresponder un elemento (a1 , . . . , an ) ∈ Rn , de modo tal que
dado otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) el nuevo elemento
(ã1 , . . . , ãn ) ∈ Rn asignado verifica
  ∂ q̃1
ã1
∂q 1
 ..   ..
 . = .
∂ q̃ n
ãn
∂q 1


a1
..  ·  ..  ,
.   . 
∂ q̃ n
an
∂q n
(3.2)
∀i ∈ {1, . . . , n}.
(3.3)
∂ q̃ 1
∂q n
...
..
.
...


p
o, equivalentemente,
n
X
∂ q̃ i
ã =
(p) · aj
j
∂q
j=1
i
Resulta inmediato comprobar que las Definiciones 3.1.1 y 3.1.3 son
equivalentes. Además, de la linealidad de (3.2) queda de manifiesto la
estructura de espacio vectorial de dimensión n (a partir de la suma y el
producto por escalares usuales en Rn ) de que está dotado el conjunto
de todos los vectores tangentes a p.
La Definición 3.1.3 formaliza la idea clásica en Fı́sica de que un
vector es asignar a cada sistema de coordenadas un elemento de Rn
“que se transforma como un vector” (esto es, verificándose (3.3)).
3.1.3.
Vector tangente como derivación
Introducimos ahora un nuevo concepto de vector tangente basándonos
en la existencia de un “modo de derivar funciones” para cada vector
tangente a Q en p; es lo que generaliza la derivada direccional en Rn .
Más concretamente, sea γ ∈ Cp y consideremos su vector tangente asociado [γ]. Si f : Q → R es una aplicación diferenciable (C ∞ ) entonces
podemos considerar f ◦ γ :] − ²γ , ²γ [→ R y calcular dtd |t=0 (f ◦ γ)(t). A
este número real lo llamaremos derivada direccional de f en la dirección del vector tangente [γ]. Comprobemos, en primer lugar, que esta
derivada es independiente del representante escogido en la clase [γ].
Esto es,
Lema 3.1.4 Si γ ∼ ρ entonces
d
|
dt t=0
(f ◦ γ)(t) =
d
|
dt t=0
(f ◦ ρ)(t).
54
CAPÍTULO 3. ESPACIO TANGENTE
Demostración. Si (U, ϕ = (q 1 , . . . , q n )) es un sistema de coordenadas
en p entonces dtd |t=0 (f ◦ γ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t). Entonces,
aplicando la regla de la cadena,
Pn ∂(f ◦ϕ−1 )
d
−1
(ϕ(p)) · dtd |t=0 (q j ◦ γ)(t)
|
(f
◦
ϕ
)
◦
(ϕ
◦
γ)(t)
=
t=0
j=1
dt
∂xj
Pn ∂(f ◦ϕ−1 )
= j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j ◦ ρ)(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ ρ)(t)
= dtd |t=0 (f ◦ ρ)(t).
2
Por tanto, cada clase de equivalencia proporciona una única derivada
direccional en p.
De la prueba del Lema 3.1.4 resulta inmediato comprobar que si el
vector tangente [γ] viene dado por coordenadas entonces la derivada
P
◦ϕ−1 )
direccional de f es igual a i ai ∂(f∂x
(ϕ(p)), en la notación de la
i
Definición 3.1.3.
Consideremos el conjunto C ∞ (Q) = {f : Q → R : f es diferenciable C ∞ }. De manera natural, en este conjunto se pueden definir las
operaciones f + g, f · g y a · f , siendo f, g ∈ C ∞ (Q) y a ∈ R. De
hecho, (C ∞ (Q), +, ·) tiene estructura de anillo unitario conmutativo
y (C ∞ (Q), +, ·R) tiene estructura de espacio vectorial. Si fijamos un
vector tangente en p, [γ] = vp , podemos definir la aplicación:
Dvp : C ∞ (Q) → R
f 7→ Dvp (f ) ≡ vp (f ),
(3.4)
siendo vp (f ) = dtd |t=0 (f ◦γ)(t) la derivada direccional de f con respecto
a vp . La aplicación (3.4) verifica las siguientes propiedades:
(1) Es R-lineal:
Dvp (a·f +b·g) = a·Dvp (f )+b·Dvp (g),
∀f, g ∈ C ∞ (Q), ∀a, b ∈ R.
(2) Verifica la regla de Leibniz del producto en p:
Dvp (f · g) = (Dvp f ) · g(p) + f (p) · Dvp (g),
∀f, g ∈ C ∞ (Q)
Demostración de (2). Si vp = [γ], entonces
Dvp (f · g) = dtd |t=0 ((f · g) ◦ γ)(t) = dtd |t=0 ((f ◦ γ) · (g ◦ γ))(t) =
( dtd |t=0 (f ◦ γ)(t)) · g(γ(0)) + f (γ(0)) · ( dtd |t=0 (g ◦ γ)(t)) =
Dvp (f ) · g(p) + f (p) · Dvp (g). 2
3.2. ESTRUCTURA DEL ESPACIO TANGENTE
55
Ahora estamos en condiciones de establecer nuestra última definición
de vector tangente.
Definición 3.1.5 Sea Q una variedad diferenciable y p ∈ Q. Un vector tangente en p a Q (como derivación) es una aplicación Dvp :
C ∞ (Q) → R tal que:
(1) Es R-lineal.
(2) Verifica la regla de Leibniz del producto en p.
Observaciones:
(1) Obviamente, cada vector tangente según las anteriores definiciones proporciona un vector tangente como derivación. Más aún,
el recı́proco también es cierto. Esto es, si tenemos un vector tangente como derivación vp = Dvp entonces existe un único vector
tangente [γ] tal que1 :
Dvp (f ) = vp (f ) =
d
|t=0 (f ◦ γ)(t) ∀f ∈ C ∞ (Q).
dt
(2) Si dos funciones f , g coinciden en un entorno V de p se puede
demostrar que Dvp f = Dvp g. En consecuencia, un vector tangente en p como derivación también proporciona una aplicación
C ∞ (V ) → R, R-lineal y que verifica la regla del producto, para
todo entorno V de p.
Esta tercera definición de vector tangente a p es la más abstracta de
las tres, aunque también la más cómoda desde el punto de vista puramente matemático. En adelante diremos que “vp es un vector tangente
a p” y usaremos cualesquiera de las tres definiciones, según conveniencia.
3.2.
Estructura del espacio tangente
En adelante denotaremos por Tp Q el conjunto de todos los vectores
tangentes en p a Q, y lo llamaremos espacio tangente en p a Q.
1
Véase [O’N, Capı́tulo 1]; en la próxima sección veremos explı́citamente cómo
un vector tangente como derivación puede expresarse por coordenadas o como clase
de equivalencia de curvas.
56
3.2.1.
CAPÍTULO 3. ESPACIO TANGENTE
Vectores tangentes inducidos por los entornos
coordenados
Sea Q una variedad n-dimensional y consideremos un punto p ∈
Q. Existe una manera natural de asociar a cada entorno coordenado
(U, ϕ = (q 1 , . . . , q n )) n vectores tangentes en p a Q. En efecto, fijado
i ∈ {1, . . . , n} consideremos el vector ei = (0, . . . , 1(i) , . . . , 0) ∈ Rn .
Definimos la recta ri :
ri : R → Rn
t 7→ ϕ(p) + t · ei .
A continuación, tomemos la preimagen por ϕ de la recta ri anterior:
γi :] − ², ²[ → Q
t 7→ ϕ−1 (ϕ(p) + t · ei ).
Obtenemos ası́ n vectores tangentes en p, [γi ], i = 1, . . . , n, para cada
entorno coordenado. Observemos que
d
d
|t=0 (ϕ ◦ γi )(t) =
|t=0 (ϕ(p) + t · ei ) = ei .
dt
dt
Es decir, el vector de Rn asociado al vector tangente por coordenadas
[γi ] mediante (U, ϕ) vuelve a ser ei (véase la Figura 12).
Figura 12
Observemos además que en este caso la derivación asociada a vp ≡ [γi ]
es
Dvp : C ∞ (Q) → R
∂(f ◦ϕ−1 )
∂f
(ϕ(p)).
f 7→ ∂q
i (p) :=
∂xi
3.2. ESTRUCTURA DEL ESPACIO TANGENTE
57
En efecto:
Dvp (f ) = dtd |t=0 (f ◦ γi )(t) = dtd |t=0 (f ◦ ϕ−1 ) ◦ (ϕ ◦ γi )(t)
P
◦ϕ−1 )
= nj=1 ∂(f∂x
(ϕ(p)) · dtd |t=0 q j ◦ ϕ−1 (ϕ(p) + tei )
j
Pn ∂(f ◦ϕ−1 )
◦ϕ−1 )
(ϕ(p)),
= j=1 ∂xj (ϕ(p)) · dtd |t=0 (q j (p) + δij t) = ∂(f∂x
i
donde recordemos que q j = xj ◦ ϕ y δij es la delta de Kronecker. Esto
justifica que de ahora en adelante sigamos la notación Dvp ≡ ∂q∂ i |p
siempre que vp = [γi ].
En resumen, fijado un entorno coordenado (U, ϕ = (q 1 , . . . , q n ))
hemos obtenido n derivaciones en p,
∂
∂q i
|p : C ∞ (Q) → R
∂f
f 7→ ∂q
i (p)
i = 1, . . . , n.
Ejemplo. Consideremos la aplicación f : R2 → R, f (x, y) = x2 +
y. Consideremos coordenadas polares (U, ϕ = (ρ, θ)) con U = R2 −
{(x, 0) : x ≤ 0}. Si tomamos p = (0, 1) entonces ϕ(p) = (ρ(p), θ(p)) =
∂
∂
(1, π/2). Por tanto, para los vectores tangentes ∂ρ
|p y ∂θ
|p tenemos:
∂
|
∂ρ p
∂
∂θ
∂
(f ) = ∂f
(p) ∂ρ
|(1,π/2) (ρ2 cos2 θ + ρsenθ)
∂ρ
= (2ρ cos2 θ + senθ) |(1,π/2) = 1.
∂
|p (f ) = ∂f
(p) = ∂θ
|(1,π/2) (ρ2 cos2 θ + ρsenθ)
∂θ
2
= (−ρ sen2θ + ρ cos θ) |(1,π/2) = 0.
Ejercicio. Para Q = R2 y coordenadas usuales (x, y), compruébese
∂
∂
que ∂x
|p y ∂y
|p coinciden con las derivadas parciales usuales en p.
3.2.2.
Estructura de espacio vectorial de Tp Q
Cuando estudiamos el concepto de vector tangente por coordenadas
llamamos la atención sobre la estructura de espacio vectorial de dimensión n del espacio tangente. La estructura de espacio vectorial resulta
también obvia (no tanto su dimensionalidad) tratando los vectores tangentes como derivaciones. En efecto, si vp , wp ∈ Tp Q entonces la suma
vp + wp : C ∞ (Q) → R
f 7→ vp (f ) + wp (f ),
58
CAPÍTULO 3. ESPACIO TANGENTE
y el producto por un escalar λ ∈ R
λ · vp : C ∞ (Q) → R
f 7→ λ · vp (f ),
verifica todas las propiedades de espacio vectorial. El siguiente resultado permite trabajar con facilidad en coordenadas.
Proposición 3.2.1 Para cada entorno coordenado (U, ϕ = (q 1 , . . . , q n ))
de p ∈ Q se tiene que Bpϕ = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) es una base de Tp Q.
P
Además, si vp ∈ Tp Q entonces vp = ni=1 vp (q i ) ∂q∂ i |p .
Demostración. Ya vimos que para cada entorno coordenado (U, ϕ) se
tiene el isomorfismo natural


v1


vp 7→  ...  ∈ Rn .
vn
En particular, ∂q∂ i |p → ei ∈ Rn . Por tanto, Bpϕ se aplica en la base usual
P
de Rn y, es entonces una base. Más aún, si vp = ni=1 v i ∂q∂ i |p entonces
j
vp (q ) =
n
X
i=1
v
i ∂q
j
∂q i
(p) =
n
X
v i δij = v j .
i=1
2
En particular, si (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) es otro entorno coordenado
de p ∈ Q entonces ∂q∂ j |p se puede escribir como combinación lineal de
elementos de la base Bpϕ̃ = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ). Con más precisión:
n
X ∂ q̃ i
∂
∂
|
=
(p) i |p .
p
j
j
∂q
∂q
∂ q̃
i=1
(3.5)
Observaciones:
(1) La expresión (3.5) se reduce a aplicar la regla de la cadena evaluando en la correspondiente función. En efecto,
∂
∂q j
−1
−1
−1
∂(f ◦ϕ )
∂f
|p (f ) = ∂q
(ϕ(p)) = ∂(f ◦ϕ̃ ∂x◦jϕ̃◦ϕ ) (ϕ(p))
j |p =
∂xj
Pn ∂ q̃i
P
◦ϕ̃−1
∂ q̃ i
∂
(ϕ̃(p)) ∂q
= ni=1 ∂f∂x
i
j (p) =
i=1 ∂q j (p) ∂ q̃ i |p (f ).
(3.6)
3.2. ESTRUCTURA DEL ESPACIO TANGENTE
59
(2) También seguiremos la notación v i = q̇ i (vp )(= vp (q i )). Por tanto,
i
q̃˙ (vp ) =
n
X
∂ q̃ i
(p) · q̇ j (vp )
j
∂q
j=1
(3.7)
(o, más brevemente, si se da por supuesto el vector vp entonces
P
i
∂ q̃ i j
q̃˙ = nj=1 ∂q
j q̇ ).
Ejemplos:
(1) En R2 consideramos las coordenadas usuales ϕ = (x, y). Fijemos
p0 ∈ R2 y consideremos la base del espacio tangente en p0 Bp0 =
∂
∂
( ∂x
|p0 , ∂y
|p0 ). Tenemos pues las aplicaciones
C ∞ (R2 ) → R,
f 7→
∂f
(p )
∂x 0
|p0 : C ∞ (R2 ) → R,
f 7→
∂f
(p0 ).
∂y
∂
| :
∂x p0
∂
∂y
Además, dado vp0 ∈ Tp0 R2 se tiene
vp0 = a
∂
∂
|p0 +b
|p
∂x
∂y 0
con
a = vp0 (x) ≡ ẋ(vp0 )
b = vp0 (y) ≡ ẏ(vp0 ).
Se puede establecer por tanto un isomorfismo canónico
ip0 : R2 → Tp0 R2
∂
∂
(a, b) 7→ (a ∂x
|p0 +b ∂y
|p0 ).
Obviamente, esto es extensible a Rn . De hecho, podemos trabajar
indistintamente con Rn o con su tangente Tp0 Rn vı́a el isomorfismo canónico ip0 anterior.
Más aún, en todo espacio vectorial V (R) existe una identificación
natural entre Tv V y V , ∀v ∈ V . En efecto, fijado v ∈ V , para
cada w ∈ V se tiene una curva t 7→ v + tw que define un vector
tangente wv ∈ Tv V . Se tiene entonces un isomorfismo natural
Tv V → V
wv 7→ w.
Sin embargo, nada similar a estas identificaciones ocurre en variedades diferenciables arbitrarias.
60
CAPÍTULO 3. ESPACIO TANGENTE
(2) Si tomamos coordenadas polares (ρ, θ) en un abierto U de R2 que
contenga a p0 = (ρ0 cos θ0 , ρ0 senθ0 ) ∈ R2 y consideramos la base
∂
∂
( ∂ρ
|p0 , ∂θ
|p0 ) del espacio tangente Tp0 R2 tenemos
∂
| = ∂x
| ∂ |
∂ρ p0
∂ρ p0 ∂x p0
+ ∂y
|
∂ρ p0
∂
∂y
∂
∂
|p0 = cos θ0 ∂x
|p0 +senθ0 ∂y
|p0
∂
∂θ
+ ∂y
|
∂θ p0
∂
∂y
∂
∂
|p0 = −ρ0 senθ0 ∂x
|p0 +ρ0 cos θ0 ∂y
|p0 .
|p0 =
∂x
| ∂ |
∂θ p0 ∂x p0
∂
∂
∂
|p0 , ∂θ
|p0 ) es una base de Tp0 R2 . Si escribimos êρ = ∂ρ
|p0 ,
Ası́, ( ∂ρ
1 ∂
êθ = ρ0 ∂θ |p0 e identificamos (êρ , êθ ) vı́a ip0 con una base de R2 ,
esta base es ortonormal para el producto euclı́deo usual.
∂
∂
Ejercicio. Calcular las coordenadas del vector vp = v 1 ∂x
|p +v 2 ∂y
|p ∈
2
∂
∂
Tp R en la base ( ∂ρ |p , ∂θ |p ).
3.3.
Variedad tangente
Sea Q una variedad diferenciable de dimensión n. Definimos el espacio o variedad tangente a Q como T Q = ∪p∈Q Tp Q. Consideremos la
proyección π : T Q → Q, π(vp ) = p. Nuestro objetivo es demostrar que
cada entorno coordenado de Q induce un entorno coordenado en T Q de
modo que T Q resulta ser, de manera natural, una variedad diferenciable de dimensión 2n. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado
de Q. Definimos
ϕT : π −1 (U )(⊆ T Q) → ϕ(U ) × Rn (⊆ Rn × Rn ≡ R2n )
vp 7→ (ϕ(p), (vp (q 1 ), . . . , vp (q n )))
≡ ((q 1 (p), . . . , q n (p)), (q̇ 1 (vp ), . . . , q̇ n (vp )).
(3.8)
Claramente, ϕT es biyectiva. Consideraremos en T Q la única topologı́a
tal que cada ϕT es un homeomorfismo, esto es, la que admite como
base topológica los subconjuntos de T Q que se pueden escribir como
(ϕT )−1 (V ), para algún ϕT construido como (3.8) y algún abierto V
de ϕ(U ) ⊆ Rn . Esta topologı́a resulta ser Hausdorff y ANII, siendo
además T Q localmente homeomorfo a R2n . Ası́, T Q es una variedad
topológica de dimensión 2n, donde cada (π −1 (U ), ϕT ) es obviamente
un entorno coordenado. Si ahora tomamos otro entorno coordenado
(Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) de Q, y definimos la correspondiente aplicación
ϕ̃T : π −1 (Ũ ) → ϕ̃(Ũ ) × Rn (⊂ R2n ),
3.3. VARIEDAD TANGENTE
61
se tiene ϕ̃T ◦ (ϕT )−1 : ϕ(U ∩ Ũ ) × Rn → ϕ̃(U ∩ Ũ ) × Rn
1
n
((q 1 , . . . , q n ), (q̇ 1 , . . . , q̇ n )) 7→ ((q̃ 1 (q), . . . , q̃ n (q)), (q̃˙ (q, q̇), . . . , q̃˙ (q, q̇)),
donde q = (q 1 , . . . , q n ), q̇ = (q̇ 1 , . . . , q̇ n ). Obviamente, ϕ̃T ◦ (ϕT )−1 es
i
diferenciable y q̃˙ (q, q̇) viene determinado por (3.7). En conclusion,
Teorema 3.3.1 T Q es una variedad diferenciable de dimensión 2n.
Observación. T Q es localmente difeomorfo a Q × Rn ; de hecho, dos
variedades arbitrarias de la misma dimensión k son localmente difeomorfas (por ser difeomorfas a Rk localmente). Sin embargo, no son
necesariamente globalmente difeomorfos.
Ejemplos:
(1) Consideremos R2 y T R2 . La aplicación
R2 × R2 → T R2
∂
∂
(x0 , y0 , a, b) 7→ a ∂x
|(x0 ,y0 ) +b ∂y
|(x0 ,y0 )
es un difeomorfismo entre R4 y T R2 . Análogamente, la aplicación
V × V → TV
(v, w) 7→ (v, α0 (0)),
con α(t) = v + tw, determina un difeomorfismo entre V × V y
TV .
(2) Justifiquemos que también T S 1 es difeomorfo a S 1 × R. Consideremos primero el vector tangente en cada punto de R2
−y
∂
∂
|(x,y) +x
|(x,y) .
∂x
∂y
Este vector coincide con el vector coordenado
∂
∂
∂
|(x,y) = −ρsen(θ(x, y))
|(x,y) +ρ cos(θ(x, y))
|(x,y)
∂θ
∂x
∂y
en el dominio de definición de las polares. De ahı́ que, sin posibil∂
idad de confusión, podamos denotarlo ∂θ
|(x,y) para todo (x, y) ∈
2
R −{(0, 0)}. En particular, sobre todo punto de S 1 , podemos ver
62
CAPÍTULO 3. ESPACIO TANGENTE
∂
∂θ
|(x,y) como la clase de equivalencia de la curva θ 7→ (cos(θ +
θ0 ), sen(θ + θ0 )) ∈ S 1 , con x = cos θ0 , y = senθ0 . Fácilmente se
comprueba entonces que
S1 × R → T S1
∂
((x, y), a) 7→ a ∂θ
|(x,y)
es un difeomorfismo.
(3) Sin embargo, la variedad T S 2 , tangente a la esfera bidimensional
S 2 , no es difeomorfa a S 2 × R2 (véase la Sección 5.3).
Por último, señalemos que cada curva γ(t) en Q determina un vector tangente [γ] ≡ γ 0 (0) en γ(0) o, con más generalidad, un vector
tangente γ 0 (t0 ) en cada punto t0 de su dominio de definición (formalmente, γ 0 (t0 ) := [γ(t + t0 ]). Ası́, cada curva γ(t) en Q genera una curva
γ 0 (t) en TQ.
3.4.
Apéndice: notas sobre Mecánica Lagrangiana
A continuación, vamos a aplicar estos conceptos al estudio de los
sistemas lagrangianos. Recordemos que para una partı́cula que describe
una curva x(t) en R3 con energı́a cinética T = (1/2)m k x0 (t) k2 y
energı́a potencial V (x(t), t), la lagrangiana se define como
1
L(x, ẋ, t) = m k ẋ k2 −V (x, t),
2
que es una función explı́cita de la posición, la velocidad y también del
tiempo t (en el caso de que lo sea V ). Si, p. ej., la trayectoria de la
partı́cula está restringida a pasar por una superficie S ⊂ R3 , es natural
pensar que el sistema “pierde un grado de libertad”, y la lagrangiana
será una función con dominio la superficie, junto con todos los planos
tangentes a ella posibles, más, eventualmente, el tiempo. Esta situación
se puede generalizar y abstraer progresivamente, lo que conduce a los
siguientes conceptos.
3.4. APÉNDICE: MECÁNICA LAGRANGIANA
3.4.1.
63
Lagrangianas
Con bastante generalidad, se postula que el espacio de configuración de un sistema mecánico es una variedad diferenciable arbitraria
Q siendo entonces la lagrangiana una función sobre T Q o, con más
generalidad (lagrangianas dependientes del tiempo),
L : T Q × R → R,
donde la coordenada natural de R en T Q × R o “tiempo” se usará para
parametrizar las curvas bajo consideración (fórmula (3.9)). El dominio
de definición de la lagrangiana es pues una variedad producto N =
T Q × R, donde usualmente se trabaja con coordenadas tipo (q, q̇, t),
esto es, coordenadas (q, q̇) ≡ ϕT como en (3.8) junto a la coordenada
usual de R.
Tiene sentido pues considerar ∂L
, ∂L y ∂L
. Sea
∂q ∂ q̇
∂t
γ:I⊂R →Q
t 7→ γ(t)
una curva diferenciable (tomando coordenadas podemos escribir t →
q(t)). Esta curva induce a su vez curvas en T Q y en N = T Q × R:
I ⊂ R → TQ
t 7→ γ 0 (t)
I ⊂ R → TQ × R
t 7→ (γ 0 (t), t).
(3.9)
En coordenadas esta última aplicación se suele escribir (q(t), q̇(t), t),
donde cada q̇ i (t) es igual a la componente i-ésima del vector tangente
γ 0 (t), que coincide con la derivada de q i (t) ≡ q i (γ(t)) en cada t ∈ I,
dq i
(t) ∀t ∈ I.
dt
Obsérvese que, en general, si ρ(t) = (q(t), q̇(t), t) es una curva definida
directamente en N = T Q × R entonces se tiene
q̇ i (t) =
=
(t)
ρ̇(t)(L) = d(L◦ρ)
dt
dq̇ i
∂L
∂L
i=1 ( ∂q i (q(t), q̇(t), t) dt (t) + ∂ q̇ i (q(t), q̇(t), t) dt (t) +
Pn
dq i
∂L
(q(t), q̇(t), t)).
∂t
Pero sólo cuando la curva ρ(t) es del tipo ρ(t) = γ 0 (t) para alguna
curva γ(t) de Q se puede escribir
dq̇ i
d2 q i
dq i
= q̇ i (t);
= 2.
dt
dt
dt
64
3.4.2.
CAPÍTULO 3. ESPACIO TANGENTE
Curvas crı́ticas de la acción
Es sabido que, en la deducción variacional de las Recuaciones de
t
Euler-Lagrange, se considera el funcional acción A(γ) = t01 L(γ 0 (t), t)dt
sobre curvas diferenciales γ : [t0 , t1 ] → Q. La compacidad de [t0 , t1 ]
(concretamente, la existencia de un “número de Lebesgue”) permite
hallar un número finito de entornos coordenados (U (α) , q (α) ) y una partición del intervalo t0 = s0 < s1 < . . . < sk = t1 tal que γ([si , si+1 ]) ⊂
U (αi ) para algún αi . Ası́, tiene sentido escribir
Z t1
k Z si
X
0
A(γ) =
L(γ (t), t)dt =
L(q (αi ) (t), q̇ (αi ) (t), t)dt
t0
i=1
si−1
para poder deducir expresiones manejables en coordenadas.
Tı́picamente, en Mecánica Lagrangiana se consideran curvas que
conectan dos puntos fijos p0 , p1 ∈ Q, y que son crı́ticas para el funcional
acción A en el siguiente sentido. Sea γ una curva que conecta p0 con
p1 ,
γ : [t0 , t1 ] → Q,
γ(t0 ) = p0 , γ(t1 ) = p1 .
Una variación de γ es una aplicación diferenciable
] − ², ²[×[t0 , t1 ] → Q,
(s, t) 7→ γs (t)
para algún ² > 0, que verifica γ0 (t) = γ(t), ∀t ∈ [t0 , t1 ] (en ocasiones,
también conviene permitir que el intervalo de definición de γs dependa
de s, por lo que el dominio de la variación se generaliza subsecuentemente). La variación se llama de extremos fijos si
γs (t0 ) = p0 ,
γs (t1 ) = p1 ,
∀s ∈] − ², ²[.
Para cada s fijo, la curva t 7→ γs (t) es una curva longitudinal de la
variación. Para cada t fijo, la curva s 7→ γs (t) es una curva transversal;
esta curva determina en s = 0 un vector tangente V (t) para cada t. A
la curva en T Q
t 7→ V (t)
se le llama campo variacional o variación infinitesimal de γ. Obsérvese
que la variación de γ en Q induce una variación de γ 0 en T Q:
] − ², ²[×[t0 , t1 ] → T Q,
(s, t) 7→ γs0 (t),
(3.10)
3.4. APÉNDICE: MECÁNICA LAGRANGIANA
65
donde γs0 (t) denota al vector tangente en γs (t) determinado por la
curva longitudinal γs (a su vez, esta variación induce trivialmente una
en T Q × R). Se dice que γ es una curva crı́tica para A si para toda
variación de γ en el conjunto de curvas que se esté considerando se
tiene
dA(γs )
|s=0 = 0.
ds
No es difı́cil demostrar que las curvas crı́ticas para variacioness de extremos fijos coinciden con las que, escritas en cualesquiera coordenadas,
satisfacen las ecuaciones de Euler-Lagrange:
d
dt
µ
∂L
∂ q̇ i
¶
−
∂L
= 0.
∂q i
Ejercicios
Ejercicio 1. Razonar por qué se puede identificar Tp R2 con R2 , ∀ p ∈
R2 .
Ejercicio 2. Calcúlese una base de T(1,1,2) Q, siendo Q el paraboloide
dado por la gráfica de la función z = x2 + y 2 .
Ejercicio 3. Calcúlese una base de T( √1 ,0,√2) Q, siendo Q el elipsoide
2
de ecuación
2
x2 + y 2 + z4 = 1.
Ejercicio 4. Sea Q una variedad, p ∈ Q y v ∈ Tp Q. Demuéstrese:
(i) Si f ∈ C ∞ (Q) es constante entonces v(f ) = 0.
(ii) Si f, g ∈ C ∞ (Q) coinciden en un entorno de p entonces v(f ) =
v(g).
Ejercicio 5. Se consideran las coordenadas cilı́ndricas definidas en
[Tema 2, Apéndice 2]. Escrı́banse ∂/∂ρ|p , ∂/∂θ|p y ∂/∂z|p como combinación lineal de la base de Tp R3 inducida por las coordenadas usuales
(cartesianas) de R3 .
Ejercicio 6. Sean U = {(x, y, z) : z > 0} y f : U → R la aplicación
definida por f (x, y, z) = 3 x + y/z. Calcular qué valor toman sobre
f las derivaciones asociadas a las coordenadas cilı́ndricas en el punto
p = (1, 1, 3).
66
CAPÍTULO 3. ESPACIO TANGENTE
Ejercicio 7. Sean p = (3, 4, 2) ∈ R3 y vp = −∂x + 3 ∂y − 2 ∂z ∈ Tp R3 .
Hállese la expresion de vp en coordenadas cilı́ndricas.
Ejercicio 8. Dado p = (0, 1, 1) ∈ R3 , se considera vp = −2 ∂ρ + ∂θ −
∂z ∈ Tp R3 . Calcúlese la expresión de vp en coordenadas cartesianas.
Ejercicio 9. Sea F : R3 −→ R2 la aplicación definida por
F (x, y, z) = (x2 + y 2 , z 2 ).
Discutir si c = (1, 1) es un valor regular de F , y en tal caso, determinar
la dimensión de la subvariedad regular Q = F −1 (c), y hallar T(1,0,1) Q.
Ejercicio 10. Dada la aplicación F : R4 −→ R3 , definida por
F (x, y, z, t) = (2 x + y, t, z),
estudiar si Q = F −1 (c) es una subvariedad regular de R4 , con c =
(0, 1, 1), y en caso afirmativo, calcular T(1,−2,1,1) Q.
Ejercicio 5. Idem para las coordenadas esféricas ϕ = (r, θ, φ) definidas
en ese mismo apéndice.
Capı́tulo 4
Aplicaciones diferenciables
entre variedades
En este capı́tulo pretendemos generalizar el concepto de diferencial
de una aplicación diferenciable entre espacios euclı́deos a aplicaciones
entre variedades arbitrarias. Para ello partiremos del conocimiento previo de algunas nociones sobre el espacio dual, que se desarrollan en el
Apéndice. Más aún, definiremos las variedades cotangentes, que sirven
de dominio natural a la Mecánica Hamiltoniana, y generalizaremos
algunos teoremas fundamentales sobre aplicaciones diferenciables.
Recordemos que, dada una función diferenciable de dos variables reales
f : R2 → R, el plano tangente a su gráfica en un punto (x0 , y0 , f (x0 , y0 ))
admite la expresión
z − z0 =
∂f
∂f
(x0 , y0 )(x − x0 ) +
(x0 , y0 )(y − y0 ).
∂x
∂y
Este plano se suele escribir como una diferencial en (x0 , y0 ) ∈ R2 ,
dz ≡ (df )(x0 ,y0 ) =
∂f
∂f
(x0 , y0 )dx +
(x0 , y0 )dy.
∂x
∂y
Esta diferencial puede interpretarse como una función lineal sobre
67
68
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
T(x0 ,y0 ) R2 . En efecto, tomando un vector tangente arbitrario
v = v1
∂
∂
|(x0 ,y0 ) +v 2
|(x ,y ) ∈ T(x0 ,y0 ) R2
∂x
∂y 0 0
se tiene
(df )(x0 ,y0 ) (v) = v 1
∂f
∂f
(x0 , y0 ) + v 2 (x0 , y0 ) ∈ R,
∂x
∂y
véase la Figura 13.
Figura 13
En la Sección 4.1 se va a extender este punto de vista a cualquier
función real sobre Q lo que, en particular, permitirá definir la variedad
cotangente, Sección 4.2. En la Sección 4.3 extenderemos el concepto de
diferencial a cualquier aplicación entre dos variedades.
4.1. DIFERENCIAL DE UNA FUNCIÓN
69
4.1.
Diferencial de una función sobre una
variedad
4.1.1.
Concepto
Sea vp = [γ] un vector tangente a Q en p. Recordemos que para
f ∈ C ∞ (Q) habı́amos definido la derivada de f en la dirección de
vp como vp (f ) = dtd |t=0 (f ◦ γ) ∈ R. En consecuencia, para cada
f ∈ C ∞ (Q) se tiene la aplicación
dfp : Tp Q → R
vp 7→ vp (f )
(4.1)
a la que denominaremos diferencial de f en p. Como muestra la siguiente proposición, la aplicación dfp es una forma lineal sobre Tp Q
(véase (1) del Apéndice). En efecto,
Proposición 4.1.1 La aplicación dfp definida en (4.1) es lineal, esto
es, dfp ∈ Tp Q∗ .
Demostración.
dfp (avp +bwp ) = (avp +bwp )(f ) = avp (f )+bwp (f ) = a·dfp (vp )+b·dfp (wp )
para todo vp , wp ∈ Tp Q y todo a, b ∈ R. 2
Ası́, la aplicación dfp extiende a la diferencial usual de funciones
reales, y representa la mejor aproximación lineal a f en p.
4.1.2.
Expresión en coordenadas
A continuación estudiaremos bases de Tp Q∗ asociadas a entornos
coordenados, y determinaremos la expresión en coordenadas de la diferencial de f : Q → R.
Fijemos un entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de la variedad
Q. La base canónica de Tp Q asociada a dicho entorno es Bpϕ = ( ∂q∂ 1 |p
, . . . , ∂q∂n |p ).
Proposición 4.1.2 La base dual de Bpϕ (véase (2) del Apéndice) es
Bpϕ∗ = (dqp1 , . . . , dqpn ).
70
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
Demostración. Obsérvese en primer lugar que q i : U ⊆ Q → R es, obviamente, diferenciable, por lo que, efectivamente dqpi define un elemento
de Tp Q∗ . El resultado se deduce por tanto de:
dqpj (
∂q j
∂
|
)
=
(p) = δij
p
∂q i
∂q i
∀i, j ∈ {1, . . . , n}.
2
Podemos ahora considerar la matriz de dfp asociada a Bpϕ , esto es,
(siguiendo el Apéndice), las coordenadas de dfp en Bpϕ∗ . Usando que
∂
∂f
|p (f ) = i (p) ∀i ∈ {1, . . . , n}
i
∂q
∂q
dicha matriz queda:
µ
¶
∂
∂
M (dfp , {1} ←
= dfp ( 1 |p ), . . . , dfp ( n |p )
∂q
∂q
µ
¶
∂f
∂f
=
(p), . . . , n (p) .
∂q 1
∂q
Bpϕ )
Ası́,
n
X
∂f
dfp =
(p)dqpi ,
i
∂q
i=1
(4.2)
y si vp ∈ Tp Q entonces
n
n
X
X
∂f
∂f
i
dfp (vp ) =
(p) · dqp (vp ) =
(p) · vpi ,
i
i
∂q
∂q
i=1
i=1
donde vp =
4.1.3.
Pn
i=1
vpi ∂q∂ i |p .
Cambio de coordenadas
Tomemos ahora otro sistema de coordenadas (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n ))
alrededor de p. Para estas coordenadas se verifica igualmente
dfp =
n
X
∂f
(p)dq̃pi .
i
∂
q̃
i=1
4.2. EL ESPACIO COTANGENTE
71
Ahora bien, por (4.2) el cambio de base entre Bpϕ∗ y Bpϕ̃∗ queda (compárese con el Apéndice (3)):
dqpi =
n
X
∂q i
(p)dq̃pj .
j
∂
q̃
j=1
En consecuencia, de la anterior ecuación se tiene fácilmente la siguiente relación entre las parciales de f con respecto a las distintas coordenadas:
Pn ∂qi
Pn ∂qi
∂f
∂
∂
∂
(p)
=
df
(
|
)
=
df
(
(p)
|
)
=
p
p
p
p
j
j
j
i
i=1 ∂ q̃
i=1 ∂ q̃ j (p)dfp ( ∂q i |p )
∂ q̃
∂q
Pn ∂ q̃ ∂qi
∂f
= i=1 ∂ q̃j (p) ∂q
i (p).
Se obtiene ası́ la relación entre las coordenadas de dfp en Bpϕ̃∗ y Bpϕ∗ .
4.2.
El espacio cotangente
El desarrollo de la sección anterior es aplicable a cualquier forma lineal sobre Tp Q. Ası́, si fijamos un entorno coordenado (U, ϕ =
(q 1 , . . . , q n )) de p ∈ Q y consideramos las bases Bpϕ y Bpϕ∗ entonces a
cada φ ∈ Tp Q∗ le corresponden n números reales (b1 , . . . , bn ) tales que
φ=
n
X
bi · dqpi .
i=1
Estos n números reales son las coordenadas de φ en Bpϕ∗ y vienen dados
por la expresión
bi = φ(
∂
|p ) ∀i ∈ {1, . . . , n}.
∂q i
Si tomamos otro entorno coordenado (Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) la forma
lineal φ tendrá coordenadas (b̃1 , . . . , b̃n ), deduciéndose la relación
b̃j =
n
X
∂q i
(p)bi .
j
∂
q̃
i=1
(4.3)
Como ocurrı́a con los vectores tangentes, esta relación permite definir
cada elemento del espacio dual Tp Q∗ por coordenadas como una n-upla
72
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
asignada a cada entorno coordenado de p que se transforma según (4.3)
frente a cambios de coordenadas.
Análogamente al caso del espacio tangente, llamamos espacio o
variedad cotangente de Q a T Q∗ = ∪p Tp Q∗ . Este espacio también se
considera dotado de una estructura natural de variedad diferenciable,
definiéndose un atlas diferenciable como sigue. Sea π : T Q∗ → Q,
π(αp ) = p, la proyección canónica, y (U, ϕ) un entorno coordenado de
Q. Definimos
ϕC : π −1 (U ) → ϕ(U ) × Rn (⊆ R2n )
αp 7→ (q 1 (p), . . . , q n (p), p1 (αp ), . . . , pn (αp )),
P
donde pi (αp ) = αp ( ∂q∂ i |p ), esto es, αp = ni=1 pi (αp )dqpi .
(4.4)
Nota. En Mecánica Hamiltoniana se parte de la variedad de configuración Q, de su espacio cotangente T Q∗ (o espacio de fases) y de una
hamiltoniana H : T Q∗ × R → R. A las coordenadas pi se les llama
momentos generalizados. Análogamente al caso lagrangiano (Sección
3.4), en Mecánica Hamiltoniana se pueden calcular curvas crı́ticas de
la hamiltoniana (u otros funcionales relacionados con ella) para diversos tipos de variaciones. Esto es, curvas en T Q∗
ρ : [t0 , t1 ] → T Q∗ , ρ(t) = (q(t), p(t))
tales que para cualquier variación
] − ², ²[×[t0 , t1 ] → T Q∗
(s, t) 7→ ρs (t)
(en la clase de curvas que se considere) la función
µ Z t1
¶
Z t1
A(ρs ) =
H(ρs (t), t)dt ≡
H(qs (t), ps (t), t)dt
t0
t0
verifique dA
| = 0. Pero, a diferencia del caso lagrangiano, tanto la
ds s=0
curva ρ(t) como la variación ρs (t) se toman directamente en T Q∗ , esto
es, no se construyen a partir de curvas de Q (compárese con (3.10)).
La consecuencia de esta “mayor libertad” en las variaciones, es que las
ecuaciones de Hamilton
∂H
dq i
(t) =
(q(t), p(t), t);
dt
∂pi
dpi
∂H
(t) = − i (q(t), p(t), t),
dt
∂q
(4.5)
4.3. DIFERENCIAL DE UNA APLICACIÓN
73
(que caracterizan localmente a curvas extremales apropiadas), son 2n
ecuaciones de primer orden –en lugar de n ecuaciones de segundo, como
en el caso lagrangiano.
4.3.
Diferencial de una aplicación entre
variedades
En esta sección introduciremos el concepto de diferencial de una
aplicación entre dos variedades arbitrarias. Sean Q, Q0 dos variedades
diferenciables y F : Q → Q0 una aplicación diferenciable entre ellas.
Es claro que si vp = [γ] ∈ Tp Q entonces [F ◦ γ] ∈ TF (p) Q0 . Pues bien,
llamamos diferencial de F en p a la aplicación
dFp : Tp Q → TF (p) Q0
[γ] 7→ [F ◦ γ],
véase la Figura 14.
Figura 14
Observación. Para comprobar que esta definición es consistente, debemos tener en cuenta lo siguiente:
74
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
(1) La definición es independiente de la curva de la clase [γ] que se
elija. En efecto, supongamos que m y n son las dimensiones de
Q y Q0 , respectivamente. Sean (U, ϕ = (q 1 , . . . , q m )) y (U 0 , ϕ0 =
(q 01 , . . . , q 0n )) entornos coordenados alrededor de p y de F (p),
respectivamente. Si vp = [γ] ∈ Tp Q entonces
d
|
dt t=0
(ϕ0 ◦ F ◦ γ)(t) = dtd |t=0 (ϕ0 ◦ F ◦ ϕ−1 ) ◦ (ϕ ◦ γ)(t)
P
∂(ϕ0 ◦F ◦ϕ−1 )
= m
(ϕ(p)) dtd |t=0 (q j ◦ γ)(t).
j=1
∂xj
(4.6)
d
Ahora bien, si γ ∼ ρ (esto es, vp = [γ] = [ρ]) entonces dt |t=0
(q j ◦ γ)(t) = dtd |t=0 (q j ◦ ρ)(t) ∀j. En consecuencia, de (4.6)
deducimos que la definición de diferencial sólo depende del vector
vp y no del representante de la clase.
(2) Esta definición es consistente con la definición de diferencial que
vimos para una función real f : Q → R. En efecto, esto se ve
fácilmente gracias a la identificación entre R y Tf (p) R, ya que
dfp (vp ) = vp (f ) =
d
|t=0 (f ◦ γ) ∈ Tf (p) R ≡ R.
dt
De ahora en adelante usaremos la notación
q 0i ◦ F ≡ F i
1
n
∂
|
(ϕ0 ◦ F ◦ ϕ−1 ) = ( ∂F
, . . . , ∂F
)(p).
∂xj ϕ(p)
∂q j
∂q j
Con esta notación dFp (vp ) adopta la expresión:
à m
!
n
X
X ∂F i
∂
dFp (vp ) =
(p)v j
| ,
j
0i F (p)
∂q
∂q
i=1
j=1
P
j ∂
donde vp = m
j=1 v ∂q j |p . Esto es, matricialmente las coordenadas de
0
dFp (vp ) en la base Bpϕ = ( ∂q∂01 |p , . . . , ∂q∂0n |p ) son

 ∂F 1
 
∂F 1
1
.
.
.
v
1
m
∂q
∂q
 ..
..  ·  ..  .
..
(4.7)
 .
.
.   . 
m
∂F n
∂F n
v
. . . ∂qm
∂q 1
p
De hecho, (4.7) puede considerarse como definición de dFp , aplicable
directamente cuando los vectores tangentes se dan por coordenadas.
4.3. DIFERENCIAL DE UNA APLICACIÓN
75
De todo lo anterior resulta inmediato que dFp : Tp Q → TF (p) Q0 es
lineal. La siguiente proposición relaciona los vectores tangentes dFp (vp )
y vp vistos como derivaciones.
Proposición 4.3.1 Si vp ∈ Tp Q y F : Q → Q0 es una aplicación
diferenciable entonces
dFp (vp ) : C ∞ (Q0 ) → R
g 7→ vp (g ◦ F ).
(4.8)
Demostración. Si vp = [γ] entonces dFp (vp ) = [F ◦ γ]. Por tanto,
dFp (vp )(g) =
d
d
|t=0 g ◦ (F ◦ γ) =
|t=0 (g ◦ F ) ◦ γ = vp (g ◦ F ). 2
dt
dt
Figura 15
Obviamente, (4.8) también puede tomarse como definición de dFp ,
aplicable directamente a vectores dados como derivaciones.
Ejemplos:
(1) Para una función diferenciable F : Rm → Rn , si identificamos los
espacios tangentes Tp Rm , TF (p) Rn con Rm , Rn (véase (4.7)), respectivamente, entonces la definición de diferencial (dF )p coincide
con la usual entre Rm y Rn .
76
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
(2) Consideremos la circunferencia S 1 ⊂ R2 ≡ C (véase la Sección
3.3) y la aplicación diferenciable F : S 1 → S 1 , F (z) = z 2 , ∀z ∈ C.
Para calcular dFp0 , p0 ∈ S 1 , tomamos como coordenada en torno
a p0 el “ángulo” θ y consideramos la curva θ → (cos θ, senθ) ∈
S 1 ⊂ R2 . Si θ0 es tal que p0 = (cos θ0 , senθ0 ) entonces:
dFp0 (
∂
d
|p0 ) =
|θ F (cos θ, senθ)
∂θ
dθ 0
d
∂
|θ0 (cos 2θ, sen2θ) = 2
|F (p0 ) ,
dθ
∂θ
donde recordemos (véase [Sección 3.3, Ejemplo (2)])
=
∂
∂
∂
|p0 = −senθ0
|p0 + cos θ0
|p .
∂θ
∂x
∂y 0
(3) Consideremos una subvariedad regular Q ⊂ Rn+p y una aplicación F : Q → Q0 que sea restricción de otra aplicación F̄ :
Rn+p → Q0 . Se verifica entonces
dFp = dF̄p |Tp Q .
Ası́, por ejemplo, la aplicación F : S 2 → S 2 , F (x) = −x es la
restricción a S 2 de la aplicación F̄ : R3 → R3 , F̄ (x) = −x. Como,
salvo identificación, dF̄p = −Id3 , se tiene
à n
!
n
X ∂
X
∂
i
dFp
a
|p = −
ai i |(−p)
i
∂x
∂x
i=1
i=1
para cualquier vector tangente
4.4.
Pn
i=1
ai ∂x∂ i |p ∈ Tp S 2 .
Teoremas fundamentales
En esta sección enunciaremos con generalidad en variedades arbitrarias algunos teoremas fundamentales relacionados con las aplicaciones diferenciables. Esencialmente, sus demostraciones se reducen a
las de los correspondientes teoremas entre espacios euclı́deos, una vez
escritos los enunciados en coordenadas.
4.4. TEOREMAS FUNDAMENTALES
77
Teorema (Regla de la cadena): Consideremos dos aplicaciones
diferenciables entre variedades F : Q → Q0 y G : Q0 → Q00 y consideremos sus respectivas diferenciales dFp : Tp Q → TF (p) Q0 y dGF (p) :
TF (p) Q0 → TG(F (p)) Q00 con p ∈ Q. Se verifica entonces:
d(G ◦ F )p = dGF (p) ◦ dFp .
Teorema de la Función Inversa: Sea F : Q → Q0 una aplicación
diferenciable y p0 ∈ Q. Supongamos que (dF )p0 : Tp0 Q → TF (p0 ) Q0
es biyectiva (por lo que, necesariamente, dim Q =dim Q0 ). Entonces
existen entornos coordenados U de p0 y U 0 de F (p0 ) tales que F (U ) =
U 0 y la restricción de F a U es biyectiva con inversa diferenciable; esto
es,
F |U : U → U 0
p 7→ F (p)
−1
es un difeomorfismo. Además, d(F |−1
U )F (p0 ) = (dFp0 ) .
(Obsérvese que F es un difeomorfismo local si y sólo si (dF )p es
biyectiva para todo p ∈ Q.)
Teorema de la Función Implı́cita: Sea F : Q → Q0 una aplicación diferenciable y q ∈ ImF (⊆ Q0 ) un valor regular de F , esto es,
tal que para todo p ∈ F −1 (q) se tiene que dFp : Tp Q → TF (p) Q0 es
suprayectiva. Entonces F −1 (q) es una variedad topológica de dimensión dim Q−dim Q0 ≥ 0 y admite una estructura diferenciable natural
a partir de las cartas de Q. A cada variedad diferenciable obtenida mediante este teorema la llamaremos subvariedad de Q asociada al valor
regular q de F .
Observación 4.4.1 Sobre el Teorema de la Función Implı́cita merece
tenerse en cuenta lo siguiente:
(1) Sean, n = dim Q, m = dim Q0 . Como en el Teorema 2.5.3, para
construir un atlas diferenciable en F −1 (q) se entiende que, para cada
p ∈ F −1 (q) y cada entorno coordenado (U, ϕ) de Q alrededor de p, si
las columnas i1 , . . . , im de dFp en esas coordenadas son independientes
entonces se deben escoger las otras n − m funciones coordenadas de ϕ.
(2) Como en la [Sección 4.3, Ejemplo (3)], la restricción de cualquier
aplicación diferenciable definida sobre Q a una subvariedad suya es
también diferenciable. Además, el espacio tangente a F −1 (q) en cada
punto p ∈ F −1 (q) puede verse como un subespacio de Tp Q.
78
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
Observemos que, en el Teorema de la Función Inversa, dFp0 es biyectiva,
mientras que en el Teorema de la Función Implı́cita dFp es sobreyectiva.
Si dFp es inyectiva entonces existen entornos U de p y U 0 de F (p)
tales que la restricción
F |U : U → U 0
p 7→ F (p)
es inyectiva. Esto es, F |U es un embebimiento en el sentido que definimos a continuación:
Definiciones 4.4.2 Sea F : Q → Q0 una aplicación diferenciable.
(1) F es una inmersión si dFp es inyectiva para todo p ∈ Q. En este
caso diremos que (Q, F ) es una subvariedad inmersa en Q0 .
(2) F es un embebimiento si, además, F es un homeomorfismo sobre su imagen F (Q). En este caso diremos que (Q, F ) es una
subvariedad embebida en Q0 .
En este último caso, F (Q) no es sólo una variedad topológica (con la
topologı́a inducida de Q0 ) sino que la estructura diferenciable de Q se
induce sobre F (Q) de modo que Q y F (Q) son variedades difeomorfas.
Una subvariedad embebida es entonces equivalente a una subvariedad
en el siguiente sentido: una variedad Q incluida en otra variedad Q0 es
una subvariedad de ésta si la inclusión i : Q → Q0 es un embebimiento.
Ejemplo. Consideremos tres curvas γi :]0, 1[→ R2 , γi0 (t) 6= 0 ∀t ∈
]0, 1[, i = 1, 2, 3, cuyas imágenes y sentido de recorrido aparecen en la
Figura 16. La curva γ1 es una inmersión, con lo que (]0, 1[, γ1 ) es una
subvariedad inmersa en R2 . La curva γ2 es una inmersión inyectiva,
aunque no un embebimiento. Finalmente, la curva γ3 sı́ resulta ser un
embebimiento, y su imagen una subvariedad.
Nota. Recordemos que en Mecánica Lagrangiana se postula que el
espacio de configuración de un sistema fı́sico es una variedad diferenciable Q. El espacio de estados del sistema queda entonces modelado
por la variedad tangente T Q. En ocasiones, existen “ligaduras” sobre
los posibles estados del sistema, que se representan mediante una función F : T Q → Rk (o, más generalmente, F : T Q → Q0 ). En este
caso se supone que los estados del sistema caen en F −1 (c) ⊂ T Q, para
4.5. APÉNDICE: EL ESPACIO DUAL
79
Figura 16
algún valor regular c ∈ Rk . Cuando existe una subvariedad S de Q tal
que T S = F −1 (c) entonces se dice que las ligaduras son holónomas o
integrables. En caso contrario, se dice que son anholónomas.
4.5.
Apéndice: el espacio dual
(1) Concepto de dual algebraico.
Sea V (R) un espacio vectorial real de dimensión n. Se define el
espacio dual V ∗ (R) de V (R) como:
V ∗ (R) := (L(V, R) =){φ : V → R : φ lineal}.
A cada elemento del dual φ ∈ V ∗ (R) se le llama forma lineal. El espacio
dual V ∗ (R), dotado de sus operaciones naturales, es un espacio vectorial de dimensión n(= dim V · dim R). Si fijamos una base ordenada
de V (R) B = (v1 , . . . , vn ) y tomamos {1} como base de R(R) entonces
para cada φ ∈ V ∗ (R) podemos calcular la matriz de la aplicación φ expresada en dichas bases M (φ, B, {1})(≡ M (φ, {1} ← B)),
que
Pnmatriz
i
resulta ser igual a (φ(v1 ) . . . φ(vn )). De esta forma, si v = i=1 a vi ∈ V
entonces


1
a
n
X


φ(v) =
φ(vi )ai = (φ(v1 ) . . . φ(vn )) ·  ... 
i=1
an
80
CAPÍTULO 4. APLICACIONES DIFERENCIABLES


a1


= M (φ, {1} ← B) ·  ...  ∈ R.
an
(2) Base dual.
Consideremos los espacios vectoriales V (R), V ∗ (R) y fijemos una
base B = (v1 , . . . , vn ) de V (R). Es conocido el siguiente resultado:
Teorema 4.5.1 Existe una única base B ∗ = (φ1 , . . . , φn ) de V ∗ (R)
que verifica
φi (vj ) = δji ∀i, j ∈ {1, . . . , n}.
A esta base B ∗ se la llama base dual de la base B. Además, para los
elementos de esta base se tiene
M (φ1 , {1} ← B) = (1, 0, . . . , 0)
..
..
.
.
M (φn , {1} ← B) = (0, 0, . . . , 1).
∗
Fijada la base B =P(v1 , . . . , vn ) P
y su base dual B
= (φ1 , . . . , φn ) se
P
n
n
n
verifica φj (v) = φj ( i=1 ai vi ) = i=1 ai φj (vi ) = i=1 ai δij = aj . Esto
es,
n
X
1
n
v = φ (v)v1 + · · · + φ (v)vn =
φi (v)vi , ∀v ∈ V.
Análogamente, si φ ∈ V ∗ y φ =
bj . Esto es,
1
i=1
Pn
i
i=1 bi φ
n
φ = φ(v1 )φ + · · · + φ(vn )φ =
n
X
entonces φ(vj ) =
φ(vi )φi ,
Pn
∀φ ∈ V ∗ .
i
i=1 bi δj
=
(4.9)
i=1
(3) Cambio de base dual.
Sean B = (v1 , . . . , vn ), B = (v̄1 , . . . , v̄n ) dos bases de V (R) y
1
n
∗
B ∗ = (φ1 , . . . , φn ), B P= (φ , . . . , φ ) sus respectivas bases duales.
Supongamos que v j = ni=1 aij vi , j ∈ {1, . . . , n}, es decir,

a11 . . . a1n


=  ... . . . ...  .
an1 . . . ann

M (IdV , B ← B) = (aij )i,j
4.5. APÉNDICE: EL ESPACIO DUAL
81
P
Como consecuencia, si v ∈ V y v = ni=1 ai vi
P
ai = ni=1 aij aj . Esto es,



a1

 .. 
 .  = M (IdV , B ← B) · 
an
=
Pn
j=1
aj v j entonces

a1
..  .
. 
an
Comprobemos a continuación
∗
M (IdV ∗ , B ← B ∗ ) = M (IdV , B ← B)t .
(4.10)
P
Obsérvese que, si escribimos φk = nj=1 bkj φ̄j entonces los elementos de
∗
la matriz (bkj ) serán los de la matriz M (Id, , B ← B ∗ ), pero el ı́ndice
superior indicará ahora columna y no fila (como en (aij )). Ası́, (4.10)
se sigue de bkj = φk (v̄j ) = akj (la primera igualdad por (4.9).
Pn
Pn
j
i
Como consecuencia de (4.10), si ϕ =
b
ϕ
=
i
i=1
j=1 bj ϕ se
tiene
n
X
b̄j =
aij bi ,
i=1
(o bien, directamente, bj = ϕ(v j ) =
Pn
i=1
aij ϕ(vi ) =
Pn
i=1
aij bi ).
(4) Trasposición de una aplicación lineal.
Sean V (R), V 0 (R) dos espacios vectoriales y f : V → V 0 una aplicación lineal entre ellos. Para cada φ0 ∈ V 0∗ (R) podemos definir la
aplicación φ0 ◦ f : V → R. Como φ0 ◦ f es una composición de aplicaciones lineales se tiene que φ0 ◦ f es también lineal y, por tanto,
φ0 ◦ f ∈ V ∗ (R).
Definición 4.5.2 Definimos la aplicación traspuesta f t de la aplicación lineal f : V → V 0 como la aplicación
f t : V 0∗ → V ∗
φ0 7→ f t (φ0 ) := φ0 ◦ f.
Se tiene entonces el siguiente resultado:
Teorema 4.5.3 La aplicación traspuesta f t de una aplicación lineal
f : V → V 0 verifica:
(i) Es lineal.
82
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
(ii) Si B y B 0 son bases de V y V 0 , respectivamente, entonces
M (f t , B ∗ ← B 0∗ ) = M (f, B 0 ← B)t .
(iii) La aplicación trasposición
t : L(V, V 0 ) → L(V 0∗ , V ∗ )
f 7→ f t
es lineal. De hecho, es un isomorfismo de espacios vectoriales.
(5) Teorema de reflexividad.
Sean V (R) y V ∗ (R) un espacio vectorial y su dual, respectivamente. Podemos considerar el dual de V ∗ (R), o bidual de V (R): V ∗∗ (R) =
(V ∗ (R))∗ . Estos tres espacios vectoriales tienen igual dimensión y, por
tanto, son isomorfos. Sin embargo, mientras que no existe ningún isomorfismo canónico general entre V (R) y V ∗ (R), sı́ podemos definir uno
entre V (R) y V ∗∗ (R). Ello, en la práctica, equivale a considerar ambos
espacios como iguales.
Concretamente, fijado un vector v ∈ V definimos la aplicación
Φv : V ∗ → R
φ 7→ φ(v)
que es lineal y, por tanto, pertenece al bidual V ∗∗ (R). No es difı́cil
comprobar:
Teorema 4.5.4 (de Reflexividad). La aplicación
Φ : V → V ∗∗
v 7→ Φv
es un isomorfismo de espacios vectoriales.
Otro modo de construir este isomorfismo es el siguiente (pruébese como
ejercicio). Sean B, B dos bases de V (R). Existe un único isomorfismo
F : V → V ∗ que, de manera ordenada, aplica B en B ∗ . Análogamente,
existe un único isomorfismo G : V ∗ → V ∗∗ que aplica B ∗ en B ∗∗ . Con
B obtenemos análogamente isomorfismos F , G. En general, F 6= F
y G 6= G. Sin embargo, G ◦ F = G ◦ F , y ambos coinciden con el
isomorfismo que proporciona el Teorema de Reflexividad.
4.5. APÉNDICE: EL ESPACIO DUAL
83
Una consecuencia inmediata del Teorema de Reflexividad es que
cualquier base B 0 = (φ1 , . . . , φn ) de V ∗ (R) es la base dual de una única
base B de V (R). En efecto, si tomamos la base dual de B 0 , podemos
escribir B 0∗ = (Φv1 , . . . , Φvn ) donde B = (v1 , . . . , vn ) es una base de
V (R). Entonces, se comprueba fácilmente que B ∗ = B 0 .
Ejercicios
Ejercicio 1. (a) Si F : Rn −→ Rm es una aplicación lineal, compruébese que, con las identificaciones usuales de Tp (Rk ) con Rk , se
tiene (dF )p = F , ∀p ∈ Rn .
(b) Sea Q una subvariedad de R3 . Si φ ∈ (R3 )∗ y f : Q −→ R
es la función diferenciable sobre Q dada por f (p) = φ(p), ∀p ∈ Q,
compruébese que (df )p (v) = φ(v), ∀v ∈ Tp Q.
Ejercicio 2. Se consideran las aplicaciones f : R2 −→ R2 , g : R2 −→
R3 , dadas por
f (x, y) = (x2 − 2y, 4x3 y 2 ),
g(x, y) = (x2 y + y 2 , 2 − 2y 3 , yex )
Calcúlese: (a) la matriz de (df )(1,0) en coordenadas cartesianas; (b)
∂
∂
ı́dem para (d(g ◦ f ))(1,0) ; (c) el valor de (df )(1,0) (2 ∂x
− ∂y
).
Ejercicio 3. Sea f : S 2 −→ R la función dada por f (x, y, z) =
2x − y + z. Calcúlese (df )p (v), siendo p = ( √12 , √12 , 0) y v = (1, −1, 1).
Ejercicio 4. Sean Q y Q0 variedades diferenciables, Q×Q0 la variedad
producto de Q por Q0 , (p, p0 ) ∈ Q × Q0 y f ∈ C ∞ (Q × Q0 ). Pruébese:
v(f ) = v1 (f ◦ ip0 ) + v2 (f ◦ ip )
donde v ∈ T(p,p0 ) (Q × Q0 ), v1 = (dπQ )(p,p0 ) (v), v2 = (dπQ0 )(p,p0 ) (v),
πQ , πQ0 son las proyecciones de Q × Q0 en Q y Q0 , respectivamente,
e ip0 : Q −→ Q × Q0 , ip : Q0 −→ Q × Q0 son las inclusiones ip0 (q) =
(q, p0 ), ∀q ∈ Q, ip (q 0 ) = (p, q 0 ), ∀q 0 ∈ Q0 .
Ejercicio 5. Sea F : Q −→ Q0 una aplicación diferenciable entre las
variedades Q y Q0 . Supongamos que (dF )p = 0 (aplicación lineal nula)
∀p ∈ Q. Pruébese que si Q es conexa entonces F es constante.
84
CAPÍTULO 4. APLICACIONES DIFERENCIABLES
Ejercicio 6. Si f, f 0 : Q −→ R son dos funciones diferenciables sobre
una variedad conexa Q tales que (df )p = (df 0 )p , ∀p ∈ Q, y f (p0 ) =
f 0 (p0 ) para un punto fijo p0 ∈ Q, pruébese que f = f 0 .
Ejercicio 7. Fijada una aplicación diferenciable F : Q → Q0 con
diferencial en p dFp : Tp Q → TF (p) Q0 llamaremos codiferencial δFp de
F a la aplicación traspuesta (dFp )t . ¿Cuál es su dominio y codominio?
Sean F : Q −→ Q0 , y G : Q0 −→ Q00 aplicaciones diferenciables
entre las variedades Q, Q0 y Q00 . Pruébese la siguiente regla de la cadena
para la codiferencial de una composición: δ(G ◦ F )p = (δF )p ◦ (δG)F (p) ,
∀p ∈ Q.
Ejercicio 8. Sea α : Tp (S 2 ) −→ R, p = (−1, 0, 0), dada por α(0, a, b) =
2a+b. Si (U, ϕ) es una carta de S 2 con p ∈ U , calcúlese las coordenadas
de α en la correspondiente base ((dq 1 )p , (dq 2 )p ) de T∗p (S 2 ).
Ejercicio 9. Dada una función diferenciable f : S 2 −→ R tal que
(df )p0 6= 0, p0 ∈ S 2 , pruébese que existe una carta (U, ϕ), con p0 ∈ U ,
tal que una de sus coordenadas coincide con f sobre U .
Ejercicio 10. Sea F : Q −→ Q0 una aplicación diferenciable. Supongamos que (dF )p0 es biyectiva. Pruébese que para cada sistema
de coordenadas (x1 , . . . , xn ) en un entorno abierto de F (p0 ) en Q0 , las
funciones x1 ◦ F, ..., xn ◦ F son un sistema de coordenadas en un cierto
entorno abierto de p0 en Q.
Ejercicio 11. Dada la aplicación f : R3 −→ R definida por
f (x, y, z) = x ez + 2,
calcúlese (df )p en coordenadas cartesianas, cilı́ndricas y esféricas, en
cada punto p ∈ R3 donde éstas se hallen definidas.
Ejercicio 12. Sea O ⊂ R3 un abierto, y f : O → R una aplicación diferenciable que admite un valor regular a. Sea S = f −1 (a)
la correspondiente superficie regular de R3 . Compruébese que Tp S =
Nuc((df )p ), donde, con las identificaciones usuales, Nuc((df )p ) = {v ∈
R3 : (df )p (v) = 0}).
Capı́tulo 5
Campos vectoriales
5.1.
Concepto de campo vectorial
Sean Q una variedad diferenciable, T Q su variedad tangente y π :
T Q → Q la proyección canónica. Un campo vectorial X sobre Q es una
aplicación que asigna a cada punto p ∈ Q un vector tangente a Q en
ese punto, Xp ∈ Tp Q. Esto es, una aplicación X : Q → T Q tal que
π ◦ X = IdQ .
Un campo X se dice diferenciable (resp. continuo) si X es diferenciable C ∞ (resp. continua) como aplicación entre variedades. Ası́,
si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) entonces X, que puede
escribirse
∂
∂
Xp ≡ X(p) = X 1 (p) 1 |p + · · · + X n (p) n |p ∀p ∈ U,
∂q
∂q
será diferenciable en p0 ∈ U si y sólo si X 1 , . . . , X n son aplicaciones
diferenciables en p0 .
En particular, observemos que sobre el abierto U las coordenadas
inducen n campos vectoriales diferenciables ∂q∂ 1 , . . . , ∂q∂n (campos coordenados) en función de los cuales podemos expresar cualquier otro
campo sobre U . Como en el caso de variedades y aplicaciones entre variedades, de ahora en adelante supondremos, salvo mención explı́cita
85
86
CAPÍTULO 5. CAMPOS VECTORIALES
de lo contrario, que los campos vectoriales son “diferenciables”, por lo
que omitiremos esta palabra.
Ejemplos:
(1) Campos vectoriales sobre RnP
. Todo campo vectorial X sobre Rn
se puede escribir como X = ni=1 f i · ∂x∂ i , donde f i ∈ C ∞ (Rn ) y
(∂/∂x1 , . . . , ∂/∂xn ) son los campos coordenados asociados a las
coordenadas usuales (x1 , . . . , xn ).
(2) Campos vectoriales sobre la esfera S n . Con las identificaciones
naturales, Tp S n puede verse como un hiperplano de Rn+1 ortogonal a p con el producto escalar usual h·, ·i. En consecuencia,
dar un campo vectorial sobre S n equivale a dar una aplicación
diferenciable X : S n → Rn+1 tal que hp, X(p)i = 0 para todo
p ∈ S n.
5.2.
Estructura de los campos vectoriales
Denotaremos por X(Q) al conjunto de todos los campos vectoriales
sobre Q. Veamos cuáles son las operaciones naturales en X(Q).
(1) Suma:
X(Q) × X(Q) → X(Q)
(X, Y ) 7→ X + Y,
definida por (X + Y )p = Xp + Yp para todo p ∈ Q.
(2) Producto por escalares (reales):
R × X(Q) → X(Q)
(a, X) 7→ a · X,
definido por (a · X)p = a · Xp para todo p ∈ Q.
(3) Producto por funciones:
C ∞ (Q) × X(Q) → X(Q)
(f, X) 7→ f · X,
definido por (f · X)p = f (p) · Xp para todo p ∈ Q.
El conjunto X(Q) dotado de las dos primeras operaciones tiene estructura de espacio vectorial real de dimensión ∞ (salvo que Q tenga
5.3. PARALELIZABILIDAD
87
dimensión 0, en cuyo caso X(Q) ≡ 0). Por otra parte, X(Q) con la
primera y la tercera operación verifica propiedades formalmente análogas a las de un espacio vectorial sobre C ∞ (Q). Ahora bien, C ∞ (Q)
no es un cuerpo, ya que no existe inverso respecto al producto para
funciones que, sin ser idénticamente nulas, se anulen en algún punto de
la variedad. De hecho, C ∞ (Q) sólo tiene estructura de anillo unitario
conmutativo. Se dice entonces que X(Q) es un módulo sobre el anillo
C ∞ (Q).
Fijado un campo vectorial X ∈ X(Q), para cada función f ∈
∞
C (Q) podemos definir la aplicación
X(f ) : Q → R
p 7→ Xp (f ).
P
Si tomamos coordenadas (U, ϕ = (q 1 , . . . , q n )) y X = ni=1 X i ∂q∂ i entonces
!
à n
n
X
X
∂f
∂
i
(f ) =
X i i ∈ C ∞ (Q).
X(f ) =
X
i
∂q
∂q
i=1
i=1
En consecuencia, para cada X ∈ X(Q) tenemos una aplicación
C ∞ (Q) → C ∞ (Q)
f 7→ X(f )
que es R-lineal y verifica la regla de Leibniz, esto es:
X(f · g) = X(f ) · g + f · X(g).
5.3.
Paralelizabilidad
Fijados r campos vectoriales X1 , . . . , Xr ∈ X(Q) diremos que son
independientes (punto a punto) si el conjunto de vectores {X1 (p), . . . , Xr (p)}
⊂ Tp Q es linealmente independiente para todo p ∈ Q. En este caso
necesariamente r ≤ n (n = dim Q). Obviamente, si son independientes
y r = n entonces el conjunto {X1 (p), . . . , Xn (p)} es una base de cada
espacio tangente Tp Q. En este caso diremos que {X1 , . . . , Xn } es una
base (global) de campos vectoriales (o bien una referencia móvil). En
general, no tienen por qué existir r campos independientes sobre toda
la variedad, por lo que existen variedades que no admiten una base
global de campos.
88
CAPÍTULO 5. CAMPOS VECTORIALES
Definición 5.3.1 De una variedad diferenciable Q que admita una
base global de campos vectoriales se dice que es paralelizable. En caso
contrario, diremos que es no-paralelizable.
En caso de que una variedad Q sea paralelizable y {X1 , . . . , Xn } sea
una base global suya podemos establecer el isomorfismo de espacios
vectoriales:
C ∞ (Q)n → X(Q)
P
(f 1 , . . . , f n ) 7→ ni=1 f i Xi .
Obviamente, en este caso la aplicación
Q × Rn → T Q P
(p, a1 , . . . , an ) 7→ ni=1 ai Xi (p).
es un difeomorfismo entre Q×Rn y T Q. Es decir, en las variedades paralelizables el correspondiente espacio tangente se reduce esencialmente
a Q × Rn .
Ejemplos:
(1) Ejemplos sencillos de variedades paralelizables son Rn (véase
[Sección 3.3, Ejemplo (1)]), cualquier espacio vectorial y cualquier abierto de un entorno coordenado. No es difı́cil visualizar
que un toro también es una variedad paralelizable.
(2) La esfera 1-dimensional S 1 ⊂ R2 también es paralelizable. En
∂
∂
∂
efecto, una base de campos global suya es ∂θ
= −y ∂x
+ x ∂y
,
[Sección 3.3, Ejemplo (2)].
(3) Las esferas de dimensión par S 2n ⊂ R2n+1 en cambio no admiten
campos vectoriales sin ceros, esto es, sin que se anulen en algún
punto1 . En consecuencia, estas esferas S 2n no son paralelizables.
(4) Para las esferas impares S 2n+1 ⊂ R2n+2 sı́ existen campos vectoriales que no se anulan. En efecto, basta tomar como campo
vectorial X en cada p = (p1 , . . . , p2n+2 ) ∈ S 2n+1 :
X(p) = (p2 , −p1 , . . . , p2n+2 , −p2n+1 ) ∈ Tp S 2n+1 (⊂ Tp R2n+2 ).
1
Esta propiedad, relacionada con el clásico Teorema del Punto Fijo de Brouwer,
puede interpretarse intuitivamente como la imposibilidad de “peinar una esfera
peluda sin hacer remolinos”.
5.4. CURVAS INTEGRALES. FLUJOS
5.4.
89
Curvas integrales. Flujos
Definición 5.4.1 Sea Q una variedad diferenciable, X ∈ X(Q) un
campo vectorial y γ : I → Q, I =]a, b[⊆ R una curva diferenciable.
Diremos que γ es una curva integral de X si γ 0 (t) = Xγ(t) para todo
t ∈ I.
Toda curva integral de X se puede extender como curva integral hasta un (único) dominio máximo. Más formalmente, la curva integral
γ : I → Q es inextensible o maximal si no existe otra curva integral
γ̃ : J → Q tal que I
J y γ = γ̃ |I . Como veremos, toda curva integral determinará una única maximal por lo que, en adelante,
consideraremos siempre curvas integrales inextensibles.
Una curva integral de X (inextensible) γ : I → Q es completa si
I = R, e incompleta en caso contrario. En el primer caso, diremos
que X es completo a lo largo de γ. Diremos que X es completo si es
completo a lo largo de todas sus curvas integrales.
∂
Ejemplo. Consideremos en R2 el campo X = ∂x
. Sus curvas integrales
son del tipo γ(x0 ,y0 ) (t) = (x0 , y0 )+(t, 0), t ∈ R. Por tanto, X es completo
sobre R2 . Sin embargo, resulta obvio que ∂/∂x es incompleto sobre el
abierto ]0, ∞[×R.
Estudiemos a continuación cómo se determinan localmente las curvas integrales de un campo vectorial. Sea X ∈ X(Q) un campo vectorial
y (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q. Nuestro objetivo
es encontrar una curva integral γ : I → Q de X. Ahora bien, si componemos con ϕ, esto equivale a encontrar una solución del sistema de
ecuaciones diferenciales sobre U de primer orden:
dq i
(t) = X i (q(t)) ∀i ∈ {1, . . . , n}.
dt
(5.1)
De los teoremas clásicos de existencia de soluciones para sistemas de
ecuaciones diferenciales se deduce que, si fijamos una condición inicial
ϕ(γ(t0 )) = ϕ(p0 ), p0 ∈ U (esto es, q 1 (t0 ) = p10 , . . . , q n (t0 ) = pn0 con
p10 , . . . , pn0 ∈ R), existe ² > 0 tal que el sistema de ecuaciones (5.1)
admite solución en ]t0 − ², t0 + ²[. Además, esta solución es única en
el sentido de que para cualquier otra solución con la misma condición
inicial en t0 y definida en un intervalo J, las dos soluciones coinciden
en J∩]t0 − ², t0 + ²[. Más aún, ello acaba implicando la existencia de
90
CAPÍTULO 5. CAMPOS VECTORIALES
una única curva integral maximal. Por otra parte, si γ(t) es una curva
integral de un campo X entonces también lo es la curva γ̃(t) = γ(t+t0 ),
por lo que no será restrictivo suponer, como haremos en adelante, t0 =
0 ∈ I. En conclusión,
Teorema 5.4.2 Fijado un campo vectorial X ∈ X(Q), para cada p ∈
Q existe una única curva integral inextensible de X, γp :]ap , bp [→ Q,
tal que γp (0) = p (0 ∈]ap , bp [).
Ejemplo. Consideremos sobre R2 el campo vectorial X = xy ∂/∂x. Si
imponemos que γ(t) sea una curva integral de X entonces obtenemos
el sistema de ecuaciones
x0 (t) = x(t)y(t)
y 0 (t) = 0.
Si suponemos γ(0) = (x0 , y0 ) ∈ R2 entonces este sistema tiene por
solución
x(t) = x0 ey0 ·t
y(t) = y0
para todo t ∈ R. En particular, se deduce que X es completo.
∂
Ejercicio. Consideremos sobre R el campo de vectores X = xm ∂x
,
m ∈ N. Hállense sus curvas integrales y compruébese si es completo o
no (discútase según el valor de m).
Del ejercicio anterior se deduce que, incluso en R, existen campos vectoriales completos e incompletos. Ello ocurre en toda variedad (de dimensión mayor que 0) excepto en las compactas. De hecho, es posible demostrar que: si Q es compacta entonces todo campo vectorial
X ∈ X(Q) es completo (véase, v. gr., [O’N, Lemma 1.56]).
Intimamente relacionado con las curvas integrales aparece el concepto de flujo de un campo vectorial.
Definición 5.4.3 Consideremos un campo vectorial completo X ∈
X(Q). Definimos el flujo φ de X como la aplicación
φ: R×Q→Q
(t, p) 7→ φt (p) = γp (t),
donde γp es la curva integral de X dada en el Teorema 5.4.2.
5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS
91
El flujo φt de X para cada t consiste por tanto en desplazar cada punto
a lo largo de sus curvas integrales en un valor t de su parámetro. Si
visualizamos el campo vectorial como el campo de las velocidades de
un fluido, φt determina hacia dónde se mueve cada partı́cula del fluido
tras un tiempo t.
Debido a la variación diferenciable de las soluciones de (5.1) con
las condiciones iniciales, tanto φt como la aplicación flujo φ son diferenciables. Más aún, se verifican las siguientes propiedades:
(1) φ0 = Id.
(2) φs ◦ φt = φs+t , ∀t, s ∈ R (en efecto, φs ◦ φt (p) = φs (γp (t)) =
γp (t + s) = φt+s (p)).
(3) φ−t = (φt )−1 , ∀t ∈ R (en particular, cada φt es biyectiva para
todo t ∈ R).
Por otra parte, si X no es completo entonces para cada p ∈ Q existe
un entorno abierto U de p y un ² > 0 tal que la aplicación
φ :] − ², ²[×U → Q
(t, p) 7→ φt (p) = γp (t)
está bien definida y es diferenciable. En este caso, la aplicación φ verifica propiedades análogas a las anteriores:
(1’) φ0 (p) = p, ∀p ∈ U .
(2’) φs ◦ φt = φs+t , siempre que s, t, s + t ∈] − ², ²[.
(3’) Para cada t, φt es inyectiva, y puede escogerse un entorno abierto
V ⊂ U de cada p0 ∈ U fijo tal que φt (V ) ⊂ U . Restringiendo
entonces, φt : V → φt (V ) ⊂ U , se tiene φ−t = (φt )−1 .
5.5.
Grupo uniparamétrico de difeomorfismos
En esta sección vamos a introducir el concepto de grupo uniparamétrico de difeomorfismos, que, como veremos, abstrae la noción de flujo.
Sea X ∈ X(Q) un campo completo y consideremos su flujo global φ.
92
CAPÍTULO 5. CAMPOS VECTORIALES
Entonces G = {φt : t ∈ R} es un conjunto de difeomorfismos de Q que
con la operación de composición tiene estructura de grupo (véanse las
propiedades (1), (2) y (3) de la sección anterior). Es más, se trata de
un grupo conmutativo ya que
φt ◦ φs = φt+s = φs+t = φs ◦ φt .
Además, la aplicación
(R, +) → (G, ◦)
t 7→ φt
es entonces un epimorfismo de grupos. Las propiedades del flujo global
φ se pueden abstraer mediante el siguiente concepto:
Definición 5.5.1 Sea Q una variedad diferenciable. Llamaremos grupo
uniparamétrico de difeomorfismos de Q a toda aplicación diferenciable
Φ: R×Q→Q
(t, p) 7→ Φt (p)
que verifique: (i) Φ0 = IdQ , (ii) Φs+t = Φs ◦ Φt .
Obsérvese que de (i) e (ii) se tiene IdQ = Φt−t = Φt ◦ Φ−t ; por tanto,
Φt : Q → Q es biyectiva con inversa Φ−t . Ası́, el conjunto de difeomorfismos GΦ = {Φt : t ∈ R} tiene estructura de grupo respecto a la
composición.
Obviamente, el flujo φ de un campo completo X es un grupo uniparamétrico de difeomorfismos de Q. Es más, el recı́proco también se
verifica:
Teorema 5.5.2 Fijado un grupo uniparamétrico de difeomorfismos Φ
en Q, existe un campo vectorial completo X sobre Q cuyo flujo asociado
φ coincide con Φ.
Al campo X ası́ definido se le llamará generador infinitesimal del
grupo Φ.
Demostración. Todo se reduce a definir sobre Q un campo vectorial X
cuyas curvas integrales sean del tipo t → Φt (p). Consideremos pues el
campo X determinado en cada punto p por:
Xp =
d
|t=0 Φt (p).
dt
5.5. GRUPO UNIPARAMÉTRICO DE DIFEOMORFISMOS
93
Para demostrar que t 7→ Φt (p) es una curva integral de X, basta comprobar que:
d
|t=t0 Φt (p) = XΦt0 (p) ∀t0 ∈ R.
dt
En efecto,
d
d
d
|t=t0 Φt (p) =
|t=0 Φt+t0 (p) =
|t=0 Φt (Φt0 (p)) = XΦt0 (p) . 2
dt
dt
dt
Observaciones:
(1) El generador infinitesimal X de Φ es invariante por Φ; esto es,
verifica la propiedad XΦt0 (p) = (dΦt0 )p Xp para todo t0 . En efecto,
XΦt0 (p) =
d
d
|t=0 Φt0 +t (p) =
|t=0 Φt0 (Φt (p)) = (dΦt0 )p Xp .
dt
dt
(2) Las curvas del tipo t 7→ Φt (p) son inyectivas o se cierran sobre
sı́ mismas, ya que son curvas integrales de un campo (el generador
infinitesimal). Estas curvas reciben el nombre de órbitas del grupo
uniparamétrico (véase la Figura 17).
Ejemplo. Consideremos en Q = R3 ó Q
respecto al eje z, Φ : R × Q → Q
  

x
cos θ −senθ
θ,  y  7→  senθ cos θ
z
0
0
= S 2 las rotaciones con
  
0
x


0
y .
·
1
z
Es directo comprobar que se trata de un grupo uniparamétrico de
difeomorfismos de Q. Su generador infinitesimal es
d
|θ=0 Φθ (x, y, z) =
dθ

 

x cos θ − ysenθ
−y
 xsenθ + y cos θ  =  x  ∈ T(x,y,z) Q,
z
0
X(x,y,z) =
d
|θ=0
dθ
94
CAPÍTULO 5. CAMPOS VECTORIALES
Figura 17
∂
∂
+ x ∂y
.
es decir, el campo vectorial X = −y ∂x
Nota. Conviene destacar que un grupo uniparamétrico Φ : R×Q → Q
induce otro grupo uniparamétrico en el espacio tangente a Q que viene
dado por la expresión
R × TQ → TQ
(t, vp ) 7→ dΦt (vp ) ∈ TΦt (p) Q.
Obviamente, también se induce un grupo uniparamétrico sobre N =
T Q × R sin más que dejar constante la componente en R. Diremos que
una función F : Q → R es invariante por Φ si F (p) = F (Φt (p)) para todo t ∈ R. Análogamente, diremos que una función L : N = T Q × R →
R es invariante por Φ si lo es por el grupo uniparamétrico inducido en
T Q × R (en el sentido anterior). Por el Teorema de Noether clásico se
sabe que, si una lagrangiana es invariante por un grupo uniparamétrico, entonces sus curvas extremales admiten una cantidad conservada
(momento lineal, momento angular, energı́a, etc. -véase la última sección del Tema 7).
5.6. CORCHETE DE LIE
5.6.
95
Corchete de Lie de campos vectoriales
Consideremos una base de campos de vectores {X1 , . . . , Xn } sobre
un abierto U de una variedad Q. Fijado un punto p ∈ Q nos preguntamos si existen coordenadas (q 1 , . . . , q n ) alrededor de p tales que
Xi =
∂
∂q i
∀i ∈ {1, . . . , n}
(5.2)
sobre U . Para responder a esta pregunta consideremos una función
f ∈ C ∞ (Q). Podemos construir entonces funciones Xi (f ) ∈ C ∞ (Q)
y, repitiendo el proceso, Xj (Xi (f )) ∈ C ∞ (Q). Si la base de campos
proviniese de un sistema de coordenadas entonces se verificarı́a (5.2)
y, por tanto,
µ
¶
∂f
∂2f
∂
=
.
Xj (Xi (f )) = j
∂q
∂q i
∂q j ∂q i
Del Lema de Schwarz se deduce entonces que
Xj (Xi (f )) =
∂ 2f
∂ 2f
=
= Xi (Xj (f )).
∂q j ∂q i
∂q i ∂q j
Por tanto, una condición necesaria para que una base de campos vectoriales sea localmente de campos coordenados (esto es, que verifique
(5.2) en un entorno de cada p ∈ Q), es que se verifique:
Xi (Xj (f )) = Xj (Xi (f )) ∀f ∈ C ∞ (Q) ∀i, j ∈ {1, . . . , n}.
La justificación de que esta propiedad es suficiente conduce a la siguiente definición, de interés propio:
Definición 5.6.1 Si X, Y ∈ X(Q), definimos su corchete de Lie en
un punto p ∈ Q como la aplicación
[X, Y ]p : C ∞ (Q) → R
f 7→ Xp (Y (f )) − Yp (X(f )).
(5.3)
Observemos que de esta definición se puede deducir fácilmente la identidad de Leibniz para el producto:
[X, Y ]p (f · g) = f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ).
96
CAPÍTULO 5. CAMPOS VECTORIALES
En efecto,
[X, Y ]p (f · g) = Xp (Y (f · g)) − Yp (X(f · g))
= Xp (g · Y (f ) + f · Y (g)) − Yp (g · X(f ) + f · X(g))
= Xp (g) · Yp (f ) + g(p) · Xp (Y (f )) + Xp (f ) · Yp (g) + f (p) · Xp (Y (g))
−Yp (g) · Xp (f ) − g(p) · Yp (X(f )) − Yp (f ) · Xp (g) − f (p) · Yp (X(g))
= f (p) · (Xp (Y (g)) − Yp (X(g))) + g(p) · (Xp (Y (f )) − Yp (X(f )))
= f (p) · [X, Y ]p (g) + g(p) · [X, Y ]p (f ).
Puesto que [X, Y ]p es también R-lineal, se tiene que (5.3) define un
vector tangente a Q en cada punto p como derivación. Resumiendo:
Proposición 5.6.2 Si X, Y ∈ X(Q) entonces [X, Y ]p ∈ Tp Q. Además,
[X, Y ] : Q → T Q
p 7→ [X, Y ]p
es un campo vectorial sobre Q.
Veamos qué expresión adquiere el corchete de Lie en coordenadas
locales. Sea (U, ϕ = (q 1 , . . . , q n )) un entorno coordenado de Q y sean X,
Y dos campos de vectores sobre Q. Expresados en estas coordenadas
se tiene:
n
n
X
X
∂
i ∂
X=
X
Y =
Y i i.
i
∂q
∂q
i=1
i=1
Pn
Si escribimos en coordenadas [X, Y ] = k=1 [X, Y ]k ∂q∂k , entonces
=
[X, Y ]k = [X, Y ](q k ) = X(Y (q k )) − Y (X(q k ))
P
P
P
k ))
k
k
k
i ∂(Y (q ))
− ni=1 Y i ∂(X(q
= ni=1 X i ∂Y
− ni=1 Y i ∂X
.
i=1 X
∂q i
∂q i
∂q i
∂q i
Pn
Por tanto, el corchete de Lie en coordenadas locales queda:
¶
n µ
k
k
X
∂
i ∂Y
i ∂X
[X, Y ] =
X
−
Y
.
i
i
k
∂q
∂q
∂q
i,k=1
(5.4)
Propiedades del corchete de Lie:
(1) El corchete de Lie de campos es un corchete de Lie “abstracto”.
Esto quiere decir que es una aplicación
[·, ·] : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ [X, Y ]
que verifica las siguientes propiedades:
5.6. CORCHETE DE LIE
97
(i) Es lineal en cada variable, esto es,
[aX + bX 0 , Y ] = a[X, Y ] + b[X 0 , Y ]
[X, aY + bY 0 ] = a[X, Y ] + b[X, Y 0 ]
para todo X, X 0 , Y, Y 0 ∈ X(Q) y todo a, b ∈ R.
(ii) Es antisimétrico, esto es,
[X, Y ] = −[Y, X] ∀X, Y ∈ X(Q).
(iii) Verifica la identidad de Jacobi, esto es,
[X, [Y, Z]] + [Z, [X, Y ]] + [Y, [Z, X]] = 0 ∀X, Y, Z ∈ X(Q).
Un espacio vectorial dotado de una operación que verifique las
propiedades (i), (ii), (iii) anteriores recibe el nombre de álgebra
de Lie. En consecuencia, (X(Q), [·, ·]) es un álgebra de Lie (de
dimensión ∞ si dim Q > 0).
(2) Dos campos X, Y ∈ X(Q) verifican [X, Y ] = 0 si y sólo si para
cualesquiera flujos φ, ψ de X, Y , respectivamente, se tiene φs ◦
ψt = ψt ◦ φs en su dominio de definición. En este caso se dice que
X e Y conmutan.
La siguiente expresión del corchete de Lie permite entender esta
propiedad. Sea φ el flujo del campo X ∈ X(Q). Consideremos
la aplicación φ−t y su diferencial dφ−t : Tφt (p) Q → Tp Q. Si Y ∈
X(Q), tiene sentido comparar los vectores Yp y (dφ−t )φt (p) Yφt (p) .
Se verifica entonces (véase la Figura 18):
[X, Y ]p = limt→0
(dφ−t )φt (p) Yφt (p) − Yp
.
t
Esto es, el corchete de Lie mide lo que “varı́a infinitesimalmente”
el campo Y a lo largo de las curvas integrales de X.
(3) El corchete de Lie se preserva por aplicaciones diferenciables. Es
decir, si F : Q → Q0 es diferenciable, y X, Y ∈ X(Q), X 0 , Y 0 ∈
X(Q0 ) verifican XF0 (p) = dFp Xp , YF0 (p) = dFp Yp , para todo p ∈ Q,
entonces dFp [Xp , Yp ] = [XF0 (p) , YF0 (p) ].
98
CAPÍTULO 5. CAMPOS VECTORIALES
Figura 18
El siguiente resultado resuelve el problema que planteaban las bases
de campos y con el que iniciamos esta sección:
Teorema 5.6.3 (Frobenius). Sea {X1 , . . . , Xr } un conjunto de campos
vectoriales independientes sobre una variedad Q. Son equivalentes:
(i) [Xi , Xj ] = 0 para todo i, j ∈ {1, . . . , r}.
(ii) Para cada p ∈ Q existe un entorno coordenado (U, q 1 , . . . , q n ) tal
que Xi = ∂q∂ i para todo i ∈ {1, . . . , r}.
En particular, si r = n, una base de campos {X1 , . . . , Xn } es localmente
una base de campos coordenados si y sólo si [Xi , Xj ] = 0 ∀i, j ∈
{1, . . . , n}.
Idea de la demostración. La implicación (ii) ⇒ (i) es inmediata de la
discusión al comienzo de esta sección. Para la implicación (i) ⇒ (ii)
(i)
consideremos para simplificar el caso r = n. Sean φt flujos locales de
Xi , i = 1, . . . , n, definidos en un entorno de p para todo t ∈] − ², ²[.
Consideremos la aplicación
F :] − ², ²[n → Q
(1)
(n)
(t1 , . . . , tn ) 7→ φt1 ◦ · · · ◦ φtn (p).
Claramente, dF ( ∂t∂ i |(0,...,0) ) = Xi (p), ∀i ∈ {1, . . . , n}. En consecuencia, por el Teorema de la Función Inversa existen entornos Θ de (0, . . . , 0)
5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE
99
y U de p tales que la restricción F |Θ : Θ → U es un difeomorfismo. El entorno coordenado en cuestión será entonces (U, (F |Θ )−1 ≡
(q 1 , . . . , q n )). Para comprobar que, efectivamente, Xi = ∂q∂ i , se usa la
conmutatividad de los flujos (para más detalles véase, p. ej., [AM,
2.2.26]). 2
5.7.
Apéndice: Grupos y Álgebras de Lie
Recordemos que un grupo de Lie (G, ·) es una variedad diferenciable
G de dimensión finita n con una operación que la dota de estructura
de grupo y tal que las aplicaciones
G×G→G
(g, h) 7→ g · h
G→G
g 7→ g −1
son diferenciables [Sección 2.5, Nota (2)].
En todo grupo de Lie (G, ·) se pueden definir las traslaciones por la
izquierda como sigue: fijado g ∈ G la traslación por la izquierda según
g es
Lg : G → G
h 7→ g · h.
Obviamente, las aplicaciones Lg , g ∈ G son difeomorfismos. Un campo vectorial X ∈ X(G) se dice que es invariante por la izquierda si
(dLg )h Xh = Xg·h para todo g, h ∈ G.
Una manera de construir campos invariantes por la izquierda es
la siguiente: sea e ∈ G el elemento neutro del grupo y sea v ∈ Te G,
entonces el campo vectorial X v dado por Xgv = (dLg )e v es diferenciable
e invariante por la izquierda. De hecho, todo campo invariante por la
izquierda puede construirse de este modo.
El conjunto G = {X ∈ X(G) : X es invariante por la izquierda}
con las operaciones usuales es un espacio vectorial. De hecho, la aplicación
Te G → G
v 7→ X v
es un isomorfismo de espacios vectoriales, por lo que G también tiene
dimensión n. Ası́, si (v1 , . . . , vn ) es una base de Te G entonces (X v1 , . . . ,
X vn ) ≡ (X1 , . . . , Xn ) es una base de campos sobre todo el grupo de
100
CAPÍTULO 5. CAMPOS VECTORIALES
P
Lie G. En particular, G es paralelizable. Más aún, si X = ni=1 f i Xi ∈
X(G) entonces X ∈ G si y sólo si f i ≡ cte para todo i.
Un hecho destacable es que el corchete de Lie preserva los campos
invariantes por la izquierda, esto es:
X1 , X2 ∈ G =⇒ [X1 , X2 ] ∈ G
(debido a que dLg [X1 , X2 ] = [dLg X1 , dLg X2 ] = [X1 , X2 ], véase [Sección 5.6, Propiedad (3)]). Como consecuencia, (G, [·, ·]) es un algebra
de Lie de dimensión finita n. Además,
para los elementos de la base
P
(X1 , . . . , Xn ) se tiene [Xi , Xj ] = nk=1 ckij Xk , donde los ckij ∈ R determinan el álgebra (salvo isomorfismos) y se denominan constantes de
estructura del grupo en la base (X1 , . . . , Xn ).
La teorı́a de grupos de Lie estudia detalladamente cómo las propiedades del álgebra de Lie (G, [·, ·]) determinan el grupo de Lie G
(al menos localmente). Una simplificación importante se debe a que,
esencialmente, todo grupo de Lie es isomorfo a un subgrupo de matrices regulares (Teorema de Ado), siendo el corchete de Lie identificable
con el conmutador de las matrices en el espacio tangente a la matriz
identidad.
Ejercicio. Compruébese que el álgebra de Lie del grupo de las matrices ortonormales O(n, R) = {A ∈ Gl(n, R) : A · At = In } es identificable al espacio vectorial de las matrices antisimétricas n × n.
Ejercicios
∂
∂
Ejercicio 1. Se considera el campo vectorial X = (x−y) ∂x
−2xz ∂y
+
3
∂
sobre R . Calcúlese X(f ), siendo f (x, y, z) = 2x − y + z.
∂z
∂
∂
Ejercicio 2. Se considera el campo vectorial X = x ∂x
− y ∂y
sobre
2
R . Exprésese como combinación lineal de los campos coordenados
originados por las coordenadas polares usuales (ρ, θ).
Ejercicio 3. Sobre R2 se consideran los campos de vectores:
X = (x + y)
∂
∂
−
,
∂x ∂y
Y = (y 2 + 1)
∂
∂
+x .
∂x
∂y
(i) Pruébese que son independientes en cada punto.
5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE
101
∂
∂
(ii) Si Z = (x2 + y 2 ) ∂x
+ (x2 − y 2 ) ∂y
, encuéntrense f1 , f2 ∈ C ∞ (R2 )
tales que Z = f1 · X + f2 · Y .
Ejercicio 4. (a) Encuéntrese un campo vectorial sobre S 2 que se
anule exactamente en dos puntos.
(b) Encuéntrese un campo vectorial sobre S 2 que se anule exactamente
en un punto.
Ejercicio 5. Compruébese que, con las identificaciones usuales, la
aplicación X : S 2 −→ R3 , X(x, y, z) = (xz, yz, z 2 − 1) define un campo
vectorial sobre S 2 . Tómense las coordenadas x, y sobre el hemisferio
z > 0 y calcúlense las coordenadas de X en los correspondientes campos coordenados.
Ejercicio 6. Se consideran los campos de vectores sobre R2
X=x
∂
∂
+
,
∂x ∂y
Y =y
∂
∂
+x .
∂x
∂y
Calcúlese [X, Y ].
Ejercicio 7. Compruébese que para todo X, Y ∈ X(Q) y todo f, g ∈
X(Q) se verifica:
[f X, gY ] = f g[X, Y ] + f (X(g))Y − g(Y (f ))X.
Ejercicio 8. Sea F : Q −→ Q0 un difeomorfismo. Para cada X ∈
X(Q) compruébese que
(F∗ (X))q0 := (dF )F −1 (q0 ) (XF −1 (q0 ) ),
∀q 0 ∈ Q0
define un campo vectorial sobre Q0 .
Pruébese que F∗ ([X, Y ]) = [F∗ (X), F∗ (Y )]0 , ∀X, Y ∈ X(Q), donde
[, ] y [, ]0 son los respectivos corchetes de Lie en Q y Q0 .
Ejercicio 9. Compruébese que la aplicación Φ : R × R2 −→ R2 ,
Φ(t, x, y) = (xe2t , ye−3t ), es un grupo uniparamétrico de difeomorfismos
de R2 . Determı́nese el campo vectorial que induce.
P
Ejercicio 10. Se considera el campo vectorial sobre Rn , X = ni=1 ai ∂x∂ i ,
ai ∈ R, 1 ≤ i ≤ n. Pruébese que X admite como grupo uniparamétrico
102
CAPÍTULO 5. CAMPOS VECTORIALES
global asociado a la aplicación Φ : R × Rn −→ Rn , Φ(t, p) = p + tv,
siendo v = (a1 , ..., an ).
∂
∂
Ejercicio 11. Se considera el campo vectorial X = y ∂x
−x ∂y
∈ X(R2 )
¿Admite un grupo uniparamétrico global?
Ejercicio 12. En la variedad Q = R2 − {(0, 0)} se considera el campo X = x∂x − y∂y . Calcúlense y dibújense sus curvas integrales. Determı́nese su flujo. ¿Es X completo?
Ejercicio 13. En R2 se considera el campo de vectores X = y ∂∂x −
(y + 1) ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo?
Ejercicio 14. Se considera la aplicación φ : R × R2 → R2 ,
φ(t, (x, y)) =
¢
1¡
(x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t .
2
(i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 .
(ii) Calcúlese su generador infinitesimal X.
(iii) ¿Es X completo?
Ejercicio 15. En R3 se considera el campo de vectores,
X = (x2 − y)
∂
∂
∂
− 2xz
+y .
∂x
∂y
∂z
Calcúlese X(f ), siendo f (x, y, z) = x + y + z.
Ejercicio 16. En R3 se consideran los campos vectoriales:
X1 = y∂z − z∂y ,
X2 = z∂x − x∂z ,
X3 = x∂y − y∂x .
(i) Compruébese que inducen, por restricción, tres campos vectoriales sobre cualquier esfera S centrada en el origen. ¿Forman
una base de campos (referencia móvil) sobre R3 ? ¿Y sobre S?
Calcúlense todos los corchetes [Xi , Xj ], i, j = 1, 2, 3.
(ii) Sea φ(i) el flujo de cada Xi y considérese la aplicación ψ : R ×
(2)
(1)
S → S, ψ(t, p) = φt ◦ φ2t (p). ¿Es un grupo uniparamétrico de
difeomorfismos? Calcúlese el campo generado como ∂ψ(t, p)/∂t|0 .
5.7. APÉNDICE: GRUPOS Y ÁLGEBRAS DE LIE
103
Ejercicio 17. En R2 se consideran los siguientes tres campos vectoriales:
X = ∂ x + x2 ∂ y ,
Y = x2 ∂ x + ∂ y
Z = [[X, Y ], ∂y ] + [[∂y , X], Y ].
Calcúlense sus curvas integrales. ¿Cuáles de ellos son completos?
Ejercicio 18. En R3 se consideran los campos de vectores:
X = ∂y ,
Y = zy∂x + 3∂y − xy∂z .
Calcúlense las curvas integrales de Z = [X, Y ]. ¿Es Z completo?
Ejercicio 19. Se considera la aplicación φ : R × R2 → R2 ,
φ(t, (x, y)) =
¢
1¡
(x + y)et + (x − y)e−t , (x + y)et − (x − y)e−t .
2
(i) Demuéstrese que φ es un grupo uniparamétrico sobre R2 .
(ii) Calcúlese su generador infinitesimal X.
(iii) ¿Es X completo?
Ejercicio 20. Se considera el campo vectorial sobre R2 , X = x ∂∂x −
y 2 ∂∂y . Calcúlense sus curvas integrales. ¿Es X completo?
Ejercicio 21. Dada una función diferenciable no constante y que no
se anule f : R −→ R, se considera el campo vectorial X sobre R,
d
Xy = f (y) dx
|y , ∀y ∈ R. Hállense todos los campos que conmutan con
d
.
X, y compruébese que, salvo el nulo, ninguno de ellos conmuta con dx
Ejercicio 22. Se considera en R3 un sistema de ecuaciones en derivadas parciales
∂z
= g(x, y, z),
∂x
∂z
= h(x, y, z),
∂y
y se le asocian los campos
X=
∂
∂
+g ,
∂x
∂z
Y =
∂
∂
+h .
∂y
∂z
Demuéstrese que si el sistema admite una solución z = f (x, y), entonces
los campos X, Y son una paralelización de la variedad z = f (x, y) tal
que [X, Y ] = 0.
104
CAPÍTULO 5. CAMPOS VECTORIALES
Capı́tulo 6
Campos tensoriales y formas
diferenciales
En este tema comprobamos en primer lugar que no sólo el concepto de
vector tangente induce el de campo vectorial, sino que toda el álgebra
tensorial sobre un espacio vectorial induce los correspondientes campos
y operaciones tensoriales sobre la variedad.
A continuación, nos centramos por su particular interés en las
r−formas diferenciales para r = 1, 2, e introducimos los conceptos
de 1-formas cerradas y exactas, y de circulación de una 1-forma a lo
largo de una curva. El estudio general de r−formas diferenciales se
pospone hasta el estudio de Integración en Variedades (Temas 8 y 9),
que resulta independiente del resto.
6.1.
Tensores en un espacio vectorial
6.1.1.
Concepto
Definición 6.1.1 Sea V (R) un espacio vectorial. Un tensor r veces
covariante y s veces contravariante (o tipo (r, s)) sobre V (R) es una
aplicación
T : V r × (V ∗ )s → R
(u1 , . . . , ur , φ1 , . . . , φs ) 7→ T (u1 , . . . , ur , φ1 , . . . , φs )
105
106
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
que es multilineal, esto es, lineal en cada una de sus r + s variables.
Denotaremos por Tr,s (V ) al conjunto de los tensores tipo (r, s) sobre
V (R). De manera natural se puede definir en este conjunto una suma
y un producto por escalares reales. Concretamente,
(1) si T, T 0 ∈ Tr,s (V ) entonces T + T 0 (∈ Tr,s (V )) se define por:
(T + T 0 )(y 1 , . . . , y r , φ1 , . . . , φs ) =
T (y 1 , . . . , y r , φ1 , . . . , φs ) + T 0 (y 1 , . . . , y r , φ1 , . . . , φs );
(2) si T ∈ Tr,s (V ), a ∈ R entonces a · T (∈ Tr,s (V )) se define por:
(a · T )(y 1 , . . . , y r , φ1 , . . . , φs ) = a · T (y 1 , . . . , y r , φ1 , . . . , φs ).
Se comprueba fácilmente que (Tr,s (V ), +, ·R) tiene estructura de espacio vectorial.
Ejemplos:
(1) Claramente, T1,0 (V ) = V ∗ y T0,1 (V ) = V ∗∗ . Ahora bien, puesto
que por el Teorema de Reflexividad podemos identificar V ∗∗ con
el propio V , podemos considerar T0,1 (V ) = V . Por tanto, un
vector v se correspondelos con el tensor 1-contravariante:
v : V∗ →R
φ 7→ φ(v).
(2) Los métricas g : V × V → R sobre V (R) se definen como tensores
2-covariantes y simétricos; esto es, tales que verifican g(u, v) =
g(v, u), ∀u, v ∈ V (véase el Tema siguiente).
2
(3) Consideremos la aplicación det : Rn → R definida por
¯
¯




¯ a11 . . . a1n ¯
a1n
a11
¯
¯
¯
¯ .. . .
 .. 
 .. 
.
.
( .  , . . . ,  . ) 7→ ¯ .
. . ¯.
¯
¯
¯ an1 . . . ann ¯
ann
an1
Es directo comprobar que det∈ Tn,0 (Rn ).
6.1. TENSORES EN UN ESPACIO VECTORIAL
107
(4) Sea f : V → V un endomorfismo de espacios vectoriales y consideremos la aplicación
Tf : V × V ∗ → R
(u, φ) 7→ φ(f (u)).
Se demuestra fácilmente Tf ∈ T1,1 (V ). Es más, la aplicación
End(V ) → T1,1 (V )
f 7→ Tf
es un isomorfismo de espacios vectoriales. Por tanto, es posible
asociar una traza a un tensor tipo (1, 1) sin más que calcular
la de su endomorfismo correspondiente. Concretamente, si B =
(v1 , . . . , vn ) es una base de V :
traza Tf := traza f =
n
X
φi (f (vi )) =
i=1
n
X
Tf (vi , φi ),
i=1
que resulta independiente de la base B escogida.
Por completitud, se define también T0,0 (V ) = R, de modo que el concepto de tensor incluye simultánemente los de escalar, vector, forma
lineal y endomorfismo.
6.1.2.
Producto tensorial
El producto tensorial resultará útil para estudiar tensores tipo (r, s)
a partir de tensores de tipo inferior en r ó s. El objetivo final será poder
estudiar todos los tensores a partir de los (1,0) (vectores) y (0,1) (formas lineales).
Definición 6.1.2 Sean T ∈ Tr,s (V ) y T 0 ∈ Tr0 ,s0 (V ). Se define el producto tensorial de T por T 0 como
0
0
T ⊗ T 0 : V r+r × (V ∗ )s+s → R
0
0
((u1 , . . . , ur+r0 ), (φ1 , . . . , φs+s )) 7→ T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ),
siendo
0
T ⊗ T 0 (u1 , . . . , ur+r0 , φ1 , . . . , φs+s ) =
0
= T (u1 , . . . , ur , φ1 , . . . , φs ) · T 0 (ur+1 , . . . , ur+r0 , φs+1 , . . . , φs+s ).
108
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
Propiedades. Se comprueba fácilmente:
(1) T ⊗ T 0 es multilineal y, por tanto, T ⊗ T 0 ∈ Tr+r0 ,s+s0 (V ).
(2) La operación producto tensorial es lineal en cada variable en el
siguiente sentido:
(aT + bT ) ⊗ T 0 = a(T ⊗ T 0 ) + b(T ⊗ T 0 )
0
0
T ⊗ (aT 0 + bT ) = a(T ⊗ T 0 ) + b(T ⊗ T )
0
para todo T, T ∈ Tr,s y T 0 , T ∈ Tr0 ,s0 .
(3) La operación producto tensorial es asociativa (aunque no conmutativa).
6.1.3.
Tensores tipo (r, s) con r + s = 2
Consideremos en primer lugar el espacio vectorial T2,0 (V ). Acabamos
de ver que si φ, ψ ∈ V ∗ (= T1,0 (V )) entonces φ ⊗ ψ ∈ T2,0 (V ), siendo (φ ⊗ ψ)(v, w) = φ(v) · ψ(w), ∀v, w ∈ V . Consideremos fijada una
base B = (v1 , . . . , vn ) de V , y su correspondiente base dual B ∗ =
(φ1 , . . . , φn ). Nuestro objetivo será demostrar que una base de T2,0 (V )
es el conjunto de todos los productos tensoriales de elementos de B ∗ ,
esto es
B2,0 = {φi ⊗ φj : i, j ∈ {1, . . . , n}}.
P
Lema 6.1.3 Si T = ni,j=1 tij φi ⊗φj ∈ T2,0 (V ) entonces tkl = T (vk , vl )
para todo k, l ∈ {1, . . . , n}.
Demostración.
T (vk , vl ) =
n
X
i,j=1
i
j
tij (φ ⊗ φ )(vk , vl ) =
n
X
tij δki δlj = tkl . 2
i,j=1
Teorema 6.1.4 (1) El conjunto B2,0 es una base del espacio T2,0 (V )
y, por tanto, dim T2,0 = n2 .
(2) La coordenada (k, l) de un tensor T en la base B2,0 coincide con
T (vk , vl ).
6.1. TENSORES EN UN ESPACIO VECTORIAL
109
Demostración. (1) En primer
que B2,0 es linealmente
Pnlugar veamos
i
j
independiente. En efecto, si i,j=1 tij φ ⊗ φ = T0 ≡ 0 entonces, por el
Lema 6.1.3, tij = T0 (vi , vj ) = 0, ∀i, j. Para demostrar que B2,0 es un
sistema de generadores
basta comprobar que para todo T ∈ T2,0 (V )
Pn
se tiene T =
t φi ⊗ φj , siendo tij = T (vi , vj ). En efecto, si
i,j=1
Pn i
Pnij j
u = i=1 a vi , v = j=1 b vj entonces
n
n
n
X
X
X
i
j
T (u, v) = T (
a vi ,
b vj ) =
T (vi , vj )ai bj
i=1
=
n
X
j=1
Ã
tij ai bj =
i,j=1
n
X
i,j=1
!
tij φi ⊗ φj
(u, v)
i,j=1
(2) Inmediato del Lema 6.1.3. 2
Observación. Las coordenadas tij de T en B2,0 se pueden escribir de
modo matricial


T (v1 , v1 ) . . . T (v1 , vn )


..
..
...
MB (T ) = (tij )i,j = 
.
.
.
T (vn , v1 ) . . . T (vn , vn )
Se comprueba entonces:


b1


T (u, v) = (a1 , . . . , an )MB (T )  ...  .
bn
Observación. Todos los tensores tipo (2, 0) se pueden escribir como
productos tensoriales del tipo φ ⊗ ψ o sumas finitas de ellos. Esto lleva
a usar a veces la notación T2,0 (V ) = V ∗ ⊗ V ∗ (producto directo de V ∗
por V ∗ ).
Ejercicio. Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ con n ≥ 2. Pruébese
que no existen φ, ψ ∈ V ∗ tales que φ ⊗ ψ = φ1 ⊗ φ2 + φ2 ⊗ φ1 .
Un desarrollo análogo al que hemos hecho para T2,0 (V ) se puede
llevar a cabo para T0,2 (V ), T1,1 (V ). Ası́, consideremos el espacio vectorial T0,2 (V ). Dados dos vectores u, v ∈ V (≡ T0,1 (V )) ahora también
110
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
podemos definir la aplicación
u⊗v :V∗×V∗ →R
(φ, ψ) 7→ φ(u) · ψ(v).
En consecuencia, fijada una base B = (v1 , . . . , vn ) de V y su correspondiente base dual B ∗ = (φ1 , . . . , φn ), podemos construir el conjunto
B0,2 = {vi ⊗ vj : i, j ∈ {1, . . . , n}} de manera que se verifica:
Lema 6.1.5 Si T =
Pn
i,j=1
tij vi ⊗ vj entonces tkl = T (φk , φl ).
Teorema 6.1.6 (1) El conjunto B0,2 es una base del espacio T0,2 (V )
y, por tanto, dim T0,2 = n2 .
(2) La coordenada (k, l) de un tensor T en la base B0,2 coincide con
T (φk , φl ).
Observación. Se suele usar la notación T0,2 (V ) ≡ V ⊗ V .
Finalmente, consideremos el espacio vectorial T1,1 (V ). Dados φ ∈
V y u ∈ V podemos definir
∗
φ⊗u:V ×V∗ →R
(v, ψ) 7→ φ(v) · ψ(u).
Para el conjunto B1,1 = {φj ⊗vi : i, j ∈ {1, . . . , n}} se verifica entonces:
Lema 6.1.7 Si T =
Pn
i j
i,j=1 tj φ
⊗ vi entonces tlk = T (vk , φl ).
Teorema 6.1.8 (1) El conjunto B1,1 es una base del espacio T1,1 (V )
y, por tanto, dim T1,1 = n2 .
(2) La coordenada (k, l) de un tensor T correspondiente al elemento
l
φ ⊗ vk de la base B1,1 coincide con T (vl , φk ).
Observación. Según la definición general de producto tensorial que
estamos considerando, se verifica φ ⊗ u = u ⊗ φ. Por tanto, indistintamente se suelen usar las notaciones T1,1 (V ) ≡ V ⊗ V ∗ ≡ V ∗ ⊗ V .
6.1. TENSORES EN UN ESPACIO VECTORIAL
6.1.4.
111
Tensores tipo (r, s)
Consideremos r formas lineales ψ 1 , . . . , ψ r en V ∗ y s vectores u1 , . . . , us
en V . Usando la asociatividad de ⊗ puede escribirse inequı́vocamente
ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us ∈ Tr,s (V ). Explı́citamente,
ψ 1 ⊗ · · · ⊗ ψ r ⊗ u1 ⊗ · · · ⊗ us : V r × (V ∗ )s → R
(w1 , . . . , wr , ρ1 , . . . , ρs ) 7→ ψ 1 (w1 ) · · · ψ r (wr ) · ρ1 (u1 ) · · · ρs (us ).
Para construir una base de Tr,s (V ) consideramos una base B = (v1 , . . . , vn )
de V y su base dual B ∗ = (φ1 , . . . , φn ) de V ∗ . Definimos entonces
Br,s = {φi1 ⊗· · ·⊗φir ⊗vj1 ⊗· · ·⊗vjs : i1 , . . . , ir , j1 , . . . , js ∈ {1, . . . , n}}.
Argumentos análogos a los del caso r + s = 2 permiten demostrar:
Teorema 6.1.9 (1) Br,s es una base de Tr,s (V ) y, por tanto, dim Tr,s (V ) =
nr+s .
(2) Si T ∈ Tr,s (V ) satisface
T =
n
X
...js
tji11...i
· φi1 ⊗ · · · ⊗ φir ⊗ vj1 ⊗ · · · ⊗ vjs
r
i1 ,...,js =1
...js
entonces tji11...i
= T (vi1 , . . . , vir , φj1 , . . . , φjs ).
r
,...,js
Abusando del lenguaje se suele decir que los escalares tji11,...,i
son las
r
coordenadas de T en B (en lugar de en Br,s ).
6.1.5.
Tensores simétricos y antisimétricos tipo (2, 0)
Definiciones 6.1.10 (1) Diremos que un tensor T ∈ T2,0 (V ) es simétrico si T (x, y) = T (y, x), ∀x, y ∈ V .
(2) Diremos que un tensor T ∈ T2,0 (V ) es antisimétrico si T (x, y) =
−T (y, x), ∀x, y ∈ V .
En caso de tensores tipo (0, 2) se puede dar una definición análoga; en
cambio, para tensores tipo (1, 1) esto no tiene sentido.
Proposición 6.1.11 Sea T ∈ T2,0 (V ). Son equivalentes:
(i) T es simétrico (resp. antisimétrico).
112
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
(ii) Existe una base B = (v1 , . . . , vn ) de V tal que T (vi , vj ) = T (vj , vi )
(resp. T (vi , vj ) = −T (vj , vi )), ∀i, j ∈ {1, . . . , n}.
(iii) Cualquier base verifica la propiedad (ii).
Demostración. Las implicaciones (i) ⇒ (iii) y (iii) ⇒ (ii) son triviales.
Para (ii) ⇒ (i) téngase en cuenta lo siguiente:
n
n
X
X
i
T (x, y) = T (
a vi ,
aj vj )
i=1
=
n
X
i,j=1
i j
a b T (vi , vj ) =
n
X
j=1
ai bj T (vj , vi ) = T (y, x). 2
i,j=1
Observación: Si φ, ψ ∈ V ∗ entonces el tensor φ⊗ψ+ψ⊗φ es simétrico
mientras que el tensor φ ⊗ ψ − ψ ⊗ φ es antisimétrico.
Definición 6.1.12 Si φ, ψ ∈ V ∗ se define su producto exterior como
el tensor antisimétrico φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ.
Es fácil probar que se verifican la siguientes propiedades:
S
A
(1) Tanto T2,0
(V ) = {T ∈ T2,0 (V ) : T es simétrico} como T2,0
(V ) =
{T ∈ T2,0 (V ) : T es antisimétrico} son subespacios vectoriales de
T2,0 (V ).
S
(2) Se verifica la descomposición en suma directa T2,0 (V ) = T2,0
(V )⊕
A
S
A
S
A
T2,0 (V ) (esto es, T2,0 (V ) = T2,0 (V )+ T2,0 (V ) y T2,0 (V ) ∩ T2,0 (V ) = {0}.)
(3) Si B = (φ1 , . . . , φn ) es una base de V ∗ entonces los conjuntos
S
A
B2,0
= {φi ⊗ φj + φj ⊗ φi : 1 ≤ i ≤ j ≤ n} y B2,0
= {φi ∧ φj =
S
φi ⊗ φj − φj ⊗ φi : 1 ≤ i < j ≤ n} son bases de los espacios T2,0
(V ) y
A
T2,0 , respectivamente. Por tanto, la dimensión del primero es n(n+1)/2
y la del segundo n(n − 1)/2.
6.2.
Tensores sobre variedades
6.2.1.
Tensores en un espacio vectorial tangente
Sea Q una variedad diferenciable y p ∈ Q. Consideremos el espacio vectorial tangente Tp Q y sea (U, ϕ = (q 1 , . . . , q n )) un entorno
6.2. TENSORES SOBRE VARIEDADES
113
coordenado de p. Para estas coordenadas podemos construir las bases
Bp = ( ∂q∂ 1 |p , . . . , ∂q∂n |p ) y Bp∗ = (dqp1 , . . . , dqpn ), y a partir de ellas, los
tensores dqpi ⊗dqpj ∈ T2,0 (Tp Q), dqpi ⊗ ∂q∂ j |p ∈ T1,1 (Tp Q), etc. Como vimos
en la Subsección 6.1.3, estos tensores permiten construir las bases de los
correspondientes espacios tensoriales (T2,0 (Tp Q), T1,1 (Tp Q)). Con más
generalidad (Subsección 6.1.4), si Tp ∈ Tr,s (Tp Q), existirán números
...js
reales tji11...i
tales que
r
Tp =
n
X
,...,js
tji11,...,i
· dqpi1 ⊗ · · · ⊗ dqpir ⊗
r
i1 ,...,js =1
∂
∂
|p ⊗ · · · ⊗ j s |p ,
j
1
∂q
∂q
,...,js
donde tji11,...,i
= Tp ( ∂q∂i1 |p , . . . , ∂q∂ir |p , dqpj1 , . . . , dqpjs ) (coordenadas de T
r
en Bp ).
Para estudiar cómo cambian las coordenadas del tensor ante cambios de base, supongamos que (Ũ , ϕ̃ = (q̃1 , . . . , q̃n )) es otro entorno
coordenado alrededor de p. Entonces las nuevas bases asociadas a esas
coordenadas son B̃p = ( ∂∂q̃1 |p , . . . , ∂∂q̃n |p ) y B̃p∗ = (dq̃p1 , . . . , dq̃pn ). Por
tanto, debemos hallar la relación existente entre las coordenadas de Tp
en las diferentes bases de tensores inducidas por Bp y B̃p . Para ello,
supongamos en primer lugar que Tp ∈ T2,0 (Tp Q), entonces
Tp =
n
X
tij ·
dqpi
⊗
dqpj
=
i,j=1
Ahora bien,
n
X
t̃kl · dq̃pk ⊗ dq̃pl .
k,l=1
Pn
∂
|
=
p
k
∂ q̃
Pni=1
∂
| = j=1
∂ q̃ l p
∂q i
(p) ∂q∂ i |p
∂ q̃ k
∂q j
(p) ∂q∂ j |p ,
∂ q̃ l
luego
P P
t̃kl = Tp ( ∂∂q̃k |p , ∂∂q̃l |p ) = ni=1 nj=1
P
i
j
(p)tij .
= ni,j=1 ∂∂qq̃k (p) ∂q
∂ q̃ l
j
∂q i
(p) ∂q
(p)
∂ q̃ k
∂ q̃ l
· Tp ( ∂q∂ i |p , ∂q∂ j |p )
Esto es,
n
X
∂q j
∂q i
t̃kl =
(p)
(p)tij
k
l
∂
q̃
∂
q̃
i,j=1
∀k, l ∈ {1, . . . , n}.
114
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
Ejercicio. (1) En el caso de que Tp sea un tensor 2 contravariante,
compruébese que la transformación análoga de coordenadas es
n
X
∂ q̃ l
∂ q̃ k
(p)
(p)tij
t̃ =
i
j
∂q
∂q
i,j=1
kl
∀k, l ∈ {1, . . . , n}.
(2) Supongamos que la transformación de coordenadas q̃ i (q 1 , . . . , q n )
es afı́n, esto es:



 

q̃ 1
q1
q01
 .. 
 .   . 
(6.1)
 .  = A ·  ..  +  .. 
q̃ n
qn
q0n
para alguna matriz regular A = (aji )i,j y q01 , . . . , q0n ∈ R fijos. Escribiendo la matriz inversa como A−1 = (bji )i,j , muéstrese que se verifica:
kl
t̃ =
n
X
i,j=1
aki alj tij ,
t̃kl =
n
X
bik bjl tij
i,j=1
para todo k, l ∈ {1, . . . , n}. ¿Qué sucede si A es una matriz ortonormal,
A ∈ O(n, R)?
(3) Repı́tanse los dos puntos anteriores cuando Tp es un tensor (1,1).
A continuación, consideremos el caso general Tp ∈ Tr,s (Tp Q). Ahora
,...,js
s
tenemos coordenadas tji11,...,i
y t̃lk11,...,l
,...,kr en las bases inducidas por Bp y
r
B̃p , respectivamente. La relación entre ambas queda:
∂
∂
s
l1
ls
t̃lk11,...,l
,...,kr = Tp ( ∂ q̃ k1 |p , . . . , ∂ q̃ kr |p , dq̃p , . . . , dq̃p )
Pn ∂qi1
P
ir
= Tp ( i1 =1 ∂ q̃k1 (p) ∂ q̃∂i1 |p , . . . , nir =1 ∂∂qq̃kr (p) ∂q∂ir |p ,
Pn ∂ q̃ls
Pn ∂ q̃l1
j1
js
js =1 ∂q js (p)dqp ).
j1 =1 ∂q j1 (p)dqp , . . . ,
Por tanto, usando la multilinealidad de los tensores se tiene
s
t̃lk11,...,l
,...,kr =
n
X
i1 ,...,js
∂q i1
∂q ir
∂ q̃ l1
∂ q̃ ls
...js
(p)
·
·
·
(p)
·
(p)
·
·
·
(p) · tji11...i
. (6.2)
r
k1
kr
j1
js
∂
q̃
∂
q̃
∂q
∂q
=1
La expresión (6.2) proporciona la definición clásica por coordenadas
de tensor (r, s) en p, esto es: una asignación de nr+s números reales a
cada entorno coordenado de p que se transforma según (6.2).
6.2. TENSORES SOBRE VARIEDADES
115
Observación. La elección de las posiciones de los ı́ndices (“contravariantes” arriba, “covariantes” abajo) facilita recordar mnemotécnicamente expresiones tensoriales generales como (6.2): (i) siempre que hay un
sumatorio de dos ı́ndices, uno de ellos aparece arriba y otro abajo, (ii)
si un ı́ndice queda suelto (sin sumarse en él) en uno de los miembros de
la igualdad, también quedará suelto en el otro, y en la misma posición.
Nota (Sobre el electromagnetismo en Relatividad Especial). Clásicamente se suponı́a que cada observador inercial O medı́a en cada instante de
tiempo t y en cada punto p del espacio fı́sico ordinario tridimensional
~ t (p) ≡
(al que asigna unas coordenadas (x, y, z)), un campo eléctrico E
~
~
~
E(t, x, y, z) y un campo magnético Bt (p) ≡ B(t, x, y, z). Otro obser~ 0 (p) ≡ E
~ 0 (t, x0 , y 0 , z 0 ) y un
vador inercial O0 medirá un campo eléctrico E
t
~ t0 (p) ≡ B
~ 0 (t, x0 , y 0 , z 0 ). Si, por ejemplo, O0 se mueve
campo magnético B
a lo largo del eje x de O con velocidad constante v, desde el punto de
vista de Galileo la transformación de coordenadas que los observadores
inerciales encuentran para los puntos del espacio fı́sico es:
x0 = x − vt
y0 = y
z 0 = z.
(6.3)
Nótese que t desempeña el papel de un parámetro (igual para O y O’)
independiente de p. Ası́,
∂
∂
|p =
|p ;
∂x
∂x0
∂
∂
|p = 0 |p ;
∂y
∂y
∂
∂
|p = 0 |p .
∂z
∂z
(6.4)
Si los campos eléctrico y magnético fueran vectores sobre el espacio
~ t (p) = E
~ t0 (p), B
~ t (p) = B
~ t0 (p) y
fı́sico medibles por O y O0 , entonces E
~ t (p) y B
~ t (p)
las igualdades (6.4) conducirı́an a que las coordenadas de E
0
deberı́an ser las mismas para O y O . Por el contrario, se sabe de las
distintas leyes de la electrodinámica que ello no ocurre ası́. Es mérito de
Einstein percatarse del siguiente hecho. Consideremos el tiempo como
una coordenada más (esto es, ahora la variedad Q es el espacio-tiempo
fı́sico, formado por todos los “eventos” espacio-temporales) y consideremos las ternas (E 1 , E 2 , E 3 ), (B 1 , B 2 , B 3 ) obtenidas de las mediciones
~ x, y, z), B(t,
~ x, y, z) por cada observador inercial O. Podemos
de E(t,
construir el tensor electromagnético F para O, definido por la matriz
116
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
de coordenadas :

0
E1
E2
E3
 −E 1
0
B 3 −B 2 
.
(Fij ) = 
 −E 2 −B 3
0
B1 
−E 3 B 2 −B 1
0

Supongamos ahora que, entre cada dos observadores inerciales O, O0
la transformación de coordenadas (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) asignada a
un mismo evento espacio-temporal, en lugar de verificar la transformación galileana (6.3) (más la implı́cita t = t0 ), verifica la igualdad
(6.1) para alguna matriz A en el grupo de Lorentz (esto es, tal que
AηAt = η, donde η es la matriz diagonal -1,+1,+1,+1). Entonces “la
matriz (Fij )i,j se transforma como un tensor entre observadores inerciales”, esto es: el tensor electromagnético F construido por O en
~ x, y, z), B(t,
~ x, y, z) coin(t, x, y, z) a partir de sus mediciones de E(t,
cide con el tensor electromagnético F 0 construido por cualquier otro
observador inercial O0 en ese punto a partir de sus propias mediciones
~ 0 (t0 , x0 , y 0 , z 0 ), B
~ 0 (t0 , x0 , y 0 , z 0 ).
de E
6.2.2.
Campos tensoriales
Un campo tensorial T tipo (r, s) sobre una variedad Q es una asignación de un tensor Tp ∈ Tr,s (Tp Q) a cada punto p ∈ Q. Dado el campo T y un entorno coordenado (U, ϕ = (q 1 , . . . , q n )), existen funciones
,...,js
tji11,...,i
, i1 , . . . , js ∈ {1, . . . , n} definidas en U tales que
r
Tp =
n
X
i1 ,...,js =1
,...,js
tji11,...,i
(p)·dqpi1 ⊗· · ·⊗dqpir ⊗
r
∂
∂
|p ⊗ · · ·⊗ js |p
j
1
∂q
∂q
∀p ∈ U.
Diremos que el campo tensorial T es continuo (resp. diferenciable C r )
...js
en p si todas las funciones tij11...i
son continuas (resp. diferenciables
r
r
C ) en p. A partir de ahora adoptaremos el convenio de llamar campos
tensoriales a aquéllos que son diferenciables C ∞ .
Observación. Recordemos que habı́amos definido un campo de vectores como una aplicación X : Q → T Q tal que π ◦ X = IdQ , siendo
π(vp ) = p para todo p ∈ Q. Una definición análoga puede darse para
campos tensoriales en general. Para ello, consideramos:
Tr,s (Q) ≡ ∪p∈Q Tr,s (Tp Q),
6.3. FORMAS DIFERENCIALES
117
que, de forma natural, es una variedad de dimensión n + nr+s , Un
campo tensorial tipo (r, s) es una aplicación T : Q → Tr,s (Q) tal que
πr,s ◦ T = IdQ , siendo πr,s : Tr,s (Q) → Q la proyección canónica, esto
es, πr,s (Tp ) = p, ∀Tp ∈ Tr,s (Q). Denotamos por Xr,s (Q) al conjunto de
todos los campos tensoriales (diferenciables) (r, s) sobre Q. Al igual
que X(Q), también Xr,s (Q) tiene estructura de espacio vectorial (de
dimensión infinita si dim Q > 0) y de C ∞ (Q)-módulo.
Definición 6.2.1 Sea T un campo tensorial tipo (2, 0) sobre Q. Diremos que T es simétrico (resp. antisimétrico) si Tp es simétrico (resp.
antisimétrico) para todo p ∈ Q; esto es, si
Tp (vp , wp ) = Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q
(resp. Tp (vp , wp ) = −Tp (wp , vp ) ∀vp , wp ∈ Tp Q, ∀p ∈ Q).
Ejercicio. Consideremos el campo tensorial sobre R2
g = dx ⊗ dx + dy ⊗ dy(≡ dx2 + dy 2 ).
Escrı́banse sus coordenadas en la base inducida por las coordenadas
polares.
6.3.
Formas diferenciales
Definición 6.3.1 Una forma diferencial (tipo (1, 0) ó 1-forma diferencial) α es un campo de formas lineales, esto es, de tensores tipo
(1, 0).
Denotaremos por Λ1 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales.
Ahora podemos reobtener el concepto de variedad cotangente a Q
(definida ya en la Sección 4.2) sin más que tener en cuenta T1,0 (Q) =
T Q∗ .De nuevo, Λ1 (Q) es un espacio vectorial (de dimensión ∞) y un
C ∞ (Q)-módulo. La diferente notación introducida hasta ahora se resume en el siguiente esquema:
(r, s) cualquiera
Tr,s (Q)
Xr,s (Q)
r = 0, s = 1
TQ
X(Q)
r = 1, s = 0
T Q∗
Λ1 (Q).
118
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
1
Además, si α ∈
(Q) y (U, q 1 , . . . , q n ) es un entorno coordenado de Q
PΛ
n
entonces α = i=1 αi dq i , siendo αi = α( ∂q∂ i ).
Un ejemplo relevante de forma de diferencial es la diferencial de una
función f ∈ C ∞ (Q) esto es, df ∈ Λ1 (Q).
Definición 6.3.2 Una forma diferencial (2, 0) o 2-forma diferencial Ω
sobre una variedad Q es un campo tensorial tipo (2, 0) que es antisimétrico, esto es, tal que Ωp (vp , wp ) = −Ωp (wp , vp ), ∀vp , wp ∈ Tp Q y
∀p ∈ Q.
Denotaremos por Λ2 (Q) al conjunto de todas las formas diferenciales, dotado de sus operaciones naturales.
Recordemos que si φ, ψ ∈ Tp Q entonces φ ∧ ψ = φ ⊗ ψ − ψ ⊗ φ es
un tensor (2, 0) antisimétrico y, obviamente, el producto ∧ se extiende
naturalmente a formas diferenciales. Además, si Ω ∈ Λ2 (Q) entonces
Ω=
n
X
Ωij dq i ⊗ dq j ,
i,j=1
donde Ωij = Ω( ∂q∂ i , ∂q∂ j ) = −Ω( ∂q∂ j , ∂q∂ i ) = −Ωji . Ası́,
Ω=
X
Ωij dq i ∧ dq j ,
1≤i<j≤n
siendo Ωii = 0 para todo i.
Nota. En general, para todo entero r no negativo se puede definir el
concepto de r-forma diferenciable sin más que extender el concepto de
antisimetrı́a a tensores tipo (r, 0) (si r = 0 se define Λ0 (Q) ≡ C ∞ (Q)).
Ası́, el espacio vectorial y C ∞ (Q)-módulo de todas las r-formas diferenciales sobre Q se denota por Λr (Q).
6.4.
La diferencial exterior
6.4.1.
Formas exactas
Definición 6.4.1 Diremos que una forma diferencial α ∈ Λ1 (Q) es
exacta si existe una función f ∈ C ∞ (Q) tal que α = df .
6.4. LA DIFERENCIAL EXTERIOR
119
Una
interesante consiste en cuándo una forma diferencial α =
Pn cuestión
i
i=1 αi dq es exacta. Obsérvese que, en caso afirmativo,
n
X
∂f i
dq ,
α=
i
∂q
i=1
f ∈ C ∞ (Q)
y, por tanto,
∂αi
∂ 2f
∂ 2f
∂αj
=
=
=
.
j
j
i
i
j
∂q
∂q ∂q
∂q ∂q
∂q i
Esto es, si α es exacta entonces en cualquier sistema de coordenadas:
∂αi
∂αj
=
j
∂q
∂q i
∀i, j ∈ {1, . . . , n}.
(6.5)
Más adelante veremos que la condición (6.5) no sólo es una condición necesaria para que α sea exacta sino que, localmente, también
es suficiente (Teorema 6.4.6). Pero antes definiremos el concepto de
diferencial de una forma, que, como veremos, extiende al de una función. Este concepto nos permitirá comprobar que la igualdad (6.5) es
independiente de coordenadas, esto es, si para unas coordenadas sobre un abierto U se verifica (6.5), entonces también se verifica para
cualesquiera otras coordenadas en U .
6.4.2.
Diferencial de formas. Lema de Poincaré
Pn
i
Sea α =
i=1 αi dq la expresión de una forma diferencial en un
entorno coordenado (U, ϕ = (q 1 , . . . , q n )) de Q. Por analogı́a con la
diferencial de una función, no resulta extraño definir la diferencial exterior de α (en esas coordenadas) como
dα =
n
X
dαi ∧ dq i .
i=1
Obsérvese que dαi =
Pn
∂αi
j
j=1 ∂q j dq ,
dα =
por lo que
n X
n
X
∂αi
i=1 j=1
∂q j
· dq j ∧ dq i ,
(6.6)
120
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
o también,
X
dα =
(
1≤i<j≤n
∂αi ∂αj
− i ) · dq j ∧ dq i .
∂q j
∂q
(6.7)
Sin embargo, para que esta definición sea consistente, debe resultar
independiente de coordenadas, como comprobamos a continuación.
Proposición 6.4.2 Sea α ∈ Λ1 (Q), y sean (U, ϕ = (q 1 , . . . , q n )),
(Ũ , ϕ̃ = (q̃ 1 , . . . , q̃ n )) do entornos coordenados con U ∩ Ũ 6= ∅, escribiéndose en U ∩ Ũ :
α=
n
X
αi dq i =
i=1
Entonces:
n
X
j=1
n
X
α̃j dq̃ j .
j=1
j
dα̃j ∧ dq̃ =
n
X
dαk ∧ dq k .
(6.8)
k=1
Llamaremos diferencial exterior dα de α a la 2-forma diferencial definida en cada entorno coordenado por la expresión (6.8).
Demostración. Como
à n
!
µ
¶
µ
¶ X
n
n
k
X
X
∂
∂q ∂
∂q k
∂
∂q k
α̃j = α
=α
=
α
=
αk ,
∂ q̃ j
∂ q̃ j ∂q k
∂ q̃ j
∂q k
∂ q̃ j
k=1
k=1
k=1
(que es un caso particular de (6.2)) se tiene:
à n
!
¶
n
n µ
X
X
∂ X ∂q k
∂ 2qk
∂q k ∂αk
l
dα̃j =
α dq̃ =
α + j
dq̃ l .
l
j k
l ∂ q̃ j k
l
∂
q̃
∂
q̃
∂
q̃
∂
q̃
∂
q̃
l=1
k=1
k,l=1
En consecuencia,
P
Pn
2 k
k ∂α
j
k
= nj,k,l=1 ( ∂∂q̃l ∂q q̃j αk + ∂q
)dq̃ l ∧ dq̃ j
j=1 dα̃j ∧ dq̃
∂ q̃ j ∂ q̃ l
Pn
P
k
k
= k,l,j=1 ( ∂α
dq̃ l ) ∧ ( ∂q
dq̃ j ) = nk=1 dαk ∧ dq k ,
∂ q̃ j
∂ q̃ l
donde se ha usado que
n
X
∂ 2qk
dq̃ l ∧ dq̃ j = 0
l ∂ q̃ j
∂
q̃
l,j=1
6.4. LA DIFERENCIAL EXTERIOR
121
por la antisimetrı́a de ∧. 2
El siguiente resultado caracteriza a la diferencial exterior, y puede
tomarse como definición alternativa de ella.
Teorema 6.4.3 Sea α ∈ Λ1 (Q), y X, Y ∈ X(Q). Entonces:
dα(X, Y ) = X(α(Y )) − Y (α(X)) − α([X, Y ]).
Demostración. Resulta inmediato de (6.7) en el caso de que X, Y sean
campos coordenados. Para el caso general, obsérvese que cada miembro es C ∞ (Q)−lineal en X e Y , esto es, resulta equivalente en cada
miembro multiplicar por f ∈ C ∞ (Q) que reemplazar X (resp. Y ) por
f X (resp. f Y ) . 2
Ejercicio. Demuéstrese que la aplicación diferencial exterior d : Λ1 (Q) →
Λ2 (Q) es lineal y verifica:
d(f α) = df ∧ α + f dα, ∀f ∈ Λ0 (Q), ∀α ∈ Λ1 (Q).
Podemos caracterizar ahora la igualdad (6.5).
Definición 6.4.4 Diremos que una forma diferencial α ∈ Λ1 (Q) es
cerrada si dα = 0, esto es, si en cualesquiera coordenadas verifica
(6.5).
De la discusión al comienzo de la Subsección 6.4.1 se tiene:
Corolario 6.4.5 Si α ∈ Λ1 (Q) es exacta (α = df ) entonces α es
cerrada (dα = 0).
Veamos a continuación un recı́proco parcial de este resultado.
Teorema 6.4.6 (Lema de Poincaré). Sea α ∈ Λ1 (Q) una forma diferencial cerrada. Para cada p ∈ Q existe un entorno abierto V de p y
una función f : V → R tal que α = df sobre V .
Demostración. Consideremos un entorno coordenado (U, ϕ = (q 1 , . . . ,
q n )) de p ∈ Q tal que ϕ(p) = 0. Sea δ > 0 tal que ]−δ, δ[n ⊂ ϕ(U ) ⊆ Rn ,
y tomemos V = ϕ−1 (] − δ, δ[n ). Todo se reduce a hallar una función f
tal que
∂f
= αi ∀i ∈ {1, . . . , n}.
(6.9)
∂q i
122
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
Ahora bien, como α es cerrada, la solución explı́cita del sistema de
ecuaciones (6.9) es:
R q1
R q2
f (q 1 , . . . , q n ) = 0 α1 (t, q 2 , . . . , q n )dt + 0 α2 (0, t, q 3 , . . . , q n )dt+
R q3
R qn
+ 0 α3 (0, 0, t, q 4 , . . . , q n )dt + . . . + 0 αn (0, . . . , 0, t)dt + C
para cualquier C ∈ R.1 2
Una cuestión interesante es “cómo de grande” puede tomarse V en
el Lema de Poincaré. De la demostración anterior resulta obvio que
si Q = Rn entonces es posible tomar V = Rn . Con más generalidad,
es posible demostrar que podemos asumir V = Q siempre que Q sea
“simplemente conexa” (véase el Apéndice 1). Concretamente:
Teorema 6.4.7 Sea Q una variedad simplemente conexa. Una forma
diferencial α ∈ Λ1 (Q) es cerrada si y sólo si es exacta.
A veces, aunque α no sea cerrada existe una función h ∈ C ∞ (Q), h > 0,
tal que h · α es cerrada. Se dice entonces que h es un factor integrante
de α. Obviamente, en este caso h verifica la ecuación
d(h · α) = dh ∧ α + hdα = 0.
Observemos que, al no anularse h, el núcleo de la forma lineal h(p)·αp :
Tp Q → R coincide con el de αp . Por otra parte, es fácil comprobar que
dos formas lineales que tengan igual núcleo son proporcionales. Dada
una forma diferencial α la colección de todos los núcleos de las correspondientes formas lineales αp , p ∈ Q determina cuándo α admite
factores integrantes. De hecho, del Teorema 6.4.3 es inmediato deducir
que si α ∈ Λ1 (Q) admite un factor integrante, entonces para cualesquiera X, Y ∈ X(Q) con α(X) ≡ α(Y ) ≡ 0 se tiene α([X, Y ]) ≡ 0.
El recı́proco también es cierto localmente; en particular, en dimensión
2 toda forma diferencial admite localmente factores integrantes.
6.5.
Circulación de una forma diferencial
Consideremos una forma diferencial α ∈ Λ1 (Q) y una curva diferenciable γ : [a, b] → Q. Es posible definir la composición:
α ◦ γ 0 (t) = αγ(t) (γ 0 (t)) ∈ R,
1
∀t ∈ [a, b],
Esto es bien sabido del estudio elemental de ecuaciones en derivadas parciales,
y se puede comprobar directamente derivando.
6.5. CIRCULACIÓN DE UNA FORMA DIFERENCIAL
123
que resulta ser una aplicación diferenciable [a, b] → R. Definimos la
circulación de α a lo largo de γ como la integral de esta aplicación:
Z
Z b
α :=
α(γ 0 (t))dt.
(6.10)
γ
a
Esta definición se extiende de manera natural al caso en el que γ sea
sólo diferenciable a trozos (véase la Sección ??, Observación (3); el integrando no estarı́a bien definido sólo en un conjunto finito de puntos).
Una consecuencia interesante de la linealidad de α es que la circulación
resulta independiente de la reparametrización de γ. Con más precisión:
Proposición 6.5.1 Consideremos una forma diferencial α ∈ Λ1 (Q),
una curva γ : [a, b] → Q y una aplicación diferenciable t : [c, d] → [a, b],
s 7→ t(s) con t(c) = a, t(d) = b. Si definimos γ̄ : [c, d] → Q como2
γ̄(s) = γ(t(s)), entonces la circulación de α a lo largo de γ coincide
con la circulación de α a lo largo de γ̄.
Demostración. Del comportamiento de la integral frente al cambio de
variable y de la linealidad de α se tiene:
Z b
Z d
Z d
dt
0
0
α(γ (t))dt =
α(γ (t(s))) ·
· ds =
α(γ̄ 0 (s))ds. 2
ds
a
c
c
Cuando γ cae dentro de un entorno coordenado (U, q 1 , . . . , q n ) se verifica:
Z b
n Z b
X
dq i (t)
0
α(γ (t))dt =
αi (q 1 (t), . . . , q n (t))
dt,
(6.11)
dt
a
a
i=1
siendo γ(t) = (q 1 (t), . . . , q n (t)). En la práctica, se suele calcular la
circulación mediante la expresión:
n Z b
X
dq i (t)
1
n
αi (q (t), . . . , q (t))
dt
dt
i=1 a
2
Cuando t0 (s) > 0 en todo punto se dice que γ̄ es una reparametrización (creciente) de γ, aunque esta hipótesis no es necesaria para la presente proposición. En
cualquier caso, la condición t(c) = a, t(d) = b implica que la derivada sea positiva
en un subconjunto de [c, d]; si reemplazamos esta condición por t(c) = b, t(d) = a
entonces el signo de la circulación a lo largo de γ̄ cambia con respecto a γ. Obsérvese
además que, en el caso de que γ(a) = γ(b), la condición t(c) = a, t(d) = b implica
intuitivamente que el “número de vueltas” con el que finalmente se recorre γ sea
igual al “número de vueltas” con el que se recorre γ̄.
124
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
=
n Z
X
i=1
q1i
q0i
αi (q 1 (q i ), . . . , q i , . . . , q n (q i ))dq i ,
(6.12)
(q01 , . . . , q0n ),
siendo γ(a) ≡
γ(b) ≡ (q11 , . . . , q1n ). En ocasiones, en lugar
de la expresión “circulación de α a lo largo de γ” se habla de “integral
de lı́nea (o camino) de α a lo largo de (la imagen de) γ”, con lo que se
pone más de manifiesto su invariancia ante reparametrizaciones.
Si conocemos la circulación de α a lo largo de cualquier curva entonces podemos reconstruir α. Con más precisión, de (6.11) se sigue
inmediatamente:
Proposición 6.5.2 Si vp ∈ Tp Q y si γ : [0, ²] → Q, ² > 0 es una
curva diferenciable con γ 0 (0) = vp , entonces se verifica
Rt
α(γ 0 (t))dt
0
.
α(vp ) = limt→0
t
La circulación de α a lo largo de dos curvas distintas γ y γ̃ no tiene por
qué coincidir aunque los extremos de γ y γ̃ sı́ lo hagan. Sin embargo,
esto sı́ coincide cuando α es exacta. En efecto, si α = df entonces
Z b
Z b
Z b
d(f ◦ γ)
0
0
α(γ (t))dt =
df (γ (t))dt =
dt = f (γ(b)) − f (γ(a)).
dt
a
a
a
(6.13)
De hecho, esta propiedad caracteriza a las formas diferenciales exactas:
Teorema 6.5.3 Resultan equivalentes:
(i) α es una forma diferencial exacta.
(ii) Para cualesquiera dos curvas γ : [a, b] → Q, γ̃ : [c, d] → Q con
γ(a) = γ̃(a), γ(b) = γ̃(b) la circulación de α a lo largo de γ
coincide con la circulación de α a lo largo de γ̃.
Demostración. La implicación (i) ⇒ (ii) se reduce a (6.13). Para la
recı́proca, escojamos un punto p0 en (cada parte conexa de) Q. Para
cada punto p (en esa parte conexa -y, por tanto, arcoconexa) tomamos
una curva γ : [0, b] → Q que conecte p0 con p. Definimos f escogiendo
f (p0 ) ∈ R arbitrariamente y tomando:
Z b
f (p) = f (p0 ) +
α(γ 0 (t))dt.
(6.14)
0
6.6. APÉNDICE 1: CONEXIÓN SIMPLE
125
La función f está bien definida por la hipótesis (ii). Si v = γ 0 (0) ∈
Tp0 Q, de
d(f ◦ γ)
(0), v = γ 0 (0)
dt
y (6.14) se comprueba que αp0 (v) = dfp0 (v). Para comprobar la igualdad entre α y df en cualquier otro punto p1 (de la misma parte conexa
de p0 ), basta con darse cuenta de que la igualdad (6.14) se verifica
también sustituyendo f (p0 ) por f (p1 ) y tomando curvas que conecten
p1 con cada p (fı́jese una curva γ0 que conecte p0 con p1 y yuxtapóngase
con cualquiera que conecte p1 con p). 2
Si α es cerrada pero no exacta entonces las circulaciones de α a
lo largo de γ y γ̃ no tienen por qué coincidir. Ahora bien, si γ y γ̃
son homotópicas (véase el Apéndice 1) entonces estas circulaciones
necesariamente coinciden. Una explicación intuitiva de este hecho es
que, al ser γ y γ̃ homotópicas, ambas caen en un conjunto simplemente
conexo U de Q. Por tanto, α es exacta sobre U y el resultado se sigue
del Teorema 6.5.3.
dfp (v) =
Ejercicio. Sea α una forma diferencial cerrada sobre Q = R2 \{0}.
Pruébese que es exacta si y sólo si su circulación a lo largo de la curva
γ(t) = (cos t, sent), t ∈ [0, 2π] es nula. Generalı́cese a Q igual a R2
menos un conjunto finito de puntos.
6.6.
Apéndice 1: variedades simplemente
conexas
A continuación introducimos el concepto de conexión simple. Este
concepto es aplicable a todo espacio topológico aunque, por comodidad,
puede suponerse que el espacio topológico es siempre una variedad
(topológica) Q.
Fijados p, q ∈ Q, diremos que la curva (continua) γ : [0, 1] → Q
conecta p con q si p = γ(0), q = γ(1). En el caso particular p = q,
diremos que γ es un lazo en p. Dada otra curva γ̃ : [0, 1] → Q que
conecte p y q se dice que γ y γ̃ son homotópicas si existe una aplicación
continua
H : [0, 1] × [0, 1] → Q
(s, t) 7→ γs (t)
126
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
tal que cada curva γs conecta p y q, ∀s ∈ [0, 1] y, además, γ0 = γ,
γ1 = γ̃. Un lazo γ en p se dice homotópico nulo si es homotópico al
lazo constantemente igual a p.
Definición 6.6.1 Una variedad3 conexa Q es simplemente conexa si
todo lazo en p es homotópico nulo, ∀p ∈ Q.
Al ser la variedad conexa, no es difı́cil comprobar que si la anterior
condición se verifica en un punto entonces se verifica en todos los puntos.
Algunos ejemplos de espacios simplemente conexos son Rn , S n con
n ≥ 2 y R3 − {p} (para cualquier p ∈ R3 ). Ejemplos de espacios que
no son simplemente conexos son S 1 , R2 − {p} y R3 − {r} donde r es
cualquier lı́nea recta.
Nota. Resulta relevante que todo espacio topológico arcoconexo Q admite (bajo hipótesis muy generales satisfechas por cualquier variedad)
un recubridor universal (Q̃, Π), donde Q̃ es un espacio topológico simplemente conexo y Π : Q̃ → Q una aplicación recubridora, esto es, un
homeomorfismo local que verifica: todo punto p ∈ Q admite un entorno
conexo V tal que Π restringido a cada parte conexa de Π−1 (V ) es un
homeomorfismo sobre V . En el caso de que Q sea una variedad diferenciable, la aplicación recubridora Π induce de manera natural una
(única) estructura diferenciable sobre Q̃, para la cual Π resulta ser un
difeomorfismo local4 .
Análogas conclusiones se derivan para el caso de variedades complejas (véase la nota al concepto de variedad anterior a la Sección
2.3). De hecho, la superficie de Riemann Q̃ que se construye en variable compleja para una función holomorfa f sobre C con singularidades aisladas, es un ejemplo tı́pico de variedad (real de dimensión
2, compleja de dimensión 1) construida de tal modo que la aplicación
3
En principio, los conceptos de homotopı́a y de conexión simple son aplicables a
todo espacio topológico, por lo que se formulan sólo con continuidad. No obstante,
en variedades se puede suponer que todos los elementos son diferenciables (o diferenciables a trozos) sin pérdida de generalidad. De hecho, toda curva continua que
conecte dos puntos fijos es homotópica a una diferenciable, y si dos curvas diferenciables son continuamente homotópicas entonces también son diferenciablemente
homotópicas.
4
Discutiremos con más detalle estas propiedades en el Tema 8, Apéndice 8.7
6.7. APÉNDICE 2: TERMODINÁMICA
127
Π : Q̃ → C\{singularidades} que identifica puntos de diversas hojas de
Q̃ resulta ser una aplicación recubridora (diferenciable compleja). Ası́,
p. ej., la superficie de Riemann Q̃ de la aplicación logaritmo neperiano,
dotada de su proyección natural Π : Q̃ → C\{0}, puede verse como el
recubridor universal de C\{0}.
6.7.
Apéndice 2: Termodinámica
Consideramos los “estados de equilibrio” de un sistema termodinámico (simple) como puntos de una variedad5 M que, por sencillez, supondremos simplemente conexa.
Cada “proceso casiestático” de un estado p ∈ M a un estado q ∈ M
se modela por una curva diferenciable γ : [a, b] → M con γ(a) = p,
γ(b) = q. El parámetro de la curva no debe interpretarse como el
tiempo (los estados son de equilibrio). Como estaremos interesados en
circulaciones de formas, por la Proposición 6.5.1 no nos importará la
reparametrización de γ.
En cada proceso casiestático γ, el fı́sico es, en principio, capaz de
calcular el calor transferido Q y el trabajo realizado L por el sistema.
La independencia de Q y L con la reparametrización de γ sugiere que
ambos son circulaciones de formas diferenciales. La Proposición 6.5.2
permitirı́a calcular entonces estas formas. Postulamos entonces que exˆ y dL,
ˆ cuyas circulaciones a lo largo
isten dos formas diferenciales, dQ
de cualquier proceso casiestático γ proporcionan, respectivamente, Q
y L. Nótese que dˆ es sólo una notación, no representa diferenciales de
ˆ dL
ˆ ∈ Λ1 (M ). La notación simplemente sugiere que el
funciones, dQ,
calor o trabajo transferidos a lo largo del proceso γ se obtiene como
una circulación a lo largo de él.
ˆ dL
ˆ pueden ser arbitrarias, con la única
En principio, las formas dQ,
restricción de que en ningún punto se anulen. Sin embargo, existen
razones fı́sicas por las que se postula que su diferencia es exacta, esto
es:
(Primer Principio de la Termodinámica.) Existe una función U , la energı́a interna del sistema termodinámico, que
verifica:
ˆ − dL
ˆ = dU.
dQ
5
En esta sección reservamos la letra Q para el calor transferido por el sistema.
128
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
ˆ dL
ˆ no sean cerradas, se admite que dL
ˆ es expresable
Aunque dQ,
en términos de funciones con significado fı́sico sobre M , tı́picamente
ˆ = −P dV , donde P es la presión del sistema y V : M → (0, ∞)
dL
ˆ De nuevo, exisel volumen; ası́, 1/P es un factor integrante de dL.
ˆ también debe admitir un factor
ten razones fı́sicas para creer que dQ
integrante:
(Segundo Principio de la Termodinámica). La inversa de la
temperatura T del sistema fı́sico es un factor integrante de
ˆ esto es 1 dQ
ˆ es cerrada. Al ser M simplemente conexa,
dQ,
T
podemos escribir:
1ˆ
dQ = dS
T
para una función S sobre M , a la que se le llamará entropı́a
del sistema fı́sico.
Una consecuencia del Segundo Principio de la Termodinámica es el
“Teorema de Caratheodory”, la conclusión del cual puede admitirse
como un postulado alternativo al Segundo (“Postulado de Caratheodory”). Para analizarlo téngase en cuenta el siguiente resultado general
[AMR, Section 8.4.1]:
Teorema 6.7.1 Sea M simplemente conexa y α ∈ Λ1 (M ) tal que αp 6=
0, ∀p ∈ M . Equivalen:
(i) α admite un factor integrante.
(ii) Para ningún p ∈ M existe un entorno suyo U tal que el punto p
y cada q ∈ U puedan conectarse mediante una curva γ con α ◦ γ 0 ≡ 0.
[Es fácil comprobar (i) ⇒ (ii). De hecho, si h·α = df entonces α◦γ 0 ≡ 0
equivale a df ◦ γ 0 ≡ 0, esto es, f ◦ γ ≡ constante. Por tanto, mediante
curvas γ con α ◦ γ 0 ≡ 0 sólo podremos conectar p y q si f (p) = f (q).]
Una vez admitido el Segundo Postulado de la Termodinámica, el
Teorema de Caratheodory afirma:
Para todo estado p ∈ M existen estados arbitrariamente
próximos de p (esto es, una sucesión {pn }n → p, pn ∈
M − {p}, ∀n ∈ N) que son inaccesibles desde p por vı́a
adiabática (esto es, no existe ningún proceso casiestático γ
0
ˆ
entre p y pn tal que dQ(γ
(t)) ≡ 0).
Claramente, esta conclusión es una reformulación de (i) ⇒ (ii) en el
teorema anterior.
6.7. APÉNDICE 2: TERMODINÁMICA
129
Ejercicios
Ejercicio 1. Exprésese en coordenadas cilı́ndricas el campo tensorial
sobre R3 : T = xyzdx ⊗ dz ⊗ ∂/∂y.
Ejercicio 2. Pruébese que para toda función f sobre una variedad
diferenciable Q se verifica d(df ) = 0.
Ejercicio 3. Sean α, β ∈ Λ1 (Q), Ω ∈ Λ2 (Q), f ∈ C ∞ (Q) ≡ Λ0 (Q) y
sea F : Q0 → Q diferenciable. Definimos (véase también la Definición
8.5.6.) F ∗ α : T Q0 → R por
F ∗ α(vp0 ) = α(dFp0 (vp0 )),
∀vp0 ∈ Tp0 Q0 , ∀p0 ∈ Q0 ,
y, análogamente, F ∗ Ω : T Q0 × T Q0 → R. Demuéstrese:
(i) F ∗ α ∈ Λ1 (Q0 ), F ∗ Ω ∈ Λ2 (Q0 ).
(ii) F ∗ α ∧ F ∗ β = F ∗ (α ∧ β).
(iii) d(F ∗ α) = F ∗ dα, d(f ◦ F ) = F ∗ df .
(iv) si α es cerrada (resp. exacta), F ∗ α es cerrada (resp. exacta).
Ejercicio 4. Se considera la forma diferencial α = (xdy − ydx)/(x2 +
y 2 ) sobre R2 − {(0, 0)}. ¿Es α cerrada? ¿Es exacta?
Sea Π : R+ × R → R2 − {(0, 0)}, (ρ, θ) → (ρ cos θ, ρsenθ). En la
notación del ejercicio anterior, ¿es Π∗ α cerrada? ¿Es exacta?
Ejercicio 5. En R+ × R+ se considera la 1-forma diferencial α =
y
dx + 2dy. ¿Es α cerrada o exacta? ¿Admite un factor integrante?
x
Calcúlese su circulación a lo largo del rectángulo de extremos los puntos
(1, 1), (3, 1), (3, 2), (1, 2) en sentido de giro positivo.
Ejercicio 6. En todo R2 \{0} se considera la forma diferencial que,
en el dominio de definición de las coordenadas polares, se expresa como α = ρdθ + ρ2 dρ. Sea α̂ su restricción a la circunferencia unidad.
Determı́nese si α y α̂ son cerradas o exactas. Calcúlese la circulación
de ambas a lo largo de la curva γ(t) = (cos t, sent), t ∈ [0, 3π].
Ejercicio 7. En R2 \{0} se considera la forma diferencial
α=
x2
¡ 3
¢
1
(x + xy 2 − y)dx + (yx2 + y 3 + x)dy .
2
+y
Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es
α cerrada? ¿Es exacta?
130
CAPÍTULO 6. TENSORES Y FORMAS DIFERENCIALES
Ejercicio 8. Sea Q la variedad formada por R2 ×]0, ∞[ menos el eje z,
y considérense las formas diferenciales α, β ∈ Λ1 (Q) que, en el dominio
de definición de las coordenadas cilı́ndricas, vienen dadas por:
α = ρsen(2θ)dρ + ρ2 cos(2θ)dθ +
1 2
ρ sen(2θ)dz,
2z
β = z α.
(i) ¿Son α y β cerradas? ¿Son exactas?
(ii) Calcúlese la circulación de ambas a lo largo de la curva
½
(cos t, sent, 1),
t ∈ [0, 2π]
γ(t) =
(1, 0, t − 2π + 1), t ∈ [2π, 2π + 2].
Ejercicio 9. En R2 \{0} se considera la forma diferencial
µ
¶
µ
¶
y
x
α= x− 2
dx + y + 2
dy.
x + y2
x + y2
Calcúlese su circulación a lo largo de γ(t) = (cos t, sent), t ∈ [0, π]. ¿Es
α cerrada? ¿Es exacta?
Ejercicio 10. Determı́nense las posibles funciones f ∈ C ∞ (R4 ) para
que la forma diferencial sobre R4 , µ = (y + z + t)dx + (x + z + t)dy +
(x + y + t)dz + f dt, sea cerrada, y entonces muéstrese explı́citamente
que es exacta.
Capı́tulo 7
Campos tensoriales métricos
Cuando a cada espacio tangente Tp Q de una variedad Q se le fija un
producto escalar gp se tiene una variedad semi-riemanniana (en particular, riemanniana o lorentziana según el ı́ndice del producto escalar).
Puesto que gp determina un isomorfismo canónico entre Tp Q y su espacio dual, en este capı́tulo traduciremos las propiedades de las formas
diferenciales vistas en el capı́tulo anterior a campos vectoriales. En
particular, definiremos los campos conservativos e irrotacionales como
los asociados a formas exactas y cerradas, respectivamente. También
definiremos el concepto de variedades semi-riemannianas isométricas,
que permite decidir cuándo dos variedades semi-riemannianas tienen
todas sus propiedades iguales. Finalmente, anticipamos el concepto de
distancia asociada a una métrica riemanniana, que desarrollaremos más
ampliamente en el Capı́tulo ??.
7.1.
Concepto de métrica riemanniana y
lorentziana
Sea V (R) un espacio vectorial real y h·, ·i un tensor 2-covariante y
simétrico (métrica) sobre él. Por el Teorema de Sylvester es bien sabido
que existe una base B = (v1 , . . . , vs , vs+1 , . . . vr , vr+1 , . . . , vn ) de V tal
131
132
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
que
hvi , vj i = 0 si i 6= j

 −1 si i = 1, . . . , s
1 si i = s + 1, . . . , r
y hvi , vi i =

0 si i = r + 1, . . . , n.
A las bases en las que h·, ·i adopta esta expresión se les llama ortonormales. Los valores de s, r ∈ {0, 1, . . . , n} son independientes de la base
ortonormal escogida y reciben el nombre de ı́ndice y rango de h·, ·i,
respectivamente. Se dice que h·, ·i es:
(1) no degenerado o un producto escalar si r = n. Ello ocurrirá si y
sólo si la matriz asociada (hvi , vj i)i,j es regular (su determinante
es distinto de 0) para alguna base B = (v1 , . . . , vn ) de V (y, en
este caso, la matriz es regular para cualquier base).
Equivalentemente: si un vector v ∈ V verifica hv, wi = 0 para
todo w ∈ V , entonces necesariamente v = 0.
(2) un producto escalar euclı́deo si s = 0 y r = n, o equivalentemente: hv, vi ≥ 0 ∀v ∈ V , con igualdad si y sólo si v = 0. Por
tanto, h·, ·i es no degenerado y las bases ortonormales pueden
calcularse por el procedimiento clásico de ortonormalización de
Gram-Schmidt. Obsérvese que en este caso la matriz asociada a
una base ortonormal B = (v1 , . . . , vn ) es la identidad.
(3) un producto escalar lorentziano si n ≥ 2 y la matriz (hvi , vj i)i,j
es no degenerada y con ı́ndice s = 1. En este caso, para cualquier
base ortonormal B = (v1 , . . . , vn ) se tiene la matriz:


−1 0 . . . 0
 0



(hvi , vj i) =  ..
.
 .

Idn−1
0
Definiciones 7.1.1 Sea Q una variedad diferenciable. Llamaremos
campo tensorial métrico o, simplemente, métrica sobre Q a cualquier
campo de tensores 2-covariante simétrico g sobre Q. En este caso se
dice que la métrica g es:
7.1. MÉTRICAS RIEMANNIANAS Y LORENTZIANAS
133
(1) riemanniana si gp es un producto escalar euclı́deo de Tp Q para
todo p ∈ Q.
(2) lorentziana si gp es una producto escalar lorentziano de Tp Q para
todo p ∈ Q.
(3) semi-riemanniana si gp es un producto escalar de Tp Q con ı́ndice
s constante para todo p ∈ Q1 .
Según el caso, llamaremos al par (Q, g) variedad riemanniana, lorentziana
o semi-riemanniana, respectivamente.
En adelante todas las métricas que consideremos serán semi-riemannianas,
salvo especificación contraria.
Ejemplos:
(1) La métrica riemanniana usual de Rn es
n
X
g0 = dx ⊗ dx + · · · + dx ⊗ dx ≡
(dxi )2 .
1
1
n
n
i=1
Análogamente, la métrica lorentziana usual se define como
n
X
gL = −dx ⊗dx +dx ⊗dx +· · ·+dx ⊗dx ≡ −(dx ) + (dxi )2 .
1
1
2
2
n
n
1 2
i=2
(2) Sea S una subvariedad de Rn . Como Tp S es un subespacio de
Tp Rn para todo p ∈ S, la métrica usual g0 de Rn puede restringirse a Tp S para proporcionar un producto escalar euclı́deo gpS
sobre cada Tp S. Concretamente,
gpS : Tp S × Tp S → R
(v, w) 7→ g0 (v, w).
El campo de tensores g S sobre S ası́ determinado es una métrica
riemanniana. Esto ocurre, por ejemplo, en la esfera bidimensional S 2 ⊂ R3 (ası́ como en cualquier superficie de R3 ), sobre la
1
Si Q es conexa entonces la condición de que la métrica sea no degenerada
implica que el ı́ndice sea constante.
134
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
que se puede inducir la métrica usual de R3 . Con más generalidad, para cualquier variedad riemaniana (Q, g), su métrica
puede inducirse por restricción a cualquier subvariedad suya S,
generándose ası́ una nueva variedad riemanniana2 (S, g S ).
(3) Consideremos sobre R2 un campo de tensores arbitrario
g = g11 (x, y)dx2 + g12 (x, y)(dx ⊗ dy + dy ⊗ dx) + g22 (x, y)dy 2 .
Si el determinante
¯
¯ g11 (x, y) g12 (x, y)
¯
¯ g12 (x, y) g22 (x, y)
¯
¯
¯
¯
es distinto de 0 en todo punto de R2 entonces g es una métrica
semi-riemanniana. Si el determinante es mayor que 0 y g11 > 0 entonces g es riemanniana. Finalmente, si el determinante es menor
que 0 entonces g es lorentziana. Esto se mantiene aun cuando
(x, y) representaran las coordenadas de cualquier variedad bidimensional (en el abierto donde estén definidas). El criterio para
comprobar cuándo es riemanniana se generaliza fácilmente a dimensiones superiores (hállese como ejercicio).
(4) Consideremos dos variedades semi-riemannianas (Q, g), (Q0 , g 0 ).
Para la variedad producto Q×Q0 se tiene la identificación natural
T(p,p0 ) (Q × Q0 ) ≡ Tp Q × Tp0 Q0 , de modo que cada vector tangente
en (p, p0 ) se puede ver como un par (vp , vp0 0 ) ∈ Tp Q × Tp0 Q0 . De
modo natural, podemos considerar g y g 0 como tensores métricos
sobre Q × Q0 y definir
(g + g 0 )((vp , vp0 0 ), (wp , wp0 0 )) = g(vp , wp ) + g 0 (vp0 0 , wp0 0 ).
Por tanto, g + g 0 es una nueva métrica semi-riemanniana cuyo
ı́ndice es la suma de los ı́ndices de g y g 0 (en particular, si ambas
son riemannianas entonces g+g 0 también lo es). Si h, f ∈ C ∞ (Q×
Q0 ), h > 0, f > 0 entonces hg + f g 0 es también una métrica semiriemanniana.
2
Si la métrica de partida g fuera semi-riemanniana, habrı́a que tener la precaución de que el campo de tensores inducido g S sobre la subvariedad no degenerase
en ningún punto. Con esta restricción, (S, g S ) también es una nueva variedad semiriemanniana, aunque no necesariamente del mismo ı́ndice que (Q, g).
7.2. GRADIENTE DE UNA FUNCIÓN
135
Puede demostrarse que toda variedad diferenciable admite una métrica
riemanniana, usando particiones de la unidad (véase el Tema 8, Sección
8.2.4).
Ejercicio. Sean (Q, g) = (R, −dt2 ), (Q0 , g 0 ) = (S 3 , gS ), donde −dt2
es la métrica opuesta a la usual de R y gS es la métrica inducida por
(R4 , g0 ) sobre la esfera S 3 . Sea
f : R × S3 → R
(t, x) 7→ f (t),
f > 0,
y consideremos sobre R × S 3 la métrica:
g = −dt2 + f 2 (t)gS
(modelo cosmológico estándar de universo finito pero ilimitado de Robertson -Walker). Compruébese:
(1) En cada base Bp = (∂t , v̂1 , v̂2 , v̂3 ) del espacio tangente Tp (R×S 3 )
tal que B̂ = (v̂1 , v̂2 , v̂3 ) es ortonormal para gS , la métrica g tiene por
matriz asociada


−1 0
...
0




 0


.
 ..

2
 .

f (t) · Id3
0
(2) La métrica g es lorentziana. Constrúyase una base ortonormal
en cada punto.
(3) La restricción de la métrica lorentziana g a cada hipersuperficie
t ≡constante es una métrica riemanniana.
(4) Si S 1 = {(x, y, z, w) ∈ S 3 : z = w = 0} es el ecuador de
S 3 , entonces S = R × S 1 es una subvariedad de R × S 3 y la métrica
lorentziana g restringida a S también es lorentziana.
(5) Existen en R × S 3 subvariedades de dimensión 1 tales que g
restringida a cualesquiera de ellas es idénticamente nula.
7.2.
Gradiente de una función
En un espacio vectorial dotado de un producto escalar los isomorfismos bemol y sostenido permiten asociar a cada vector una forma
136
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
lineal, y viceversa (véase el Apéndice 1). Por tanto, si (Q, g) es una
variedad semi-riemanniana, se definen de manera natural la forma diferencial bemol X [ ∈ Λ1 (Q) y el campo sostenido α] ∈ X(Q) de un
campo X ∈ X(Q) y una forma diferencial α ∈ Λ1 (Q), respectivamente.
En coordenadas (U, q 1 , . . . , q n ), dichos campos tienen la expresión:
X=
n
X
Xi
i=1
α=
n
X
∂
,
∂q i
i
αi dq ,
X[ =
n
X
gij X i dq j .
i,j=1
]
α =
i=1
n
X
g ij αi
i,j=1
∂
.
∂q j
Estamos en condiciones de establecer la siguiente definición:
Definición 7.2.1 Sea (Q, g) una variedad semi-riemanniana. Para
cada f ∈ C ∞ (Q) definimos el campo vectorial gradiente de f , grad f ,
como el campo asociado a la diferencial de f por la métrica g:
grad fp = (dfp )]
∀p ∈ Q.
Por tanto, de la expresión por coordenadas obtenida anteriormente
para el campo sostenido se tiene:
grad f =
n
X
i,j=1
g ij
∂f ∂
.
∂q i ∂q j
Discutimos a continuación algunas propiedades del gradiente que
ayudan a comprender mejor su significado. Supongamos que la función
diferenciable f : Q → R presenta un valor regular c ∈ R (esto es,
dfp 6= 0 para todo p ∈ f −1 (c)). Sea S = f −1 (c) la correspondiente
subvariedad (hipersuperficie de nivel) asociada a f . Consideremos un
vector vp ∈ Tp S arbitrario y una curva γ en S cuya velocidad inicial
coincida con vp . Entonces,
g(grad fp , vp ) = dfp (vp ) =
d
d
|t=0 f ◦ γ(t) =
|t=0 c = 0.
dt
dt
Por tanto, al ser vp ∈ Tp S arbitrario, acabamos de probar que grad fp
es perpendicular a S en p.
7.3. CAMPOS CONSERVATIVOS E IRROTACIONALES
137
Más aún, cuando g es riemanniana y γ es una curva arbitraria en Q
(no necesariamente contenida en S) tal que γ(0) = p ∈ S, |γ 0 (0)k = 1,
entonces:
d
|t=0 f ◦ γ(t) = gp (grad fp , γ 0 (0)) = kgrad fp k · cos β,
dt
siendo β el ángulo que forman grad fp y γ 0 (0) según gp . En particular, si
γ 0 (0) apunta en la dirección de grad fp entonces cos β = 1 y la derivada
anterior es máxima. En resumen, grad fp es perpendicular a S en p y
apunta en la dirección de máxima variación de f , en sentido creciente,
con módulo igual a la máxima derivada.
7.3.
Campos conservativos e irrotacionales
Definiciones 7.3.1 Sea (Q, g) una variedad semi-riemanniana.
(i) Diremos que un campo vectorial X ∈ X(Q) es conservativo si
X = grad f para alguna función f ∈ C ∞ (Q), esto es, si X [ es
exacta (X [ = df ).
(ii) Diremos que un campo vectorial X ∈ X(Q) es irrotacional si X [
es cerrada, esto es, si la 2-forma rotacional dX [ es nula.
De estas definiciones y de las propiedades de las formas cerradas y
exactas (Sección 6.4) se tiene inmediatamente:
Proposición 7.3.2 (i) Si un campo X ∈ X(Q) es conservativo entonces es irrotacional.
(ii) Si un campo X ∈ X(Q) es irrotacional entonces es localmente
conservativo, esto es, para todo p ∈ Q existe un entorno suyo V y una
función f ∈ C ∞ (V ) tal que X = grad f en V .
Cuando Q es simplemente conexa entonces puede tomarse V = Q; por
tanto, para estas variedades los campos irrotacionales coinciden con
los conservativos.
Ejemplo. En R3 con su métrica usual consideremos un campo vectorial
X = X1
∂
∂
∂
+ X2
+ X3 .
∂x
∂y
∂z
138
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
∂
∂
∂
definido en un abierto U ⊆ R3 . Dado que el conjunto ( ∂x
, ∂y
, ∂z
) es
3
una base ortonormal en cada punto de R se tiene:
X [ = X 1 dx + X 2 dy + X 3 dz.
Un cálculo simple muestra entonces que la 2-forma rotacional vale:
¶
µ
∂X 3 ∂X 2
[
dX =
−
dy ∧ dz
∂y
∂z
µ
¶
µ
¶
∂X 3 ∂X 1
∂X 2 ∂X 1
+
dx ∧ dz +
dx ∧ dy.
−
−
∂x
∂z
∂x
∂y
Usando las coordenadas usuales de R3 podemos definir el rotacional de
X como el siguiente campo de vectores3 :
µ
¶
µ
¶
µ
¶
∂X 3 ∂X 2 ∂
∂X 3 ∂X 1 ∂
∂X 2 ∂X 1 ∂
Rot X =
−
−
−
+
−
.
∂y
∂z
∂x
∂x
∂z
∂y
∂x
∂y
∂z
(7.1)
Claramente, dX [ = 0 si y sólo si Rot X = 0. Ası́, si X está definido
en un abierto U simplemente conexo, (p. ej., todo U = R3 ), X es
conservativo si y sólo si Rot X = 0.
7.4.
Circulación de un campo vectorial a
lo largo de una curva
Sea X un campo vectorial sobre una variedad semi-riemanniana
(Q, g) y consideremos una curva diferenciable γ : [a, b] → Q. Se tienen
3
3
Para definir el rotacional de X estamos usando la base de campos usual de
R . Como veremos en el Tema 9, para definir Rot X en cada punto p, podemos
3
usar (7.1) reemplazando las coordenadas usuales de R (y sus correspondientes
campos vectoriales coordenados) por cualesquiera otras (q 1 , q 2 , q 3 ) que verifiquen:
3
(i) Bp = (∂/∂q 1 |p , ∂/∂q 2 |p , ∂/∂q 3 |p ) es una base ortonormal de Tp R , y (ii) Bp
está “positivamente orientada” respecto a la base Bp0 en p inducida por las coordenadas cartesianas usuales, esto es, el determinante de la matriz de cambio de
base entre Bp0 y Bp es positivo (por verificarse (i), el determinante será entonces
igual a 1). La construcción del campo vectorial Rot X es entonces generalizable
de manera inmediata a cualquier variedad riemanniana (Q, g) que esté orientada y
tenga dimensión 3. En dimensión superior no existe la interpretación del rotacional
como campo vectorial (véase también la Sección ?? para más detalles).
7.5. ISOMETRÍAS
139
entonces que Xγ(t) , γ 0 (t) ∈ Tγ(t) Q, y tiene sentido considerar la aplicación diferenciable
[a, b] → R
t 7→ g(Xγ(t) , γ 0 (t)).
Definición 7.4.1 Definimos la circulación de un campo X ∈ X(Q) a
lo largo de una curva diferenciable γ en Q como la integral
Z
b
g(Xγ(t) , γ 0 (t))dt.
(7.2)
a
Obsérvese que esta definición coincide con la circulación de X [ a lo
largo de γ, esto es:
Z b
[
Xγ(t)
(γ 0 (t))dt.
a
En particular, resulta independiente de la reparametrización de γ (Proposición 6.5.1).
Por otra parte, de las propiedades de la circulación de formas
cerradas y exactas (Sección 6.5) resultan inmediatas las propiedades
análogas para la circulación de campos irrotacionales y conservativos.
Ası́, si X es conservativo entonces la circulación de X a lo largo de
una curva depende sólo de los extremos de la curva. Concretamente, la
circulación de X = grad f a lo largo de la curva γ verifica
Z
b
g(X, γ 0 )dt = f (γ(b)) − f (γ(a)).
a
Esta propiedad caracteriza a los campos conservativos (Teorema 6.5.3).
Si X fuera irrotacional pero no conservativo entonces sólo podrı́amos
asegurar que la circulación de X a lo largo de dos curvas γ, ρ con los
mismos extremos coincide si γ y ρ son homotópicas.
7.5.
Isometrı́as
Definición 7.5.1 Sean (Q, g), (Q0 , g 0 ) dos variedades semi-riemannianas.
Diremos que una aplicación diferenciable F : Q → Q0 es una isometrı́a
(entre variedades semi-riemannianas) si
140
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
(i) F es un difeomorfismo,
(ii) F “preserva las métricas”, esto es,
gp (vp , wp ) = gF0 (p) (dFp (vp ), dFp (wp )), ∀vp , wp ∈ Tp Q, ∀p ∈ Q.
Observemos que la condición (ii) equivale a que la aplicación dFp :
Tp Q → TF (p) Q0 sea una isometrı́a vectorial entre (Tp Q, gp ) y (TF (p) Q0 ,
gF0 (p) ) para todo p ∈ Q. De dos variedades semi-riemannianas entre las
que existe una isometrı́a se dice que son isométricas. Todas las propiedades derivadas de la métrica (y, por supuesto, de la estructura de
variedad diferenciable -en particular las propiedades topológicas) que
verifique una variedad semi-riemanniana (Q, g) las verificarán también
todas las variedades isométricas a ella. Por tanto, las propiedades asociadas a la métrica en la variedad se conservan a través de la isometrı́a.
Dadas dos variedades semi-riemannianas resulta natural preguntarse cuándo son isométricas. Por ejemplo, consideremos la esfera S 2 ⊂
R3 , un cilindro C ⊂ R3 y un plano Π ⊂ R3 como variedades riemannianas. Dos a dos no son isométricas porque no son difeomorfas globalmente (de hecho, ni siquiera son homeomorfas): la esfera es compacta y
el resto no; el cilindro no es simplemente conexo mientras que la esfera
y el plano sı́ lo son. Sin embargo, un casquete abierto de una esfera
sı́ es difeomorfo a un disco, o a algunos abiertos de un cilindro (Figura
19).
Figura 19
7.6. DISTANCIA EN EL CASO RIEMANNIANO
141
Se puede demostrar que no existen abiertos de la esfera y del plano
que sean isométricos entre sı́. Por otra parte, todo abierto simplemente
conexo del cilindro es isométrico a algún abierto del plano. En la determinación de la posible existencia de isometrı́as desempeña un papel
esencial el tensor de curvatura, que estudiaremos más adelante.
7.6.
Distancia asociada a una métrica riemanniana
Sea (Q, g) una variedad riemanniana y sea γ : [a, b] → Q una curva
diferenciable. Definimos la longitud de γ como
Z b
Z bq
0
gγ(t) (γ 0 (t), γ 0 (t))dt.
L(γ) =
kγ (t)kdt =
a
a
El concepto de longitud de una curva que acabamos de introducir sugiere la siguiente definición de distancia. Dada una variedad riemanniana
conexa (Q, g) y dos puntos p, q ∈ Q, definimos la distancia entre ellos
como:
dg (p, q) = Infγ {L(γ) : γ : [a, b] → Q, γ(a) = p, γ(b) = q}.
Aunque las propiedades de la función distancia se verán con más detalle
en el Capı́tulo ??, anticipamos ahora las dos siguientes:
(1) La aplicación dg : Q × Q → [0, ∞) es una distancia “abstracta”,
esto es, verifica las propiedades de una distancia definidas en
[Sección 1.6, Definición 1.6.1].
(2) La topologı́a asociada a la distancia dg en Q coincide con la
topologı́a de (Q, g) como variedad.
Como acabamos de ver, toda variedad riemanniana conexa (Q, g) tiene
asociado un espacio métrico (Q, dg ) que, en general, puede o no ser
completo. Por otra parte, dos variedades riemannianas isométricas son
también isométricas como espacios métricos. En particular, tendrán el
mismo diámetro, que se define (como en cualquier espacio métrico):
diam(Q) = Sup{dg (p, q) : p, q ∈ Q} ∈ [0, ∞].
142
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
Una cuestión que surge de manera natural es la siguiente: dados
dos puntos p, q ∈ Q, ¿existe alguna curva que conecte p y q y que
tenga longitud igual a dg (p, q)? La respuesta a esta pregunta (que es
afirmativa siempre localmente, y que lo es globalmente cuando (Q, dg )
es completo) se obtiene en términos de geodésicas, tal y como veremos
en el Tema ??.
7.7.
Apéndice 1: aplicaciones bemol y sostenido
En general, cada producto escalar h·, ·i induce un isomorfismo canónico
entre V (R) y V ∗ (R). En efecto,
Definición 7.7.1 Llamamos aplicación bemol [ (“bajar ı́ndices”) entre V (R) y V ∗ (R) asociada al producto escalar h·, ·i a la aplicación
[: V →V∗
v 7→ v [ ≡ hv, ·i,
donde
hv, ·i : V → R
w 7→ hv, wi.
Teorema 7.7.2 (1) La aplicación bemol [ es un isomorfismo entre los
espacios vectoriales V (R) y V ∗ (R).
(2) La aplicación inversa ] de [, conocida como aplicación sostenido
(subir ı́ndices), queda caracterizada por la relación hφ] , wi = φ(w),
∀φ ∈ V ∗ , ∀w ∈ V .
Demostración. (1) La linealidad es inmediata. Para la inyectividad
nótese que son equivalentes: (i) [ tiene núcleo 0, (ii) el tensor métrico
h·, ·i es no degenerado.
(2) En efecto, (φ] )[ (w) = hφ] , wi = φ(w) ∀w ∈ V . Además, esta
igualdad caracteriza a φ] por ser h·, ·i no degenerada. 2
Para dar sus expresiones en coordenadas consideremos una base B =
(v1 , . . . , vn ) de V (R) y su correspondiente base dual B ∗ = (φ1 , . . . , φn ).
7.7. APÉNDICE 1: BEMOL Y SOSTENIDO
Pn
Entonces podemos suponer que v =
Ahora bien, aj = v [ (vj ) = hv, vj i y
i=1
ai vi ∈ V y v [ =
n
X
[
aj = v (vj ) = hv, vj i =
143
Pn
j=1
gij ai ,
aj φj .
(7.3)
i=1
P
donde gij = hvi , vj i. Por tanto, v [ = ni,j=1 ai gij φj . Si denotamos por
(g ij )i,j la matriz inversa de (gij )i,j entonces multiplicando ambos miembros de la igualdad (7.3) por g jk y sumando en j obtenemos:
k
a =
n
X
aj g jk
j=1
En conclusión, si φ =
entonces
Pn
i
i=1 bi φ
]
φ =
∈ V ∗ y suponemos φ] =
n
X
bi g ij vj .
Pn
j=1
b j vj
(7.4)
i,j=1
Observación: Si h·, ·i es euclı́dea y B es una base ortonormal entonces
aj = aj para todo j ∈ {1, . . . , n}. (En el caso lorentziano la única
diferencia es a1 = −a1 ).
Este isomorfismo entre V (R) y V ∗ (R) induce isomorfismos entre tensores tipo (2, 0), (0, 2) y (1, 1) (y, en general, entre tensores tipo (r, s)
y (r0 , s0 ) con r + s = r0 + s0 ). Por ejemplo, supongamos que T es un
tensor (2, 0) y queremos construir a partir de él un tensor T̂ que sea
(0, 2). Entonces basta con definir T̂ (φ, ψ) := T (φ] , ψ ] ). Obsérvese que
la relación correspondiente en coordenadas queda:
T =
n
X
tij φi ⊗ φj ,
T̂ =
i,j=1
donde
tij =
n
X
k,l=1
n
X
tkl vk ⊗ vl ,
k,l=1
kl
gik gjl t ,
kl
t =
n
X
g ki g lj tij .
i,j=1
Además, si el producto escalar es euclı́deo y la base B ortonormal
entonces tij = tij , para todo i, j ∈ {1, . . . , n}.
144
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
Finalmente, recordemos que para tensores (1, 1) habı́amos definido
su traza mediante la del endomorfismo asociado, [Capı́tulo 6, Subsección 6.1.1]. Puesto que usando un producto escalar euclı́deo g podemos
asignar unı́vocamente a cada tensor 2-covariante o 2-contravariante
un tensor (1, 1), ahora también es posible definir una traza para estos tensores.
Ası́, por ejemplo, la traza de un tensor de tipo (2, 0)
Pn
T = i,j=1 tij ϕi ⊗ ϕj es:
trazag T =
n
X
i=1
tii
,
siendo
tij
=
n
X
g ik tkj .
k=1
Esto es fácilmente generalizable a tensores de tipo superior (“contracción” de tensores en un ı́ndice covariante y otro covariante -sin necesidad de g- y contracción de tensores en dos ı́ndices covariantes o dos
contravariantes -con ayuda de g).
7.8.
Apéndice 2: M. Lagrangiana frente a
Hamiltoniana
En este apéndice comentaremos la relación existente entre el formalismo lagrangiano, introducido en el apéndice del Capı́tulo 3, y el formalismo hamiltoniano, del que dimos algunos elementos en la nota final
de la Sección 4.2. Esencialmente desarrollaremos las siguientes ideas:
(1) cualquier lagrangiana L : T Q × R → R, a cada instante t fijo,
define de manera natural una aplicación (no necesariamente lineal)
Tp Q → Tp Q∗ para cada p y, por tanto, una aplicación T Q → T Q∗ ;
cuando ésta es un difeomorfismo, la lagrangiana se dice hiper-regular,
(2) las lagrangianas tı́picas L = T − V , donde T es la “energı́a
cinética” asociada a una métrica semi-riemanniana g, y V un potencial,
no sólo son hiper-regulares, sino que la aplicación que inducen entre
T Q y T Q∗ coincide con el bemol para g, independientemente de t,
(3) para cualquier lagrangiana hiper-regular, el difeomorfismo asociado T Q × R → T Q∗ × R se expresa en coordenadas (q, q̇, t) →
(q, p(q, q̇, t), t), con pi = ∂L/∂ q̇ i ; además las coordenadas en T Q × R
se inducen T Q∗ × R, y viceversa, y
(4) cuando, fijada una función L(= Lp,t ) sobre un espacio vectorial
se toman como nuevas coordenadas las derivadas parciales de L, resulta
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
145
conveniente introducir una nueva función, la transformada de Legendre
de L, que admite una interpretación geométrica natural.
Aplicación entre V y V ∗ asociada a una función sobre V
Sea V (R) un espacio vectorial, B = (v1 , . . . , vn ) una base suya,
∗
B = (φ1 , . . . , φn ) su correspondiente base dual y (x1 , . . . , xn ) (resp.
(p1 , . . . , pn )) las coordenadas sobre todo V (resp V ∗ ) inducidas por B
(resp. B ∗ ).
Sea f : V → R una aplicación diferenciable (no necesariamente
lineal) y consideremos su diferencial como una aplicación entre V y
V ∗ . Es decir,
Df : V → V ∗
u 7→ Dfu
donde Dfu : V → R coincide con la diferencial dfu : Tu V → Tf (u) R ≡ R
salvo por la identificación natural de Tu V con V . Por tanto,
Dfu =
n
X
∂f
(u)φi ,
i
∂x
i=1
o, directamente en las coordenadas introducidas,
Df (x1 , . . . , xn ) = (p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn )),
siendo
∂f 1
(x , . . . , xn ), i = 1, . . . , n.
i
∂x
Si calculamos la diferencial de Df en u0 ∈ V , se obtiene que su
matriz en las coordenadas introducidas coincide con la matriz hessiana
∂ 2 f /∂xi ∂xj en u0 . Si ésta es regular, el Teorema de la Función Inversa permite escoger entornos apropiados de u0 y Dfu0 para los que la
restricción de la aplicación Df es un difeomorfismo.
Supongamos para simplificar que Df es un difeomorfismo global entre V y V ∗ . En este caso las coordenadas (p1 , . . . , pn ) (resp. (x1 , . . . , xn ))
sobre V ∗ (resp. V ), compuestas con Df (resp. (Df )−1 ) generan unas
nuevas coordenadas en V (resp V ∗ ), y las funciones
pi (x1 , . . . , xn ) =
(p1 (x1 , . . . , xn ), . . . , pn (x1 , . . . , xn ))
(resp. (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))) sirven para denotar tanto la
aplicación Df (resp. (Df )−1 ), como el cambio de coordenadas en V (resp. V ∗ ) entre (x1 , . . . , xn ) y (p1 , . . . , pn ) (resp. (p1 , . . . , pn ) y (x1 , . . . , xn )).
146
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
Ejercicios. (1) Sean a, b, c, d, e, f ∈ R y definamos f : R2 → R por
f (x, y) = ax2 + 2bxy + cy 2 + dx + ey + f,
∀(x, y) ∈ R2 .
Calcúlese Df : R2 → R2∗ y pruébese que es un difeomorfismo global si
y sólo si
¯
¯
¯ a b ¯
¯
¯
¯ b c ¯ 6= 0.
(2) Sea g un producto escalar sobre el espacio vectorial V (R), y sea
Eg : V → R la aplicación Eg (u) = g(u, u)/2, ∀u ∈ V . Pruébese que
DEg coincide con la aplicación bemol asociada a g.
Lagrangianas regulares. Momentos generalizados
Consideremos en Mecánica Lagrangiana un espacio de configuración
Q (≡ (q 1 , . . . , q n )), el correspondiente espacio de estados T Q (≡ (q 1 , . . . ,
q n , q̇ 1 , . . . , q̇ n )), y una lagrangiana
L : TQ × R → R
(q , . . . , q , q̇ 1 , . . . , q̇ n , t) 7→ L(q, q̇, t).
1
n
Fijado (p0 , t0 ) ∈ Q × R podemos considerar la aplicación
Tp0 Q → R
vp0 7→ L(vp0 , t0 ),
(7.5)
esto es,
(q̇ 1 , . . . , q̇ n ) 7→ L(q 1 (p0 ), . . . , q n (p0 ), q̇ 1 , . . . , q̇ n , t0 ).
Como vimos en el apartado anterior, esta aplicación (de V = Tp Q a
R) induce otra con codominio el dual:
Leg(p0 ,t0 ) : Tp0 Q 7→ Tp0 Q∗
vp0 7→ v̂p0 ,
que viene definida por la diferncial, esto es:
v̂p0 : Tp0 Q → R
|
(vp0 + swp0 , t0 ).
wp0 7→ dL
ds s=0
Diremos que la lagrangiana L es regular en (p0 , t0 ) si Leg(p0 ,t0 ) es un
difeomorfismo local, esto es, si su diferencial es biyectiva en todo punto.
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
147
Nótese que fijado cualquier entorno coordenado (U, q 1 , . . . , q n ) de p0 la
matriz de la diferencial de Leg(p0 ,t0 ) en cada vp0 ∈ Tp0 Q resulta ser
µ 2
¶
∂ L
(vp , t0 )
,
∂ q̇ i ∂ q̇ j 0
i,j
por lo que L es regular en (p0 , t0 ) si y sólo si esta matriz (para unas
coordenadas alrededor de p0 y, por tanto, para cualesquiera) es regular
en todo vector vp0 tangente a p0 . Diremos que L es regular si es regular
en todo (p0 , t0 ) ∈ Q × R. En adelante, supondremos por simplicidad
la condición algo más fuerte de que L sea hiper-regular, esto es, que
Leg(p0 ,t0 ) sea un difeomorfismo (no sólo local, sino global) ∀(p0 , t0 ) ∈
Q × R. Por tanto, en este caso se tiene el difeomorfismo:
Leg : T Q × R → T Q∗ × R
(vp , t) 7→ (v̂p = Leg(p,t) (vp ), t).
(7.6)
Ejercicio. Sea (Q, g) una variedad semi-riemanniana y consideremos
la lagrangiana
L : TQ × R → R
(vp , t) 7→ 12 gp (vp , vp ) − V (p, t)
(7.7)
para cierta función V : Q × R → R (potencial). Demuéstrese que,
independientemente del valor de t, la aplicación Leg correspondiente
coincide con la aplicación bemol [ : T Q → T Q∗ , vp 7→ vp[ (en particular, L es hiper-regular).
Obsérvese que, al componer con el difeomorfismo Leg, las coordenadas
pi en T Q∗ sirven también como coordenadas de TQ; esto es, para cada
t ∈ R podemos usar como coordenadas de T Q:
(q 1 , . . . , q n , p1 :=
∂L
∂L
,
.
.
.
,
p
:=
).
n
∂ q̇ 1
∂ q̇ n
A estas nuevas coordenadas pi se les llama momentos generalizados.
Nótese que cada vector vp y su imagen
P v̂p por Leg tienen las mismas
coordenadas pi . De hecho, si wp = ni=1 wpi ∂∂q̇i |p entonces
v̂p (wp ) =
n
X
∂L
(q(p), q̇(vp ), t)wpi
i
∂
q̇
i=1
148
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
y, por tanto,
v̂p =
n
X
i=1
n
n
X ∂L
X
∂
i
(q(p),
q̇(v
),
t)dq
=
pi (vp , t)dqpi .
v̂p ( i |p )dqpi =
p
p
i
∂q
∂
q̇
i=1
i=1
Remarquemos que si tomamos coordenadas q ≡ (q 1 , . . . , q n ), una
expresión del tipo L(q, p, t) puede denotar, indistintamente: (a) la función lagrangiana L : T Q × R → R escrita en las coordenadas sobre
T Q que se obtienen componiendo Leg con las coordenadas (q, p, t) de
T Q∗ × R o (b) la función L◦Leg−1 : T Q∗ × R → R escrita en coordenadas (q, p, t). Análogamente, componiendo con Leg−1 las coordenadas
(q̇ 1 , . . . , q̇ n ) se pueden usar en T Q∗ , por lo que, para una función hamiltoniana H : T Q∗ × R → R, la expresión H(q, q̇, t) puede denotar tanto
a la función H en las coordenadas inducidas por Leg−1 como la función
H◦Leg en las coordenadas naturales de T Q × R.
La transformada de Legendre
Consideremos de nuevo el espacio vectorial V (R) y las bases B, B ∗ .
Obsérvese que en V (R) se puede definir el campo de vectores radial ρ
que a cada vector u ∈ V le hace corresponder
propio vector u visto
Pn el
i
como un elemento de Tu V ; esto es, ρ = i=1 x ∂/∂xi .
Sea f : V → R tal que Df : V → V ∗ es un difeomorfismo. La
transformada de Legendre de f se define como la aplicación L[f ] :
V ∗ → R dada por:
L[f ](φ) = (f − ρ(f )) ◦ (Df )−1 (φ),
Si φ =
Pn
i=1
∀φ ∈ V ∗ .
pi φi entonces el vector (Df )−1 (φ) tiene coordenadas
(x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))
y escribiendo directamente f, L[f ] sobre las coordenadas de u, φ:
L[f ](p1 , . . . , pn ) = f (x1 (p1 , . . . , pn ), . . . , xn (p1 , . . . , pn ))
−
n
X
xi (p1 , . . . , pn )pi
(7.8)
i=1
Geométricamente, la interpretación de L[f ] es la siguiente. Dada una
forma lineal φ : V → R podemos considerar su grafo en V × R, que
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
149
será un hiperplano {(u, φ(u)) : u ∈ V } que pasa por el origen. Desplazando paralelamente este hiperplano podemos construir un hiperplano
tangente a la gráfica de la función f : V → R en un (único) punto
(uφ , f (uφ )). La ordenada en el origen de este hiperplano coincide con
L[f ](φ).
El principal interés geométrico de la transformada de Legendre
aparece cuando, por alguna razón, resulta conveniente usar como coordenadas las derivadas parciales de una función4 f . Si conocemos la función f (p1 , . . . , pn ) pero no el difeomorfismo Df entonces, en principio,
no podemos recuperar la función original f (x1 , . . . , xn ). Sin embargo,
si conocemos L[f ] podemos recuperar la gráfica de f como la hipersuperficie envolvente a todos los hiperplanos Hφ = {(u, φ(u) + L[f ](φ)) :
u ∈ V } obtenidos variando φ ∈ V ∗ . Se dice entonces que la transformada de Legendre de f “conserva la información” de f (al menos bajo
la hipótesis de que Df sea un difeomorfismo).
Ejercicio. (1) Se considera la función f : R → R, f (x) = x2 + 3x + 2.
(a) Calcúlese Df y compruébese que es un difeomorfismo.
(b) Calcúlese f ◦ (Df )−1 y L[f ].
(c) Sea h : R → R tal que Dh es un difeomorfismo. Compruébese:
(i) L[h] = L[f ] ⇒ h = f , (ii) existe una función h 6= f tal que
f ◦ (Df )−1 = h ◦ (Dh)−1 .
(2) Repı́tanse los puntos anteriores para f : R2 → R, f (x, y) = 2xy −
3x + 4y − 1.
La hamiltoniana como transformada de Legendre
Consideremos ahora una lagrangiana hiper-regular L. Como hemos
visto, tenemos asociado un difeomorfismo Leg entre el dominio T Q×R
de L y el dominio T Q∗ × R de las funciones hamiltonianas. Llevando a
cabo la transformada de Legendre de Leg(p0 ,t0 ) en cada (p0 , t0 ) ∈ Q × R
y cambiando el signo, generamos una función
H : T Q∗ × R → R
4
P. ej., esto ocurre frecuentemente en Termodinámica, donde las parciales de la
energı́a interna U con respecto a la entropı́a S y el volumen V son, respectivamente,
la temperatura T y la opuesta de la presión −P . P y T pueden resultar mucho más
fáciles de medir que V y (por supuesto) que S.
150
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
que, expresada en coordenadas, se define por:
H(q, p, t) =
n
X
pi q̇ i (q, p, t) − L(q, p, t).
(7.9)
i=1
Se dice entonces que la función H es la función hamiltoniana asociada
a la lagrangiana (hiper-regular) L.
Es bien conocido que si γ(t) ≡ (q(t)) es una curva en Q para la
cual se verifican las ecuaciones de Euler-Lagrange para L (γ es una
curva crı́tica de L ante variaciones de las q’s con extremos fijos), entonces Leg ◦γ 0 (t) = γ̂ 0 (t) ≡ (q(t), p(t)) es una curva en T Q∗ que verifica las ecuaciones de Hamilton para H (Leg ◦γ 0 (t) es una curva crı́tica
de H ante variaciones de las q y las p con extremos fijos). Por tanto, la Mecánica Lagrangiana puede verse (al menos para lagrangianas
hiper-regulares, como las del tipo (7.7)) como un caso particular de la
Hamiltoniana.
Nota sobre el Teorema de Noether
Sea Q una variedad y L una lagrangiana hiper-regular que, para
simplificar, supondremos también independiente de t (eventualmente,
t podrı́a considerarse como una coordenada más de Q). Sea Φ un
grupo uniparamétrico de difeomorfismos de Q con generador infinitesimal X Φ ∈ X(Q), y consideremos la forma diferencial asociada a X Φ ,
X̂ Φ = Leg ◦ X Φ : Q → T Q∗ . Supongamos que L es invariante por
Φ (véase la Sección 5.5); el Teorema de Noether afirma entonces que
sobre cada curva crı́tica γ(t) de la lagrangiana (aquélla que satisface
las ecuaciones de Euler-Lagrange) la función
X̂ Φ (γ 0 (t))
(7.10)
es constante (independiente de t). Esto es, (7.10) es una cantidad conservada a lo largo de la curva γ. Si L es una tı́pica lagrangiana
1
L(vp ) = gp (vp , vp ) − V (p),
2
(7.11)
esta cantidad conservada se puede escribir directamente a partir de X φ
en términos de la métrica:
X̂ Φ (γ 0 ) = g(X Φ , γ 0 ) ≡ constante[γ].
(7.12)
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
151
Ejemplo. Considérese una lagrangiana del tipo (7.11) para (R3 , g0 )
que sea invariante por un grupo uniparamétrico de difeomorfismos Φ.
No es difı́cil comprobar:
(a) Si Φ es el grupo de traslaciones según el eje z de R3 (esto es,
Φs (x, y, z) = (x, y, z + s), ∀x, y, z, s ∈ R) entonces X Φ = ∂/∂z,
y la cantidad conservada (7.12) para cada curva crı́tica γ(t) =
(x(t), y(t), z(t)) es ż(t) (o momento lineal según el eje z).
(b) Si Φ es el grupo de rotaciones según el eje z (definido en el ejemplo de la Sección 5.5) entonces X Φ = −y∂/∂x + x∂/∂y, y la correspondiente cantidad conservada es el momento angular según
dicho eje x(t)ẏ(t) − y(t)ẋ(t).
Ejercicios
Ejercicio 1. Sea V (R) un espacio vectorial real de dimensión 3, B =
(v1 , v2 , v3 ) una base ordenada suya y B ∗ = (φ1 , φ2 , φ3 ) su base dual. Se
consideran los tensores métricos g, g 0 sobre V definidos por sus matrices
en B:




2 1 0
1 0
0
MB (g) =  1 1 0  ,
MB (g 0 ) =  0 −3 0 
0 0 3
0 0 −1
Compruébese que g y g 0 son productos escalares y determı́nense sus
ı́ndices. Calcúlese para cada uno v [ , φ] , siendo v = 2v1 + v2 + v3 y
φ = φ1 − 3φ2 + φ3 .
Ejercicio 2. Se considera en R3 la métrica riemanniana usual y una
función f : R3 → R. Calcúlense las coordenadas de grad f en los campos coordenados inducidos por las coordenadas cartesianas, cilı́ndricas
y esféricas.
Ejercicio 3. Se considera sobre R2 el campo de tensores métrico
g = 2ex dx2 + 2senydxdy + e−x dy 2
(≡ 2ex dx ⊗ dx + seny(dx ⊗ dy + dy ⊗ dx) + e−x dy ⊗ dy).
(a) ¿Es g una métrica riemanniana? Calcúlese, si es posible, una base
de campos que sea ortonormal en todo punto.
152
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
(b) ¿Cuáles de los siguientes campos son conservativos?
(b1) Los campos coordenados ∂x , ∂y .
(b2) El campo vectorial
Z=
¡ −x
¢
1
x
(e
−
seny)∂
+
(2e
−
seny)∂
.
x
y
2 − sen2 y
Ejercicio 4. Para la variedad semi-riemanniana del problema anterior, calcúlense los campos vectoriales X = (dx)] , Y = (dy)] . Determı́nense las circulaciones de X e Y a lo largo de la curva γ(t) =
(et sen(πt), t3 ), t ∈ [0, 1].
Ejercicio 5. En R2 \{0} con la métrica usual se consideran los campos
X=p
1
x2
+ y2
(x∂x + y∂y ) ,
Y = (−y∂x + x∂y ) .
¿Son conservativos? (Resuélvase trabajando tanto en coordenadas cartesianas como en polares.)
Ejercicio 6. Se considera en R2 la métrica lorentziana g = dx2 −
e2x dy 2 . Calcúlense todos los puntos de R2 que pueden conectarse con
(0, 0) mediante una curva “luminosa” γ, esto es, que verifica γ 0 (t) 6=
0, g(γ 0 (t), γ 0 (t)) = 0 para todo valor de t.
Ejercicio 7. Se considera en R3 la métrica g = −ex+y (dx ⊗ dy + dy ⊗
dx) + exy dz 2 . ¿Es g riemanniana o lorentziana? Calcúlese la circulación
de ∂/∂y a lo largo de la curva
γ(t) = (1, cos t, t),
t ∈ [0, π].
Ejercicio 8. Se considera en R3 la métrica
g = exy dx2 − dx ⊗ dy − dy ⊗ dx + 2e−xy dy 2 + 4dz 2 .
¿Es g riemanniana? Sea f = xy + yz + zx. Calcúlese grad f y su
circulación a lo largo de la curva
γ(t) = (t/2, tet , sen2 2t),
t ∈ [0, π].
Ejercicio 9. Se considera sobre R × R+ el campo de tensores métrico
g = 2y 2 dxdy.
7.8. APÉNDICE 2: M. LAGRANGIANA Y HAMILTONIANA
153
(i) ¿Es g riemanniana? ¿Es lorentziana?
(ii) Se consideran las nuevas coordenadas (u, v) sobre R×R+ definidas
por el cambio de cartas:
u = (x + y)/2,
v = (x − y)/2.
Obténgase la expresión de g en las coordenadas (u, v).
(iii) Se considera el campo vectorial X = A(x, y)∂x , siendo A(x, y)
una función sobre R × R+ . Determı́nense todas las posibles funciones A(x, y) para las que X sea conservativo.
(iv) Determı́nese un campo vectorial Y y una curva γ sobre R × R+
de modo que la circulación de Y a lo largo de γ sea igual a 2π +1.
Ejercicio 10. En R3 se consideran la métrica riemanniana usual g1 ,
la métrica lorentziana usual g2 , y la métrica
g3 = −dx2 − dy 2 + dz 2 .
Calcúlese el gradiente de las funciones f1 = x y z 2 y f2 = z ex y respecto
de las tres métricas.
154
CAPÍTULO 7. CAMPOS TENSORIALES MÉTRICOS
Capı́tulo 8
Integración en Variedades
En este tema generalizaremos la integración usual (de Riemann o
Lebesgue) en Rn a una variedad diferenciable arbitraria. Este problema admite esencialmente dos enfoques, a priori muy distintos: a partir
de integración de n−formas (en variedades orientadas) y a partir de
la definición directa de una medida (variedades semi-riemannianas).
La primera aproximación es la que nos será más útil para el próximo tema, con múltiples aplicaciones prácticas. La segunda, empero,
también presenta ventajas: la delimitación clara del tipo de funciones
objeto de integración, que permite definir espacios de funciones “completos” de dimensión infinita, con múltiples relaciones y aplicaciones a
otras partes de la Matemática y Fı́sica.
Tras una primera motivación de los conceptos (Sección 8.1, Subsección 8.2.1), desarrollaremos en primer lugar la integración de n−formas
en variedades orientadas (Sección 8.2). La introducción de este concepto es progresiva, razonándose la cada vez mayor generalidad de
n−formas a las que se puede aplicar el concepto de integración. El resultado final se obtiene en la Subsección 8.2.4, donde se introducen las
particiones de la unidad. Este concepto requiere cierta dosis de abstracción y soltura en topologı́a, pero es importante en sı́ pues permite extender globalmente multitud de elementos definibles localmente sobre
una variedad (de hecho, esto se requerirá para la prueba del Teorema
de Stokes, en el próximo tema). No obstante, en la integración práctica
155
156
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
de una n−forma concreta se suele evitar su uso, como justificamos en
la Subsección 8.2.3.
Los elementos técnicos se desarrollan en los apéndices. Concretamente, en los Apéndices 8.5 y 8.6 se desarrollan sucintamente los elementos necesarios de álgebra de tensores antisimétricos para la integración de n−formas. En el Apéndice 8.7 se estudia el concepto de
orientación en variedades, e introducimos el concepto topológico de
espacio recubridor, que aplicamos para mostrar la existencia de un recubridor orientable.
En la Sección 8.3, definiremos la integral de una función respecto
a un elemento de volumen. Puesto que toda métrica semi-riemanniana
sobre una variedad orientada tiene canónicamente asociada un elemento de volumen, ello permite hablar de integración de funciones en variedades semi-riemannianas orientadas. Más aún, esta integración resulta
ser independiente de la orientación; de hecho, se puede extender a variedades semi-riemannianas cualesquiera (incluyendo las no-orientables).
Ello sirve como motivación a la Sección 8.4, aunque esta sección
puede leerse con independencia del resto. En ella se define un espacio
de medida sobre cualquier variedad semi-riemanniana, y la integración
de funciones sobre variedades se recupera como un caso particular de
la integración de funciones sobre un espacio de medida, en analogı́a
directa con la integración de Lebesgue en Rn .
8.1.
Motivación
Cuando se integra una función real f : U ⊆ Rn → R, se supone,
explı́cita o implı́citamente, que se sabe cómo “medir” subconjuntos
apropiados del dominio, derivándose este concepto de la estructura
peculiar de R. Ası́, para la integral de Riemann, las sumas (superiores,
inferiores) de su construcción parten del concepto de longitud de los
subintervalos y, a partir de él, de volumen de los n−rectángulos en
que se subdivide el dominio U . En la integral de Lebesgue se parte
explı́citamente del concepto de medida (construida de nuevo a partir
del concepto de longitud y volumen de intervalos y n−rectángulos)
para subconjuntos muy generales de Rn .
Este hecho debe tenerse presente para cualquier intento de definición de integración sobre una variedad. De hecho, no podremos definir
8.1. MOTIVACIÓN
157
la integración de una función hasta que no tengamos algún modo de
“medir el volumen” de subconjuntos apropiados de la variedad. Ası́,
nuestros objetivos serán: (1) abstraer primero qué significa “medir
el volumen” sobre la variedad, lo que conduce a la integración de
n−formas diferenciales, y a la integración de una función respecto
a un elemento de volumen, y (2) mostrar cómo una métrica semiriemanniana produce un modo canónico de medir volúmenes, lo que
conduce a la integración de funciones sobre variedades semirriemannianas.
Para entender mejor las futuras definiciones, conviene tener presente los siguientes aspectos de Geometrı́a elemental:
Determinante y volumen de n−paralelepı́pedos en Rn . Si se tienen
n vectores independientes {v1 , . . . , vn } en Rn se sabe por geometrı́a elemental que det0 (v1 , . . . , vn ) (el determinante de la matriz de coordenadas de (v1 , . . . , vn ) en la base usual) es, salvo signo, igual al volumen del n-paralelepı́pedo que generan. Más aún,
existen populares reglas prácticas para n = 2, 3 que permiten determinar el signo de det0 (v1 , . . . , vn ) (regla del sentido inverso del
giro de las agujas del reloj, regla del sacacorchos). Obsérvese que
det0 puede verse como un tensor antisimétrico n−covariante no
nulo sobre Rn o “elemento de volumen”. De hecho, para n = 2,
det0 = φ10 ∧ φ20 , donde (φ10 , φ20 ) es la base dual de la usual de R2 .
Por otra parte, podemos afirmar que, salvo signo (determinable
por las reglas prácticas aludidas), el producto escalar usual de Rn
determina al elemento de volumen det0 . Ası́, puede comprobarse
con facilidad para n = 2 que det0 = ±φ1 ∧ φ2 , donde (φ1 , φ2 )
es la base dual de cualquier base ortonormal de R2 . Y, para n
arbitrario, el valor de det0 (v1 , . . . , vn ) coincide, salvo signo, con
el del determinante de la matriz de coordenadas de (v1 , . . . , vn )
en cualquier base ortonormal.
En resumen, se sugieren ası́ las relaciones
Volumen de n−paralelepı́pedos ←→ elementos de volumen.
Producto escalar + fijación de signo =⇒ elemento de volumen .
Integración en superficies de Rn . Consideremos una superficie S
de R3 , obtenida como un grafo, S = {(x, y, z(x, y)) : (x, y) ∈ D}.
158
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Fijemos (x0 , y0 ) ∈ D, z0 = z(x0 , y0 ), y sea R el rectángulo de
vértices (x0 ± ∆x/2, y0 ± ∆y/2). En primer orden, el área ∆A
de la porción de superficie S que se proyecta sobre R se puede
aproximar por el área dA del paralelogramo en el plano tangente
T(x0 ,y0 ,z0 ) S ⊂ R3 que se proyecta sobre R. Clásicamente, esta área
se calcula por:
s
µ ¶2 µ ¶2
dxdy
∂z
∂z
dA =
= 1+
+
(x0 , y0 ) dxdy, (8.1)
∂x
∂y
|~n · ~k|
donde ~k = ∂/∂z|(x0 ,y0 ,z0 ) , ~n es un vector unitario perpendicular
a T(x0 ,y0 ,z0 ) S, (el normalizado de ±(∂z/∂x(x0 , y0 ), ∂z/∂y(x0 , y0 ),
−1)), el producto escalar usual se denota por · , y dx = ∆x, dy =
∆y. El área de la superficie S se computa entonces integrando el
segundo miembro de (8.1) en el dominio D de (x, y). Más aún, una
vez que se tiene el concepto de área (esto es, medida o volumen
bidimensional), se puede rehacer la construcción de Riemann –o
de Lebesgue– para definir la integral de una función f : S → R.
Asi, se define la “integral de superficie” de f sobre S como:
Z
s
Z
f dA =
S
f (x, y, z(x, y))
D
µ
1+
∂z
∂x
¶2
µ
+
∂z
∂y
¶2
(x, y) dxdy.
(8.2)
No obstante, estas definiciones de área e integración parecen muy
particulares para grafos. Para indagar su posible generalidad,
pensemos ahora en el grafo S sólo como una variedad dotada de la
métrica g (obtenida por restricción de la usual de R3 ), para la cual
la proyección sobre el plano z = 0 desempeña el papel de carta
coordenada (global) ϕ(x, y, z) = (q 1 (x, y, z) = x, q 2 (x, y, z) = y).
La función “peso” |~n · ~k|−1 que aparece en (8.1), (8.2) se puede
expresar en función de la métrica g y la carta coordenada ϕ como
sigue. Sea B la base de campos coordenados inducida por ϕ,
¶ µ
¶
µ
∂
∂
∂z ∂ ∂
∂z ∂
∂
,
=
+
,
+
.
B=
∂q 1 ∂q 2
∂x ∂x ∂z ∂y ∂y ∂z
Resulta inmediato computar la matriz gij de g en la base B,
8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES
159
obteniéndose
µ
det MB (g) = 1 +
∂z
∂x
¶2
µ
+
∂z
∂y
¶2
,
que es igual a |~n · ~k|−2 . Ası́, (8.2) se reescribe:
Z
Z
p
f (q 1 , q 2 ) |det MB (g)|(q 1 , q 2 ) dq 1 dq 2 ,
f dA =
S
(8.3)
D
expresión ésta que valdrı́a también para cualesquiera otras coordenadas sobre S.
8.2.
Integración de n−formas diferenciales
8.2.1.
El problema de la integración sobre una variedad
Supongamos que nos planteamos el problema de definir la integral de una función real f sobre una variedad diferenciable Q de dimensión n. Para simplificar dicho problema, supondremos inicialmente
f ∈ C ∞ (Q) y que el soporte de f es compacto y está incluido en un
entorno coordenado (U, ϕ) de Q, sopf ⊂ U . En este caso, la función
diferenciable f ◦ ϕ−1 : ϕ(U ) ⊆ Rn → R también tiene soporte compacto incluido en Rn , pues sop(f ◦ ϕ−1 ) = ϕ(sop f ). Ingenuamente, se
podrı́a pensar en definir la integral de f sobre Q como
Z
f ◦ ϕ−1 ,
(8.4)
n
ϕ(U )⊆R
donde la integral es la usual en (abiertos de) Rn . Sin embargo, esta
definición presentarı́a un problema fundamental: no es independiente
del entorno coordenado escogido. Para comprobarlo, supongamos que
(V, ψ) es otro entorno coordenado que verifica sopf ⊂ V , y tomemos
analogamente la integral
Z
f ◦ ψ −1 .
(8.5)
ψ(Q)
160
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Puesto que sop f ⊂ U ∩ V ,
Z
Z
−1
f ◦ϕ =
f ◦ ϕ−1 ,
ϕ◦ψ −1 (ψ(U ∩V ))
ϕ(U )
y, aplicando el teorema clásico de cambio de variables para la integral
usual en Rn , obtenemos:
R
R
−1
f
◦
ϕ
=
((f ◦ ϕ−1 ) ◦ (ϕ ◦ ψ −1 ))|det J(ϕ ◦ ψ −1 )|
−1
ϕ◦ψ (ψ(U ∩V ))
ψ(U
R ∩V )
= ψ(V ) (f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )|
donde J(ϕ ◦ ψ −1 ) denota la matriz jacobiana de ϕ ◦ ψ −1 . Resumiendo:
Z
Z
−1
f ◦ϕ =
(f ◦ ψ −1 )|det J(ϕ ◦ ψ −1 )|,
(8.6)
ϕ(U )
ψ(V )
y, puesto que el factor |det J(ϕ ◦ ψ −1 )| no es necesariamente igual a
1, las expresiones (8.4) y (8.5) no coinciden, en general. Ası́, el valor
(8.4) ingenuamente propuesto para la integral de f sobre Q depende
del entorno coordenado escogido, resultando este problema esencial: si
se usa sólo la estructura diferenciable de la variedad Q, no existe un
procedimiento canónico de privilegiar un entorno coordenado frente a
otro ni, tampoco, de definir la integración de funciones.
Ejercicio. Considérese en Rn el entorno coordenado (Rn , ϕ), donde
ϕ : Rn → Rn viene definida por




x1
x1
 .. 
 . 
 .  7→ A ·  ..  ,
xn
xn
siendo A ∈ Gl+ (n, R) = {A ∈ Mn×n (R) : det(A) > 0}. Compruébese
Z
Z
f =a·
f ◦ ϕ−1
n
n
R
R
donde a = det(A−1 ). En consecuencia, obténgase una definición de
integración de funciones para variedades riemannianas isométricas a
Rn .
Una posible manera de resolver el problema anteriormente apuntado es
la siguiente. Dado que los cambios de carta afectan a la integral definida
8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES
161
en (8.4) mediante el factor peso |det J(ϕ ◦ ψ −1 )|, podrı́amos tratar de
hallar un objeto matemático w que, al escribirse en coordenadas, se
transforme afectado exactamente por ese mismo factor peso; esto es,
tal que
wψ = wϕ ◦ (ϕ ◦ ψ −1 ) · |det J(ϕ ◦ ψ −1 )|.
(8.7)
De esta manera, multiplicando el integrando de (8.4) por dicho objeto
matemático, la integral permanecerı́a invariante frente a cambios de
carta. En una variedad
p semi-riemannaniana (Q, g), este objeto existe:
puede tomarse como |det MB (g)|, lo que conduce directamente a una
definición de integración de funciones que generaliza a las integrales de
superficie tipo (8.3) (véase la Sección 8.4). Pero ganaremos en perspectiva si antes centramos nuestro estudio en otro objeto matemático,
que nos permitirá identificar geométricamente el significado del factor
peso: las n-formas diferenciales.
8.2.2.
Integración de n-formas en entornos coordenados
Las r−formas diferenciales, o campos tensoriales r covariantes antisimétricos, ya fueron introducidas en el Tema 6, en el cual nos centrábamos en los casos r = 1, 2. Las propiedades de (el C ∞ (Q)-módulo
de) las r−formas diferenciales Λr (Q) resultan inmediatas a partir de
las propiedades de los tensores antisimétricos sobre un espacio vectorial
y de los campos tensoriales sobre una variedad (véanse los Apéndices
8.5, 8.7.1). En adelante necesitaremos n−formas diferenciales, esto es,
el caso de covariancia máxima no trivial r = n.
Definición 8.2.1 Consideremos un abierto U ⊆ Rn y una n-forma
diferencial ω ∈ Λn (U ), con soporte incluido en U , y expresión en coordenadas usuales:
ω = w dx1 ∧ · · · ∧ dxn ,
w ∈ C ∞ (U )
La integral de ω se define como:
Z
Z
ω :=
w,
U
U
donde en el segundo miembro se está considerando la integral usual en
Rn .
162
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
El siguiente resultado describe cómo se comportan las n-formas frente a
transformaciones diferenciables, y será la clave que nos permitirá extender la Definición 8.2.1 a una variedad orientada arbitraria. En efecto,
resulta inmediato (Apéndice 8.6, Proposición 8.6.4 (1)):
Lema 8.2.2 Sean U, V dos abiertos de Rn y F : U → V una aplicación diferenciable. Si ω = w dx1 ∧ · · · ∧ dxn ∈ Λn (V ) entonces la
n−forma inducida F ∗ w (Definición 8.5.6) tiene la expresión
F ∗ ω = det J(F ) · (w ◦ F ) dx1 ∧ · · · ∧ dxn .
Acabamos de comprobar por tanto que, salvo por el signo de det J(F ),
las n-formas se transforman afectadas del mismo factor peso con que lo
hacı́a la integral que proponı́amos en (8.4) (véase (8.7)). En consecuencia, se deduce ahora de la Proposición 8.6.4 (2) el siguiente resultado:
Lema 8.2.3 Sean U , V dos abiertos de Rn y F : U → V un difeomorfismo que conserva (resp. invierte) la orientación (usual de Rn ) en
todos sus puntos (Definición 8.6.2). Entonces,
½ R
Z
F ∗ω
si F conserva la orientación en todo punto,
UR
ω=
∗
− UF ω
si F invierte la orientación en todo punto.
V
Estamos ya en condiciones de introducir la definición de integral de una
n-forma diferencial en una variedad orientada arbitraria, al menos en
el caso de que el soporte de la n−forma sea compacto e incluido en un
entorno coordenado. Observemos previamente que, para una variedad
orientada, no supone ninguna pérdida de generalidad restringirnos a
entornos coordenados (U, ϕ) que preserven la orientación (Proposición
8.7.5).
Definición 8.2.4 Sea +Q una n−variedad orientada, y ω ∈ Λn (Q)
una n-forma diferencial con soporte compacto incluido en un entorno
coordenado. Se define la integral de ω en Q como:
Z
Z
ω :=
(ϕ−1 )∗ ω,
(8.8)
+Q
ϕ(U )
donde (U, ϕ ≡ (q 1 , . . . , q n )) es cualquier entorno coordenado que contiene al soporte de ω y preserva la orientación.
Por construcción, resulta inmediato ahora comprobar que esta definición es independiente del entorno coordenado que se escoja (siempre
que incluya al soporte de ω y preserve la orientación).
8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES
8.2.3.
163
Integración general de n−formas
De las varias restricciones sobre ω en la Definición 8.2.4, algunas se
imponen sólo por comodidad en la discusión, y otras tienen un carácter
más profundo. Discutimos a continuación tales restricciones, lo que
permite extender la integración a n−formas mucho más generales:
1. Orientabilidad y elección de una orientación en la variedad Q.
Aunque, como veremos en la próxima sección, esta restricción no
será necesaria para la integración de funciones, sı́ resulta esencial para la integración de n−formas. En cualquier caso, no son
suposiciones muy restrictivas (véase el Apéndice 8.7): (i) si Q
no fuera orientable admitirı́a un “recubridor de dos hojas” que
sı́ lo es, (ii) si Q es orientable y conexa admite exactamente dos
posibles orientaciones.
2. Diferenciabilidad C ∞ de ω, con soporte compacto. Estas hipótesis
se han impuesto sólo por simplicidad de lenguaje, y se pueden
relajar claramente. De hecho, en nada varı́an los argumentos anteriores que hacen consistente la Definición 8.2.4 si se supone que
las n−formas (como campos tensoriales) son sólo continuas.
Si el soporte no fuera compacto, las únicas precauciones serı́an:
(a) la n− forma sobre Rn , (ϕ−1 )∗ ω = wdx1 ∧ . . . ∧ dxn podrı́a no
ser integrable, en el sentido de que no lo sea la función w, y (b)
convendrı́a incluso admitir como posibles valores de la integral
±∞.
Se aplicarı́a entonces la solución estándar en teorı́a de la integración (compárese con la Subsección 8.4.3): (i) si w ≥ 0 se
admite la posibilidad natural de que la integral de w (y de ω)
sea infinita, y (ii) en general, se escribe w = w+ − w− donde
w+ , w− ≥ 0, y se dice que w es integrable si al menos una de las
dos integrales es finita, en cuyo caso se define
Z
Z
Z
Z
+
ω :=
w :=
w −
w− ∈ [−∞, ∞].
Q
ϕ(U )
ϕ(U )
ϕ(U )
Obsérvese que la descomposición w = w+ − w− también induce
una descomposición de ω ligada a la orientación1 ω = ω + − ω − .
1
Más intrı́nsecamente, las funciones ω ± se caracterizan por anularse en cada
164
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Por último, podrı́amos extender la definición de integración incluso al caso en el que ω no sea continua, sino que generara en
coordenadas una función w que fuera sólo integrable Riemann o
Lebesgue (véase la Sección 8.4).
3. El soporte de ω cae en un entorno coordenado. A priori, esta
restricción resulta totalmente indeseable y, como veremos en la
próxima subsección, tal problema se puede resolver con la ayuda
de un nuevo elemento de interés propio: la existencia de particiones de la unidad.
No obstante, conviene tener en cuenta los siguientes hechos que
anticipamos de la Sección 8.4 y que permiten, en la práctica,
evitar completamente el uso de particiones de la unidad:
Asociada a su estructura diferenciable, en toda variedad se
pueden definir directamente los conjuntos de medida nula
(Subsección 8.4.4).
A efectos de cálculo de una integral, un subconjunto de medida nula carece de importancia, y puede obviarse.
Toda variedad Q contiene un subconjunto cerrado de medida nula N tal que Q\N admite una carta coordenada global
ϕ : Q\N → ϕ(Q\N ) ⊆ Rn , Teorema 8.4.4 (de hecho, si Q
es conexa Q\N puede tomarse difeomorfo a Rn o la bola
unidad).
Aun cuando la manera general de construir el conjunto de medida nula N y la carta ϕN puede no ser manejable en la práctica,
sı́ ocurre muy a menudo que se visualiza con facilidad un subconjunto cerrado de medida nula N , tal que Q\N es la unión de
varios abiertos conexos, cada uno de los cuales admite una carta
global (piénsese p. ej., en una esfera, eventualmente con una o
varias asas). El problema queda entonces reducido al caso de que
el soporte de ω caiga en varios entornos coordenados disjuntos.
punto al menos una de ellas, y por estar positivamente orientadas donde no se
anulan.
Obsérvese además que si w es continua (esto es, ω continua) entonces las funciones w± (y las n−formas ω ± ) son continuas, pero éstas no necesariamente son
diferenciables si w lo es. Esto ilustra las limitaciones de integrar sólo n-formas que
sean diferenciables.
8.2. INTEGRACIÓN DE N −FORMAS DIFERENCIALES
8.2.4.
165
Particiones de la unidad e integración
Definición 8.2.5 Sea U ≡ {Uα }α∈I un recubrimiento abierto de una
variedad diferenciable Q. Se dice que una colección de funciones diferenciables να : Q → [0, 1], α ∈ I es una partición de la unidad sobre
Q, subordinada a U si:
(1) sop να ⊂ Uα para todo α,
(2) la colección {sop να }α∈I es localmente finita, esto es, todo punto
de Q tiene un entorno coordenado que interseca sólo a un número
finito de elementos de {sop να }α∈I ,
P
(3)
α να (p) = 1 para todo p ∈ Q.
Observaciones:
(1) En principio, la suma que aparece en la condición (3) anterior
involucrarı́a posiblemente un número infinito de sumandos. Sin
embargo, la condición (2) implica que cada p ∈ Q admite un
entorno en el cual la función να es idénticamente nula para todos
salvo para un número finito de valores del ı́ndice α. En consecuencia, la sumatoria en (3) debe entenderse siempre en cada
punto como la suma (finita) de los términos no nulos.
(2) En una variedad diferenciable (paracompacta) todo recubrimiento abierto admite una partición de la unidad.Más aún, las condiciones sobre las να implican que, aunque el conjunto de ı́ndices I
podrı́a ser no numerable, sólo un subconjunto numerable de las
να puede no ser idénticamente nulo2 .
Ejercicio. Usando la existencia de particiones de la unidad, pruébese
que toda variedad diferenciable admite una métrica riemanniana. ¿Admite también una lorentziana?
Sea (+Q, g) una variedad riemanniana orientada y consideremos un recubrimiento por entornos coordenados positivamente orientados {(Uα ,
ϕα )}α∈I de Q. Sea {να }α∈I una partición de la unidad subordinada, y
consideremos una n-forma ω.
2
De hecho, toda variedad diferenciable es Lindelöff, esto es, todo recubrimiento
abierto de Q admite un subrecubrimiento numerable.
166
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Si ω tiene el soporte compacto, existe un subconjunto finito de enm
tornos {(Ui , ϕi )}i=1
tal que sop ω ⊂ ∪m
i=1 Ui . Consideremos la n-forma
wi := w · νi , cuyo soporte es compacto y está incluido en el correspondiente
R entorno coordenado (Ui , ϕi ), por lo que se tiene definida su
integral +Q wi . Definimos entonces:
Z
m Z
X
w :=
wi .
+Q
i=1
+Q
No es difı́cil comprobar que esta definición resulta independiente de los
entornos coordenados y la partición escogida.
Para incluir el caso general en que el soporte de ω no sea compacto,
podemos usar que Q siempre se puede recubrir por un conjunto numerable de entornos coordenados positivamente orientados {(Ui , ϕi )}i∈N ,
y considerar una partición de la unidad subordinada {νi }i∈N . Escribimos entonces, para evitar inconsistencias si las integrales se hicieran infinitas, ω = ω + −ω − , con ω ± positivamente orientadas y no simultáneamente distintas de 0, y definimos ωi+ = νi ω + , ωi− = νi ω − para todo
i ∈ N. Podemos dar ya la siguiente definición, donde permitiremos
además que el valor de la integral sea infinito.
Definición 8.2.6 Sea +Q una variedad orientada y ω una n-forma
sobre Q. Diremos que ω es integrable si lo son cada una de las nformas ωi+ , ωi− para todo i ∈ N y, además, al menos una de las series
∞ Z
X
i=1
+Q
ωi+ ,
∞ Z
X
i=1
+Q
ωi−
es finita.
En este caso, se define la integral de ω en (+Q, g) como
Z
∞ Z
∞ Z
X
X
+
w :=
ωi −
ωi− ∈ [−∞, ∞].
+Q
i=1
+Q
i=1
+Q
De nuevo, la integral ası́ definida resulta independiente del recubrimiento abierto y la partición escogida. Además, como apuntamos en
la subsección anterior, no sólo es aplicable al caso en que ω es diferenciable, sino también a cuando es sólo continua o, aún más, cuando
cada una de las funciones wi± generada sobre ϕi (U ) ⊆ Rn por las ωi±
es integrable en el sentido de Riemann o, con más generalidad, en el
de Lebesgue.
8.3. INTEGRACIÓN DE FUNCIONES
167
8.3.
Integración de funciones
8.3.1.
Elementos de volumen e integración de funciones
Recordemos del Apéndice 8.7 que un elemento de volumen sobre
una variedad Q no es más que una n−forma diferencial sin ceros. Si
fijamos un elemento de volumen Ω0 automáticamente consideraremos
a Q orientada por [Ω0 ], y podemos definir la integración de funciones
sobre Q como sigue:
Definición 8.3.1 Sea Q una variedad diferenciable dotada de un elemento de volumen Ω0 . Una función f sobre Q se dirá integrable si la
n−forma f Ω0 es integrable y, en este caso, definimos la integral de f
en Q respecto a Ω0 como:
Z
Z
f=
f Ω0 .
(Q,Ω0 )
(Q,+)
donde la orientación de (Q, +) es [Ω0 ].
Resulta inmediato comprobar que, si en lugar de fijar el elemento de
volumen Ω0 , fijamos −Ω0 entonces las dos integrales de f coinciden:
Z
Z
Z
Z
f=
f (−Ω0 ) =
f Ω0 =
f.
(8.9)
(Q,−Ω0 )
(Q,−)
(Q,+)
(Q,Ω0 )
Ejercicio. Compruébese que esta igualdad se mantiene si Q no es
conexa y se cambia el signo de Ω0 sólo en alguna parte conexa de Q.
8.3.2.
Integración en variedades semi-riemannianas
El concepto de integral de funciones respecto a un elemento de
volumen resulta especialmente natural desde un punto de vista semiriemanniano. En efecto, si suponemos ahora que el ambiente es una
variedad semi-riemanniana orientada (+Q, g), entonces disponemos de
un elemento de volumen canónico, sin más que aplicar a cada espacio
tangente Tp Q la Definición 8.6.5:
168
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Definición 8.3.2 Se define el elemento de volumen métrico orientado
µ+
g de una variedad semi-riemanniana orientada (+Q, g) como la nforma diferencial que en cada espacio tangente Tp Q es igual al elemento
de volumen métrico orientado para (+Tp Q, gp ).
El elemento de volumen métrico orientado se calcula en coordenadas a
partir de las expresiones en el Apéndice 8.6. En efecto, para cualquier
entorno coordenado positivamente orientado (U, ϕ ≡ (q 1 , . . . , q n )) se
tiene
p
µ+
|det MB (g)| dq 1 ∧ · · · ∧ dq n ,
g =
donde B = (∂q1 , . . . , ∂qn ) (véase la Proposición 8.6.6). En particular,
esto prueba que µ+
g es diferenciable.
La Definición 8.3.1 permite ahora definir la integración de funciones
respecto a µ+
g . Por supuesto, si en Q tomamos la orientación opuesta,
+
entonces se tiene µ−
g = −µg . De la igualdad (8.9) (para cada parte
conexa de Q) se tiene que la integración es independiente de la orientación escogida, lo que conduce a la definición:
Definición 8.3.3 Sea (Q, g) una variedad semi-riemanniana orientable. Una función f sobre Q se dice integrable si, escogida una (y
entonces, para toda) orientación sobre Q, f es integrable respecto al
elemento de volumen métrico orientado µ+
g . En este caso, se define su
integral por la expresión, independiente de la orientación escogida:
Z
Z
f :=
f.
(Q,g)
(Q,µ+
g )
El siguiente ejercicio muestra que toda integral de funciones respecto
a un elemento de volumen en el sentido de la Definición 8.3.1 puede
verse como una integral en una variedad riemanniana en el sentido de
la Definición 8.3.3.
Ejercicio. Sea Q una variedad orientable y Ω un elemento de volumen
sobre ella. Pruébese que existe una métrica riemanniana g tal que (para
la orientación determinada por Ω) µ+
g = Ω. (Sugerencia: úsese que
siempre existe alguna métrica riemanniana h, y calcúlese f > 0 de
modo que se pueda tomar g = f h.)
Observación. La Definición 8.3.3 se extiende sin dificultad a variedades semi-riemannianas no orientables. Para comprobarlo, úsese: (1)
8.4. TEORÍA DE LA MEDIDA
169
el abierto de definición de cada entorno coordenado es orientable, lo
que permite definir la integración para funciones con soporte en un
entorno coordenado, (2) las particiones de la unidad (o, alternativamente, el Teorema 8.4.4) extienden esta definición al caso de que el
soporte no verifique tal condición.
8.4.
Integración a partir de la teorı́a de la
medida
Dado un subconjunto A de un conjunto X, la función caracterı́stica
de A se denotará por χA : X → R, donde χA (x) es igual a 1 para todo
x ∈ A, y a 0 en caso contrario.
8.4.1.
Nota previa sobre la integral de Riemann
Recordemos brevemente la integración de Riemann en Rn . Decimos
que un subconjunto C ⊂ Rn es un n−rectángulo o, simplemente, un
rectángulo si existen 2n constantes ai < bi , i ∈ {1, . . . , n} tales que
C = {(x1 , . . . , xn ) ∈ Rn : ai < xi < bi ∀i ∈ {1, . . . , n}}.
Para estos conjuntos se define su volumen como
vol(C) = Πni=1 (bi − ai ).
Cualquier subconjunto acotado de Rn está incluido en un rectángulo de lados suficientemente grandes, y una partición de cada uno de
los lados genera de manera natural una partición del rectángulo por
rectángulos menores. Consideremos una función f : Rn ⊆ Rn → R,
(si sólo está definida en un subconjunto, la supondremos extendida
por 0 a todo Rn ). Si suponemos que f está acotada, con f ≥ 0 y su
soporte cae dentro de un rectángulo C, se hace la siguiente construcción. Sea {C m }m∈N una sucesión de particiones de C (esto es, cada
término C m = {Ckm , k ∈ {1, . . . , km }} es un conjunto de km rectángulos obtenido del producto de particiones de cada uno de sus n−lados),
tal que el menor diámetro |C m | de las particiones de cada uno de los
n lados, tiende a cero cuando m tiende a infinito. Se dice que f es
170
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
integrable en el sentido de Riemann si: (a) existe el lı́mite
Z
∞
X
m
f := lı́m
f (xm
∈ [0, ∞],
k ) · vol(Ck )
n
m→∞
R
k=1
(8.10)
m
donde xm
k es cualquier punto del rectángulo Ck , y (b) este lı́mite resulta
independiente de la partición y los puntos xm
k escogidos. A esta definición se le hacen las extensiones progresivas estándar (compárese con
la Subsección 8.4.3): (i) En el caso de que el soporte no esté acotado,
se hace primero la elección C = [−L, L]n y se toma entonces el lı́mite
L → ∞; (ii) si f no está acotada, se reemplaza por fM , definida en cada punto p como el mı́nimo de {f (p), M }, y se toma el lı́mite M → ∞;
(iii) si no se verificara f ≥ 0, se escribe f = f + − f − , f + , f − ≥ 0, se
repite la construcción para f ± y, caso de que
y
R ambas
R integrales
R existan
3
+
−
no sean ∞ simultáneamente , se define: Rn f = Rn f − Rn f . Un
subconjunto A ⊆ Rn se dice medible Jordan si su función caracterı́stica
χA es integrable (lo cual ocurre si y sólo si el conjunto de sus puntos
frontera es de medida nula, en el sentido de la Subsección
R 8.4.2); en
este caso, se dice que la integral de Riemann
de
f
en
A,
f , existe si
A
R
R
existe la de f χA , y en este caso se define A f = Rn f χA .
Cuando f es continua con soporte compacto, se demuestra que el
lı́mite anterior existe, y es independiente de la sucesión de particiones
escogida. Concretamente, se prueba que el lı́mite de la suma superior
de Riemann (esto es, la sumatoria obtenida en (8.10) tomando xm
k
igual al máximo de f en el rectángulo -cerrado- Ckm ) y el de la suma
inferior de Riemann (ı́dem tomando xm
k como el mı́nimo) coinciden.
Ahora bien, la integral también está bien definida en algunas funciones
no continuas (piénsese por ejemplo en la función escalón). La clase de
las funciones para las que podemos definir la integral en el sentido de
Riemann, y ésta es finita, recibe el nombre de clase de las funciones
“integrables Riemann”.
Todo ello resulta extensible de manera más o menos directa a la
integración en variedades (semi-)riemannianas (véase [Sp2]).
Aunque a la hora práctica de realizar integrales el concepto de integración de Riemann suele resultar suficiente, éste presenta limitaciones
teóricas importantes como: (1) es fácil encontrar funciones que coinciden en todos sus puntos excepto en un conjunto numerable, una de
3
Se excluye ası́ el caso de la integral impropia de Riemann en R
8.4. TEORÍA DE LA MEDIDA
171
ellas integrable Riemann y la otra no (v. gr.: función caracterı́stica de
los racionales y la idénticamente nula), (2) el espacio de las funciones
integrables Riemann
R (módulo las funciones de integral nula) dotado de
la norma k f k= Rn |f | no es completo. Estas carencias se salvan con
la integración de Lebesgue.
8.4.2.
Espacios de medida. Medida de Lebesgue
Un espacio medible es un par (X, F), donde X es un conjunto arbitrario y F es una σ-álgebra; esto es, una colección no vacı́a de subconjuntos de X que verifica las siguientes propiedades:
(a.1) ∅ ∈ F ,
(a.2) si A pertenece a F entonces su complementario Ac también,
(a.3) si {An }n es una sucesión de elementos de F entonces su unión
también pertenece a F.
Un espacio de medida es un espacio medible (X, F) dotado de una
medida; esto es, de una función real m sobre F tal que:
(m.1) m(∅) = 0,
(m.2) m(∪∞
n=1 An ) =
P∞
n=1
m(An ), siendo los An disjuntos dos a dos.
Previamente a la definición de un espacio de medida canónico en Rn ,
definimos la medida exterior de Lebesgue de un subconjunto arbitrario
A ⊂ Rn como el ı́nfimo de las sumas de los volúmenes de los rectángulos, tomado variando en el conjunto de los recubrimientos (numerables)
por rectángulos de A; esto es:
̰
!
X
µ(A) = Inf {{Ci } :A⊆∪∞
vol(Ci ) .
i=1 Ci }
i∈N
i=1
En particular, se dice que un subconjunto A ⊂ Rn es de medida nula
si µ(A) = 0; o, equivalentemente, si para todo ² > 0 existe un con∞
junto
P∞ numerable de rectángulos {Ci }i=1 que recubren A y tales que
i=1 vol(Ci ) < ². Esencialmente, para la integración lo que ocurra en
un conjunto de medida nula resultará irrelevante, de ahı́ que se hable de
172
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
que una propiedad se verifica “casi por doquier” (c.p.d.) cuando se verifica para todos los puntos, salvo a lo más para los de un subconjunto
de medida nula.
La relación entre los conjuntos de medida nula y las aplicaciones
diferenciables se resume en el siguiente resultado:
Teorema 8.4.1 Sea F : Rn → Rn , una aplicación diferenciable:
(1) Si A ⊂ Rn es de medida nula en Rn entonces F (A) es de medida
nula en Rn .
(2) (Sard.) Si ΣF ⊂ Rn es el conjunto de los puntos crı́ticos de F ,
entonces F (ΣF ) es de medida nula en Rn .
Además, si F : Rn → Rm , y n < m entonces F (Rn ) es de medida nula
en Rm .
El conjunto P(Rn ) de las partes de Rn es obviamente una σ-álgebra de
Rn , y la medida exterior de Lebesgue es aplicable a cualquier elemento
de ella. Sin embargo, la medida exterior no verifica la propiedad (m.2)
de una medida. De ahı́ que se elijan σ-álgebras para las cuales la restricción de la medida exterior de Lebesgue sı́ proporcione una medida.
Existen dos elecciones fundamentales: (1) la σ-álgebra boreliana, esto
es, la σ-álgebra mı́nima que contiene a los abiertos de Rn , y (2) la
σ-álgebra de Lebesgue, esto es, la σ-álgebra mı́nima que contiene tanto
a los abiertos como a los conjuntos de medida nula de Rn . (Que tales
σ-álgebras mı́nimas existen se prueba tomando la intersección de todas
las σ-álgebras que contienen los subconjuntos requeridos).
Se define ası́ el espacio de medida de Lebesgue (Rn , MRn , µRn ) ≡
(Rn , M, µ), donde M es la σ-álgebra de Lebesgue, y µ es la restricción a M de la medida exterior de Lebesgue o, simplemente, medida
de Lebesgue. La clase de los conjuntos medibles Lebesgue (que, desde luego, incluye tanto a los abiertos como a los cerrados), se revela
espectacularmente grande; la construcción de un conjunto no medible
precisa del axioma de elección.
8.4.3.
Integral de Lebesgue en Rn
Una vez definido el espacio de medida de Lebesgue, vamos a definir
la clase de las funciones sobre Rn a las que, potencialmente, podremos
8.4. TEORÍA DE LA MEDIDA
173
definir la integral. Intentaremos que ésta sea lo más general posible y,
eventualmente, admitiremos incluso como valor de las funciones ±∞.
Definición 8.4.2 Diremos que f : Rn → [−∞, ∞] es medible si son
subconjuntos medibles Lebesgue las preimágenes de cualquier intervalo
abierto f −1 (]y0 , y1 [), ası́ como f −1 (∞), f −1 (−∞).4
La clase de las funciones medibles no sólo incluye a las continuas, sino
que, al igual que la de los conjuntos medibles, resulta muy grande. La
medibilidad no sólo es respetada por las operaciones algebraicas elementales, sino que se conserva por paso al lı́mite. Ası́, una función f
será medible cuando exista una sucesión de funciones {fm }m∈N medibles que converge puntualmente c.p.d a f ; el lı́mite superior o inferior
de una sucesión de funciones medibles es también medible.
El proceso de definición de la integral sigue entonces los siguientes
pasos:
(1) En primer lugar, supongamos f ≥ 0 y acotada, f (Rn ) ⊂ [0, M ]
para algún real M > 0. Consideremos una sucesión de particiones {P m }m de [0, M ], P m = {ykm , k = 0, . . . , jm }, y tal que su
m
diámetro |P m | = supk {(yk+1
− ykm ) : k ∈ {0, . . . , jm − 1} tienda a
cero. Definimos la integral de f sobre Rn como:
!
Ãj −1
Z
m
X
m
m
f (yk ) · µ(Ak )
∈ [0, ∞],
f := lı́m
m→∞
Rn
k=0
−1
m
siendo Am
([ykm , yk+1
]). En efecto, se puede demostrar que
k = f
este lı́mite existe y es independiente de la sucesión de particiones
R
escogida. En particular, con esta definición se tiene Rn χA =
µ(A), para todo A ⊆ Rn medible.
4
En general, dados dos espacios medibles (X, F), (X 0 , F 0 ), una aplicación f :
X → X 0 se dice medible si f −1 (A0 ) ∈ F para todo A0 ∈ F 0 . Se puede comprobar
n
que, para el caso de que f : R → R, esta definición general incluye a la de arriba
n
siempre que en el dominio R consideremos la σ−álgebra de Lebesgue y en el
codominio la σ− álgebra boreliana (la cual, al tener menos elementos que la de
Lebesgue, en principio permite que sean admisibles como medibles más funciones).
La extensión de la σ-álgebra boreliana a [−∞, ∞] puede hacerse de manera obvia;
en cualquier caso, la definición de que f sea medible equivale a que la preimagen
de cualquier intervalo cerrado de [−∞, ∞] sea un medible.
174
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
(2) Si f ≥ 0 no está acotada, se define fM : Rn → [0, ∞[ como
fM (x) =Min{f (x), M }, se considera la integral de fM según el
paso anterior y se define:
Z
Z
fM .
f := lı́m
M →∞ Rn
Rn
Obsérvese que este lı́mite debe existir, pues la integral de fM (≥ 0)
crece con M .
(3) Supongamos ahora que la función medible f puede tomar valores negativos. Entonces podemos escribir f = f + − f − , donde
f + , f − : Rn → [0, ∞] son funciones medibles no negativas (cuya
integral ya hemos
En este caso, si al menos una de las
R definido).
R
dos integrales Rn f + , Rn f − es finita, se define la integral de f
por
Z
Z
Z
n
R
f :=
n
R
f+ −
n
R
f − ∈ [−∞, ∞].
(4) Se dice que una función f : Rn → [∞, ∞] es integrable L1 si
la integral de f está bien definida según el Rpaso anterior, y su
integral es finita (esto es, si f es medible y Rn |f | < ∞). Si se
establece en el espacio de las funciones integrables L1 la relación
de equivalencia f ∼
R h si y sólo si f ≡ h c.p.d. (o, equivalentemente, si y sólo si Rn |f − h| = 0) se induce en el cociente una
1
estructura
R de espacio vectorial, ası́ como la norma (norma L ):
k[f ]k = Rn |f | (es costumbre abusar de la notación y denotar
por f indistintamente a la función y a su clase de equivalencia
[f ]). Se denota por L1 (Rn ) a este espacio normado, que resulta
ser de Banach.
(5) Finalmente, señalemos que no es necesario considerar siempre
como dominio todo Rn . Ası́, cualquier función f definida en un
subconjunto medible E se supone extendida por 0 fuera de él, y
se define:
Z
Z
f :=
f χE ,
E
Rn
(en el caso de que exista el último miembro) ası́ como, de manera
obvia, el espacio L1 (E).
8.4. TEORÍA DE LA MEDIDA
8.4.4.
175
Conjuntos de medida nula y espacio de medida en una variedad
Consideremos ahora una variedad semi-riemanniana (Q, g) de dimensión n. Para definir de manera análoga a Rn un espacio de medida,
debemos empezar por considerar una σ−álgebra sobre Q. La σ−álgebra, será intrı́nseca a la estructura diferenciable, e independiente de
g.
Definición 8.4.3 Un subconjunto A de la variedad diferenciable Q es
de medida nula si para todo entorno coordenado (U, ϕ) el subconjunto
ϕ(U ∩ A) es un conjunto de medida nula de Rn .
El Teorema 8.4.1(1) muestra la consistencia de esta definición, esto es,
basta con verificar que ϕ(U ∩ A) es de medida nula para un recubrimiento por entornos coordenados de A.
Es fácil entender la importancia a la hora del cómputo de una integral del siguiente resultado, que permite reducir siempre la integración
a un único entorno coordenado (entorno coordenado c.p.d.)5 :
Teorema 8.4.4 Sea Q una variedad diferenciable de dimensión n. Existe un cerrado C ⊂ M de medida nula tal que U = Q\C es difeomorfo
a un abierto de Rn .
Consecuencia inmediata de este resultado es que el Teorema 8.4.1 es
traspasable a variedades, sin más que sustituir Rn , Rm por variedades
de dimensiones n, m, resp.
Con estas definiciones, ya estamos en condiciones de definir el espacio medible para (Q, g). Definimos la σ-álgebra MQ de Q como la
σ-álgebra generada por los abiertos y los conjuntos de medida nula de
Q. A los elementos de MQ los llamaremos conjuntos medibles de la
variedad. Para cada conjunto medible A ⊆ Q, y cualquier entorno coordenado, ϕ(U ∩ A) resulta ser entonces un medible de Rn . Definimos
ası́ la medida de A como:
Z
p
|det MB (g)|χϕ(U ∩A) ,
µg (A) =
ϕ(U )
5
Aunque se puede dar una prueba directa de este teorema, existen métodos
elegantes y simples dentro del marco de la Geometrı́a Riemanniana: se toma una
métrica riemanniana completa, y se suprime su “lugar de corte”.
176
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
donde (U, ϕ) es cualquier entorno coordenado c.p.d. Es fácil comprobar
directamente por el teorema del cambio de variables (y se ha discutido
ya exhaustivamente en las Subsecciones 8.2.1, 8.3.2), que la medida
ası́ definida resulta independiente del entorno coordenado escogido6 .
Algunas propiedades de esta medida, que resultan inmediatas de
las de Rn , son las siguientes:
1. Si A ⊆ B ⊆ Q entonces µQ (A) ≤ µQ (B).
2. Dada una sucesión {An }n ⊆ Q, si µQ (An ) = 0 para todo n
entonces µQ (∪n An ) = 0.
3. Si A ⊂ Q verifica µQ (A) = 0 entonces su interior es vacı́o.
4. Si F : Q → Q0 es diferenciable y las dimensiones de Q, Q0 coinciden, entonces A ⊂ Q con µQ (A) = 0 implica µQ0 (F (A)) = 0.
5. Si F : Qn → Qm es diferenciable y las respectivas dimensiones
satisfacen n < m, entonces µQ0 (F (Q)) = 0.
6. Dadas las variedades Q, Q0 , y fijado un punto (q0 , q00 ) ∈ Q × Q0
definimos
iq00 : Q → Q × Q0
q 7→ (q, q00 )
jq0 : Q0 → Q × Q0
q 0 7→ (q0 , q 0 ).
Sea A ⊂ Q × Q0 . Si casi para todo q0 ∈ Q (resp. casi para todo q00 ∈ Q0 )
0
µQ0 (jq−1
(A)) = 0 (resp. µQ (i−1
q 0 (A)) = 0) entonces µQ×Q (A) = 0.
0
0
8.4.5.
Integración en una variedad
Una vez definido el espacio de medida de la variedad (Q, g), la
definición Rde función medible f : Q → [−∞, ∞], de la la integral de
Lebesgue Q f y del espacio normado de Banach L1 (Q) sigue pasos
completamente análogos a los de la Subsección 8.4.3 para Rn (basta
con reemplazar Rn , µ por Q, µg a lo largo de toda esa subsección).
6
Obsérvese que aunque, debido a la simplificación de notación para el elemento
de volumen métrico orientado, µ+
g ≡ µg , usamos ahora la misma notación para la
medida, no existe posibilidad de confusión entre ambas.
8.4. TEORÍA DE LA MEDIDA
177
Más aún, las propiedades fundamentales de la integral de Lebesgue
se demuestran de manera completamente análoga en el caso de Rn y de
la variedad. Repasamos brevemente estas propiedades, formulándolas
directamente para (Q, g):
Elementales:
(i) Linealidad: si f = af1 + bf2 siendo f1 y f2 integrables
R
Lebesgue, entonces f es integrable Lebesgue y: (Q,g) f =
R
R
f + (Q,g) f2 ,
(Q,g) 1
R
R
(ii) Orden: f ≤ g entonces (Q,g) f ≤ (Q,g) g.
Conmutatividad del lı́mite con la integral:
Teorema de la Convergencia Monótona. Sea {fn }n una
sucesión no decreciente c.p.d. de funciones medibles positivas sobre (Q, g) y f : Q → [0, ∞] su lı́mite
puntual c.p.d.
Entonces, f
R
R
es medible y su integral verifica: (Q,g) f = lı́mn (Q,g) fn .
Teorema de la Convergencia Dominada. Sea {fn }n una
sucesión de funciones integrables L1 en (Q, g) tales que: (i) existe una función h integrable L1 tal que |fn | ≤ h c.p.d. para cada
n ∈ N; (ii) existe f : Q → [−∞, ∞] que es lı́mite
R puntual
R c.p.d.
de {fn }n . Entonces, f es integrable L1 y lı́mn (Q,g) fn = (Q,g) f .
Integración en variedades producto:
Para integrar en una variedad producto, usaremos la notación
estándar (diferencial respecto a una variable) para indicar si se
está integrando sólo en uno de los factores.
Teorema de Fubini. Sean (Qi , gi ), i ∈ {1, 2} dos variedades
semi-riemannianas y f : Q1 × Q2 → [−∞, ∞] una función medible.
Sean:
Z
Z
I12 =
dq1
Z
(Q1 ,g1 )
I21 =
dq2 |f (q1 , q2 )|
Z
(Q2 ,g2 )
dq2
(Q2 ,g2 )
dq1 |f (q1 , q2 )|.
(Q1 ,g1 )
178
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Entonces I12 < ∞ ⇔ I21 < ∞.
En este caso, f es integrable L1 y se verifica:
Z
f (q1 , q2 ) =
(Q1 ×Q2 ,g1 +g2 )
Z
Z
Z
dq1
(Q1 ,g1 )
Z
dq2 f (q1 , q2 ) =
(Q2 ,g2 )
dq2
(Q2 ,g2 )
dq1 f (q1 , q2 ),
(Q1 ,g1 )
donde además:
(i) casi para todo q10 ∈ Q1 , la función q2 7→ fq10 (q2 ) := f (q10 , q2 )
es finita c.p.d. en Q2 y es integrable L1 ;
(ii) casi para todo q20 ∈ Q2 , la función q1 7→ fq20 (q1 ) := f (q1 , q20 )
es finita c.p.d. en Q1 y es integrable L1 ;
R
(iii) la función q1 7→ (Q2 ,g2 ) fq1 es finita c.p.d. en Q1 y es integrable L1 ;
R
(iv) la función q2 7→ (Q1 ,g1 ) fq2 es finita c.p.d. en Q2 y es integrable L1 ;
Otros resultados clásicos de teorı́a de integración permiten relacionar
integrales con derivadas (versión de la Regla de Barrow clásica, resultados que permiten permutar la integral con derivadas parciales, etc.)
8.5.
Apéndice 1: álgebra exterior sobre
V (R)
En este apéndice y el siguiente se recogen algunas notas básicas
sobre el álgebra exterior en un espacio vectorial V (R) de dimensión n,
necesarias para el desarrollo de la teorı́a de la integración de n−formas
en variedades. Esencialmente, en el presente apéndice estudiaremos
tensores antisimétricos, extendiendo nuestro estudio de los 2-covariantes
en la Sección 6.4 a los r−covariantes; en el Apéndice 2 nos centraremos
en el caso r = n.
8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R)
179
Definición 8.5.1 Diremos que un tensor r-covariante T ∈ Tr,0 (V ) es
antisimétrico si verifica:
T (y1 , . . . , yi , . . . , yj , . . . , yr ) = −T (y1 , . . . , yj , . . . , yi , . . . , yr )
1 ≤ i < j ≤ r, para todo y1 , . . . , yr ∈ V , esto es, si T es antisimétrico
respecto a cualquier par (i, j) de sus variables, i < j. El conjunto de
todos los tensores r-covariantes antisimétricos se denotará por Λr (V ).
Es directo comprobar que Λr (V ) es un subespacio vectorial de Tr,0 (V ).
Recordemos además las identificaciones Λ1 (V ) = V ∗ y Λ0 (V ) = R.
Antes de introducir el concepto de antisimetrizador para los tensores de un espacio vectorial, conviene recordar la definición, ası́ como
algunas propiedades básicas, de las permutaciones.
Definición 8.5.2 Sea S(r) = {1, 2, . . . , r} ⊂ N. Llamaremos permutación de S(r) (o de r elementos) a toda aplicación biyectiva σ :
S(r) → S(r). Al conjunto de todas las permutaciones de S(r) lo denotaremos por Sr .
Propiedades elementales:
(1) El conjunto de las permutaciones Sr junto con la operación de
composición tiene estructura de grupo abeliano. Además, su cardinal es r!
(2) Toda permutación σ ∈ Sr , se puede escribir como composición de
trasposiciones (permutaciones que actuan sobre S(r) únicamente
intercambiando dos de sus elementos). Existen muchas maneras de escribir una misma permutación σ como composición de
trasposiciones, y se pueden escoger éstas de un modo canónico
como [σ] trasposiciones “de ı́ndices contiguos”, tomadas de modo que se vayan “reordenando los ı́ndices de menor a mayor”.
En cualquier caso, el número de trasposiciones necesarias para
una σ fijada siempre será par o impar, independientemente de la
composición de trasposiciones, y se define la signatura de σ como
sig(σ) := (−1)[σ] .
(3) La aplicación sig : Sr → {−1, 1} es un homomorfismo de grupos.
La permutación σ se dice par (resp. impar) si sig(σ) = 1 (resp.
= −1).
180
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Definición 8.5.3 Se define el antisimetrizador de orden r ∈ N para
el espacio vectorial V como la aplicación
hr : Tr,0 (V ) → T
r,0 (V )
P
T
7→ σ∈Sr sig(σ)T σ ,
donde T σ (y1 , . . . , yr ) := T (yσ(1) , . . . , yσ(r) ) para todo y1 , . . . , yr ∈ V .
No es difı́cil comprobar las siguientes propiedades:
Propiedades:
(1) hr es lineal y hr (T σ ) = sig(σ) hr (T ).
(2) Im hr ⊂ Λr (V ), y si T ∈ Λr (V ) entonces hr (T ) = r! T .
(3) Para todo T ∈ Tr,0 (V ), T 0 ∈ Tr0 ,0 (V ) se tiene
0
0
hr+r (hr (T ) ⊗ T 0 ) = r! hr+r (T ⊗ T 0 ),
0
0
0
hr+r (T ⊗ hr (T 0 )) = r0 ! hr+r (T ⊗ T 0 ).
0
0
0
(4) hr+r (T ⊗ T 0 ) = (−1)r·r hr+r (T 0 ⊗ T ).
Definición 8.5.4 Se definen los siguientes productos exteriores:
0
0
∧ : Λr (V ) × Λr (V ) → Λr+r (V )
(T, T 0 ) 7→ T ∧ T 0 =
0
0
1
hr+r (T
r!r0 !
⊗ T 0)
0
∧ : Λr (V ) × Λr (V ) → Λr+r (V )
1
r+r0
(T ⊗ T 0 ).
(T, T 0 ) 7→ T ∧T 0 = (r+r
0 )! h
Es inmediato comprobar que estos productos pueden expresarse del
siguiente modo:
P
P
T ∧ T 0 = k!k1 0 ! σ∈Sr+r0 sig(σ)(T ⊗ T 0 )σ = σ∈σr,r0 sig(σ)(T ⊗ T 0 )σ
P
1
0 σ
T ∧T 0 = (k+k
0 )!
σ∈Sr+r0 sig(σ)(T ⊗ T )
donde σr,r0 = {σ ∈ Sr+r0 : σ(1) < · · · < σ(r) y σ(r + 1) < · · · <
σ(r + r0 )}.
Propiedades: Los productos exteriores ∧, ∧ son:
8.5. APÉNDICE 1: ÁLGEBRA EXTERIOR SOBRE V (R)
181
(1) bilineales (obviamente),
(2) asociativos (para lo cual resulta esencial la elección hecha de los
factores r!r0 ! o (r + r0 )!), y
(3) antisimétricos, en el siguiente sentido:
0
T ∧ T 0 = (−1)r+r T 0 ∧ T,
0
T ∧T 0 = (−1)r+r T 0 ∧T,
0
para T ∈ Λr (V ), T 0 ∈ Λr (V ). En adelante, escogeremos siempre el
producto exterior ∧.
Proposición 8.5.5 Sea B ∗ = (φ1 , . . . , φn ) una base de V ∗ , se verifican:
(i) El conjunto {φi1 ∧ · · · ∧ φir : 1 ≤ i1 < · · · < ir ≤ n} es una base
de Λr (V ).
µ ¶
n
r
si r ≤ n, y 0 si r > n.
(ii) dim Λ (V ) =
r
(iii) Si T ∈ Λr (V ) entonces:
X
T =
ti1 ...ir φi1 ∧ · · · ∧ φir ,
1≤i1 <···<ir ≤n
donde ti1 ...ir = T (vi1 , . . . , vir ) y B = (v1 , . . . , vn ) tiene por base
dual a B ∗ .
Demostración. Obviamente, (ii) se deduce directamente de (i). Para
comprobar la independencia lineal del conjunto en cuestión, supongamos que
X
ai1 ...ir φi1 ∧ · · · ∧ φir = 0.
1≤i1 <···<ir ≤n
Entonces, aplicando los dos miembros de la expresión al vector (vl1 ,
. . . , vlr ), 1 ≤ l1 < · · · < lr ≤ n, obtenemos que al1 ···lr = 0.
Finalmente, escribiendo como hasta ahora ti1 ···ir = T (vi1 , . . . , vir ):
P
T = ni1 ,...,ir =1 ti1 ,...,ir φi1 ⊗ · · · ⊗ φir
P
P
= 1≤i1 <···<ir ≤n σ∈Sr tiσ(1) ...iσ(r) φiσ(1) ⊗ · · · ⊗ φiσ(r)
P
P
= P1≤i1 <···<ir ≤n σ∈Sr sig(σ)ti1 ...ir φiσ(1) ⊗ · · · ⊗ φiσ(r)
= P1≤i1 <···<ir ≤n ti1 ...ir hr (φi1 ⊗ · · · ⊗ φir )
= 1≤i1 <···<ir ≤n ti1 ...ir φi1 ∧ · · · ∧ ϕir ,
182
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
lo que prueba (i) y (iii). 2
Ejercicio. Consideremos φ1 , . . . , φr ∈ V ∗ . Demuéstrese que el conjunto {φ1 , . . . , φr } es linealmente independiente si y sólo si φ1 ∧· · ·∧φr 6= 0.
Llamaremos álgebra exterior sobre V al espacio
Λ(V ) ≡ (⊕nr=0 Λr (V ), ∧),
donde el producto exterior ∧ se supone definido para cualequiera par
de elemento de Λ(V ) extendiéndolo de manera natural por bilinealidad.
Por último, justifiquemos para referencia posterior cómo es posible usar
los homomorfismos entre espacios vectoriales para transportar tensores
antisimétricos y, en general, r-covariantes, de uno a otro espacio. En
adelante, V 0 (R) será otro espacio vectorial de dimensión finita.
Definición 8.5.6 Sea F : V → V 0 lineal y T 0 ∈ Tr,0 (V 0 ). Se define el
tensor inducido o pull-back F ∗ T 0 ∈ Tr,0 (V ) de T 0 por F como
F ∗ T 0 (y1 , . . . , yr ) = T 0 (F (y1 ), . . . , F (yr )),
∀y1 , . . . yr ∈ V.
Propiedades:
(1) La aplicación F ∗ : Tr,0 (V 0 ) → Tr,0 (V ) es lineal y verifica F ∗ (Λr (V 0 ))
⊂ Λr (V ).
(2) Si F = IdV entonces F ∗ = IdTr,0 (V ) .
(3) Si se tiene otra aplicación lineal G : V 0 → V 00 entonces (G◦F )∗ =
F ∗ ◦ G∗ .
(4) Si F es biyectiva entonces (F −1 )∗ = (F ∗ )−1 . En particular, F ∗ es
biyectiva y F ∗ (Λr (V 0 )) = Λr (V ).
Se define entonces F∗ = (F −1 )∗ que, en el caso de que G también
sea biyectiva verifica: (G ◦ F )∗ = G∗ ◦ F∗ .
(5) F ∗ (T10 ∧ T20 ) = F ∗ (T10 ) ∧ F ∗ (T20 ).
8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R)
183
8.6.
Apéndice 2: Elementos de volumen
en V (R)
8.6.1.
Elemento de volumen y orientación
Si ω ∈ Λn (V ), ω 6= 0, entonces forma una base de Λn (V ). Este
hecho simple permite introducir los siguientes conceptos:
Definiciones 8.6.1 (1). Llamamos elemento de volumen de V a todo ω ∈ Λn (V ) no nulo.
(2). Consideremos la relación de equivalencia en Λn (V )−{0} definida
por: ω1 ∼ ω2 si y sólo si w1 = a w2 , a > 0. Llamamos orientación
en V a cada una de las dos únicas clases de equivalencia definidas
por ∼. Fijada una de estas clases, [ω], al par (V, [ω]) le llamaremos espacio vectorial orientado según [ω].
(3). Sea (V, [ω]) un espacio vectorial orientado. Diremos que una base
(ordenada) B = (v1 , . . . , vn ) está positivamente orientada (resp.
negativamente orientada) si su correspondiente base dual B ∗ =
(φ1 , . . . , φn ) verifica TB := φ1 ∧ · · · ∧ φn ∈ [ω] (resp. TB 6∈ [ω]). Al
tensor TB le llamaremos tensor determinante en B (y, de hecho,
TB (y1 , . . . , yn ) coincide con el determinante de la matriz cuya
columna j−ésima está formada por las coordenadas de yj en B,
para todo j).
Ejercicio. Pruébense las siguientes afirmaciones:
(i). Todo elemento de volumen ω ∈ Λn (V ) puede escribirse como un
tensor determinante para alguna base ordenada B.
(ii). Para Rn , el determinante usual de n vectores es un elemento
de volumen, que coincide con el tensor determinante en la base
usual.
(iii). Si B 0 = (v10 , . . . , vn0 ) es otra base ordenada entonces
TB 0 = det(M (IdV , B 0 ← B)) · TB .
(8.11)
donde M (IdV , B 0 ← B) es la matriz en cuyas columnas aparecen,
ordenadamente, las coordenadas de los elementos de la base B
en B 0 .
184
8.6.2.
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Determinante de un endomorfismo
Definición 8.6.2 Sean (V, [ω]), (V 0 , [ω 0 ]) dos espacios vectoriales orientados. Diremos que un isomorfismo F : V → V 0 preserva las orientaciones si F ∗ ω 0 ∈ [ω].
Obsérvese que esta definición es independiente del representante ω 0
escogido. Además, si F preserva las orientaciones [ω] y [ω 0 ], entonces
también preserva las orientaciones opuestas.
El hecho de que Λn (V ) tenga dimensión 1 permite definir el determinante cuando F es un endomorfismo.
Definición 8.6.3 Sea F un endomorfismo de V y consideremos el
correspondiente endomorfismo
F ∗ : Λn (V ) → Λn (V )
w 7→ F ∗ w
del espacio vectorial monodimensional Λn (V ). Llamamos determinante
de F al único número real det F ∈ R que verifica
F ∗ = det F · IdΛn (V ) .
Esta definición coincide, para cualquier base B = (v1 , . . . , vn ), con la
del determinante usual de la matriz M (F, B) cuya columna j−ésima
está formada por las coordenadas de F (vj ) en B. De hecho, es fácil
comprobar de la Definición 8.6.3 y las propiedades del tensor TB :
Proposición 8.6.4 (1) Si F es un endomorfismo de V y B = (v1 ,
. . . , vn ) es una base ordenada suya, entonces se verifica
det F = TB (F (v1 ), . . . , F (vn )) = det(M (F, B)).
(2) Sea F un automorfismo de V . Se verifica que det F > 0 si y sólo
si F ∗ ω ∈ [ω] para algún (y, entonces, para todo) elemento de volumen
ω, esto es, si y sólo si F aplica bases positivamente orientadas en bases
positivamente orientadas.
8.6. APÉNDICE 2: ELEMENTOS DE VOLUMEN EN V (R)
8.6.3.
185
El elemento de volumen métrico orientado
Consideremos ahora que, en el espacio vectorial orientado (V, [ω]),
fijamos un producto escalar g = h·, ·i.
Definición 8.6.5 Se define el elemento de volumen métrico orientado
de (V, g, [ω]) como
µ+
g := TB0 ,
donde B0 es cualquier base de V ortonormal y positivamente orientada.
Resulta inmediato de (8.11) que, en esta definición, TB0 no depende de
la base B0 (ortonormal y positivamente orientada) escogida.
Por simplicidad, omitiremos en la notación la dependencia del elemento de volumen métrico con la orientación, y escribiremos únicamente µg . No obstante, cuando nos refiramos al elemento de volumen
métrico con la orientación opuesta, escribiremos µ−
g.
Obsérvese que si fijamos una base B = (v1 , . . . , vn ) de V entonces
se tiene:
µg = µg (v1 , . . . , vn ) · TB = det(IdV , B0 ← B) · TB ,
donde B0 es cualquier base ortonormal, positivamente orientada. Ahora
bien, considerando las matrices MB (g), MB0 (g) de la métrica g en las
bases B, B0 , respectivamente, se tiene
MB (g) = M (IdV , B0 ← B)t · MB0 (g) · M (IdV , B0 ← B).
Por tanto, deducimos que
|det MB (g)| = det (M (IdV , B0 ← B))2 .
En resumen:
Proposición 8.6.6 Si B es cualquier base positivamente orientada de
(V, [ω], g), entonces:
p
µg = |det MB (g)| TB .
Por último, es de señalar que la definición de determinante de un endomofismo se puede extender a la de determinante de una aplicación
lineal entre dos espacios vectoriales métricos orientados de igual dimensión.
186
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Definición 8.6.7 Sean (V, g, [ω]), (V 0 , g 0 , [ω 0 ]) dos espacios vectoriales métricos orientados de igual dimensión, y F : V → V 0 una aplicacion lineal. Se define el determinante de F como el único número real
det F ∈ R que verifica
F ∗ µg0 = det F · µg .
Obviamente, si F es un endomorfismo de V entonces las Definiciones
8.6.3 y 8.6.7 coinciden para todo g y [ω], siempre y cuando se supongan
g 0 = g y [ω 0 ] = [ω].
8.7.
Apéndice 3: r−formas y orientación
en variedades
8.7.1.
El álgebra de r−formas diferenciales
De manera inmediata, todo el álgebra de tensores antisimétricos
desarrollada en las secciones anteriores para un espacio vectorial se
traspasa a variedades diferenciables. Ası́, un un campo tensorial antisimétrico r-covariante o r−forma diferencial β ∈ Λr (Q) se escribirá en
coordenadas:
X
β=
βi1 ···ir dq i1 ∧ · · · ∧ dq ir , i1 , . . . , ir ∈ {1, . . . , n}. (8.12)
1≤i1 <···<ir ≤n
con βi1 ···ir = β(∂i1 · · · ∂ir ). Se define el álgebra exterior
Λ(Q) ≡ (⊕nr=0 Λr (Q), ∧)
entendiéndose la acción natural del producto exterior ∧ punto a punto.
Como para cualquier campo tensorial, la diferenciabilidad de cada r-forma equivale a que las funciones ai1 ···ir sean diferenciables para
cualesquiera entornos coordenados (aunque basta con que la diferenciabilidad se verifique para las cartas de un atlas). Análogamente, se
pueden definir r−formas que sean sólo continuas o medibles, según el
carácter de las funciones que inducen sus coordenadas sobre abiertos
de Rn .
8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN
8.7.2.
187
Orientación de una variedad
Dada una n−variedad Q, un elemento de volumen (resp. orientación)
sobre Q se define como una asignación diferenciable de un elemento de
volumen sobre cada Tp Q:
Definiciones 8.7.1 (1) Un elemento de volumen sobre Q es una nforma diferenciable Ω que no se anula en ningún punto.
(2) Una orientación sobre una variedad Q es una elección en cada
p ∈ Q de una orientación [ωp ] de Tp Q que resulta diferenciable en el
sentido de que para todo p ∈ Q existe un entorno Up y un elemento de
volumen Ω sobre Up tal que Ωp0 ∈ [ωp0 ] para todo p0 ∈ Up .
Proposición 8.7.2 Sea Q una variedad diferenciable. Son equivalentes:
(1) Q admite un elemento de volumen.
(2) El C ∞ (Q)-modulo Λn (Q) esta generado por un elemento Ω0 , esto
es, Λn (Q) = {f Ω0 : f ∈ C ∞ (Q)}.
(3) Q admite una orientación.
(4) Cada parte conexa de Q admite exactamente dos orientaciones.
Idea de la Demostración. Resultan inmediatas la equivalencia (2) ⇔
(1) ⇒ (3). (3) ⇒ (1) se demuestra usando una partición de la unidad
µi subordinadaPal recubrimento de los Up en la Definición 8.7.1(2), y
tomando Ω = i µi Ωpi .
Para la equivalencia con (4), obsérvese que la orientación determinada por el elemento de volumen Ω es distinta a la de −Ω. Además, si
Q es conexa no pueden existir más de dos orientaciones por (2): la determinada por f Ω0 y la determinada por −f Ω0 , para cualquier f > 0.
2
Definición 8.7.3 Una variedad diferenciable Q se dice orientable si
(alguna de) las condiciones de la Proposición 8.7.2 se verifican. En
este caso, al par (Q, [Ω]) se le llama variedad orientada, siendo Ω un
elemento de volumen y [Ω] la orientación que define.
188
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
Para simplificar la notación, escribiremos (Q, [Ω]) ≡ +Q, y −Q denotará la variedad orientada con la orientación opuesta. Todo abierto de
una variedad orientada se supone asimismo orientado por la restricción
de la orientación.
A continuación centraremos nuestra atención en el comportamiento de
la orientación respecto a los difeomorfismos locales y, en particular,
respecto de los entornos coordenados.
Definición 8.7.4 Sea F : Q0 → Q un difeomorfismo local y [Ω] una
orientación sobre Q. Se define la orientación inducida por F en Q0
como [F ∗ Ω]. Si suponemos prefijada una orientación [Ω0 ] en Q0 , se
dice que F preserva la orientación si [Ω0 ] = [F ∗ Ω].
Ejercicio. Pruébese que si Q es conexa entonces un difeomorfismo
local F : +Q → +Q preserva o no la orientación con independencia de
la que se escoja.
En Rn , la orientación canónica o usual es [dx1 ∧· · ·∧dxn ]. Si F : U → V
es un difeomorfismo local entre dos abiertos U, V de Rn entonces F
preserva la orientación si y sólo si detJ (F ) > 0.
Proposición 8.7.5 Sea Q una variedad diferenciable. Son equivalentes:
(1) Q es orientable,
(2) Existe un recubrimiento por entornos coordenados de Q con cambios de carta de jacobiano positivo.
En este caso, escogida una orientación en Q, existe un atlas cuyas
cartas coordenadas preservan la orientación de Q y la usual de R.
Demostración. (1)⇒(2) Observemos previamente que, escogida una
orientación, para cada entorno coordenado (U, ϕ ≡ (q 1 , . . . , q n )) con U
conexo, la aplicación ϕ : U → ϕ(U ) ⊆ Rn o conserva la orientación
o la invierte en todo punto. En este último caso, podemos definir la
carta ϕ̃ ≡ (q 1 , . . . , qn−1 , −qn ), que sı́ la conservarı́a. El atlas ası́ formado
verifica la propiedad deseada. En efecto, como la composición de dos
difeomorfismos locales que preservan la orientación también preserva la
orientación, cada cambio de coordenadas conserva la orientación usual
de Rn , de donde se sigue el resultado.
8.7. APÉNDICE 3: R−FORMAS Y ORIENTACIÓN
189
(2)⇒(1) Escojamos para cada p ∈ Q la orientación inducida por
cada carta del recubrimiento. Esta elección es consistente, esto es, si
(U, ϕ), (W, ψ) son dos de tales cartas, la orientación inducida por ψ
es la misma que por ϕ en U ∩ W (ψ = (ψ ◦ ϕ−1 ) ◦ ϕ se expresa como
composición de dos difeomorfismos que preservan la orientación). 2
Ejercicio. Demuéstrese que si Q es una variedad orientable entonces
admite exactamente 2c orientaciones, siendo c el número de partes
conexas de Q.
8.7.3.
El recubridor de dos hojas orientable
Aunque existen conocidos ejemplos de variedades no orientables
(cinta de Moebius, botella de Klein, superficie proyectiva real), la restricción de orientabilidad no se considera muy restrictiva por la existencia, en este caso, de un recubridor de dos hojas orientable.
Definición 8.7.6 Sean Q, Q̃ dos variedades diferenciables, Q conexa.
Una aplicación diferenciable Π : Q̃ → Q es recubridora si para cada
p ∈ Q existe un entorno conexo U tal que Π−1 (U ) es una unión disjunta
de k ∈ N ∪ {∞} abiertos conexos Π−1 (U ) = ∪ki=1 Ũi tales que cada
restricción Π|Ũi es un difeomorfismo sobre U .
En este caso, k es constante, y se dice que (Q̃, Π) es un recubridor
de k hojas de Q.
Ası́, son aplicaciones recubridoras de infinitas hojas R → S 1 (⊂ R2 ≡
C), t 7→ eit , o la proyección canónica R2 → R2 /Z2 , donde el cociente
es identificable con un toro. En variable compleja, las superficies de
Riemann de k hojas construidas para una función k−multivaluada son
recubridoras en el sentido anterior. No es difı́cil construir una aplicación
recubridora de dos hojas del cilindro (orientable) en la cinta de Moebius
(no orientable). Este ejemplo se puede generalizar a cualquier variedad
Q como sigue.
Definamos a partir de la variedad conexa Q la siguiente nueva variedad.
Como conjunto consideramos Q̃ = {(p, Op ) : p ∈ Q, Op es una
orientación en Tp Q}. Para la topologı́a y la estructura diferenciable,
consideramos para cada p̃ = (p, Op ) ∈ Q̃ una carta (U, ϕ) tal que U es
conexo, p ∈ U y ϕ preserva la orientación Op . Definimos entonces un
190
CAPÍTULO 8. INTEGRACIÓN EN VARIEDADES
entorno coordenado (Ũ , ϕ̃) de Q̃ como
ϕ̃ : Ũ → Rn
(q, Oq ) 7→ ϕ(q),
siendo Ũ = {(q, Oq ) : q ∈ U, Oq la orientación inducida por ϕ en q}.
Se verifican entonces las siguientes propiedades:
(i) Por construcción, la aplicación Π es un recubridor de dos hojas,
y Q̃ es orientable;
(ii) Q es orientable si y sólo si Q̃ tiene dos partes conexas.
En particular, se demuestra ası́:
Teorema 8.7.7 Toda variedad diferenciable no orientable conexa Q
admite un recubridor de dos hojas (Q̃, Π) tal que Q̃ es orientable y
conexo.
Ejercicio. Una variedad producto Q1 × Q2 es orientable si y sólo si
Q1 y Q2 lo son.
Por último, es de señalar que la idea de la construcción del recubridor de dos hojas orientables está en la base del siguiente importante
resultado, en el que el papel del conjunto de las dos orientaciones en
cada punto lo pasa a desempeñar el conjunto de las clases de lazos
homotópicos en cada punto.
Teorema 8.7.8 Toda variedad diferenciable conexa Q admite un recubridor universal, esto es, un recubridor (Q̃, Π) tal que Q̃ es simplemente conexo.
Es de remarcar que el concepto de recubridor es válido en el contexto más general de los espacios topológicos arcoconexos, sin más que
reemplazar la diferenciabilidad de las aplicaciones por continuidad –en
particular difeomorfismos locales por homeomorfismos locales. En este
contexto también se mantiene el Teorema 8.7.8, con alguna condición
topológica poco restrictiva (hay que suponer que, además de ser arcoconexo, Q verifica que todo punto admite un entorno simplemente
conexo –propiedad ésta que verifica cualquier obviamente variedad).
Capı́tulo 9
Teorema de Stokes
El objetivo fundamental de este capı́tulo es estudiar la versión general
del Teorema de Stokes, y algunas de sus aplicaciones más importantes.
Para ello, previamente veremos algunos conceptos que necesitaremos
para entender dicho teorema, como son las derivaciones y antiderivaciones tensoriales, y las variedades con borde. A continuación, enunciaremos y demostraremos el Teorema de Stokes, y estudiaremos algunos
resultados clásicos que se derivan de él.
9.1.
Derivaciones y antiderivaciones tensoriales
9.1.1.
Derivación tensorial
El concepto de derivación usual puede extenderse al espacio de los
campos de tensores sobre una variedad. Para ello, es necesario introducir previamente el concepto de contracción, que generaliza el de traza
para endomorfismos y tensores (1, 1).
Definición 9.1.1 Sea V (R) un espacio vectorial de dimensión n ∈ N,
y consideremos un tensor T ∈ Tr,s (V ) con r, s ≥ 0. Dada una base B = (v1 , . . . , vn ) de V se define el tensor contraı́do de T respec191
192
CAPÍTULO 9. TEOREMA DE STOKES
to a los ı́ndices i−ésimo covariante y j-ésimo contravariante, Cij T ∈
Tr−1,s−1 (V ), con i ∈ {1, . . . , r}, j ∈ {1, . . . , s} como:
Cij T (w1 , . . . , wr−1 , ψ 1 , . . . , ψ s−1 )
=
n
X
T (w1 , . . . , wi−1 , vk , wi+1 , . . . , wr−1 , ψ 1 , . . . , ψ j−1 , φk , ψ j , . . . , ψ s−1 )
k=1
donde B tiene por base dual a B ∗ = (φ1 , . . . , φn ).
Resulta inmediato que esta definición es independiente de la base B
escogida pues, fijados los argumentos de todos los ı́ndices de T salvo el
i y el j-ésimos, se tiene un tensor (1, 1) al cual se le está calculando la
traza. Asimismo, resulta obvio de la definición que Cij T es un tensor
(r − 1, s − 1).
En adelante consideraremos el espacio vectorial y C∞ (Q)−módulo
T (Q) = ⊕r,s Tr,s (Q), cuyos elementos se pueden escribir como una suma
finita de elementos en cada Tr,s (Q).
Definición 9.1.2 Una derivación tensorial D : T (Q) → T (Q) es una
aplicación R-lineal tal que D(Tr,s (Q)) ⊂ Tr,s (Q) y verifica, para todo
T, T 0 ∈ T (Q):
(i) Regla de Leibniz: D(T ⊗ T 0 ) = DT ⊗ T 0 + T ⊗ DT 0
(ii) Conmutabilidad con las contracciones: D(Cij T ) = Cij DT .
Nota. En esta definición, las funciones se consideran como campos
tensoriales (0,0), y el producto de una función por un tensor como un
producto tensorial. De hecho, la regla de Leibniz (i) generaliza a la que
verifican los campos vectoriales, y ası́ D |C ∞ (Q) es identificable a un
campo vectorial V ∈ X(Q).
Se comprueban sin dificultad las siguientes propiedades de las derivaciones tensoriales:
Propiedades:
(1) Localidad. Si T, T 0 ∈ T (Q) y T = T 0 en un entorno U de p, entonces DTp = DTp0 . En particular, si D es una derivación tensorial
9.1. DERIVACIONES Y ANTIDERIVACIONES
193
sobre Q y U es un abierto, existe una única derivación tensorial
DU sobre U tal que:
DU (A |U ) = (DA) |U
∀A ∈ T (Q)
(en adelante se usará la misma letra D para denotar DU ).
Demostración. Tómese una función ρ ∈ C ∞ (Q) con soporte en
U , y que sea distinta de 0 en p. Entonces ρT ≡ ρT 0 por lo que,
aplicando la derivación en ambos miembros:
D(ρ)T + ρD(T ) = D(ρ)T 0 + ρD(T 0 )
en todo punto. Evaluando en p y usando ρ(p) 6= 0 se sigue el
resultado inmediatamente.
(2) Unicidad. El valor de D sobre C ∞ (Q) y X(Q) (resp., sobre C ∞ (Q)
y Λ1 (Q)), determina unı́vocamente a D.
Ası́, si D y D0 son dos derivaciones tensoriales que coinciden sobre
C ∞ (Q) y X(Q) (resp. sobre C ∞ (Q) y Λ1 (Q)) entonces D = D0 .
Demostración. Sean ω ∈ Λ1 (Q), X ∈ X(Q). Puesto que ω(X) =
C11 (ω ⊗ X), necesariamente
D(ω(X)) = (Dω)(X) + ω(DX).
(9.1)
Ası́, determinado el valor de D sobre la función ω(X) y el campo
vectorial X se deduce el valor de Dω (análogamente, si se tiene
determinado D sobre la forma diferencial ω). Para el resto de
campos tensoriales, la demostración se sigue con facilidad por
inducción. Ası́, si T es un campo tensorial (2, 0), obsérvese que
T (X, Y ) = C11 (C11 (T ⊗ X ⊗ Y )) por lo que se tendrá:
(DT )(X, Y ) = D(T (X, Y )) − T (DX, Y ) − T (X, DY ).
(9.2)
(3) Existencia. Sea V ∈ X(Q) cualquier campo vectorial, y δ : X(Q) →
X(Q) una aplicación R-lineal tal que δ(f X) = V (f )X + f δ(X),
∀f ∈ C ∞ (Q), ∀X ∈ X(Q). Entonces existe una (única) derivación
tensorial D tal que D |C ∞ (Q) ≡ V y D |X(Q) ≡ δ.
Demostración. Obsérvese que, si existiera tal D, su valor sobre
cualquier campo tensorial quedarı́a determinado por las igualdades (9.1), (9.2) (y otras análogas obtenidas inductivamente).
Basta entonces con definir D por tales igualdades.
194
CAPÍTULO 9. TEOREMA DE STOKES
La siguiente derivación tensorial tiene gran interés1 , y será definida
haciendo uso de la propiedad (3).
Definición 9.1.3 Sea Q una variedad diferenciable. Se define la derivada de Lie según V ∈ X(Q), como la única derivación tensorial que verifica: (i) LV f = V (f ) ∀f ∈ C ∞ (Q), (ii) LV (X) = [V, X] ∀X ∈ X(Q).
Ejercicio. Pruébense las siguientes propiedades de la derivada de Lie:
(a) L[X,Y ] = LX ◦ LY − LY ◦ LX ∀X, Y ∈ X(Q).
0
(b) Consideremos ω ∈ Λr (Q), ω 0 ∈ Λr (Q) y X ∈ X(Q). Se verifican:
(i) LX ω ∈ Λr (Q), (ii) LX (ω ∧ ω 0 ) = (LX ω) ∧ ω 0 + ω ∧ (LX ω 0 ).
Ejercicio. Demuéstrese:
(1) Si D una derivación tensorial, y V ≡ D |C ∞ (Q) , entonces D − LV
restringido sobre X(Q) es C ∞ (Q)-lineal y, por tanto, identificable a un
campo de endomorfismos.
(2) Dados V ∈ X(Q) y A ∈ T1,1 (Q) existe una única derivación D
tal que V = D |C ∞ (Q) y (D − LV ) |X(Q) ≡ A.
9.1.2.
Antiderivación tensorial
Aprovechando las propiedades de antisimetrı́a del producto exterior, es posible introducir un tipo de derivación especı́fica para los
tensores antisimétricos.
Definición 9.1.4 Una antiderivación de grado p ∈ Z en Λ(Q) es una
aplicación R-lineal D : Λ(Q) → Λ(Q) que verifica:
(i) D(Λr (Q)) ⊂ Λr+p (Q) (asuminos el convenio: Λ−r (Q) ≡ 0, ∀r ∈
N),
(ii) D(ω∧ω 0 ) = (Dω)∧ω 0 +(−1)r ω∧Dω 0
(Regla de Leibniz).
0
∀ω ∈ Λr (Q), ∀ω 0 ∈ Λr (Q)
La generalidad permitida de que se pueda aumentar o disminuir en p el
tipo de forma tensorial se revelará útil para antiderivaciones2 Resulta
1
También tendrán interés las derivaciones asociadas a un conexión afı́n ∇ sobre
una variedad diferenciable Q (véase el Tema 10). Dada una tal ∇, la derivada
covariante según V ∈ X(Q) se define como la única derivación tensorial que verifica:
(i) ∇V (f ) = V (f ) ∀f ∈ C ∞ (Q), (ii) ∇V (X) = ∇V X ∀X ∈ X(Q).
2
No precisaremos una propiedad similar para derivaciones, por lo que no se
admite tal posibilidad para ellas (pero compárese con el Apéndice del Tema ??).
9.1. DERIVACIONES Y ANTIDERIVACIONES
195
inmediato comprobar las siguiente propiedades de las antiderivaciones,
que son análogas a las de las derivaciones tensoriales.
Propiedades:
(1) Localidad. Las antiderivaciones tensoriales son también operadores locales; esto es, si U es un abierto de Q y ω |U ≡ ω 0 |U entonces
(Dω) |U = (Dω 0 ) |U para todo ω, ω 0 ∈ Λ(Q). En particular,
(i) si f ∈ C ∞ (Q) ≡ Λ0 (Q) es constante en un entorno U de p,
(Df )p ≡ 0,
(ii) D define de manera natural derivaciones en cada abierto de
Q.
(2) “Unicidad”. Determinado el valor de D sobre C ∞ (Q) y Λ1 (Q),
se determina sobre todo Λ(Q).
Nos interesarán dos simples casos particulares de antiderivaciones, una
de grado 1 y otra de grado -1. La primera de ellas es sólo la generalización de la diferencial estudiada en el Tema 6.
Definición 9.1.5 Sea Q una variedad diferenciable de dimensión n.
Se define la derivada exterior de ω como la (r +1)-forma dω ∈ Λr+1 (Q)
que en coordenadas locales (U, q 1 , . . . , q n ) de Q tiene la expresión
dω :=
X
dωi1 ...ir ∧ dq i1 ∧ · · · ∧ dq ir ,
(9.3)
1≤i1 <···<ir ≤n
P
siendo ω := 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧· · ·∧dq ir , y dωi1 ...ir la diferencial
usual de funciones.
Repitiendo pasos análogos a los de la Proposición 6.4.2 no es difı́cil
comprobar que esta definición resulta independiente de las coordenadas
elegidas.
Obsérvese que de la expresión (9.3) se deduce directamente que la
derivada exterior sobre las funciones coincide con la diferencial usual. Para las (n − 1)-formas diferenciales, la siguiente expresión de la
diferencial exterior, que usaremos más adelante, también es inmediato
196
CAPÍTULO 9. TEOREMA DE STOKES
Proposición 9.1.6 Sea ω ∈ Λn−1 (Q) una (n − 1)-forma diferencial.
Entonces, en coordenadas locales ω admite la expresión:
ω=
n
X
ci ∧ · · · ∧ dq n ,
(−1)i−1 ωi dq 1 ∧ · · · ∧ dq
i=1
(donde el signo b· indica que se suprime el término que cubre), y ası́:
à n
!
X ∂ωi
dω =
dq 1 ∧ · · · ∧ dq i ∧ · · · ∧ dq n .
i
∂x
i=1
El siguiente resultado es general.
Proposición 9.1.7 La derivada exterior satisface la igualdad d2 = 0.
Demostración. Aplicando directamente la definición de diferencial exterior se tiene:
³P
´
Pn ∂ωi1 ···ir j
i1
ir
d(dω) = d
dq
∧
dq
∧
·
·
·
∧
dq
j
1≤i1 <···<ir ≤n
´
³P j=1P ∂q
P
∂ωi1 ···ir
n
n
i
j
dq
∧
dq
∧ dq i1 ∧ · · · ∧ dq ir
= 1≤i1 <···<ir ≤n
j=1
i=1 ∂q i ∂q j
= 0,
donde se ha usado que, por la igualdad entre las derivadas cruzadas,
el paréntesis del último término es nulo. 2
Ejercicio. Pruébense las siguientes caracterizaciones de la diferencial
exterior:
(1.) La diferencial exterior es la única antiderivación tensorial que
coincide con la diferencial usual sobre las funciones y que verifica
d ◦ d = 0.
(2.) La diferencial exterior es la antiderivación tensorial definida, para
todo ω ∈ Λr (Q), por:
P
dω(X0 , X1 , . . . , Xr ) = ri=0 (−1)i Xi (ω(X0 , . . . , X̂i , . . . , Xr ))
P
+ 0≤i<j≤r (−1)i+j ω([Xi , Xj ], X0 , . . . , X̂i , . . . , X̂j , . . . , Xr ).
donde el sı́mbolo ˆ sobre un argumento indica que éste ha sido
suprimido.
9.1. DERIVACIONES Y ANTIDERIVACIONES
197
Proposición 9.1.8 Consideremos dos variedades diferenciables Q, Q0
y una aplicación diferenciable entre ellas F : Q0 → Q. Si ω ∈ Λ(Q)
entonces se verifica
d(F ∗ ω) = F ∗ dω.
Demostración. Basta con considerar ω ∈ Λr (Q) para r arbitrario, y
restringirnos a un abierto. Nótese previamente que si f : Q → R
entonces
F ∗ df = d(f ◦ F ),
(9.4)
ya que F ∗ df (v)
P = df ◦ dF (v) = d(f ◦ F )(v) para todo v ∈ T Q. Por
tanto, si ω = 1≤i1 <···<ir ≤n ωi1 ...ir dq i1 ∧ · · · ∧ dq ir entonces
P
F ∗ ω = P1≤i1 <···<ir ≤n (F ∗ ωi1 ···ir ) F ∗ dq i1 ∧ · · · ∧ F ∗ dq ir
= 1≤i1 <···<ir ≤n (ωi1 ···ir ◦ F ) d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F ).
En consecuencia, usando de nuevo (9.4) se deduce:
P
d(F ∗ ω) = 1≤i1 <···<ir ≤n d(ωi1 ···ir ◦ F ) ∧ d(q i1 ◦ F ) ∧ · · · ∧ d(q ir ◦ F )
P
= F ∗ 1≤i1 <···<ir ≤n dωi1 ···ir ∧ dq i1 ∧ · · · ∧ dq ir
= F ∗ dω. 2
La otra antiderivación que también desempeñará un papel importante más adelante es el producto interior. Pero, previamente, conviene
tener presente el siguiente ejercicio elemental.
Ejercicio. Sea V un espacio vectorial, v ∈ V y ω ∈ Λr (V ). Se define
el producto interior de ω según v, iv ω ∈ Λr−1 (V ), como:
iv ω(v1 , . . . , vr−1 ) := ω(v, v1 , . . . , vr−1 ) ∀v1 , . . . , vr−1 ∈ V.
Pruébese que se verifican:
(i) iv : Λr (V ) → Λr−1 (V ) es una aplicación lineal,
(ii) iv (ω ∧ ω 0 ) = (iv ω) ∧ ω 0 + (−1)r ω ∧ (iv ω 0 ),
0
Λr (V ).
∀ω ∈ Λr (V ), ω 0 ∈
Definición 9.1.9 Sea Q una variedad diferenciable de dimensión n.
Se define el producto interior iX según X ∈ X(Q) como la única antiderivación de grado −1 tal que: (i) iX (f ) = 0 para todo f ∈ C ∞ (Q),
(ii) iX (ω) = ω(X) para todo ω ∈ Λ1 (Q).
198
CAPÍTULO 9. TEOREMA DE STOKES
Si bien la unicidad viene garantizada por la propiedad (2) de las antiderivaciones, para asegurar su existencia se debe aplicar el ejercicio
anterior.
Obsérvese que de la definición de producto interior se deduce fácilmente el siguiente resultado.
Proposición 9.1.10 Si X, Y ∈ X(Q) y f, h ∈ C ∞ (Q) entonces
(1) if X+hY = f iX + h iY
(2) iX df = X(f ).
9.1.3.
Teorema de Cartan
Consideremos un campo de vectores X sobre una variedad diferenciable Q.
Lema 9.1.11 El operador definido por DX := iX ◦ d + d ◦ iX : Λ(Q) →
Λ(Q) es R-lineal y verifica la regla de Leibniz; esto es,
DX (ω ∧ ω 0 ) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ) ∀ω, ω 0 ∈ Λ(Q).
(9.5)
Demostración. Dado que DX es manifiestamente lineal, basta con de0
mostrar (9.5) para ω ∈ Λr (Q), ω 0 ∈ Λr (Q). Se tiene entonces:
iX ◦ d(ω ∧ ω 0 ) = iX (dω ∧ ω 0 + (−1)r ω ∧ dω 0 )
= (iX dω) ∧ ω 0 + (−1)r+1 dω ∧ (iX ω 0 )
+(−1)r (iX ω) ∧ dω 0 + (−1)2r ω ∧ iX dω 0 ,
(9.6)
d ◦ iX (ω ∧ ω 0 ) = d((iX ω) ∧ ω 0 + (−1)r ω ∧ (iX ω 0 ))
= (d ◦ iX ω) ∧ ω 0 + (−1)r−1 (iX ω) ∧ dω 0
(9.7)
r
0
2r
0
+(−1) dω ∧ (iX ω ) + (−1) ω ∧ (d ◦ iX ω ).
Por tanto, sumando (9.6) y (9.7), y simplificando los términos que se
cancelan, se obtiene:
DX (ω ∧ ω 0 ) = (iX dω) ∧ ω 0 + (d ◦ iX ω) ∧ ω 0 + (−1)2r ω ∧ (iX ◦ dω)
+(−1)2r ω ∧ (d ◦ iX ω) = (DX ω) ∧ ω 0 + ω ∧ (DX ω 0 ). 2
Ya estamos listos para demostrar la siguiente relación debida a Cartan.
9.2. VARIEDADES CON BORDE
199
Teorema 9.1.12 (de Cartan) Dado un campo de vectores X ∈ X(Q)
se verifica
LX = iX ◦ d + d ◦ iX .
(9.8)
Demostración. Por el Lema 9.1.11 y las propiedades de unicidad de
las derivaciones, basta con comprobar la igualdad (9.8) sobre C ∞ (Q)
y Λ1 (Q). Ası́, si f ∈ C ∞ (Q) se tiene
DX f = iX ◦ df + d ◦ iX f = iX ◦ df = X(f ) = LX (f ).
Y, en el caso Y ∈ X(Q) y ω ∈ Λ1 (Q), se tiene
DX ω(Y ) = (iX ◦ dω + d ◦ iX ω)(Y ) = dω(X, Y ) + d(ω(X))(Y )
= X(ω(Y )) − Y (ω(X)) − ω([X, Y ]) + Y (ω(X))
= (LX ω)(Y ).
como se querı́a.
2
Como consecuencia inmediata del Teorema de Cartan se obtiene el
siguiente resultado:
Corolario 9.1.13 LX y d conmutan; esto es,
d LX ω = LX dω
∀X ∈ X(Q), ∀ω ∈ Λr (Q).
Demostración. Aplicando el Teorema de Cartan y la Proposición 9.1.7
dos veces se tiene:
dLX ω = d(iX dω + diX ω) = (d ◦ iX )dω = (LX − iX ◦ d)dω = LX dω. 2
Ejercicio. Redemuéstrese este corolario usando que (localmente) LX ω =
d ∗
φ ω y d ◦ φ∗t = φ∗t ◦ d, siendo φt el flujo local de X.
dt t
Ejercicio. Demuéstrese la igualdad i[X,Y ] ω = LX (iY ω) − LY (iX ω).
9.2.
Variedades con borde
En esta sección vamos a estudiar el concepto de variedad con borde.
Para ello, previamente necesitaremos algunas nociones sobre diferenciabilidad en abiertos de Rn+ .
200
CAPÍTULO 9. TEOREMA DE STOKES
9.2.1.
Diferenciabilidad en abiertos de Rn+
En adelante usaremos la notación Rn+ = {(x1 , . . . , xn ) ∈ Rn : xn ≥
0}. Si U es un abierto de Rn+ , escribiremos Int(U ) para denotar al
interior de U visto como subconjunto de Rn :
Int U = {(x1 , . . . , xn ) ∈ U : xn > 0}.
Por otra parte, escribiremos ∂U para denotar su borde:
∂U = U \ Int U = {(x1 , . . . , xn ) ∈ U : xn = 0}.
Cabe señalar que, en general, el borde ∂U no coincide con la frontera
topológica de U (ni en Rn ni en Rn+ ).
Definición 9.2.1 Sean U , V dos abiertos de Rn+ y F : U → V una
aplicación. Diremos que F es diferenciable en x ∈ U si existen abiertos
U1 y V1 de Rn con x ∈ U1 y F (x) ∈ V1 , y una aplicación diferenciable
en x0 , F1 : U1 → V1 , tal que F1 |U1 ∩U = F |U1 ∩U . En este caso, definimos
(dF )x0 := (dF1 )x0 : Tx0 Rn ≡ Rn → TF1 (x0 ) Rn ≡ Rn .
Es fácil comprobar que esta definición es independiente de la extensión
F1 escogida (d(F1 )x0 queda fijada por su valor sobre n vectores tangentes independientes, que pueden tomarse asociados a curvas definidas
en ] − ², 0] o [0, ²[ incluidas en RN
+ ). Análogamente, se definen la diferm
enciabilidad cuando V ⊂ R+ , la diferenciabilidad en (todo) U , o el
concepto de difeomorfismo. En particular, si F es un difeomorfismo
entonces dFx0 es biyectiva.
Lema 9.2.2 Sea F : U ⊆ Rn+ → Rn+ una aplicación diferenciable:
(1) Si x0 ∈ Int(U ) y F (x0 ) ∈ ∂Rn+ entonces, con las identificaciones
naturales, (dF )x0 (Rn ) ⊆ ∂Rn+ .
(2) Si V = F (U ) es un abierto de Rn+ y F es un difeomorfismo sobre V
entonces induce por restricción los difeomorfismos Int F : IntU → IntV
y ∂F : ∂U → ∂V .
Demostración. (1) Como F (x0 ) ∈ ∂Rn+ , se tiene para todo v ∈ Tx0 Rn
y t ∈ R:
0 ≤ xn (F (x0 + tv)) = xn (F (x0 ) + dFx0 (tv) + o(tv))
= xn (dFx0 (tv)) + xn (o(tv)),
(9.9)
9.2. VARIEDADES CON BORDE
201
donde lı́mt→0 o(tv)
= 0. Por tanto, multiplicando ambos miembros de
t
(9.9) por 1/t y tomando lı́mite t → 0+ , se obtiene
xn (dFx0 (v)) ≥ 0.
(9.10)
Ahora bien, dado que (9.10) se verifica para todo v, en particular se
verifica para −v. Luego,
−xn (dFx0 (v)) = xn (dFx0 (−v)) ≥ 0.
Por tanto, xn (dFx0 (v)) = 0 para todo v ∈ Tx0 Rn . Esto es, dFx0 (Rn ) ⊆
∂Rn+ .
(2) Del apartado (1) se sigue que F (Int(U )) ⊂ IntV y F −1 (IntV ) ⊂
IntU . Luego se puede definir IntF : IntU → IntV , que es necesariamente un difeomorfismo. Por ser F biyectiva, también se puede definir
∂F : ∂U → ∂V , que es también biyectiva. Para demostrar que ∂F
(definida entre abiertos de Rn−1 ) es un difeomorfismo, nótese que si
x0 ∈ ∂U entonces


c1
µ i
¶

.. 
∂F

C
. 
=
(9.11)
(x
)

,
0
∂xj

cn−1 
i,j
0 ... 0
c
donde F i ≡ xi ◦ F , C =
³
´
∂(∂F )i
(x0 )
∂xj
i,j
y c > 0. Por tanto, todas
las derivadas parciales de ∂F existen, son diferenciables y forman una
matriz no singular. 2
Nota. Es de remarcar que, si se supone sólo que F sea sólo un homeomorfismo, entonces sigue siendo cierto que se inducen por restricción
homeomorfismos Int F : IntU → IntV y ∂F : ∂U → ∂V , si bien la
prueba de este resultado (basado en el “Teorema de la Invariancia del
Dominio”) es mucho más difı́cil de demostrar.
9.2.2.
Concepto de variedad con borde
La definición de variedad (diferenciable) con borde resulta completamente análoga a la de variedad diferenciable, con la única salvedad
de que las cartas locales toman ahora valores en Rn+ .
202
CAPÍTULO 9. TEOREMA DE STOKES
Ası́, una variedad diferenciable con borde es una variedad topológica
con borde (un espacio topológico Q, Hausdorff y ANII, localmente
homeomorfo a Rn+ ) dotado de una estructura diferenciable, esto es, un
atlas maximal cuyos cambios de carta son diferenciables, en el sentido
de la subsección anterior.
Obsérvese que, por el Lema 9.2.2 (2), el hecho de que, para una
carta coordenada (U, ϕ), el punto ϕ(p) pertenezca a ∂Rn+ o no, es independiente de la carta escogida. Ello permite distinguir entre los puntos
del interior y del borde de Q:
Definición 9.2.3 Sea A = {(Uα , ϕα ) : α ∈ I} un atlas de Q. Se
definen los conjuntos interior y borde de Q como:
IntQ := ∪α∈I ϕ−1
α (Intϕα (Uα ))
∂Q := ∪α∈I ϕ−1
α (∂ϕα (Uα )),
respectivamente.
Se comprueba con facilidad que si U es un abierto de Q entonces
IntU := U ∩ IntQ y ∂U = U ∩ ∂Q. Es más, del Lema 9.2.2 (2) también
se deduce inmediatamente:
Proposición 9.2.4 Sea Q una variedad con borde de dimensión n.
Entonces:
(i) IntQ es una variedad diferenciable (sin borde) de dimensión n.
(ii) Si no es vacı́o, el borde ∂Q es una variedad diferenciable (sin
borde) de dimensión n − 1, que admite como atlas diferenciable
las cartas formadas por la restricción a ∂Q de las (n−1) primeras
coordenadas de cada carta de Q.
El concepto de aplicación diferenciable entre variedades con borde se
mantiene de manera completamente análoga al del caso sin borde. Ello
incluye la diferenciabilidad de curvas del tipo γ : [a, b[→ Q ó γ :
]a, b] → Q, que se pueden usar para definir los vectores tangentes
(además de mediante derivaciones o por coordenadas). En cualquier
caso, el espacio tangente en un punto p ∈ Q resulta completamente
análogo al caso sin borde. Nótese que si p ∈ IntQ entonces, de manera
natural, Tp Q ≡ Tp (IntQ). Si p ∈ ∂Q entonces Tp Q también es un
9.2. VARIEDADES CON BORDE
203
espacio vectorial de dimensión n, pudiendo identificarse Tp ∂Q como
un subespacio vectorial de Tp Q de dimensión n − 1.
De hecho, dada un entorno coordenado (U, q 1 , . . . , q n ), para cada
p ∈ Q se induce una base de vectores tangentes
Pn i en∂ Tp Q, con lo que
todo vector tangente en p se escribe como i=1 a ( ∂qi ). Si p ∈ ∂Q, los
vectores tangentes con coordenada an = 0 se identifican con vectores
tangentes a ∂Q en p, con lo que se puede escribir Tp (∂Q) ⊂ Tp Q.
Usando la expresión (9.11), se comprueba directamente: si, en una
carta coordenada, la n-ésima coordenada de un vector tangente v a
un punto p del borde es mayor que cero (resp. menor que cero), ello
también ocurre cualquier otra carta coordenada que contenga a p. Ello
permite introducir las siguientes definiciones.
Definiciones 9.2.5 Sea p P
∈ ∂Q y v ∈ Tp Q. Para un entorno coordei
n
nado de p, escribamos v = n−1
i=1 a ∂q i |p + a ∂q n |p . Diremos que:
(i) v apunta al interior si an > 0,
(ii) v es tangente a ∂Q si an = 0,
(iii) v apunta al exterior si an < 0.
En particular, ∂qn |p apunta siempre al interior.
Ejercicio. Sean α : [0, ²[→ Q, β :] − ², 0] → Q dos curvas diferenciables con α(0) = β(0) = p ∈ ∂Q. Demuéstrese que:
(i) α0 (0) no apunta al exterior,
(ii) β 0 (0) no apunta al interior.
Por último, resulta obvio:
Proposición 9.2.6 Sea F : Q → Q0 un difeomorfismo entre dos variedades con borde. Entonces se inducen por restricción los difeomorfismos
IntF : IntQ → IntQ0
∂F : ∂Q → ∂Q0 .
204
9.2.3.
CAPÍTULO 9. TEOREMA DE STOKES
Orientación en el borde
La orientabilidad en una variedad con borde Q se define de modo
análogo al caso sin borde, estudiado en el Tema 8 (recuérdese que el
espacio tangente en los puntos del borde es de la misma dimensión que
la variedad), esto es, mediante:
(i) elementos de volumen ;
(ii) atlas cuyos cambios de carta tienen jacobiano positivo;
(iii) elecciones (diferenciables) de bases ordenadas;
(iv) existencia de un generador del C ∞ (Q)-módulo Λn (Q).
Además, de (ii) y teniendo en cuenta la expresión (9.11), se comprueba
directamente que si Q es orientable entonces ∂Q también lo es. Con
más precisión, vamos a mostrar ahora cómo una orientación sobre Q
induce una sobre ∂Q. Esencialmente, el problema se soluciona en cada
espacio tangente mediante la siguiente definición.
Proposición 9.2.7 Sean (V, [ω]) un espacio vectorial orientado de dimensión n, H ⊂ V un hiperplano y V ext ⊂ V \ U una de las dos partes
conexas de V \ U .
Existe una única orientación que verifica: si B 0 = (e2 , . . . , en ) de H
está positivamente orientada (respecto a [ω] y V ext ) si la base BN =
(N, e2 , . . . , en ) (o, equivalentemente, (e2 , . . . , en , (−1)n−1 N )) está positivamente orientada en (V, [ω]), donde N es cualquier vector de V ext .
Además, esta orientación coincide con la definida por iN ω |H , para
cualquier N ∈ V ext .
Llamaremos a esta orientación sobre H la orientación inducida por
ext
V
y [ω].
Demostración. Basta con demostrar que la orientación ası́ definida por
B 0 en H resulta independiente tanto B 0 como del vector N escogidos.
Ası́ si B̄ 0 es otra base de H y N̄ ∈ V ext , la matriz de cambio de base
verifica:


a1 0
...
0




 a2

M (IdV , BN ← B̄N̄ ) = 
 , con a1 > 0.
 ..

0
0
 .

M (IdV , B ← B̄ )
an
9.2. VARIEDADES CON BORDE
205
Esto es, la orientación de BN y BN̄ coincide si y sólo si coincide la de
B 0 y B̄ 0 , como se querı́a.
Por último, iN ω |H (e02 , . . . , e0n ) = ω(N, e02 , . . . , e0n ) > 0, por lo que
la orientación inducida en H coincide con la definida por iN ω|h . 2
En una variedad con borde orientada (Q, [ω]), podemos repetir en el
espacio tangente de cada p ∈ ∂Q la construcción anterior, de modo
que induzcamos una orientación en ∂Q. Ası́, tomamos V = Tp Q, H =
Tp ∂Q ⊂ Tp Q y consideramos sobre Tp ∂Q la orientación inducida por
[ωp ] y V ext = {N ∈ Tp Q : N apunta al exterior}.
Obsérvese que en cualquier carta (U, q 1 , . . . , q n ) coordenada alrededor de p, el campo −∂/∂q n apunta al exterior, por lo que la orientación
inducida sobre ∂Q ∩ U coincide con la restricción de i−∂qn ω (lo que demuestra la diferenciabilidad de la orientación). En resumen:
Definición 9.2.8 Sea (Q, [ω]) una n−variedad con borde orientada
de dimensión n. Se define la orientación inducida sobre ∂Q tomando,
para cada p = ∂Q cualquier vector tangente Np que apunte al exterior
(p. ej., Np = −∂/∂q n |p ), y definiendo la orientación equivalentemente
como:
(1.) La definida por la clase de equivalencia de iN ωp |Tp ∂Q
(2.) Aquélla para la cual una base B 0 = (e2 , . . . , en ) ⊂ Tp (∂Q) está positivamente orientada si y sólo si (N, e2 , . . . , en ) está positivamente orientada en Tp Q.
Ejercicio. Identificando Rn−1 con el hiperplano ∂Rn+ de Rn , compruébese que la orientación en ∂Rn+ inducida de la usual de Rn , coincide
con la usual de Rn−1 si y sólo si n es par.
Por otra parte, no debe olvidarse que la orientación en Q no sólo induce
una orientación en su borde sino también, trivialmente, una en Int Q.
Observaciones finales:
(1) Los conceptos de partición de la unidad y métrica (no degenerada) se traspasan directamente a variedades con borde3 .
3
Para ésta y otras propiedades puede resultar útil, dada una variedad con borde
Q, construir su “variedad doble” Q̂. Ésta se define como dos copias de Q con los
206
CAPÍTULO 9. TEOREMA DE STOKES
(2) Si Q es una variedad con borde entonces trivialmente ∂Q tiene
medida nula. Por tanto, todo sistema coordenado c.p.d. de IntQ
también lo es de Q, y toda variedad con borde admite un sistema
coordenado c.p.d.
(3) Como consecuencia, fijada una orientación en Q (resp. una métrica no degenerada en Q) se puede definir la integración de una
n-forma (resp. una función) de modo análogo al caso sin borde
(y obteniéndose que esta integral coincide con la integral sobre
Int Q).
(4) Todo lo que se ha visto en esta sección se traspasa sin dificultad a
las variedades con borde anguloso (o a trozos); esto es, variedades
topológicas que son “localmente difeomorfas” a abiertos de Rnm =
{(x1 , . . . , xn ) ∈ Rn : xm ≥ 0, . . . , xn ≥ 0}. Es de señalar, empero,
que éste es un concepto que, a diferencia del de variedad con
borde, sólo tiene sentido para variedades diferenciables, y no para
topológicas.
Ejercicio. Si Q es una variedad (orientable o no) con borde, pruébese
que existe un campo diferenciable N que apunta al exterior y que
está definido sobre todo ∂Q.
9.3.
Teorema de Stokes
En esta sección damos la versión general del Teorema de Stokes que,
esencialmente, se puede ver como una generalización a variedades de
dimensión arbitraria de la Regla de Barrow clásica. Por la importancia
de este resultado, rebajaremos los requisitos de diferenciabilidad que
habitualmente hemos usado.
puntos análogos de los bordes identificados. Ası́, IntQ se puede visualizar como un
abierto de Q̂, cuya frontera topológica coincide con la hipersuperficie regular ∂Q.
Un recubrimiento abierto de Q induce naturalmente uno de Q̂, y una partición de
la unidad subordinada a este recubrimiento de Q̂ induce por restricción una del
recubrimiento original. No obstante, debe tenerse presente que un campo tensorial
(v.gr., una métrica riemanniana) no tiene por qué poderse extender de manera
diferenciable de Q a la variedad doble.
9.3. TEOREMA DE STOKES
207
Teorema 9.3.1 (de Stokes): Sea +Q una variedad con borde orientada de dimensión n ≥ 2, i : ∂Q → Q la inclusión del borde en la
variedad, y ω una n − 1 forma continua sobre Q que sea diferenciable
C 1 en IntQ.
Si el soporte sop ω es compacto, entonces
Z
Z
∗
iω=
d ω,
+∂Q
+Q
donde +∂Q denota al borde de Q con la orientación inducida
por +Q.
R
En particular, si Q es una variedad sin borde entonces +Q d ω = 0.
Demostración. Sea {(Uα , ϕα )}α∈I un recubrimiento por entornos coordenados de Q y {ρi }i∈N una partición de la unidad subordinada,
sop ρP
i ⊂ Ui , i ∈ N. Puesto que sop ω es compacto, podemos suponer
ω = ki=1 ρi ω. En particular,
Z
k Z
X
d(ρi ω).
dω =
+Q
+Q
i=1
De la linealidad de esta igualdad, basta con probar el resultado para cada uno de los k sumandos. Esto es, sin perdida de generalidad,
podemos suponer sop ω incluido en un entorno coordenado (U, ϕ).
Podemos asumir que ϕ : U → ϕ(U ) ⊂ Rn+ está positivamente
orientada. Además, se verifica la igualdad i ◦ ∂ϕ−1 = ϕ−1 ◦ ĩ, siendo
ĩ : ∂(ϕ(U )) ⊂ ∂Rn+ ,→ ϕ(U ) ⊂ Rn+ . En consecuencia,
Z
Z
Z
−1∗
dω =
ϕ dω =
d(ϕ−1∗ ω)
n
n
+Q
+R+
+R+
y
Z
Z
i∗ ω =
+∂Q
Z
=
Z
+∂ R
−1 ∗
n
+
+∂ R
(i ◦ ∂ϕ ) ω =
n
+
(∂ϕ−1 )∗ i∗ ω
−1
n
+
+∂ R
(ϕ
Z
∗
◦ ĩ) ω =
n
+
+∂ R
ĩ∗ (ϕ−1∗ ω).
Luego no resulta restrictivo suponer que ω es una (n − 1)-forma sobre Rn+ , por lo que simplificaremos (ϕ−1∗ ω) por ω. Podemos escribir
entonces (Proposición 9.1.6):
ω=
n
X
ci ∧ · · · ∧ dxn .
(−1)i−1 ωi dx1 ∧ · · · ∧ dx
i=1
208
CAPÍTULO 9. TEOREMA DE STOKES
En este caso,
P
i
dω = ni=1 ∂ω
dx1 ∧ · · · ∧ dxi ∧ · · · ∧ dxn
∂xi
i∗ ω = (−1)n−1 ωn (x1 , . . . , xn−1 , 0) dx1 ∧ · · · ∧ dxn−1 |∂ Rn .
+
Integrando:
Z
n
+
+R
=
dω =
n
+
R
µZ
i=1
∂xi
dx1 · · · dxn
¶
∂ωi i
ci · · · dxn
dx dx1 · · · dx
i
n−2
R ×R+
−∞ ∂x
¶
µZ ∞
Z
∂ωn n
+ n−1
dx dx1 · · · dxn−1 .
n
∂x
0
R
n−1 Z
X
i=1
à n
!
X ∂ωi
Z
+∞
Ahora
por la compacidad de sopω, la primera sumatoria es nula
R bi ∂ωbien,
i
i
( −ai ∂xi dx = 0 para ai , bi suficientemente grande).
n
último sumando serı́a cero, esto es,
R Si sop ω ∩ ∂R+ = ∅ también el
n
n dω = 0. Pero si sop ω ∩ ∂R
+ 6= ∅:
+R
+
¡R ∞ ∂ωn n ¢ 1
R
R
∂ωn
n
n−1
dω
=
=
dx dx · · · dxn−1
n
0 ∂xn
+R
RR+ ∂x
R
= − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 .
R
n
+
Pero esta integral coincide con,
R
R
n i∗ ω
n (−1)n−1 ω (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1
=
+∂ R+
+∂ R+
Rn
n
n−1
1
n−1
n−1 ωn (x , . . . , x
= (−1) (−1)
, 0) dx1 · · · dxn−1
R
R
= − Rn−1 ωn (x1 , . . . , xn−1 , 0) dx1 · · · dxn−1 .
como se querı́a. 2
Observaciones:
(1) El Teorema de Stokes también se verifica para una variedad sin
borde de dimensión 1, El caso unidimensional con borde, esto
es, esencialmente, cuando Q = [a, b], también se puede deducir
como un caso lı́mite, reobteniéndose ası́ la Regla de Barrow. En
efecto, para Q = [a, b] basta con definir, para cada función (0forma) f sobre Q, su integral en un punto x del borde de Q
9.4. PRIMERAS APLICACIONES
209
como f (x). Aplicando estrictamente la definición de orientación
inducida, ésta será la usual en b y la opuesta en a, esto es:
Z
Z
Z
Z
Z
f=
f+
f = − f + f = −f (a) + f (b).
+∂Q
+{a}
+{b}
a
b
Mientras que, como df = f 0 dx:
Z
Z
b
df =
+Q
f 0 dx.
a
(2) Cabe señalar que el Teorema de Stokes también se verifica para una variedad con borde anguloso, adaptándose la prueba de
manera sencilla.
9.4.
Primeras aplicaciones
Veamos a continuación algunas consecuencias inmediatas del Teorema de Stokes.
9.4.1.
Fórmula de Green-Riemann en el plano
Aplicando el Teorema de Stokes a una 1-forma diferencial general
ω = P dx + Qdy sobre R2 , se deduce el siguiente resultado:
Teorema 9.4.1 Sea D un abierto de R2 tal que su cierre D sea una
variedad con borde, y sean P, Q dos funciones diferenciables en D y
continuas en D, con soporte compacto. Entonces
¶
Z
Z µ
∂Q ∂P
−
(P dx + Qdy) =
dx ∧ dy.
∂x
∂y
+∂D
+D
Obsérvese que el miembro izquierdo no es más que una integral ordinaria de una función (con soporte compacto en D) sobre D. El miembro
derecho se puede escribir como la circulación de la 1-forma ω sobre
una curva γ que parametrice (cada parte conexa de) +∂D “en sentido
positivo” (esto es, de modo que al recorrerla “D quede a la izquierda”).
Puesto que el soporte es compacto, no supone pérdida de generalidad
210
CAPÍTULO 9. TEOREMA DE STOKES
considerar que el dominio de la curva también lo es, γ : [a, b] → R2 . La
circulación se reescribe entonces como:
Z
Z X
2
2 Z b
X
dxi
∗
∗
i
γ ω=
(ωi ◦ γ)γ (dx ) =
(ωi ◦ γ)
dt
dt
[a,b]
[a,b] i=1
i=1 a
Z
b
dx
dy
+ Q(x(t), y(t)) )dt.
dt
dt
a
Resulta especialmente interesante el caso en el que +∂D puede parametrizarse
con una curva de Jordan diferenciable, esto es, una curva diferenciable
γ : [a, b] → R2 , cerrada γ(a) = γ(b), cuya restricción a [a, b[ es inyectiva, y tal que además γ 0 (a) = γ 0 (b).4 En particular, obsérvese que para
calcular el área D basta con tomar ω = −ydx o bien ω = xdy en el
Teorema 9.4.1, obteniéndose:
=
(P (x(t), y(t))
Corolario 9.4.2 El área de la región D encerrada por la curva de
Jordan γ : [a, b] → R2 , se puede calcular como
Z b
Z b
Z
1 b
0
0
x(t)y (t)dt = −
y(t)x (t)dt =
(x(t)y 0 (t) − y(t)x0 (t))dt,
2
a
a
a
(9.12)
siendo γ(t) = (x(t), y(t)).
Ejercicio. Aplı́quese (9.12) para calcular el área de la superficie de
la elipse.
9.4.2.
Teorema integral de Cauchy
Consideremos de nuevo un abierto D del plano complejo C(≡ R2 )
tal que su clausura D sea una variedad con borde, y sea f : D → C,
f (x, y) = f1 (x, y) + i f2 (x, y) una función diferenciable en D y continua
en D, con soporte compacto. Se verifica entonces el siguiente resultado:
4
Esta igualdad de los vectores tangentes en los extremos no es necesaria, pues
se puede aplicar el Teorema de Stokes para variedades con borde anguloso; más
aún, por este motivo también basta con que γ sea diferenciable a trozos en [a, b].
El celebrado “Teorema de la curva de Jordan” permite afirmar que toda curva
diferenciable de Jordan es el borde parametrizado de un abierto conexo D cuya
adherencia es una variedad con borde compacta; recı́procamente, el borde de todo
tal abierto es parametrizable por una curva diferenciable de Jordan.
9.4. PRIMERAS APLICACIONES
211
Teorema 9.4.3 (integral de Cauchy) Si f es holomorfa entonces
Z
Z
Z
f (z)dz :=
(f1 dx − f2 dy) + i
(f1 dy + f2 dx)
∂D
∂D
∂D
es nula.
Demostración. Obsérvese que el integrando es, al menos formalmente,
la “1-forma compleja”:
ω(z) := f (z)dz = (f1 + if2 )(z) (dx + idy)
= (f1 dx − f2 dy) + i(f2 dx + f1 dy) = ω1 + iω2 ,
siendo
ω1 = f1 dx − f2 dy
ω2 = f2 dx + f1 dy.
dos 1-formas diferenciales ordinarias sobre R2 . De las ecuaciones de
Cauchy-Riemann para f es directo comprobar que dωi = 0, i = 1, 2.
En consecuencia, aplicando el Teorema de Stokes a las 1-formas ωi ,
i = 1, 2, se obtiene:
R
R
R
(f
dx
−
f
dy)
=
ω
=
1
2
1
R+∂D
R+∂D
R+D dω1 = 0
(f
dy
+
f
dx)
=
ω
=
dω2 = 0,
2
+∂D 1
+∂D 2
+D
lo que concluye la prueba. 2
9.4.3.
Teorema clásico de Stokes
Recordemos que habı́amos definido el rotacional rot X de un campo
vectorial X sobre una variedad riemanniana (Q, g) como la 2-forma:
rotX = d(X [ ).
Por tanto, se deduce ahora directamente la siguiente versión intrı́nseca
del Teorema de Stokes:
Teorema 9.4.4 (Stokes clásico intrı́nseco.) Sea (+Q, g) una variedad
riemanniana orientada bidimensional con borde. Si X ∈ X(Q) tiene
soporte compacto entonces
Z
Z
rot X =
X [.
(9.13)
+Q
+∂Q
212
CAPÍTULO 9. TEOREMA DE STOKES
Obsérvese que el miembro derecho de la igualdad no es más que la
circulación de X [ a lo largo del borde, por lo que si éste se reparametriza
con una curva de Jordan γ : [a, b] → Q podemos escribir:
Z
Z
b
[
X =
+∂Q
g(γ 0 , X)dt.
(9.14)
a
Supongamos ahora que, además, Q es una superficie regular S de R3
o, con más generalidad, de cualquier variedad orientada de dimensión
3, (+Q̃, h·, ·i) y g la métrica h·, ·i restringida a Q.
Observemos que la orientación de S determina un campo vectorial
normal unitario N , mediante N = E1 ×E2 , donde (E1 , E2 ) es cualquier
base ortonormal local de campos positivamente orientados sobre S;
esto es, N queda caracterizado porque (N, E1 , E2 ) es en cada punto
una base ortonormal positivamente orientada en R3 (obsérvese que,
recı́procamente, la elección de un vector normal unitario selecciona la
orientación de S).
Usando en este ambiente la definición del rotacional como un campo
vectorial (véase el Apéndice), se tiene:
hRot X, Y × Zi = rot X(Y, Z) ∀Y, Z ∈ X(Q).
En consecuencia (compruébese aplicando ambos miembros sobre (E1 ,
E2 )):
rot X = hRot X, N iµg
(9.15)
donde µg es el elemento de volumen métrico orientado sobre S. Por
tanto, teniendo en cuenta (9.14) y (9.15), el Teorema Clásico de Stokes
se reescribe, para superficies regulares de R3 o, en general, (+Q̃, h·, ·i):
Z
Z
b
hRot X, N i =
(S,µg )
g(γ 0 , X)dt,
(9.16)
a
donde la curva de Jordan γ que parametriza el borde ∂S se recorre
de modo que, en todo punto, la base ordenada formada por el normal exterior a S, la velocidad γ 0 y el vector normal a la superficie N
estén positivamente orientados en R3 (“un sacacorchos que girara en
el sentido de γ avanzarı́a en el sentido de N ”).
9.4. PRIMERAS APLICACIONES
213
Por último, es de remarcar que la igualdad anterior no sólo es
válida cuando el campo X ∈ X(Q) (el cual, para superficies embebidas -como la regular S-, siempre se puede obtener por restricción de
otro definido en un entorno de Q en Q̃), sino también para un campo
arbitrario X̃ ∈ X(Q̃) que, sobre los puntos de S, no sea necesariamente tangente a S. Para comprobarlo, escribamos (cada entorno de)
S como imagen inversa de un valor regular de una función F , siendo
S = Sc=0 , Sc = F −1 (c). Podemos considerar N como un campo vectorial unitario definido en un entorno de S y que sea ortogonal a cada superficie Sc (de hecho, componiendo F con una función apropiada ψ para
normalizar, se tiene N =grad(ψ ◦ F )), y escribir X̃ = X + hX̃, N iN ,
donde X es tangente a cada superficie Sc . Entonces claramente
hγ 0 , X̃i = g(γ 0 , X),
y, de rotX̃ = rotX + d(hγ 0 , X̃i)N se sigue:
hRotX̃, N i = hRotX, N i.
Por tanto, usando (9.16) se tiene, en resumen:
Teorema 9.4.5 (Stokes clásico extrı́nseco). Sea S una superficie regular de R3 (o de cualquier 3-variedad riemanniana orientada), orientada
por un vector unitario normal N , y eventualmente con borde, cada una
de sus partes conexas parametrizada con una curva γi : [ai , bi ] → ∂S,de
modo que γi0 pertenezca en cada punto a la orientación inducida. Para
cada campo X̃ ∈ X(Q) se considera la función flujo del rotacional a
través de S:
hRotX̃, N i : S → R.
Si la intersección del soporte de X̃ y S es compacta, se tiene entonces:
Z
hRot X̃, N i =
(S,µg )
XZ
i
bi
ai
hγi0 , X̃idt,
(9.17)
(donde la sumatoria se extiende a lo más a un número finito de sumandos).
214
9.5.
CAPÍTULO 9. TEOREMA DE STOKES
Teorema de la Divergencia
Fijado un elemento de volumen Ω0 , la derivada de Lie respecto a un
campo vectorial LX Ω0 da una medida de cómo el elemento de volumen
varı́a con el flujo de X. Esta medida puede hacerse cuantitativa, pues
LX Ω0 es una n−forma diferencial y, por tanto, expresable como una
función por el propio Ω0 .
Definición 9.5.1 Sea Ω0 un elemento de volumen sobre la variedad
Q. La divergencia del campo vectorial X ∈ X(Q) se define como la
función divΩ0 X ∈ C ∞ (Q) que verifica:
LX Ω0 = divΩ0 X · Ω0 .
En una variedad semi-riemanniana orientada, divX se refiere a la divergencia obtenida con respecto al elemento de volumen métrico orientado. Más aún, al ser claramente independiente de la orientación escogida, divX es definible también para variedades semi-riemannianas
no orientables (véase el Tema ?? para una definición directa -Definición
??).
Ejercicio. Obténganse expresiones en coordenadas cartesianas, cilı́ndricas y esféricas, para la divergencia de campos vectoriales sobre R3
con respecto al elemento de volumen usual.
El siguiente resultado es una consecuencia especialmente relevante
del Teorema de Stokes.
Teorema 9.5.2 (de la Divergencia). Sean (+Q, g) una variedad riemanniana con borde orientada, y X un campo vectorial sobre Q con
soporte compacto. Entonces
Z
Z
divX µg =
g(X, N ) µi∗ g ,
(9.18)
+Q
+∂Q
donde N es el campo normal que apunta al exterior, y µi∗ g denota
el elemento de volumen métrico iN µg sobre ∂Q para la orientación
inducida.
Demostración. Mediante una cálculo directo y usando el Teorema de
Cartan se tiene
(div X)µg = LX µg = iX dµg + d iX µg = d iX µg ,
(9.19)
9.5. TEOREMA DE LA DIVERGENCIA
215
la última igualdad por ser dµg una (n + 1)-forma diferencial. Por otra
parte, si X ∈ X(Q) y v2 , . . . , vn ∈ Tp (∂Q) entonces
(iX µg )(v2 , . . . , vn ) = µg (X, v2 , . . . , vn ) = g(X, N ) µg (N, v2 , . . . , vn )
= g(X, N ) iN µg (v2 , . . . , vn ) = g(X, N ) µi∗ g (v2 , . . . , vn ).
Por tanto,
iX µg = g(X, N )µi∗ g .
(9.20)
Teniendo en cuenta que iX µg tiene soporte compacto, la igualdad (9.18)
se deduce de aplicar directamente a esta (n − 1) forma el Teorema de
Stokes, usando (9.19) y (9.20). 2
Una consecuencia conocida de este teorema es la fórmula de GaussOstogradski, que se obtiene cuando Q es el cierre de un abierto acotado
D de Rn , y se considera la métrica usual. Esto es,
Z X
Z
n
∂X i
=
hX, N i,
i
D i=1 ∂x
∂D
donde D̄ es compacto.
Observaciones:
(1) La fórmula de Gauss-Ostogradski (y, en general, el Teorema de la
Divergencia) admite una interpretación muy intuitiva en términos de teorı́a de fluidos. En efecto, si D̄ es una región compacta de
R3 y X el campo de velocidades de un fluido, el miembro derecho
(flujo de X a través de ∂D) representa la cantidad de fluido que
sale por ∂D por unidad de tiempo. Si el fluido es incompresible
(divX ≡ 0), entonces el miembro izquierdo es nulo “la cantidad
de fluido que entra en cualquier región compacta D por unidad
de tiempo es igual a la que sale”. Si p ∈ Q es un manantial,
div Xp > 0 (resp. sumidero, div Xp < 0) entonces en cualquier
bola compacta B alrededor de p lo suficientemente
pequeña, el
R
signo
de
div
X
se
mantiene
constante
y
hX,
N
i
> 0 (resp.
∂B
R
hX, N i < 0) representa la cantidad de fluido que mana de
∂B
B al exterior (resp. que se suma al de B desde el exterior) por
unidad de tiempo.
(2) Puesto que tanto la divergencia de X, como la integración de
funciones o el concepto de normal exterior son independientes de
216
CAPÍTULO 9. TEOREMA DE STOKES
la orientación escogida, podemos escribir la igualdad
Z
Z
divX =
g(X, N )
(Q,g)
(9.21)
(∂Q,i∗ g)
incluso cuando (Q, g) no sea orientable (en este caso, (9.21) se
puede probar pasando al recubridor de dos hojas orientable).
(3) También se puede dar una versión del Teorema de la Divergencia
para un elemento de volumen arbitrario. En efecto, sin más que
usar el Teorema de Cartan y el de Stokes se tiene:
Z
Z
divΩ0 X =
iX Ω0 .
(Q,Ω0 )
9.6.
+∂Q
Algunas aplicaciones del T. de la Divergencia
A lo largo de esta sección, consideraremos Rn dotado de sus elementos geométricos usuales, y Q = D̄ será una n−variedad con borde
compacta obtenida como la adherencia de un abierto D. Denotaremos al borde por5 S = ∂Q, y a su campo normal exterior por N . Dado
p ∈ Rn , denotaremos p̄ al propio p visto como vector tangente en Tp Rn .
Cálculo de volumenes de Rn :
P
Consideremos en Rn el campo vectorial X = ni=1 xi ∂/∂xi . Un cálculo
directo muestra: div X = n. Por tanto, el Teorema de la Divergencia
proporciona la siguiente fórmula para el volumen de D (y Q):
Z
1
vol(D) =
hp, Np i.
n S
Caracterización de superficies que contienen al origen de
R3 :
5
Un resultado conocido afirma que si S es una hipersuperficie conexa compacta
n
n
embebida en R , entonces R \S tiene dos partes conexas, una de ellas (la “interior”) acotada D, de modo que Q = D̄ es una variedad con borde en las condiciones
de arriba.
9.6. APLICACIONES DEL T. DE LA DIVERGENCIA
217
Consideremos en R3 \{0} con la métrica inducida por la usual, el campo
de vectores
Xp =
1
p
= 2
(x∂x + y∂y + z∂z ).
3
2
kpk
(x + y + z 2 )3/2
Un cálculo directo muestra que divX = 0. En Rconsecuencia, aplicando
el Teorema de la Divergencia obtenemos que ∂B(0,r) g(X, N ) es independiente del radio r escogido, donde B(0, r) es la bola de centro 0 y
radio r, y N apunta al exterior de la bola. Computando el valor de esta
integral para r = 1 se obtiene inmediatamente 4π, que coincide con el
valor del área de la superficie ∂B(0, 1) = S 2 (1). Ası́, si S es cualquier
superficie compacta embebida en R3 \ {0} y D es su dominio interior
en R3 , se tiene, de nuevo por el Teorema de la Divergencia,
½
Z
0 si (0, 0, 0) 6∈ D,
g(X, N ) =
4π si (0, 0, 0) ∈ D,
S
donde N apunta al exterior de D. Por tanto, el valor de esta integral
caracteriza las superficies que contienen al origen de R3 .
Ley de Gauss del campo electromagnético:
Esta ley es sólo una reformulación del resultado anterior. Se define
el campo eléctrico E producido en un punto p ∈ R3 por una carga
puntual de magnitud q situada en el origen como
E :=
q
p
,
4π²0 kpk3
donde ²0 > 0 es una constante (dieléctrica del vacı́o). Salvo una constante, E coincide con el campo X del apartado anterior. Por tanto,
tomando una superficie S compacta y embebida en R3 que contenga al
origen, se sigue la siguiente igualdad conocida como Ley de Gauss:
Z
q
g(E, N ) = .
²0
S
Nota. Cabe señalar que la Ley de Gauss lleva naturalmente a postular
la igualdad (una de las Leyes de Maxwell)
div E =
ρ
,
²0
ρ densidad de carga.
218
CAPÍTULO 9. TEOREMA DE STOKES
Ángulo solido:
Llamamos ángulo sólido a la 2-forma en R3 \ {0} definida por:
Ωsol = ip/|p|3 Ω0 =
x dy ∧ dz + y dz ∧ dx + z dx ∧ dy
,
(x2 + y 2 + z 2 )3/2
donde Ω0 = dx ∧ dy ∧ dz es el elemento de volumen métrico orientado
usual. Obsérvese entonces que
Ωsol (vp , wp ) =
1
1
Ω0 (p, vp , wp ) = 3 hp, vp × wp i
3
|p|
|p|
para todo p ∈ R3 − {0} y todo vp , wp ∈ Tp R3 .
Un cálculo directo permite demostrar:
dΩsol = 0.
Por otra parte, en coordenadas esféricas el ángulo sólido admite la
siguiente expresión sencilla:
Ωsol = i 12 ∂r Ω0 = senθ dθ ∧ dφ.
r
Estudiemos a continuación la relación del ángulo sólido con la superficie
de las esferas. Consideremos la esfera S 2 (r), centrada en el origen de
radio r > 0. Una base ortonormal positivamente orientada de Tp R3 ,
p ∈ S 2 (r), es
µ
¶
∂ 1 ∂
1 ∂
BR 3 =
,
,
∂r r ∂θ rsenθ ∂φ
(válida siempre que θ 6= nπ, n ∈ Z). En consecuencia, una base
ortonormal de Tp S 2 (r), positivamente orientada con la orientación inducida sobre S 2 (r) como borde de B(0, r), es
¶
µ
1 ∂
1 ∂
,
,
BS 2 (r) =
r ∂θ rsenθ ∂φ
cuya dual es BS∗ 2 (r) = (r dθ, rsenθ dφ). Ası́, la métrica inducida en S 2 (r)
es
h, i |S 2 (r) = r2 (dθ2 + sen2 θdφ2 ),
9.6. APLICACIONES DEL T. DE LA DIVERGENCIA
219
y el elemento de volumen positivamente orientado µ0 sobre S 2 (r), también calculable inmediatamente de BS∗ 2 (r) :
µ0 = r2 senθ dθ ∧ dφ = r2 Ωsol
en T S 2 (r).
Esta última igualdad permite caracterizar a Ωsol mediante:
½
Ωsol (vp , wp ) = r12 µ0 (vp , wp ) si vp , wp ∈ Tp S 2 (r)
Ωsol (vp , ∂r |p ) = 0
para todo vp ∈ Tp R3 .
(9.22)
Estamos en condiciones de establecer la siguiente definición:
Definición 9.6.1 Sea S una superficie con borde compacta y orientada de R3 − {0}. Se define el ángulo sólido subtendido por +S desde el
origen como:
Z
i∗ Ωsol ,
^sol (+S) =
+S
3
donde i : S ,→ R − {0} es la inclusión.
Justificación. Supongamos que: (a) la superficie S ⊂ R3 \ {0} es tal
que cada semirrecta r que parte del origen corta a S transversalmente
a lo sumo una vez y, (b) en este caso, si r = {λv0 : λ > 0} corta a S
en p0 , la orientación inducida de la usual de R3 por el vector v0 (visto
como vector transverso a Tp0 S en Tp0 R3 ) coincide con la orientación
positiva de Tp0 S. Sea C(S) la unión de las semirrectas que cortan a S.
Desde el punto de vista clásico, se define el ángulo sólido subtendido
por S como el área de S 2 (1) ∩ C(S). De la caracterización (9.22) se
deduce entonces:
Z
2
Área(S (1) ∩ C(S)) =
i∗ Ωsol .
+S
En la Definición 9.6.1 se incluye este caso, y cuando la orientación
inducida por v0 es negativa, el área se computa de manera negativa.
La caracterización de las superficies compactas que incluyen al origen puede reformularse ahora como:
Teorema 9.6.2 Sea S ⊂ R3 \ {0} una superficie compacta sin borde, que encierra un abierto D de R3 , y orientada con la orientación
inducida por D. Entonces
½
0 si (0, 0, 0) 6∈ D
^sol (S) =
4π si (0, 0, 0) ∈ D.
220
CAPÍTULO 9. TEOREMA DE STOKES
Teorema de Arquı́medes:
Suponiendo a R3 dotada con la métrica usual, consideremos la función
presión P : R3 → R definida por:
½
−cz si z ≤ 0
(x, y, z) 7→
0
si z > 0,
siendo la constante c > 0 la densidad por atracción gravitatoria que,
en términos de magnitudes fı́sicas tı́picas, es igual a c = ρ g0 , siendo ρ
la “densidad (constante) de masa del fluido” y g0 la aceleración gravitatoria (digamos g0 = 90 8 m/s2 ). Supongamos que el “sólido rı́gido”
Q = D̄ está incluido en la región z < 0. Para cada q ∈ S = ∂Q se
define la fuerza ejercida por el fluido en q como
Fq = −P Nq = czNq ,
siendo Nq el vector unitario normal exterior. Consideremos el campo
∂
∂
∂
vectorial F = F x ∂x
+ F y ∂y
+ F z ∂z
ası́ definido sobre S, y definamos
el empuje del fluido sobre Q como la terna, E = (E x , E y , E z ):
Z
Z
Z
x
x
y
y
z
E =
F , E =
F , E =
F z.
S
S
S
Aplicando directamente el Teorema de la Divergencia, se obtiene el
siguiente resultado clásico.
Teorema 9.6.3 (de Arquı́medes). Con la notación introducida
E x = E y = 0,
E z = c vol(Q) = ρg0 vol(Q).
Esto es, todo cuerpo sólido (representado por la variedad compacta con
borde Q) sumergido en un fluido (subespacio z < 0) experimenta un
empuje vertical hacia arriba E igual al peso del fluido que desaloja.
Demostración. Sea Z = cz ∂/∂z. Entonces div Z = c y F z = cz·
hN, ∂/∂zi = hN, Zi. Luego, por el Teorema de la Divergencia,
Z
Z
z
E = hZ, N i =
c = c vol(Q).
S
D
Si X = cz ∂/∂x, Y = cz ∂/∂y entonces div X = div Y = 0 y F x =
hN, Xi, F y = hN, Y i. Luego, por el Teorema de la Divergencia,
Z
x
E =
div X = 0,
Q
y
y análogamente E = 0.
2
9.7. FÓRMULAS DE GREEN
9.7.
221
Fórmulas de Green
Para cualquier variedad semi-riemanniana, se define el laplaciano
de una función f como:
∆f = div(gradf ).
Sea Q una variedad riemanniana con borde, y N un campo normal
unitario sobre ∂Q que apunta al exterior.
Primera Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h)
es compacto, entonces
Z
Z
Z
f g(∇h, N )µi∗ g .
g(∇f, ∇h)µg =
f ∆h µg +
∂Q
Q
Q
En particular, si ∂Q = ∅ entonces
Z
Z
f ∆h µg = − g(∇f, ∇h)µg .
Q
Q
Demostración. Aplı́quese el Teorema de la Divergencia teniendo presente la igualdad
div(f ∇h) = f div∇h + g(∇f, ∇h). 2
Obsérvese que si f ≡ 1 entonces se reobtiene el Teorema de la Divergencia para ∇h.
Segunda Fórmula de Green: Si f, h ∈ C ∞ (Q) son tales que sop(f ∇h)
y sop(h∇f ) son compactos, entonces
Z
Z
Z
f ∆h µg −
h∆f µg =
g(f ∇h − h∇f, N )µi∗ g .
Q
Q
∂Q
En particular, si ∂Q = ∅ entonces
Z
Z
f ∆h µg =
h∆f µg .
Q
Q
Demostración. Escrı́base también la Primera Fórmula de Green intercambiando los papeles de f y h, y réstense las dos expresiones. 2
Las fórmulas anteriores se mantienen válidas para métricas no degeneradas (siempre que i∗ g también sea una métrica no degenerada
sobre ∂Q, al menos c.p.d.) Sin embargo, el siguiente resultado fundamental usa fuertemente el carácter definido de la métrica.
222
CAPÍTULO 9. TEOREMA DE STOKES
Teorema 9.7.1 Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde. Si h ∈ C ∞ (Q) es tal que ∆h ≥ 0 ó ∆h ≤ 0 sobre
todo Q, entonces h es constante.
Demostración. Consideremos el caso ∆h ≥ 0 (si ∆h ≤ 0 úsese que
∆(−h) = −∆h ≥ 0). Puesto que Q es compacta, podemos escoger
c ≥ 0 (c ∈ R) tal que hc = h + c ≥ 0; obsérvese que ∇hc = ∇h y
∆hc = ∆h. Tomando f = hc en la Primera Fórmula de Green se tiene
Z
Z
hc ∆h µg +
g(∇h, ∇h) = 0.
Q
Q
Como al ser g riemanniana los integrandos de ambos sumandos son no
negativos, éstos deben anularse. Por tanto, g(∇h, ∇h) ≡ 0, y ∇h ≡ 0.
2
Nota. A una función h con ∆h ≡ 0 se le llama armónica, si ∆h ≥ 0
subarmónica, y si ∆h ≤ 0 superarmónica. Por el teorema anterior, las
únicas funciones subarmónicas o superarmónicas que admite la variedad riemanniana compacta Q son las constantes.
Consecuencias: Sea (Q, g) una variedad riemanniana conexa, compacta y sin borde:
R
(1) Si definimos hf, hi := Q f h µg , obtenemos un producto escalar
sobre C ∞ (Q). Por la Segunda Fórmula de Green, el operador
∆ : C ∞ (Q) → C ∞ (Q) es autoadjunto para h, i. Además, por
el Corolario 9.7.1, Nucl∆ ≡ R(≡ funciones constantes),
y una
R
condición necesaria para que f ∈ Im∆ es que Q f µg = 0. De
hecho, mirando la igualdad ∆u = f como una ecuación donde
f es conocida y u es la incógnita, la anterior es una condición
necesaria para la existencia de soluciones (que puede demostrarse
es también suficiente).
(2) Consideremos los autovalores del laplaciano, esto es, los escalares
µ ∈ R tales que
∆u = µ u
para alguna función no constante u ∈ C ∞ (Q). Multiplicando esta
igualdad por u y aplicando la Primera Fórmula de Green, se tiene
Z
Z
2
µ u µg +
g(∇u, ∇u) = 0.
Q
Q
9.8. APÉNDICE: PRODUCTO VECTORIAL
223
Pero la primera y segunda integral son no negativas (y claramente
distintas de cero). Por tanto, necesariamente µ < 0. De hecho,
es posible demostrar que estos autovalores forman una sucesión
divergente a −∞.
9.8.
Apéndice: producto vectorial y rotacional
9.8.1.
Isomorfismos especiales en (V 3 (R), µ0 ).
Sea V (R) un n−espacio vectorial con un elemento de volumen fijado
µ0 . Entonces, existe un isomorfismo entre V (R) y Λn−1 (V ), canónicamente asociado a µ0 ; concretamente, el isomorfismo que a cada vector
v le hace corresponder el tensor antisimétrico iv µ0
Ası́, para n = 3 podemos escribir este isomorfismo como
V 3 → Λ2 (V 3 )
v 7→ iv µ0 = µ0 (v, ·, ·).
(9.23)
Por otra parte, en dimension 3, a la aplicación
V3×V3×V3 →R
(u, v, w) 7→ µ0 (u, v, w),
(9.24)
la denominaremos “producto mixto” Si fijamos los vectores (u, v), la
aplicación
V → R, w 7→ µ0 (u, v, w),
es una forma lineal. Cuando µ0 es el elemento de volumen métrico
orientado para un producto escalar, h·, ·i, al sostenido de esta forma
lineal se le llama, producto vectorial de u y v, que se denota por u × v.
Esto es, se define
u × v = (iv (iu µ0 ))] ,
con lo que el producto vectorial queda caracterizado por la igualdad:
hu × v, wi = µ0 (u, v, w),
∀w ∈ V.
(9.25)
Por supuesto, todo esto resulta extensible punto a punto a los espacios
tangentes en variedades de dimensión 3.
224
CAPÍTULO 9. TEOREMA DE STOKES
Ejercicio. En R3 con la métrica riemanniana y orientación usuales,
obténganse expresiones para el producto vectorial de dos campos vectoriales en coordenadas cilı́ndricas y esféricas.
9.8.2.
El rotacional
Consideremos ahora una variedad semi-riemanniana (Q, g) y un
campo vectorial X ∈ X(Q). Recordemos (Sección 7.3) que la 2-forma
diferencial rotacional se definı́a como rotX=dX [ . Supongamos ahora
que en Q se fija una orientación, y el correspondiente elemento de
volumen métrico orientado µg .
En dimensión n = 3, el inverso del isomorfismo (9.23) permite
definir ahora el campo vectorial rotacional de X, RotX ∈ X(Q), que
se caracteriza como:
iRotX µg = rotX = dX [ .
Ası́, usando (9.25), también se tiene la caracterización:
µg (RotX, Y, Z) = g(RotX, Y × Z)
= rotX(Y, Z) = Y g(X, Z) − Zg(X, Y ) − g(X, [Y, Z]),
válida para cualesquiera campos vectoriales Y, Z. En particular, si
Y, Z fueran campos coordenados, el último término no aparecerı́a, y
si además Y = ∂i , Z = ∂j fueran ortonormales para una métrica
g riemanniana (lo cual sólo sucede en el caso particular de que la
métrica sea isométrica a la usual de R3 , en algún abierto), entonces:
µg (RotX, ∂i , ∂j ) = ∂i X j − ∂j X i .
Ejercicio. En R3 con la métrica riemanniana y orientación usuales,
obténganse expresiones para el rotacional de un campo vectorial en
coordenadas cilı́ndricas y esféricas.
Capı́tulo 10
Conexiones afines
En este capı́tulo introducimos un elemento nuevo sobre una variedad: el concepto de conexión afı́n. A partir de él se pueden definir
varios conceptos de interés geométrico: la derivada covariante a lo largo
de una curva, el transporte paralelo, las geodésicas y la aplicación exponencial (además de la curvatura que estudiaremos en el capı́tulo
siguiente). Describiremos brevemente estos conceptos y hallaremos expresiones en coordenadas para todos ellos a partir de los sı́mbolos de
Christoffel de la conexión.
10.1.
Concepto de conexión afı́n
Hasta ahora, dada una variedad diferenciable arbitraria sabemos
derivar una función f con respecto a una dirección del espacio tangente v, pero no sabemos derivar un campo de vectores Y . Un primer
intento para definir esta derivación serı́a el corchete de Lie que, si bien
permitirı́a hablar de la derivada de un campo Y en la dirección de otro
campo V , no permite derivar en la dirección del vector v en un punto.
Esto es, puede ocurrir que para V, Ṽ ∈ X(Q) con v = Vp = Ṽp se tenga
[V, Y ]p 6= [Ṽ , Y ]p .
Para tratar de definir esta derivación consideremos en primer lugar
n
R con el sistema usual de coordenadas (x1 , . . . , xn ). Todo campo de
225
226
CAPÍTULO 10. CONEXIONES AFINES
vectores Y ∈ X(Rn ) puede escribirse como:
Y =
n
X
Yi
i=1
∂
,
∂xi
con Y i : Rn → R diferenciable ∀i ∈ {1, . . . , n}.
Si vp ∈ Tp Rn entonces podemos definir la derivada de Y en la dirección
de vp como
n
X
∂
vp (Y ) :=
vp (Y i ) i |p .
∂x
i=1
Obviamente, esta definición depende del sistema de coordenadas escogido. Ası́, en una variedad arbitraria Q donde no exista un sistema
de coordenadas privilegiado la anterior definición carece de sentido.
Por tanto, se hace necesario abstraer las propiedades deseables de esta
definición de manera que sea aplicable a una variedad Q arbitraria.
Definición 10.1.1 Sea Q una variedad diferenciable. Una conexión
afı́n sobre Q es una aplicación ∇,
∇ : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ ∇X Y
que verifica:
(1) Es R-lineal con respecto a la segunda variable, esto es,
∇X (aY + bY ) = a∇X Y + b∇X Y , ∀a, b ∈ R, ∀X, Y, Y ∈ X(Q).
(2) Verifica la regla de Leibniz del producto con respecto a la segunda
variable:
∇X (f Y ) = X(f )Y + f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q).
(3) Es R-lineal con respecto a la primera variable, esto es,
∇aX+bX (Y ) = a∇X Y + b∇X Y, ∀a, b ∈ R, ∀X, X, Y ∈ X(Q).
(4) Es C ∞ (Q)-lineal con respecto a la primera variable, esto es,
∇f X Y = f ∇X Y, ∀f ∈ C ∞ (Q), ∀X, Y ∈ X(Q).
10.1. CONCEPTO DE CONEXIÓN AFÍN
227
Si, además, se verifica
∇X Y − ∇Y X = [X, Y ], ∀X, Y ∈ X(Q)
entonces se dice que la conexión es simétrica. Al par (Q, ∇) lo llamaremos variedad afı́n.
Observaciones:
(1) Es inmediato comprobar que el corchete de Lie sobre Q
[·, ·] : X(Q) × X(Q) → X(Q)
(X, Y ) 7→ [X, Y ]
no es una conexión afı́n puesto que no verifica la propiedad (4)
(en cambio, sı́ verifica el resto de las propiedades).
(2) Del axioma (2) queda claro que (si dim Q > 0) la conexión afı́n
no es C ∞ (Q)-lineal con respecto a la segunda variable. Sı́ lo es,
sin embargo, respecto de la primera variable (propiedad (4)).
Comprobemos ahora que con una conexión afı́n sı́ es posible definir la
derivada de Y en la dirección de un vector tangente v. En adelante,
simplificaremos sistemáticamente la notación siendo consistentes con:
∂i ≡ ∂/∂q i .
Proposición 10.1.2 Sean X, X ∈ X(Q) tales que Xp = X p para cierto p ∈ Q. Entonces
(∇X Y )p = (∇X Y )p ,
∀Y ∈ X(Q).
Demostración. Sean X, X ∈ X(Q) tales que Xp = X p . Si (U, q 1 , . . . , q n )
es un entorno coordenado de Q alrededor de p entonces podemos escribir:
n
n
X
X
i
i
X ∂i ,
X=
X=
X ∂i ,
i=1
i=1
Ahora bien, por la propiedad (4) de la Definición 10.1.1
P
∇X Y = ∇(Pni=1 X i ∂i ) Y = ni=1 X i ∇∂i Y,
∇X Y = ∇(Pn
i=1
X
i
Y =
∂i )
Pn
i
i=1 X ∇∂i Y.
(10.1)
228
CAPÍTULO 10. CONEXIONES AFINES
i
Por tanto, como X i (p) = X (p) se tiene
(∇X Y )p =
n
X
i
X (p)(∇∂i Y )p =
i=1
n
X
i
X (p)(∇∂i Y )p = (∇X Y )p . 2
i=1
Gracias a este resultado podemos definir la derivada ∇vp Y , vp ∈
Tp Q. En efecto, para computar dicha derivada basta con calcular (∇X Y )p ,
siendo X ∈ X(Q) tal que Xp = vp .
Nota. Al escribir los campos X e Y en coordenadas en la demostración
anterior, se plantea la dificultad de que estas expresiones no estén
definidas sobre todo Q. En este caso, en rigor, no tiene sentido escribir
(10.1) aplicando los axiomas de la Definición 10.1.1. Esta dificultad se
puede salvar porque de estos axiomas se deduce que si X, Y ∈ X(Q)
coinciden, respectivamente, con X, Y ∈ X(Q) en un entorno U de p, entonces ∇X Y = ∇X Y sobre U . En particular, si se define una conexión
sobre una variedad, ésta queda definida sobre cualquier abierto suyo.
La prueba de estos resultados usa la existencia de “funciones meseta”
alrededor de cualquier punto p (véase [O’N, Proposition 2.2, Lemma
2.3] para más detalles).
Ejercicio. Pruébese que la aplicación ∇0 : X(Rn ) × X(Rn ) → X(Rn )
definida usando las coordenadas usuales de Rn por
(X, Y ) 7→
∇0X Y
n
X
n
X
∂
∂Y j ∂
:=
X(Y ) j =
Xi i
,
∂x
∂x ∂xj
j=1
i,j=1
j
P
P
siendo X = ni=1 X i ∂x∂ i , Y = nj=1 Y j ∂x∂ j , es una conexión afı́n simétrica sobre Rn .
Definición 10.1.3 Dada una variedad afı́n (Q, ∇) se dice que X ∈
X(Q) es paralelo si ∇X ≡ 0; esto es, si
∇v X = 0,
∀v ∈ T Q.
Una variedad afı́n puede no admitir campos paralelos.
Ejercicio. Determı́nense todos los campos paralelos de (Rn , ∇0 ).
10.2. SÍMBOLOS DE CHRISTOFFEL
10.2.
229
Sı́mbolos de Christoffel
Sean (Q, ∇) una variedad afı́n y (U, q 1 , . . . , q n ) un entorno coordenado de Q. Como sabemos, el conjunto (∂1 ≡ ∂/∂q 1 , . . . , ∂n ≡ /∂q n ) es
una base de campos sobre U , y dado que ∇∂i ∂j también es un campo
sobre U , podemos expresarlo punto a punto como combinación lineal
de los campos coordenados (∂1 , . . . , ∂n ). En consecuencia, existen n3
funciones diferenciables Γkij , i, j, k ∈ {1, . . . , n} sobre U tales que
∇∂i ∂j =
n
X
Γkij ∂k .
(10.2)
k=1
Definición 10.2.1 Las funciones Γkij , i, j, k ∈ {1, . . . , n} dadas por la
expresión (10.2) reciben el nombre de sı́mbolos de Christoffel de ∇ en
las coordenadas (q 1 , . . . , q n ).
Propiedades:
(1) Los valores de Γkij , i, j, k ∈ {1, . . . ,P
n} determinan laPconexión
∇ sobre el abierto U . En efecto, si X = ni=1 X i ∂i , Y = nj=1 Y j ∂j
entonces
P
P
∇X Y = ∇(Pni=1 X i ∂i ) ( nj=1 Y j ∂j ) = ni,j=1 X i ∇∂i (Y j ∂j )
P
P
P
= ni,j=1 X i (∂i Y j ∂j + Y j ∇∂i ∂j ) = ni,j=1 X i (∂i Y j ∂j + Y j nk=1 Γkij ∂k ),
(mientras que en la segunda igualdad se usa el axioma (4), en la tercera
se usa el (2); para la última igualdad se ha usado (10.2)). En consecuencia, conociendo los sı́mbolos de Christoffel podemos computar la
conexión afı́n sobre dos campos cualesquiera.
(2) Recı́procamente, fijado un entorno coordenado (U, q 1 , . . . , q n ) y
3
n funciones diferenciables arbitrarias Γkij , i, j, k ∈ {1, . . . , n} sobre U ,
existe una única conexión afı́n ∇ sobre U cuyos sı́mbolos de Christoffel
en coordedanadas (q 1 , . . . , q n ) son Γkij . Concretamente, ∇ viene dado
por la expresión
!
Ã
n
n
X
X
Γkij ∂k , X, Y ∈ X(U ).
∇X Y :=
X i ∂i Y j ∂j + Y j
i,j=1
k=1
En particular, si en Rn tomamos coordenadas usuales y Γkij ≡ 0, ∀i, j, k,
reobtenemos la conexión usual ∇0 .
230
CAPÍTULO 10. CONEXIONES AFINES
(3) Sean Γkij los sı́mbolos de Christoffel de una conexión ∇ sobre
Q para un entorno coordenado (U, q 1 , . . . , q n ). Se verifica que ∇ es
simétrica en U (véase la Definición 10.1.1) si y sólo si Γkij = Γkji para
todo i, j, k. (En consecuencia, la simetrı́a de los sı́mbolos de Christoffel
no depende de las coordenadas elegidas).
Demostración de (3). Probémoslo en primer lugar para campos coordenados. Dado que [∂i , ∂j ] = 0, computando directamente se tiene:
∇∂i ∂j − ∇∂j ∂i =
n
X
Γkij ∂k
−
n
X
Γkji ∂k
=
(Γkij − Γkji )∂k ,
k=1
k=1
k=1
n
X
que es nulo si y sólo si Γkij = Γkji para todo i, j, k. Para campos cualesquiera basta con expresar dichos campos en términos de los coordenados y reducir la prueba al caso anterior.
(4) Sea ∇ una conexión sobre Q y sean (q 1 , . . . , q n ), (q 1 , . . . , q n )
dos sistemas coordenados sobre un mismo abierto U ⊆ Q. La relación
k
existente entre los sı́mbolos de Christoffel Γkij y Γij asociados a los
respectivos sistemas coordenados es:
s
Γij
n
n
X
X
∂q l ∂q m ∂q s r
∂q s ∂ 2 q r
+
Γ .
=
∂q r ∂q i ∂q j l,m,r=1 ∂q i ∂q j ∂q r lm
r=1
(10.3)
En particular, la expresión (10.3) muestra que una conexión no se
puede considerar como un campo tensorial ya que, debido al término
en derivadas segundas, las funciones Γkij no se transforman como las
coordenadas de un tensor.
Demostración de (4). Por definición de los sı́mbolos de Christoffel
P
∇∂i ∂j = nk=1 Γkij ∂k
P
k
∇∂ i ∂ j = nk=1 Γij ∂ k .
P
Pn ∂ql
∂q l ∂
Ahora bien, como ∂ k ≡ ∂q∂k = nl=1 ∂q
k ∂q l ≡
l=1 ∂q k ∂l se tiene
P
Pn
m
∂q l
∂q m
∇∂ i ∂ j = ∇Pn ∂ql ∂ ( nm=1 ∂q
j ∂m ) =
i ∇∂l ( ∂q j ∂m )
l,m=1
∂q
∂q
l=1 ∂q i l
P
Pn
∂ 2 qm
∂q l ∂q m r
= nm=1 ∂q
i ∂q j ∂m +
l,m,r=1 ∂q i ∂q j Γl,m ∂r .
Por otra parte,
∇∂ i ∂ j =
n
X
k=1
k
Γij ∂ k
=
n
X
k,r=1
k
Γij
∂q r
∂r .
∂q k
10.3. DERIVADA COVARIANTE
231
Igualando la componente r-ésima de cada expresión se obtiene:
n
X
k
Γij
k=1
Pero
Pn
∂q r
∂q s
r=1 ∂q k ∂q r
bros de (10.4) por
=
n
X
∂q r
∂ 2qr
∂q l ∂q m r
=
+
Γ .
∂q i ∂q j l,m=1 ∂q i ∂q j lm
∂q k
∂q s
∂q k
(10.4)
= δks . Por tanto, multiplicando los dos miem-
∂q s
∂q r
y sumando en r obtenemos finalmente:
à n
!
n
n
X
X
∂q s X k ∂q r
s
k s
Γij =
Γij δk =
Γ
∂q r k=1 ij ∂q k
r=1
k=1
Ã
!
n
n
X
X
∂q l ∂q m r
∂ 2qr
∂q s
=
+
Γ
. 2
i
j
i
j lm
r
∂q
∂q
∂q
∂q
∂q
r=1
l,m=1
Ejemplo. Como ya indicamos los sı́mbolos de Christoffel de R2 para
∇0 en coordenadas usuales son todos nulos. Sin embargo, en coordenadas polares se tiene (compruébese directamente de (10.3)):
∇0∂ρ ∂ρ = 0,
10.3.
∇0∂θ ∂θ = −ρ∂ρ ,
1
∇0∂θ ∂ρ = ∂θ .
ρ
Derivada covariante
Sean (Q, ∇) una variedad afı́n y γ : I → Q, I =]a, b[ una curva
diferenciable. Como ya vimos, si X ∈ X(Q) entonces tiene sentido
escribir ∇v X para cualquier vector tangente v ∈ T Q. En particular,
podemos escribir ∇γ 0 (t) X, ∀t ∈ I.
Definición 10.3.1 Llamamos derivada covariante de X ∈ X(Q) a lo
largo de γ : I → Q a la aplicación
DX
dt
: I → TQ
t 7→ ∇γ 0 (t) X ∈ Tγ(t) Q.
Usando las propiedades de la conexión afı́n de la Sección 10.1 se obtienen las siguientes:
(1) La derivada covariante es R-lineal, esto es,
DX
DX
D(aX + bX)
=a
+b
.
dt
dt
dt
232
CAPÍTULO 10. CONEXIONES AFINES
(2) Se verifica la regla de Leibniz del producto, esto es,
D(f X)
DX
d(f ◦ γ)
DX
= γ 0 (f )X + f
=
X +f
.
dt
dt
dt
dt
Estudiemos a continuación la expresión
Pn eni coordenadas1 de la derivada
covariante. Supongamos que X = i=1 X ∂i y γ(t) = (q (t), . . . , q n (t)).
Entonces γ 0 (t) = (q̇ 1 (t), . . . , q̇ n (t)) ∈ Tγ(t) Q, es decir,
0
γ (t) =
n
X
j=1
q̇ j (t)
∂
|γ(t) .
∂q j
Por tanto,
P
DX
(:= ∇γ 0 (t) X)
= nk=1 ∇γ 0 (t) (X k ∂k )
dt
Pn
P
= k=1 γ 0 (t)(X k )∂k + ni=1 X i ∇γ 0 (t) ∂i
P
P
k
= nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t)∇(∂j |γ(t) ) ∂i
P
P
P
k
= nk=1 d(Xdt◦γ) ∂k + ni,j=1 X i (γ(t))q̇ j (t) nk=1 Γkij (γ(t))∂k .
En conclusión, su expresión en coordenadas queda:
Ã
!
n
n
X
DX
d(X k ◦ γ) X i
(t) =
+
X (γ(t))q̇ j (t)Γkij (γ(t)) ∂k |γ(t) .
dt
dt
i,j=1
k=1
(10.5)
La definición de derivada covariante se puede extender a campos vectoriales sobre γ más generales de la siguiente manera:
Definición 10.3.2 Dada una curva diferenciable γ : I → Q decimos
que X̂ es un campo sobre γ si es una aplicación diferenciable
X̂ : I → T Q
t 7→ X̂(t)
tal que X̂(t) ∈ Tγ(t) Q, ∀t ∈ I (esto es, tal que π ◦ X̂ = γ siendo
π : T Q → Q la proyección canónica).
Por ejemplo, si X ∈ X(Q) entonces la aplicación diferenciable
X ◦ γ : I → TQ
t 7→ Xγ(t) ,
(10.6)
10.3. DERIVADA COVARIANTE
233
Figura 20
es un campo sobre γ. Ahora bien, no todos los campos sobre una curva son restricciones a esa curva de un campo definido sobre toda la
variedad (véase la Figura 20).
A partir de (10.5) se comprueba que la derivada covariante de
un campo a lo largo de una curva γ sólo depende de los valores del
campo sobre dicha curva. Esto permite definir la derivada covariante
a lo largo de γ de un campo X̂ sobre γ que no provenga necesariamente P
de un campo definido sobre toda la variedad. En efecto, si
X̂(t) = ni=1 X̂ i (t) ∂q∂ i |γ(t) entonces definimos
n
X
DX̂
(t) :=
dt
k=1
Ã
!
n
X
dX̂ k
(t) +
X̂ i (t)q̇ j (t)Γkij (γ(t)) ∂k |γ(t) . (10.7)
dt
i,j=1
Esta definición es independiente de las coordenadas elegidas, al coincidir con (10.5).
En resumen, para cualquier campo vectorial X̂ sobre una curva
γ hemos definido un nuevo campo vectorial DdtX̂ también sobre γ que
representa la “derivada de X̂ en la dirección de γ 0 (t)”, para todo t ∈ I.
234
CAPÍTULO 10. CONEXIONES AFINES
10.4.
Transporte paralelo
Definición 10.4.1 Sea X̂ : I → T Q un campo de vectores sobre una
curva γ. Diremos que X̂ es paralelo si DdtX̂ ≡ 0.
A continuación veremos que existe una única manera de “transportar
paralelamente” un vector v a lo largo de una curva γ. En efecto:
Teorema 10.4.2 Fijados una curva γ : I → Q y un vector v ∈
Tγ(t0 ) Q, t0 ∈ I, existe un único campo de vectores V sobre γ tal que
V (t0 ) = v y DV
≡ 0.
dt
Idea de la demostración. Tomemos coordenadas alrededor de γ(t0 ).
La prueba se reduce entonces a resolver el sistema de n ecuaciones
diferenciales de primer orden
n
dV k (t) X i
+
V (t)q̇ j (t)Γkij (γ(t)) = 0,
dt
i,j=1
k = 1, . . . , n,
(10.8)
con condiciones iniciales V i (t0 ) = v i , ∀i ∈ {1, . . . , n}. Pero esto se
reduce a aplicar los teoremas clásicos de existencia y unicidad para
tales ecuaciones1 . El resultado se puede extender entonces a toda la
curva, recubriendo su imagen por entornos coordenados. 2
Ejemplo. En Rn las ecuaciones de transporte paralelo de un campo
V , V (t0 ) = v, a lo largo de una curva en coordenadas usuales son:
dV k (t)
≡ 0,
dt
V k (t0 ) = v k ,
k = 1, . . . , n.
Obviamente, estas ecuaciones admiten como única solución V k (t) ≡
v k = cte, ∀t ∈ I. Ello coincide con la idea intuitiva de lo que debe ser
transportar un vector paralelamente en R2 ó R3 .
Denotemos por Ttt0 (v) al vector de Tγ(t) Q obtenido por transporte paralelo de v ∈ Tγ(t0 ) Q a lo largo de γ. Entonces se verifican las siguientes
propiedades:
1
Véase, por ejemplo, el Teorema 1 del Capı́tulo 2 de “Ecuaciones diferenciales
II”, Ediciones Pirámide, S.A., 1996 (C. Fernández, J. M. Ruiz).
10.4. TRANSPORTE PARALELO
235
(1) La aplicación transporte paralelo
Ttt0 : Tγ(t0 ) Q → Tγ(t) Q
v 7→ Ttt0 (v)
es un isomorfismo de espacios vectoriales (esencialmente, la linealidad
se debe a la del sistema (10.8) y la inyectividad a la unicidad de soluciones de (10.8) para cada v).
(2) Si (e1 , . . . , en ) es una base de Tγ(t0 ) Q y E1 , . . . , En son los correspondientes campos sobre γ obtenidos por transporte paralelo de los
vectores e1 , . . . , en , respectivamente, entonces cualquier campo paralelo
V sobre γ puede escribirse como
V =
n
X
ai Ei ,
ai ∈ R, ∀i ∈ {1, . . . , n}.
i=1
(3) Se verifica la igualdad Ttt21 ◦ Ttt10 = Ttt20 , ∀t0 , t1 , t2 ∈ I.
(4) Es posible reconstruir la conexión a partir del transporte paralelo. En efecto, para cada campo X ∈ X(Q) y cada curva γ en Q, el
campo de vectores ∇γ 0 (t) X se puede expresar en términos de la aplicación transporte paralelo de la siguiente manera:
∇γ 0 (t) X = limh→0
Ttt+h (Xγ(t+h) ) − Xγ(t)
h
(véase, p. ej., [Sp1, Chapter 6, Proposition 3]).
Ejercicio. Demuéstrese:
(1) Sea X ∈ X(Q) un campo paralelo para la conexión ∇ (Definición
10.1.3). Para cualquier curva γ, X̂ = X ◦γ es paralelo (Definición
10.4.1).
(2) Sean X, Y ∈ X(Q) dos campos paralelos. Si Q es conexa y Xp =
Yp para algún p ∈ Q entonces X = Y .
(3) Si Q es conexa entonces los campos paralelos sobre Q forman un
espacio vectorial de dimensión menor o igual que n.
236
CAPÍTULO 10. CONEXIONES AFINES
10.5.
Geodésicas
Hasta ahora, para una curva diferenciable γ(t) en Q hemos definido
su velocidad γ 0 (t) pero no su aceleración. A continuación veremos cómo
la conexión permite definir esta última y, con ella, el concepto de
geodésica.
Definición 10.5.1 Sea (Q, ∇) una variedad afı́n y γ : I → Q una curva diferenciable. Llamaremos aceleración de γ a la derivada covariante
0
de su velocidad Dγ
.
dt
Diremos que γ es una geodésica si tiene aceleración nula Dγ 0 /dt ≡
0, esto es, si el campo de vectores γ 0 (t) sobre γ es un campo paralelo.
Obsérvese que para definir los conceptos de aceleración y geodésica ha
sido necesario introducir previamente la conexión afı́n.
Estudiemos a continuación la ecuación que define las geodésicas en
coordenadas. Dado un entorno coordenado (U, q 1 , . . . , q n ) de Q y un
campo X̂ a lo largo de una curva γ en U , la expresión de la derivada covariante viene dada por (10.7). Por tanto, si tomamos X̂ ≡ γ 0
entonces
Ã
!
n
n
0
2 k
X
X
Dγ
dq
∂
(t) =
(t) +
q̇ i (t)q̇ j (t)Γkij (γ(t))
|γ(t) .
2
dt
dt
∂q k
i,j=1
k=1
En consecuencia, γ será una geodésica si y sólo si se verifica:
n
X
d2 q k
(t) +
Γkij (γ(t))q̇ i (t)q̇ j (t) = 0,
dt2
i,j=1
∀k ∈ {1, . . . , n}.
(10.9)
Ejemplo. Si tomamos coordenadas usuales en (Rn , ∇0 ) entonces (10.9)
se reduce a
d 2 xk
= 0, ∀k ∈ {1, . . . , n}
dt2
y, por tanto, las geodésicas son rectas afines xk (t) = ak · t + bk , ∀k ∈
{1, . . . , n}. En cambio, en las coordenadas polares de R2 las ecuaciones
de las geodésicas adoptan la expresión:
ρ̈ − ρθ̇2 = 0,
ρθ̈ + 2ρ̇θ̇ = 0.
10.6. CONEXIONES SIMÉTRICAS
237
Como en la demostración del Teorema 10.4.2, si aplicamos los teoremas clásicos de existencia y unicidad de soluciones de ecuaciones
diferenciales a (10.9) obtenemos:
Teorema 10.5.2 Sea (Q, ∇) una variedad afı́n. Para cada t0 ∈ R,
p ∈ Q y v ∈ Tp Q, existe una única geodésica γ :]a, b[→ Q tal que
(i) γ(t0 ) = p, γ 0 (t0 ) = v, y
(ii) γ es inextensible (o maximal), esto es, no existe otra geodésica γ
que verifique (i) y cuyo dominio de definición contenga estrictamente a ]a, b[.
Grosso modo, lo que se está diciendo es que el punto y la velocidad
iniciales determinan la geodésica. Una propiedad relevante que pueden
presentar las geodésicas es la completitud:
Definición 10.5.3 Si una geodésica inextensible tiene dominio de definición todo R entonces se dice que es completa.
Una variedad cuyas geodésicas inextensibles son todas completas se
dice que es una variedad geodésicamente completa.
Por ejemplo, Rn con la conexión usual es completa. Sin embargo, la
bola de centro 0 y radio r(< ∞) no lo es.
Nota. Las velocidades de las geodésicas proporcionan las curvas integrales de un campo vectorial G sobre la variedad tangente, G ∈ X(T Q).
Ello permite descubrir algunas analogı́as entre los conceptos aquı́ estudiados para las geodésicas y los vistos en el Tema 5 para las curvas
integrales de cualquier campo vectorial.
10.6.
Conexiones simétricas
Si observamos con detenimiento las ecuaciones de las geodésicas,
encontramos que el término ẋi ẋj va multiplicado por (Γkij + Γkji ) para
cada par de ı́ndices i, j. Esto implica que las sumas (Γkij + Γkji ) están
determinadas por las geodésicas. Además, si la conexión es simétrica
entonces se tiene Γkij + Γkji = 2Γkij . Por tanto, las geodésicas determinan
los sı́mbolos de Christoffel y, en consecuencia, también la conexión.
Por otra parte, aunque una conexión ∇ no sea simétrica, siempre
ˆ simétrica a partir de ∇ que tenga
es posible construir otra conexión ∇
sus mismas geodésicas.
238
CAPÍTULO 10. CONEXIONES AFINES
Proposición 10.6.1 Dada una conexión no simétrica ∇, existe una
ˆ cuyas geodésicas coinciden con las de ∇.
única conexión simétrica ∇
Esquema de la demostración. Paso 1. Para toda conexión afı́n ∇ se
define su torsión como
Tor(X, Y ) = ∇X Y − ∇Y X − [X, Y ],
X, Y ∈ X(Q).
Es fácil comprobar que Tor(·, ·) es un campo de tensores 2-covariante,
1-contravariante, no nulo y antisimétrico (Tor(X, Y ) = −Tor(Y, X)).
ˆ := ∇ − 1 Tor(·, ·), esto es, ∇
ˆ X Y = ∇X Y −
Paso 2. Definimos ∇
2
1
ˆ también es una conexión ya
Tor(X, Y ), ∀X, Y ∈ X(Q). Entonces ∇
2
que, en general, si a una conexión se le suma un tensor tipo (2, 1), se
obtiene otra conexión.
ˆ es
Paso 3. De la antisimetrı́a del tensor Tor(·, ·) es claro que ∇
simétrica. En efecto,
ˆ XY − ∇
ˆ Y X = ∇X Y − ∇Y X − 1 Tor(X, Y ) + 1 Tor(Y, X)
∇
2
2
= ∇X Y − ∇Y X − Tor(X, Y ) = [X, Y ].
Paso 4. Dado que
ˆ X X = ∇X X − 1 Tor(X, X) = ∇X X,
∇
2
(la última igualdad por la antisimetrı́a de Tor) las geodésicas para
ambas conexiones coinciden. 2
10.7.
Aplicación exponencial
Consideremos una reparametrización arbitraria γ(s) = γ(t(s)) de
una geodésica no constante γ(t). Entonces
¶
µ ¶2
µ
D dt 0
d2 t 0
dt
Dγ 0
Dγ 0
(s) =
γ (t(s)) = 2 · γ (t(s)) +
·
(t(s)).
ds
ds ds
ds
ds
dt
2
d t
Por tanto, γ seguirá siendo una geodésica si y sólo si ds
2 (s) ≡ 0, es
decir, si y sólo si t(s) = a · s + b, a, b ∈ R.
Por otra parte, observemos que si las geodésicas inextensibles γv ,
0
(0) = h ·
γh·v , h ∈ R\{0} verifican γv (0) = γh·v (0), γv0 (0) = v, γh·v
0
v entonces ambas geodésicas tienen la misma imagen y γh·v (s) ≡ h·
γv0 (hs).
10.7. APLICACIÓN EXPONENCIAL
239
Lema 10.7.1 Sea (Q, ∇) una variedad afı́n y consideremos un punto
p ∈ Q. Existe un entorno abierto U de 0 en Tp Q tal que para todo v ∈ U
la (única) geodésica inextensible γv tal que γv0 (0) = v está definida en
t = 1.
La demostración puede consultarse en [O’N, Chapter 3, Lemma 27]2 .
Teorema 10.7.2 Sea (Q, ∇) una variedad afı́n y consideremos un
punto p ∈ Q. Existe un entorno U0 de 0 en Tp Q y un entorno Up
de p en Q tal que la aplicación exponencial
expp : U0 (⊆ Tp Q) → Up (⊆ Q)
v 7→ γv (1)
está bien definida y es un difeomorfismo de U0 en Up .
Esquema de la demostración. Se basa en los siguientes puntos: (1) por
el Lema 10.7.1 la aplicación expp está bien definida en algún abierto
U de 0 ∈ Tp Q; (2) es diferenciable porque está construida a partir de
soluciones de ecuaciones diferenciales; (3) su diferencial en 0,
(d expp )0 : T0 (Tp Q) → Tp Q,
(10.10)
es biyectiva; de hecho, (d expp )0 es, esencialmente, la identidad, con la
identificación natural entre un espacio vectorial y su tangente en un
punto (véase [Subsección 3.2.2, Ejemplo (1)]); (4) como (d expp )0 es
biyectiva, podemos obtener el entorno en cuestión U0 ⊆ U usando el
Teorema de la Función Inversa [Capı́tulo 4, Sección 4.4]. 2
Observaciones:
(1) El Teorema 10.7.2 proporciona un entorno coordenado (Up ,
n
exp−1
p ) que contiene a p ∈ Q (identificando Tp Q con R mediante
cualquier isomorfismo vectorial).
(2) Las geodésicas que pasan por p, escritas en estas coordenadas,
se corresponden con lı́neas rectas que pasan por el origen de Rn . En
particular, esto implica Γkij (p) + Γkji (p) = 0 para todo i, j, k y, si ∇ es
simétrica, Γkij (p) = 0 para todo i, j, k.
Nota. Una discusión clásica en Relatividad General es la del “principio de equivalencia”, según el cual los observadores en caı́da libre
2
Para la idea intuitiva téngase en cuenta que si la geodésica γv puede definirse
en, digamos, t = t0 > 0 entonces la geodésica γt0 v (t) podrá definirse hasta t = 1.
240
CAPÍTULO 10. CONEXIONES AFINES
pueden tomar coordenadas (t, x, y, z) tales que “infinitesimalmente”
(“en primer orden de aproximación”) las leyes de la Fı́sica se escriben
igual que para los observadores inerciales de la Relatividad Especial. La
formulación matemática de este principio es la siguiente. La gravedad
determina una conexión afı́n sobre el espacio-tiempo y, por tanto, sus
geodésicas. Los observadores en caı́da libre seguirán geodésicas de esta
conexión y, si miden cuidadosamente, lo harán usando la aplicación
exponencial. Por ello, en sus coordenadas los sı́mbolos de Christoffel
se anulan a lo largo de esa geodésica con lo que, en primer orden,
considerarán sı́mbolos de Christoffel nulos, igual que si se hallaran en
(Rn , ∇0 ).
Capı́tulo 11
Curvatura
El concepto de curvatura resulta esencial para entender la geometrı́a de
una variedad semi-riemanniana. No obstante, la formulación abstracta
de la curvatura como tensor, aunque muy simple matemáticamente,
resulta muy alejada de la intuición geométrica. Inicialmente, en este
tema se define el tensor curvatura y se estudian sus propiedades algebraicas elementales, incluyendo sus contracciones tı́picas -el tensor de
Ricci y la curvatura escalar- (Secciones 11.1– 11.5), para hacer luego
un breve recorrido intuitivo (Sección 11.6) que justifique el significado
de este tensor.
11.1.
Concepto de curvatura
Sea (Q, g) una variedad semi-riemanniana y ∇(≡ ∇g ) la conexión
de Levi-Civita de g. Definimos el tensor de curvatura como la aplicación:
R : X(Q) × X(Q) × X(Q) → X(Q)
(X, Y, Z) 7→ R(X, Y )Z
que viene dado por la expresión
R(X, Y )Z := ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z.
241
242
CAPÍTULO 11. CURVATURA
Otra manera de expresar el tensor de curvatura es
R(X, Y ) = [∇X , ∇Y ] − ∇[X,Y ] ,
expresión donde queda de manifiesto que R mide la falta de conmutatividad entre ∇X ∇Y y ∇Y ∇X . Señalamos que el término ∇[X,Y ] (que
no aparece si X, Y son campos coordenados) es necesario para que R
sea C ∞ (Q)-lineal en cada una de sus variables. Por tanto, tiene sentido
computar
R(up , vp )wp ∈ Tp Q ∀up , vp , wp ∈ Tp Q.
y considerar a la curvatura como un campo tensorial 3 covariante, 1
contravariante.
En coordenadas locales (U, q 1 , . . . , q n ) el tensor de curvatura adopta
la expresión
R=
n
X
i,j,k,l=1
l
Ri,j,k
dq i ⊗ dq j ⊗ dq k ⊗
∂
,
∂q l
l
donde Ri,j,k
= dq l (R(∂/∂q i , ∂/∂q j , ∂/∂q k )). Teniendo en cuenta que
Ã
Ã
!!
X ∂Γljk
X
X
Γljk ∂l ) =
∇∂i (∇∂j ∂k ) = ∇∂i (
∂ + Γljk
Γm
,
il ∂m
i l
∂q
m
l
l
i
se deduce fácilmente que la expresión de los coeficientes Rjkl
en coordenadas locales es:
i
Rkjl
n
n
X
X
∂ i
∂ i
i
m
= k Γjl − k Γlj +
Γlm Γjk −
Γikm Γm
lj .
∂q
∂q
m=1
m=1
Conviene destacar la dependencia de estos coeficientes respecto de Γkij
y ∂l Γkij , es decir, respecto de gij , ∂k gij y ∂l ∂k gij .
11.2.
Tensor de curvatura 4-covariante
El tensor de curvatura R tiene sentido para cualquier variedad
dotada de una conexión afı́n arbitraria. Sin embargo, como nos restringiremos a conexiones de Levi-Civita, podemos usar la correspondiente métrica g para subir y bajar ı́ndices. Ası́, a partir del tensor de
11.3. CURVATURA SECCIONAL
243
curvatura R podemos obtener un tensor tipo (4, 0) equivalente al anterior sin más que aplicar a R el sostenido ]. Es decir, podemos definir
el campo tensorial
R] : X(Q)4 → C ∞ (Q)
(X, Y, Z, W ) 7→ R] (X, Y, Z, W ) := g(R(X, Y )Z, W ).
Obviamente, para reobtener el tensor de curvatura a partir de éste
basta con subir ı́ndices, [Sección 7, Apéndice 1]. De ahora en adelante
abusaremos de la notación escribiendo también R en lugar de R] .
El tensor de curvatura R presenta las siguientes simetrı́as:
(1) Es un tensor antisimétrico en las dos primeras variables, esto es,
R(X, Y, Z, W ) = −R(Y, X, Z, W ),
∀X, Y, Z, W ∈ X(Q).
(2) Es antisimétrico en las dos últimas variables, esto es,
R(X, Y, Z, W ) = −R(X, Y, W, Z),
∀X, Y, Z, W ∈ X(Q).
(3) Es simétrico dos a dos en las dos primeras variables con las dos
últimas, esto es,
R(X, Y, Z, W ) = R(Z, W, X, Y ),
∀X, Y, Z, W ∈ X(Q).
(4) Verifica la primera identidad de Bianchi, esto es,
R(X, Y )Z + R(Z, X)Y + R(Y, Z)X = 0,
11.3.
∀X, Y, Z, W ∈ X(Q).
Curvatura seccional
Sea (Q, g) una variedad semi-riemanniana y consideremos un plano
tangente a dicha variedad Π = Gen{u, v} ⊆ Tp Q tal que g |Π sea no
degenerada.
Definición 11.3.1 La curvatura seccional Ks del plano Π se define
como
R(u, v, v, u)
.
(11.1)
Ks (Π) =
g(u, u)g(v, v) − g(u, v)2
244
CAPÍTULO 11. CURVATURA
Observaciones:
(1) La expresión (11.1) se simplifica si tomamos u, v tales que formen una base ortonormal de Π, ya que en este caso el denominador
pasa a ser ±1.
(2) Cuando g |Π es euclı́dea el denominador coincide con el cuadrado
del área del paralelogramo generado por u, v. En efecto, si α(u, v) es
el ángulo formado por u y v entonces
g(u, u)g(v, v) − g(u, v)2 = kuk2 kvk2 − kuk2 kvk2 cos2 (α(u, v))
= kuk2 kvk2 sen2 (α(u, v)).
Además, si g es riemanniana entonces g |Π es no degenerada para
cualquier plano Π.
(3) El valor de la curvatura seccional de un plano Π es independiente
de los vectores u, v elegidos. En efecto, si u = au + bv y v = cu + dv
con ad − bc 6= 0 entonces
R(u,v,v,u)
(ad−bc)2 R(u,v,v,u)
=
2
g(u,u)g(v,v)−g(u,v)
(ad−bc)2 (g(u,u)g(v,v)−g(u,v)2 )
R(u,v,v,u)
= g(u,u)g(v,v)−g(u,v)2 .
(4) La curvatura seccional Ks (Π) para todo plano no degenerado Π
tangente a Q en p determina el tensor de curvatura R en p. Por tanto,
resulta equivalente conocer R y Ks (véase, v. gr., [Sp1, Chapter 4D,
Proposition 8] o [O’N, pág. 79]).
11.4.
Tensor de Ricci
Sea (Q, g) una variedad semi-riemanniana y R su tensor de curvatura. Para cada Y, Z ∈ X(Q) consideramos el campo de endomorfismos
p 7→ R(·, Yp )Zp , siendo
R(·, Yp )Zp : Tp Q → Tp Q
Xp 7→ R(Xp , Yp )Zp .
Definición 11.4.1 Se define el tensor de Ricci de (Q, g) como el tensor (2, 0)
Ric : X(Q) × X(Q) → C ∞ (Q)
(Y, Z) 7→ Ric(Y, Z),
11.5. CURVATURA ESCALAR
245
definido por
Ric(Y, Z) : Q → R
p 7→ traza R(·, Yp )Zp .
Si se computa esta traza en términos de la métrica se obtiene:
Ric(Y,
:= traza R(·, Yp )Zp P
Pn Z)(p)
ij
= i,j=1 g g(R(∂i , Yp )Zp , ∂j ) = ni,j=1 g ij R(∂i , Yp , Zp , ∂j ).
Propiedades:
(1) El tensor de Ricci es simétrico, esto es, Ric(Y, Z) = Ric(Z, Y )
(esto es fácil de comprobar a partir de las simetrı́as de R, véase
la Sección 11.2). Además, salvo signo es el único tensor (2, 0) no
nulo que se obtiene como contracción del tensor de curvatura.
(2) En el caso riemanniano la “media” de las curvaturas seccionales
de todos los planos que contienen a vp ∈ Tp Q − {0} es
1 Ric(vp , vp )
.
n − 1 g(vp , vp )
(11.2)
La propiedad (2) se formula con más precisión como sigue. Sea Bp =
(e1 , . . . , en ) una base ortonormal de Tp Q con e1 = vp /kvp k, y sean Πi ,
i ≥ 2 los planos tangentes generados por e1 y ei . Entonces se tiene
Ric(vp ,vp ) = Ric(e , e ) = Pn R(e , e , e , e )
1 1
i 1 1 i
i=1
g(vp ,vp )
Pn
P
R(ei ,e1 ,e1 ,ei )
= i=2 g(ei ,ei )g(e1 ,e1 )−g(e1 ,ei )2 = ni=2 Ks (Πi ),
donde en la penúltima igualdad se ha usado que g(ei , ei )g(e1 , e1 ) −
g(ei , e1 )2 = 1, i = 2, . . . , n. Por tanto, al dividir por n − 1 se obtiene
la media de las curvaturas seccionales de los planos Π2 , . . . , Πn para
cualquier elección ortogonal de (e2 , . . . , en ).
11.5.
Curvatura escalar
Dado que el tensor de Ricci de una variedad semi-riemanniana
(Q, g) es de tipo (2, 0), su contracción métrica tiene sentido (véase
[Tema 7, Apéndice 1]).
246
CAPÍTULO 11. CURVATURA
Definición 11.5.1 Se define la curvatura escalar S de (Q, g) como la
contracción métrica de su tensor de Ricci.
En coordenadas (U, q 1 , . . . , q n ) la curvatura escalar en p adopta la expresión
n
X
S(p) =
g ij (p)Ric(∂i |p , ∂j |p ), ∀p ∈ U.
i,j=1
Ası́, si {e1 , . . . , en } es una base ortonormal de Tp Q y g es riemanniana
entonces
n
X
Sp ≡ S(p) =
Ric(ei , ei )p .
i=1
Por tanto, en este caso n1 Sp es una “media” de las curvaturas de Ricci
en p. Ahora bien, como (11.2) es la media de las curvaturas seccionales
de los planos que contienen a vp , en el caso riemanniano la expresión
1
Sp
n(n − 1)
puede entenderse como la media de las curvaturas seccionales de todos
los planos contenidos en p.
Nota. Las definiciones del tensor de curvatura (3,1) y del tensor de
Ricci tienen sentido para cualquier conexión afı́n ∇ (no necesariamente
de Levi-Civita). Sin embargo, tanto la curvatura seccional como la
escalar precisan de la métrica g para su definición.
11.6.
Significado de la curvatura
Aunque la construcción algebraica de R, Ric y S es simple, su
significado geométrico no es obvio, y tiene detrás una larga historia
de desarrollos matemáticos. En esta sección intentaremos dar un breve
apunte de su significado. Para fijar ideas nos restringiremos en esta
sección a una métrica g riemanniana.
11.6.1.
Orı́genes geométricos
Sea γ : I → R2 una curva plana unitaria (kγ 0 (t)k = 1). A continuación, consideremos la circunferencia tangente a dicha curva en γ(t0 )
11.6. SIGNIFICADO DE LA CURVATURA
247
que mejor se aproxime a ella, esto es, aquélla que, parametrizada como
curva unitaria, tenga velocidad y aceleración coincidentes con las de γ
en γ(t0 ). Se define la curvatura C(γ(t0 )) de γ en γ(t0 ) como 1/r siendo
r el radio de dicha circunferencia. Obsérvese que, como g0 (γ 0 (t), γ 0 (t))
es constante, se tiene 2g0 (γ 00 (t), γ 0 (t)) = 0, es decir, γ 00 (t)⊥γ 0 (t), ∀t. El
centro de la circunferencia que más se aproxima queda entonces sobre
la recta que pasa por γ(t0 ) con vector director γ 00 (t0 ), y su radio es
r = 1/kγ 00 (t0 )k. Como caso lı́mite, la curvatura se define como 0 si
γ 00 (t0 ) = 0 (r = ∞). 1
Observación. Esta definición de curvatura se extiende fácilmente al
caso de curvas en R3 . En este caso, aunque la curva unitaria γ : I →
R3 no esté contenida en un plano, el plano afı́n que pasa por γ(t0 )
generado por γ 0 (t0 ) y γ 00 (t0 ) es el que más se aproxima a γ en γ(t0 ).
Ası́, puede definirse la curvatura de γ en t0 como kγ 00 (t0 )k, y mantenerse
su interpretación como inversa del radio de circunferencia que más se
aproxima a γ en γ(t0 ).
Figura 24
Consideremos a continuación una superficie S incluida en R3 . Nuestro objetivo ahora será definir su curvatura en un punto p ∈ S. Sea
vp ∈ Tp S un vector unitario y sea γvp la geodésica en S con velocidad
1
Estas afirmaciones no son difı́ciles de demostrar. En cualquier caso, para todo
3
lo referente a curvatura de curvas y superficies en R remitimos al libro clásico de
M.P. do Carmo [dC2]
248
CAPÍTULO 11. CURVATURA
inicial vp . Considerando a γvp como una curva en R3 , puede demostrarse
que su aceleración en p es perpendicular a Tp S, por ser una geodésica
en S. Obviamente, podemos aplicar la definición anterior para calcular
C(γvp (t0 )) = 1/r. Además, usando que la curva está contenida en S,
es posible asociar un signo a la curvatura como sigue. Escojamos un
vector unitario Np normal a la superficie en p (Np ∈ Tp R3 es ortogonal
a Tp S). El centro Ovp de la circunferencia estará en la recta que pasa
por p con vector director Np , concretamente o en p + rNp o en p − rNp .
En el primer caso, consideraremos a la curvatura con signo positivo y,
en caso contrario, negativo. Esto es, definimos:
Figura 25
½
C
Np
(γvp (t0 )) =
kγv00p (t0 )k
−kγv00p (t0 )k
si Ovp = p + rNp
si Ovp = p − rNp .
Nota. Aunque en una superficie no orientable de R3 (como la cinta de
Möebius) no existe un campo normal globalmente definido N , sı́ podemos definir un vector normal en cada punto y, por tanto, mantener la
anterior definición punto a punto.
Calculemos la curvatura con signo de todas las geodésicas unitarias
contenidas en S que pasan por p. Existirán dos direcciones tales que
estas curvaturas sean máxima y mı́nima. Denotemos entonces a estas
curvaturas principales como:
Cmax = Max{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1}
Cmin = Min{C Np (γvp (t0 )) : vp ∈ Tp S, kvp k = 1}.
11.6. SIGNIFICADO DE LA CURVATURA
249
Obsérvese que Cmax , Cmin se calculan “extrı́nsecamente” a S, esto es,
viendo a S somo una superficie dentro de R3 , por lo que no tienen
un significado “intrı́nseco” (calculable a partir de la geometrı́a de S
como variedad riemanniana). Además, Cmax , Cmin también dependen
del normal Np escogido –aunque su producto es independiente de éste.
Por otra parte, como S es una variedad riemanniana de dimensión
2 (con la métrica inducida de la usual de R3 ), cada punto p ∈ S tiene
asociada una única curvatura seccional KS (p) = Ks (Πp ) correspondiente al único plano Πp = Tp S contenido en el espacio tangente a p
(véase la Sección 11.3). Pues bien, ambas curvaturas se relacionan de
la siguiente manera (Teorema Egregium de Gauss):
Para toda superficie S ⊂ R3 se verifica
KS (p) = Cmin · Cmax ,
donde KS (p)(:= Ks (Tp S)) denota la curvatura seccional de
S en p.
Es decir, el producto de las curvaturas principales de una superficie
S ⊂ R3 en cada punto p es una propiedad intrı́nseca a la superficie,
computable exclusivamente del valor de la métrica sobre ella y, de
hecho, igual a KS (p).
Por ejemplo, en cualquier punto de la esfera de radio r se tiene
Cmax = Cmin = 1r y, por tanto, KS ≡ r12 . Para el cilindro de radio de la
base a, se tiene Cmax = 1/a y Cmin = 0, luego KS ≡ 0.
Estudiemos ahora el caso más general en que (Q, g) es una variedad
riemanniana n-dimensional. Sea Πp un plano de Tp Q y consideremos
un abierto U0 ⊆ Tp Q tal que expp : U0 ⊆ Tp Q → Up ⊆ Q es un difeomorfismo. Consideremos la superficie S = expp (Πp ∩ U0 ) que contiene
a p. Se puede demostrar entonces que la curvatura seccional Ks (Πp )
coincide con la curvatura de S en p con la métrica restringida2 , KS (p).
Ası́, el tensor de curvatura R en cada punto p “contiene la información” de todas las curvaturas en p de todas las superficies que podemos
construir de este modo. Recı́procamente, estas curvaturas determinan
al tensor curvatura, pues a partir de la curvatura seccional Ks (Πp ) de
cada uno de los planos Πp tangentes a p es posible determinar el tensor
de curvatura R en p (véase la Sección 11.3).
2
Esto se mantiene válido si g es semi-riemanniana y el plano Πp no degenerado.
250
CAPÍTULO 11. CURVATURA
Extrı́nseco
Extrı́nseco
Extrı́nseco
l
Intrı́nseco
Intrı́nseco
Intrı́nseco
Intrı́nseco
11.6.2.
Curvatura de curvas C(γ(t0 ))
Curvatura (con signo) de curvas en una superficie S ⊂ R3 con un normal fijado; curvaturas principales Cmin , Cmax
Producto de curvaturas máxima y mı́nima
de S en p
l T. Egregium
Curvatura seccional KS (p) = Ks (Tp S)
Curvatura seccional de variedades riemannianas bidimensionales KS (p) = Ks (Πp ),
para el único plano Πp = Tp S
Curvatura seccional de cada plano tangente a una variedad riemanniana Ks (Πp ),
Πp ⊂ Tp Q, que coincide con la de la subvariedad riemanniana bidimensional S =
expp (Πp ) en p
Tensor curvatura R (que equivale a Ks (Πp )
para todo Πp )
Cómo la curvatura determina la métrica
Una vez estudiado el origen del tensor de curvatura, conviene entender cómo la curvatura determina la métrica. De nuevo, nos restringiremos a una variedad riemanniana (Q, g) aunque, esencialmente, lo que
sigue también valdrá para una variedad semi-riemanniana arbitraria:
Resultado 1. “La curvatura es una segunda derivada de la métrica”. Sea p ∈ Q y consideremos coordenadas normales (q 1 , . . . , q n ) asociadas a expp : U0 ⊆ Tp Q → Up ⊆ Q, siendo expp |U0 un difeomorfismo
y U0 un abierto estrellado,
gij (p) = δij
y Γkij (p) = 0,
∀i, j, k ∈ {1, . . . , n}.
(11.3)
Como q 1 (p) = · · · = q n (p) = 0, se verifica el siguiente desarrollo de
Taylor de gij :
1
gij (q 1 , . . . , q n ) = δij + Rijkl (p)q k q l + O(kqk3 ).
3
11.6. SIGNIFICADO DE LA CURVATURA
251
Para ello basta con tener en cuenta la expresión de los sı́mbolos de
Christoffel en términos de la métrica y usar (11.3) (véase [Sa, Chapter
II, Proposition 3.1]).
Resultado 2. “La curvatura determina la métrica”. Sean g, g 0 dos
0
métricas riemannianas sobre una variedad conexa Q. Si Rg = Rg sobre
todo Q y gp = gp0 en un punto p ∈ Q entonces g = g 0 .3 Por supuesto,
dos variedades isométricas (Q, g), (Q0 , g 0 ) (Sección 7.5) tienen “iguales
curvaturas” R, R0 ; esto es, al inducir mediante la isometrı́a F : Q →
Q0 el tensor curvatura R de Q en Q0 se obtiene R0 , o:
R0 (dFp vp , dFp wp )dFp up ) = dFp (R(vp , wp )up ),
para todo vp , wp , up ∈ Tp Q, ∀p ∈ Q.
Resultado 3. “La curvatura mide cuánto se aleja localmente una
geometrı́a de la de Rn ”. Existen diversos resultados en esta dirección.
Como un ejemplo sencillo, sea (Q, g) una variedad riemanniana con
R ≡ 0. Entonces para cada p ∈ Q existen coordenadas (Up , q 1 , . . . , q n )
tales que g(∂/∂q i , ∂/∂q j ) = δij en todo Up ; esto es, la carta coordenada
ϕ : Up → ϕ(Up ) ⊂ Rn es una isometrı́a. Este resultado se puede ver
como un caso muy particular, o bien del Resultado 2 anterior, o bien
de un Teorema clásico de Cartan (véase, p. ej., [Sa, II, Theorem 3.2]).
Ası́, curvatura nula implica “localmente isométrico” a Rn (pero no
globalmente, piénsese en el cilindro).
Resultado 4. “Geometrı́as no-euclı́deas modelo”. Se definen los
siguientes espacios modelo de curvatura constante C y dimensión n:
(i) Para C = 0, Rn .
(ii) Para C > 0, la esfera
Sn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 :
g0 ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = r2 },
√
con r = 1/ C, siendo g0 la métrica riemanniana usual de Rn+1
y la métrica de Sn (r) la inducida.
(iii) Para C < 0, el espacio hiperbólico
Hn (r) = {(x1 , . . . , xn+1 ) ∈ Rn+1 :
gL ((x1 , . . . , xn+1 ), (x1 , . . . , xn+1 )) = −r2 , xn+1 > 0}
3
Véase v.gr. 1.7.18 en J.A. Wolf, “Spaces of constant curvature”, Mc Graw-Hill
Co. NY (1967).
252
CAPÍTULO 11. CURVATURA
√
con r = 1/ −C, siendo gL la métrica lorentziana usual de Rn+1
y la de Hn la inducida (que es riemanniana). Ası́, por ejemplo,
para n = 2 se tiene4
H2 (r) = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 = −r2 , z > 0},
p
esto es, z = r2 + x2 + y 2 .
Teorema 11.6.1 Toda variedad riemanniana (Q, g) de curvatura constante C es localmente isométrica al espacio modelo de esa misma curvatura. Si, además, Q es
11.6.3.
Ecuación de Jacobi
Justifiquemos a continuación que la curvatura se halla ı́ntimamente
relacionada con la velocidad con la que las geodésicas se aproximan o
se separan entre sı́. En efecto, consideremos una variedad riemanniana
(Q, g) y sea γ : [0, 1] → Q una geodésica con kγ 0 k = 1. Consideremos
una variación de γ por geodésicas, esto es, una aplicación diferenciable
] − ², ²[×[0, 1] → Q
(s, t) 7→ γs (t)
(11.4)
tal que
(i) γ0 = γ, y
(ii) γs es una geodésica para cada s.
Para esa variación se define el campo variacional asociado, o campo de
Jacobi, como el campo sobre γ
J(t) =
d
|s=0 γs (t).
ds
En ocasiones se dice que J(t) es la “variación infinitesimal” de γ ante
la variación (“finita”) (11.4), escribiéndose δγ(t) en lugar de J(t). Se
expresa ası́ que J(t) mide, hasta primer orden, cómo se desvı́an las
+
Este espacio es isométrico al famoso semiplano de Poincaré (R × R , g =
(dx2 + dy 2 )/y 2 ).
4
11.6. SIGNIFICADO DE LA CURVATURA
253
geodésicas próximas a una dada. Se puede comprobar que el campo de
Jacobi J(t) verifica la ecuación
D2 J
+ R(J, γ 0 )γ 0 = 0,
dt2
2
que se conoce como ecuación de Jacobi. Por tanto, el término g( Ddt2J , J)
está ı́ntimamente relacionado con la curvatura seccional del plano Πt =
Gen{γ 0 (t), J(t)}, ya que, vı́a la ecuación de Jacobi, se tiene
g(
D2 J
, J) = −g(R(J, γ 0 )γ 0 , J) = −Ks (Πt )(g(γ 0 , γ 0 )g(J, J) − g(γ 0 , J)2 ).
dt2
Ası́, si la curvatura seccional es positiva (y g es riemanniana) las
geodésicas próximas tenderán a juntarse más que en el espacio euclı́deo (Rn , h·, ·i), y si es negativa, tenderán a separarse más que en
dicho espacio.
Esta interpretación puede extenderse al Ricci. Si, por ejemplo, en
lugar de suponer que la curvatura seccional sea positiva suponemos
sólo que el tensor de Ricci sea definido positivo, entonces las geodésicas
próximas a γ se acercarán “en promedio” más que en Rn , aunque eventualmente puede haber direcciones con Ks (Πt ) < 0 y en las que las
geodésicas próximas se alejen más.
11.6.4.
Otras propiedades
Existen otras propiedades que caracterizan la curvatura. Ası́, por
ejemplo, sea (Q, g) una variedad riemanniana y Πp un plano incluido
en Tp Q. Consideremos expp : Πp ∩ U0 → S ⊂ Q de manera que S sea
una superficie. Consideremos en Πp ∩ U0 la circunferencia centrada en
0 y de radio r. Sea Cr la imagen de esa circunferencia por expp , cuya
longitud L(Cr ) se computa usando la métrica g. Entonces:
limr→0
π
2πr − L(Cr )
=
Ks (Πp ).
r3
3
(11.5)
Por otra parte, en el Tema 8 se muestra que la métrica g permite
introducir una medida (área en dimensión 2, volumen en dimensión 3)
de cualquier subconjunto abierto o cerrado de (Q, g) (véase también la
nota al final de la Sección ??). Si denotamos por A0 (r) = πr2 y A(r)
254
CAPÍTULO 11. CURVATURA
a las áreas de la circunferencia usual de radio r (en Tp Q) y de Cr en
expp (Πp ∩ U0 ), respectivamente, se verifica:
Ks (Πp ) = limr→0 12
A0 (r) − A(r)
.
r2 A0 (r)
(11.6)
Grosso modo, a mayor curvatura menor longitud y área que las esperadas en Rn .
Las fórmulas (11.5) y (11.6) permiten conocer si el espacio está curvado en un punto p a partir de “mediciones infinitesimales de longitud
y área alrededor de p”. Ası́, los eventuales habitantes de un espacio
curvado podrán percatarse de su curvatura a partir de mediciones de
longitudes y áreas.
Capı́tulo 12
Algunas notas sobre
Relatividad
En este capı́tulo se describen muy brevemente los ambientes matemáticos de la Relatividad Especial y General. Mostraremos cómo los diferentes objetos geométricos introducidos encajan en el marco de la Relatividad, resultando imprescindible toda la maquinaria matemática
estudiada para el caso de la Relatividad General. Sin mayores pretensiones, nuestro objetivo es doble: ayudar a conectar los diferentes
lenguajes fı́sico y matemático que aparecen en la literatura sobre Relatividad, y estimular la curiosidad e interés rigurosos por esta teorı́a.
12.1.
Relatividad Especial
12.1.1.
Espacios vectoriales lorentzianos
Recordemos que todo espacio vectorial lorentziano (V, h·, ·i) de dimensión n + 1 es isométrico al espacio de Lorentz-Minkowski Ln+1 ,
que se define como Rn+1 dotado con la métrica usual lorentziana η ≡
(−, +, . . . , +). Denotaremos por (t = x0 , x1 , . . . , xn ) a las coordenadas
usuales de Ln+1 , por lo que en ellas se tiene:
η00 = −1,
ηij = δij ,
255
∀i, j ∈ {1, . . . , n}.
256
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
El caso de mayor
p interés fı́sico es, por supuesto, n = 3. De ahora
en adelante a |hv, vi| lo denotaremos por kvk, aunque no verifica,
obviamente, las propiedades de una norma. Diremos que un vector
v ∈ V es:


hv, vi < 0
temporal






hv, vi = 0, v 6= 0
luminoso
si
hv, vi ≤ 0, v 6= 0
causal






espacial
hv, vi > 0 ó v = 0.
No es difı́cil comprobar (obsérvese la Figura 26 para L3 ) que los
vectores causales de (V, h·, ·i) junto con el vector v = 0 forman dos
conos. Si elegimos uno de estos conos C ↑ y lo llamamos cono futuro,
diremos que el espacio vectorial lorentziano está orientado temporalmente, y al otro cono C ↓ se le llama cono pasado. En Ln+1 elegimos
como cono futuro al superior, esto es, C ↑ = {a = (a0 , . . . , an ) ∈ Ln+1 :
ha, ai ≤ 0, a0 ≥ 0}.
Figura 26
Fijada una variedad lorentziana (Q, g), a una elección “continua”
de un cono para cada Tp Q (isométrico a Ln+1 , aunque no de modo
12.1. RELATIVIDAD ESPECIAL
257
canónico) se le llama una orientación temporal de la variedad. Una
variedad lorentziana que admita una orientación temporal (no todas
la admiten) se dice que es temporalmente orientable. Si Q es conexa
y temporalmente orientable, tal orientación temporal estará fijada por
la elección del cono en un punto cualquiera p ∈ Q.
Llamamos transformaciones de Lorentz en Ln+1 a cada una de sus
isometrı́as vectoriales, esto es, a los isomorfismos vectoriales f : Ln+1 →
Ln+1 que verifican η(u, v) = η(f (u), f (v)), ∀u, v ∈ Ln+1 . Esto equivale
a que f aplique bases ortonormales en bases ortonormales de manera
ordenada. Matricialmente, esta condición se reduce a
(ηij ) = At · (ηij ) · A,
(12.1)
donde ηij = η(vi , vj ) y
A = M (f, B) = (f (v0 ), f (v1 ), . . . , f (vn )),
donde cada f (vi ) se escribe por columnas y B = (v0 , . . . , vn ) es cualquier base ortonormal de Ln+1 .
Conviene señalar que, en general, las transformaciones de Lorentz
no conservan la elección hecha para los conos temporales, esto es, tal
vez f (C ↑ ) = C ↓ . A una transformación de Lorentz que sı́ respete los
conos temporales, esto es, tal que f (C ↑ ) = C ↑ (y, por tanto, f (C ↓ ) =
C ↓ ) se le llama ortocrona. Si, además, det f > 0 entonces se dice que
es propia.
Claramente, el conjunto de las transformaciones de Lorentz junto
con la operación de composición tiene una estructura de grupo. El
estudio de las isometrı́as vectoriales de un espacio vectorial lorentziano
(V, h·, ·i) de dimensión n+1 equivale al estudio de las transformaciones
de Lorentz de Ln+1 .
12.1.2.
El grupo de Lorentz
El estudio de las transformaciones de Lorentz equivale al de las matrices que verifican (12.1). Ası́ llamamos grupo de Lorentz de dimensión
n + 1 a:
O1 (n + 1) = {A ∈ Gl(n + 1, R) : At (ηij )A = (ηij )}.
Retomando la subsección anterior, es inmediato ahora comprobar que
una transformación de Lorentz f con matriz en una base ortonormal
258
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
A ∈ O1 (n + 1) y elementos (aij ), i, j ∈ {0, 1, . . . , n} será ortocrona si y
sólo si a00 > 0. Además, como η(e0 , e0 ) = −1 y
−1 = η(f (e0 ), f (e0 )) =
−(a00 )2
+
n
X
(a0i )2 ,
i=1
necesariamente se tiene que |a00 | ≥ 1. Denotamos por O1↑ (n + 1) (resp.
O1+ (n+1), O1+↑ (n+1)) al subgrupo de O1 (n+1) formado por las matrices con a00 ≥ 1 (resp. det A = 1, que verifican ambas condiciones). Para
cualquier espacio vectorial lorentziano (V, h·, ·i) las isometrı́as vectoriales de V se corresponden, fijada una base ortonormal, con los elementos
de O1 (n + 1).
En el caso n = 1 el grupo de Lorentz puede computarse explı́citamente con facilidad, obteniéndose:
½µ
¶
¾
² · cosh θ ν · senh θ
O1 (2) =
: θ ∈ R, ², ν ∈ {1, −1} . (12.2)
² · senh θ ν · cosh θ
Ejercicio. Demuéstrese (12.2).
Obsérvese que si ² = ν = 1 entonces las correspondientes transformaciones son ortocronas propias, esto es, pertenecientes a O1+↑ (2).
Adicionalmente, podemos usar la siguiente expresión para las matrices
en O1+↑ (2):
µ
cosh θ senh θ
senh θ cosh θ
¶
µ
= cosh θ ·
1
tagh θ
tagh θ
1
¶
.
Usando entonces que cosh2 θ − senh2 θ = 1 y definiendo v = tagh θ, que
verifica |v| < 1, obtenemos
½
O1+↑ (2)
=
1
√
1 − v2
µ
1 v
v 1
¶
¾
: v ∈] − 1, 1[ .
(12.3)
Con más generalidad, no es difı́cil demostrar que si f es una transformación de Lorentz de (V, h·, ·i) y Π es un subespacio invariante por
f (esto es, f (Π) ⊆ Π) entonces el subespacio ortogonal a Π (es decir,
Π⊥ = {v ∈ V : hv, wi = 0, ∀w ∈ Π}) también lo es (f (Π⊥ ) ⊆ Π⊥ ). Ello
permite dar la siguiente definición:
12.1. RELATIVIDAD ESPECIAL
259
Definición 12.1.1 Sea f una isometrı́a de un espacio vectorial lorentziano (V, h, i) de dimensión n + 1. Diremos que f es una transformación de Lorentz pura o “boost” (resp. isometrı́a espacial pura) si f
admite un subespacio Π invariante por f que verifica: tiene dimensión
2 (resp. dimensión n), la métrica restricción g |Π es lorentziana (resp.
euclı́dea) y la restricción de la isometrı́a al subespacio ortogonal f |Π⊥
es la identidad.
En dimensión 4 se puede demostrar que para toda transformación de
Lorentz propia ortocrona f existe un “boost” f1 y una isometrı́a espacial pura f2 tales que
f = f1 ◦ f2 .
Además, al ser f2 esencialmente una isometrı́a vectorial (y que conserva
la orientación) en un espacio vectorial Π de dimensión 3, f2 restringido
a alguna recta R ⊂ Π es la identidad, por lo que f2 puede considerarse
como una rotación pura en el plano P ⊂ Π ortogonal a R. Esto es,
“f se puede escribir como composición de un “boost” y una rotación”
–aunque el plano espacial P en el que transcurre la rotación no es
necesariamente ortogonal al plano temporal en el que transcurre el
“boost”. Ası́, muchas de las propiedades más caracterı́sticas de las
transformaciones de Lorentz se pueden estudiar en dimensión 2.
12.1.3.
L4 como modelo de espaciotiempo
Reflexionemos en primer lugar sobre por qué el plano fı́sico admite como modelo matemático al plano euclı́deo R2 ≡ (R2 , dx21 + dx22 ).
Esencialmente, esto significa:
(a) El plano fı́sico P admite una estructura de variedad riemanniana
(o de espacio afı́n euclı́deo) de dimensión 2 que es isométrica
a R2 .
(b) Existe una manera fı́sica de construir una tal isometrı́a I : P →
R2 . A la postre, digamos: se puede “fijar un origen, unos ejes
ortogonales y unidades” en el plano fı́sico y “proyectar” cada
punto sobre los ejes coordenados, obteniendo ası́ el elemento deseado de R2 .
260
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
Es de señalar que esta isometrı́a no es única. Sin embargo, si fijamos
una entonces podemos trabajar indistintamente con P ó R2 . Además,
cuando se tienen dos de tales isometrı́as I, I 0 : P → R2 existe una
isometrı́a R de R2 tal que I 0 = R ◦ I; esto es, todo el estudio se acaba
reduciendo al de R2 .
En Relatividad Especial se postula que el conjunto de todos los
eventos (o sucesos “aquı́-ahora”) del espaciotiempo admite como modelo fı́sico al espacio de Minkowski L4 con su orientación temporal
futura. La necesidad de este postulado se puede comprobar a posteriori, ya que permite modelar la constancia de la velocidad de la luz.
Como en el caso del plano fı́sico tal postulado significa:
(a) El espaciotiempo como conjunto de sucesos admite una estructura de variedad lorentziana (Q, g) (o de espacio afı́n lorentziano)
de dimensión 4 y orientada temporalmente que es isométrica a L4
(mediante una isometrı́a que respeta los conos futuros, es decir,
una isometrı́a ortocrona).
(b) Existe una manera fı́sica de construir esa isometrı́a.
Sin embargo, (b) resulta ahora menos intuitivo y precisa de discusiones
fı́sicas. Resumiendo, se admite que dicha isometrı́a se construye usando
la existencia de observadores inerciales en el espaciotiempo (Q, g). Cada uno de estos observadores describe una geodésica (recta afı́n) r(t)
tal que r0 (t) pertenece al cono futuro y g(r0 (t), r0 (t)) = −1. En cada
instante t0 el observador percibe como espacio en reposo el hiperplano
afı́n Π(t0 ) que es ortogonal a r(t) en r(t0 ). Este hiperplano podrá considerarse entonces como una variedad riemanniana (o un espacio afı́n
euclı́deo) isométrica a R3 (Figura 27).
Si nos restringimos a una dimensión espacial, una vez que el observador fija la isometrı́a dicho observador “se ve a sı́ mismo” como
una recta con vector director e0 = (1, 0) de L2 , siendo su “espacio
en reposo” una recta de vector director e1 = (0, 1). Otro observador
será visto por el primero como otra recta de vector director temporal
e00 ∈ C ↑ , y tendrá como espacio en reposo una recta distinta con vector
director e01 que será ortogonal a e00 . La matriz de cambio de base entre
(e0 , e1 ) y (e00 , e01 ) pertenecerá a O1↑ (2).
12.1. RELATIVIDAD ESPECIAL
261
Figura 27
12.1.4.
La constancia de la velocidad de la luz
En la aceptación histórica de Ln+1 , n = 3, como modelo del espaciotiempo en Relatividad Especial, el problema de la velocidad de la luz,
que comentaremos brevemente, representó un papel central. Por simplicidad puede suponerse n = 1, aunque los desarrollos matemáticos
que siguen pueden extenderse para un n arbitrario.
En contra de la intuición newtoniana clásica, tanto argumentos teóricos
como evidencias experimentales sugerı́an postular que la velocidad de
la luz es finita y la misma para todos los observadores (inerciales). Los
argumentos teóricos se basaban en los siguientes tres hechos:
(1) las ecuaciones de Maxwell proporcionan la velocidad de la luz
-o de cualquier onda electromagnética- con respecto a su medio de
propagación (no respecto a la fuente que la origina),
(2) la luz se propaga en el vacı́o y
(3) el vacı́o parece ser el mismo para todos los observadores inerciales.
Ası́, la velocidad de la luz respecto al vacı́o predicha por las ecuaciones
262
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
de Maxwell debı́a ser la misma que midieran todos los observadores
inerciales, independientemente de su movimiento relativo. La evidencia experimental de este hecho se halló con el célebre experimento de
Michelson-Morley.
En el marco de la Mecánica Newtoniana, la existencia de esta velocidad c igual para todos los observadores resultaba absurda: si un
observador inercial mide como velocidad de la luz c, otro observador
inercial que se mueva a una velocidad v respecto al primero en la dirección y sentido de propagación de la luz deberı́a medir como velocidad
de la luz c − v. Veamos cómo esta velocidad de propagación constante
(digamos c = 1, en unidades apropiadas) es modelable en Relatividad
Especial.
Supongamos, como al final de la subsección anterior, que se tienen
dos observadores inerciales, el primero de los cuales toma coordenadas
de modo que describe al espaciotiempo como Ln+1 , y la recta que él
mismo describe se corresponde con r(t) = t(1, 0) (≡ t(1, 0, . . . , 0)),
siendo e0 ≡ r0 (0) = (1, 0). Supondremos por simplicidad que la recta
s que describe el segundo observador corta a r en el origen, esto es,
se escribe en las coordenadas del primero como s(t) = te00 , siendo
e00 = (t0 , x0 ) ∈ C ↑ cualquier vector temporal unitario que apunte al
futuro.
La n-upla v = x0 /t0 se interpreta (bien como definición matemática,
bien como postulado fı́sico) como la velocidad del observador asociado
a e00 medida por el observador e0 . Ahora bien, como −1 = η(e00 , e00 ) =
−t20 + kx0 k2 se tiene kvk2 = 1 − 1/t20 y, por tanto, esta velocidad es
siempre menor que 1.
Sea ahora u = (u0 , u1 ) ∈ C ↑ un vector luminoso (u0 > 0, ku1 k =
|u0 |). El cociente v = u1 /u0 verifica kvk = 1 al ser 0 = η(u, u) =
u20 −u21 . Este hecho es de vital importancia para nuestro modelo, porque
permite postular que las trayectorias de los rayos de luz se describen
mediante geodésicas (rectas afines) luminosas de L4 que apuntan al
futuro: cualquier observador inercial medirá como velocidad de esa
geodésica en sus coordenadas v = u1 /u0 de modo que siempre kvk = 1.
Más aún, como demostró el propio Einstein, la descripción unificada
~ y magnético B
~ como componentes de una
de los campos eléctrico E
2-forma diferencial (véase la Subsección 6.2.1) permite una descripción
sencilla de las ecuaciones de Maxwell y de todo el electromagnetismo.
12.1. RELATIVIDAD ESPECIAL
12.1.5.
263
Algunas consecuencias del modelo
Admitiendo L4 como modelo del espaciotiempo, debemos ser consistentes con él. Ello provoca algunas consecuencias que inicialmente
pueden resultar sorprendentes. Históricamente, la más conocida de ellas es la identidad entre masa (en reposo) y energı́a, a través de la
famosa ecuación de Einstein E = mc2 . Podemos intuir la necesidad de
una relación de este tipo porque para una partı́cula en movimiento, el
momento p~ = (px , py , pz ) y la energı́a E medidos por un observador
inercial no pueden tener un significado intrı́nseco (no se transforman
separadamente como las coordenadas de ningún tensor sobre L4 ). Resulta ası́ natural postular que no son más que componentes de un
vector (E, p~). El escalar h(E, p~), (E, p~)i precisa entonces de alguna interpretación fı́sica, y diversos análogos con la energı́a cinética clásica
hacen natural postular h(E, p~), (E, p~)i = −m2 (≡ −m2 c4 ), siendo m la
masa que medirı́a un observador para el que la partı́cula estuviera en
reposo. Describimos brevemente a continuación otras consecuencias,
éstas puramente geométricas.
Dilatación del tiempo. Supongamos que los observadores e00 y e0
asignan coordenadas (T 0 , 0) y (T, X), respectivamente, al evento P ,
con T 0 > 0 (Figura 28).
Entonces, aplicando la métrica η al vector OP obtenemos η(OP , OP ) =
−(T 0 )2 para el observador e00 . Para el observador e0 se tiene, en cambio,
η(OP , OP ) = −T 2 + X 2 . Igualando ambas expresiones se tiene:
T 2 = (T 0 )2 + X 2
y, por tanto, T > T 0 . Más aún, dividiendo en ambos miembros por T 2
se tiene
µ 0 ¶2
T
1=
+ v2,
T
siendo v la velocidad relativa del observador e00 respecto del observador
e0 . En consecuencia,
1
T =√
T 0.
1 − v2
Desigualdad triangular. Consideremos un triángulo lorentziano
OP Q en L4 (Figura 29). Se verifica el siguiente teorema: si OP , OQ
264
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
Figura 28
y P Q son temporales y apuntan al futuro entonces
kOQk ≥ kOP k + kP Qk,
(12.4)
con igualdad si y sólo si los vectores son colineales. Esta desigualdad
recibe el nombre de desigualdad triangular, y se deduce análogamente a
la conocida desigualdad triangular euclı́dea (kOQk ≤ kOP k + kP Qk).
Fı́sicamente, (12.4) se interpreta como que el tiempo medido por el
observador e00 que sigue la trayectoria desde O hasta Q es mayor que
el medido por el observador que sigue la trayectoria OP y luego P Q.
(Esta conclusión produce la popular “paradoja de los gemelos”.)
Contracción de la longitud. Consideremos una varilla V de longitud L = kOP k que está en reposo respecto del observador e0 . Para
el observador e00 la varilla tendrá longitud L0 y estará en movimiento
0
(véase la Figura 30). Esta longitud L0 será igual a la del segmento OP ,
intersección del espacio en reposo de e00 (generado por {e01 }) con todas
las rectas temporales Rx = {(t, x) : t ∈ R} generadas por cada uno de
los puntos de la varilla (0, x) para x ∈ [0, L]. Por tanto,
0
0
η(OP , OP ) = (L0 )2 .
12.2. RELATIVIDAD GENERAL
265
Figura 29
Como P 0 = (T, L) en las coordenadas del observador e0 , se tiene
0
0
η(OP , OP ) = −T 2 + L2 . En consecuencia,
√
L0 = −T 2 + L2
y, por tanto, L02 < L2 . Más aún, téngase en cuenta que e00 es ortogonal a e01 , por lo que las coordenadas de e00 determinadas por e0 son
proporcionales a (L, T ). La velocidad de e00 medida por e0 es entonces
v = T /L. Ası́, de la expresión anterior para L0 se tiene:
√
L0 = 1 − v 2 · L.
12.2.
Relatividad General
12.2.1.
El modelo matemático
En Relatividad General, esto es, el modelo obtenido cuando se incorporan los efectos de la gravedad a la Relatividad Especial, se postula
que el espaciotiempo fı́sico (o una región “macroscópicamente grande”
de él) admite una estructura de variedad de Lorentz conexa temporalmente orientada de dimensión 4.
Esto se corresponde con el paso (a) de la Subsección 12.1.3, con la
importante diferencia de que ahora no está prefijado de antemano el
modelo matemático de variedad a la que es isométrico el espaciotiempo. Por eso, el paso (b) de esa subsección debe llevarse a cabo desentrañando a la vez a qué variedad lorentziana temporalmente orientable
concreta es isométrico el espaciotiempo.
266
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
Figura 30
Para esto no existen reglas fijas, pero sı́ se aceptan algunas prescripciones: (i) Cada observador se modela como una curva temporal
(unitaria) γ dirigida hacia el futuro; si el observador está en caı́da libre
entonces describe una geodésica (el vector velocidad de la geodésica es
temporal, unitario y apunta en la dirección del cono futuro en cada
punto). (ii) Si γ(t) es un observador, en cada instante t0 podemos considerar el hiperplano Π ortogonal a γ 0 (t0 ) en Tγ(t0 ) Q (Π serı́a el “espacio en reposo infinitesimal” de γ 0 (t0 )) , y la hipersuperficie expγ(t0 ) (Π)
constituye el “espacio en reposo” del observador γ en t0 (al menos para
distancias “suficientemente pequeñas”). (iii) Las partı́culas aceleradas
vienen representadas por curvas temporales que apuntan al futuro (su
normalización, en lugar de unitaria, se suele escoger igual a la masa
en reposo en cada instante). (iv) Los rayos de luz se describen como geodésicas luminosas que apuntan también al futuro (la luz no
está acelerada1 ).
Es de señalar que el tensor de curvatura desempeña ahora un papel
crucial, puesto que determina cómo se comportan las geodésicas. Como
veremos más adelante (Subsección 12.2.4), este tensor vendrá determinado por la materia y la energı́a.
1
Sin embargo, no existe una interpretación fı́sica clara para las geodésicas espaciales.
12.2. RELATIVIDAD GENERAL
12.2.2.
267
Causalidad
Consideremos una variedad de Lorentz orientada temporalmente
(Q, g). Si p, q ∈ (Q, g), se definen las siguientes relaciones de causalidad:

futuro cronológico (q << p)



futuro causal estricto (q < p)
p está en el
de q
pasado cronológico (p << q)



pasado causal (p ≤ q)
si existe una curva diferenciable a trozos,

temporal y dirigida al futuro



causal y dirigida al futuro
temporal y dirigida al pasado



causal y dirigida al pasado
que parte de p y llega a q. La notación p ≤ q significa que o bien p < q
o bien p = q. Se pueden comprobar relaciones del tipo:
p << q, q << r =⇒ p << r
p << q, q ≤ r =⇒ p << r
p ≤ q, q ≤ r =⇒ p ≤ r,
etc. Llamaremos ası́ futuro cronológico de p, I + (p), (resp. futuro causal
de p, J + (p)) a:
I + (p) = {q ∈ Q : p << q}
J + (p) = {q ∈ Q : p ≤ q}
Para los pasados cronológico I − (p) o causal J − (p) las definiciones son
análogas.
La estructura causal del espaciotiempo tiene un enorme interés tanto fı́sico como geométrico, pudiendo presentar los futuros y pasados
multitud de posibilidades. Ası́, observemos que en el espaciotiempo
de Minkowski los conos aparecen como en la Figura 31, por lo que el
conjunto J + (p) acaba intersecando a toda geodésica temporal dirigida
hacia el futuro r(t). Sin embargo, en un espaciotiempo en el que los
conos se distribuyan como en la Figura 32, ocurre que si p está a la
derecha de la lı́nea L (el “horizonte de sucesos”) entonces J + (p) no
interseca la región a la izquierda de L. De hecho, un observador como
268
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
γ1 , que parte del punto q a la izquierda de L, una vez que atraviese L
no volverá a cruzar esta lı́nea, perdiendo todo contacto con la región
izquierda de L. Ası́, γ1 sólo podrá encontrarse con γ2 si éste también
se decide a cruzar L (sabiendo que entonces γ2 tampoco la volverá a
poder cruzar).
Figura 31
Para un espaciotiempo se suele admitir que se verifican diferentes
condiciones de causalidad. De todas, la más básica y menos restrictiva
es la condición de cronologı́a, esto es, que no existan curvas temporales
cerradas (a través de las cuales un observador podrı́a viajar a su propio
pasado).
Por último, señalemos la siguiente cuestión técnica. Sea Ω > 0 una
función diferenciable sobre Q. A la métrica de Lorentz g 0 = Ωg se le
llama métrica conforme a g mediante Ω. Claramente, dos métricas conformes presentan los mismos vectores luminosos y, por tanto, la misma
causalidad (la causalidad es un “invariante conforme”). Además, si dos
métricas lorentzianas g, g 0 tienen iguales vectores luminosos (y, por
tanto, igual causalidad) entonces un bonito razonamiento algebraico
muestra que son conformes (véase, por ejemplo, [BEE, Theorem 2.3];
el resultado es válido en cualquier dimensión n, con la salvedad para
n = 2 de que el factor Ω puede ser también siempre negativo). Esto
12.2. RELATIVIDAD GENERAL
269
Figura 32
sugiere definir clases conformes de métricas mediante la relación de
equivalencia: g ∼ g 0 si y sólo si existe Ω > 0 tal que g 0 = Ωg. La estructura conforme de un espaciotiempo equivale a la causal (conjunto
de los conos luminosos futuros en cada punto), y existen múltiples propiedades fı́sicas y geométricas (trayectorias de rayos luminosos, tensor
de Weyl, etc.) que dependen sólo de ella.
12.2.3.
Propiedades maximizantes de las geodésicas
causales
En el casop
lorentziano, la longitud de una curva γ : [a, b] → Q se deRb
fine como a |g(γ 0 (t), γ 0 (t))|dt. Aunque ahora no existe una distancia
asociada como en el caso riemanniano (Sección ??), se puede definir un
concepto con ciertas analogı́as para curvas causales dirigidas al futuro.
En primer lugar, obsérvese que no podemos usar como distancia entre
dos puntos relacionados causalmente p, q , p ≤ q el ı́nfimo de las longitudes de las curvas causales que los conectan, puesto que éste siempre
serı́a cero (bastarı́a con coger curvas que fuesen luminosas en casi todo
270
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
su trayecto). Por el contrario, lo que se hace es tomar el supremo de
las longitudes de tales curvas. Aunque este supremo puede ser ∞ (por
ejemplo, si existiera una curva temporal cerrada que pasase por p y
q), condiciones de causalidad poco restrictivas implican su acotación.
Este supremo recibe el nombre de distancia lorentziana o separación
temporal d(p, q) definido por:
Sup{L (γ) : γ curva causal dirigida al futuro que conecta p y q},
que puede tomar cualquier valor en [0, ∞] (si p 6≤ q entonces se define
d(p, q) = 0). Con esta definición se prueban algunas analogı́as entre las
propiedades minimizantes de las geodésicas en geometrı́a riemanniana
y las correspondientes maximizantes en geometrı́a lorentziana. La más
relevante de ellas es la desigualdad triangular invertida:
d(p, q) + d(q, r) ≤ d(p, r).
Sin embargo, también hay notables diferencias: ası́ d(p, q) = 0 no implica p = q y, en general, d(p, q) 6= d(q, p) (de hecho, si d(p, q) = d(q, p)
entonces necesariamente d(p, q) ∈ {0, ∞}). Las analogı́as se extienden
a las propiedades que relacionaban geodésicas y longitud en el caso
riemanniano. Ası́, si en el caso riemanniano (Sección ??) las geodésicas
minimizan localmente la longitud (en Rn+1 globalmente), en el caso
lorentziano las geodésicas causales la maximizan localmente (en Ln+1
globalmente). Fı́sicamente, la longitud de una curva causal se identifica
con el tiempo medido por un observador que la recorra (“tiempo propio” del observador). Por tanto, un observador en caı́da libre γ medirı́a
un tiempo mayor que el de cualquier otro observador ρ “próximo”2 que
siga una curva temporal no geodésica, Figura 33. (Esta es la versión
más general de la “paradoja de los gemelos”.)
12.2.4.
Ecuación de Einstein
Como ya sabemos, cada espaciotiempo viene modelado por una variedad de Lorentz orientada temporalmente de dimensión 4. Ası́, una
vez fijada la variedad de Lorentz es posible establecer la causalidad,
la velocidad de las partı́culas, las trayectorias de los rayos de luz, etc.
Basta con que ρ y γ caigan en un mismo entorno normal, ası́, en L
necesaria la restricción de que ρ sea “próximo”.
2
n+1
no es
12.2. RELATIVIDAD GENERAL
271
Figura 33
Ahora bien, ¿qué es lo que determina la métrica g que modela al espaciotiempo (y su estructura topológica y diferenciable)? Parece fı́sicamente razonable que sea la energı́a, considerada en sentido amplio, es
decir, abarcando el momento, la masa, etc. La ecuación de Einstein
relaciona conceptos geométricos asociados a g, como el tensor de Ricci y la curvatura escalar, con conceptos fı́sicos como la energı́a y el
momento.
La energı́a del espaciotiempo fı́sico permite construir un campo
de tensores T de tipo (2, 0) y simétrico, que llamaremos tensor impulso -energı́a, atendiendo a lo siguiente: para cada base ortonormal
(e0 , e1 , e2 , e3 ) en Tp Q el término T (e0 , e0 ) medirá la densidad de energı́a
en ese punto para cualquier observador con velocidad e0 en p; el término T (e0 , ei ) medirá la densidad de momento lineal en la dirección ei ,
y T (ei , ej ) la densidad de presión en la dirección ej sobre la superficie
en e⊥
0 ortogonal a ei . Se tiene ası́ la matriz 4 × 4:


T (e0 , e0 ) T (e0 , ei )

,
T (e0 , ej ) T (ei , ej )
donde T (ei , ej ), i, j ∈ {1, 2, 3} es una matriz 3 × 3. En principio, este
tensor, que se construye a partir de la distribución de energı́a del espaciotiempo, debiera determinar su geometrı́a. La igualdad esperada
272
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
entre elementos asociados a g y T es la ecuación de Einstein:
1
Ric − Sg + Λg = T,
2
(12.5)
donde Λ ∈ R es la constante cosmológica. Además (siempre que no se
entre en consideraciones cuánticas como las referentes a la energı́a del
vacı́o), se acepta que la constante cosmológica Λ debe ser 0, por lo que
la ecuación de Einstein se supondrá en adelante:
1
Ric − Sg = T.
2
(12.6)
Hay varios argumentos fı́sicos de plausibilidad en favor de (12.5)3 , pero
esta ecuación debe admitirse como un postulado, sin demostración formal.
Si se describe una región del espaciotiempo que esté vacı́a, sin materia o energı́a de ningún tipo, la ecuación (12.6) queda Ric−(1/2)Sg = 0.
Al tomar la traza en esta igualdad se tiene (en dimensión 4): S − 21 4S =
−S = 0. En conclusión, la ecuación de Einstein en el vacı́o (con Λ = 0)
queda
Ric ≡ 0.
(12.7)
Observaciones:
(1) Vı́a la ecuación de Einstein, el tensor energı́a-impulso proporciona esencialmente el tensor de Ricci. Ahora bien, el tensor de curvatura R tiene “más componentes” que el de Ricci. En efecto, en dimensión
4 o superior, a partir de R se puede construir el llamado tensor de Weyl
C el cual, conjuntamente con el Ricci, determina R. El tensor de Weyl
es un “invariante conforme”, esto es, depende sólo de la causalidad; ası́,
dos métricas conformes tendrán el mismo tensor de Weyl (véase el final
de la Subsección 12.2.2). Se tiene entonces que el tensor de Ricci (determinado por las ecuaciones de Einstein) junto con el tensor de Weyl
(determinado por la causalidad) sı́ determinan el tensor de curvatura
3
Ası́: (i) tomando un lı́mite apropiado se reobtiene la ecuación de Poisson de la
Mecánica Newtoniana; (ii) a partir de la ecuación deP
Einstein es posible deducir
n
leyes de conservación (div T = 0, siendo div T (v) = i,j=1 g ij (∇ei T )(v, ej )), sin
necesidad de imposiciones adicionales, como en el caso de la Mecánica Newtoniana;
(iii) la ecuación (12.6) se corresponde con propiedades extremales para variaciones
apropiadas de S.
12.2. RELATIVIDAD GENERAL
273
R que, como vimos en la Subsección 11.6.2, caracteriza esencialmente
la métrica.
(2) Ya establecimos que T (e0 , e0 ) es la densidad de energı́a. Parece
razonable suponer que ésta sea positiva, esto es, T (e0 , e0 ) ≥ 0 para
todo e0 temporal unitario. La condición equivalente T (v, v) ≥ 0 para
todo v temporal (y, por continuidad, también para todo v luminoso)
recibe el nombre de condición débil de energı́a. En particular, si u es
luminoso entonces de (12.6) se tiene
0 ≤ T (u, u) = Ric(u, u).
(3) Existen otros tipos de condiciones esperables sobre el comportamiento de T o Ric. Por ejemplo, la condición, muy usada:
Ric(v, v) ≥ 0 para todo v temporal,
(12.8)
recibe el nombre de condición de convergencia temporal, y se interpreta
diciendo que la gravedad, en promedio, atrae. Tal interpretación se
debe a la relación estudiada en la Subsección 11.6.3 entre curvatura y
geodésicas por medio de la ecuación de Jacobi.
12.2.5.
Modelos cosmológicos de Robertson-Walker
Sea (QC , gC ) la variedad riemanniana modelo de curvatura constante C y dimensión 3, esto es, un plano (C = 0), esfera (C > 0) o
espacio hiperbólico (C < 0), Subsección 11.6.2.
Sea I ⊆ R un intervalo real y f : I → R una función diferenciable
positiva. Se define el espaciotiempo de Robertson-Walker asociado como
la variedad producto I × QC dotada de la métrica
g = −dt2 + f 2 (t)gC ,
donde t (función tiempo universal) es la proyección de I × QC sobre I.
Usando la identificación natural T(t0 ,x0 ) (I × QC ) ≡ Tt0 I × Tx0 QC ,
cada vector v ∈ T(t0 ,x0 ) (I × QC ) puede escribirse como v = (vt0 , vx0 )
con vt0 ∈ Tt0 I y vx0 ∈ Tx0 QC . Se tiene ası́:
g(v, w) = −vt0 wt0 + f 2 (t0 )gC (vx0 , wx0 ).
274
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
Los espaciotiempos de Robertson-Walker son los modelos más simples
que describen a gran escala el Universo fı́sico y, pese a su sencillez, hay
buenos argumentos fı́sicos de plausibilidad a su favor4 .
Para las métricas tipo g = −dt2 + f 2 (t)gC que aparecen en este
tipo de modelos no resulta difı́cil computar el tensor de Ricci y la
curvatura escalar, ası́ como escribir la ecuación de Einstein. De hecho, dependiendo de la función f y resolviendo las correspondientes
ecuaciones de Einstein, aparecerán distintas posibilidades para f (universos de Friedmann, suponiendo que T es el correspondiente a un
“fluido perfecto”).
La condición de convergencia temporal (12.8) tiene importantes
consecuencias en los espaciotiempos de Robertson-Walker. En efecto,
si esta condición se verifica entonces
Ric(∂t , ∂t ) ≥ 0.
(12.9)
Ahora bien, no es difı́cil comprobar que esta condición equivale a que
f sea cóncava, esto es:
f 00 ≤ 0.
(12.10)
Ejercicio. Compruébese que (12.9) implica (12.10).
De (12.10) se sigue necesariamente que si f no es constante entonces
el intervalo de definición I de f no puede ser todo R, ya que f debe
ser positiva. Es más, si f 0 (t0 ) > 0 para cierto t0 ∈ I entonces I =]a, b[
está acotado por la izquierda, esto es, −∞ < a < b ≤ ∞. Esta conclusión es relevante, porque, efectivamente, se cree5 que actualmente
el Universo se está expandiendo, (esto es, f 0 (t0 ) > 0 para el tiempo
universal actual t0 ), lo que sugiere que el tiempo universal tuvo un
principio: la Gran Explosión o Big Bang (Figura 34).
Ideas de este tipo se hallan presentes en los célebres (y mucho más
generales) teoremas de singularidades de Hawking y Penrose.
4
Entre ellos: (1) cada hipersuperficie a t ≡ t0 constante, dotada de la métrica
espacial g = f 2 (t0 )gC , es isótropa y homogénea, lo que coincide a gran escala con
la estructura observada del universo; (2) es un dato experimental aceptado que, a
gran escala, el universo se va enfriando, lo que permite identificar la función tiempo
universal t con, esencialmente, la inversa de la temperatura media del universo.
5
Debido al corrimiento al rojo del espectro de las estrellas, por el efecto Doppler.
12.2. RELATIVIDAD GENERAL
275
Figura 34
Posibilidades para f (> 0) si f 00 ≤ 0 y f no es constante.
Si f 0 (t0 ) > 0 para algún t0 ∈ I, necesariamente el extremo inicial a
debe ser finito.
12.2.6.
Espaciotiempo de Schwarzschild
La caracterı́stica más sorprendente del espaciotiempo de Schwarzschild
es que conduce a la aparición de una singularidad fı́sica que, a diferencia de las que eventualmente pueden tener los espaciotiempos de
Robertson-Walker, estarı́a presente en el Universo actual, debido a la
evolución natural de muchas estrellas. Muy grosso modo, podemos decir que aparece una singularidad fı́sica cuando se dan simultáneamente
los siguientes elementos:
(1) Existen geodésicas temporales incompletas. Por ejemplo, en el
caso de un espaciotiempo Robertson-Walker las geodésicas temporales s 7→ (s, x0 ) son incompletas (hacia el pasado) cuando
I =]a, b[, a > −∞.
(2) El espaciotiempo es inextensible, esto es, no se puede considerar
como un abierto propio de un espaciotiempo mayor.
(3) Existe algún “invariante” o función (escalar) asociado al tensor
de curvatura que diverja a lo largo de alguna geodésica
temporal
Pn
ijkl
Rijkl ,
incompleta γ (un ejemplo de invariante es
i,j,k,l=1 R
6
pero no una coordenada concreta Rijkl ).
6
No obstante, la divergencia de alguna coordenada Rijkl para una “tetrada
276
CAPÍTULO 12. ALGUNAS NOTAS SOBRE RELATIVIDAD
El espaciotiempo de Schwarzschild modela el campo gravitatorio generado fuera de una estrella con simetrı́a esférica que no rota. Concretamente, se trata de la variedad Q = R×]2m, ∞[×S 2 dotada de la
métrica7
µ
¶
2m
1
2
2
2
2
2
g =− 1−
dt2 +
2m dr + r (dθ + sen θdφ ).
r
1− r
La constante m > 0 admite la interpretación de masa de la estrella.
En r = 2m (radio de Schwarzschild) la métrica es singular. Sin
embargo, no se trata de una singularidad fı́sica (sino de un horizonte
de sucesos). De hecho, si consideramos la región 0 < r < 2m dotada formalmente de la misma métrica, que vuelve a ser una variedad
de Lorentz (“agujero negro de Schwarzschild”), es posible “pegar por
el borde” ésta con la región r > 2m de manera que desaparezca la
singularidad en r = 2m. De manera más precisa, existe un espaciotiempo mayor (K, g) (espaciotiempo de Kruskal) tal que dos abiertos
suyos K + , K − son isométricos, respectivamente, a las regiones r > 2m
y 0 < r < 2m, estando K + y K − separados por una hipersuperficie en
la que g está bien definida.
Sin embargo, el agujero negro de Schwarzschild (y, por tanto, el
espaciotiempo de Kruskal) presenta una singularidad, que sı́ es fı́sica
(en el sentido del principio de esta subsección), en r = 0. El estudio de
la evolución estelar muestra que, para estrellas con una masa superior a
cierta cantidad crı́tica, el espaciotiempo de Kruskal, incluido el agujero
negro de Schwarzschild, puede tomarse como un modelo apropiado de
su campo gravitatorio (véase, p. ej., [HE]).
paralela” (base de campos sobre γ obtenida por transporte paralelo) sı́ se considera
“invariante”, al ser esta propiedad independiente de la tetrada escogida.
7
Las principales condiciones de plausibilidad de este modelo son las siguientes:
(1) el Ricci de g es nulo, lo que permite modelar el campo fuera de la estrella,
esto es, el vacı́o que rodea la estrella, véase (12.7); (2) la coordenada t se puede
interpretar como una coordenada temporal, siendo los coeficientes de la métrica
independientes de ella, lo que da idea de una situación estacionaria; (3) cada hipersuperficie a t constante es ortogonal a ∂t (su espacio en reposo), y tiene simetrı́a
esférica; (4) asintóticamente, cuando r → ∞, la métrica tiende a la del espacio4
tiempo de Minkowski L . Esencialmente, estas condiciones fijan al espaciotiempo
de Schwarzschild unı́vocamente.
Bibliografı́a
[AM] Abraham R., Marsden J.E., Foundations of Mechanics, (2a
Edic.) Advanced Book Program, Perseus Books, Cambridge, Massachusets, 1978.
[AMR] Abraham R., Marsden J.E., Ratiu T., Manifolds, tensors, analysis and applications, Addison-Wesley Pub. Co., 1983.
[Ar] Armstrong M.A., Topologı́a Básica, Reverté, Barcelona, 1987.
[Bu] Burke W.L., Applied Differential Geometry, Cambridge Univ.
Press, 1985.
[BEE] Beem J. K., Ehrlich P. E., Easley K. L., Global
Lorentzian Geometry, Monographs Textbooks Pure Appl. Math.
202 (Dekker Inc., New York, 1996).
[dC1] do Carmo M., Riemannian Geometry, Birkhäuser Boston,
1992.
[dC2] do Carmo M., Geometrı́a Diferencial de curvas y superficies,
Alianza Universidad Textos, 1994.
[CM] Curtis W.D., Miller F.R., Differential Manifolds and Theoretical Physics, Academic Press, 1985.
[GM] Gamboa J. M., Ruiz J. M., Introducción al estudio de las
Variedades Diferenciables, Sanz y Torres, Madrid, 1988.
[HE] Hawking S. W., Ellis G. F. R., The Large Scale Structure
of Space-time, (Cambridge: Cambridge University Press) 1973.
277
278
BIBLIOGRAFÍA
[O’N] O’Neill B., Semi-Riemannian Geometry with applications to
Relativity, Series in Pure and Applied Math. 103 Academic Press,
N.Y. (1983).
[Sa] Sakai T., Riemannian Geometry, Editorial Board, 1996.
[Sp1] Spivak M., A Comprehensive Introduction to Differential Geometry, Volume II, Publish or Perish, INC., Boston, 1970.
[Sp2] Spivak M., Cálculo en variedades, Reverté, 1970.

Documentos relacionados