CENTRO ((TORDESILLAS)) - Revista del Seminario

Transcripción

CENTRO ((TORDESILLAS)) - Revista del Seminario
CENTRO ((TORDESILLAS))
DE
RELACIONES CON IBEROAMÉRICA
Seminarios Temáticos
Revista del
Seminario Iberoamericano de Matemáticas
Sede del Seminario
Casas del Tratado, Tordesillas.
Consejo de redacción
José Manuel Aroca, Felipe Cano, José Cano,
Percy Fernández, Jorge Mozo, Jorge Vitório Pereira,
Fernando Sanz, José Seade.
Secretarios de redacción
José Cano, Lorena López.
VOLUMEN 4
FASCÍCULO II
(2013)
Universidad de Valladolid
Centro ((Tordesillas)) de Relaciones con Iberoamérica
Seminario Iberoamericano de Matemáticas
Casas del Tratado
47100 Tordesillas
Valladolid, España
Depósito Legal: VA-359-1996
ISSN: 1136-3894
Imprime: MATA. Plaza de la Universidad no 2, Valladolid
c 2013 Seminario Iberoamericano de Matemáticas
En esta revista se publican las conferencias del Seminario Iberoamericano de Matemáticas, dependiente del Centro ((Tordesillas)) de Relaciones con Iberoamérica
de la Universidad de Valladolid. Asimismo se publicarán trabajos expositivos de
entre 10 y 20 páginas, sobre temas de interés en matemáticas. Los textos deben
ser dirigidos a algún miembro del Consejo o del Secretariado de redacción.
La revista se distribuye en versión impresa a bibliotecas de universidades de
todo el mundo. Está disponible en su versión electrónica en la página web
http://rsim.blogs.uva.es.
Los textos estarán redactados, preferiblemente, en español o portugués, aunque
también se admitirán textos en inglés o francés. Los trabajos serán más fácilmente editados si se remiten en formato LATEX 2ε utilizando clases estándar (como
article o amsart) con paquetes comunes y sin modificar márgenes, cabeceras ni
pies de página.
Para cualquier consulta, contactar con los secretarios de redacción.
Consejo de redacción
José Manuel Aroca [email protected]
Felipe Cano [email protected]
José Cano [email protected]
Percy Fernández [email protected]
Jorge Mozo [email protected]
Jorge Vitório Pereira [email protected]
Fernando Sanz [email protected]
José Seade [email protected]
Secretarios de redacción
José Cano [email protected]
Lorena López [email protected]
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
EVOLUTIONARY DYNAMICS ON GRAPHS
FERNANDO ALCALDE CUESTA, PABLO GONZÁLEZ SEQUEIROS,
AND ÁLVARO LOZANO ROJO
Abstract. In this paper, we summarize some ideas and results about
evolutionary dynamics on graphs. This theory is illustrated with a concrete
example, the so-called star graph, for which we calculate the average fixation
probability.
1. Introduction and motivation
Population genetics studies the genetic composition of biological populations,
and the changes in this composition that result from the action of four different
process: natural selection, random drift, mutation and migration. The modern
evolutionary synthesis combines Darwin’s thesis on the natural selection and
Mendel’s theory of inheritance. According to this synthesis, the central object of
study in evolutionary dynamics is the frequency distribution of the alternative
forms (allele) that a hereditary unit (gene) can take in a population evolving
under these four forces.
Many mathematical models have been proposed to understand the evolutionary
biological processes. For example, the Wright-Fisher model (stated explicitly
by S. Wright [8], but present in the work of and R. A. Fisher [4]) describes the
change of gene frequency by random drift on a population of finite fixed size N .
For simplicity, the involved organisms are assumed to be haploids (containing
only one set of chromosomes) with only two possible alleles a and A for a given
locus, although the Wright-Fisher model can be extended to multiple alleles in
diploids organisms. Then there are only N + 1 possible gene frequencies i/N for
0 ≤ i ≤ N . Assume that in some population there are exactly i copies of the
allele A (and therefore N − i copies of a). If each of the N offspring contains
a copy of a randomly chosen allele from the present generation, then the gene
frequency in the next generation could assume any of the N + 1 possible values,
except when i = 0 or i = N .
The Moran model (introduced by P. A. P. Moran in [6]) shows a particular
equilibrium between natural selection and random drift. This model has many
variants, but we will consider the variant which is closest to the Wright-Fisher
model. We have a haploid population of N individuals having only two possible
2010 Mathematics Subject Classification. 05C81, 60J20 92D15.
Key words and phrases. Evolutionary dynamics, Moran process, fixation probability, star
graph.
Partially supported by the Ministry of Science and Innovation - Government of Spain
(Grant MTM2010-15471).
3
4
alleles a and A for a given locus. In the Moran model, instead of all individuals
dying simultaneously upon the birth of the next generation, at each unit of time,
one individual is chosen at random for reproduction and its clonal offspring
replaces another individual chosen at random to die. To model natural selection,
it suffices to assume that the parent individuals with allele A have relative
fitness r > 1, as compared to those with allele a whose fitness is 1. In this
case, individuals with the advantageous allele A have a certain chance of fixation
generating a lineage that takes over the whole population, whereas individuals
with the disadvantageous allele a are likely to become extinct, although it will
be never guaranteed.
As in the previous models, evolutionary dynamics has been usually studied for homogeneous populations. But it is a natural question to ask how
non-homogeneous structures affects the dynamics. The study of evolutionary
dynamics on directed graphs was initiated by E. Liberman, C. Hauert and M.
A. Novak [5] (see also [7]). Now each vertex represents an individual in the
population, and the offspring of each individual only replace direct successors,
i.e. end-points of edges with origin in this vertex. The fitness of an individual
represents again its reproductive rate which determines how often offspring takes
over its neighbor vertices, although these vertices do not have to be replaced
in a equiprobable way. In other words, the evolutionary process is given by the
choice of stochastic matrix W = (wij ) where wij denotes the probability that
individual i places its offspring into vertex j. In fact, further generalizations of
evolutionary graphs are considered in [5] assuming simply that the probability
above is proportional to the product of a weight wij and the fitness of the
individual i. In this case, the matrix W does not need to be stochastic, but
non-negative.
In this context, several interesting and important results have been shown by
Liberman, Hauert and Novak:
• Different graph structures support different dynamical behaviors amplifying
or suppressing the reproductive advantage of mutant individuals (having the
advantageous allele A) over to the resident individuals (having the disadvantageous allele a).
• An ‘isothermal theorem’ which states that an evolutionary process on a graph is
equivalent to a Moran process (in the sense that there is a well-defined fixation
probability which coincides with the fixation probability for an homogeneous
population) if and only if it is defined by a doubly stochastic matrix W . More
generally, a non-negative matrix W defines an evolutionary process equivalent
to a Moran process if and only if it is a circulation, i.e. each vertex i has
PN
PN
the same entering and leaving weight w− (i) = j=1 wji = j=1 wij = w+ (i),
which is equal to 1 in the stochastic case.
However, for evolutionary processes on graphs, the fixation probability depends
usually on the starting position of the mutant. The effect of the initial placement
on the mutant spread has been discussed by M. Broom, J. Rychtář and B. Stadler
in the case of undirected graphs, see [2] and [3].
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
5
The aim of this paper is summarize some fundamental ideas and results on
evolutionary dynamics on graphs. This theory will be illustrated with a concrete
example, the so-called star graph, for which we calculate the (average) fixation
probability outlined in [5] (see also [1]).
2. Moran process
The Moran process was introduced by Moran [6] to model random drift
and natural selection for finite homogeneous populations. As indicated in the
introduction, we consider a haploid population of N individuals having only
two possible alleles a and A for a given locus. At the beginning, all individuals
have the allele a, then one resident individual is chosen at random and replaced
by a mutant having the neutral or advantageous allele A. At successive steps,
one randomly chosen individual replicates with probability proportional to the
relative fitness and its offspring replaces another individual randomly chosen to
be eliminated. Since the future states of the process depend only on the present
state, and not on the sequence of events that preceded it, the Moran process is
defined by the Markov chain
Xn = number of mutant individuals with the allele A at the step n
with state space S = {0, . . . , N }. Moreover, this process is stationary because
the probability to pass from i to j mutant individuals
Pi,j = P[Xn+1 = j|Xn = i] = P[Xn+1 = j|X0 = i0 , . . . , Xn−1 = in−1 , Xn = i]
does not depend on the time. But the number of mutant individuals can change
at most by one at each time step and therefore a non-trivial transition exists
only between state i and state i − 1, i or i + 1. Then, the transition matrix of
the stochastic process is a tridiagonal matrix




1
0
0 ...
0
P0,0 P0,1 . . . P0,N
−
+
+
 −
0 
 P1,0 P1,1 . . . P1,N   δ1 1 − δ1 − δ1 δ1 . . .


  ..
.
.
.. 
.
.
.
.
P = .
=


.
.
.
..
.
.
. 
..
..

 ..
  .
.
+
 0
0
0 . . . δN −1 
PN,0 PN,1 . . . PN,N
0
0
0 ...
1
where Pi,i−1 = δi− , Pi,i+1 = δi+ and Pi,i = 1 − δi− − δi+ . The states i = 0 and
i = N are absorbing while the other states are transient.
A
a
a
a
a
Figure 1. Moran process on a homogeneous population
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
6
For a general birth-death process, defined by a tridiagonal matrix P , the chance
that any set of i mutant individuals spread taking over the whole population is
denoted by
xi = P[∃n : Xn = N |X0 = i].
In particular, the probability of one mutant individual to reach fixation
x1 = P[∃n : Xn = N |X0 = 1]
is called fixation probability and also denoted by ΦA . Now we consider the
following system of linear equations
x0 = 0
xi = δi− xi−1 + (1 − δi− − δi+ )xi + δi+ xi+1
xN = 1
(2.1)
To find a solution x = (x0 , x1 , . . . , xN ) of the linear equation P x = x with the
conditions x0 = 0 and xN = 1, it is useful to define
verifying
have:
PN
i=1
yi = xi − xi−1
yi = xN − x0 = 1. Then, dividing each side of (2.1) by δi+ , we
yi+1 = γi yi
(2.2)
δi− /δi+
where γi =
is the death-birth rate (which is reciprocal to the reproductive
advantage of any set of i mutant individuals). It follows:
yi = x1
i−1
Y
γj .
j=1
Therefore, the fixation probability is given by
x1 =
1+
1
PN −1 Qi
i=1
j=1
γj
(2.3)
Random drift. If none of alleles a and A is reproductive advantageous, the
random drift phenomenon can be modeled by the Moran process with relative
fitness r = 1. In this case, the transition probabilities are given by
Pi,i−1
=
Pi,i+1
=
Pi,i
=
i
N −i
.
N N −1
i N −i
.
N N −1
i i−1
N −i N −i−1
.
+
.
N N −1
N
N −1
(2.4)
Since γi = 1, the fixation probability ΦA = 1/N . As for every birth-death
process, if the population reaches one of the absorbing states, then it stays there
forever. In the other states, the population of mutant individuals randomly
evolves, but eventually these individuals will either become extinct or take over
the whole population.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
7
Natural selection. The effect of fitness on the evolutionary dynamics of a
population is described by the Moran process provided mutant individuals with
the allele A have relative fitness r > 1. Now, the transition probabilities are
given by
Pi,i−1
=
Pi,i+1
=
Pi,i
=
N −i
i
.
ri + N − i N − 1
ri
N −i
.
ri + N − i N − 1
i−1
N −i
N −i−1
ri
.
+
.
ri + N − i N − 1 ri + N − i N − 1
(2.5)
Since the death-birth rate γi = 1/r, the fixation probability
ΦA =
1+
1
PN −1
j=1
r−i
=
1
1 − r−1
≥1− .
−N
1−r
r
Thus, an advantageous mutation with r > reaches fixation with positive probability but this is not always guaranteed, because this probability is strictly less
than 1.
3. Evolutionary processes on graphs
Evolutionary graph theory was introduced by Liberman, Hauert and Novak
[5]. Like for homogenous populations, the first natural question is to determine
the chance that the offspring of a mutant individual having an advantageous
allele spreads through the graph reaching any vertex. But this chance depends
obviously on the initial position of the individual (see [2] and [3]) and the global
graph structure may significantly modify the equilibrium between random drift
and natural selection observed in homogeneous populations (as proved in [5]; see
also [2] and [3]).
Let G = (V, E) be a directed graph, where V is the set of vertices and E is the
set of edges. We assume G is finite, connected and simple graph (without loop or
multiple edges). Thus, E identifies to a subset of V × V which does not meet the
diagonal. Any graph structure on the vertex set V = {1, . . . , N } is completely
determined by the adjacency matrix (aij ) where aij = 1E (i, j) for each pair
(i, j) ∈ V × V . An evolutionary process on G is also given by a Markov chain,
but each state is now described by a set of vertices S ∈ S = P(V ) inhabited
by mutant individuals having an advantageous allele A. This reproductive
advantage is measured by the fitness r ≥ 1. The transition probabilities of this
Markov chain are defined from a non-negative matrix W = (wij ) whose entries
are edge weights satisfying wij = 0 ⇔ aij = 0. So evolutionary process on G can
be identified with the elements of the set W of such matrices. The transition
probability between two states S, S 0 ∈ S = P(V ) (which is still time-independent)
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
8
is given by
P

r i∈SP
wij

P
P
P
if S 0 \S = {j}


r
w
+

ij
i∈S
j∈V
i∈V \S
j∈V wij


P



w

i∈V \S
 P
P
P ij
P
if S\S 0 = {j}
r
w
+
ij
i∈S
j∈V
i∈V \S
j∈V wij
PS,S 0 =
(3.6)
P
P



r
w
+
w

 P
Pi,j∈S ij Pi,j∈V \SP ij
if S = S 0


r
w
+
w

ij
ij
i∈S
j∈V
i∈V
\S
j∈V



0
otherwise
P
P
P
P
where r i∈S j∈V wij + i∈V \S j∈V wij is the sum of the reproductive weight
of the mutant and resident individuals (equal to r#S + N − #S = N + (r − 1)#S
when the matrix W is stochastic). In other words, the process is defined by
a 2N × 2N stochastic matrix P = (PS,S 0 ). As for the Moran process, S = ∅
and S = V are absorbing states, but there may exist other absorbing states, as
well as recurrent states, so the probability that resident or mutant individuals
become extinct can be strictly less than 1. Anyway, the fixation probability of
any other set S inhabited by mutant individuals
ΦS = P[∃n : Xn = V |X0 = S]
can be obtained as the solution of a linear equation, which is analogous to (2.1)
for the classical Moran process. Assuming the absorbing states S = ∅ and S = V
are connected with other states and using that P is stochastic, it is possible
to prove this equation has always a unique solution. Details will be reported
elsewhere. By simplifying ΦS terms, this equation reduces to the following
equation:
P
P
i∈S
j∈V \S rwij ΦS∪{j} + wji ΦS\{i}
P
P
ΦS =
i∈S
j∈V \S rwij + wji
(with P∅ = 0 and PV = 1) used in [1], [2] and [3]. In particular, for S = {i}, we
have the equation:
P
j6=i rwij Φ{i,j}
.
Φ{i} = P
j6=i rwij + wji
Contrary to the case of homogeneous populations, the fixation probability
depends on the starting position of the mutant in the graph. This fact justifies
the following definition:
Definition 3.1. For any matrix W ∈ W, we define the average fixation probability on G as the average
ΦA =
N
1 X
Φ{i} .
N i=1
The definitions and results above can be illustrated by some examples:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
9
Moran process. The classical Moran process coincides with the evolutionary
process on the complete graph G = KN (where V = {1, . . . , N } and E =
V × V \∆) defined by the stochastic matrix W = (wij ) where wij = N 1−1 if i 6= j.
Since G is symmetric (i.e. its automorphism group acts transitively on the vertex
and edge sets) and W is preserved by the action of the automorphism group
of G, the fixation probability Φ{i} = Φ{j} for all i 6= j. Therefore the average
probability fixation ΦA = Φ{i} for all i.
A
a
a
a
a
Figure 2. Evolutionary process on a complete graph
Directed line graph. This graph is described in the figure below, and the
process is given by the adjacency matrix




W =


0 1
0 0
.. ..
. .
0 0
0 0
0
1
..
.
...
...
..
.
0
0
...
...
0
0
..
.




.

1 
0
If the starting position of the mutant individual coincide with the root, then this
mutant generates with probability 1 a lineage that will take the whole population.
But this will never be possible in other positions. In other words,
1 if i = 1
Φ{i} =
0 if i 6= 1
According to [5], such a graph structure is be said to be a suppressor of selection
since the average fixation probability ΦA = 1/N is the same that of the random
drift for a homogeneous population independently of the mutant fitness.
A
a
a
a
a
Figure 3. The line graph
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
10
Cycle graph. As before, this graph is described in the figure below, but now
the process is given by the stochastic matrix


0 12 0 . . . 12
 1 0 1 ... 0 
2

 2


W =  ... ... ... . . . ...  .


 0 0 0 ... 1 
2
1
1
0 0
0
2
2
Since the graph is still symmetric and W is preserved by the action of its
automorphism group, even if the population is not yet homogeneous, the starting
position of a mutant individual does not have any effect on the process. Thus,
we can assume the starting state is S = {1}, which only may evolve to S = ∅,
S = {1, 2} or S = {N, 1}. Arguing by recurrence, we see that any accessible
state is a connected subset, and the non-trivial transition probabilities depend
only on its cardinal number i. In more precise way, these probabilities are given
by
Pi,i−1
=
Pi,i+1
=
Pi,i
=
for 1 ≤ i < N .
1
1
1
1
2 ri + N − i + 2 ri + N − i
1
1
r
r
2 ri + N − i + 2 ri + N − i
r(i − 1)
N −i−1
ri + N − i + ri + N − i
=
=
=
1
ri + N − i
r
ri + N − i
1 − Pi,i−1 − Pi,i+1
A
a
a
a
a
Figure 4. Cycle graph
4. Circulation theorem
Complete graphs and cycle graphs show the same equilibrium between random
drift and natural selection that a homogeneous population. Now, according to
[5], it is natural to adopt the following definition:
Definition 4.1 ([5]). An evolutionary process on a graph G defined by a matrix
W = (wij ) ∈ W is said to be equivalent to the Moran process if the fixation
probability of a single copy of a mutant allele A having fitness r > 1 is well
defined (that is, it does not depend on the initial placement of the mutant allele)
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
11
and equal to the fixation probability
1 − r−1
1 − r−N
of the Moran process, where N is the number of vertices of G.
ΦA =
Our next aim is to recall the circulation theorem proved by Liberman, Hauert
and Novak [5], where they give some necessary and sufficient conditions for this
equivalence. We start by recalling the circulation condition:
Definition 4.2 ([5]). A matrix W = (wij ) ∈ W defines a circulation on G if for
any vertex i ∈ V the entering weight
w− (i) =
N
X
wji
w+ (i) =
N
X
wij
and the leaving weight
j=1
j=1
are equal. The weighted graph (G, W ) is also said to be weight-balanced.
PN
In the case where W is stochastic, the entering weight w− (i) = j=1 wji is
also called the temperature of the vertex i and denote by Ti , while the leaving
PN
weight w+ (i) = j=1 wij is always equal to 1.
Circulation Theorem [5]. For any matrix W = (wij ) ∈ W, the following
conditions are equivalent:
(1) W defines an evolutionary process equivalent to the Moran process.
(2) The probability that a initial population of n mutant individuals having fitness
r > 1 reaches a mutant population of m individuals is given by
ΦA (r, W, n, m) =
1 − r−n
.
1 − r−m
(3) W defines a circulation on G.
(4) The number of elements of a state S performs a biased random walk on the
integer interval [0, N ] with forward bias r > 1 and absorbing states 0 and N .
Proof. We prove a cycle of implications (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (1). To verify
(1) ⇒ (2), it suffices to remark:
ΦA (r, W, n, N ) = ΦA (r, W, n, m)ΦA (r, W, m, N ) ,
∀m ≥ n
since the probability of reaching one state from another state depends only on
their number of vertices.
Now we prove (2) ⇒ (3). First, for each state S 6= ∅, V , we define entering
and leaving weights
w− (S) =
X
i∈S
w− (i) =
N
XX
wji
i∈S j=1
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
12
and
w+ (S) =
X
w+ (i) =
N
XX
wij .
i∈S j=1
i∈S
The probability that the mutant population S increases or decreases of one
individual is given by
δ + (S) =
rw+ (S)
rw+ (S) + w− (S)
or
δ − (S) =
Then the birth-death rate is equal to
By hypothesis, we know:
w− (S)
.
rw+ (S) + w− (S)
rw+ (S)
δ + (S)
=
.
δ − (S)
w− (S)
(4.7)
1 − r−1
r
=
.
r+1
1 − r−2
In particular, this means that the evolutionary process does not depend on the
initial placement of the mutant individual. Then, writing δ ± = δ ± ({i}) for any
i ∈ V , we have also:
∞
X
δ+
ΦA (r, W, 1, 2) =
δ + (1 − δ + − δ − )k = +
.
δ + δ−
ΦA (r, W, 1, 2) =
k=0
We deduce:
δ+
= r.
δ−
Combining this equality with (4.7) for S = {i}, we obtain w+ (i) = w− (i) for all
i ∈ V , that is, W defines a circulation on G
To show (3) ⇒ (4), we need to prove that the number of individuals k = #S
of a mutant population S defines a Markov chain Xn verifying
P[Xn+1 = k + 1|Xn = k] = δ + (S)
with forward bias
and P[Xn+1 = k − 1|Xn = k] = δ − (S)
δ + (S)
=r
δ − (S)
and absorbing states 0 and N . Since W defines a circulation, we have:
X
w+ (S) − w− (S) =
w+ (i) − w− (i) = 0
i∈S
for every state S 6= ∅, V in S = P(V ). Using (4.7), we deduce that the Markov
chain Xn verifies:
rw+ (S)
δ + (S)
=
=r
δ − (S)
w− (S)
for all S 6= ∅, V .
Finally, we prove (4) ⇒ (1). By hypothesis, the fixation probability of a single
mutant individual having fitness r > 1 does not depend on its initial placement.
More generally, the probability of reaching the whole population V from one
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
13
state S depends only on its number of vertices k = #S.
Markov chain with transition matrix

1
0
0 ...
0
 δ1− 1 − δ1− − δ1+ δ1+ . . .
0


..
..
..
..
P =  ...
.
.
.
.

+
 0
0
0 . . . δN
−1
0
0
0 ...
1
where
Thus, W defines a







δk+
= r , ∀k = 1, . . . , N − 1
δk−
by hypothesis. Arguing as for the case of a Moran process, we obtain:
ΦA (r, W, 1, N ) =
This completes the proof.
1 − r−1
.
1 − r−N
As a corollary of this theorem, we have:
Isothermal Theorem [5]. For any stochastic matrix W = (wij ) ∈ W, the
following conditions are equivalent:
(1) W defines an evolutionary process equivalent to the Moran process.
(2) W defines an isothermal process on G, i.e. all vertices i ∈ V have the same
PN
temperature Ti = j=1 wji = T .
PN
(3) W is doubly stochastic, i.e. Ti = j=1 wji = 1 for all i ∈ V .
Proof. Firstly, we have:
n
X
i=1
Ti =
N
N X
X
i=1 j=1
wji =
N X
N
X
wji = N
j=1 i=1
if W is stochastic. To see (1) ⇒ (2), it suffices to apply the circulation theorem,
so the temperature Ti = w− (i) of each vertex i is equal to its leaving weight
w
P+n(i) = 1. The implication (2) ⇒ (3) follows from the equation above because
i=1 Ti = N T = N and hence T = 1 when W defines an isothermal process.
Finally, according to the circulation theorem, any doubly stochastic matrix W
defines a circulation (and hence an isothermal process) equivalent to the Moran
process.
5. Star graph
In [5], Liberman, Hauert and Novak showed that there are some graph
structures, called star structures, which act as evolutionary amplifiers favoring
advantageous alleles in non-homogeneous populations. These structures have
also been studied in [1]. We will explicitly describe the asymptotic behavior of
the average fixation probability.
A star graph consists of N = m + 1 vertices labelled 0, 1, . . . , m where only the
center 0 is connected with the peripheral vertices 1, . . . , m, see the figure below.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
14
A
a
a
a
a
a
Figure 5. Star graph
Since the automorphism group is isomorphic to the symmetric group acting on
the peripheral vertices, the state space reduces to the subsets ∅ and {1, . . . , i},
{0} and {0, 1, . . . , i}, 1 ≤ i ≤ m, which can be described using ordered pairs. In
the first entry, we write the number i of peripheral vertices inhabited by mutant
individuals. In the second one, we use 1 or 0 to indicate whether or not there
is a mutant individual at the center. Thus, the fixation probabilities will be
denoted by
Φi,1 = P[∃n : Xn = (m, 1)|X0 = (i, 1)]
and
Φi,0 = P[∃n : Xn = (m, 1)|X0 = (i, 0)].
As for the Moran process, the evolutionary dynamics of the star structure is
described by the system of linear equations
Φ0,0
=
0
Φi,1
=
+
−
δi,1
Φi+1,1 + δi,1
Φi,0
Φi,0
=
+
δi,0
Φi,1
Φm,1
=
1
+
−
δi,0
Φi−1,0
+
−
+ (1 − δi,1
− δi,1
)Φi,1
+ (1 −
+
δi,0
−
−
δi,0
)Φi,0
(5.8)
(5.9)
since non-trivial transition exists only between state (i, 1) (resp. (i, 0)) and
states (i + 1, 1), (i, 0) and (i, 1) (resp. (i − 1, 0), (i, 1) and (i, 0)), see the figure
below. The non-trivial entries in the transition matrix are given by
r
m−i
.
r(i + 1) + m − i m
m−i
= (i, 0)|Xn = (i, 1)]
=
r(i + 1) + m − i
ri
= (i, 1)|Xn = (i, 0)]
=
ri + m + 1 − i
1
i
= (i − 1, 0)|Xn = (i, 0)] =
.
ri + m + 1 − i m
+
δi,1
= P[Xn+1 = (i + 1, 1)|Xn = (i, 1)] =
(5.10)
−
δi,1
= P[Xn+1
(5.11)
+
δi,0
= P[Xn+1
−
δi,0
= P[Xn+1
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
(5.12)
(5.13)
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
15
(0, 1)
•
(1, 1)
/•V
(i − 1, 1)
/•V
(i, 1)
•/ V
(i + 1, 1) (m − 1, 1)
•/ V
•/ V
(m, 1)
/•V
• o
(0, 0)
• o
(1, 0)
• o
(i − 1, 0)
• o
(i, 0)
• o
• o
(i + 1, 0) (m − 1, 0)
•
(m, 0)
Figure 6. State space of a star graph
and
+
−
1 − δi,1
− δi,1
=
+
−
1 − δi,0
− δi,0
=
In particular, we have:
m+1
ri
.
m r(i + 1) + m − i
m+1
m−i
.
m ri + m + 1 − i
r
rm
Φ1,1 and Φ1,0 =
Φ1,1 .
r+m
rm + 1
Thus, the death-birth rates are given by
Φ0,1 =
γi,1
=
γi,0
=
−
δi,1
+
δi,1
−
δi,0
+
δi,0
(5.14)
=
m
r
(5.15)
=
1
rm
(5.16)
+
Arguing as for (2.1) and dividing each side of Equations (5.8) and (5.9) by δi,1
+
and δi,0 respectively, we obtain equations
m
Φi+1,1 − Φi,1 = γi,1 (Φi,1 − Φi,0 )
=
(Φi,1 − Φi,0 )
(5.17)
r
1
Φi,1 − Φi,0 = γi,0 (Φi,0 − Φi−1,0 ) =
(Φi,0 − Φi−1,0 )
(5.18)
rm
analogous to (2.2). From (5.18), we prove inductively the following lemma:
Lemma 5.1. For each i = 1, . . . , m, the fixation probability
Φi,0 =
i
X
1 i−j rm i−j+1
(
) (
)
Φj,1 .
rm
rm + 1
j=1
Proof. For i = 1, the identity reduces to the second identity in (5.14). Assuming
it is true for i − 1 ≤ 1, from (5.18), we deduce:
i−1
(1+
1
1
1 X 1 i−1−j rm i−1−j+1
)Φi,0 = Φi,1 +
Φi−1,0 = Φi,1 +
(
)
(
)
Φj,1 .
rm
rm
rm j=1 rm
rm + 1
This implies the formula.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
16
Now, using (5.17), we obtain the following equation:
Φi+1,1 − Φi,1
=
−
m
rm
1
rm 2
Φi,1 −
Φi,1 −
.(
) Φi−1,1
r
rm + 1
rm rm + 1
i−2
X
1 i−j rm i−j+1
) (
)
Φj,1
(
rm
rm + 1
j=1
=
m
m
Φi,1 − (
)2 Φi−1,1
r(rm + 1)
rm + 1
−
i−2
X
m
j=1
1 i−j rm i−j+1
(
) (
)
Φj,1
r rm
rm + 1
where
lim
m→+∞
i−2
X
m
j=1
1 i−j rm i−j+1
) (
)
Φj,1 = 0.
r rm
rm + 1
(
Thus, when the number of peripheral vertices m tends to +∞, the peripheral
process whose fixation probabilities are equal to Φi,1 becomes more and more
close to the Moran process determined by the system of linear equations
1
(Φi,1 − Φi−1,1 )
(5.19)
r2
Even though there is no limit process, we say that the peripheral process is
asymptotically equivalent to the Moran process determined by (5.19) and whose
relative fitness is quadratically amplified.
Φi+1,1 − Φi,1 =
On the other hand, according to (5.14), the average fixation probability
ΦA =
1
m
Φ0,1 +
Φ1,0
m+1
m+1
is equal to
(
r
m
rm
1
.
+
.
)Φ1,1
m + 1 r + m m + 1 rm + 1
and therefore ΦA also becomes more and more close to the fixation probability
of the Moran process determined by (5.19), which has relative fitness r2 > 1.
We can resume this discussion in the following statement:
Star Theorem [5]. The star structure is a quadratically amplifier of selection
in the sense that the average fixation probability of a mutant individual with
relative fitness r > 1 is asymptotically equivalent to the fixation probability
ΦA =
1 − r−2
1 − r−2m
for the Moran process with relative fitness r2 > 1
Actually, there are super-star structures which act as amplifiers of selection
of arbitrary polynomial degree [5].
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
F. Alcalde Cuesta, P. González Sequeiros, A. Lozano Rojo
17
6. Conclusion
In this paper, we have described some basic ideas of evolutionary graph theory
sketched by Liberman, Hauert and Novak [5] by focusing in the study of the
average fixation probability of a randomly arising mutation. The effect of the
starting position of the mutant individual has been discussed by Broom, Rychtář
and Stadler in [2] and [3] for small-world networks and other small-order graphs.
For example, like they observed, regular graphs have the worst structure for the
mutant spread. These authors were also interested in the time to fixation of a
advantageous allele for strongly connected directed graphs and undirected graphs,
and how it depends on the graph structure and the initial placement of the
mutant. In a forthcoming paper, we will study the average fixation probability
and the expected fixation time in different types of graphs and complex networks.
References
[1] M. Broom, J. Rychtář. An analysis of the fixation probability of a mutant on special
classes of non-directed graphs. Proc. R. Soc. A, 464 (2008), 2609–2627.
[2] M. Broom, J. Rychtář, B. Stadler. Evolutionary dynamics on small-order graphs. J.
Intesdiscip. Math., 12 (2009), 129–140.
[3] M. Broom, J. Rychtář, B. Stadler. Evolutionary dynamics on graphs - the effect of
graph structure and initial placement on mutant spread. J. Stat. Theory Pract., 5 (2011),
369–381.
[4] R.A. Fisher. The genetical theory of natural selection. Clarendon Press, Oxford, 1930.
[5] E. Lieberman, C. Hauert, M. A. Novak. Evolutionary dynamics on graphs. Nature, 433
(2005), 312–316.
[6] P. A. P. Moran. Random processes in genetics. Proc. Camb. Phil. Soc., 54 (1958), 60–71.
[7] M. A. Novak. Evolutionary dynamics: exploring the equations of life. Harvard University
Press, Cambridge, 2006.
[8] S. Wright. Evolution in Mendelian populations. Genetics, 16 (1931), 97–159.
Departamento de Xeometrı́a e Topoloxı́a, Facultade de Matemáticas, Universidade
de Santiago de Compostela, Rúa Lope Gómez de Marzoa s/n, E-15782 Santiago de
Compostela (Spain)
E-mail address: [email protected]
Departamento de Didáctica das Ciencias Experimentais, Facultade de Formación
do Profesorado, Universidade de Santiago de Compostela, Avda. Ramón Ferreiro,
10, E-27002 Lugo (Spain)
E-mail address: [email protected]
Centro Universitario de la Defensa - IUMA Universidad de Zaragoza, Academia
General Militar, Ctra. Huesca s/n, E-50090 Zaragoza (Spain)
E-mail address: [email protected]
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 3–17
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
Sistemas articulados. Teorema de Kempe
J.M. Aroca
Desde un punto de vista intuitivo un sistema articulado es un mecanismo
compuesto por barras rı́gidas unidas por sus extremos mediante articulaciones.
Como nuestro estudio es puramente geométrico y nos limitaremos a sistemas
articulados planos, suponemos que las barras son unidimensionales y que las
articulaciones les permiten girar con completa libertad en el plano. Si llamamos
vértices a los extremos de las barras, es claro que cada posición del sistema queda determinada por las posiciones de sus vértices, y como el sistema es plano,
es decir que todas las barras están situadas en un plano y están forzadas a
moverse en él, el conjunto de posiciones del sistema está parametrizado por un
subconjunto de R2n , siendo n el número de vértices del sistema, este conjunto se conoce por espacio de configuraciones del sistema articulado. De modo
inmediato se plantean dos preguntas sobre estos sistemas.
1. ¿Cuál es la geometrı́a del espacio de configuraciones de un sistema articulado?
2. ¿Cómo son las trayectorias de los vértices del sistema?
En este trabajo, puramente de revisión y sin pretensiones de originalidad, intentaremos analizar algunas de las respuestas que se han dado en los últimos
dos mil años a esas dos preguntas.
1.
Un poco de historia
Los primeros sistemas articulados, diferentes de la regla y el compás, de los
que se tienen noticias, se deben a los geómetras griegos del siglo V antes de
Cristo y estaban destinados a resolver algunos problemas relativos a cónicas y
otros asociados a ecuaciones de tercer grado insolubles con regla y compás. La
primera referencia clásica a un sistema dinámico de construcción de curvas es
la del sistema destinado a la construcción de la cuadratriz atribuido a Hippias
(460 − 400 a.C.). La cuadratriz es el lugar geométrico descrito por un punto
que gira en torno al origen con velocidad angular constante a la vez que se
mueve paralelamente al eje y, con velocidad constante (ver [13]). No existen
datos sobre un sistema articulado capaz de dibujar esta curva que se puede usar
para resolver los problemas de la cuadratura del cı́rculo y de la trisección del
ángulo. Parece ser que se dibujaba trazando una cantidad suficiente de puntos
de ella, ya que es fácil dar un método elemental para dibujar una familia densa
numerable de puntos de dicha curva.
19
20
Hay una interesante controversia entre los historiadores de la matemática
sobre la admisión en la geometrı́a griega de construcciones usando instrumentos
distintos de la regla y el compás, el lector interesado puede consultar el capı́tulo 8,2 Neusis- Constructions in Greek Geometry de la obra de Fowler [15], el
artı́culo de Zeuthen [41] y para el punto de vista opuesto el texto de Allman [3].
En este último se hace referencia a dos citas de Platón hechas por Plutarco:
We learn from Plutarch (Quaest. Conviv. lib. viii q. 2, I; Plut. Opera, ed Didot vol. iv p. 876) that “Plato blamed Eudoxus, Archytas, and Menaechmus, and
their School for endeavouring to reduce the duplication of the cube to instrumental and mechanical contrivances; for in this way the whole good of geometry is
destroyed and perverted, since it backslides into the things of sense, and does not
soar and try to grasp eternal and incorporeal images; through the contemplation
of which God is ever God”
La segunda cita, contenida en la Vida de Marcelo, está hecha esencialmente
en los mismos términos, pero añade que “aplican ciertos instrumentos para
calcular medias proporcionales a partir de lı́neas curvas y secciones”de este
modo, y eso es de la cosecha de Plutarco, substituyen lo que hay en la geometrı́a
de incorpóreo y sensible por una vulgar herramienta. De este modo, y vuelve
a ser opinión de Plutarco, Platón diferencia la mecánica de la geometrı́a y la
expulsa de ella, de este modo y al ser considerada durante mucho tiempo por
debajo de la filosofı́a, la mecánica se transforma en una de las artes de la guerra.
Sin embargo Fowler ([15] pp 286) dice no querer describir: Cómo de tenue
es la evidencia sobre la crı́tica que se dice hace Platón al uso de construcciones
mecánicas en geometrı́a y termina diciendo que todos los comentaristas modernos aceptan que en la geometrı́a griega se admitı́an construcciones mas generales
que las efectuadas con regla y compás. También pone en duda la autorı́a de un
aparato para duplicar el cubo atribuido por Eutocio (siglo IV después de Cristo)
a Platón, y la existencia de una misteriosa regla - cuerno citada por Diocles.
No se conocen con precisión los instrumentos de que disponı́an los griegos
para dibujar cónicas, Allman aventura la hipótesis, contradicha por otros autores, de que las pintaban por aproximación dibujando muchos de sus puntos.
Según cita Allman, tanto Bretschnaider como Cantor no consideraban improbable que Menaechmo dispusiera de algún instrumento para dibujar parábolas,
imprescindible para su solución del problema de duplicación del cubo por medio
de la intersección de dos parábolas. Sin embargo no hay referencias de sistemas
articulados capaces de dibujar cónicas hasta épocas muy posteriores. La primera
está en Proclo (418 - 485 d. C.) que habla de un compás para dibujar parábolas
de Isidoro de Mileto. Sı́ hay referencias en Eutocio y Proclo de dos aparatos, uno
de ellos el ya citado atribuido a Platón, y otro atribuido a Nicomedes (siglo III
a.C.) que son esencialmente sistemas mecánicos para el cálculo de raı́ces cúbicas
y tienen aplicación directa tanto a resolver el problema Deliano (la duplicación
del cubo), como el problema de la trisección del ángulo. Esos aparatos son los
que describimos a continuación.
1 Aparato atribuido a Platón
El aparato de la figura está descrito en [5, 3] y consiste en tres barras, dos
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
21
Figura 1: Aparato para resolver el problema Deliano, atribuido a Platón
de las cuales, α y β, están rı́gidamente unidas por un extremo formando
un ángulo recto, con vértice B, y la tercera γ se puede desplazar a lo
largo de β, a la que está unida por uno de sus extremos C, manteniéndose
paralela a α (ver figura 1). En cierto sentido es similar al compás y podrı́a
usarse, como este, para dibujar circunferencias.
En la figura citada se puede apreciar cómo se usa. Si queremos calcular la
raı́z cubica de d/a, es decir de la medida del segmento d tomando a como
unidad, en un sistema cartesiano se hace pasar la barra α por el punto
(−a, 0), y la barra γ por el punto (0, −d) y a continuación se desplaza la
barra β hasta que se colocan, el vértice C en el eje x (punto (c, 0)) y el B
alcanza el eje y (punto (0, b)).
La aplicación del teorema de la altura a los triángulos rectángulos ABC
y BCD establece que:
b2 = a.c
⇒ b4 = a2 .c2 = a2 .b.d ⇒ (b/a)3 = d/a
c2 = b.d
2 La conchoide de Nicomedes
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
22
Figura 2: Aparato atribuido a Nicomedes
El sistema (ver figura 2) consta de tres barras, la barra β esta rı́gidamente
unida a la barra α en su punto medio formando con ella un ángulo de 90
grados y en ella hay un pivote fijo B, a distancia b de la intersección con la
barra α sobre el que desliza la barra γ, esta a su vez tiene otro pivote P a
distancia a de su extremo que encaja en una ranura de la barra α. De este
modo el extremo X de la barra γ está situado en una recta variable por
B, de modo que la longitud del segmento de dicha recta contenido entre
X y la barra α es de longitud constante igual a a.
Tomando una referencia cartesiana centrada en B con eje de ordenadas
sobre β, la ecuación en polares de la conchoide, tomando ángulos a partir
del semieje x negativo es
b
+ a.
ρ=
sin ϑ
La ecuación cartesiana en la referencia fijada de la conchoide, que es una
cuártica, es
x2 (y − b)2 = y 2 (a2 − (y − b)2 .
La conchoide se puede usar en la resolución del problema de la duplicación
del cubo y en el de la trisección del ángulo, veamos como ejemplo la
resolución de este segundo problema.
Tomamos el ángulo θ a trisecar (ver figura 3) - supuesto que es agudo
\ para AC = 1 - tomamos una recta r ortogonal a AB por C y la
θ = BAC
conchoide γ de r respecto de A para a = 2. Tomamos por C la paralela a
AB que cortará a γ en E; AE corta a r en F y F E = 2. Si D es el punto
\
medio de EF , es ED = DF = 1. Como F
CE = π/2, EF es diagonal de
\
\ = α. Dado que α
un rectángulo y DC = 1; como AC = 1, ADC = DAC
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
23
r
2
F
C
β
1
α
A
β
F
B
β
γ
E
2
γ
Figura 3: Uso de la conchoide en la trisección del ángulo
es un ángulo exterior al triángulo CDE, es α = 2β y como θ = α + β, es
θ = 3β, luego hemos trisecado el ángulo θ. Los griegos, a esta técnica de
mover inclinaciones la llamaron vergeris.
La cisoide, atribuida a Diocles, es una curva cúbica de construcción similar
a la conchoide y con las mismas aplicaciones, y resulta fácil diseñar un aparato
que la dibuja, pero no hay referencias históricas de un aparato de este tipo hasta
el siglo XVII, como veremos en la sección siguiente.
2.
De las cónicas a las transformaciones cuadráticas
Hay referencias a un elipsógrafo atribuido por Chasles a Proclus (ver Blake
[4]), este mismo aparato ha sido atribuido a Leonardo de Vinci por diversos
autores (Braunmühl [5] o Rouse Ball [31], por ejemplo) y consiste en dos barras
rı́gidamente unidas con dos ranuras por las que deslizan dos pivotes de una
tercera barra. Cualquier punto rı́gidamente unido a esta tercera barra describe
una elipse. Un cálculo elemental con coordenadas prueba que se dibuja la elipse
centrada en O con semiejes BC y AC (ver figura 4).
Tanto Leonardo como Durero diseñaron aparatos para ayudarse en el trazado
de óvalos, por ejemplo el de la figura 5, pero estos aparatos, desde nuestro punto
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
24
Figura 4: Elipsógrafo atribuido a Proclus y Leonardo de Vinci
de vista de sistemas articulados, son sistemas libres que recorren toda una región
del plano.
Figura 5: Aparato diseñado por Durero
Nos remontaremos ahora al siglo XVII, en el que la publicación de la Geometrı́a de Descartes [12], en la que se describe la construcción de varias curvas
algebraicas, vuelve a dar interés a los aparatos para la construcción de curvas. Pese a describir numerosas curvas como lugares geométricos, Descartes solo
menciona dos aparatos, uno de ellos destinado a la construcción de elipses usando una cuerda y otro con un doble propósito que es el que aparece en la figura 6.
Consiste en dos barras Y Z, Y X que se articulan en Y el punto B está fijo pero
todos los demás son móviles, manteniéndose únicamente la ortogonalidad de las
barras transversales bien a Y Z, bien a Y X. Como el propio Descartes señala en
dos puntos diferentes de su obra, el aparato tiene una doble aplicación:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
25
Figura 6: Aparato diseñado por Descartes
1. Los triángulos ABC, ACD, ADE, AEF, AF G, AGH son semejantes y
en consecuencia se tiene la proporción continua:
CD
DE
EF
FG
BC
=
=
=
=
.
CD
DE
EF
FG
GH
Por tanto este aparato proporciona raı́ces cúbicas y se puede usar para la
duplicación del cubo y la trisección del ángulo.
2. El punto B describe una circunferencia pero los puntos D, F y H describen
\
curvas progresivamente más complicadas. Si llamamos θ al ángulo ZY
X
y a = Y B, la ecuación en polares de la curva descrita por D es:
Y D = a + BD = a + BC tan θ = a + a tan2 θ
Es decir es la curva cuártica, muy parecida a la cuadratriz:
y 4 = a2 (x2 + y 2 ).
Un seguidor de Descartes, Franz von Schooten el joven (1615 - 1668), presenta numerosos aparatos para dibujar cónicas en su tratado “De organica conicarum sectionum in piano descriptione tractatus”publicado en 1675, el primero
de ellos (ver figura 7), aunque es aparentemente diferente del de Proclus - Leonardo de Vinci, está basado en el mismo principio. Si tomamos dos barras de la
misma longitud OP y P Q articuladas en P y sujetas por O a una barra fija por
la que desliza Q, cualquier punto X de la barra P Q, diferente de sus extremos,
describe una elipse. En efecto, si situamos una barra virtual ortogonal a la OP
en 0 y añadimos otra barra virtual idéntica a la P Q a partir de P , tenemos el
primer elipsógrafo, la barra de longitud fija 2a que se apoya en dos barras fijas.
También se debe a von Schooten un hiperbológrafo que ya está basado en la
descripción de la hipérbola como lugar geométrico de los puntos cuya diferencia
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
26
Figura 7: Primer elipsógrafo de von Schooten basado en el mismo principio del
de Proclus-Leonardo
Figura 8: Hiperbológrafo de von Schooten basado ya en la definición habitual de
hipérbola
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
27
Figura 9: Casos no degenerados del teorema de von Schooten
de distancias a dos fijos es constante. En el aparato (ver figura 8) los puntos A
y B son fijos, la distancia AB coincide con P Q y AP = P Q, entonces M es el
punto medio de los dos segmentos AB y P Q, en consecuencia:
XP = XQ
y
XA − XB = XA − XP = AP
y el punto X traza una hipérbola.
Von Schooten construye también tres tipos de compases deslizantes basados
en el siguiente resultado elemental:
Teorema 1.– Von Schooten. Si un rombo articulado ABCD tiene fijo el
punto A y el punto C se mueve en una circunferencia de radio r centrada en
otro punto fijo O, el punto de corte de la recta OC con la diagonal del rombo
BD describe una cónica. Esa cónica es una elipse si r < OA, es una hipérbola
si r > OA y degenera en un punto si r = OA. Si C describe una recta (que
se puede considerar como una circunferencia de radio infinito), P describe una
parábola.
Al estar situado P sobre la diagonal BD del rombo P C = P A se pueden
dar tres casos (ver figura 9);
1. Si r > OA, P está siempre entre O y C y:
P O + P A = P O + P C = OC = r,
por tanto P describe una elipse.
2. Si r < OA, C está siempre entre O y P y:
P O − P A = P O − P C = OC = r,
por tanto P describe una hipérbola.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
28
Figura 10: Compases deslizantes (conicógrafos) de von Schooten
3. Si r = OA, OA = OC ⇒ O ∈ BD ⇒ P = OC ∩ BD = O y P no se
mueve.
En el caso en que C describa una recta Γ, que se puede considerar una circunferencia de radio infinito con centro en el punto del infinito de la perpendicular a
Γ por A, la recta OC es la perpendicular a Γ por C y si P es el punto de corte
de OC con la diagonal BD, como P está en la diagonal BD es P C = P A y
como P C es perpendicular a Γ, es:
dist(P, Γ) = P C = P A
y en consecuencia P describe una parábola.
En la figura 10 se pueden ver los conicógrafos construidos por van Schooten
aplicando el teorema anterior.
Isaac Newton (1642 - 1727) describe en su Enumeratio Linearum Tertii Ordinis [28] setenta y dos tipos de curvas de tercer grado, de entre ellas destacaremos
la estrofoide por sus conexiones con la cisoide de Diocles a la que ya hemos hecho referencia. Según R. Clare Archibald [6], el primero que estudió esta curva
fue Isaac Barrow (1630 - 1677), maestro de Newton, aunque el nombre se debe a
Montucci ya en el siglo XIX. Barrow describe la estrofoide de la forma siguiente:
Dados un punto O y una recta r que no pasa por O, una recta variable s
por O corta a r en un punto Os , si O′ es el pie de la perpendicular a r por
O, se toman los puntos Xs , Ys sobre s tales que Os Xs = Os Ys = Os O′ . El
lugar descrito por los puntos Xs e Ys es la estrofoide (ver figura 11).
La ecuación de la estrofoide es fácil de obtener, en coordenadas polares con polo
O, semieje positivo OO′ y unidad de longitud OO′ son:
ρ = OYs = OOs − Os Ys = OOs − Os O′ =
1
− tan α.
cos α
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
29
Figura 11: Cisoide, estrofoide y fundamentación del sistema articulado de Newton que las dibuja
Al pasar a implı́citas, teniendo en cuenta los dos puntos Xs , Ys se obtiene:
y
x = ρ cos α = 1 ± sin α = 1 ± ⇒ ρ(x − 1) = ±y ⇒ (x2 + y 2 )(x − 1)2 = y 2 .
ρ
La ecuación es divisible por x y llevando el origen a O′ resulta:
y 2 (1 + x) − x2 (1 − x) = 0.
La cisoide de Diocles tiene también una descripción clásica (ver figura 11):
Dado un punto R en una circunferencia Γ, se toma la recta r tangente a Γ
en el punto diametralmente opuesto a R, una recta variable s por R corta
a r en un punto Bs y a Γ en un segundo punto As , el lugar de los puntos
−−−→ −−→
Xs tales que As Bs = RXs .
De nuevo en polares, con origen en R semieje positivo RP y unidad RP , la
ecuación de la cisoide es:
1
ρ = RXs = As Bs = RBs − RAs =
− cos α.
cos α
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
30
Figura 12: Reproducción del sistema articulado de Sturm y de su fundamento
teórico
y en la referencia cartesiana con origen en R y la orientación usual, la ecuación
implı́cita es:
x3 + y 2 (x + 1) = 0.
En 1689 J.Ch. Sturm (1635 - 1703), en su Mathesis Enucleata [37], describe
un sistema articulado para dibujar la cisoide (ver la figura 12). Manteniendo su
−−→
−−→
notación, el punto H está en las cisoide de vértice D si y solo si DH = F P ,
por proyección sobre el eje x, esto sucede si y solo si DG = KC y por simetrı́a
de la circunferencia, esto es equivalente a GE = KF . Entonces, en el sistema
articulado de Sturm, las barras [DF ] y [CE] están forzadas a cortarse en el eje
y, el punto E está forzado a moverse en la circunferencia y la barra [EG] se
mantiene perpendicular al eje x, de este modo el punto H de corte de las barras
[EG] y [DF ] describe la cisoide.
Newton citó la cisoide en su Arithmetica Universalis [28], como un ejemplo
del uso de curvas, por parte de los matemáticos clásicos griegos, para resolver
problemas de tercer grado. De nuevo la citó junto con la estrofoide en su Enumeratio Linearum Tertii Ordinis [26] y diseñó un aparato muy simple para dibujar
ambas curvas (ver figura 13).
El sistema de referencia [EF GH] está formado por dos barras fijas ortogonales [EF ] y [GH]. La parte móvil está formada por dos barras rı́gidas formando
ángulo recto, [AB] y [BC], este sistema se mueve de modo que el vértice A
recorre el eje [EF ] y la barra [BC] pasa por un punto fijo D de la barra [GH]
tal que HD = AB, entonces el punto B describe la estrofoide y el punto medio
M de la barra [AB] describe la cisoide. Algunos autores llaman estrofoides a
todas las curvas descritas por los puntos de la barra [AB].
El fundamento del sistema está en la parte izquierda de la figura 11, en lugar
de una prueba usando geometrı́a clásica, fácil pero más larga, podemos deducir
directamente las ecuaciones:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
31
Figura 13: Sistema articulado de Newton y dibujos de la cisoide y la estrofoide
Para la curva trazada por Q (parte superior de la figura 11), tomando
OA = P Q = 1 es:
x
x =
sin θ
⇒ y = (1 − x) √
⇒ y 2 (1 + x) = x2 (1 − x)
y = (1 − x) tan θ
1 − x2
y la curva es la estrofoide.
Para la curva trazada por Q en la parte inferior de la figura 11. Los
triángulos (P OS) y (AT S) son iguales, luego OS = ST y al ser Q y R los
puntos medios de los segmentos de longitud 1, [P T ] y [OA], SQ = SR y
[ = SRQ
[ y llamando α a este ángulo, es OSP
[ = 2α,
en consecuencia SQR
y en consecuencia θ = π/2 − 2α. Entonces las ecuaciones de la curva
ası́ construida son:
)
x = 21 − 12 . sin θ = 21 (1 − cos(2α)) = sin2 α
⇒ y 2 (1−x) = x3
y =
x tan α
=
x √sin α
1−sin2
y la curva es la cisoide.
Newton en sus Principia [27] dio una descripción orgánica de una cónica,
que es lo mismo que un sistema articulado para trazarla (ver la figura 14):
Dos ángulos de magnitud fija giran sobre dos pivotes situados en sus vértices.
Uno de los brazos del primer ángulo corta a uno de los brazos del segundo en
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
32
Figura 14: Reconstrucción de un conicógrafo de Newton, junto al dibujo original
del texto de los Principia de 1687
un punto que traza una lı́nea recta, entonces el lugar de la intersección de los
otros dos brazos traza una cónica. (Libro I, Lema 21)
Desde la óptica de la geometrı́a proyectiva, el fundamento teórico de la construcción es simple (figura 14). Dentro de un haz plano de rectas de vértice P
la correspondencia gP,θ que asocia a cada recta la que forma con ella un ángulo
orientado fijo θ es una proyectividad, entonces, si los ángulos dados con vértices C y B son respectivamente α y β y si la recta descrita por el punto de
intersección de los dos primeros brazos es r, la composición de proyectividades:
gB,β πr gC,α , donde πr es la composición de la sección por r y la proyección desde
B, es una proyectividad entre los haces de vértices C y B, y los puntos de corte
de rayos homólogos forman una cónica.
Este lema tiene como consecuencia inmediata que por cinco puntos del plano
en posición general pasa una única cónica, resultado conocido, en la matemática
inglesa, por Teorema de Braikenridge - McLaurin. Tanto C. McLaurin (1698 1746) como W. Braikenridge (1700 - 1768) se adjudicaron este resultado y su
generalización en una agria polémica bien narrada en [35].
McLaurin (ver figura 12) considera un caso particular de la construcción de
Newton, con los ángulos α = β = π/2, con lo cual su construcción sigue siendo
métrica, pero prueba que si el punto de intersección de dos de los brazos recorre
una curva de grado d, el de los otros dos recorre una curva de grado 2d, es decir,
técnicamente se da cuenta de que está manejando una transformación cuadrática. Además observa que las cónicas transformadas de rectas son exactamente
las que pasan por tres puntos y que si transforma una cónica que pasa por los
vértices de los ángulos, el transformado es otra cónica más una recta doble.
Se pueden obtener las ecuaciones de la transformación. Si los ángulos tienen
como vértices O y P y elegimos una referencia métrica con origen en O y con
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
33
Figura 15: Sistema articulado de McLaurin, el transformado de una elipse es
claramente una curva de cuarto grado
−−→
OP de coordenadas (1, 0), X tiene de coordenadas (x1 , x2 ) y su transformado
Y , (y1 , y2 ), es:
−−→ −−→
−−→ −−→
OX ⊥ OY ⇒ OX.OY = 0
−−→ −−→
−−→ −−→
P X ⊥ P Y ⇒ P X.P Y = 0
En consecuencia se obtiene:
⇒ (x1 , x2 ).(y1 , y2 ) = 0 ⇒ x1 y1 + x2 y2 = 0,
⇒ (x1 − 1, x2 )(y1 − 1, y2 ) = 0 ⇒ x1 + y1 = 1.
y1
y2
=
=
1 − x1
x1 x2
x1 −1 ,
que corresponde a la transformación proyectiva involutiva:

 β0 = α0 (α1 − α0 )
β1 = −(α1 − α0 )2

β2 =
α1 α2 .
Por el contrario, la construcción de Braikenridge (ver figura 16) es puramente
proyectiva. Por tres puntos fijos no alineados del plano B1 , B2 , B3 se hacen pasar
tres rectas variables r1 por B1 , r2 por B2 y r3 por B3 , llamamos A1 = r2 ∩ r3 ,
A2 = r1 ∩ r3 y A3 = r2 ∩ r1 y forzamos a A1 a recorrer una recta fija r que no
pasa por ninguno de los puntos fijos. Braikenridge prueba que si A2 recorre una
curva de grado d, A3 describe una curva de grado 2d
La prueba del resultado es también proyectiva, es claro que si A2 recorre una
recta s, tenemos una proyectividad del haz de vértice B1 en el haz de vértice B2
por sección con r proyección desde B3 , sección por s y proyección desde B2 y
los puntos A2 son las intersecciones de rayos homólogos en esta proyectividad,
luego describen una cónica. La transformación es pues cuadrática.
En términos analı́ticos, si elegimos una referencia de rectas:
R = {B2 + B3 , B1 + B3 , B1 + B2 , r}
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
34
Figura 16: Transformación de Braikenridge
las coordenadas proyectivas de B1 , B2 , B3 son respectivamente [1, 0, 0], [0, 1, 0],
[0, 0, 1] y la recta r tiene la ecuación x0 + x1 + x2 = 0. Entonces. si A2 tiene
coordenadas [α0 , α1 , α2 ], r3 = B3 +A2 tiene por ecuación α1 x0 −α0 x1 = 0, A1 =
r3 ∩ r, tiene por coordenadas [−α0 , −α1 , α0 + α1 ], r2 = A1 + B2 tiene la ecuación
(α0 + α1 )x0 + α0 x2 = 0, y como r1 = A2 + B1 tiene la ecuación α2 x1 − α1 x2 = 0,
el punto A3 = r1 ∩ r2 tiene coordenadas [α0 α2 , −α1 (α0 + α1 ), −α2 (α0 + α1 )].
Luego las ecuaciones de la transformación son:

α0 α2
 β0 =
β1 = −α1 (α0 + α1 )

β2 = −α2 (α0 + α1 ).
La transformación de McLaurin es la base para una nueva construcción
métrica de Victor Poncelet (1788 - 1867), que posteriormente generaliza a una
construcción puramente proyectiva de las transformaciones cuadráticas involutivas. La primera construcción de Poncelet (ver figura 17) parte de dos circunferencia exteriores una a la otra y asocia a cada punto X el punto de corte de
sus polares respecto a las dos circunferencias. Su construcción generaliza la de
McLaurin, que corresponde al caso particular de dos circunferencias de radio
cero, reducidas por tanto a sus centros. Posteriormente Poncelet substituye las
circunferencias por dos cónicas, y por la linealidad de la polar observa que la
correspondencia se puede asociar al haz de cónicas que generan dichas dos cónicas, de modo que define la correspondencia asociada a un haz de cónicas que
asigna a cada punto del plano la intersección de sus polares respecto a todas las
cónicas del haz, pero esta ya es otra historia.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
35
Figura 17: Transformación de Poncelet
Figura 18: Mecanismo de Watt, en las proximidades de su centro traza aproximadamente una lı́nea recta
3.
¿Como dibujar una recta?
A.B. Kempe (1849 - 1922) publicó en 1877 un curioso libro, de cuyo tı́tulo
hemos sacado el de esta sección, en el que hace un estudio sistemático de algunos tipos de sistemas articulados. Observa en primer lugar que con sistemas
compuestos por una o dos barras, con solo un grado de libertad, solo se pueden dibujar cı́rculos y que los sistemas interesantes son ya los de tres barras, y
el primero de ellos el de Watt. El ingeniero J. Watt (1736 - 1819) patentó su
sistema articulado (ver figura 18) en 1784 como un mecanismo para producir
un movimiento paralelo a una dirección de referencia, esencial para controlar
el movimiento en lı́nea recta de un pistón. En su ancianidad lo consideraba su
invento más interesante:
Although I am not over anxious after fame, yet I am more proud of the
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
36
Figura 19: Mecanismo de Evans, a la izquierda el transformado de una recta por
E, a la derecha el de una circunferencia
parallel motion than of any other invention I have ever made. (Carta de Watt
a su colega M. Boulton)
Y aunque se considera el primer método de dibujar aproximadamente un
segmento de recta, Watt nunca consideró que su invención, con enormes aplicaciones prácticas, estuviese destinada a ese fin.
En la misma lı́nea de simplicidad del mecanismo de Watt se encuentra un
mecanismo que genera un movimiento conocido por saltamontes, hay dudas
sobre la primera vez que se utilizó y sobre su autor, Ferguson [14] lo atribuye al
ingeniero inventor de la máquina de vapor de alta presión Oliver Evans (17651819).
El sistema articulado [EHN F ] (ver figura 19), está compuesto por dos barras, EH y N F articuladas en el punto medio H de N F y tales que EH =
−−→
−−→
N H = HF . Entonces HF = −HN y se verifica que:
−−→ −−→
−−→ −−→ −−→ −−→
−−→
−−→
EF .EN = (EH + HF ).(EH − HF ) = (EH)2 − (HF )2 = 0.
En consecuencia si F se mueve en una lı́nea recta que llega a E, N describe
la recta ortogonal a ella por E. Y es fácil ver que si F describe una circunferencia
de centro E, también lo hace N . Sin embargo la transformación que lleva F a
N no es lineal, un cálculo elemental en coordenadas lo demuestra, pero también
hemos incluido en la figura 19 la curva trazada por N cuando F recorre una
circunferencia que pasa por E.
Hay toda una serie de modificaciones y mejoras del invento de Watt, todas
aplicables a las máquinas de vapor, pero aparte hay otros que trazan exactamente una lı́nea recta, pero a los que se pueden poner objeciones prácticas:
Un ingeniero inglés, J. White [40], usa en 1798 las propiedades de la hipocicloide (ver la figura 20). Si una rueda de radio r gira sin deslizar dentro
de una circunferencia de radio 2r, el punto de la rueda que al iniciar el
movimiento está en contacto con la circunferencia exterior se mueve en
lı́nea recta. En efecto, al ser el radio de la circunferencia exterior doble del
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
37
Figura 20: Mecanismo de White, el punto X recorre el diámetro OA
d que coincide con la del arco XB
d
de la interior, la longitud del arco AB,
d
porque la rueda gira sin deslizar, corresponde a un ángulo α, y la del XB
a un ángulo de 2α, entonces:
−−→ −−→ −−→
OX = OC + CX = (r cos α, r sin α) + (r cos α, −r sin α) = (2r cos α, 0).
White recibió en 1801 un premio por su invento concedido por Napoleón
Bonaparte.
La segunda construcción permite trazar una recta pero en el espacio de
dimensión tres. Se debe a P.- F. Sarrus (1798 - 1861), que describe en
un artı́culo de los Comptes Rendues [32] un sistema articulado compuesto
por dos triángulos rectángulos isósceles rı́gidos de lados paralelos ABC,
A′ B ′ C ′ , unidos por dos pares de cuadrados rı́gidos [ABP ′ P ], [A′ B ′ P ′ P ],
y [BCQ′ Q], [B ′ C ′ Q′ Q], la figura está articulada a modo de bisagras en
AB, P P ′ , A′ B ′ , BC, QQ′ , B ′ C ′ , de este modo se garantiza que:
−→ −−→′ −−→′ −−′−→′ −−→ −−→′ −−→′ −−′−→′
AP = BP , P A = P B , BQ = CQ , QB = Q C ,
−−→ −−→′ −−′−→′ −−→ −−→′ −−′−→′
AB = P P = A B , BC = QQ = B C .
−−→
−−→ −−→′
−→
−−→ −−→
Además: AB = P P es ortogonal a AP y a P ′ A′ y lo mismo BC = QQ′
−−→
−−→
es ortogonal a BQ y a QB ′ . Entonces:
−−→′ −→ −−→′ −−→′ −−′−→′ −−→′
AA = AP + P A = BP + P B = BB
−−→
y ambos son ortogonales a AB, por la misma razón:
−−→′ −−→′ −−→
BB = CC ⊥ BC.
−−→′
Luego AA es siempre ortogonal al plano ABC y A′ se desplaza en lı́nea
recta.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
38
Figura 21: Mecanismo de Sarrus, el punto A recorre la recta AA′ ortogonal al
plano del triángulo
El principal protagonista de la búsqueda de la lı́nea recta durante el siglo
XIX fue el matemático ruso P.L. Chebishev (1821 - 1894), quien comenzó a
interesarse en el problema en 1853 tras un viaje a Francia y trabajó en el mismo
durante treinta años. Al parecer llegó a pensar que era imposible construir un
mecanismo que trazase exactamente una recta:
There is a persistent rumor that Professor Chebyshev sought to demonstrate
the impossibility of constructing any linkage, regardless of the number of links,
that would generate a straight line; but I have found only a dubious statement in
the Grande Encyclopédie of the late 19th century and a report of a conversation
with the Russian by an Englishman, James Sylvester, to the effect that Chebyshev
had “succeeded in proving the nonexistence of a five-bar link-work capable of
producing a perfect parallel motion...” (Ferguson [14])
La idea de Chebyshev era refinar el mecanismo de Watt para aproximar mejor la lı́nea recta, y el sistema a seguir fue combinar varios mecanismos de forma
que se compensaran los errores llegando a alcanzar desviaciones del orden de
10−13 . En la figura 22 se presenta una modificación de Chebishev del mecanismo
de Watt y una combinación de este mecanismo con el mecanismo de Evans. El
punto M recorre aproximadamente un segmento de recta, pero realmente es un
arco de una curva de grado cuatro, el punto Q transformado de M por el mecanismo de Evans recorre un arco de curva de grado ocho mucho mas próximo
a un segmento de recta.
El primer sistema articulado capaz de dibujar en el plano una lı́nea recta se
debe a C.N. Peaucellier (1832 - 1913) capitán de ingenieros del ejército francés
y antiguo alumno de la École Polytechnique. En una carta al editor de los
Nouvelles Annales de Mathématiques [29] define el compas composé, en esencia
el sistema articulado, y propone construir uno capaz de dibujar circunferencias
de gran diámetro, rectas y cónicas. De las últimas frases de su carta parece
deducirse que ya disponı́a del citado compás. Sin embargo no publica en la
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
39
Figura 22: Mecanismo de Chebyshev, lo mismo que el de Watt aproxima una
recta en una pequeña región
revista citada su modelo y la justificación geométrica del mismo hasta 1873 [30],
esto hace que algunos autores den la autorı́a del aparato a Y.T.L. Lipkin (1843
- 1875), pero los datos de Lemoine [24] zanjan la cuestión de modo definitivo:
Cette question a été communiquée, au nom du commandant Peaucellier, par
M. Mannheim, à la séance de la Société Philomathique de Paris du 20 juillet
1867. M. Peaucellier l’avait déjà posée dans les Nouvelles Annales de Mathématique, 2e série, t. III, p. 414, 1864; il en a, de plus, appliqué le principe à un
appareil pour mesurer les distances, qui se trouve décrit dans le Mémorial de
l’Officier du Génie, no 18, année 1868. Ces détails historiques sont nécessaires,
parce que M. Lipkin donne, en août 1871, le même théorème dans la Revue Universelle des Mines et de la Métallurgie de Liège, vol. XXX. (E. Lemoine [24]).
Ambos obtuvieron premios en su tiempo por el invento. Kempe [20] asegura
que:
His discovery (de Peaucellier) was not at first estimated at its true value, fell
almost into oblivion, and was rediscovered by a Russian student named Lipkin,
who got a substantial reward from the Russian Government for his supposed
originality. However, M. Peaucellier’s merit has at last been recognized, and he
has been awarded the great mechanical prize of the Institute of France, the “Prix
Montyon.”
El compas composé de Peaucellier, del que se presentan dos versiones en la
figura 23, es un aparato que reproduce la transformación geométrica llamada
inversión. Está formado por un rombo articulado con lados de longitud r en
los vértices [ACBD] con dos barras de igual longitud R articuladas entre si por
uno de sus extremos O y articuladas por el otro a vértices opuestos del rombo
C y D. De este modo el producto de distancias desde O a los vértices A y B es
la potencia de O respecto a la circunferencia de centro C y radio r y por tanto:
d = OA.OB = OE.OF = R2 − r2 .
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
40
Figura 23: Dos formas del inversor de Peaucellier, la superior es un modelo del
Conservatoire National des Arts et Métiers y la inferior es una ilustración del
libro de Kempe
En consecuencia la transformación del plano que lleva el punto A al B es la
inversión de polo O y razón d y transforma las circunferencias que pasan por
O en rectas, luego añadiendo una nueva barra de longitud l con un extremo
articulado en un punto fijo a distancia l del punto O, también fijo, y con el otro
extremo articulado en A, se fuerza a A a recorrer una circunferencia por O y su
inverso B se desplazará a lo largo de una recta.
J.J. Sylvester (1814 - 1897) se entusiasmó con el inversor del que afirmaba
[38]:
The perfect parallel motion of Peaucellier looks so simple, and moves so easily
that people who see it at work almost universally express astonishment that it
waited so long to be discovered. But I wonder the more that it was ever found
out, and can see no reason why it should have been discovered for a hundred
years to come.
Además, y para poner de manifiesto las aplicaciones prácticas del aparato,
Sylvester señalaba que el célebre arquitecto Penrose habı́a fabricado una bomba
doméstica con un pistón controlado por un inversor y cuyo movimiento era
en perfecta lı́nea recta, y que del mismo modo se puede diseñar una cisterna
perfecta para el inodoro. También se usaba un inversor en:
certain machinery connected with some new apparatus for the ventilation
and filtration of the air of the Houses of Parliament. In due course, Mr. Prim,
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
41
Figura 24: Ventilador de la Cámara de los Comunes
(engineer to the Houses) was pleased to show his adaptation of the Peaucellier
linkage to his new blowing engines, which proved to be exceptionally quiet in
their operation. (Sylvester [38])
En los últimos años del XIX se inventan numerosas mejoras y variantes del
inversor, algunas tan complejas como un sistema articulado de Sylvester compuesto por 78 barras y capaz de trazar el segmento que une dos puntos dados.
Pero resulta especialmente interesante, sobre todo por sus aplicaciones integrado
en mecanismos más complejos, el inversor inventado por H. Hart (1848-1920).
El inversor de Hart es simplemente un antiparalelogramo (ver figura 25),
consta de 4 barras iguales dos a dos, de longitudes L y l < L, articuladas
en sus extremos formando un cuadrilátero no convexo [ABCD], los triángulos
[ADB] y [CBD] son iguales por tener los tres lados iguales, y en consecuencia
\ = DCB,
\ ABC
\ = ADC
\ y [ADE] = [CBE], [ADC] = [CBA]. Además los
DAB
triángulos [ODY ] y [ADC] son semejantes, como lo son los [OAX] y [DAB].
En consecuencia:
OY
OD OX
OA
OY OX
OD OA
=
,
=
⇒
=
.
AC
AD DB
AD
AC DB
AD AD
Los cocientes
OD
AD
=λy
OA
AD
= 1 − λ son fijos en el aparato. Y por el teorema
Figura 25: Inversor de Hart
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
42
de Pitágoras:
2
2
2
2
2
2
l2 = BC = BP + P C , L2 = AB = AP + BP ,
luego
2
2
L2 − l2 = AP − P C = AC.DB
y por lo tanto
OX.OY = λ(1 − λ)(L2 − l2 ) = cte
y la transformación que lleva X a Y es una inversión.
En su artı́culo ya citado de los Nouvelles Annales [30], Peaucellier emplea
un argumento heurı́stico que abre la puerta, como conjetura, al impresionante
teorema de Kempe que será objeto de la próxima sección:
La ligne que parcourt un point quelconque guidé par une combinaison de
pièces articuleés est nécessairement algébrique. On conçoit que, réciproquement,
toute courbe algébrique puisse être engendrée à l’aide d’un systéme articulé convenablement choisi.
4.
El teorema de Kempe (Clásico)
A. B. Kempe (1849 - 1922) dio en 1875 una primera prueba (ver [19]),
con un error leve en la construcción de dos de los aparatos, de la conjetura
de Peaucellier. Su demostración es, como veremos a continuación, muy simple
desde el punto de vista conceptual pero enormemente complicada de llevar a
cabo en la práctica para representar curvas concretas. Kempe era consciente de
este hecho, hablando de su prueba escribı́a [19]:
... there is a way of drawing any given case; and the variety of methods of
expressing particular functions that have already been discovered renders it in
the highest degree probable that in every case a simpler method can be found.
There is still, therefore, a wide field open to the mathematical artist to discover
the simplest link-works that will describe particular curves
El enunciado del teorema es el siguiente:
Teorema 2.– Kempe. Dada una curva algebraica real plana f (x, y) = 0 y un
punto P de ella, existen un entorno Ep de P y un sistema articulado S tal que
mientras un punto de S recorre un segmento de lı́nea recta, otro punto de S
describe la intersección de la curva con EP .
La prueba del teorema se hace partiendo de la ecuación de la curva:
f (x, y) =
i+j=d
X
fij xi y j = 0,
i+j=0
haciendo un cambio de variables:
x =
y =
a cos ϕ + b cos ψ
a sin ϕ + b sin ψ,
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
43
donde las variables son ϕ y ψ y a y b son parámetros a fijar posteriormente, se
tiene:
0 = f (x, y) =
i+j=d
X
fij (a cos ϕ + b cos ψ)i (a sin ϕ + b sin ψ)j
i+j=0
=
i+j=d
X
fij
=
r
r=0
i+j=0
i+j=d
X
i X
i
fij
i+j=0
r i−r
a b
r
cos ϕ cos
i−r
ψ
!
j X
j
s=0
s
s j−s
a b
s
sin ϕ sin
j−s
ψ
!
i
j r+s i+j−r−s
a b
cosr ϕ cosi−r ψ sins ϕ sinj−s ψ .
s
r
r=0,s=0
r=i,s=j
X
!
Podemos transformar esta fórmula usando las relaciones trigonométricas:
sin α = cos( π2 − α).
cos α cos β = 21 (cos(α + β) + cos(α − β)).
Para n impar:
n−1
2
2 X
n
cos α = n
cos ((n − 2k)α).
2
k
n
k=0
Para n par:
n
2 −1 2 X
1 n
n
cos α = n n + n
cos ((n − 2k)α).
2
2
k
2
n
k=0
Con ellas transformamos todas las funciones trigonométricas en cosenos y reducimos las potencias a cosenos de combinaciones lineales con coeficientes enteros
de ϕ, ψ y π/2 y reduciendo módulo π se obtiene una expresión del tipo:
f (x, y) = E +
X
1≤r+s≤d
Ars cos(rϕ + sψ) + Brs cos(rϕ − sψ)
π
π
+ Crs cos rϕ + sψ −
+ Drs cos rϕ − sψ −
2
2
= 0,
donde los coeficientes E, Ars , Brs Crs son polinomios en a y b. Se tata ahora de
construir un punto K cuya primera coordenada sea:
X
1≤r+s≤d
Ars cos(rϕ + sψ) + Brs cos(rϕ − sψ)
π
π
+ Drs cos rϕ − sψ −
= f (x, y) − E.
+ Crs cos rϕ + sψ −
2
2
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
44
Figura 26: El transformador de coordenadas, transforma las coordenadas cartesianas en trigonométricas
Figura 27: Cuatro juegos de coordenadas trigonométricas del mismo punto
Recordemos que partı́amos de un punto C de coordenadas:
(x, y) = (a cos ϕ + b cos ψ, a sin ϕ + b sin ψ).
Entonces si el punto C recorre la curva f (x, y) = 0, la abscisa de K será E,
es decir al recorrer K la recta x = E, C recorrerá la curva f (x, y) = 0, y solo
queda explicar cómo construir K y cómo determinar los valores adecuados de a
y b.
Veamos en primer lugar los aparatos necesarios para construir K:
El transformador de coordenadas: Consiste en un paralelogramo articulado
[OACB] (ver figura 26) con un vértice fijo en el origen O y lados de longitudes
\ = ϕ, BOD
\ = ψ, las coordenadas de C
a = OA y b = OB, es claro que si AOD
son:
x
y
=
=
OE
EC
=
=
OD + DE
EF + F C
=
=
OA cos ϕ + AB cos ψ
OA sin ϕ + AB sin ψ
=
=
a cos ϕ + b cos ψ
a sin ϕ + b sin ψ
El problema es la no unicidad global de las coordenadas trigonométricas, en
la figura 27 se muestran cuatro juegos de coordenadas distintos para un mismo
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
45
Figura 28: El trasladador lleva el vector de origen A y extremo C a la posición
con origen en G
punto C. Es fácil apreciar que estas coordenadas corresponden a un cambio de
configuración del paralelogramo, y para cambiar de configuración el paralelogramo debe pasar por el alineamiento de sus cuatro vértices. Las situaciones de
alineamiento se producen cuando la distancia de C a O es a + b, o cuando es
b − a. Suponemos b ≥ a porque en caso contrario las coordenadas trigonométricas están definidas solamente si C está en una corona circular centrada el origen
O. Entonces el problema es únicamente elegir a y b para que el punto C, en
cuyo entorno queremos dibujar la curva, esté en el cı́rculo abierto de centro en
O y radio a + b y no esté sobre la circunferencia de centro en O y radio b − a,
estas lı́neas limitarán también el entorno del punto C en que podremos dibujar
la curva.
El trasladador: Es el sistema articulado que permite trasladar vectores, consta
de cuatro paralelogramos [ABED], [DEHG], [BCF E], [EF HI], cada dos de
ellos con un lado común, y tales que AB = BC (ver figura 28). Con ellos
está garantizado que:
−−→ −−→ −−→ −−→ −−→ −→
AB = DE = GH, BC = EF = HI
y, en consecuencia:
−→ −−→ −−→ −−→ −−→ −−→ −−→ −→ −→
AC = AB + BC = DE + EF = DF = GH + HI = GI.
De este modo, si queremos trasladar un vector v, basta colocar A en el origen
del vector y C en su extremo, lo cual es posible si |v| < 2AB. A continuación
llevamos G al nuevo origen, que debe estar situado a distancia menor que 2AD
−→
de A y el vector GI es el trasladado de v al punto G.
El problema, no previsto por Kempe, de esta construcción es que los paralelogramos pueden cambiar de configuración tal como señalamos al hablar del
transformador de coordenadas, pero se puede evitar este problema colocando
una barra intermedia en la forma representada en la figura 29.
El girador: El girador es un paralelogramo [ABCD] (ver figura 30) con dos de
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
46
Figura 29: La colocación de una barra intermedia evita el cambio de configuración del paralelogramo
Figura 30: Girador
sus lados [AB] y [AD] ranurados, y una diagonal [AC] ranurada y fija en A, por
las ranuras de los lados deslizan cuatro barras con un punto común I forzado a
deslizar por la barra [AC], las barras [IE] e [IG], con los extremos E y G en el
lado [AB] y las barras [IF ] e [IH] con sus extremos F y H en la barra [AD],
verificando además que:
IE = IF , IG = IH.
Por simetrı́a
AG = AH, EG = F H,
por tanto el girador permite girar un vector con origen en A de módulo menor
o igual que AB cualquier ángulo, sin más que desplazar el vértice I hasta que
\ sea el
H se sitúe en el extremo del vector y luego desplazar C hasta que DAB
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
47
Figura 31: Duplicador o reversor de ángulos y triplicador
−→
ángulo deseado, ası́ AG será el vector girado. Del mismo modo se puede girar
\
cualquier segmento [F H] el ángulo DAB.
Los multiplicadores de ángulos: Los procesos de sumar ángulos y multiplicarlos por enteros se pueden efectuar por medio de giradores, pero hay otra
construcción por medio de antiparalelogramos que detallamos a continuación.
Los multiplicadores son cadenas de inversores de Hart semejantes, en la
figura 31 se representan un aparato para duplicar ángulos y otro que los triplica,
expliquemos el fundamento del primero:
Los antiparalelogramos [ABCD] y [ADEF ] (ver figura 31) están enlazados
de modo que el vértice D es común y el lado [DC] del primero está sobre el
lado [DE] del segundo. Se han construido además para que sean semejantes, es
decir:
AB
AD
=
,
AD
DE
en consecuencia los triángulos [ABC] y [CDA] son iguales y semejantes a los
triángulos, también iguales, [ADE] y [EF A]. En consecuencia:
\ = ACB
\ = AED
\ = EAF
[
β = CAD
y por ser ángulos exteriores de triángulos
\ = AHD
\
2β = AGB
luego:
\ = DAF
\.
α = BAD
\
Y esta relación se mantiene para cualquier ángulo que se coloque en BAD
siempre que no varı́e la configuración del antiparalelogramo. Veremos luego cómo
evitarlo.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
48
Figura 32: El sumador de ángulos es un sistema de dos duplicadores con un lado
común
El triplicador sigue el mismo principio, basta enlazar al segundo antiparalelogramo un tercero en la misma forma en que enlazamos el segundo al primero.
Ası́ sucesivamente se pueden enlazar cualquier número de antiparalelogramos y
construir nα para cualquier ángulo α y cualquier entero n.
El sumador de ángulos: El sumador de ángulos es un sistema compuesto por
dos duplicadores: [AKLD], [AN M D] y [ABCD], [ADEF ] con un lado [AD]
común (ver figura 32). De esta forma:
\
\
\
β=N
MD = N
AD = DAK
\
\
\
α=F
ED = F
AD = DAB
y se obtiene:
\
\
\
\
α+β =F
AK = N
AB, α − β = F
AN = KAB.
El funcionamiento correcto de los sistemas que operan con ángulos requiere
evitar los cambios de configuración de los antiparalelogramos, para evitarlos hay
que añadirles cuatro barras articuladas en un vértice O y en los puntos medios
de los lados [OP ], [OQ], [OR], [OS] (ver figura 33), tales que:
OP = OS = r, OQ = OR = s.
En virtud del resultado probado al hablar del inversor de Hart, teniendo en
cuenta que P y S son ahora los puntos medios de los lados, la razón de la
inversión asociada con centro P (o con centro S) es
ρ=
1 2
(L − l2 ), l = AB, L = BC.
4
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
J.M. Aroca
49
Figura 33: Se puede evitar que el antiparalelogramo cambie de configuración
Además por ser rectángulos los triángulos [OT Q], [OT P ] es:
2
2
2
2
2
2
r2 = OP = OT + T P , s2 = OQ = OT + T Q ,
restando ambas igualdades:
2
2
r2 − s2 = T P − T Q = (T P + T Q)(T P − T Q) = P R.P Q = ρ
P, Q, R, S están siempre alineados
P QP R = SRSQ =
L2 −l2
4
= r 2 − s2
La posición lı́mite, que no se puede sobrepasar sin que se tenga la posibilidad de
cambiar de configuración, se alcanza cuando los cuatro vértices están alineados,
esta posición es accesible si:
2r ≥ L + l, 2s ≥ L − l.
Por tanto para que no sea accesible esta posición limite:
2r < L + l, 2s < L − l.
Entonces basta con construir las barras con esta propiedad (de hecho basta con
la condición sobre s para que no haya problemas).
Una vez construidos estos sistemas articulados la construcción de Kempe
resulta evidente. Se trata de construir un vector, a partir del punto dado P de
la curva cuya abscisa sea:
(∗)
X
1≤r+s≤d
Ars cos(rϕ + sψ) + Brs cos(rϕ − sψ)
π
π
+ Drs cos rϕ − sψ −
.
+ Crs cos rϕ + sψ −
2
2
Procedemos en las etapas siguientes:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
50
Construimos un transformador de coordenadas [OAP B] con origen en O
y extremo en P , si E es un punto del semieje positivo de abscisas, los
ángulos de partida son:
\ = ϕ, EOB
\ = ψ,
EOA
a y b se eligen, como dijimos antes, en función del entorno de P en que se
quiere dibujar la curva.
Construimos multiplicadores de ángulos para ϕ, partiendo de [OA] para
todos los múltiplos de ϕ que aparecen efectivamente (es decir con coeficiente distinto de cero) en (∗), y lo mismo para [OB] y ψ, hay que tener en
cuenta que si los dos lados iniciales de un multiplicador tienen longitudes
u y v y u/v = t > 1, la longitud del lado del n-ésimo antiparalelogramo
es tn−1 v.
Con los sumadores construimos para cada par (r, s) con coeficiente Ars ,
Brs , Crs , Drs no nulo vectores
ars , brs , crs , drs
respectivamente, sobre las rectas por el origen que formen ángulos:
rϕ + sψ, rϕ − sψ, rϕ + sψ −
π
π
, rϕ − sψ −
2
2
respectivamente con el semieje positivo de abscisas, si el coeficiente es
−−→
positivo de modo que el ángulo orientado con el vector OE sea el dado y
si es negativo que el ángulo sea el dado más π.
Construimos en la dirección de esos vectores barras de longitudes |Ars |,
|Brs |, |Crs |, |Drs |.
Con trasladadores vamos llevando las barras una a continuación de otra y
el extremo final es el punto buscado.
El proceso es enormemente complicado, en [33] se puede ver la construcción detallada del sistema articulado que dibuja una cónica, de modo que se
comprende la frase ya citada de Kempe:
... renders it in the highest degree probable that in every case a simpler method can be found
que deja abierto un interesante problema.
Referencias
[1] Abbot M.T. Generalizations of Kempe’s universality theorem. M.I.T. 2008.
Rev. Semin. Iberoam. Mat. 4 fasc.˜II (2013) 19–53
J.M. Aroca
51
[2] Artobolevskii I.I. Mechanisms for the generation of plane curves Pergamon.
Oxford 1964 (Traducción de un original ruso de 1959).
[3] Allman G.J. On Greek Geometry from Thales to Euclid. Dublin Univ. Press,
Dublin 1887.
[4] Blake E.M. The ellipsograph of Proclus. American Journal of Maths. 22,
1900 pp 146-153.
[5] Braunmühl A. Historische Studie über die organische Erzeugung ebener
Curven von den altesten Zeiten bis zum Ende des achtzehnten Jahrhunderts. in Dyck W. Katalog.... pp 54 - 88.
[6] Clare Archibald R. Outline of the History of Mathematics. The Lancaster
Press, 1932.
[7] Coolidge J.L. A History of Geometrical methods. Dover, New York 1963
(Reimpresión de un texto de Clarendon, Oxford 1940).
[8] Darboux G. Recherches sur un système articulé. Bull. Sci. Mathem. et Astr.
Tome III, n.1 1879.
[9] Darboux G. Sur un nouvel appareil á ligne droite de M. Hart. Bull. Sci.
Mathem. et Astr. Tome III, n.1 1879.
[10] Darboux G. De l’emploi des fonctions elliptiques dans la theorié du cuadrilatère plan. Bull. Sci. Mathem. et Astr. Tome III, n.1 1879.
[11] Demaine D., O’Rourke J. Geometric folding algorithms. Cambridge Univ.
Press, Cambridge 2007.
[12] Descartes R. La Géométrie (1637). Edición de A. Hermann Paris 1886 (ebook Proyecto Gutenberg 2008).
[13] Dyck W. Katalog mathematischer und mathematisch-physikalischer Modelle, Apparate und Instrumente. Deutsche Mathematiker -Vereinigung, M K.
Hof Universitatsbuchdruckerei von Dr. C. Wolf und Sohn. München 1892.
[14] Ferguson F. Kinematik of mechanisms from the time of Watt. Contributions from the Museum of History and Technology. Paper 27. Smithsonian
Institution, Washington D.C. 1952.
[15] Fowler D. The Mathematics of Plato´s Academy. Clarendon Press, Oxford
(1999).
[16] Gao X.-S., Zhu G.-C., Chou S.-C., Ge J.-X. Automatic generation of Kempe
linkages for algebraic curves and surfaces. Mechanism and Machine Theory
36 (2001).
[17] Kapovich M., Millson JJ. Universality theorems for configuration spaces of
planar linkages. Topology 41 (6) 2002.
Rev. Semin. Iberoam. Mat. 4 fasc.˜II (2013) 19–53
52
[18] Heath T.L. A History of Greek Mathematics. Vol I, vol. II. Oxford Univ.
press. Reprinted by Dover New York 1921.
[19] Kempe A.B. On a General Method of describing Plane Curves of the nth
degree by Linkwork. Proc. London Math. Soc. (1875) s1-7(1): 213-216.
[20] Kempe A.B. How to draw a straigth line. Mac Millan London 1877 (Proyecto Gutemberg [EBook num. 25155]).
[21] King H.C. Planar linkages and algebraic sets. Turkish J. Math. 23 (1) 1999.
[22] Koenigs G. Leçons de Cinematique. Hermann Paris 1897.
[23] Lebesgue H. Leçons sur les constructions géométriques. Gauthier Villars,
Paris 1950 (reimpreso J. Gabay, Paris 1987).
[24] Lemoine E. Note sur le losange articulé du Commandant du Génie Peaucellier destiné a remplacer le Parallélogramme de Watt. Journal de Physique 1873. Article published online by EDP Sciences and available at
http://dx.doi.org/10.1051/jphystap:018730020013001.
[25] Liguine V. Liste des travaux sur les Systèmes Articulés. Bulletin des sciences mathématiques, vol. 7, 1883.
[26] Newton I. Arithmetica Universalis (1707). Traducción inglesa de W. Whiston Universal Arithmetik. London 1778.
[27] Newton I. Philosophiae Naturalis Principia Mathematica. S. PEPYS, Reg.
Soc. Cambridge 1686 (Proyecto Gutemnberg 2008). Trad. española Principios matemáticos de la Filosofı́a natural. Ediciones Altaya, Barcelona, 1993
[Estudio preliminar y traducción Antonio Escohotado].
[28] Newton I. Enumeratio Linearum Tertii Ordinis. H.G. Bohn London 1870
(digitalizado por Google).
[29] Peaucellier C.- N. Correspondance. Lettre de M. Peaucellier, capitaine de
Génie. Nouvelles Annales de Mathématiques, 2a série, vol. 3, 1884.
[30] Peaucellier C. - N. Note sur une question de geométrie de compas. Nouvelles
Annales de mathématiques, vol. 12, série2, 1873.
[31] Rouse Ball W.W. A short account of the History of Mathematics. Dover
Pub. New York (1960).
[32] Sarrus J. P. C.R. Acad. Sci. Paris Vol36, 1853, pp 1036 - 1038.
[33] Saxena A. Kempe’s Linkages and the Universality Theorem. Resonance,
Marzo 2011.
[34] Snyder V. et al. Selected topics in Algebraic Geometry. (Informe del Comité de Transformaciones racionales (1928) del National Research Council
de Estados Unidos) Chelsea, New York 1970.
Rev. Semin. Iberoam. Mat. 4 fasc.˜II (2013) 19–53
J.M. Aroca
53
[35] St.
Andrews
University
webpage
andrews.ac.uk/Biographies/Braikenridge.html.
www-history.mcs.st-
[36] Smith D.E. History of Mathematics. Vol 2. Dover New York 1958 (Reimpresión de un original de 1925).
[37] Sturm J.C. Mathesis Enucleata. W. Mauriti 1711. (Libros Google).
[38] Sylvester J.J. Recent Discoveries in Mechanical Conversion of Motion. Notices of the Proceedings of the Royal Institution of Great Britain, 1873-1875,
vol. 7.
[39] Taimina
D.
Historical
Mechanisms
for
Drawing
Curves.
http://dspace.library.cornell.edu/bitstream/1813/2718/1/2004-9.pdf.
[40] White J. A new Century of Inventions. Manchester 1822.
[41] Zeuthen H.G. Die geometrische Construction als Existenzbeweis in der antiken Geometrie. Math. Annalen 47 1896 pp 222-228.
[42] Zeuthen H.G. Histoire des Mathématiques dans l’Antiquité et le moyen Age.
Gauthier-Villars Paris 1902.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 19–53
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Percolación de Bernoulli de un pseudogrupo
Marı́a Pérez Fernández de Córdoba
1.
Introducción
La teorı́a de la percolación fue introducida en los 50 por el ingeniero Simon
Broadbent y el matemático John Hammersley para comprender cómo las motas
de polvo obstruı́an las cámaras antigás. Desde entonces ha sido estudiada con el
objeto de modelar numerosos procesos fı́sicos aleatorios como la filtración de un
fluido en un medio poroso, la expansión de una epidemia o la propagación de un
incendio. Por ejemplo, si se introduce una gran roca porosa en un fluido, resulta
interesante estudiar si el lı́quido fluirá hasta alcanzar el centro de la roca o si por
el contrario ésta permanecerá húmeda sólo en su superficie. Sorprendentemente,
la teorı́a de la percolación prueba que la probabilidad de que el fluido alcance el
centro no aumenta gradualmente a medida que variamos el grado de porosidad,
sino que pasa de ser nula a ser total a partir de un nivel crı́tico.
En términos matemáticos, la teorı́a de la percolación estudia la naturaleza
y propiedades de las componentes conexas (clústeres) de subgrafos aleatorios
de un grafo infinito G. En particular, el proceso de percolación de Bernoulli de
parámetro p ∈ [0, 1] sobre G asigna a cada arista una probabilidad de permanencia p y una probabilidad de desaparición 1 − p ([8],[12],[13]).
p=0
p=0.2
p=0.4
p=0.6
p=0.8
p=1
Obviamente, la probabilidad de que exista un clúster infinito en el subgrafo
aleatorio obtenido es monótona creciente respecto de p. Además, sólo puede ser
55
56
nula o total por la ley 0-1 de Kolmogorov para cada p. Luego existe un valor
crı́tico pc ∈ [0, 1] que divide el proceso en dos fases: la fase subcrı́tica p < pc
donde los clústeres son finitos (con probabilidad 1) y la fase supercrı́tica p > pc
donde existe al menos un clúster infinito (con probabilidad 1).
p
pc (G)
0
1
Clústeres finitos
Hay un clúster infinito
Cuando G es un grafo de Cayley de un grupo finitamente generado G, se
puede decir más acerca de los clústeres. C.M. Newman y L.S. Schulman prueban
en [15] que el número de clústeres infinitos es constante igual a 0, 1 o ∞ para
cada p ∈ [0, 1]. Además, O. Häggström, Y. Peres y R.H. Schonmann prueban en
[10] la existencia de un nuevo valor crı́tico pu que limita inferiormente una fase
de unicidad pu < p donde existe un único clúster infinito (con probabilidad 1):
p
pc (G)
0
Clústeres finitos
pu (G)
Hay una infinidad
de clústeres infinitos
1
Hay un único
clúster infinito
El objetivo de este trabajo consiste en extender el proceso de percolación
de Bernoulli a un pseudogrupo de transformaciones no singulares Γ sobre un
espacio de probabilidad (X, µ) dotado de un sistema finito de generadores Σ.
El interés por los pseudogrupos viene motivado por el concepto de pseudogrupo
de holonomı́a ([9]) que constituye una adecuada discretización del concepto de
laminación. El sistema Σ proporciona una estructura de grafo sobre las órbitas de Γ de modo análogo a la construcción del grafo de Cayley de un grupo.
El proceso de percolación de Bernoulli de parámetro p ∈ [0, 1] sobre el pseudogrupo grafado (Γ, Σ) consiste en hacer percolación sobre las aristas de cada
órbita de Γ con independencia unas de otras. Ahora, el objetivo es estudiar la
naturaleza y propiedades de los clústeres de las órbitas genéricas respecto de µ.
Debido a que éstas carecen de la homogeneidad propia de los grafos de Cayley,
las herramientas clásicas no son aplicables en nuestro contexto. No obstante,
probamos que la percolación crı́tica de las órbitas varı́a de manera medible y en
el caso ergódico, existe un valor crı́tico pc (Γ) que divide el proceso en una fase
subcrı́tica p < pc (Γ) donde los clústeres de casi toda órbita son finitos y una
fase supercrı́tica p > pc (Γ) donde casi toda órbita contiene un clúster infinito:
p
pc (Γ)
0
Clústeres finitos
en c.t. órbita
1
Hay un clúster infinito
en c.t. órbita
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
57
En este contexto, el estudio de los clústeres resulta más complicado que
en el caso clásico. No obstante, cuando la medida considerada es armónica y
ergódica, podemos obtener información sobre el número de clústeres infinitos de
pseudogrupos cuyas órbitas tienen más de un final. Las principales herramientas
son la Proposición fundamental de E. Ghys [7] y la versión discreta del Lema
de la hipersuperficie de E. Ghys descrita por F. Paulin en [16]. Los resultados
que presentamos muestran la analogı́a con los resultados clásicos sobre grafos
de Cayley según los cuales pc = 1 si el grafo tiene 2 finales y pu = 1 si tiene una
infinidad de finales ([13]).
Teorema 1. Si la medida µ es armónica y ergódica y µ-casi toda órbita tiene
2 finales, entonces pc (Γ) = 1.
Teorema 2. Si la medida µ es armónica y ergódica y µ-casi toda órbita tiene un
Cantor de finales, entonces para pc (Γ) < p < 1, existe una infinidad de clústeres
infinitos en µ-casi toda órbita.
2.
2.1.
Teorı́a clásica de la percolación de Bernoulli
Grafos
Un grafo es un par G = (V, E) formado por un conjunto de vértices V 6= ∅ y
un conjunto de aristas E dotado de una aplicación de E en V ×V que envı́a cada
arista e ∈ E en un par (v1 , v2 ) ∈ V × V . Si la aplicación es inyectiva, se dice que
G carece de aristas múltiples y las aristas se identifican con sus extremos. Un
lazo es una arista cuyos extremos coinciden. La valencia val(v) de un vértice v
es el número de aristas que unen dicho vértice con sus vecinos. Un grafo se dice
localmente finito si la valencia es finita en cada vértice y de geometrı́a acotada
si la valencia está uniformemente acotada.
Un camino en un grafo es una sucesión de vértices tal que cada par de
elementos consecutivos son extremos de una arista de E. La longitud de un
camino es el número de aristas que lo forman. Se llama ciclo a todo camino finito
{v1 , ..., vn } tal que v1 = vn . Un grafo se dice conexo si dos vértices arbitrarios
están siempre unidos por un camino. Un árbol es un grafo conexo sin aristas
múltiples, sin lazos y sin ciclos.
Un grafo G está dotado de una métrica natural d tal que la distancia entre
dos vértices es el mı́nimo de las longitudes de los caminos que los unen. La
distancia entre vértices se puede extender a puntos cualesquiera dotando a cada
arista de la métrica que la hace isométrica al intervalo [0, 1] o la circunferencia
S1 en el caso de un lazo. Un camino geodésico es aquel que minimiza la distancia
entre sus extremos.
Grafos de Cayley. Sea G un grupo finitamente generado y S un sistema finito
de generadores simétrico (S = S −1 ) que no contiene el elemento neutro 1. El
grafo de Cayley G = G(G, S) es un grafo conexo localmente finito cuyos vértices
son los elementos de G y dos vértices g1 y g2 están unidos por una arista si y
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
58
sólo si g1−1 g2 ∈ S. Se llama longitud de un elemento g de G al número mı́nimo
de generadores de S necesarios para escribir g y se define la distancia de las
S-palabras entre dos elementos g1 y g2 de G como dS (g1 , g2 ) = longS (g1−1 g2 ).
Ejemplos 2.1.1 Presentamos a continuación algunos ejemplos de grafos de
Cayley.
G = Z, S = {±1}.
G = Z2 , S = {(±1, 0), (0, ±1)}.
G = Z ∗ Z.
Nótese que el grafo de Cayley depende del sistema de generadores considerado, como podemos observar en la figura siguiente:
-6
-4
-2
0
-1
-5
-3
-1
+2
+4
+6
+3
+5
+7
+2
-2
+1
+1
G = Z, S = {±1, ±2}.
Espacio de finales de un grafo. Un rayo de un grafo conexo e infinito G
es una aplicación r : [0, +∞) → G continua y propia. Se dice que r es un rayo
geodésico si además es una isometrı́a. El espacio de finales de G se define a través
de una relación de equivalencia sobre el conjunto de rayos sobre el grafo.
Definición 2.1.2 Dos rayos r y r0 convergen al mismo final si para todo compacto K ⊂ G existe un entero N ∈ N tal que r([N, ∞)) y r0 ([N, ∞)) pertenecen
a la misma componente conexa de G − K. La clase de equivalencia de un rayo r
se denota E(r) y el conjunto de clases de equivalencia E(G) se denomina espacio
de finales de G.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
59
Para definir una topologı́a sobre E(G) basta con describir la convergencia
entre finales. Una sucesión E(rn ) → E(r) si y sólo si para cada compacto K ⊂ G
existe una sucesión de enteros Nn tal que rn ([Nn , ∞)) y r([Nn , ∞)) pertenecen a
la misma componente conexa de G − K para todo n ≥ n0 con n0 suficientemente
grande. Luego un conjunto B ⊂ E(G) es cerrado si para cada sucesión E(rn ) ∈ B
verificando E(rn ) → E(r) se tiene que E(r) ∈ B.
Ejemplo 2.1.3 En el caso de un árbol, el espacio de finales E(T ) coincide con
el borde geométrico ∂T formado por todos los rayos geodésicos de T que parten
de un vértice fijado. Presentamos a continuación dos árboles con espacios de
finales muy diferentes:
∂T ≡ {0, 1}N
∂T 0 ≡ { n1 }n∈N ∪ {0}.
El espacio de finales del árbol T no tiene puntos aislados, todos son puntos de
acumulación. De hecho ∂T es un conjunto de Cantor. El espacio de finales del
segundo árbol T 0 sı́ posee puntos aislados y un único punto de acumulación.
Espacio de finales de un grafo de Cayley. Si S y S 0 son dos conjuntos
finitos de generadores de un grupo G, entonces los espacios de finales de los
correspondientes grafos de Cayley E(G) y E(G 0 ) son homeomorfos (véase [3]). El
teorema de Hopf ([11]) proporciona más información sobre el espacio de finales
de los grafos de Cayley de un grupo finitamente generado:
Teorema 2.1.4 Sea G un grupo finitamente generado y S un sistema finito de
generadores de G. El grafo de Cayley G = G(G, S) tiene 0, 1, 2 o un conjunto
de Cantor de finales.
Ejemplo 2.1.5 Los grafos del ejemplo 2.1.1 tienen espacios de finales muy distintos: el grafo de Cayley de Z tiene 2 finales, el de Z2 tiene un final y el del
grupo libre Z ∗ Z tiene un Cantor de finales.
2.2.
Percolación de Bernoulli sobre grafos
Sea G = (V, E) un grafo infinito, numerable y localmente finito. El proceso
de percolación de Bernoulli con parámetro de permanencia p ∈ [0, 1] consiste
en mantener cada arista de E con probabilidad p o eliminarla con probabilidad
1 − p, de manera independiente unas de otras (véase [8],[13]).
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
60
Definición 2.2.1 El proceso de percolación de Bernoulli (de aristas) de parámetro p ∈ [0, 1] sobre un grafo infinito G = (V, E) viene dado por el espacio de
coloreados Ω = {0, 1}E sobre el conjunto de aristas E, dotado de la σ-álgebra
generada por los cilindros
,...,αn
Ceα00,...,e
= { ω ∈ Ω | ω(ei ) = αi , i ∈ {0, ..., n}},
n
con ei ∈ E, αi ∈ {0, 1} y de la medida Pp de percolación sobre Ω obtenida como
producto de las medidas de Bernoulli con pesos p y 1 − p sobre 1 y 0 en cada
arista, dada por
donde m =
Pn
i=0
,...,αn
Pp (Ceα00,...,e
) = pm (1 − p)(n+1)−m ,
n
(1)
αi .
Dado un coloreado ω ∈ Ω, diremos que una arista e ∈ E está abierta si
ω(e) = 1 y cerrada si ω(e) = 0. Cada coloreado ω ∈ Ω define un subgrafo Gω de
G cuyo conjunto de vértices es V y cuyo conjunto de aristas está formado por las
aristas abiertas de ω, es decir, las aristas e ∈ E tales que ω(e) = 1. En general
el grafo Gω es no conexo y llamamos clúster a cada una de sus componentes
conexas. Para cada v ∈ V , denotamos Cω (v) al clúster de Gω que contiene al
vértice v.
Ejemplo 2.2.2 Sea G = (V, E) un grafo infinito conexo. Si hacemos percolación de Bernoulli de parámetro p = 0, la medida P0 se concentra en un único
coloreado ω tal que ω(e) = 0 para todo e ∈ E. Es decir, Gω es (con probabilidad 1) el subgrafo de G formado únicamente por los vértices. Los clústeres se
reducen a los vértices.
Cuando tomamos el parámetro p = 1, hay un único coloreado con probabilidad total dado por ω(e) = 1 para todo e ∈ E. En este caso, Gω coincide con G
(con probabilidad
G.
p=1/2
p=1/4
p=0 1) y el único clúster es
p=0
p=3/4
p=1/4
p=1/2
p=1
Percolación de Bernoulli del grafo de Cayley de Z2 con parámetro p = 0 y p = 1.
La teorı́a de la percolación estudia básicamente la naturaleza y propiedades del subgrafo aleatorio Gω y de sus componentes conexas, prestando especial
interés a la existencia de clústeres infinitos. Una cuestión interesante para comenzar el estudio de los clústeres es conocer de qué modo varı́a el proceso de
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
p=3/4
p=1
Marı́a Pérez Fernández de Córdoba
61
percolación de Bernoulli cuando hacemos variar el parámetro p a lo largo del
intervalo [0, 1]. Para ello, se hace uso del proceso de ”standard coupling”, cuyo
interés reside en la capacidad de englobar todos los procesos de percolación de
Bernoulli en un único proceso.
Proceso de Standard Coupling. Se sustituye el espacio de coloreados Ω =
{0, 1}E por el espacio X = [0, 1]E dotado de la medida producto µ de la medida
de Lebesgue sobre [0, 1] en cada arista. Cada elemento de X determina un grafo
coloreado donde los colores blanco y negro se sustituyen por toda la gama de
grises. Para cada p ∈ [0, 1], definimos la aplicación ηp : [0, 1]E → {0, 1}E como
1 si x(e) ≤ p,
ηp (x)(e) =
0 si x(e) > p,
que verifica (ηp )∗ µ = Pp . Obviamente, si p1 ≤ p2 , entonces
ηp1 (x) ≤ ηp2 (x).
Este proceso es conocido como standard coupling y nos permite comparar
procesos de percolación de Bernoulli de parámetros diferentes. En efecto, cuando
p1 ≤ p2 el conjunto de aristas abiertas del primer proceso está contenido en el
conjunto de aristas abiertas del segundo.
Tolerancia a la inserción y al borrado. La percolación de Bernoulli es un
ejemplo de percolación tolerante a la inserción y al borrado de aristas. Es decir,
si abrimos (o cerramos) una arista en un conjunto de coloreados con medida
positiva, el conjunto que resulta sigue siendo de medida positiva.
Sea G = (V, E) un grafo infinito y sea (Ω, Pp ) el proceso de percolación de
Bernoulli sobre G de parámetro p ∈ [0, 1].
Definición 2.2.3 Se define la aplicación de inserción ie0 : Ω → Ω de una arista
e0 ∈ E como
1
si e = e0 ,
ie0 (ω)(e) =
ω(e) si e 6= e0 .
De modo análogo se define la aplicación de borrado de0 : Ω → Ω de una arista
e0 ∈ E como
0
si e = e0 ,
de0 (ω)(e) =
ω(e) si e 6= e0 .
Definición 2.2.4 Se dice que la medida Pp es tolerante a la inserción (resp.
tolerante al borrado) si para cada arista e ∈ E y para todo conjunto boreliano
B ⊂ Ω tal que Pp (B) > 0 se tiene
Pp (ie (B)) > 0, (resp. Pp (de (B)) > 0).
La medida de probabilidad P0 no es tolerante a la inserción ni la medida P1
es tolerante al borrado. No obstante, para el resto de valores de p se dan ambas
propiedades:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
62
Proposición 2.2.5 Para cada p ∈ (0, 1), la medida de probabilidad Pp es tolerante a la inserción y al borrado.
Demostración. Sea e ∈ E la arista que queremos insertar. Nótese que para
,...,αn
)) es igual a
los distintos tipos de cilindros se tiene que el valor Pp (ie (Ceα00,...,e
n
,...,αn
Pp (Ceα00,...,e
), si ei = e, y αi = 1 para algún i ∈ {0, ..., n},
n
,...,αn
pPp (Ceα00,...,e
), si ei 6= e para todo i ∈ {0, ..., n},
n
p
α1 ,...,αn
1−p Pp (Ce0 ,...,en ),
si ei = e, y αi = 0 para algún i ∈ {0, ..., n}.
Para cualquier boreliano B ⊂ Ω verificando Pp (B) > 0 se tiene
Pp (ie (B)) > mPp (B) > 0,
p
donde m = mı́n{p, 1−p
}. La prueba de la tolerancia al borrado es análoga.
2.3.
Percolación crı́tica.
El objetivo principal de la teorı́a de la percolación es estudiar la probabilidad
de que exista al menos una componente infinita en el subgrafo aleatorio obtenido
tras la percolación. Con ese fin, se estudia primero la probabilidad de que el
clúster de un vértice fijado sea infinito.
Definición 2.3.1 Dado un vértice v ∈ G, se define la función θv : [0, 1] → [0, 1]
como
p 7→ θv (p) = Pp [ ω ∈ Ω | Cω (v) es infinito ].
En algunas ocasiones escribiremos θv (p) como Pp [v ↔ ∞]. Usando el proceso
de standard coupling, se comprueba que θv es monótona creciente con respecto
a p. Además, para todo par de vértices v, v 0 ∈ V , se verifica
θv (p) = 0
⇐⇒
θv0 (p) = 0.
En efecto, si θv (p) > 0, basta insertar un camino de aristas finito {e0 , ..., en }
que una v con v 0 de manera que
θv0 (p) ≥ Pp [i{e0 ,...,en } ( ω ∈ Ω | Cω (v) es infinito )] > 0.
Estudiamos ahora la probabilidad de existan clústeres infinitos:
Definición 2.3.2 Sea θ : [0, 1] → [0, 1] la función definida como
p 7→ θ(p) = Pp [ ω ∈ Ω | ∃Cω infinito ].
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
63
Para cada vértice v ∈ V , se verifica
θv (p) ≤ θ(p) ≤
X
θv (p).
v∈V
La monotonı́a de θ con respecto a p se deduce de la monotonı́a de θv . Además,
el evento considerado es independiente de cualquier conjunto finito de aristas,
luego θ(p) es igual a 0 ó 1 por la ley 0-1 de Kolmogorov. Por tanto, para cualquier
v ∈V,
0 si θv (p) = 0
θ(p) =
1 si θv (p) > 0
De las propiedades anteriores se deduce la existencia de un valor crı́tico pc (G) a
partir del cual la probabilidad de que haya un clúster infinito pasa de ser nula
a ser total:
Definición 2.3.3 Se define la percolación crı́tica del grafo G como
pc (G) = sup{p ∈ [0, 1] | θ(p) = 0} = ı́nf{p ∈ [0, 1] | θ(p) = 1}
En resumen, la percolación crı́tica divide el intervalo [0, 1] en dos fases. En
la fase subcrı́tica con p < pc (G) todos los clústeres son finitos (con probabilidad
1), mientras que en la fase supercrı́tica con p > pc (G) existe al menos un clúster
infinito (con probabilidad 1). (No obstante, en la transición de fase p = pc (G)
puede darse cualquiera de los dos casos anteriores, véase [8]).
p
pc (G)
0
Clústeres finitos
1
Hay un clúster infinito
Proposición 2.3.4 Sea G 0 un subgrafo de G, entonces pc (G) ≤ pc (G 0 ).
Demostración. Para p > pc (G 0 ), hay un clúster infinito en G 0 (con probabilidad
1) y en consecuencia G posee un clúster infinito. Luego pc (G) ≤ pc (G 0 ).
Ejemplos 2.3.5 El cálculo del valor crı́tico pc no es sencillo y en la mayorı́a de
los grafos se desconoce su valor. Presentamos a continuación algunos ejemplos:
1. El grafo de Cayley de Z verifica pc (Z) = 1. En efecto, para p < 1, existe
una infinidad de aristas cerradas a la izquierda y a la derecha del origen
(con probabilidad 1), luego todos los clústeres son finitos.
2. El grafo de Cayley de Z2 verifica pc (Z 2 ) = 21 (véase [8]). Además, en la
fase supercrı́tica p > 12 existe un único clúster infinito (con probabilidad
1).
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
64
3. No se conoce el valor de la percolación crı́tica del grafo de Cayley de Zd
para d > 2. No obstante, por la proposición 2.3.4, se deduce que 0 <
pc (Z d ) < 1 y pc (Z d+1 ) ≤ pc (Z d ).
1
4. Si el grafo considerado es un árbol T , entonces pc (T ) = br(T
) donde br(T )
es el número de ramificación de T (véase [13]). Además, hay una infinidad
de clústeres infinitos en la fase supercrı́tica p > pc (T ) ([17]).
2.4.
Percolación de Bernoulli en grafos de Cayley
La homogeneidad que caracteriza a los grafos de Cayley permite obtener
mayor información acerca de los clústeres del proceso de percolación. Sea G un
grupo finitamente generado, S un sistema finito de generadores y G = G(G, S)
el grafo de Cayley correspondiente. La acción por traslaciones de G sobre G se
extiende de manera natural a una acción de G sobre el espacio de coloreados Ω
dada por
gω(e) = ω(g −1 (e)).
Proposición 2.4.1 Para todo p ∈ [0, 1], la medida Pp sobre Ω es invariante
respecto de la acción de G, es decir,
Pp (gA) = Pp (A)
para todo g ∈ G y para todo boreliano A ⊂ Ω.
Demostración. Basta probar la invarianza de Pp sobre los cilindros. Sea g ∈ G,
,...,αn
m
(n+1)−m
,...,αn
0 ,...,αn
Pp (gCeα00,...,e
) = Pp (Cgα−1
= Pp (Ceα00,...,e
)
n
n
e0 ,...,g −1 en ) = p (1 − p)
para e0 , ..., en ∈ E, α0 , ..., αn ∈ [0, 1] y m =
Pn
i=0
αi .
Proposición 2.4.2 Para todo p ∈ [0, 1], la medida de probabilidad Pp sobre Ω
es ergódica respecto de la acción de G.
Demostración. Si se prueba que todo boreliano saturado A ⊂ Ω verifica
Pp (A) = Pp (A)2 y en consecuencia Pp (A) ∈ {0, 1}, se deduce la ergodicidad.
Sean B1 , B2 y D subconjuntos borelianos arbitrarios de Ω. Entonces
|Pp (B1 ∩ D) − Pp (B2 ∩ D)| ≤ Pp [(B1 ∩ D) M (B2 ∩ D)] ≤ Pp (B1 M B2 ).
donde B1 M B2 = (B1 ∪ B2 ) − (B1 ∩ B2 ). Por otra parte, si A es un boreliano
saturado en Ω, para cada ε > 0 existe un cilindro C verificando que
Pp (A M C) < ε
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
65
y un elemento g ∈ G tal que C y gC son sucesos independientes. Luego
|Pp (A) − Pp (A)2 | =
|Pp (A ∩ gA) − Pp (A)2 |
≤
|Pp (A ∩ gA) − Pp (C ∩ gA)| + |Pp (C ∩ gA) − Pp (C ∩ gC)|
≤
Pp (A M C) + Pp (gA M gC) + |Pp (C)Pp (gC) − Pp (C)2 |
<
+|Pp (C ∩ gC) − Pp (C)2 | + |Pp (C)2 − Pp (A)2 |
+|Pp (C) − Pp (A)|(Pp (C) + Pp (A))
4ε.
Número de clústeres infinitos. De la invarianza y ergodicidad de la medida
de probabilidad Pp respecto de la acción del grupo sobre el espacio de coloreados,
se deduce que sólo puede darse una de las siguientes posibilidades: o bien todas
las componentes conexas son finitas, o bien existe una única componente infinita,
o bien existe una infinidad de componentes infinitas.
Para cada p ∈ [0, 1] se define la aplicación Np : Ω → N ∪ {+∞} que asigna
a cada coloreado ω el número de clústeres infinitos Np (ω) de Gω .
Teorema 2.4.3 ([15]) Sea G = G(G, S) un grafo de Cayley. Dado p ∈ [0, 1],
existe k ∈ N ∪ {∞} tal que:
Pp [ ω ∈ Ω | Np (ω) = k ] = 1.
Además, k ∈ {0, 1, ∞}.
Demostración. Es sabido que la aplicación Np es medible y constante sobre
las órbitas de la acción de G sobre Ω (véase [15]). De la ergodicidad de Pp se
deduce que Np es constante en casi todo coloreado ω ∈ Ω. Ahora, basta ver
que Np ∈
/ [2, ∞) por reducción al absurdo. Supongamos entonces que casi todo
coloreado tiene exactamente k clústeres infinitos con k > 2 y k 6= ∞. Puesto
que el conjunto de bolas centradas en el origen es numerable, existe una bola
suficientemente grande B y un conjunto ΩB ⊂ Ω de medida positiva, tales que
B interseca a cada coloreado ω ∈ ΩB en al menos dos clústeres infinitos. Usando
tolerancia a la inserción, el boreliano iB (ΩB ) tiene medida positiva. Se obtiene
ası́ la contradicción deseada, pues iB (ΩB ) está formado por coloreados con a lo
sumo k − 1 clústeres infinitos, de manera que Np no es constante en casi todo
coloreado.
Fase de unicidad. El proceso de percolación de Bernoulli sobre un grafo de
Cayley se divide en tres fases: la fase de finitud donde todos los clústeres son
finitos (con probabilidad 1); la fase de no unicidad donde existe una cantidad
infinita de clústeres infinitos (con probabilidad 1); y la fase de unicidad donde
hay un único clúster infinito (con probabilidad 1).
En efecto, el siguiente teorema prueba que si existe un único clúster infinito
con casi total seguridad para un parámetro p1 , entonces sucede lo mismo para
todo p2 > p1 :
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
66
Teorema 2.4.4 ([10]) Sea G un grafo de Cayley y sea pc (G) < p1 < 1 tal que
Pp1 [ ω ∈ Ω | ∃◦ Cω infinito ] = 1.
Entonces, para cada p2 > p1 :
Pp2 [ ω ∈ Ω | ∃◦ Cω infinito ] = 1.
Para probar el teorema, se usa el proceso de standard coupling. En particular,
se utiliza que si pc (G) < p1 < p2 , entonces cada p2 -clúster infinito contiene un
p1 -clúster infinito casi seguro. Como consecuencia del teorema anterior, existe un
valor crı́tico pu (G) ∈ [pc (G), 1] que limita inferiormente una nueva fase llamada
fase de unicidad, en la que existe un único clúster infinito:
Definición 2.4.5 Sea G un grafo de Cayley y sea Ω el espacio de coloreados
sobre las aristas de G. Se define el valor crı́tico
pu (G) = ı́nf{p ∈ [0, 1] | Pp [ ω ∈ Ω | ∃◦ Cω infinito ] = 1}.
En resumen, el proceso de percolación sobre un grafo de Cayley G se divide
en las tres fases siguientes separadas por los valores crı́ticos pc (G) y pu (G):
p
pc (G)
0
Clústeres finitos
pu (G)
Hay una infinidad
de clústeres infinitos
1
Hay un único
clúster infinito
La fase de no unicidad puede no existir, los grafos de Cayley de grupos
promediables son un ejemplo de ello. También puede suceder que la fase de
unicidad se reduzca a un único punto, es decir, pu (G) = 1. Es el caso de los
grafos de Cayley de grupos libres.
Percolación de Bernoulli en grafos arbitrarios. En general, los resultados
mencionados para grafos de Cayley no son extensibles a grafos arbitrarios. No
podemos asegurar la existencia de la fase de unicidad, ni siquiera podemos
afirmar que para cada parámetro p el número de clústeres sea constante.
Ejemplo 2.4.6 Sea T el árbol de Fibonacci con pc (T ) = 1/Φ, pu (T ) = 1 y Z 2
el grafo de Cayley de Z2 con pc (Z 2 ) = pu (Z 2 ) = 1/2. Sea G el grafo que resulta
al unir T y Z 2 con una arista. Nótese que para 1/2 < p < 1/Φ, el número de
clústeres infinitos es 1, mientras que para p > 1/Φ hay una infinidad de clústeres
infinitos.
Ejemplo 2.4.7 Sean G1 y G2 dos copias de Z 2 . Consideramos el grafo G que
resulta de unir G1 y G2 por una arista e. Entonces, para todo p > 1/2 el número
de clústeres infinitos no es constante. En efecto, con probabilidad positiva puede
haber un único clúster o 2 clústeres, dependiendo de que la arista e permanezca
o desaparezca.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
67
Todos los resultados vistos hasta ahora para grafos de Cayley pueden enunciarse en el contexto más general de los grafos transitivos (véase [13]).
Resultados clásicos para grafos de Cayley. Presentamos una recopilación
de resultados clásicos de la teorı́a de la percolación de Bernoulli sobre grafos de
Cayley relacionados con el crecimiento, el número de finales y la promediabilidad.
Proposición 2.4.8 Sea G un grafo de Cayley. Si G tiene crecimiento exponencial entonces pc (G) < 1.
Demostración. En [12] se prueba que todo grafo de cayley G contiene un
subárbol maximal subperiódico T tal que br(T ) = gr(T ) = gr(G). Además,
1
cuando G tiene crecimiento exponencial, br(T ) > 1 y pc (T ) = br(T
) < 1. Para
finalizar, usando la proposición 2.3.4, se tiene que pc (G) < pc (T ) < 1.
Proposición 2.4.9 Sea (G, S) un grupo finitamente generado y G el grafo de
Cayley asociado. Entonces:
1. Si G tiene 2 finales, pc (G) = pu (G) = 1.
2. Si G tiene un número infinito de finales, pu (G) = 1.
3. Si G es de presentación finita y G tiene 1 final, pc (G) < 1.
La prueba puede verse en [13].
Teorema 2.4.10 ([4]) Sea (G, S) un grupo finitamente generado y sea G su
grafo de Cayley asociado. Si G es promediable, entonces pc (G) = pu (G).
El teorema original de [4] es enunciado para Zd . La prueba del caso general
puede verse en [13].
Por último recordamos algunas propiedades de los clústeres infinitos de un
grafo de Cayley. Los resultados siguientes forman parte de la prueba del teorema
de indistinguibilidad de [14], según el cual los clústeres obtenidos por percolación
son indistinguibles desde un punto de vista medible.
Proposición 2.4.11 ([14]) Los clústeres que poseen más de 3 finales no poseen
finales aislados casi seguro.
Proposición 2.4.12 ([14]) En la fase de no unicidad, los clústeres infinitos
tienen una infinidad de finales casi seguro.
Proposición 2.4.13 ([14]) En la fase de no unicidad, los clústeres infinitos son
transitorios casi seguro.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
68
3.
3.1.
Percolación de Bernoulli en pseudogrupos grafados
Pseudogrupos medibles
El concepto de pseudogrupo generaliza la noción de grupo de transformaciones. Nuestro interés por los pseudogrupos y sus propiedades está motivado
por la noción de pseudogrupo de holonomı́a que juega un importante papel en
la teorı́a de foliaciones.
Sea X un espacio boreliano estándar, es decir, dotado de una σ-álgebra
isomorfa a la σ-álgebra de un espacio polaco (completamente metrizable y separable).
Definición 3.1.1 Un pseudogrupo de transformaciones medibles sobre X es
una familia Γ de isomorfismos entre conjuntos borelianos de X tales que:
1. Si γ : A → B y γ 0 : A0 → B 0 pertenecen a Γ entonces la composición
γ 0 ◦γ : γ −1 (B ∩ A0 ) → γ 0 (B ∩ A0 )
pertenece a Γ.
2. Si γ ∈ Γ, entonces γ −1 ∈ Γ.
3. La aplicación identidad idX pertenece a Γ.
4. Si γ : A → B está localmente en Γ, es decir γ|A0 ∈ Γ para todo conjunto
boreliano A0 ⊂ A, entonces γ ∈ Γ.
La órbita de x ∈ X es el conjunto Γ(x) = {γ(x) | γ ∈ Γ, x ∈ dom(γ)}.
Un boreliano B ⊂ X es saturado si es unión de órbitas
S y para cada boreliano
A ⊂ X se define el saturado de A como Γ(A) = x∈A Γ(x). Un sistema de
generadores de Γ es una familia Σ ⊂ Γ verificando que para cada γ ∈ Γ y para
todo x ∈ dom(γ) existe un entorno U ⊂ X de x tal que:
γ|U = σin ◦ ... ◦ σi0 |U
donde σij ∈ Σ para j = 0, ..., n. Se dice que Γ es un pseudogrupo finitamente
generado si existe un sistema de generadores finito.
Ejemplos 3.1.2 Los siguientes ejemplos ilustran la noción de pseudogrupo medible:
Acciones de grupos. Una acción boreliana de un grupo numerable G sobre
un espacio boreliano estándar X define un pseudogrupo medible formado por
las restricciones a borelianos de los isomorfismos borelianos τg : X → X donde
τg (x) = g · x para x ∈ X y g ∈ G.
Relaciones de equivalencia medibles discretas. Una relación de equivalencia medible discreta R sobre un espacio boreliano estándar X es una relación
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
Ui
69
Xi
Xj
Uj
ϕj
ϕi
ϕij = ( ψij , γ ij )
cuyas clases R[x] son numerables y el grafo R ⊂ X × X es un boreliano. Según
un resultado de [5], R está definida mediante la acción boreliana de un grupo
numerable. Si llamamos transformación parcial de R a cualquier isomorfismo
boreliano γ : A → B entre partes borelianas de X cuyo grafo
G(γ) = {(x, y) ∈ X × X | y = γ(x)} ⊂ R,
entonces el pseudogrupo formado por las transformaciones parciales define R.
Pseudogrupo de Holonomı́a. Una laminación L de dimensión p de un espacio topológico M viene dada por un atlas foliado A = {(Ui , ϕi )} de abiertos
distinguidos Ui y cartas locales ϕi : Ui → Di × Xi donde Di es un disco abierto
de Rp y Xi es un espacio topológico. Además, el cambio de cartas
ϕi ◦ ϕ−1
j : ϕj (Ui ∩ Uj ) → ϕi (Ui ∩ Uj )
viene dado por:
y
ϕi ϕ−1
j (x, y) = (ψij (x), γij (y))
y
donde γij es un homeomorfismo y ψij
un difeomorfismo que depende conti0
nuamente
F de y en la topologı́a C . Llamamos transversal a la unión disjunta
X = Xi . Los conjuntos Pi = ϕ−1
i (Di × {x}) son subvariedades de dimensión p llamadas placas que se solapan dando lugar a subvariedades conexas
de dimensión p llamadas hojas. Siempre podemos suponer que el atlas foliado
A = {(Ui , ϕi )} es bueno, es decir:
1. A es localmente finito y numerable (finito si M compacto),
2. los abiertos Ui son relativamente compactos,
3. si Ui ∩Uj 6= ∅ entonces existe Uij abierto distinguido tal que Ui ∪Uj ⊂ Uij .
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
70
En este caso, los homeomorfismos locales γij de Xi en Xj se extienden a un
abierto maximal de Xi y generan un pseudogrupo Γ sobre X llamado pseudogrupo de holonomı́a de L.
Si se supone que las transversales Xi son borelianos estándar en lugar de
espacios topológicos, se tiene una laminación boreliana o medible (en el sentido
de [2]) y el pseudogrupo de holonomı́a es medible.
Medidas. Sea Γ un pseudogrupo medible actuando sobre un espacio de probabilidad (X, µ). Se dice que µ es invariante si todos los elementos de Γ respetan
µ, es decir,
γ∗ µ(A) = µ(γ −1 (A)) = µ(A)
para todo γ ∈ Γ y para todo A ⊂ dom(γ −1 ) boreliano de X. Se dice que µ es
casi-invariante si los elementos de Γ respetan los conjuntos de medida nula
µ(A) = 0
=⇒
µ(Γ(A)) = 0.
En tal caso se dice que se trata de un pseudogrupo de transformaciones no
singulares del espacio de probabilidad (X, µ). La medida µ es ergódica si los
conjuntos saturados son de medida nula o total, esto es,
µ(Γ(A)) = 0 ó µ(Γ(A)) = 1
para todo boreliano A ⊂ X. A partir de ahora, usaremos el término genérico
para referirnos a conjuntos de medida total.
3.2.
Pseudogrupos grafados
Sea Γ un pseudogrupo medible dotado de un sistema finito de generadores Σ
actuando sobre un espacio boreliano estándar X. Se puede realizar cada órbita
Γ(x) como conjunto de vértices de un grafo conexo ΓΣ (x) denominado grafo
de Cayley de la órbita, donde dos elementos y, z ∈ Γ(x) estan unidos por una
arista si y sólo si existe σ ∈ Σ tal que σ(y) = z. Cuando Σ es finito, ΓΣ (x) es de
geometrı́a acotada, en particular localmente finito. Podemos dotar a cada órbita
de una métrica natural como en el caso de los grafos de Cayley: la distancia
dΣ (y, z) entre dos puntos y y z de la misma órbita es el mı́nimo de los enteros
k tales que z = σik ◦ . . . ◦ σi1 (y) con σi1 , . . . , σik ∈ Σ.
Definición 3.2.1 Llamamos pseudogrupo grafado (finitamente generado) al par
(Γ, Σ). El boreliano E = {(x, y) ∈ X × X | ∃σ ∈ Σ : y = σ(x)} es el conjunto
de aristas de la estructura de grafo disconexo no numerable sobre X cuyas
componentes conexas son los grafos de Cayley de las órbitas ΓΣ (x).
Ejemplos 3.2.2 Presentamos a continuación ejemplos básicos de pseudogrupos
grafados:
Acciones grafadas de grupos. La acción boreliana de un grupo numerable G
dotado de un sistema finito de generadores S sobre un espacio boreliano estándar
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
71
X define un pseudogrupo grafado medible. El sistema de generadores formado
por los isomorfismos borelianos τs : X → X con s ∈ S define la estructura
grafada de las órbitas.
Relaciones de equivalencia medibles discretas. Una estructura grafada
sobre las clases de una relación de equivalencia medible discreta (X, R) viene
dada por un subconjunto medible simétrico E ⊂ R, de manera que dos puntos
x, y ∈ X están unidos por una arista si y sólo si (x, y) ∈ E. Llamamos relación
de equivalencia grafada a (X, R, E). Denotamos RE [x] a la clase de equivalencia
R[x] dotada de la estructura de grafo E. Decimos que la estructura de grafo E
es conexa si los grafos RE [x] son conexos. Toda estructura de grafo conexa E
sobre (X, R) proviene de un pseudogrupo de transformaciones parciales.
Pseudogrupo de holonomı́a grafado. Si L es una laminación boreliana,
el conjunto de isomorfismos locales γij descrito en el ejemplo 3.1.2 genera el
pseudogrupo de holonomı́a y define una estructura de grafo sobre las órbitas.
3.3.
Percolación de Bernoulli en pseudogrupos grafados
Sea (Γ, Σ) un pseudogrupo grafado finitamente generado que actúa sobre
un espacio boreliano estándar X, dotado de una medida casi-invariante µ. El
proceso de percolación de Bernoulli de parámetro p ∈ [0, 1] sobre (Γ, Σ) consiste
en hacer percolación de Bernoulli sobre el grafo disconexo (X, E). Es decir, cada
arista de E se mantiene (o se borra) con probabilidad p (o 1 − p) de manera
independiente. Nuestro objetivo es estudiar la existencia de clústeres infinitos
en las órbitas genéricas. Para ello, estudiamos primero la probabilidad de que
un punto pertenezca a un clúster infinito.
Para cada x ∈ X, denotamos E x al conjunto de aristas de la órbita ΓΣ (x)
x
y (Ωx = {0, 1}E , Ppx ) al proceso de percolación de Bernoulli de parámetro
p ∈ [0, 1] sobre ΓΣ (x) (véase la definición 2.2.1). Definimos la aplicación θ(p) :
X → [0, 1] como
θx (p) = Ppx [x ↔ ∞] = {ω ∈ Ωx | Cω (x) infinito}.
Proposición 3.3.1 La aplicación θ(p) es medible.
Demostración. Basta probar que el conjunto:
θ(p)−1 ([0, a]) = {x ∈ X | Ppx [x ↔ ∞] ≤ a} = {x ∈ X | Ppx [x = ∞] ≥ 1 − a}
es boreliano para a ∈ (0, 1]. Con ese fin, consideramos el conjunto numerable
B de subgrafos finitos conexos con un punto base fijado y cuyas aristas están
etiquetadas con elementos de Σ. Dado un punto x ∈ X, diremos que un grafo
B ∈ B es realizable en la órbita ΓΣ (x) si para todo camino (σ1 , . . . , σk ) en B
partiendo del punto base, se tiene que x ∈ dom(σk ◦ . . . ◦ σ1 ) y x es un punto
fijo de σk ◦ . . . ◦ σ1 si y sólo si el camino es un lazo. Llamaremos Bx al grafo
realizado y denotamos XB al conjunto boreliano formado por los puntos de X
tales que B es realizable en su órbita.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
72
Cada grafo finito B ∈ B tiene una cantidad finita de posibles bordes de
aristas. Denotamos BF al conjunto de los pares (B, F ) donde B ∈ B es un
grafo finito con borde F y llamamos X(B,F ) al boreliano de puntos de X tales
que (B, F ) es realizable en sus órbitas. En estos términos, para cada x ∈ X, el
suceso [x = ∞] se descompone en la unión disjunta:
G
G
{ω ∈ Ωx | Cω (x) = B.x} =
{ω ∈ Ωx | ω(B) = 1, ω(F ) = 0}.
(B,F )∈BF
(B,F )∈BF
Para cada (B, F ) ∈ BF la aplicación f(B,F ) : X → [0, 1] definida como
f(B,F ) (x) = Ppx [ω ∈ Ωx | ω(B) = 1, ω(F ) = 0]
solo toma dos valores:
f(B,F ) (x) =
pn (1 − p)m
0
si x ∈ X(B,F ) ,
si x ∈
/ X(B,F ) ,
donde n y m son el número de aristas de B y F respectivamente. Como X(B,F )
es un boreliano, la aplicación f(B,F ) es también boreliana y podemos reescribir
θ(p)−1 ([0, a]) = {x ∈ X | Ppx [x = ∞] ≥ 1 − a} =
{x ∈ X |
X
(B,F )∈BF
f(B,F ) (x) ≥ 1 − a},
de donde se deduce que θ es medible.
Definimos ahora la aplicación de percolación pc : X → [0, 1] que asigna a
cada punto x la percolación crı́tica de su órbita, es decir, pc (x) = pc (ΓΣ (x)).
Proposición 3.3.2 La aplicación de percolación pc es boreliana y constante
sobre las órbitas.
Demostración. Por definición, pc es constante sobre las órbitas. Para ver que
es boreliana, basta probar que los conjuntos p−1
c ([0, a]) son borelianos para cualquier a ∈ (0, 1]. En efecto,
p−1
c ([0, a])
= {x ∈ X | pc (x) ≤ a}
= {x ∈ X | sup{p ∈ [0, 1] | Ppx [x ↔ ∞] = 0} ≤ a}
\
=
{x ∈ X | Pqx [x ↔ ∞] > 0}.
q∈(a,1]
La familia de los conjuntos {x ∈ X | Pqx [x ↔ ∞] > 0} es contractiva cuando
q → a, luego expresamos la intersección usando una subfamilia numerable:
\
\
p−1
{x ∈ X | Pqx [x ↔ ∞] > 0} =
{x ∈ X | θx (q) > 0}.
c ([0, a]) =
q∈(a,1]∩N
q∈(a,1]∩N
Deducimos de la proposición 3.3.1 que se trata de un conjunto boreliano.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
73
Proposición 3.3.3 Si la medida µ es ergódica, entonces la aplicación pc es
constante en µ-casi todo punto.
Demostración. Los conjuntos p−1
c ([a, 1]) son saturados, luego tienen medida
nula o total por ergodicidad. Denotamos
b = ı́nf{a ∈ [0, 1] | µ(p−1
c ([a, 1])) = 0}.
S
−1
−1
Entonces p−1
c ((b, 1]) =
a∈(b,1]∩Q pc ([a, 1]) es de medida nula y pc ([b, 1]) =
T
−1
a∈[0,b]∩Q pc ([a, 1]) es de medida total. Luego, pc es constante igual a b casi
por doquier.
Definición 3.3.4 Se define la percolación crı́tica inferior y la percolación crı́tica superior del pseudogrupo grafado (Γ, Σ) como
pc (Γ, Σ, µ) = ı́nf ess {pc },
pc (Γ, Σ, µ) = sup ess {pc },
donde
ı́nf ess {pc } = sup{a ∈ [0, 1] | µ{x ∈ X | pc (x) < a} = 0},
sup ess {pc } = ı́nf{b ∈ [0, 1] | µ{x ∈ X | pc (x) > b} = 0}.
Estos valores crı́ticos diferencian tres fases en el proceso de percolación: para
p < pc (Γ, Σ, µ), los clústeres son finitos en µ-casi toda órbita, mientras que en
el caso p > pc (Γ, Σ, µ), se tiene que existe al menos un clúster infinito en µ-casi
toda órbita. En el caso intermedio pc (Γ, Σ, µ) < p < pc (Γ, Σ, µ), obtenemos una
fase mixta.
p
pc (Γ)
0
Clústeres finitos
en c.t. órbita
pc (Γ)
1
Hay un clúster infinito
en c.t. órbita
Proposición 3.3.5 Cuando la medida es ergódica, se verifica que
pc (Γ, Σ, µ) = pc (Γ, Σ, µ) = pc (ΓΣ (x))
para µ-casi todo punto x ∈ X.
La prueba es consecuencia directa de la proposición 3.3.3.
Definición 3.3.6 Cuando la medida µ es ergódica, definimos la percolación
crı́tica del pseudogrupo (Γ, Σ) como
pc (Γ, Σ, µ) = pc (Γ, Σ, µ) = pc (Γ, Σ, µ).
Luego, en el caso ergódico, el proceso de percolación es similar al de grafos,
es decir, se divide en dos fases, la fase subcrı́tica y la supercrı́tica:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
74
p
pc (Γ)
0
Clústeres finitos
en c.t. órbita
3.4.
1
Hay un clúster infinito
en c.t. órbita
Espacio de finales y percolación crı́tica
En general, las órbitas de los pseudogrupos grafados carecen de la homogeneidad propia de los grafos de Cayley. No obstante, cuando la medida considerada
es armónica respecto de un recorrido aleatorio (véanse [16] y [1]) y ergódica,
E. Ghys prueba en [7] que las órbitas genéricas presentan cierta ‘periodicidad’
propia de los grafos de Cayley. Por el ejemplo, el siguiente teorema de E. Ghys
([7]) generaliza el teorema de Hopf para grupos. Presentamos la versión discreta
de F. Paulin ([16]):
Teorema 3.4.1 Si (Γ, Σ) es un pseudogrupo grafado actuando sobre un espacio
boreliano estándar (X, µ) dotado de una medida armónica, entonces para µ-casi
todo x ∈ X, el grafo de Cayley de la órbita ΓΣ (x) tiene 0, 1, 2 ó un conjunto de
Cantor de finales.
Cuando las órbitas genéricas del pseudogrupo respecto de una medida armónica tienen más de un final, podemos obtener información acerca del número de
clústeres infinitos. Las herramientas principales son la Proposición fundamental
y la versión discreta ([16]) del lema de la Hipersuperficie de Ghys ([7]):
Proposición 3.4.2 (Proposición Fundamental) Sea (Γ, Σ) un pseudogrupo
grafado sobre un espacio boreliano estándar (X, µ) dotado de una medida armónica. Sea A un boreliano de X. Para µ-casi todo x ∈ X, la intersección de A y
Γ(x) o bien es vacı́a, o bien aproxima cualquier final de ΓΣ (x).
Proposición 3.4.3 (Lema de la hipersuperficie) Sea (Γ, Σ) un pseudogrupo grafado sobre un espacio boreliano estándar (X, µ) dotado de una medida
armónica. Supongamos que µ-casi toda órbita tiene al menos dos (respectivamente tres) finales. Entonces existe un boreliano A de X de medida positiva, un
grafo finito enraizado G y una aplicación inyectiva medible ϕ : G × A → X que
envı́a (∗, x) sobre x y tal que:
1. La aplicación ϕ induce un isomorfismo de G × {x} sobre un subgrafo G.x
de ΓΣ (x), para todo x ∈ A.
2. El espacio ΓΣ (x) − G.x posee al menos dos (respectivamente tres) componentes conexas no acotadas, para todo x ∈ A.
3. Para todo par x, y ∈ A tal que y ∈ ΓΣ (x), la distancia entre G.x y G.y es
al menos 2.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
75
Utilizando la notación empleada en la proposición 3.4.3, denotamos
G
G.A = ϕ(G × A) =
G.x.
x∈A
Puesto que la medida µ es armónica, podemos aplicar la proposición fundamental, de manera que, para casi todo x ∈ X,
G
G.A ∩ ΓΣ (x) =
Gnx
n∈N
donde {Gnx } es una sucesión infinita de copias de G disjuntas dos a dos que
aproxima a los finales y que podemos ordenar en función de la distancia al
punto x.
x
desconecta a la
Recordemos además que, para cada m ∈ N, el grafo Gm
x
es la
órbita ΓΣ (x) en al menos dos componentes conexas no acotadas. Si Cm
x
componente conexa (acotada o no) de ΓΣ (x) − Gm que contiene al punto x,
x
denotamos por Um
su complementario en la órbita, es decir
x
x
Um
= ΓΣ (x) − Cm
.
La demostración de nuestros resultados se basa en el siguiente lema cuya
prueba puede verse en [6].
Lema fundamental 3.4.4 Sea G un grafo conexo infinito y G un grafo finito.
Supongamos que G contiene una cantidad infinita numerable de copias de G
disjuntas dos a dos que denotamos {Gn }. Entonces para cada p ∈ (0, 1), al
realizar p-percolación de Bernoulli sobre G desaparecerá casi seguro una cantidad
infinita de grafos Gn .
3.5.
Pseudogrupos con 2 finales
Sabemos que los grafos de Cayley cuyas órbitas genéricas tienen dos finales
no poseen clústeres infinitos para p < 1. En el caso armónico, sucede lo mismo
para pseudogrupos cuyas órbitas genéricas tiene dos finales.
Teorema 3.5.1 Sea (Γ, Σ) un pseudogrupo grafado finitamente generado que
actúa sobre un espacio boreliano estándar X dotado de una medida de probabilidad µ armónica y ergódica. Si µ-casi toda órbita tiene 2 finales, entonces
pc (Γ, Σ, µ) = 1.
Demostración. Usaremos las notaciones del lema 3.4.3. Para casi todo x ∈ X,
se tiene que
G
G.A ∩ ΓΣ (x) =
Gnx
n∈N
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
76
donde Gnx son copias de G que desconectan a la órbita en dos componentes
infinitas y aproximan los dos finales. Puesto que hay dos subsucesiones que convergen a cada uno de los finales, podemos reordenarlas y denotarlas {Gnx }n∈Z+
x
x
y {Gnx }n∈Z− , de manera que Un+1
⊂ Unx si n ∈ Z+ y Un−1
⊂ Unx si n ∈ Z− .
Ahora, fijado el parámetro p ∈ (0, 1), percolamos simultáneamente las órbitas del pseudogrupo. Por el lema fundamental 3.4.4, sabemos que en casi toda
órbita ΓΣ (x) desaparece una infinidad de grafos de las sucesiones {Gnx }n∈Z+ y
{Gnx }n∈Z− con toda seguridad. Luego los clústeres son finitos en casi toda órbita,
o equivalentemente, pc (Γ, Σ, µ) = 1.
3.6.
Pseudogrupos con un Cantor de finales
Cuando hacemos percolación clásica sobre un árbol T , obtenemos una infinidad de clústeres infinitos en la fase supercrı́tica pc (T ) < p < 1 (véase [17]).
Lo mismo sucede para grafos de Cayley con un Cantor de finales. Basándonos en las demostraciones clásicas y utilizando la estructura geométrica de las
órbitas descrita en [16], probamos un resultado análogo para pseudogrupos grafados finitamente generados cuyas órbitas genéricas tienen un Cantor de finales
respecto de una medida de probabilidad armónica ergódica.
Teorema 3.6.1 Sea (Γ, Σ) un pseudogrupo grafado finitamente generado que
actúa sobre un espacio boreliano estándar X, dotado de una medida de probabilidad µ armónica y ergódica. Supongamos que µ-casi toda órbita tiene un
Cantor de finales. Entonces, en la fase supercrı́tica pc (Γ, Σ, µ) < p < 1, existe
una infinidad de clústeres infinitos en µ-casi toda órbita.
Demostración. Usando las notaciones del lema 3.4.3, consideramos el boreliano de medida positiva Y = X − G.A ⊂ X y el subpseudogrupo grafado
inducido (ΓY , ΣY ) donde ΣY = {σ|Y : dom(σ) ∩ Y → im(σ) ∩ Y | σ ∈ Σ}. La
estructura métrica de las órbitas de ΓY es la inducida por la de las órbitas de
Γ sobre el boreliano Y . Llamamos ΓY (y) a la órbita grafada de ΓY en un punto y ∈ Y y denotamos µY a la medida de probabilidad inducida. Cada órbita
del pseudogrupo de partida Γ contiene una infinidad numerable de órbitas del
pseudogrupo ΓY .
Consideramos la aplicación de percolación pYc : Y → [0, 1] que asigna a cada
punto y ∈ Y el valor pYc (y) := pc (ΓY (y)), y denotamos por p a la percolación
crı́tica inferior del pseudogrupo ΓY (véase la definición 3.3.4)
p = pc (ΓY , ΣY , µY ).
Además, puesto que la órbita ΓY (y) es un subgrafo de ΓΣ (y) se verifica
pc (Γ, Σ, µ) ≤ p.
La prueba del teorema se divide en el estudio de los dos siguientes casos:
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
77
1. pc (Γ, Σ, µ) < p ≤ p,
2. p > p.
Aunque en ambos casos hay clústeres infinitos en las órbitas genéricas de Γ,
en el primero los clústeres de las órbitas genéricas de ΓY son finitos, mientras que
en el segundo hay un conjunto de medida positiva de órbitas de ΓY que poseen
un clúster infinito. Veamos que en ambos las órbitas genéricas de Γ poseen una
infinidad de clústeres infinitos.
- Caso 2. Si suponemos que p > p, el boreliano
C = pYc
−1
((p, p)) = {y ∈ Y | p < pc (ΓY (y)) < p}
verifica µY (C) > 0 y en consecuencia µ(C) > 0. Por la proposición fundamental
de E. Ghys, sabemos que C aproxima los finales de casi toda órbita de Γ debido
a la armonicidad de µ. Luego, para µ-casi todo x ∈ X,
G
x
ΓΣ (x) ∩ C =
Cm
m∈N
x
} es una sucesión infinita numerable de subgrafos infinitos conexos y
donde {Cm
disjuntos contenidos en ΓΣ (x) − G.A. Al borrar cualquier grafo Gnx de la órbita
x
ΓΣ (x), separamos al menos dos subgrafos de la sucesión {Cm
}.
Al hacer percolación de Bernoulli de parámetro p sobre las órbitas de Γ,
x
obtenemos en cada componente Cm
un clúster infinito ya que su percolación
crı́tica es menor que p. Por otra parte, con total seguridad desaparece una
cantidad infinita de los subgrafos {Gnx }. De manera que hay una infinidad de
x
que permanecen disjuntos con
clústeres infinitos contenidos en los grafos Cm
total seguridad.
- Caso 1. Si suponemos que pc (Γ, Σ, µ) < p ≤ p, entonces hay clústeres infinitos
en las órbitas genéricas de Γ, pero dichos clústeres no están contenidos en las
componentes conexas de Y sino que intersecan infinitas veces el conjunto G.A.
Consideremos pc (Γ, Σ, µ) < q < p. Para µ-casi todo punto x ∈ X, tenemos
entonces las siguientes propiedades:
i) Existe al menos un entero n ∈ N tal que pc (Unx ) ≤ q. En efecto, si suponemos que pc (Unx ) > q para todo n ∈ N, entonces los clústeres de Unx son finitos
y los clústeres infinitos de ΓΣ (x) debe estar contenido en el complementario de
G.A. Por hipótesis esto no es posible.
x
ii) Existen dos componentes disjuntas no acotadas Unx0 y Um
verificando
0
x
pc (Unx0 ), pc (Um
)
≤
q.
Razonamos
por
reducción
al
absurdo.
Supongamos
que
0
x
x
para todo par Unx , Um
con pc (Unx ), pc (Um
) ≤ q se tiene
x
Unx ∩ Um
6= ∅.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
78
Tomando n0 = mı́n{n ∈ N | pc (Unx ) ≤ q} y aplicando el mismo razonamiento
del punto (i) al subgrafo Unx0 , podemos considerar el menor natural n1 tal que
Unx1 ⊂ Unx0 y pc (Unx1 ) ≤ q. Reiterando el mismo argumento, obtenemos una
subsucesión {nk } tal que Unxk+1 ⊂ Unxk y pc (Unxk ) ≤ q para todo k ∈ N. Además,
para n ∈
/ {nk }, pc (Unx ) > q. Obtenemos la contradicción deseada: hay al menos
un
infinito en la órbita ΓΣ (x) que posee un único final contenido en
T clúster
x
U
,
nk ∈N nk de manera que todo camino de aristas infinito del clúster interseca
a los grafos Gnxk . Esto no es posible ya que desaparece una cantidad infinita de
los grafos Gnxk de acuerdo con el lema fundamental 3.4.4.
Una vez probadas las propiedades (i) y (ii), continuamos con la demostración
x
los mismos
manteniendo la notación de (ii). Aplicamos ahora al subgrafo Um
0
x
x
x
argumentos. Es decir, existen Un1 , Um1 ⊂ Um0 disjuntos verificando
x
pc (Unx1 ), pc (Um
) ≤ q.
1
Procediendo de manera recurrente, obtenemos una sucesión de subgrafos {Unxk }
disjuntos dos a dos, separados entre sı́ por los grafos finitos Gnxk y verificando
pc (Unxk ) ≤ q. Para finalizar, hacemos percolación de parámetro p > q sobre las
órbitas. Cada subgrafo Unxk posee al menos un clúster infinito y por el lema
fundamental 3.4.4 una infinidad de los grafos Gnxk desaparecen, luego existe una
cantidad infinita de clústeres infinitos.
Referencias
[1] F. Alcalde, M.P. Fernández de Córdoba, Nombre de branchement d’un
pseudogroupe. Monats. Math., 163, (2011), 389–414
[2] M. Bermúdez. Laminations boréliennes, Thèse UCB-Lyon 1, 2004.
[3] M. R. Bridson, A. Haefliger. Metric spaces of non-positive curvature. Springer, Verlag Berlin Heidelberg, 1999.
[4] R. M. Burton, M. Keane, Density and uniqueness in percolation Comm.
Math. Phys, 121 (1989), 501–505.
[5] J. Feldman, C. C. Moore, Ergodic equivalence relations, cohomology and
von Neumann algebras I. Trans. Amer. Math. Soc., 234 (1977), 289–324.
[6] M.P. Fernández de Córdoba, Número de ramificación y percolación de un
pseudogrupo. Tesis de la Universidad de Santiago de Compostela, 2012.
[7] E. Ghys, Topologie des feuilles génériques. Ann. of Math., 141 (1995), 387–
422.
[8] G. Grimmett. Percolation. Springer-Verlag, Berlin, 1999.
[9] A. Haefliger, Variétés feuilletés, Ann. Scuola Norm. Sub. Pisa, 16 (1962),
367–397
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Marı́a Pérez Fernández de Córdoba
79
[10] O. Häggström, Y. Peres, R.H. Schonmann, Percolation on transitive graphs
as a coalescent process: Relentless merging followed by simultaneous uniqueness, in Perplexing Problems in Probability (Papers in Honor of Harry
Kesten). Birkhauser, Boston, 1999,69–90.
[11] H. Hopf, Enden offener Räume und unendliche diskontinuierliche Gruppen.
Comment. Math. Helv., 16 (1944), 81-100.
[12] R. Lyons, Random walks and percolation on trees. Ann. Probab., 18 (1990),
931–958.
[13] R. Lyons, Y. Peres. Probability on trees and networks. Draft Version 2012.
[14] R. Lyons, O. Schramm, Indistinguishability of Percolation Clusters. Ann.
Probab., 27(4) (1999), 1809–1836.
[15] C.M. Newman, L.S. Schulman, Infinite clusters in percolation models. J.
Statist. Phys., 26 (1981), 613–628.
[16] F. Paulin, Propriétés asymptotiques des relations d’équivalences mesurées
discrètes. Markov Process. Related Fields, 5 (1999), 163–200.
[17] Y. Peres, J.E. Steif, The number of infinite clusters in dynamical percolation. Probab. Theory Related Fields, 111 (1998), 141–165.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 55–79
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
ALTERNATIVA LOCAL DE BRUNELLA - IDEAS
SOBRE UN TRABAJO EN CURSO
MARIANNA RAVARA VAGO
Introducción
Hace algunos años, Marco Brunella propuso la siguiente conjetura
3
sobre foliaciones holomorfas de codimensión uno en P :
Sea F foliación holomorfa de codimensión 1 en P3 . Entonces F
cumple una de las siguientes alternativas:
(a)
F posee una supercie algebraica invariante.
(b) Existe una foliación holomorfa G , por curvas algebraicas,
tangente a F .
En este texto mostramos el funcionamiento de la Conjetura desde
un punto de vista local y simplicado. Siempre consideraremos una
3
foliación F holomorfa de codimensión uno de (C , 0) de
,
tipo general
es decir, las singularidades no resonantes son linealizables y no hay
singularidades de tipo sillas-nodo. El argumento fundamental es que,
si
F
no tiene germen en el origen de supercie invariante - un objeto
que tiene estructura trascendente - entonces la trascendencia se
divide entre todas las hojas que están en un entorno del origen en
la forma de la siguiente propiedad: toda hoja que se acumula en
el origen contiene un germen de curva analítica invariante. O sea,
esencialmente el objetivo es estudiar la
(Alternativa Local de Brunella) Si F es una foliación holomorfa de
codimensión uno de (C3 , 0) de tipo general que no tiene supercie
invariante, entonces existe un entorno
de 0 ∈ C3 , W , unión de
hojas de F , tal que cada hoja de F contiene un germen de curva
W
analítica invariante.
La principal herramienta empleada es el morsmo de reducción
de singularidades de
F
(ver [1]), que describimos brevemente en la
81
82
sección siguiente. En [2], F. Cano y D. Cerveau exhiben condiciones bajo las cuales
F
posee un germen en el origen de supercie
invariante. En este trabajo usamos el método descrito en [2] para
encontrar las obstrucciones a la construcción de dicha supercie - a
saber, la existencia de una componente no invariante en la preimagen del origen tras el proceso de desingularización. Visto que este
trabajo pretende tratar un caso más simplicado, ponemos condiciones adicionales en el morsmo de reducción.
Parte de este trabajo es hecho desde un punto de vista local (en
entornos de los puntos regulares y singulares de la foliación en etapas intermedias de la desingularización), y parte desde un punto de
vista global (usamos el término global para referirnos al comportamiento de las hojas cerca del divisor excepcional total, también
en etapas intermedias de la reducción de singularidades). Para no
sobrecargar el texto, en la sección sobre el estudio local preferimos
no exponer los detalles demasiados técnicos una vez que los mismos
ya están descritos en trabajos anteriores (por ejemplo, en [3]). En el
estudio global explicamos, también abdicando de los detalles técnicos, los dos tipo fundamentales de argumentos utilizados para llegar
al resultado que buscamos.
Finalizamos el texto con un ejemplo sencillo que, esperamos, ayude a jar las ideas y argumentos presentados.
Reducción de Singularidades en Dimensión 3
Brevemente explicaremos la desingularización de
F,
la principal
herramienta a ser usada (para más detalles ver [1]). Llamamos
π1 ◦ π2 ◦ · · · ◦ πN : MN → M0 = (C3 , 0)
singularidades de F ,
π1
π2
πN
(C3 , 0) = M0 ←−
M1 ←−
· · · ←−
MN .
Utilizamos la siguiente notación (1
≤ s ≤ N ):
σ s = π1 ◦ π 2 ◦ · · · ◦ πs ,
ρs = πs+1 ◦ πs+2 ◦ · · · ◦ πN ,
Ys−1 = centro
Dss
=
π=
el morsmo de reducción de
de
πs ,
πs−1 (Ys−1 ),
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
83
Dis = transformado
E s = D1s ∪ D2s ∪ · · · ∪ Dss =
estricto por
πs
de
Dis−1 , i < s,
divisor excepcional total de cada etapa,
∗
F1 = π1∗ F, . . . , Fs = πs∗ Fs−1 , . . . , FN = πN
FN −1 = π ∗ F.
En toda etapa intermedia Ms , las componentes irreducibles del
s
divisor E y los centros de explosión tienen
cruzamientos normales, es decir: existen coordenadas (x1 , x2 , x3 ) y un número
entero m,
Q
0 ≤ m ≤ 3, tales que localmente se tiene P
E s = { 3i=m+1 xi = 0},
Ys−1 ⊂ E s , y Fs es generada por una 1-forma m
i=1 ai (x1 , . . . , xm )dxi .
N
N
e,
es dicrítica si no es invariante por F
Una componente Di ⊂ E
e. Caso contrario, es una
o sea, si es genéricamente transversal a F
con
componente
invariante.
El objetivo del morsmo
FN = π ∗ F
MN
en
sean
π
es hacer con que todos los puntos de
simples
en dimensión 3. Explicaremos como
son, desde un punto de vista geométrico, dichos puntos. Denimos
el
tipo dimensional
de un punto
necesarias para describir
mos
1 ≤ τp ≤ 3.
divisor que
ep
contienen p;
Sea
FN
p, τ p ,
como el número de variables
localmente en
p. En dimensión 3, tene-
el número de componentes irreducibles del
entonces podemos tener 0 ≤ ep ≤ 3. Si p es
E N que contienen p (caso
simple, las componentes irreducibles de
existan) tienen cruzamientos normales y además
τp
y
ep
cumplen la
desigualdad
τp − 1 ≤ ep ≤ τp .
ep = τp son llamados esquinas,
ep = τp − 1 son llamados trazas.
Los puntos tales que
los puntos tales que
Observación:
cular
ep
y
mientras que
las componentes dicríticas no son consideradas al cal-
τp ,
pero aún así se debe pensar que, en dimensión 3,
el tipo dimensional máximo permitido para cualquier punto simple
es 3; es decir, por un punto tal que
τp = 1
pasan como mucho dos
componentes dicríticas (que además es transversal a las dos direcciones trivializadoras), por un punto con
τp = 2
pasa como mucho
una componente dicrítica (transversal a la - única - dirección trivializadora), y por un punto con
τp = 3
no pasa ninguna componente
dicrítica.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
84
Por lo tanto, es posible hacer un catálogo de cómo son, en esencia,
los puntos simples en dimensión 3.
Los puntos de tipo dimensional 1 son los puntos regulares de
FN , y
pueden estar en una componente invariante del divisor (en el dibujo
abajo tenemos a la izquierda un punto regular esquina) o en una hoja
(punto regular traza, a la derecha). Localmente podemos escribir en
coordenadas
FN = {dz = 0}. Pueden existir una o dos componentes
dicríticas pasando por un punto regular, que deben ser transversales
a la foliación y entre sí (por ejemplo, los planos coordenados
y/o
{y = 0}).
τp = 1
ep = 1
{x = 0}
τp = 1
ep = 0
E = {z = 0}
P
P
FN = {dz = 0}
FN = {dz = 0}
Los puntos de tipo dimensional 2 son esencialmente singularidades simples en dimensión 2 trivializadas por un campo de vectores
ξ
tangente a
FN .
Como consecuencia, las singularidades de tipo di-
mensional 2 no son aisladas y los puntos de una misma curva son
iguales. Si hay alguna componente dicrítica pasando por un punto, dicha componente es obligatoriamente transversal a la dirección
trivializadora
ξ.
A la izquierda tenemos un punto esquina, y a la
derecha un punto traza.
Dk
τp = 2
ep = 2
ξ
P
Sing
S
τp = 2
ep = 2
ξ
Di
P
FN
Sing
Di
FN
Los puntos de tipo dimensional 3 no tienen equivalencia en dimensión 2. Una singularidad
curvas contenidas en Sing
FN
p
con
τp = 3
es intersección de tres
cuyos puntos son, cerca de
p, singula-
ridades de tipo dimensional 2 - y por lo tanto, es una singularidad
aislada. En la gura abajo, tenemos a la izquierda un punto esquina,
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
85
y a la derecha un punto traza. Observe que por
p
no pasa ninguna
componente dicrítica.
Sing
FN
Sing
Dl
τp = 3
ep = 3
Dk
Sing
Sing
FN
Di
FN
Sing
Dl
τp = 3
ep = 2
S
P
FN
Sing
P
FN
FN
Di
Presentación del Problema
Vamos a imponer sobre el morsmo
M0 = (C3 , 0)
π = π1 ◦ π2 ◦ · · · ◦ πN : MN →
las siguientes condiciones adicionales:
1: π1 está centrado en el origen y es la única explosión dicrítica.
2: No se usan curvas compactas como centros de explosión. Es
es el centro de πs entonces o bien Ys−1 = {ps−1 }
−1
es un punto de σs−1 (0), o bien Ys−1 es un germen de curs−1
va con cruzamientos normales con E
tal que su imagen
3
σs−1 (Ys−1 ) ⊂ (C , 0) es un germen de curva.
decir, si
Ys−1
s
Por lo tanto se tiene que en cada etapa, el divisor excepcional E
−1
s
tiene una parte compacta - σs (0), unión de los Di que se proyecs
tan en el origen - y una parte no compacta - unión de los Di que se
proyectan en gérmenes de curva en el origen. El hecho de que la pri3
−1
mera explosión es centrada en 0 ∈ C garantiza que σs (0) es unión
s
de componentes irreducibles de E . En [2], F. Cano y D. Cerveau
describen un método para la construcción de una supercie invariante cuando la foliación
F
es no dicrítica, es decir, cuando todas
las componentes irreducibles del divisor excepcional nal son invariantes. Dicho método consiste en encontrar una curva de singularidades traza cuyos puntos genéricamente tienen tipo dimensional 2,
γ ⊂
Sing
FN ;
una vez que en
en cada punto de
γ
MN
todos los puntos son simples,
encontramos un germen de supercie invariante
que se reposa sobre
γ.
Porque no hay componentes dicríticas es
posible prolongar dicho germen de supercie invariante a lo largo de
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
86
la componente conexa de curvas de tipo traza que contiene
esa manera obtener una supercie algebraica
yecta por
π
cerrada,
γ
y de
que se pro-
en una supercie cerrada que se acumula en el origen.
Por esa razón, una consecuencia del hecho de que
F
no tiene super-
cie invariante y del método previamente descrito es la existencia
−1
de al menos una componente irreducible dicrítica en π
(0) (parte
N
compacta de E ); para simplicar el problema, pedimos que dicha
N
componente genéricamente transversal sea únicamente D1 , lo que
justica la condición . Pedimos la condición
para que la parte
−1
compacta del divisor excepcional en cada etapa (σs (0)) sea unión
de componentes irreducibles tal que cada componente es isomorfa a
2
un P en el momento en que es generada.
1
2
Volvamos a la Alternativa Local de Brunella. Queremos usar la
desingularización de
π −1 (0)
F
a nuestro favor y construir un entorno de
W de 0 ∈ C3 que buscamos.
que se proyecte en el entorno
Sabemos que si una hoja L de FN interseca la componente dicrítica
D1N es posible encontrar un germen de curva analítica contenida en
L. Si L es una hoja que se acumula en π −1 (0) y que corta a D1N ,
entonces
π(L) se acumula en el origen y contiene un germen de curva
analítica invariante. Por lo tanto, queremos mostrar que el conjunto
H ∪ E N , donde
H = unión
es un entorno de
de hojas de
π −1 (0);
así
FN
que cortan
W = π(H)
D1N ,
será el entorno de
0 ∈ C3
que buscamos. O sea, principalmente queremos estudiar el compor−1
tamiento de las hojas que se acumulan cerca de π
(0) y mostrar
que, bajo las hipótesis sobre la foliación y el morsmo de desingu−1
larización, las hojas que se acumulan cerca de π
(0) cortan a D1N .
Denición Sea DiN ⊂ E N una componente irreducible invariante. DiN está parcialmente
(Sing FN ∩ DiN ).
cubierta
si H ∪ E N es entorno de DiN \
Denición Sea A ⊂ MN un subconjunto cualquiera. A está
cubierto
si H ∪ E N es entorno de A.
Es decir, nuestro objetivo es mostrar que
π −1 (0) ⊂ E N
bien
está bien
cubierto. Lo primero a observar es que si una componente invariante
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
DiN ⊂ π −1 (0)
87
corta a
D1N ,
entonces está parcialmente cubierta. De
N
N
hecho, tomamos una pequeña sección ∆q ⊂ D1 transversal a Di
entonces ∆q ⊂ H y por lo tanto SatFN (∆q )
0
N
es un entorno del punto q . Sea q ∈ Di un punto regular cualquiera
N
N
(distinto de q ). Como Di \ (Sing FN ∩ Di ) es conexo por cami0
nos, encontramos un camino compacto α que une q y q y tal que
en un punto regular
α ∩ Sing FN = ∅.
q;
Cubrimos
α
con un número nito de abierto fo-
liados y obtenemos que (disminuyendo
q0.
∆q
es entorno de
si necesario) SatFN (∆q )
El argumento anterior es generalizado en el siguiente
Lema 1. Si DiN es una componente irreducible de π−1 (0) tal que
existe una sección ∆q , transversal a DiN en un punto regular q , contenida en H ∪ E N , entonces DiN está parcialmente cubierta.
El Lema 1 permite concluir que no es difícil cubrir los puntos reπ −1 (0): si un punto regular
gulares de una componente invariante de
está bien cubierto entonces esa propiedad se propaga a los demás
puntos regulares de dicha componente. La dicultad reside en cubrir
−1
los puntos singulares de las componentes invariantes de π
(0).
En [4], D. Marín y J-F. Mattei dan la siguiente
Denición En dimensión 2, una singularidad es de tipo
puede ser localmente escrita como
λ
dx
dy
+ µ + términos
x
y
nodal
si
de mayor grado
donde λ · µ 6= 0 y λ\µ ∈ R<0 \ Q<0 .
Las singularidades nodales en dimensión 2 son siempre linealizables y su caracterización topológica es la existencia de un cerrado
saturado cuyo complemento es un entorno desconexo de las dos separatrices de la singularidad. En dimensión 3, nos interesan las curvas
del conjunto singular tales que genéricamente cada punto tiene tipo
dimensional 2 y, al hacer una sección de dimensión 2 transversal a la
curva en un punto genérico, dicho punto es una singularidad nodal
en la sección. A estas curvas las llamamos
curvas nodales.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
88
Estudio Local de las Singularidades en Dimensión 3
Explicamos brevemente como es hecho el estudio local del comportamiento de las hojas cerca de los puntos singulares. Empecemos
−1
con un punto singular p ∈ π
(0) de tipo dimensional 2: p está
contenido en dos separatrices de FN , supongamos que dichas sepaN
N
−1
ratrices sean Di , Dk ⊂ π
(0) (el argumento que sigue funciona de
modo exactamente igual si sustituimos una componente invariante
por un germen de supercie en el punto). Tomamos una sección de
N
dimensión uno, ∆q , transversal a Di en un punto regular q . Enton-
q se tiene que todas las hojas de FN
∆q . Consideramos ahora una sección
Γ, transversal a DiN ∩ DkN en p. Podegeneralidad, que q ∈ Γ y ∆q ⊂ Γ.
ces en un abierto que contiene
que se acumulan en
q
cortan
plana no invariante por
FN ,
mos suponer, sin pérdida de
Γ tenemos la siguiente situación en dimensión 2: p es
N
un punto singular y la sección ∆q es transversal a Di en un punto
regular. Si p no es singularidad nodal, entonces podemos encontrar
2
2
un polidisco Dδ 3 p, Dδ ⊂ SatFN |Γ (∆q ); o sea, las hojas que se acumulan en q (y que por lo tanto cortan ∆q ) también se acumulan en p.
Como p es un punto de tipo dimensional 2, esa propiedad es propaN
N
N
N
gada a lo largo de Di ∩ Dk : encontramos un entorno de Di ∩ Dk
que está contenido en SatFN (∆q ) (ver [3]). Si, por otro lado, p es
un punto nodal (en dimensión 2), el argumento falla: el saturado
de la sección ∆q no es un entorno de p en Γ, y como consecuencia
N
N
SatFN (∆q ) no es un entorno de Di ∪ Dk .
Entonces en
N
Sea ahora p una singularidad de tipo dimensional 3, y sean Di ,
DkN , DlN ⊂ π −1 (0) las tres separatrices que se intersecan en p (nuevamente, el argumento es verdadero si sustituimos una componente
invariante por un germen de supercie en el punto). Como las singularidades no resonantes son linealizables podemos escribir localmente en
p
dx
dy
dz
FN = ω =
+ λ + µ = 0 , λ, µ ∈ C∗ .
x
y
z
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
89
Queremos repetir la idea del argumento anterior: tomar una sección
∆q transversal a DiN en un punto regular q y estudiar en cuales condiciones se tiene que SatFN (∆q ) es un entorno del origen
p.
N
Ponemos coordenadas locales en p: p = (0, 0, 0) el origen, y Di =
{z = 0}, DkN = {x = 0}, DlN = {y = 0}. Sea q = (1, 1, 0) y
∆q = {1} × {1} × Dε . Sea P 0 = (p1 , p2 , p3 ) un punto próximo de p
0
tal que pi 6= 0 ∀i (o sea, P ∈
/ DiN ∪ DkN ∪ DlN ). Tomamos la sección
0
plana ΓP 0 ,y = {y = p2 }. Consideremos el punto q = (1, p2 , 0) ∈ ΓP 0 ,y
0
y la sección ∆q 0 = {1} × {p2 } × Dε0 : como q es un punto regular
0
N
de Di , podemos tomar ε suciente pequeño de manera que las hojas que corten a
∆q0
también corten a
∆q .
Por lo tanto queremos
δ sucientemente pequeño tal que para todo punto en
Dδ × {p2 } × Dδ , la hoja de FN que pasa por dicho punto corta a ∆q0 ,
y en consecuencia a ∆q .
encontrar un
Como en dimensión
2,
el comportamiento de las hojas es conse-
λ, µ.
cuencia de la naturaleza de
Los posibles casos son:
1− λ o µ ∈ C \ R. Podemos encontrar un polidisco D3δ 3 p, D3δ ⊂
SatFN (∆q ). Hay dos posibilidades que dependen de λ, µ: o bien los
tres ejes X, Y, Z son no nodales, o bien como máximo uno de los
tres ejes es nodal. En ambos casos no hay problema en encontrar el
3
polidisco Dδ .
2− λ, µ ∈ R>0 .
Los tres ejes X, Y, Z no son nodales y también
3
3
encontramos polidisco Dδ 3 p, Dδ ⊂ SatFN (∆q ).
3− λ ∈ R>0 y µ ∈ R<0 .
Z no lo es. En ese caso,
Entonces los ejes
X, Y
son nodales y el
SatFN (∆q ) no es entorno de p (más bien
N
tiene un formato de cuña que separa Di de las otras dos separatrices). Sin embargo encontramos un entorno de X ∪ Y tal que las
eje
X
X ∪Y
Y , es decir, un
hojas que se acumulan en
también se acumulan en
entorno tubular de
donde el comportamiento de las hojas
cerca de un eje se propaga al otro eje.
Pasaje al Estudio Global
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
90
Veamos ahora las implicaciones que siguen del estudio local en el
comportamiento de las hojas cerca de las componentes invariantes
−1
de π
(0).
Proposición 1. Si Sing FN no tiene curvas nodales entonces π−1 (0)
está bien cubierto.
Dem: El grafo dual de π−1 (0) es conexo; dada DlN ⊂ π−1 (0) invariante, encontramos secuencia nita de componentes invariantes
El,1 = DlN , . . . , El,m−1 = DsN , El,m = D1N , El,i−1 ∩ El,i 6= ∅ ,
que conectan
DlN
a la componente dicrítica
D1N ⊂ π −1 (0).
N
La componente El,m−1 = Ds está parcialmente cubierta ya que
N
interseca a D1 . Una vez que por hipótesis no hay curvas nodales,
como consecuencia del estudio local tenemos que los puntos singu-
El,m−1 están bien cubiertos y por lo tanto El,m−2 - que se
interseca con El,m−1 - también está bien cubierta; por inducción,
toda componente El,i está bien cubierta para todo i.
lares de
La obstrucción en mostrar que
π −1 (0)
está bien cubierto surge
cuando tenemos curvas nodales. En particular, como consecuencia
del estudio local son dos las situaciones que resultan problemáticas:
1− Cuando la curva nodal C
contiene apenas puntos de tipo dimen-
sional 2:
Dk
S
Di
C
Di
C
En ambos casos no se puede decir que si
bierta entonces
Di
está parcialmente cu-
Dk /S también lo está; o que si Di
H ∪ E N es entorno de C .
está parcialmente
cubierta entonces
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
91
2− Cuando la curva nodal C
contiene un punto de tipo dimensional
3 que es intersección de dos curvas nodales:
Sing
F
Dk
Dl
S
C0
q
C
F
Sing
Dl
Di
En ambos casos si
Di
C
Dk /S
C0
q
está parcialmente cubierta entonces
también lo está, pero no se puede decir nada de
Di ;
Dl
tampoco se
puede decir que cualquiera de las componentes está bien cubierta.
0
Pero observe que las curvas C y C están en la misma componente
conexa de curvas nodales y por esta razón encontramos un entorno
0
tubular de C ∪ C .
En las dos situaciones anteriores no se puede repetir el argumento
usado en la Proposición 1 y por lo tanto somos forzados a cambiar
el trato del problema. Lo que haremos es mostrar que si existe una
componente conexa de curvas nodales cumpliendo
maremos una componente conexa
no interrumpida
1−
o
2−
- la lla-
- entonces dicha
componente conexa necesariamente no interrumpida corta transver−1
N
(0). Como hemos visto
salmente a la componente dicrítica D1 ⊂ π
en el estudio local, existe un entorno tubular alrededor de la compoN
nente conexa no interrumpida; al hacerla tocar D1 , las hojas cerca
de la componente irreducible que toca la componente dicrítica poseerán un germen de curva analítica invariante y esta propiedad será
propagada a lo largo de toda la componente conexa no interrumpida
gracias a la existencia de dicho entorno tubular. Y con eso termina−1
remos de cubrir π
(0) con el entorno H ∪ E N que buscábamos.
Consideremos el conjunto
MN
que cumplen:
N
unión de las curvas
i−: C es irreducible y C ⊂ Sing FN .
ii−: Los puntos de tipo dimensional 2
en
C
C⊂
Sing
son nodales.
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
FN ⊂
92
iii−:
Ci
Si
C
C = C1 ∪ C2 ∪ · · · ∪ Ck ,
punto q ∈ C de tipo di-
es una componente conexa,
componentes irreducibles, todo
3 es
q = Ck ∩ Ck 0 .
mensional
la intersección de dos de estas componentes:
Proposición 2. Toda componente conexa C de N tiene intersección
no vacía con la componente dicrítica D1N ⊂ π −1 (0).
Dem:
Aquí explicamos, sin entrar en los detalles técnicos, la idea
fundamental de la demostración. Supongamos que exista una comN
ponente conexa C de N tal que C ∩ D1 = ∅. El argumento principal
consiste en mostrar que C nace al mismo tiempo que la primera
−1
componente irreducible invariante de π
(0). Es decir, sea p1 ∈ D11
el centro de explosión de π2 . Entonces en el interior de la componen−1
2
te invariante D2 = π2 (p1 ) ya existirá una curva compacta nodal
C1 ;
como no se usan curvas compactas como centros de explosión,
en el proceso de desingularización de
F
modicaremos como máxi-
C1 , es decir, en MN se tiene que
2
2
es una componente irreducible de C . En M2 , como D2 ' P , las
2
2
curvas compactas C1 y D2 ∩ D1 se intersecan (o sea, C1 corta trans2
versalmente a la componente dicrítica D1 ); la demostración naliza
observando que la propiedad de que una curva nodal interseque la
mo un número nito de puntos de
C1
estable
componente dicrítica es
. Es decir, si una componente irredus
cible de C interseca D1 en una etapa intermedia Ms de la reducción
N
de singularidades de F , entonces C interseca D1 en MN .
Un Ejemplo
Ahora daremos un ejemplo muy sencillo únicamente para jar las
ideas. Sin embargo este es un ejemplo interesante pues presentamos
un argumento (cuya demostración está en [5]) que hace parte de la
demostración de la Proposición 2 y que hará ver cómo se carga la
N
componente no interrumpida C hacia la componente dicrítica D1 ,
mostrando que de hecho
riante nacen juntas.
Sea
F
C
y la primera componente compacta inva-
una foliación holomorfa de codimensión uno de
(C3 , 0)
haciendo tres explosiones centradas en puntos: sea
sin
F
π = π3 ◦ π2 ◦ π 1 :
supercie invariante y supongamos que se puede desingularizar
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
Marianna Ravara Vago
93
M3 → M0 = (C3 , 0) donde el centro de π1 es el origen (y además,
por las hipótesis, π1 es la única explosión dicrítica), el centro de
π2 es un punto p1 ∈ D11 = π1−1 (0) y el centro de π3 es un punto
p2 ∈ D22 = π2−1 (p1 ). Podemos suponer, sin pérdida de generalidad,
0
que p1 es la intersección de X (el transformado estricto del eje
1
X = {y = z = 0} por π1 ) y D1 , y que p2 es la intersección de X 00
0
0
0
2
(el transformado estricto del eje X = {y = z = 0} por π2 ) y D2 .
3
3
Por último, supongamos que C = D3 ∩ D2 - o sea, inicialmente C no
3
interseca con D1 .
∆ ⊂ (C3 , 0) una sección plana no invariante por F que cone = π ∗ ∆ ⊂ M3 ; entonces ∆
e es no invariante
tiene el eje X , y sea ∆
∗
000
por F3 = π F y contiene el eje X
(el transformado estricto de
00
00
00
e es no invariante por F3 se
X = {y = z = 0} por π3 ). Como ∆
tiene que F3 e es foliación en dimensión 2 donde pasa la siguiente
∆
Sea
situación: existen tres componentes irreducibles del divisor excepcio3
e , las
e y D3 = D3 ∩ ∆
e (que es dicrítica), D2 = D3 ∩ ∆
nal, D1 = D1 ∩ ∆
3
2
1
dos últimas
invariantes y además D1 , D2 , D3 ' P . Todos los puntos
F3 e son simples porque todos los puntos de F3 lo son, y el punto
∆
e es nodal en dimensión 2. Aplicamos
p = D2 ∩ D3 = (D23 ∩ D33 ) ∩ ∆
e
el resultado principal de [5]: encontramos un punto q ∈ D3 ⊂ ∆
que no es nodal en dimensión 2 y tal que por q pasa una separatriz
convergente γq .
de
Entonces encontramos un punto
q ∈ D33
que admite un germen de
separatriz convergente pasando por él; como por hipótesis todos los
M3 son simples, existe un germen de supercie invariante
q ; por lo tanto q es un punto de tipo dimensional 2 de tipo traza:
q ∈ Γ donde Γ ⊂ D33 , Γ ⊂ Sing F3 es una curva de singularidades
de tipo traza. Luego tenemos que C y Γ son dos curvas compactas
3
2
0
contenidas en D3 ' P , o sea, C y Γ se intersecan y además q , el
puntos de
en
punto de intersección, es simple, de tipo dimensional 3 y traza: ade0
0
3
más de estar en C y Γ, q pertenece a una curva traza Γ ⊂ D2 , Γ ⊂
Sing F3 . Como C es no interrumpida se tiene obligatoriamente que
Γ0 es una componente irreducible de C .
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
94
Pero observe que cómo
Γ0
es una curva interior de
D23
entonces
es el transformado estricto de una curva que ya existía en
M2
Γ0
y que
- centro de explosión de π3 -, el único punto de
0
2
0
dicha curva que fue modicado por π3 : Γ ⊂ D2 , Γ ⊂ Sing F2 . En
M2 , Γ0 y D12 ∩ D22 son dos curvas compactas contenidas en D22 ' P2 ,
que por lo tanto se intersecan, sea Q el punto de intersección. O sea,
contenía el punto
C
p2
M2 - a
M3 . Sin embargo como los únicos puntos modicados son el origen, p1 y p2 , se tiene que
Q ∈ C en M3 y por lo tanto C llega hasta la componente dicrítica D13 .
llega hasta la componente dicrítica en la etapa intermedia
principio, podría no hacerlo en la etapa nal
Es a esta última observación que nos referimos cuando decimos
que el hecho de que la componente no interrumpida
C
interseca la
componente dicrítica en una etapa intermedia es una propiedad estable. En este ejemplo es muy sencillo ver cómo funciona el argumento
principal de la demostración de la Proposición 2: si suponemos inicialmente que
C
surge solamente con la última explosión invariante,
al nal encontramos una componente irreducible que había nacido
junto con la primera componente invariante (aplicando el resultado
principal de [5]). Por último queremos observar que por inducción
el argumento arriba es válido si tenemos
N
explosiones puntuales.
Referencias
Reduction of the singularities of codimension one singular foliations in dimension three, Annals of Mathematics (2), 160(3):907-1011 (2004).
[2] F. Cano, D. Cerveau, Desingularization of nondicritical holomorphic foliations and existence of separatrices, Acta Mathematica, 169(1-2):1-103
[1]
F. Cano,
(1992).
L'incompressibilité des feuilles de germes de feuilletages holomorphes singuliers, (2006).
[4] D. Marín, J.F. Mattei, Monodromy and topological classication of germs
of holomorphic foliations, (2010).
[5] L. Ortiz-Bobadilla, E. Rosales-González, S.M. Voronin, On
Camacho-Sad's Theorem about the existence of a separatrix, (2008).
[3]
D. Marín, J.F. Mattei,
Rev. Semin. Iberoam. Mat. 4 fasc. II (2013) 8194
ÍNDICE DE ESTE FASCÍCULO
• F. Alcalde Cuesta, P.González Sequeiros, A. Lozano Rojo:
Evolutionary dynamics on graphs.
3–17
• J. M. Aroca:
Sistemas articulados. Teorema de Kempe.
19–53
• Marı́a Pérez Fernández de Córdoba:
Percolación de Bernoulli de un pseudogrupo.
55–79
• Marianna Ravara Vago:
Alternativa Local de Brunella - Ideas sobre un trabajo en curso.
81–94
95
96
97
ARTÍCULOS EN ESTE FASCÍCULO
• F. Alcalde Cuesta, P.González Sequeiros, A. Lozano Rojo:
Evolutionary dynamics on graphs.
3–17
• J. M. Aroca:
Sistemas articulados. Teorema de Kempe.
19–53
• Marı́a Pérez Fernández de Córdoba:
Percolación de Bernoulli de un pseudogrupo.
55–79
• Marianna Ravara Vago:
Alternativa Local de Brunella - Ideas sobre un trabajo en curso.
81–94

Documentos relacionados