Filogeografía

Transcripción

Filogeografía
Curso de Evolución 2014
Facultad de Ciencias
Montevideo, Uruguay
http://evolucion.fcien.edu.uy/
http://eva.universidad.edu.uy/
Variación geográfica
• desde la década de 1960, la electroforesis de proteínas
permitió determinar que:
• la mayoría de las especies tiene poblaciones
estructuradas geográficamente
• el grado y escala en que se manifiesta esta
subdivisión varía según habitat, modos de vida, etc.
7. Variación geográfica. Filogeografía. El
coalescente. Divergencia en aislamiento
estricto.
• las causas y procesos subyacentes pueden incluir:
• aislamiento estricto
• aislamiento parcial (con intercambios)
• divergencia guiada por selección (no excluyente
con las anteriores)
• vamos a enfatizar en esta clase el primer caso
1
2
Variación geográfica
Filogeografía
• en frecuencias alélicas (determinadas por electroforesis
para proteínas, o para microsatélites)
Campo de estudio interesado en los principios y procesos que
gobiernan la distribución geográfica de los linajes, especialmente
aquellos dentro y entre especies cercanamente emparentadas
• en secuencias de ADN (determinadas directa o
indirectamente)
Avise et al., 1987.
• vamos a enfatizar el segundo abordaje
Area A
• usaremos el marco de la filogeografía para
• ilustrar la existencia de variación geográfica
• comenzar a entender los procesos de divergencia
en aislamiento estricto, por deriva genética
FILO
3
Area B
GEO
4
1
ADN mitocondrial
Avise: variación en
el ADN mitocondrial
fuertemente
estructurada
geográficamente
Características “típicas”
(hay muchas variantes):
• genoma compacto
t (~16
( 16 KB)
• numerosas copias por célula
• herencia materna
• no hay recombinación
• evolución rápida
La herencia uniparental sin recombinación llevan a que
los genomas mitocondriales estén relacionados entre sí
por un único árbol genealógico. (“árbol de genes o
alelos, no de individuos”)
5
Ejemplo: rata de pajonal (Scapteromys)
6
Ejemplo: tucu-tucu (Ctenomys pearsoni)
polifilia
monofilia recíproca
A1
A2
A6
70a
A3
A4
A5
56,58,70b
B1
1
11
2
10
3
6
4 5
7
B2
?
56,58
B3
56
B4
9
56,64
B5
B6
C1
66,70c
70b
C3
66
C4
?
C5
70a,70c
64
?
C7
C8
D1
58,70b
C2
C6
7
70b
8
?
64,70b
8
2
Cuatro criterios para postular aislamiento
geográfico histórico
monofilia recíproca
resulta de un proceso
(según Avise 2000)
barrera
geogr
ráfica
Barrera
geográ
áfica
monofilia
recíproca
1. Fuerte apoyo para el árbol (por bootstrap, otros métodos)
95
parafilia
99
polifilia
población
ancestral
2. Concordancia con una división
2
geográfica independiente
(e.g., provincias fitogeográficas)
Historia previa
9
10
Concordancia genealógica
3. Concordancia entre especies (analizadas con el mismo gen)
Especie 1
especie 2
Distintos genes de una misma especie
Burton y Lee, 1994.
Pta. Concepción
4. Concordancia entre genes de una misma especie
Trigriopus californicus
gen 1
gen 2
11
12
3
Concordancia genealógica
Concordancia genealógica
Diferentes especies en provincias biogeogáficas
Diferentes especies con el mismo gen
Eizirik et al. 1998
ocelote
Leopardus pardalis
margay
Leopardus weidii
13
14
Tiempo
pasado
Tiempo
pasado
Avise 2000
presente
15
presente
16
4
pasado
El modelo coalescente
Tiempo
Modelo demográfico: Fisher-Wright
T2
T3
T4
Estudio de las propiedades (genealógicas, mutacionales) de
una muestra de alelos. Típicamente, la muestra está
tomada en el presente y se traza su historia hacia el
pasado.
Una realización del proceso:
Topología.
Tiempos entre eventos de coalescencia {Ti}.
Mutaciones sobre la genealogía.
demografía
mutación
T5
17
presente
T2
Genealogía
• topología
((D,E),(C,(A,B)))
• intervalos de tiempo entre
eventos de coalescencia
{ Ti }, i = 2, 3,…, n
mutaciones sobre ramas (si las
hay)
T3
T4
patrón resultante de variación
genética (sitios variables)
• número
• distribución
di t ib ió
A ggt aca cct ggc
B .a. ... g.. t.t
Sewall Wright propuso que la probabilidad de que
dos genes sean idénticos por descendencia es igual
a:
siendo,
la probabilidad de que
no lo sean
Probabilidad de que el evento de coalescencia ocurra a un
tiempo t
Probabilidad de
coalescencia a tiempo t
Probabilidad de que no
coalescan los dos alelos en las
anteriores t -1 generaciones
T5
A
B
C
D E
5
Aceptando que el tiempo de espera promedio para un evento
infrecuente (como un coalescente) es el inverso de la
probabilidad de dicho evento:
El coalescente con más de dos alelos
Para n=3 alelos, podemos pensar en la probabilidad de coalescencia
como 1/2N para cada disponible para coalescer, es decir P(coal / n =
3) =3/2N.
E (T2) = 2N
(despreciando la probabilidad de que los tres alelos coalescan en un
mismo ancestro en una generación, lo cual es razonable si 2N>>3)
Para una muestra de
n alelos tendríamos
entonces:
lo que equivale a
P(coal ) 
C2i
2N
P(coal ) 
i (i  1) / 2
2N
con i = 2, 3, ….n
E (T3) = 2N/3
E (Ti ) 
para i alelos, el tiempo de espera
es:
El coalescente con más de dos alelos
Implícita en estos resultados está la noción de que son aplicables a un
número cualquiera de alelos, en un momento cualquiera de la historia
genealógica
Es decir que la probabilidad de observar un coalescente para i = 5
alelos es la misma si tomamos en el presente o si los consideramos
hace 500 generaciones
p
es q
que E(Tn)
( ) < E(Tn
( -11) < E(Tn
( -22) < E(T
( 2)).
Otro resultado imporante
Es decir, los tiempos medios de espera se alargan a medida que el
número de linajes se reduce mediante sucesivos coalescentes.
2N
i (i  1) / 2
=
E (Ti ) 
4N
i (i  1)
Veremos ahora el tiempo esperado para el ancestro común mas
reciente (ACMR) de toda nuestra muestra de alelos, deducido a
partir de la ecuación anterior, sumando todos los valores
esperados de Ti:
E (Ti ) 
4N
i (i  1)
n


1
n
E (TACMR )   Ti  4 N 1  
i2
Este valor se interpreta como el doble del número efectivo de genes
de la población (2 en nuestro modelo, 2N alelos), y esta lectura tiene
un valor general.
Sustituyendo el 2N por el número efectivo de genes de un locus
cualquiera, y el resultado es válido.
Ejemplo:
4N = locus dipliode
2N = haploide
N = ADNm, cromosoma Y o ADN de los cloroplastos
6
Tiempo esperado de arribo a la monofilia por deriva:
depende del tamaño efectivo
Tiempo esperado de arribo a la monofilia por deriva:
depende del tamaño efectivo
A partir del modelo coalescente derivamos:
A partir del modelo coalescente derivamos:
 1
E (TMRCA )  4 N 1  
 n
 1
E (TMRCA )  4 N 1  
 n
Para un sistema diploide autosómico, E(TMRCA)
tiende a 4N
2N
Si lo p
pensamos como 2x2N,, es 2 x número
efectivo de genes
Para un sistema mitocondrial:
2 x N = 2 x N/2 = N (1/4 del valor en
un sistema dipliode autosómico)
25
Variabilidad genética en un contexto genealógico
26
Remplazando E(Ti) por 4N/[i(i-1)] y sacando 4N de la sumatoria
como factor común llegamos a:
Proceso genealógico + mutación
n
E (TTOT )   iE (Ti )
i 2
E(s) = T2

Sitios que segregan
esperadas en esta
rama
n 1
1
1
4 N 
(
1
)
i

i2
i2 i
n
E (TTOT )  4 N 
Asumiendo un modelo de sitios infinitos (tasa de mutación baja y un
número alto de clases alélicas posibles) podemos aceptar como una
aproximación razonable que todos los alelos de igual estado deben
ser descendientes de un único alelo (el mutante original).
Los sitios polimórficos esperados estarían dados entonces por:
n
Tiempo total esperado
para toda la genealogía:
E (TTOT )   iE (Ti )
i 2
n 1
n 1
1
1
E ( STOT )  4 N    
i 2 i
i2 i
7
Tiempo esperado de arribo a la monofilia por deriva:
aplicaciones
Tiempo esperado de arribo a la monofilia por
deriva: dos formas de discordancia entre árboles de especie y
árboles de genes
O
G
H
C
O
G
H
C
*
Un árbol de genes igual al árbol
de especies
Tiempo esperado de arribo a la monofilia por
deriva: dos formas de discordancia entre árboles de especie y
árboles de genes
O
G
H
C
Bajo neutralidad, la prob de observar esta discordancia
depende de la prob de que NO haya coalescencia en el
intervalo marcado (*)
Parentesco cercano
30% de los sitios muestran reparto incompleto de linajes (ILS: “incomplete
lineage sorting”) entre humanos, chimpancés y gorila
Algunas cifras:
Intervalo de tiempo: 2 - 4 MA
Tiempo generacional: 20-25
20 25 años
Ne actual en humanos: 10.000
E(TMRCA)= del orden de 1 MA
* Con 1 alelo por especie.
Hay que calcular la prob. de un ancestro de 2-4
o más MA de antigüedad. El resultado en este
caso varía entre 13% y 2%.
Notar que cambios en estimaciones de Ne y
del tiempo generacional pueden cambiar los
resultados de modo sustantivo.
Más que los detalles, importa entender que pueden surgir
discordancias sin flujo génico, por “reparto de linajes”
ancestrales.
A Scally et al. Nature 483, 169-175 (2012) doi:10.1038/nature10842
8
Conclusiones
• las poblaciones naturales están estructuradas en el espacio
• la divergencia es la consecuencia inevitable del aislamiento
geográfico
g
g
((deriva g
genética, mutación))
• la concordancia de patrones filogeográficos sugiere
historias comunes de aislamiento y divergencia
• la divergencia pasa por estados de polifilia y parafilia, hasta
llegar a la monofilia recíproca
• el “ritmo” de la divergencia
g
p
pasiva es 1/2N
• el tiempo esperado de llegada a la monofilia es aprox. 4N
generaciones (para un locus diploide autosómico neutral)
• generalizando, el tiempo de llegada a la monofilia es 2 x
no. de genes en la población (ej., 2 veces N = N, para ADN
mitocondrial)
33
9

Documentos relacionados