ISLAS Cpg y Metilación - Universidad de Granada
Transcripción
ISLAS Cpg y Metilación - Universidad de Granada
ISLAS CpG Y METILACIÓN Cristina Gómez Martín Genómica Computacional y Bioinformática Departamento de Genética, Facultad de Ciencias, Universidad de Granada Laboratorio de Bioinformática, Instituto de Biotecnología, Centro de Investigación Biomédica Metilación del ADN La metilación es la adición de un grupo metilo (-CH3) a una molécula y se observa tanto en el ADN como en ARN y proteínas. En eucariotas se da principalmente en dinucleótidos CG. Como norma general: El 70-80 % de las CpGs están metiladas Proceso de metilación de la citosina en el ADN Funciones de la metilación • • • • • • Es clave en el desarrollo embrionario Inactivación del cromosoma X Impronta génica: Mantenimiento en la expresión específica de un alelo. Splicing alternativo Silenciamiento de elementos repetidos: centrómeros Los grados de metilación de la región promotor de un gen y en el cuerpo génico influye en los niveles de expresión. Hay proteínas que se unen específicamente al DNA metilado (Ej: MECP2) y otras que se unen específicamente a islas CpG no-metiladas (la metilación bloquea la unión) Patrones de metilación Los patrones de metilación (distribución a lo largo de la secuencia) no son iguales en distintos eucariotas •En hongos solo el DNA repetido se metila. •Los mayores niveles de metilación en plantas (hasta el 50% de todas las citosinas) – metilación de contextos non-CpG en elementos transponibles •En general encontramos un mosaico de metilación (regiones metiladas y intercaladas regiones no-metiladas). En los genomas de mamífero predominantemente se metilan los dinucleótidos CpG, con excepción de regiones cortas llamadas islas CpG. DNA methylation landscapes: provocative insights from epigenomics. Mihe M. et al Nature Reviews Genetics 9, 456-476 (June 2008) Islas CpG 70-80 % CG TG Frecuencia de CpG 5 veces más baja de la esperada Desaminación espontanea de metil-citosinas Las CpG permanecen solamente en los sitios en que no se metilan: Islas CpG Propiedades de las Islas CpG 1. Son ricas en G+C (ratio O/E alto) y tienen longitudes alrededor de 1kb 2. Entre el 50 y el 70% de los genes tienen una isla CpG asociada a sus promotores. 3. Casi todos los genes “housekeeping” (se expresan en todos los tejidos) tienen una isla asociada a su promotor pero solo la mitad de los genes específicos la presentan. 4. En los promotores de los genes: Cuando se metilan dan lugar a una inhibición de la transcripción. 5. En el cuerpo génico: Cuando se metilan dan lugar a estabilización de la transcripción 6. En algunas condiciones fisiológicas o patológicas se pueden ver cambios en el estado de la metilación: cáncer Existen tanto métodos experimentales como computacionales para detectar islas CpG Clasificación de las Islas CpG Constitutivamente no-metiladas (asociadas a “Housekeeping genes”) ~100% de los genes domésticos tienen alguna isla asociada Diferencialmente metiladas (genes tejido-específicos) ~50% “Tejido específicos” isla asociada Parcialmente metiladas (genes improntados) DMIs: Islas CpG (CGIs)diferencialmente metiladas MIs: CGIs constitutivamente metiladas UIs: CGIs constitutivamente no metiladas NAs: No cumplen requisitos otras clases Barturen G. 2014. Regiones genómicas implicadas en la metilación diferencial del ADN. Tesis Doctoral, Universidad de Granada Métodos de predicción de islas: Ventanas deslizantes Gran número de parámetros arbitrarios • • • • • • Proporción CpGs observados/esperados %GC Longitud Longitud de ventana Salto Distancia para fusionar proto-islas Ejemplo: CpGplot From Takai and Jones (2002) Métodos de predicción de islas: clusterización Secuencia de DNA CpG -> 1; Otros-> 0 Secuencia binaria: 00010000101000000101000110000100010101000011 Se determina la distancia (d) de cada CpG al siguiente aguas abajo en la secuencia de DNA: 10,5,5,3,1,8,23,34,21,12,2,5,8,6,9,...N-1 Establecemos una distancia umbral dm Si di ≤ dm Establecemos un cluster Por ejemplo, para dm=5: 10,5,5,3,1,8,23,34,21,12,2,5,8,6,9,...N-1 Lista de cluster de CpG con coordenadas, longitud y nº de CpGs Asignar un pvalor a cada cluster Cluster estadísticamente significativo ≡ CpG island Calcular propiedades estadisticas de la secuencia : G+C content, O/E ratio, CpG density, intra-clustering of CpGs, overlap with Alus, PhastCons etc. ¿Qué distancia uso? Si se distribuyeran al azar seguiría una distribución geométrica 𝑃 𝑑 = (1 − 𝑝)𝑑−1 𝑝 P(d), probabilidad de encontrar una distancia d entre CpGs adyacentes y p la probabilidad de encontrar un CpG en la secuencia. Las distancias cortas observadas encuentran sobre-representadas el genoma, por encima de esperado (Existen “Clusters CpGs”). WordCluster - Michael Hackenberg, Pedro Carpena, Pedro BernaolaGalván, Guillermo Barturen, Ángel M. Alganza and José L. Oliver. 2011. Algorithms for Molecular Biology 6:2 El cruce entre observada y esperada se utiliza como distancia para agrupar CpGs. se en lo de Cromosoma 16 Mediana: 31pb Intersección genómica: 33pb Cromosoma 5 Mediana: 49pb Intersección genómica: 33pb WordCluster - Michael Hackenberg, Pedro Carpena, Pedro Bernaola-Galván, Guillermo Barturen, Ángel M. Alganza and José L. Oliver. 2011. Algorithms for Molecular Biology 6:2 ¿Cómo asigno la significación? ¿Cual es la probabilidad de encontrar un cluster con N CpGs y longitud X en una distribución al azar? Binomial Negativa WordCluster - Michael Hackenberg, Pedro Carpena, Pedro Bernaola-Galván, Guillermo Barturen, Ángel M. Alganza and José L. Oliver. 2011. Algorithms for Molecular Biology 6:2 Detectar la metilación Problemas para detectar la metilación: 1) Hibridación es insensible frente a la metilación: no se pueden usar chips de DNA 2) La PCR elimina la información acerca del estado de metilación TRATAMIENTO CON BISULFITO SÓDICO CITOSINA METILADA CITOSINA NO METILADA BISULFITO CM BISULFITO C C C CITOSINA METILADA C T T C CITOSINA NO METILADA Ventajas: • Se obtiene información de metilación para cada citosina y no solo valores medios para una región como ocurre con muchos otros métodos • Se puede detectar la metilación en todos los contextos y no solo CpG Reto: • Re-secuenciar un genoma entero • Alinear miles de millones de secuencias cortas (reads) Problemas: Distinguir entre la acción del bisulfito y : 1. Errores de secuenciación 2. SNV (Single Nucleotide Variation) : Un polimorfismo C/T sería detectado como una citosina no metilada Los valores de metilación oscilan entre 0 y 1, dependiendo de la proporción entre los reads que indiquen la existencia de una citosina metilada y los que indiquen una ausencia de metilación. NGSmethDB http://bioinfo2.ugr.es/NGSmethDB/ Stefanie Geisen, Guillermo Barturen, Ángel M. Alganza, Michael Hackenberg and José L. Oliver. 2014. Nucleic Acids Research, Vol. 42, Database issue D53–D59 Interfaz de herramientas de NGSmethDB http://bioinfo2.ugr.es/NGSmethDB/ Stefanie Geisen, Guillermo Barturen, Ángel M. Alganza, Michael Hackenberg and José L. Oliver. 2014. Nucleic Acids Research, Vol. 42, Database issue D53–D59
Documentos relacionados
Patrón de metilación
el estado de la cromatina y están así implicados en la regulación génica
Más detalles