Clase biblio genomica 2009
Transcripción
Clase biblio genomica 2009
16/04/2009 Bibliotecas Genómicas Colección de fragmentos de DNA que representan todas las secuencias de un genoma los cuales son clonados en un vector que puede ser usado y mantenido establemente. Aplicaciones: * Secuenciar un gen entero o una región de un cromosoma * Secuenciación de genomas * Identificar promotores Construcción y screening de una biblioteca genómica Extracción de DNA genómico Vector de alta capacidad Digestión con ER Digestión con ER Fraccionamiento del DNA genómico Ligación y transformación de célula huesped Selección de transformantes – clones independientes Screening de la biblioteca genómica Obtención de los clones conteniendo la/s secuencia/s de interés Secuenciación 1 16/04/2009 Requerimientos de una buena biblio genómica: * Fácil de analizar, almacenar, amplificar y estable. * Representación completa. * Representación superpuesta del genoma (overlapping clones). digestión con ER en posiciones al azar: digestión parcial: fragmentos al azar del DNA completo. Vectores de alta capacidad empleados Vector Cósmidos/Fósmidos Capacidad (Kb) 30 - 45 Vectores basados en fago P1 PAC (cromosoma artificial derivado del fago P1) BAC (cromosomas artificiales bacterianos) YAC (cromosomas artificiales de levaduras) 80 - 100 50 - 150 100 - 300 200 - 1000 Vectores de “baja” capacidad: fago lambda (9-23 kb) -Lambda DASH II -Lambda EMBL3 -Lambda Fix II 2 16/04/2009 Caracterización de las bibliotecas genómicas Representación completa del genoma Pocos clones independientes: muy poca probabilidad de encontrar el fragmento de interés. Más clones: más sitios del genoma representados. Clones son al azar y superpuestos: algunas partes del genoma están sobrerrepresentadas mientras que otras no aparecen. Número suficientemente grande de clones: certeza de que todo el genoma está representado y poder encontrar el fragmento de interés con una P: 99% Caracterización de las bibliotecas genómicas N: Número de clones necesarios para encontrar un determinado fragmento con una probabilidad P (99%) N=ln(1-P)/ln(1-f) P: probabilidad deseada de aislar el fragmento de interés: 0,99 (probabilidad del 99%) f: fracción del genoma representado por el tamaño promedio del inserto = tamaño del inserto/tamaño genoma Para genoma humano: 3x109 pares de bases: vector cósmido YAC Tamaño inserto 30000 1000000 N 500000 14000 3 16/04/2009 Caracterización de las bibliotecas genómicas equivalente genómico (EG): número mínimo de clones independientes para lograr una cobertura completa del genoma si fueran clones adyacentes 1 EG: tamaño genoma/tamaño promedio del inserto Ejemplo Tamaño promedio inserto (bases) genoma haploide humano: 3x109 bases Cósmidos 30000 1EG=1x105 BAC 200000 1EG=15.000 N (cósmido)= ln(1-0,99)/ln (1-(30.000/3x109))= 5x105 Screenear 5 veces el EG para encontrar el fragmento de interés con una probabilidad del 99% 4 16/04/2009 Preparación de DNA genómico de alto peso molecular Objetivo: Purificar DNA genómico (eliminar proteínas y contaminantes) empleando métodos que eviten su fragmentación mecánica. En promedio se utiliza 2-4x mas largo según la aplicación: Aplicación Southern blot Cosmidos YACs Tamaño 50 kb 200 kb 1000 - 4000 kb Métodos para extracción de DNA genómico 200 kb < (Cos, P1) Proteinasa K/SDS Extracción solventes orgánicos Precipitación etOH – resuspensión Estimación de la calidad: 0,30,4% agarosa Digestión parcial con ER >200 kb (BACs-YACs) Células embebidas en plugs de agarosa Infusión para lisar las células / remover las proteínas Digestión parcial con ER en el plug de agarosa 5 16/04/2009 Digestión parcial con Enzima de Restricción -Fragmentos cortos -No hay clones superpuestos y no se puede reconstruir la seq del DNA -Fragmentos largos -Representación superpuesta del genoma Sau3AI o MboI : ↓GATC↑ (4 cutter): freq de corte: 1/4n : 1/256 bases: colección de fragmentos más “randomizados”. Además: generan extremos cohesivos compatibles con BamHI (6 cutter-menor frecuencia de corte): ligar en vectores cortados con BamHI Digestión parcial: Variar la cc de enzima o tiempo de incubación. Digestión parcial de DNA genómico con Sau3AI en agarosa 0,9% 6 16/04/2009 Métodos para extracción de DNA genómico 200< (Cos, P1) >200 kb (BACs-YACs) Proteinasa K/SDS Células embebidas en plugs de agarosa Extracción solventes orgánicos Precipitación etOH – resuspensión Infusión para lisar las células / remover las proteínas Estimación de la calidad: 0,30,4% agarosa Digestión parcial con ER Digestión parcial con ER Fraccionamiento: Electroforesis de campo pulsátil (PFGE) Electroforesis de campo pulsátil (PFGE) Electroforesis común: fragmentos >50 kb migran juntos. Si el DNA cambia la dirección durante la corrida se pueden separar: PFGE Con cada reorientación del campo eléctrico los fragmentos menores reaccionan más rápido en la nueva dirección (las más grandes tardan más en arrancar): hay una diferencia de velocidad en los primeros milisegundos luego de aplicado el campo eléctrico. Fw: 0.5 seg – Rv: 0.25 seg 7 16/04/2009 Fraccionamiento DNA digerido: PFGE Seleccionar el tamaño de fragmento adecuado Cosmidos y vectores basados en P1: no es tan crítico: durante el empaquetamiento el fago selecciona por tamaño PAC, BAC, YAC: hay que fraccionar el DNA Electreoelución: slice a tubo de diálisis electroforesis colectar buffer del tubo precipitar DNA Tb: disolver el gel y precipitar el DNA Cósmidos: 30 – 45 kb Cósmido: híbrido fago-plásmido se empaquetan en cápsides (más capacidad y más eficiencia de transformación que los plásmidos) replican como plásmidos en bacterias: no da playas de lisis sino colonias!!! (no tiene proteínas del fago : no forma partículas virales) Cos de fago: empaquetar en fagos e infectar XbaI para linealizar Ampr/ori: replicación en E coli (ori: alto número de copias) Sitio de Clonado: BamHI para clonar el DNAg (BamHI o compatibles) prom RNApol T7 y T3: generar ribo-sondas a partir de los extremos del inserto (caminado cromosómico) 8 16/04/2009 Terminasa del fago : empaqueta cósmidos entre el 75% y 105% del largo del fago normal: selección por tamaño Corta en sitios cos. Deja extremos cos cohesivos 5-overhang selección LB-Amp (Colonias!!) Infectar E coli COS cohesivos se ligan en coli: circulariza Screening…. 9 16/04/2009 Fósmidos: 30 – 45 kb Similares a cósmidos (sitios cos) pero mantiene 1 copia por célula: mayor estabilidad Tienen elementos del plásmido F (como los BAC): par A, B y C, ori/repE: 1 copia por célula, controlan la partición durante la división Vectores basados en bacteriófago P1: 80 – 100 kb Ventajas: * alta eficiencia de transformación (por que se empaqueta en fagos) * alta capacidad (más que cósmido) * mayor estabilidad (1copia/cell) 30 kb -ScaI: linalizar el vector -Sitio Clonado: BamHI -Sitio de empaquetamiento del P1 (Pac): empaquetar en fagos - Sitios de recombinación del P1 (loxP): circularizar el DNA una vez inyectado por el fago en E coli (cepa P1 Cre recombinasa +) - Kanr: selección bacterias que incorporaron y recircularizaron el vector - replicón plasmídico del P1: 1 copia/bacteria: > estabilidad - replicón lítico del P1: inducible por IPTG – 20 copias/bacteria - SacBII: levansucrasa: selección de bacterias con vector+inserto (levansucrasa en medio con 5% sacarosa: levan : letal para E. coli) 10 16/04/2009 digerir y deP DNAg Cortar con ScaI y deP. Cortar con BamHI Ligación 30 kb Pac PacA y PacB Selección: Kan (vector) + sacarosa (con inserto) Replicón plasmídico (1 copia/cell) Replicón lítico: IPTG (20 copias/cell): para aislar el plásmido luego del screening (tb para amplificar vector) Selección por tamaño: muy chico: no empaqueta muy grande: corta y elimina loxP distal: no circulariza: no crece stuffer: flexibilidad – corta ahí PAC (P1 derived artificial cromosome): 50 – 150 kb PAC: cromosoma artificial derivado de vectores basados en bacteriófago P1 (pAD10 modificado): Remoción de una región que contiene el sitio pac, el fragmento stuffer y un sitio lox (acá no hay fagos!!!). Inserción de una región derivada del pUC19 en el sitio de clonado BamHI (dentro del SacBII) para anular la toxicidad de SacBII y aumentar la cant del vector (tiene ori de replicación de alto número de copias): PAC (vacío) replica mejor: se puede amplificar bien en bacterias para digerir y hacer la library Replicón lítico (IPTG), replicón plasmídico, kan… idem pAD10 11 16/04/2009 fosfatasa deP Genomic DNA Partial digestion Sau3I or MboI. Select fragment by size NO fosfatasear Selección y screening de library: rep plasmídico. Para amplificar clon de interés: rep lítico. Ligate vector to a genomic DNA fragments Transform E. coli by electroporation •Select recombinants on media containing Kan and 5% sucrose Kan: selecciona bacterias que incorporaron vector SacBII: selección de clones con inserto (levansucrasa en E. coli es letal en medio con 5% sacarosa)…sin fragm DNAg (religación): expresan levansucrasa y mueren Cromosomas artificiales bacterianos (BAC): 100 – 300 kb Contienen elementos del plásmido F (solo 1 copia por célula que se divide y particiona en las 2 células hijas): -par A, B y C, oriS/repE: mantienen 1 copia por célula (muchas copias: inestabilidad), controlan la partición durante la división -Cm(r): resist cloranfenicol: selección de bacteria transformantes -MCS: HindIII-BamH -LacZ: identificación de recombinantes -prom T7 y SP6: para generar ribosondas (pegado primers para seq los extremos del inserto) 12 16/04/2009 O digerir vector con BamHI y DNA con Sau3AI-MboI loxP y cosN: puntos para clivaje (prot P1cre y terminasa del fago) Transformar E. coli x electroporación Selección en CAM/IPTG/X-gal Transformar E. coli x electroporación Selección en CAM/IPTG/Xgal Cromosomas artificiales de levaduras (YAC): 200-1000 kb YACs se propagan en levaduras como cromosoma lineal. Elementos de cromosoma de levaduras: TEL: secuencias teloméricas CEN4: seq del centrómero ARS: seq de replicación autónoma Cloning site: EcoRI dentro del SUP4: selección de recombinates con inserto. URA3/TRP1: selección levaduras transformantes (ura-, trp-) Ori/Amp: amplificación del vector en Ecoli 13 16/04/2009 ade2 ochre: rosado x acumulación de intermediario biosíntesis de adenina SUP4: suprime los efectos de ade2ochre No rec: expresa SUP4: suprime ade2ochre colonia blanca Rec: no expresa SUP4, no suprime ade2ochre colonia rosada Selección en medio trpura- y baja cc de ade: colonias rosadas! Transf levaduras trp1- ura3- ade2 ochre (mut en gen ade2 -biosíntesis de adenina-: stop prematuro) Placas de 96 wells Elección del vector Vector Tamaño del fragmento a clonar Cosmidos/ Fósmidos < 50 kb P1 > 50 kb PAC >50 kb BAC > 50 kb YAC >250 kb Huésped/ Facilidad de recuperación del DNA clonado E. coli Extracción alcalina (EA) E. coli EA E. coli EA E. coli EA levaduras Difícil, requiere PFGE Inestabilidad de la secuencia clonada Cósmidos: alta (rearreglos) Fósmidos: baja Baja Baja Baja Clones quiméricos por rec entre 2 YACs Facilidad de screening Hibridización convencional arrays arrays arrays arrays 14 16/04/2009 Screening por hibridación convencional (cósmidos/fósmidos) SuperCos: se pueden “escrinear” 20 placas con 50000 ufc c/u: 1.0 × 106 cfu en total Screening de bibliotecas ordenadas en “arrays” (PAC, BAC, YAC) “Array” Pins: c/u pica una colonia 96 wells con medio de cultivo * 1 well=1 clon : fácil de replicar y almacenar. •Robot * Existen servicios que construyen bibliotecas en formato array etOH 70% Placas con colonias Cada clon identificado: #placafila-columna Ej: 255A6: placa 255, fila A, clomna 6 15 16/04/2009 Screening de bibliotecas ordenadas en “arrays” (PAC, BAC, YAC) Métodos para screening Hibridación Sondas para hibridación • gen vecino • gen relacionado evolutivamente • región correspondiente a un dominio conservado • exón conocido PCR Screening en forma combinacional= los clones se agrupan en pooles y se analizan muchos clones al mismos tiempo Sceening por hibridación Screening de BAC library (algodón): 16896 clones (bacterias) spottados x2. 11 filtros de 8x12cm. c/u: grilla de 386 cuadros (16x24: A-Px1-24). En cada cuadro: 4 colonias por duplicado (8 spots): 1,536 clones BAC por filtro (spottados por duplicado) Se pueden pedir las membranas, hibridarlas y encargar los clones + 16 16/04/2009 Sceening por hibridación grilla de 386 cuadros. En cada cuadro 8 colonias por duplicado (16 spots): 3072 clones BAC por filtro (spottados por duplicado) Positivos: señal doble Screening por PCR: pooles (sceening combinacional) Cada fila de las 9 placas: 1 pool (A-H): 8 pooles 9 master pool 5 Cada columna de las 9 placas: 1 pool (1-12): 12 pooles 360 placas/9 = 40 master pooles Existen servicios de screening por PCR Cada placa: 1 pool: 9 pooles A-I Pooles de placas Placa G Fila E Pooles de filas Col 5 Pooles de columnas 17 16/04/2009 Secuenciación Los insertos son muy largos!! - no se pueden secuenciar directamente Clonado de la secuencia genómica y promotora de un gen Screening (sonda correspondiente a una región conocida) Clon que contiene la seq de interés: digestión o fragmentación mecánica en fragm pequeños (2-3kb) superpuestos sub-library en otro vector Screening de la sub-library con la misma sonda y secuenciar los + A partir de las secuencias obtenidas se pueden generar nuevas sondas para re-escrinear la sub-library (encontrar clones adyacentes), secuenciar los +….repetir el proceso: “caminado genómico” Secuenciación Sub-library Vectorette a partir de un clon de la biblio genómica seleccionado por screening Seq correspondiente al primer vectorette Amplificar secuencias adyacentes a cada lado de una región conocida para secuenciar De esa seq: primers para hacer “caminando genómico” 18 16/04/2009 Secuenciación de genomas en BAC DNA digerido: fragm de 150000 pb: library en BAC Fingerprinting: para localizar cada BAC a lo largo del cromosoma (mapeos con ER de cada BAC: comparan x software). c/BAC: digestión parcial en fragm de 1500 pb library de c/BAC en otro vector c/vector se seq: PHRAP: junta los fragm por superposición 19 16/04/2009 Caminado Cromosómico: mapeado de regiones genómicas largas contenidas en distintos clones (por ej: clones de una biblioteca en cósmidos) Screening 1 Ribosondas con RNApol (T7, T3) Screening 2 Screening n 20