4. Secuenciación
Transcripción
4. Secuenciación
Cursos de Formación de la UCTS (2011) Plataforma de Genómica / Plataforma de Diagnóstico Molecular “Tecnologías de alto rendimiento en genómica” 2ª Parte: Tecnologías de ultrasecuenciación y de enriquecimiento de secuencia. Programa del curso De Sanger hacia NGS 454 de Roche Desarrollo de la tecnología Cómo funciona Aplicaciones Comparación con otros Sistemas NGS Sistema Nimblegen Cómo funciona Formatos Aplicaciones Análisis de datos de alta densidad (UEB) Cualquier DNA puede ser secuenciado Genomas Secuenciados Nature Reviews Genetics 9, 303-313, 2008 Cronología de la Secuenciación 1973 Método secuenciación “Wandering spot”, Maxam y Gilbert 1975 Método secuenciación “plus and minus”, Sanger y Coulson 1977 1.“ DNA sequencing by chemical degradation ”by Maxam y Gilbert. phi X 174 Primer genoma de DNA completo secuenciado 11 genes en 5386 bases (cadena sencilla) NGS:2ª GENERACIÓN 2.“Chain-terminator method” by Sanger et al. Método usado durante los proximos 30 años 1ª GENERACIÓN Francis Crick and James Watson describen el modelo de la doble hélice del DNA. 1ª GENERACIÓN 1953 1996 Pal Nyrén & Mostafa Ronagh i publican método de la pirosecuenciación en el Royal Institute of Technology (Stockholm). 2001 Se publica la primera versión del genoma humano. Science 291 (5507): 1304–51; Nature 409 (6822): 860–921 2003 Proyecto Genoma Humano (13 años). U.S. Department of Energy and the NIH 2005 454 Life Science comercializa el 1er ultrasecuenciador GS20 (20Mpb) 2006 Lanzamiento de SOLEXA (Illumina) 200 7 Genoma de Venter mediante sec. Sanger automática (4 años) Lanzamiento de GS FLX de Roche (100Mbp) 2008 1987 1990 Serie de reactivos Titanium de Roche (500Mbp). Applied Biosystems comercializa el primer secuenciador automático, El modelo ABI 370. El Instituto Naiconal de Salud (NIH) empieza secuenciación a gran escala de diversos microorganismos, ej. E.coli SOLID de Applied Biosystem Genoma Watson mediante 454/ROCHE Nature 452, 872-876 (17 April 2008). N ª IÓ S:3 RAC G N NE GE 2010 1000 Genomes Project Método de secuenciaciación SingleMolecularRealTime 1ª Generación Secuenciación Método Sanger Fragmentación de DNA Clonaje en Vectores; Transformación Bacterias; crecimiento y aislamiento vector DNA Ciclo Secuenciación Sanger sequencing: - Long reads (500-1000 bp) - Low throughput (192 reactions/run) Secuencia: 3´…GACTAGATACGACGAGCGTGA…5´ Primer: 5´…CTGAT Electroforesis ( 1 Secuencia/Capilar) Polimerasa dNTPs ddNTPs marcados CTATGCTCG 2ª Generación Secuenciación Los Instrumentos de secuenciación de 2ª generación pueden generar tantos datos en un día como los generados por varios cientos de secuenciadores con capilares tipo Sanger, obtenidos por una sola persona. 2ª Generación Secuenciación ROCHE GS FLX 454 GS FLX+ 454 GS Junior 454 illumina Solexa Life Technology SOLiD™ 3System SOLiD™ 4 System 5500 System 5500xl System Ion Torrent System Servicio Ultrasecuenciación UCTS GS 454 de ROCHE GS FLX GS Junior ¿Cúantas muestras se pueden secuenciar por run? 1ª Generación Metal coated PTP reduces crosstalk 29 µm well diameter (20/bead) 3100 ABI 2ª Generación GS ROCHE 3,400,000 wells per PTP 96p-Plates 384p-Plates PicoTiterPlate_FLX 70x70mm PicoTiterPlate_Junior GS FLX/Junior 454 Troughput PTP Gaskets 35 -Tamaño de lo que quiero secuenciar -Coverage -Multiplexar (MIDS) N= (GxC)/Mbp por región PTP Donde: N= num de muestras que puedo secuenciar en un run G= tamaño de lo que quiero secuenciar C=Coverage (C= N * L / G) GS FLX/Junior 454 Workflow gDNA, Amplicones, cDNA 1.Calidad & Cantidad Material de partida 2. Construcción Librería 3. Amplificación mediante emPCR 4. Secuenciación Datos Obtenidos 1. Calidad & Cantidad Material de partida 1.1 Calidad mediante Chips Bioanalyzer; gel agarosa gDNA, RNA 1.2 Cuantificación mediante Picogreen (gDNA) o Ribogreen (RNA) y = 34,577x - 61,596 R2 = 0,9994 Fluorescence 20000 15000 10000 . 5000 0 0 200 400 Lam bda DNA (ng/m L) 600 Fluorímetro FLx800 GS FLX/Junior 454 Workflow gDNA, Amplicones, RNA 1.Calidad & Cantidad Material de partida 2. Construcción Librería 3. Amplificación mediante emPCR 4. Secuenciación Datos Obtenidos 2. Construcción Librería Fragmentación Selección Tamaño Ligación Adaptadores Librería Shotgun Librería Pair-End Librería cDNA Librería Amplicones gDNA, RNA Adaptador A (44 bases): Primer 4 nucleótidos Amplificación Primer “Key” Secuenciación PCR con Fusion Primers Adaptador B (44 bases) Biotina Primer 4 nucleótidos Amplificación Primer “Key” Secuenciación Fusion Primers Adaptador A Target Adaptador B Target 2. Construcción Librería: Fragmentación gDNA Librerías Shotgun NEBULIZACIÓN Rotura utilizando nitrógeno a alta presión DNA genómico Fragmentos de DNA de doble cadena 2.1 bar (30psi) Librerías Pair-End HYDROSHEAR Fuerzas de rotura hidrodinámicas Orificio gDNA gDNA fragmentado 2. Construcción Librería: Fragmentación RNA Librerías cDNA RNA Random Primers First Strand Synthesis Solución de Fragmentación de RNA Second Strand Synthesis Fragmentos de cDNA de doble cadena 2. Construcción Librería: Selección fragmentos gDNA Nebulizado: DNA 7500 Lab Chip AMPure beads SPRI (Solid Phase Reversible Immobilization) DNA 7500 LabChip 300pb-1000pb 50pb-1000pb gDNA fragmentado con Hydroshear: RNA Pico 6000 LabChip Electroelución 500pb-600 nt Tamaño medio de 500-600 nt (dep. del contenido en GC) Menos del 10% ≤ 300 nt, no adaptor dimers Conc >0.2 ng/µl (Ribogreen ®) 2. Construcción Librería Inmobilización Fragmentos y aislamiento de la Librería: AB AB Melt Solution BB AA 4 tipos de productos resultan de la ligación Los productos con Biotina (AB, BA, BB) se unen a bolas magnéticas que llevan estreptavidina. Los products AA son lavados y eliminados. Mediante Melt Solution (NaOH0.1N) las cadenas no biotiniladas de cada fragmento de dsDNA son aisladas. Ambas cadenas de los fragmentos BB quedarán unidas a las bolas. Sólo se aislan cadenas de DNA sencilla AB constituyendo la librería. 2. Construcción Librería: Q&Q Librería Molecules/µl = - Num de Avogadro es 6.022x1023 (moléculas/mole) -328.3x109 (gramos/mole) es peso molecular medio de nts. -Perfil típico de una librería ssDNA (Agilent 2100 RNA Pico 6000 LabChip): Tamaño medio de 500-800 bp -Cuantificación mediante Ribogreen -Dilución de trabajo para emPCR GS FLX/Junior 454 Workflow gDNA, Amplicones, cDNA 1.Calidad & Cantidad Material de partida 2. Construcción Librería 3. Amplificación mediante emPCR 4. Secuenciación Datos Obtenidos 3. Amplificación mediante emPCR Antes de la emPCR: high-speed shaker -1 starting effective fragment per microreactor - ~106 microreactors per ml - All processed in parallel (Amplificación clonal) 3. Amplificación mediante emPCR Después de la PCR: Rotura y Recuperación Contaje DNA-beads/ml % Recuperación= x100 Input beads Enrequecimiento de beads con DNA: Melt dsDNA Unión de Primer marcado con Biotina a bolas de captura con ssDNA Adición de bolas magnéticas con estreptavidina Melt DNA-beads/ml % Enrequecimiento= x100 Input beads emPCR Titulación sólo para GS FLX Antes de la emPCR: ¿Cuántas copias de librería por Beads de captura son óptimas? 1. Procesar 4 tubos emulsiones Tubo Moléculas de Librería por Bead de Captura (cpb) Vol Librería Diluida 1 2 1.2 µl 2 4 2.4 µl 3 8 4.8 µl 4 16 9.6 µl 2. Recuperación y enrequecimiento de cada tubo 3. Contaje de las beads enriquecidas 4. Escoger el ratio copia/bead con aproximadamente un 8% de enrequecimiento GS FLX/Junior 454 Workflow gDNA, Amplicones, cDNA 1.Calidad & Cantidad Material de partida 2. Construcción Librería 3. Amplificación mediante emPCR 4. Secuenciación Datos Obtenidos 4. Secuenciación Metal coated PTP reduces crosstalk 29 µm well diameter (20/bead) 3,400,000 wells per PTP Gaskets 4. Secuenciación Secuenciación mediante síntesis Química basada en la pirosecuenciación Polimerasa añade nucleótidos (dATP) Se libera pirofosfato (PPi) Sulfurilasa crea ATP a partir del PPi Luciferasa hidroliza ATP y usa luciferina para producir luz. Sulfurylase Luciferase Luciferina Light + oxyluciferin 4. Secuenciación Flujo de Reactivos Nucleotides are flowed sequentially across the PTPone at a time (200 cycles à4 bases) Pyrophosphate signal generation upon complimentary nucleotide incorporation — dark otherwise The CCDcamera is generating a image after every flow The signal strength is proportional to the number of nucleotides incorporated 4. Secuenciación Flowgama y Base calling: 4. Secuenciación:Ejemplo MULTIPLEXACIÓN DE MUESTRAS MIDS: -Los MIDs son secuencias cortas que se añaden a los fragmentos a secuenciar durante la generación de librería y permiten identificar cada muestra de manera individual. Primer 4 nucleótidos Amplificación Primer “Key” Secuenciación Biotina Primer 4 nucleótidos Amplificación Primer “Key” Secuenciación Adaptador A Adaptador B MIDS MIDS Target MIDS Target MIDS -Permite aumentar el número de muestras por PTP: -separación física: “gaskets” → pérdida física de espacio en la placa -separación por “código de barras” -Utilizando las dos posibilidades anteriores, aumenta el número de muestras a secuenciar por placa: -Kit comercial de 12 MIDs (diseñados por Roche) → 12 muestras/reg. -División de la PTP en 16 reg. con “gaskets” TOTAL: 12 MIDs/reg. * 16 reg. = 192 muestras por PTP (máx) (INCLUSO MÁS) Multiplexado de Muestras Multiplexado de amplicones MID2-Amplicón 2 MID1-Amplicón 1 MID4-Amplicón 4 MID3-Amplicón 3 MID5-Amplicón 5 MID6-Amplicón 6 Amplicón 7 Amplicón 8 Amplicón 11 Amplicón 12 Amplicón 9 Amplicón 10 SISTEMA GS FLX 454-APLICACIONES -Secuenciación de DNA a partir de muestras de especies extinguidas (shot-gun, paired-end) -Estudios de epigenética: amplicones -ChIP y secuenciación de los fragmentos de DNA presentes en los IPs -Metilación: conversión con bisulfito, amplificación de las regiones conteniendo islas CpG y secuenciación. -Ensamblaje de genomas eucariotas y procariotas completos, tanto de novo como resecuenciación (shot-gun +paired-end) -SAGE (Serial Analysis of Gene Expression Ditags): análisis cuantitativo y cualitativo del transcriptoma (shot-gun) -Caracterización y cuantificación de poblaciones virales a través de la secuenciación de genes diana (ej: transcriptasa reversa en VIH). Detección de quasiespecies (amplicones). -Metagenómica: estudio del contenido genómico en una mezcla compleja de microorganismos (microbiota, muestras medioambientales). Determinación tanto cuantitativa como cualitativa (shot-gun, retrotranscripción de RNA total o de mRNA, amplicones de 16S rRNA) SISTEMA GS FLX 454-APLICACIONES -Secuenciación de genomas de pequeño tamaño (virales, mitocondriales) o de plásmidos (shot-gun) -Secuenciación de RNAs de pequeño tamaño (microRNAs, siRNAs): generación del cDNA de doble cadena como material de partida (shot-gun) -Detección de SNPs, InDels, CNV (shot-gun) -Análisis del transcriptoma (partiendo de RNA total o mRNA), cuantitativo o cualitativo (comparación de niveles de expresión) (retrotranscripción y shot-gun) -Enriquecimiento de regiones del genoma/captura del exoma utilizando arrays de captura de Nimblegen. Secuenciación de las regiones capturadas (shot-gun). En función de la aplicación, puede ser necesario completar los datos de 454 utilizando otras tecnologías, p.ej. Resolución de homopolímeros utilizando Sanger o lecturas cortas de Illumina. En general, se recomienda validar siempre los resultados utilizando otro tipo de aproximaciones: arrays, secuenciación Sanger, PCR a tiempo real, otras tecnologías de ultrasecuenciación..... Especificaciones Sistemas GS FLX & GS Junior El futuro de la secuenciación 454 Programa del curso De Sanger hacia NGS 454 de Roche Desarrollo de la tecnología Cómo funciona Aplicaciones Comparación con otros Sistemas NGS Sistema Nimblegen Cómo funciona Formatos Aplicaciones Análisis de datos de alta densidad (UEB)ç Comparación Plataformas secuenciación HiSeq 2000-Illumina GS FLX 454 ABI SOLID 5500xl Chemistry based on pirosequencing Chemistry based on reversible terminators Chemistry based on sequencing by ligation Sample amplified by emulsion PCR Sample amplified by solidphase amplification Sample amplified by emulsion PCR Read length 250-500 bp Read length 2x100 bp Read length 50-100 bp >1 million reads per run 3 billions reads per run 100-500 million reads per run 400-600 Mb of sequence 600 Gb of sequence 50-100 Gb of sequence ~10 hours run 2-11 days run 4-8 days run Comparación Plataformas secuenciación Comparación Plataformas secuenciación Comparación Plataformas secuenciación Ejemplos de Genomas humanos secuenciados Nature Reviews Genetics 11, 31-46 (January 2010) Comparación Plataformas secuenciación 1ª Generación 2ª Generación 3ª Generación Secuenciación SCIENCE Vol 323 2 JANUARY 2009 Real-Time DNA Sequencing from Single Polymerase Molecules John Eid,* Adrian Fehr,* Jeremy Gray,* Khai Luong,* John Lyle,* Geoff Otto,* Paul Peluso,* David Rank,* Primo Baybayan, Brad Bettman, Arkadiusz Bibillo, Keith Bjornson, Bidhan Chaudhuri, Frederick Christians, Ronald Cicero, Sonya Clark, Ravindra Dalal, Alex deWinter, John Dixon, Mathieu Foquet, Alfred Alfred Gaertner, Paul Hardenbol, Cheryl Heiner, Kevin Hester, David Holden, Gregory Kearns, Kearns, Xiangxu Kong, Ronald Kuse, Yves Lacroix, Steven Lin, Paul Lundquist, Congcong Congcong Ma, Patrick Marks, Mark Maxham, Devon Murphy, Insil Park, Thang Pham, Pham, Michael Phillips, Joy Roy, Robert Sebra, Gene Shen, Jon Sorenson, Austin Tomaney, Kevin Travers, Mark Trulson, John Vieceli, Jeffrey Wegener, Dawn Wu, Alicia Alicia Yang, Denis Zaccarin, Peter Zhao, Frank Zhong, Jonas Korlach, Stephen Stephen Turner. Press Release Pacific Biosciences Announces Early Access Customers for Its Single Molecule Real Time System Eleven Leading Companies Support Launch of Third-generation DNA Sequencing http://www.pacificbiosciences.com MENLO PARK, Calif., Feb 23, 2010 Pacific Biosciences, a private company developing a disruptive technology platform for real-time detection of biological events at single molecule resolution, today announced the 10 institutions that have purchased its Single Molecule Real Time (SMRT(TM)) DNA sequencing system as part of the company's early access program in North America. Programa del curso De Sanger hacia NGS 454 de Roche Desarrollo de la tecnología Cómo funciona Aplicaciones Comparación con otros Sistemas NGS Sistema Nimblegen Cómo funciona Formatos Aplicaciones Análisis de datos de alta densidad (UEB) NIMBLEGEN: Arrays de Captura Los arrays de captura de secuencia de Nimblegen permiten capturar y enriquecer regiones génicas de interés, contiguas o no, con una elevada sensibilidad y especificidad, que luego pueden amplificarse y secuenciarse mediante tecnologías de alto rendimiento (454/Illumina). -Este sistema permite secuenciar regiones de interés en vez de genomas completos, con lo cual el coste de la secuenciación se reduce considerablemente. Técnicamente, el proceso también es menos costoso. -Sistema flexible: las regiones de interés pueden ser contiguas o no en el genoma. -Nimblegen diseña los arrays a la carta, solamente es necesario facilitarles las coordenadas de los genes diana. 1) Formato sólido -Arrays “ a la carta”, con dos posibles tamaños de captura: 5 Mb ó 30 Mb por array. -Arrays de captura del exoma: prediseñados, contienen 180.000 exones humanos codificantes y 551 exones para miRNA (34 Mb), utilizando 2,1 millones de sondas. El listado de genes que contienen estos arrays puede consultarse en la web de Nimblegen (www.nimblegen.com). -2) Formato en solución -Arrays de captura del exoma: prediseñados, contienen 180.000 exones humanos codificantes y 551 exones para miRNA (34 Mb). Existe una versión LR (long-read) optimizada para secuenciación con 454. Disponible en dos formatos, para 4 reacciones y para 48 reacciones. Próximamente existirá este formato para arrays de 5 Mb. NIMBLEGEN: Arrays de Captura PROTOCOLO DE ARRAYS DE CAPTURA EN SÓLIDO 3. Pre-capture amplification 4. Hybridization a) Ensamblaje del array b) Carga del array c) Hibridación: 42º C, 64-72 h PROTOCOLO DE ARRAYS DE CAPTURA EN SOLUCIÓN Streptavidin beads Pre-capture amplification Primers biotinilados 3. Hybridization 47 ºC, 64-72 horas CONTROL DE CALIDAD DE LA CAPTURA MEDIANTE qPCR La eficiencia teórica de una qPCR es del 100% y significa que las secuencias diana se doblan en cada ciclo, es decir, que E=2. Sin embargo, la eficiencia real nunca es del 100% y por eso el valor de E debe calcularse empíricamente para cada sonda. Los locus control NSC permiten determinar el enriquecimiento de un pequeño set de locus control estandarizados que se encuentran dentro de un rango de eficiencias de captura conocidas. Estos ensayos permiten hacer una estimación aproximada del enriquecimiento de poblaciones mayores de genes diana sin necesidad de secuenciarlos. Si la qPCR de estos locus control indica una captura correcta, es muy problable que los locus experimentales de interés también hayan sido capturados satisfactoriamente. TECNOLOGÍA DE NIMBLEGEN -Arrays de enriquecimiento de secuencia -CGH arrays CGX / CNV / Whole genome / Whole genome-exon focused / Custom -ChIP-chip arrays Whole genome / Promoter / Custom -Arrays de metilación Whole genome / Promoter / Custom -Arrays de expresión génica Whole genome / Promoter / Custom www.nimblegen.com OTRAS TECNOLOGÍAS DE ENRIQUECIMIENTO DE SECUENCIA -Sistema SureSelect (Agilent): arrays de captura en solución. Optimizada para la secuenciación con Illumina, SOLiD y 454. Existen versiones prediseñadas para capturar el exoma y el noma humanos, o bien pueden diseñarse ensayos “a la carta” (captura de 3.3 ó 6.6 Mb). Las muestras pueden “indexarse” después de la captura para optimizar el rendimiento de la ultrasecuenciación (=MIDs de Roche). Existe también un formato sólido que permite capturar hasta 1 Mb. http://www.genomics.agilent.com -Sistema Febit (ABI). Para ver una descripción de cómo funciona el sistema: http://www.nature.com/nmeth/journal/v6/n9/full/nmeth.f.266.html PAUTAS PARA EL DISEÑO EXPERIMENTAL DE UN ESTUDIO DE ULTRASECUENCIACIÓN UCTS WORKFLOW Researcher Statistics and Bioinformatics (UEB) EXPERIMENTAL DESIGN RESULTS CHECKING UCTS QUALITY SAMPLES COLLECTION EXPERIMENTS DATA ANALYSIS UEB Others SAMPLE PROCESSING SEQUENCING UCTS El futuro de la secuenciación 454 Fin I. ANÁLISIS DE VARIANTES VIRALES UTILIZANDO UN ENSAYO DE AMPLICONES PAUTAS PARA LA GENERACIÓN DE UNA LIBRERÍA DE AMPLICONES -La secuenciación puede hacerse de manera unidireccional o bidireccional (en ambos sentidos, forward y reverse, separadamente). -Si la secuenciación es unidireccional, la generación de los amplicones es también unidireccional. Este método es más cómodo, especialmente cuando se quiere trabajar con diferentes “loci” diana en muchas muestras, utilizando para la amplificación primers genespecíficos (1 set por “loci”). -En general se obtienen mejores resultados utilizando secuenciación bidireccional. Esto es especialmente importante cuando se desean buscar variantes con baja frecuencia en una población. Si la secuenciación es bidireccional deben amplificarse los fragmentos de PCR con primers para ambos sentidos, forward y reverse. -Para la generación de la librería de amplicones debe usarse una polimerasa de alta fidelidad. -La cuantificación de la librería debe hacerse siempre por un método fluorimétrico (Picogreen®) porque los métodos espectrofotométricos (absorbancia) tienden a sobreestimar la cantidad de ADN. Programa del curso De Sanger hacia NGS 454 de Roche Desarrollo de la tecnología Cómo funciona Aplicaciones Comparación con otros Sistemas NGS Sistema Nimblegen Cómo funciona Formatos Aplicaciones Análisis de datos de alta densidad (UEB) I. ANÁLISIS DE VARIANTES VIRALES UTILIZANDO UN ENSAYO DE AMPLICONES Diseño de los primers para generar una librería de amplicones Usuario a) Librería de amplicones unidireccional Primers “genéricos” SIN adaptadores de secuenciación para GS FLX Titanium y SIN MIDs. Generación de una librería de tipo “shot-gun” donde se añaden los adaptadores de secuenciación y los MIDs. b) Librería de amplicones bidireccional -Se une a las Beads de captura (EmPCR) -Complementaria a los primers de amplificación & secuenciación Sequencing key 400 bp 200-600 bp (máx. 800 bp)* MIDs: Multiplex Identifiers (diseñados por Roche) Fusion primer *Amplicones <200 pb ó >1000 bp también pueden secuenciarse con modificaciones en el protocolo. II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO LAS APLICACIONES PAIRED-END Y SHOT-GUN II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO LAS APLICACIONES PAIRED-END Y SHOT-GUN II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO LAS APLICACIONES PAIRED-END Y SHOT-GUN II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO LAS APLICACIONES PAIRED-END Y SHOT-GUN EL MÉTODO DE SECUENCIACIÓN DEPENDE DEL TAMAÑO DEL GENOMA Human exome: 34 Mb DNA mitocondrial humano: 16.5 Kb Saccharomyces cerevisiae: 12.5 Mb E. coli O157:H7: 5.44 Mb Sanger Nº de bases Human genome: 3 Gb Drosophila melanogaster: 122.6 Mb Caenorhabditis elegans: 100 Mb SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS!!!! Nature 463, 943-947 (18 Feb.2010) Suppl. Info SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS AÑO 2010 Nature 463, 943-947 (18 Feb.2010) Genomas completos 1 bosquimano (total 4 participantes) + 1 bantú Bosq. 1: 454 Titanium shotgun (10.2x) + 20 Kb paired-end (12.3x) Bosq. 2: 454 Titanium (2x) Bantú: SOLiD 3.0 (> 30x) Todos: captura del exoma con arrays de Nimblegen + secuenciación 454 Titanium > 16x Validación: comparación de la secuencia completa con la secuencia del exoma, resecuenciación del genoma completo de dos individuos con Illumina (23.2x, 7.2x), validación de SNPs (Illumina arrays, Taqman, Sanger)…. SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS AÑO 2010 Nature 463, 757-762 (11 Feb.2010) Nature 463, 311-317 (21 Jan. 2010) Solexa Genome Analyzer de Illumina SOLEXA Workflow 1. Fragmentación y Ligación de adaptadores 2. Amplificación en fase sólida y generación de cluster mediante “Bridge amplificación” 3. Flujo de Terminadores reversibles e incorporación de una base en cada ciclo Incorporación 4 dNTPs Cada uno marcado con un fluorocromo Lavado, imagen de los 4 colores Corte de fluorocromos y grupos terminadores, lavado Incorporación 4 dNTPs Cada uno marcado con un fluorocromo 4. Flujo de Terminadores reversibles e incorporación de una base en cada ciclo Lavado, imagen de los 4 colores Se repiten los ciclos SOLiD 3 de Applied Biosystem SOLiD Workflow (Sequencing by Oligonucleotide Ligation and Detection ) 1. Generación Librería 4.Secuenciación mediante Ligación 2. emPCR y enriquecimiento 3. Deposición beads Secuenciación mediante ligación Comparación Plataformas secuenciación: Método amplificación 454 SOLID Polonotor SOLEXA CÓMO PROCEDER PARA HACER UN ARRAY DE CAPTURA DE SECUENCIA 1. 2. El investigador recibe el array diseñado de Nimblegen. La UCTS hace el proceso completo: generación de la librería a partir del DNA genómico con los adaptadores de secuenciación para GS FLX 454, captura de secuencia mediante el array y ultrasecuenciación. El investigador envía el DNA genómico a Nimblegen para que ellos generen la librería y hagan la captura de secuencia. El investigador recibirá la muestra capturada con unos adaptadores genéricos. La UCTS genera otra librería con los adaptadores para 454 y procede con la ultrasecuenciación. REQUISITOS DEL DNA DE PARTIDA DNA genómico humano no amplificado y no fragmentado (no debe mostrar un “smear” en gel de agarosa/bionanalyzer) UCTS Mín. 10 µg de DNA, C≥300 ng/µl en TE, cuantificado por un método fluorimétrico como el Picogreen (UCTS), con A260/A280 ≥1.8 y A260/A230 ≥1.9 DNA humano o de otros organismos (QC por el propio investigador) DNA genómico humano no amplificado y no fragmentado (no debe mostrar un “smear” en gel de agarosa/bionanalyzer) Mín. 21 µg de DNA, C=250-500 ng/µl, con A260/A280 ≥1.8 y A260/A230 ≥1.9 Sólo aceptan DNA genómico humano. NIMBLEGEN