4. Secuenciación

Transcripción

4. Secuenciación
Cursos de Formación de la UCTS (2011)
Plataforma de Genómica / Plataforma de Diagnóstico Molecular
“Tecnologías de alto rendimiento en genómica”
2ª Parte: Tecnologías de ultrasecuenciación y de enriquecimiento
de secuencia.
Programa del curso
De Sanger hacia NGS
454 de Roche
Desarrollo de la tecnología
Cómo funciona
Aplicaciones
Comparación con otros Sistemas NGS
Sistema Nimblegen
Cómo funciona
Formatos
Aplicaciones
Análisis de datos de alta densidad (UEB)
Cualquier DNA puede ser secuenciado
Genomas Secuenciados
Nature Reviews Genetics 9, 303-313, 2008
Cronología de la Secuenciación
1973
Método secuenciación
“Wandering spot”, Maxam y Gilbert
1975
Método secuenciación
“plus and minus”, Sanger y Coulson
1977
1.“ DNA sequencing by chemical degradation ”by
Maxam y Gilbert.
phi X 174
Primer genoma de DNA completo secuenciado
11 genes en 5386 bases (cadena sencilla)
NGS:2ª GENERACIÓN
2.“Chain-terminator method” by Sanger et al.
Método usado durante los proximos 30 años
1ª GENERACIÓN
Francis Crick and James
Watson describen el modelo
de la doble hélice del DNA.
1ª GENERACIÓN
1953
1996
Pal Nyrén & Mostafa Ronagh i publican método
de la pirosecuenciación en el Royal Institute of
Technology (Stockholm).
2001
Se publica la primera versión del genoma humano.
Science 291 (5507): 1304–51; Nature 409 (6822): 860–921
2003
Proyecto Genoma Humano (13 años).
U.S. Department of Energy and the NIH
2005
454 Life Science comercializa el
1er ultrasecuenciador GS20 (20Mpb)
2006
Lanzamiento de SOLEXA (Illumina)
200
7
Genoma de Venter mediante sec. Sanger
automática (4 años)
Lanzamiento de GS FLX de Roche (100Mbp)
2008
1987
1990
Serie de reactivos Titanium de Roche (500Mbp).
Applied Biosystems comercializa el
primer secuenciador automático,
El modelo ABI 370.
El Instituto Naiconal de Salud (NIH)
empieza secuenciación a gran escala de
diversos microorganismos, ej. E.coli
SOLID de Applied Biosystem
Genoma Watson mediante 454/ROCHE
Nature 452, 872-876 (17 April 2008).
N
ª
IÓ
S:3 RAC
G
N NE
GE
2010
1000 Genomes Project
Método de secuenciaciación
SingleMolecularRealTime
1ª Generación Secuenciación
Método Sanger
Fragmentación de DNA
Clonaje en Vectores; Transformación Bacterias;
crecimiento y aislamiento vector DNA
Ciclo Secuenciación
Sanger sequencing:
- Long reads (500-1000 bp)
- Low throughput (192 reactions/run)
Secuencia: 3´…GACTAGATACGACGAGCGTGA…5´
Primer:
5´…CTGAT
Electroforesis
( 1 Secuencia/Capilar)
Polimerasa
dNTPs
ddNTPs marcados
CTATGCTCG
2ª Generación Secuenciación
Los Instrumentos de secuenciación de 2ª generación
pueden generar tantos datos en un día como los
generados por varios cientos de secuenciadores con
capilares tipo Sanger, obtenidos por una sola persona.
2ª Generación Secuenciación
ROCHE
GS FLX 454
GS FLX+ 454
GS Junior 454
illumina
Solexa
Life Technology
SOLiD™ 3System
SOLiD™ 4 System
5500 System
5500xl System
Ion Torrent System
Servicio Ultrasecuenciación UCTS
GS 454 de ROCHE
GS FLX
GS Junior
¿Cúantas muestras se pueden secuenciar por run?
1ª Generación
Metal coated PTP reduces crosstalk
29 µm well diameter (20/bead)
3100 ABI
2ª Generación
GS ROCHE
3,400,000 wells per PTP
96p-Plates
384p-Plates
PicoTiterPlate_FLX
70x70mm
PicoTiterPlate_Junior
GS FLX/Junior 454 Troughput
PTP
Gaskets
35
-Tamaño de lo que quiero secuenciar
-Coverage
-Multiplexar (MIDS)
N= (GxC)/Mbp por región PTP
Donde: N= num de muestras que puedo secuenciar en un run
G= tamaño de lo que quiero secuenciar
C=Coverage (C= N * L / G)
GS FLX/Junior 454 Workflow
gDNA, Amplicones, cDNA
1.Calidad & Cantidad
Material de partida
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
Datos Obtenidos
1. Calidad & Cantidad Material de partida
1.1 Calidad mediante Chips Bioanalyzer; gel agarosa
gDNA, RNA
1.2 Cuantificación mediante Picogreen (gDNA) o Ribogreen (RNA)
y = 34,577x - 61,596
R2 = 0,9994
Fluorescence
20000
15000
10000
.
5000
0
0
200
400
Lam bda DNA (ng/m L)
600
Fluorímetro FLx800
GS FLX/Junior 454 Workflow
gDNA, Amplicones, RNA
1.Calidad & Cantidad
Material de partida
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
Datos Obtenidos
2. Construcción Librería
Fragmentación
Selección Tamaño
Ligación Adaptadores
Librería Shotgun
Librería Pair-End
Librería cDNA
Librería Amplicones
gDNA, RNA
Adaptador A (44 bases):
Primer
4 nucleótidos
Amplificación Primer
“Key”
Secuenciación
PCR con Fusion Primers
Adaptador B (44 bases)
Biotina
Primer
4 nucleótidos
Amplificación Primer
“Key”
Secuenciación
Fusion Primers
Adaptador A
Target
Adaptador B Target
2. Construcción Librería: Fragmentación gDNA
Librerías Shotgun
NEBULIZACIÓN
Rotura utilizando nitrógeno a alta presión
DNA genómico
Fragmentos de DNA
de doble cadena
2.1 bar (30psi)
Librerías Pair-End
HYDROSHEAR
Fuerzas de rotura hidrodinámicas
Orificio
gDNA
gDNA
fragmentado
2. Construcción Librería: Fragmentación RNA
Librerías cDNA
RNA
Random
Primers
First Strand
Synthesis
Solución de
Fragmentación de RNA
Second Strand
Synthesis
Fragmentos de cDNA
de doble cadena
2. Construcción Librería: Selección fragmentos
gDNA Nebulizado:
DNA 7500 Lab Chip
AMPure beads
SPRI (Solid Phase Reversible Immobilization)
DNA 7500 LabChip
300pb-1000pb
50pb-1000pb
gDNA fragmentado con Hydroshear:
RNA Pico 6000 LabChip
Electroelución
500pb-600 nt
Tamaño medio de 500-600 nt (dep. del contenido en GC)
Menos del 10% ≤ 300 nt, no adaptor dimers
Conc >0.2 ng/µl (Ribogreen ®)
2. Construcción Librería
Inmobilización Fragmentos y aislamiento de la Librería:
AB
AB
Melt Solution
BB
AA
4 tipos de productos resultan de la ligación
Los productos con Biotina (AB, BA, BB) se unen a bolas magnéticas que llevan
estreptavidina. Los products AA son lavados y eliminados.
Mediante Melt Solution (NaOH0.1N) las cadenas no biotiniladas de cada
fragmento de dsDNA son aisladas. Ambas cadenas de los fragmentos BB quedarán
unidas a las bolas.
Sólo se aislan cadenas de DNA sencilla AB constituyendo la librería.
2. Construcción Librería: Q&Q Librería
Molecules/µl =
- Num de Avogadro es 6.022x1023 (moléculas/mole)
-328.3x109 (gramos/mole) es peso molecular medio de nts.
-Perfil típico de una librería ssDNA (Agilent 2100 RNA Pico 6000
LabChip): Tamaño medio de 500-800 bp
-Cuantificación mediante Ribogreen
-Dilución de trabajo para emPCR
GS FLX/Junior 454 Workflow
gDNA, Amplicones, cDNA
1.Calidad & Cantidad
Material de partida
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
Datos Obtenidos
3. Amplificación mediante emPCR
Antes de la emPCR:
high-speed
shaker
-1 starting effective fragment per microreactor
- ~106 microreactors per ml
- All processed in parallel
(Amplificación clonal)
3. Amplificación mediante emPCR
Después de la PCR:
Rotura y Recuperación
Contaje
DNA-beads/ml
% Recuperación=
x100
Input beads
Enrequecimiento de
beads con DNA:
Melt
dsDNA
Unión de Primer marcado
con Biotina a bolas de
captura con ssDNA
Adición de bolas
magnéticas con
estreptavidina
Melt
DNA-beads/ml
% Enrequecimiento=
x100
Input beads
emPCR Titulación sólo para GS FLX
Antes de la emPCR:
¿Cuántas copias de librería por
Beads de captura son óptimas?
1. Procesar 4 tubos emulsiones
Tubo
Moléculas de Librería por
Bead de Captura (cpb)
Vol Librería
Diluida
1
2
1.2 µl
2
4
2.4 µl
3
8
4.8 µl
4
16
9.6 µl
2. Recuperación y enrequecimiento de cada tubo
3. Contaje de las beads enriquecidas
4. Escoger el ratio copia/bead con aproximadamente un 8% de enrequecimiento
GS FLX/Junior 454 Workflow
gDNA, Amplicones, cDNA
1.Calidad & Cantidad
Material de partida
2. Construcción Librería
3. Amplificación mediante emPCR
4. Secuenciación
Datos Obtenidos
4. Secuenciación
Metal coated PTP reduces crosstalk
29 µm well diameter (20/bead)
3,400,000 wells per PTP
Gaskets
4. Secuenciación
Secuenciación mediante síntesis
Química basada en la pirosecuenciación
Polimerasa añade
nucleótidos (dATP)
Se libera pirofosfato (PPi)
Sulfurilasa crea ATP a
partir del PPi
Luciferasa hidroliza ATP y
usa luciferina para producir
luz.
Sulfurylase
Luciferase
Luciferina
Light + oxyluciferin
4. Secuenciación
Flujo de Reactivos
Nucleotides are flowed sequentially across
the PTPone at a time (200 cycles à4 bases)
Pyrophosphate signal generation upon
complimentary nucleotide incorporation —
dark otherwise
The CCDcamera is generating a image after
every flow
The signal strength is proportional to the
number of nucleotides incorporated
4. Secuenciación
Flowgama y Base calling:
4. Secuenciación:Ejemplo
MULTIPLEXACIÓN DE MUESTRAS
MIDS:
-Los MIDs son secuencias cortas que se añaden a los fragmentos a secuenciar
durante la generación de librería y permiten identificar cada muestra de manera
individual.
Primer
4 nucleótidos
Amplificación Primer
“Key”
Secuenciación
Biotina
Primer
4 nucleótidos
Amplificación Primer
“Key”
Secuenciación
Adaptador A
Adaptador B
MIDS
MIDS
Target
MIDS
Target
MIDS
-Permite aumentar el número de muestras por PTP:
-separación física: “gaskets” → pérdida física de espacio en la placa
-separación por “código de barras”
-Utilizando las dos posibilidades anteriores, aumenta el número de muestras a
secuenciar por placa:
-Kit comercial de 12 MIDs (diseñados por Roche) → 12 muestras/reg.
-División de la PTP en 16 reg. con “gaskets”
TOTAL: 12 MIDs/reg. * 16 reg. = 192 muestras por PTP (máx) (INCLUSO MÁS)
Multiplexado de Muestras
Multiplexado de amplicones
MID2-Amplicón 2
MID1-Amplicón 1
MID4-Amplicón 4
MID3-Amplicón 3
MID5-Amplicón 5
MID6-Amplicón 6
Amplicón 7
Amplicón 8
Amplicón 11
Amplicón 12
Amplicón 9
Amplicón 10
SISTEMA GS FLX 454-APLICACIONES
-Secuenciación de DNA a partir de muestras de especies extinguidas (shot-gun,
paired-end)
-Estudios de epigenética: amplicones
-ChIP y secuenciación de los fragmentos de DNA presentes en los IPs
-Metilación: conversión con bisulfito, amplificación de las regiones
conteniendo islas CpG y secuenciación.
-Ensamblaje de genomas eucariotas y procariotas completos, tanto de novo como
resecuenciación (shot-gun +paired-end)
-SAGE (Serial Analysis of Gene Expression Ditags): análisis cuantitativo y cualitativo
del transcriptoma (shot-gun)
-Caracterización y cuantificación de poblaciones virales a través de la secuenciación
de genes diana (ej: transcriptasa reversa en VIH). Detección de quasiespecies
(amplicones).
-Metagenómica: estudio del contenido genómico en una mezcla compleja de
microorganismos (microbiota, muestras medioambientales). Determinación tanto
cuantitativa como cualitativa (shot-gun, retrotranscripción de RNA total o de mRNA,
amplicones de 16S rRNA)
SISTEMA GS FLX 454-APLICACIONES
-Secuenciación de genomas de pequeño tamaño (virales, mitocondriales) o de plásmidos
(shot-gun)
-Secuenciación de RNAs de pequeño tamaño (microRNAs, siRNAs): generación del
cDNA de doble cadena como material de partida (shot-gun)
-Detección de SNPs, InDels, CNV (shot-gun)
-Análisis del transcriptoma (partiendo de RNA total o mRNA), cuantitativo o
cualitativo (comparación de niveles de expresión) (retrotranscripción y shot-gun)
-Enriquecimiento de regiones del genoma/captura del exoma utilizando arrays de
captura de Nimblegen. Secuenciación de las regiones capturadas (shot-gun).
En función de la aplicación, puede ser necesario completar los datos de 454 utilizando
otras tecnologías, p.ej. Resolución de homopolímeros utilizando Sanger o lecturas
cortas de Illumina.
En general, se recomienda validar siempre los resultados utilizando otro tipo de
aproximaciones: arrays, secuenciación Sanger, PCR a tiempo real, otras tecnologías de
ultrasecuenciación.....
Especificaciones Sistemas GS FLX & GS Junior
El futuro de la secuenciación 454
Programa del curso
De Sanger hacia NGS
454 de Roche
Desarrollo de la tecnología
Cómo funciona
Aplicaciones
Comparación con otros Sistemas NGS
Sistema Nimblegen
Cómo funciona
Formatos
Aplicaciones
Análisis de datos de alta densidad (UEB)ç
Comparación Plataformas secuenciación
HiSeq 2000-Illumina
GS FLX 454
ABI SOLID 5500xl
Chemistry based on
pirosequencing
Chemistry based on
reversible terminators
Chemistry based on
sequencing by ligation
Sample amplified by
emulsion PCR
Sample amplified by
solidphase amplification
Sample amplified by
emulsion PCR
Read length 250-500 bp
Read length 2x100 bp
Read length 50-100 bp
>1 million reads per run
3 billions reads per run
100-500 million reads per run
400-600 Mb of sequence
600 Gb of sequence
50-100 Gb of sequence
~10 hours run
2-11 days run
4-8 days run
Comparación Plataformas secuenciación
Comparación Plataformas secuenciación
Comparación Plataformas secuenciación
Ejemplos de Genomas humanos secuenciados
Nature Reviews Genetics 11, 31-46 (January 2010)
Comparación Plataformas secuenciación
1ª Generación
2ª Generación
3ª Generación Secuenciación
SCIENCE Vol 323 2 JANUARY 2009
Real-Time DNA Sequencing from
Single Polymerase Molecules
John Eid,* Adrian Fehr,* Jeremy Gray,* Khai Luong,* John Lyle,* Geoff Otto,* Paul
Peluso,* David Rank,* Primo Baybayan, Brad Bettman, Arkadiusz Bibillo, Keith
Bjornson, Bidhan Chaudhuri, Frederick Christians, Ronald Cicero, Sonya Clark,
Ravindra Dalal, Alex deWinter, John Dixon, Mathieu Foquet, Alfred
Alfred Gaertner, Paul
Hardenbol, Cheryl Heiner, Kevin Hester, David Holden, Gregory Kearns,
Kearns, Xiangxu
Kong, Ronald Kuse, Yves Lacroix, Steven Lin, Paul Lundquist, Congcong
Congcong Ma,
Patrick Marks, Mark Maxham, Devon Murphy, Insil Park, Thang Pham,
Pham, Michael
Phillips, Joy Roy, Robert Sebra, Gene Shen, Jon Sorenson, Austin Tomaney, Kevin
Travers, Mark Trulson, John Vieceli, Jeffrey Wegener, Dawn Wu, Alicia
Alicia Yang,
Denis Zaccarin, Peter Zhao, Frank Zhong, Jonas Korlach, Stephen
Stephen Turner.
Press Release
Pacific Biosciences Announces Early Access
Customers for Its Single Molecule Real Time System
Eleven Leading Companies Support Launch of Third-generation DNA Sequencing
http://www.pacificbiosciences.com
MENLO PARK, Calif., Feb 23, 2010 Pacific Biosciences, a private company
developing a disruptive technology platform for real-time detection of biological
events at single molecule resolution, today announced the 10 institutions that
have purchased its Single Molecule Real Time (SMRT(TM)) DNA sequencing
system as part of the company's early access program in North America.
Programa del curso
De Sanger hacia NGS
454 de Roche
Desarrollo de la tecnología
Cómo funciona
Aplicaciones
Comparación con otros Sistemas NGS
Sistema Nimblegen
Cómo funciona
Formatos
Aplicaciones
Análisis de datos de alta densidad (UEB)
NIMBLEGEN: Arrays de Captura
Los arrays de captura de secuencia de Nimblegen permiten capturar y enriquecer regiones génicas
de interés, contiguas o no, con una elevada sensibilidad y especificidad, que luego pueden
amplificarse y secuenciarse mediante tecnologías de alto rendimiento (454/Illumina).
-Este sistema permite secuenciar regiones de interés en vez de genomas completos, con lo cual el
coste de la secuenciación se reduce considerablemente. Técnicamente, el proceso también es menos
costoso.
-Sistema flexible: las regiones de interés pueden ser contiguas o no en el genoma.
-Nimblegen diseña los arrays a la carta, solamente es necesario facilitarles las coordenadas de los
genes diana.
1)
Formato sólido
-Arrays “ a la carta”, con dos posibles tamaños de captura: 5 Mb ó 30 Mb por array.
-Arrays de captura del exoma: prediseñados, contienen 180.000 exones humanos
codificantes y 551 exones para miRNA (34 Mb), utilizando 2,1 millones de sondas. El
listado de genes que contienen estos arrays puede consultarse en la web de Nimblegen
(www.nimblegen.com).
-2) Formato en solución
-Arrays de captura del exoma: prediseñados, contienen 180.000 exones humanos
codificantes y 551 exones para miRNA (34 Mb). Existe una versión LR (long-read)
optimizada para secuenciación con 454. Disponible en dos formatos, para 4 reacciones y
para 48 reacciones.
Próximamente existirá este formato para arrays de 5 Mb.
NIMBLEGEN: Arrays de Captura
PROTOCOLO DE ARRAYS DE CAPTURA EN SÓLIDO
3. Pre-capture amplification
4. Hybridization
a) Ensamblaje del array
b) Carga del array
c) Hibridación: 42º C, 64-72 h
PROTOCOLO DE ARRAYS DE CAPTURA EN SOLUCIÓN
Streptavidin beads
Pre-capture amplification
Primers biotinilados
3. Hybridization
47 ºC,
64-72 horas
CONTROL DE CALIDAD DE LA CAPTURA MEDIANTE qPCR
La eficiencia teórica de una qPCR es del 100% y significa que las
secuencias diana se doblan en cada ciclo, es decir, que E=2. Sin embargo,
la eficiencia real nunca es del 100% y por eso el valor de E debe calcularse
empíricamente para cada sonda.
Los locus control NSC permiten determinar el enriquecimiento de un
pequeño set de locus control estandarizados que se encuentran
dentro de un rango de eficiencias de captura conocidas. Estos
ensayos permiten hacer una estimación aproximada del
enriquecimiento de poblaciones mayores de genes diana sin
necesidad de secuenciarlos. Si la qPCR de estos locus control indica
una captura correcta, es muy problable que los locus experimentales
de interés también hayan sido capturados satisfactoriamente.
TECNOLOGÍA DE NIMBLEGEN
-Arrays de enriquecimiento de secuencia
-CGH arrays
CGX / CNV / Whole genome / Whole genome-exon focused / Custom
-ChIP-chip arrays
Whole genome / Promoter / Custom
-Arrays de metilación
Whole genome / Promoter / Custom
-Arrays de expresión génica
Whole genome / Promoter / Custom
www.nimblegen.com
OTRAS TECNOLOGÍAS DE ENRIQUECIMIENTO DE SECUENCIA
-Sistema SureSelect (Agilent): arrays de captura en solución. Optimizada
para la secuenciación con Illumina, SOLiD y 454. Existen versiones
prediseñadas para capturar el exoma y el noma humanos, o bien pueden
diseñarse ensayos “a la carta” (captura de 3.3 ó 6.6 Mb). Las muestras
pueden “indexarse” después de la captura para optimizar el rendimiento de
la ultrasecuenciación (=MIDs de Roche). Existe también un formato sólido
que permite capturar hasta 1 Mb.
http://www.genomics.agilent.com
-Sistema Febit (ABI). Para ver una descripción de cómo funciona el sistema:
http://www.nature.com/nmeth/journal/v6/n9/full/nmeth.f.266.html
PAUTAS PARA EL DISEÑO EXPERIMENTAL DE UN ESTUDIO DE
ULTRASECUENCIACIÓN
UCTS WORKFLOW
Researcher
Statistics and Bioinformatics
(UEB)
EXPERIMENTAL DESIGN
RESULTS CHECKING
UCTS
QUALITY SAMPLES COLLECTION
EXPERIMENTS
DATA ANALYSIS
UEB
Others
SAMPLE PROCESSING
SEQUENCING
UCTS
El futuro de la secuenciación 454
Fin
I. ANÁLISIS DE VARIANTES VIRALES UTILIZANDO UN
ENSAYO DE AMPLICONES
PAUTAS PARA LA GENERACIÓN DE UNA LIBRERÍA DE AMPLICONES
-La secuenciación puede hacerse de manera unidireccional o bidireccional (en ambos sentidos,
forward y reverse, separadamente).
-Si la secuenciación es unidireccional, la generación de los amplicones es también
unidireccional. Este método es más cómodo, especialmente cuando se quiere trabajar con
diferentes “loci” diana en muchas muestras, utilizando para la amplificación primers genespecíficos (1 set por “loci”).
-En general se obtienen mejores resultados utilizando secuenciación bidireccional. Esto es
especialmente importante cuando se desean buscar variantes con baja frecuencia en una
población. Si la secuenciación es bidireccional deben amplificarse los fragmentos de PCR con
primers para ambos sentidos, forward y reverse.
-Para la generación de la librería de amplicones debe usarse una polimerasa de alta fidelidad.
-La cuantificación de la librería debe hacerse siempre por un método fluorimétrico
(Picogreen®) porque los métodos espectrofotométricos (absorbancia) tienden a sobreestimar
la cantidad de ADN.
Programa del curso
De Sanger hacia NGS
454 de Roche
Desarrollo de la tecnología
Cómo funciona
Aplicaciones
Comparación con otros Sistemas NGS
Sistema Nimblegen
Cómo funciona
Formatos
Aplicaciones
Análisis de datos de alta densidad (UEB)
I. ANÁLISIS DE VARIANTES VIRALES UTILIZANDO UN
ENSAYO DE AMPLICONES
Diseño de los primers para generar una librería de amplicones
Usuario
a) Librería de amplicones unidireccional
Primers “genéricos” SIN adaptadores de secuenciación para GS FLX Titanium y SIN
MIDs. Generación de una librería de tipo “shot-gun” donde se añaden los adaptadores de
secuenciación y los MIDs.
b) Librería de amplicones bidireccional
-Se une a las Beads de captura (EmPCR)
-Complementaria a los primers de amplificación & secuenciación
Sequencing key
400 bp
200-600 bp (máx. 800 bp)*
MIDs: Multiplex Identifiers (diseñados por Roche)
Fusion primer
*Amplicones <200 pb ó >1000 bp también pueden secuenciarse con modificaciones en el protocolo.
II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO
LAS APLICACIONES PAIRED-END Y SHOT-GUN
II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO
LAS APLICACIONES PAIRED-END Y SHOT-GUN
II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO
LAS APLICACIONES PAIRED-END Y SHOT-GUN
II. SECUENCIACIÓN DE NOVO DE GENOMAS BACTERIANOS UTILIZANDO
LAS APLICACIONES PAIRED-END Y SHOT-GUN
EL MÉTODO DE SECUENCIACIÓN DEPENDE DEL TAMAÑO DEL GENOMA
Human exome: 34 Mb
DNA mitocondrial humano: 16.5 Kb
Saccharomyces cerevisiae: 12.5 Mb
E. coli O157:H7: 5.44 Mb
Sanger
Nº de bases
Human genome: 3 Gb
Drosophila melanogaster: 122.6 Mb
Caenorhabditis elegans: 100 Mb
SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS!!!!
Nature 463, 943-947 (18 Feb.2010) Suppl. Info
SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS
AÑO 2010
Nature 463, 943-947 (18 Feb.2010)
Genomas completos 1 bosquimano (total 4 participantes) + 1 bantú
Bosq. 1: 454 Titanium shotgun (10.2x) + 20 Kb paired-end (12.3x)
Bosq. 2: 454 Titanium (2x)
Bantú: SOLiD 3.0 (> 30x)
Todos: captura del exoma con arrays de Nimblegen + secuenciación 454
Titanium > 16x
Validación: comparación de la secuencia completa con la secuencia del exoma,
resecuenciación del genoma completo de dos individuos con Illumina (23.2x,
7.2x), validación de SNPs (Illumina arrays, Taqman, Sanger)….
SECUENCIACIÓN DE GENOMAS HUMANOS COMPLETOS
AÑO 2010
Nature 463, 757-762 (11 Feb.2010)
Nature 463, 311-317 (21 Jan. 2010)
Solexa Genome Analyzer de Illumina
SOLEXA Workflow
1. Fragmentación y
Ligación de adaptadores
2. Amplificación en fase sólida y generación de cluster mediante “Bridge amplificación”
3. Flujo de Terminadores reversibles e incorporación de una base en cada ciclo
Incorporación 4 dNTPs
Cada uno marcado con
un fluorocromo
Lavado, imagen
de los 4 colores
Corte de fluorocromos
y grupos terminadores,
lavado
Incorporación 4 dNTPs
Cada uno marcado con
un fluorocromo
4. Flujo de Terminadores reversibles e incorporación de una base en cada ciclo
Lavado, imagen
de los 4 colores
Se repiten los
ciclos
SOLiD 3 de Applied Biosystem
SOLiD Workflow
(Sequencing by Oligonucleotide Ligation and Detection )
1. Generación Librería
4.Secuenciación mediante Ligación
2. emPCR y enriquecimiento
3. Deposición beads
Secuenciación mediante ligación
Comparación Plataformas secuenciación: Método amplificación
454
SOLID
Polonotor
SOLEXA
CÓMO PROCEDER PARA HACER UN ARRAY DE CAPTURA DE SECUENCIA
1.
2.
El investigador recibe el array diseñado de Nimblegen. La UCTS hace el proceso completo:
generación de la librería a partir del DNA genómico con los adaptadores de secuenciación para GS
FLX 454, captura de secuencia mediante el array y ultrasecuenciación.
El investigador envía el DNA genómico a Nimblegen para que ellos generen la librería y hagan la
captura de secuencia. El investigador recibirá la muestra capturada con unos adaptadores
genéricos. La UCTS genera otra librería con los adaptadores para 454 y procede con la
ultrasecuenciación.
REQUISITOS DEL DNA DE PARTIDA
DNA genómico humano no amplificado y no
fragmentado (no debe mostrar un “smear” en
gel de agarosa/bionanalyzer)
UCTS
Mín. 10 µg de DNA, C≥300 ng/µl en TE,
cuantificado por un método fluorimétrico
como el Picogreen (UCTS), con A260/A280
≥1.8 y A260/A230 ≥1.9
DNA humano o de otros organismos (QC por
el propio investigador)
DNA genómico humano no amplificado y no
fragmentado (no debe mostrar un “smear” en
gel de agarosa/bionanalyzer)
Mín. 21 µg de DNA, C=250-500 ng/µl, con
A260/A280 ≥1.8 y A260/A230 ≥1.9
Sólo aceptan DNA genómico humano.
NIMBLEGEN

Documentos relacionados