Prácticos de informática (primera parte)

Transcripción

Prácticos de informática (primera parte)
1
ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA
2010
PRÁCTICO:
“ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS”
Objetivos
Profundizar en el análisis de secuencias nucleotídicas/aa utilizando la base de datos del
Genbank.
Introducir conceptos básicos de anotación genómica mediante el uso del programa
Artemis.
Tareas previas que el estudiante debe realizar antes de la clase práctica
Adjunto a este archivo se encuentra una secuencia nucleotídica (Ava1). Usted deberá
responder las siguientes interrogantes utilizando la base de datos del GenBank a través de
herramientas como el BLAST. Recuerde que la secuencia puede ser cargada para su
análisis directamente en upload file o bien ser abierta con un bloc de nota o un programa
que reconozca el formato fasta.
1)
2)
3)
4)
5)
6)
¿A qué organismo corresponde?
¿Cuál es el nombre completo de la secuencia?
¿Cuál es su número de acceso?
¿A qué tipo de secuencia corresponde y dentro de ella, a que familia, clase, etc?
¿Cuál es la cita del PubMed?
¿Qué localización genómica presenta?
Anotación de genomas con Artemis
Artemis es un programa de anotación de secuencias que permite analizar y
visualizar éstas de forma gráfica. A fin de familiarizarnos con este programa, en este
práctico analizaremos la secuencia Ava1, que se encuentra en la carpeta “Práctico de
Análisis genómico” en el escritorio de su PC.
1) Abra la secuencia Ava1, utilizando el comando File/Open. Observe que al abrir el
archivo, aparecen tres ventanas, una inferior vacía y dos superiores que muestran la
secuencia nucleotídica y las secuencias aminoacídicas correspondientes a las
traducciones en los seis marcos de lectura posibles (tres marcos de lectura por
hebra) (Figura 1).
2) Utilizando la opción Create/Mark ORF (open reading frames), establezca los
posibles ORFs, con un largo superior a 100 aminoácidos.
Sección Genética Evolutiva
2
3) El programa identifica diversas regiones de una secuencia, como unidades con un
determinado significado, a las cuales se les pueden asignar nombres y anotar datos
acerca de ellas. Estas regiones se denominan “features” (características o marcas), y
pueden ser ORFs, exones, etc.
Analice los features (en este caso ORFs) obtenidos utilizando BLAST. Los features
aparecen indicados en la ventana inferior como CDS. Debe seleccionar cada uno de
los CDS y presionando el botón derecho del mouse sobre el feature, y utilizando la
opción View/Amino Acids of selection as FASTA (también se puede seleccionar
la secuencia nucleotidíca View/Bases of selection as FASTA) podrá obtener la
secuencia de cada CDS para su análisis.
4) Utilizando la información obtenida mediante BLAST, ahora puede editar la
información contenida en los features, haciendo click con el botón derecho, y
seleccionando la opción Edit/Selected feature in editor. En la ventana que se abre
se puede modificar el nombre del feature con la opción Key, y agregar
información, colores, etc., con la opción Add Qualifiers.
5) Los features pueden estar separados de la secuencia en un archivo aparte
denominado “entry”. Abra la entry localizada en el archivo Ava1_entry y observe
los features ahí contenidos (File/read an entry). Este archivo fue realizado por el
investigador que depositó la secuencia en el GenBank).
6) Compare el tamaño de los ORFs obtenidos con los anotados en Ava1_entry. ¿Se
encuentran diferencias? Si es así, explique por qué. Si es necesario, modifique el
tamaño de los ORF de acuerdo a los datos obtenidos mediante BLAST.
7) Usted también puede bajar el archivo con todas las anotaciones o features
directamente del Genbank. Para esto utilice la opción File/Open from EBI y
coloque el número de accessión (Acc. Number: DQ985395). Para obtener
información adicional sobre los features anotados vaya a View/view selected
features. Qué información posee el tercer CDS?. Incluya la información adicional
en el panel de features (panel 5, Figura 1).
Sección Genética Evolutiva
3
Figura 1. Ventana principal de artemis.
1: Menú desplegable principal
2. “entry” activas. Las “entry” actúan como capas o layers en las que puedo realizar
anotación. Puedo crear tantas como desee y se utilizan para organizar la información en
unidades independientes.
3. Panel principal de visualización de las secuencias. Las líneas grises representan las
hebra forward (superior) y reverse (inferior). Se representa también las secuencias
aminoacídicas correspondientes a las traducciones en los seis marcos de lectura posibles
(tres marcos de lectura por hebra). Las líneas negras verticales representan los codones
stop. Las regiones coloreadas representan los distintos “features” que han sido anotados en
la secuencia.
4. Este panel tiene la misma estructura que el panel principal de visualización pero ha sido
aumentado para visualizar las secuencias nucleotídicas y aminoacídicas.
5. Este panel indica los distintos “features” que presenta la secuencia.
6. Barras para aumentar o disminuir los paneles
7. Barras para movilizarse en la secuencia
8. Barras para desplazar los “features”.
Sección Genética Evolutiva
1
ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA 2010
PRÁCTICO:
“ANOTACIÓN GENÓMICA UTILIZANDO ARTEMIS”
Objetivos
Introducir conceptos básicos acerca de la predicción y anotado de genes
en un genoma bacteriano mediante la utilización de Artemis.
Introducción
Las herramientas de Artemis pueden ser utilizadas, entre otras cosas, para
la predicción y anotado de genes en un genoma. En el caso de este práctico,
analizaremos el genoma de Mycobacterium tuberculosis, el agente causante de la
tuberculosis. Utilizaremos tres criterios para la identificación de genes en esta
bacteria:
1) La predicción de marcos abiertos de lectura que comiencen con codones
de inicio típicos de proteínas procariotas.
2) Comparación con información de genes homólogos en otros organismos
obtenida mediante BLASTX.
3) Variación de la composición de bases en el ADN codificante y no
codificante.
Actividades
1) Cargue el archivo M. tuberculosisi fasta en Artemis, tal y como lo realizó en
la parte anterior del práctico.
2) Marque los ORF mayor a 100 aminoácidos de la misma manera que lo hizo
en el ejemplo anterior.
3) Vaya a Select/All, ahora podrá ver seleccionados todos los ORF
generados en la actividad 2.
4) Vaya a Edit/Trim Selected Features/To Any. Esta opción modificará los
ORF para que comience con un codón de inicio procariota (TTG, ATG,
GTG), Se genera el siguiente mensaje “some features could not be
trimmed (they are now selected)”. Éstos Features seleccionados no
presentan en el primer tercio de su secuencia dichos codones de inicio.
Para eliminarlos vaya a Edit/Selected Features/Delete.
Sección Genética Evolutiva
2
5) Cargar información de genes homólogos: para crear un Entry con esta
información vaya a File/Read an Entry y seleccione el archivo Hits.blastx.
Ahora podrá ser capaz de observar nuevas anotaciones en el genoma.
6) Analizar las diferencias en la composición de bases de regiones
codificantes y no codificantes: para esta actividad utilizaremos los gráficos
de GC Frame Plot (Graph/GC Frame Plot).
Preguntas
1) ¿Qué puede observar al comparar las anotaciones realizadas por usted y
las cargadas en la Entry con información de genes homólogos?
2) ¿Qué diferencias existen en la composición de bases entre secuencias
codificantes y no codificantes?
3) ¿Qué otra etapa podría adicionarse a esta estrategia de predicción para
que los resultados sean más fiables?
Sección Genética Evolutiva
1
ORGANIZACIÓN, FUNCIÓN Y VARIABILIDAD DEL GENOMA
2010
PRÁCTICO:
“GENÓMICA COMPARATIVA UTILIZANDO ACT”
Objetivos
Introducir conceptos básicos sobre el funcionamiento del programa ACT (Artemis
Comparison Tool) y su aplicación en la comparación de genomas.
Introducción a ACT
ACT es un programa que permite ver de forma gráfica la comparación de dos o más
genomas. El programa utiliza el algoritmo BLASTN o tBLASTx para generar un archivo
de comparación entre los genomas de interés. La información generada en este archivo de
comparación es utilizada por el ACT para representar en forma gráfica el grado de
similitud entre los genomas.
Generación del archivo de comparación
La manera más sencilla de generar un archivo de comparación es utilizar el servicio
disponible en www.webact.org. Esta dirección web permite subir los archivos de secuencia
a comparar y genera automáticamente el archivo de comparación.
Interpretación de los resultados
El ACT muestra como
bloques de color rojo las secuencias
conservadas en ambos genomas y que
se encuentran en el mismo sentido.
Por otro lado, las secuencias
conservadas pero que se encuentran
invertidas en un genoma con respecto
al otro, se muestran como bloques
azules. Las secuencias que están
presentes en un genoma pero no en el
otro se ven como bloques de color
blanco.
Sección Genética Evolutiva
2
Actividades que debe desarrollar el estudiante
Tarea I. Comparación entre dos alelos de un gen de D. melanogaster.
1 – Ingrese a la página www.webact.org.
2 – Diríjase a la pestaña Generate
3 – Suba los archivos sequence1 y sequence2 de la carpeta “Práctico ACT/Tarea I”
4 – Presione el botón Submit en la parte inferior de la pantalla y espere que aparezca la
ventana siguiente.
5 – Presione el botón Download para bajar el archivo de comparación a su PC.
6 – Descomprima los archivos que se encuentran dentro del .zip.
6 – Abra el programa ACT y seleccione el comando File/Open
8 – Cargue la secuencia 1, el archivo de comparación (denominado blast_out1) y la
secuencia 2.
9 – Se abrirán tres ventanas, superior e inferior conteniendo cada una de las secuencias a
comparar y una ventana central indicando con bloques de diferentes colores las homologías
y diferencias entre ambas secuencias.
Preguntas:
1)
2)
3)
4)
¿Cuál es la longitud en pb de cada una de las secuencias a comparar?
¿Qué puede decir acerca de la comparación entre ambas secuencias?
¿A que gen corresponden dichas secuencias?
¿A qué son debidas las diferencias encontradas?
Tarea II: Comparación de los genomas de Salmonella enterica serovar. typhi y
Escherichia coli K12.
1 – Ambos genomas se cargaron y el archivo de comparación fue generado siguiendo los
pasos indicados en la tarea I y se encuentran disponibles en la carpeta del “Práctico
ACT/Tarea II” como EcoliK12, Styphi y comparisonES.
2 – Abra el programa ACT y seleccione el comando File/Open.
4 – Cargue la secuencia 1, el archivo de comparación y la secuencia 2.
Preguntas:
1) ¿Existen regiones conservadas en ambos genomas?
2) ¿Qué puede decir acerca de la conservación en la posición de los genes (sintenia)?
3) ¿Se aprecia algún reordenamiento genómico?
Tarea III: Comparación del genoma de Escherichia coli K12 (no patógena) con el
genoma de Escherichia coli 0157:H7 (enteropatógeno humano).
1 – En la carpeta del “Práctico ACT/Tarea III” se encontrará con los tres archivos para
cargar en el ACT y seguirá los mismos pasos que en las tareas anteriores.
Preguntas:
1) ¿Existen regiones del genoma que sean exclusivas de una u otra cepa?, de ser así ¿qué
genes están presentes en dichas regiones?
2) ¿Qué rol podrían jugar estar regiones en el fenotipo de estas cepas?
Sección Genética Evolutiva

Documentos relacionados