Genómica, proteómica y medicina

Transcripción

Genómica, proteómica y medicina
2
Genómica, proteómica
y medicina
Fernando Vivanco
Fundación Jiménez Díaz
Universidad Complutense. Madrid
Resumen
La secuenciación del genoma humano, junto
con el desarrollo y la implementación de las
nuevas tecnologías «ómicas» de alto rendimiento (genómica, proteómica, metabolómica), están
incrementando de manera esencial el conocimiento de la enfermedad humana y estableciendo unas bases sólidas para el desarrollo de la
medicina personalizada (MP). El paradigma de
la MP, y que plantea unos objetivos más ambiciosos, es la denominada «medicina 4P»: preventiva, predictiva, personalizada y participativa.
Aplicando la biología de sistemas (que utiliza los
datos y las técnicas genómicas, proteómicas y
metabolómicas), la emergencia de nuevas tecnologías (nanochips, microfluídica, técnicas de
visualización) y las nuevas herramientas computacionales, pretenden establecer nuevos estándares en salud humana. Uno de sus objetivos
es incorporar el genoma de cada individuo a su
historial clínico. En septiembre de 2010 se ha
anunciado el lanzamiento del Proyecto del Proteoma Humano que, de forma similar al del Genoma Humano, pretende identificar y caracterizar todas las proteínas humanas. Su consecución
es una pieza esencial en el establecimiento de
la MP para facilitar la obtención de los perfiles
proteicos (de tejidos, células y líquidos fisiológicos) que definan cada enfermedad.
De la medicina
personalizada
a la medicina 4P
La MP es una forma o modalidad de la medicina que utiliza la información de los genes,
proteínas y metabolitos de cada paciente para
prevenir, diagnosticar y tratar la enfermedad.
Emplea la información del genoma de un individuo (y los datos que se derivan, expresión de
proteínas, presencia de metabolitos) en pruebas
de diagnóstico útiles y tratamientos específicos
para cada enfermedad y para cada paciente. La
medicina genómica hace uso de la información
genómica y las tecnologías complementarias
(bioinformáticas) para determinar el riesgo y
la predisposición a la enfermedad, diagnóstico
y pronóstico y la selección y priorización de las
opciones terapéuticas. Mientras que la farmacogenética se centra en el estudio de cómo un
gen (o un pequeño número de genes) afecta al
metabolismo de un fármaco, la farmacogenómica lo hace en el estudio de cómo la variación
genética del genoma afecta al metabolismo y
respuesta frente a los fármacos. La MP utiliza los
test moleculares farmacogenéticos y farmacogenómicos para estratificar a los pacientes según
su respuesta predicha a un tratamiento particular y mejora la eficacia del tratamiento selec-
Genómica, proteómica y medicina
15
cionando los individuos que responden bien o
excluyendo a los que van a tener un efecto adverso (fig. 1). En los últimos años los genetistas
han conseguido identificar los genes responsables de enfermedades que dependen de 1 solo
gen (unos 2.000), como la enfermedad de Huntington, la fibrosis quística o la anemia falciforme. Sin embargo, otras enfermedades mucho
más comunes, como la diabetes, la enfermedad
coronaria o diversos tipos de cánceres, tienen
una base genética compleja (están implicados
muchos genes) y su estudio no puede realizarse
por las técnicas genéticas habituales. No obstante, las nuevas técnicas de secuenciación de
ADN y los microarrays de ADN han permitido
la identificación de un gran número de genes de
Patients can respond differently
to the same medicine
Anti-depressants
(SSRIS)
38%
Asthma drugs
40%
Diabetes drugs
43%
Arthritis drugs
50%
Alzheimer’s
drugs
70%
Cancer drugs
75%
Percentage of the patient population for witch particular drug
in a class is ineffective, on average
Figura 1A. Eficacia de distintos fármacos sobre
la población general.
16
susceptibilidad para estas enfermedades complejas, abriendo la posibilidad de una detección
temprana y una posible prevención en algunos
casos. Los microarrays permiten evaluar miles
de fragmentos de ADN o ARN y medir el nivel de expresión de cada gen, obteniéndose las
firmas de expresión génica o perfiles de expresión; son, por tanto, una herramienta muy poderosa para investigar el papel de uno o múltiples
genes y los polimorfismos (SNP, variaciones de
secuencias en el ADN) en los procesos patológicos de individuos o de poblaciones. Asimismo,
los estudios de asociación genómica (GenomicWide Association Study, GWAS) han permitido,
a partir de 2006, la identificación de cientos de
genes de susceptibilidad para las enfermedades
prevalentes (muy recientemente para el asma).
Con esta aproximación se comparan los genomas de un número de pacientes que tienen una
enfermedad con un grupo control que no la
tiene, para identificar las diferencias entre ambas poblaciones. Si se encuentra alguna variante
genética de algún gen que aparece con mayor
frecuencia en la población de pacientes que en
el grupo control, esas variantes se consideran
que están asociadas con la enfermedad.
En cierto sentido los médicos siempre han
practicado la MP, ajustando las dosis de los medicamentos a cada paciente, cambiando el tipo
de fármaco, etc., pero para probar en función
del resultado, lo que con frecuencia dilataba el
tiempo para aplicar el tratamiento óptimo y se
padecían los efectos adversos o la ineficacia de
los fármacos. Actualmente, la MP incorpora la
información derivada de los análisis moleculares,
con nuevos perfiles proteicos en sangre que indican un riesgo elevado de enfermedad cardiovascular o la presencia de cáncer de páncreas
o de próstata o de inflamación, que orientan
al clínico de forma decisiva en la toma de decisiones. Cada vez más, un mayor número de
enfermedades se caracteriza por su perfil molecular (genómico, proteómico), cuyo máximo
exponente es el cáncer –hasta ahora el órgano,
tejido, localización y caracterización histológica
9a edición del curso de Biotecnología Aplicada a la Salud Humana
eran los criterios decisivos–. Hoy día, además,
se caracterizan por los genes que expresa cada
tumor o por las proteínas presentes en su superficie. Los test moleculares ofrecen una gran
información sobre la situación de cada paciente,
incluyendo la susceptibilidad a una enfermedad,
su progresión y la respuesta a distintos fármacos: el fármaco adecuado, en la dosis adecuada,
para el paciente adecuado, que es la esencia de
la MP (farmacogenómica). Además, tienen en
gran medida naturaleza predictiva, lo que favorece intervenciones preventivas (tabla 1). Los
dos enfoques son complementarios, siendo los
protagonistas del primero (clásico) las células,
los tejidos y los fármacos de tipo general, supuestamente útiles para todos los pacientes de
una misma enfermedad («talla única para todos»). En el enfoque de la MP, los protagonistas
son los genes, las proteínas y los metabolitos; y
las rutas, redes e interconexiones entre ellos, de
Medicina personalizada
Beneficio y toxicidad
No beneficio y toxicidad
No beneficio y no toxicidad
Pacientes
con el mismo diagnóstico
Beneficio y no toxicidad
Tratamiento
óptimo
para cada paciente
Pacientes
con el mismo diagnóstico
Genotipado
Figura 1B. Comparación de la estrategia utilizada en la MP, utilizando test genéticos (panel inferir), frente a
la medicina clásica, que utiliza el mismo fármaco para todos los pacientes de una misma enfermedad.
Genómica, proteómica y medicina
17
Tabla 1. Selected Personalized Medicine Drugs, Treatments, and Diagnostics as of March 2009*
Therapy
Biomarker/test
Indication
Herceptin® (trastuzumab) HER-2/neu receptor Breast cancer: «…for the treatment of patients with metastatic
Tykerb® (lapatinib)
breast cancer whose tumors overexpress the HER2 protein and
who have received one or more chemotherapy regimens for their
metastatic disease»
Pharmaceutical and sur- BRCA 1,2
gical prevention options
and surveillance
Breast cancer: Guides surveillance and preventive treatment based
on susceptibility risk for breast and ovarian cancer
Tamoxifen
Aviara Breast Cancer Breast cancer: Calculates a combined risk analysis for recurrence
IndexSM (HOXB13, after tamoxifen treatment for ER-positive, node-negative breast
cancer
IL17BR)
Chemotherapy
Mammostrat®
Breast cancer: Prognostic immunohistochemistry (IHC) test used
for postmenopausal, node negative, estrogen receptor expressing
breast cancer patients who will receive hormonal therapy and are
considering adjuvant chemotherapy
Chemotherapy
MammaPrint®
Breast cancer: Assesses risk of distant metastasis in a 70 gene expression profile
Coumadin® (warfarin)
CYP2C9
Cardiovascular disease: «an increased bleeding risk for patients carrying either the CYP2C9*2 or CYP2C9*3 alleles»
Coumadin® (warfarin)
VKORC1
Cardiovascular disease: «Certain single nucleotide polymorphisms
in the VKORC1 gene (especially the -1639G > A allele) have been
associated with lower dose requirements for warfarin»
Coumadin® (warfarin)
PGx PredictTM:
Warfarin
Cardiovascular disease: Determines CYP2C9 and VKORC1 genotypes to predict likelihood of adverse events with warfarin therapy.
Coumadin® (warfarin)
Protein C deficiencies Cardiovascular disease: Hereditary or acquired deficiencies of protein C or its cofactor, protein S, has been associated with tissue
necrosis following warfarin administration
Pharmaceutical and lifes- Familion® 5-gene
tyle prevention options profile
Cardiovascular disease: Guides prevention and drug selection for
patients with inherited cardiac channelopathies such as Long
QT Syndrome (LQTS ), which can lead to cardiac rhythm abnormalities
Statins
PhyzioType SINM
Cardiovascular disease: Predicts risk of statin-induced neuro-myopathy, based on a patient’s combinatorial genotype for 50 genes
Atorvastatin
LDLR
Cardiovascular disease: «Doses should be individualized according to the recommended goal of therapy. Homozygous
Familial Hypercholestremia (10-80mg/day)and heterozygous
(10-20mg/day)»
Camptosar® (irinotecan) UGTIA1
18
Colon cancer: «Variations in the UGT1A1 gene can influence a
patient’s ability to break down irinotecan, which can lead to increased blood levels of the drug and a higher risk of side effects»
9a edición del curso de Biotecnología Aplicada a la Salud Humana
Therapy
Biomarker/test
Indication
Erbitux® (cetuximab)
Gefitinib
Vectibix® (panitumab)
EGFR expression
Colon cancer: «Patients enrolled in the clinical studies were required to have…evidence of positive EGFR expression using the
DakoCytomation EGFR pharmDx™ test kit». EGFR positive individuals are more likely to respond to the drug than those with
reduced EGFR expression.
Erbitux® (cetuximab)
Gefitinib
Vectibix® (panitumab)
KRAS
Colon cancer: Certain KRAS mutations lead to unresponsiveness
to the drug
Erbitux® (cetuximab) and Target GI™
Vectibix® (panitumab)
Fluorouracil
Camptosar® (irinotecan)
Colon cancer: Provides information of the expression of key molecular targets–KRAS, TS, and TOPO1–to guide therapy
Tagretol
(carbamazepine)
HLA-B*1502
Epilepsy and bipolar disorder: Serious dermatologic reactions are
associated with the HLAB*1502 allele in patients treated with
carbamazepine. «Prior to initiating Tegretol therapy, testing for
HLA-B*1502 should be performed in patients with ancestry in
populations in which HLAB*1502 may be present»
Immunosuppressive
drugs
AlloMap® gene
profile
Heart transplantation: Monitors patient’s immune response to
heart transplant to guide immunosuppressive therapy.
Ziagen® (abacavir)
HLA-B*5701
HIV: «Patients who carry the HLA-B*5701 allele are at high risk for experiencing a hypersensitivity reaction to abacavir. Prior to initiating therapy
with abacavir, screening for the HLA-B*5701 allele is recommended»
Selzentry®
(maraviroc)
CCR5 receptor (1)
HIV: «Selzentry, in combination with other antiretroviral agents, is
indicated for treatment experienced adult patients infected with
only CCR5-tropic HIV-1 detectable...»
Budesonide IBD
Serology 7
Inflammatory bowel disease: Identifies subset of patients who will
benefit from budesonide.
Gleevec®
(imatinib mesylate)
BCR-ABL
Leukemia: «Gleevec® (imatinib mesylate) is indicated for the
treatment of newly diagnosed adult and pediatric patients with Philadelphia chromosome positive [indicated by presence of BCRABL]
chronic myeloid leukemia (CML) in chronic phase»
Dasatinib
Philadelphia
Chromosome
Leukemia: «Dasatinib is indicated for the treatment of adults with
Philadelphia chromosomepositive acute lymphoblastic leukemia
(Ph+ AL) with resistance or intolerance to prior therapy»
Busulfan
Philadelphia
Chromosome
Leukemia: «Busulfan is clearly less effective in patients with chronic myelogenous leukemia who lack the Philadelphia (Ph1) chromosome»
Purinethol®
(mercaptopurine)
Thiaguanine
Azathioprine
TPMT
Leukemia: Guides adjustment of dose in treatment of acute lymphoblastic leukemia: «Patients with inherited little or no thiopurine
S-methyltransferase (TPMT) activity are at increased risk for severe
Purinethol toxicity from conventional doses…»
Genómica, proteómica y medicina
19
Therapy
Biomarker/test
Indication
Tarceva® (erlotinib)
EGFR expression
Lung cancer: The test determines patients most likely to respond.
Capecitabine
DPD
Multiple cancers: «Rarely, unexpected severe toxicity (e.g., stomatitis, diarrhea, neutropenia and neurotoxicity) associated with
5-fluorouracil has been attributed to a deficiency of dihydropyrimidine dehydrogenase (DPD) activity»
Pharmaceutical and sur- MLH1, MSH2, MSH6 Multiple cancers: Guides surveillance and preventive treatment based on susceptibility risk for colon and other cancers.
gical treatment options
and surveillance
Chemotherapy
CupPrintTM
Chemotherapy
Aviara Cancer TYPE Multiple cancers: Classifies 39 tumor types from tumors of unkID®
nown primary origin, using a gene expression profile.
Elitek® (rasburicase)
G6PD deficiency
Drugs metabolized by
CYP P450
Amplichip®
Multiple diseases: FDA classification 21 CFR 862.3360: «This device
CYP2D6/CYP2C19 is used as an aid in determining treatment choice and individualizing
treatment dose for therapeutics that are metabolized primarily by
the specific enzyme about which the system provides genotypic
information»
2C19: Celecoxib, Codeine, Diazepam, Esomeprazole, Nelfinavir,
Omeprazole, Pantoprazole, Rabeprazole, Voriconazole
2D6: Acetaminophen, Aripiprazole, Atomoxetine, Carvedilol, Cevimeline hydrochloride, Clozapine, Fluoxetine HCl, Fluoxetine
HCL and Olanzapine, Metoprolol, Propranolol, Propafenone,
Protriptyline HCl, Risperidone,
Tamoxifen, Terbinafine, Thioridazine,Timolol maleate,Tiotropium
bromide inhalation, Tolterodine,
Tramadol, Venlafaxine
Multiple cancers: Determines cancer classification for tumors of
unknown primary origin.
Multiple cancers: «Rasburicase administered to patients with glucosephosphate dehydrogenase (G6PD) deficiency can cause severe hemolysis. … It is recommended that patients at higher risk for G6PD
deficiency … be screened prior to starting ELITEK therapy»
Rifampin
Isoniazid
Pyrazinamide
NAT
Multiple diseases: N-acetyltransferase slow and fast acetylators and
toxicity- «slow acetylation may lead to higher blood levels of the
drug, and thus, an increase in toxic reactions»
Rituximab
PGx PredictTM:
Rituximab
Non-Hodgkin’s lymphoma: Detects CD-20 variant (polymorphism
in the IgG Fc receptor gene FcgRIIIa) to predict response to cancer
drug rituximab.
Celebrex® (celecoxib)
CYP2C9
Pain: «Patients who are known or suspected to be P450 2C9 poor
metabolizers based on a previous history should be administered
celecoxib with caution as they may have abnormally high plasma
levels due to reduced metabolic clearance»
Risperdal® (resperidone)
Zyprexa® (olanzapine)
PhyzioType PIMS
Psychiatric disorders: Predicts risk of psychotropic-induced metabolic
syndrome, based on a patient’s combinatorial genotype for 50 genes.
20
9a edición del curso de Biotecnología Aplicada a la Salud Humana
Therapy
Gleevec®
(imatinib mesylate)
Biomarker/test
c-KIT
Indication
Stomach cancer: «Gleevec® is also indicated for the treatment of
patients with Kit (CD117) positive unresectable and/or metastatic
malignant gastrointestinal stromal tumors (GIST)»
*This list is not intended to be comprehensive but reflects commonly used or available products as of March 2009. Some products, for which the
FDA recommends or requires pharmacogenomic testing or which have pharmacogenomic information in their label, are listed at the FDA’s Web
site (http://www.fda.gov/cder/genomics/genomic_biomarkers_table.htm). Other listed products that are novel, and/or that address large populations, have been identified via websites and public announcements.
Indications in quotes are taken from the therapeutic product label.
BCR-ABL = breakpoint cluster region – Abelson
BRCA 1,2 = breast cancer susceptibility gene 1 or 2 c-KIT = tyrosine kinase receptor CYP = cytochrome P450 enzyme DPD = dihydropyrimidine dehydrogenase TOPO1 = topoisomerase 1
G6PD = glucose 6 phosphate dehydrogenase
TPMT = thiopurine S-methyltransferase
HER2 = human epidermal growth factor receptor 2 TS = thymidylate synthase
NAT = N-acetyltransferase UGT1A1 = UDP-glucuronosyltransferase 1A1
Therapeutic product label contains pharmacogenomic information as:
forma que los fármacos (a veces en forma de
cóctel) interfieren con las redes o con los nudos
(intersecciones) que bloquean toda la red. Algunos test para el cáncer de mama, que evalúan
70 genes, orientan no sólo sobre el fármaco a
administrar sino que predicen la probabilidad
de desarrollar metástasis e incluso el grado de
malignidad. La MP, por tanto, se basa en análisis
moleculares, con frecuencia altamente complejos (perfiles genómicos de miles de genes, perfiles proteómicos de cientos de proteínas) y que
requiere un amplio apoyo de todo el sistema
de salud de los países que quieran implantarlo: nuevas regulaciones, revisión profunda de la
educación en biomedicina, sistemas integrados
de información sobre la salud, nueva legislación
que proteja frente a la discriminación (por razones genéticas), cobertura de los test por los
seguros públicos y privados, etc.
A pesar de los numerosos obstáculos, lentamente, pero con paso firme, la MP se va incorporando a los sistemas de salud de los países
desarrollados. La tecnología y las nuevas estrategias científicas han sido siempre los motores
de las revoluciones científicas y todo indica que
lo mismo va a ocurrir con la medicina. Países
como Estados Unidos o el Reino Unido han
aprobado recientemente en sus parlamentos
las directrices para el establecimiento de la MP
Information only
Recommended
Required
como el camino óptimo para la salud de la población y, a la vez, el de menor costo a largo
plazo. El paradigma de la MP, y que plantea unos
objetivos más ambiciosos, es la denominada medicina 4P: preventiva, predictiva, personalizada y
participativa. Sus promotores (cuyo máximo representante es L. Hood, presidente del Institute
for Systems Biology, Seattle, Estados Unidos)
consideran que la aplicación de la biología de
sistemas (que hace uso de los datos y técnicas
genómicas, proteómicas y metabolómicas) (fig.
2), la emergencia de nuevas tecnologías (nanochips, microfluídica, técnicas de visualización), y
las nuevas herramientas computacionales, van a
modificar significativamente la medicina y el tratamiento de la enfermedad. El carácter predictivo proviene de la estimación de la probabilidad
de padecer o no una cierta enfermedad en
función del genoma individual. Es personalizada
porque las variaciones genéticas únicas de cada
individuo orientan y/o dirigen los tratamientos:
cada paciente se convierte en su propio control; a partir del genoma individual se poseen
billones de datos de cada individuo y cientos
de millones de individuos con esa cantidad de
información. Es preventiva porque pueden diseñarse fármacos terapéuticos/preventivos a
partir de la información generada mediante la
biología de sistemas. Y, finalmente, es participa-
Genómica, proteómica y medicina
21
• Parallel analyses of proteins, metabolites and mRNA from complex samples
• Determination of molecular function and elucidation of disease mechanisms
• Informatics tools to link gene response, protein activity and metabolite dynamics
• BioSystematics™ to translate covariant sets of genes, proteins, metabolites into biochemical
interaction and target information
Metabolites
protein index
Proteins
ge
ne
ind
ex
Clinical data
BioSystematicsTM
metabolite index
Genes
Target and
System information
Figura 2. Representación esquemática de los elementos que constituyen la biología de sistemas y su
aplicación en medicina.
tiva porque los pacientes entienden y participan en las opciones que toman los médicos, los
cuales deben actuar como integradores de la
información total.
Utilizando los análisis moleculares de la biología de sistemas para el tratamiento de la enfermedad o su predisposición, la medicina 4P
promete introducir nuevos estándares en la
salud humana. El resultado es que en los próximos 5-20 años la medicina puede cambiar de
ser prioritariamente reactiva (responde cuando
aparecen los síntomas de la enfermedad) a ser
proactiva, caracterizada por las 4P. Si se adoptan los test moleculares en la práctica clínica
se puede realmente transformar la salud de la
población. Gracias a la secuenciación ultrarrápida se puede obtener el perfil genómico de un
individuo (o de un tumor) en cuestión de días
e incluso horas, lo cual introduce unos niveles
de complejidad difícilmente controlables en la
actualidad. Sin embargo, el número de causas
o modificaciones (mutaciones) que hacen que
una célula sana se convierta en tumoral no pa22
rece ser muy elevado y son comunes a muchos
tumores, lo que facilita el diagnóstico y sobre
todo el tratamiento. Ya no es arriesgado decir
que en un futuro inmediato la determinación
del genoma completo de cada individuo es algo
no sólo factible, sino de un precio asequible
(unos 1.000 dólares, 800 euros): el primer genoma costó 3 billones de dólares, el segundo 100
millones y el tercero, el de James Watson, 1,5
millones (fig. 3). En el futuro cada recién nacido
tendrá determinado su genoma completo antes
de abandonar el hospital, lo que ya es un objetivo en Estados Unidos, donde el número de
nacimientos anuales ronda los 4 millones. Los
genomas individuales serán un estándar dentro
de las historias clínicas en los próximos años.
Sin embargo, algunas de las tecnologías de
hoy día necesitan ser mejoradas de forma importante si se quieren conseguir los objetivos
de la medicina 4P. Por ejemplo, los métodos nanotecnológicos para la medición de proteínas
–como medir 2.500 proteínas a partir de una
gota de sangre– no son posibles actualmente.
9a edición del curso de Biotecnología Aplicada a la Salud Humana
$3B
20
$ Millons
3,0
2,5
$ Billons
2,0
$20M
15
10
5
$2M
0
2006
1,5
2006
$5K
2006
2006
$1K
2006
1,0
0,5
0
1990
1992
1994
1996
1998
2000
2002
2004
2006
2008
Figura 3. Descenso progresivo en el costo (en $) estimado para la determinación del genoma completo
de un individuo.
Existen pequeños dispositivos que son capaces
de cuantificar 40-60 proteínas en líquidos fisiológicos (se han testado en saliva) que pueden
ser prototipos de desarrollos posteriores (fig.
4). La propuesta de que deben desarrollarse
test que evalúen 50-100 proteínas específicas
de los distintos órganos, como forma de preguntarnos acerca del estado de salud en vez
del estado de la enfermedad, está sin embargo mucho más cerca. Las técnicas proteómicas
más recientes, como el método MRM, ya son
capaces de cuantificar 50-100 proteínas/ensayo
en un breve tiempo y con gran sensibilidad y
exactitud. Igualmente, la capacidad de obtener
análisis detallados a partir de una única célula
o un pequeño grupo de ellas (actualmente se
está haciendo con 1.000 células) podrá ser real
en un futuro próximo. El desarrollo de herramientas computacionales y matemáticas con
capacidad de gestionar la dimensionalidad de
los datos es una tecnología con un alto poder
transformador. En los próximos 10 años vamos
a disponer de millones de datos procedentes
del genoma y proteomas de cada paciente.
¿Cómo reducir esa enorme cantidad de datos
a hipótesis simples de salud y enfermedad? El
modo de correlacionar los datos genómicos y
proteómicos con el fenotipo normal y asociado
a cada enfermedad es un gran reto. Dónde y
cómo se van a manejar informáticamente todos
esos datos es actualmente un desafío y un tema
para la reflexión. Hood considera que esta implementación abocará en una digitalización de la
medicina, de forma similar a lo que ha ocurrido
recientemente en el paso de la información analógica a la digital. Es posible que la medicina se
convierta así en una ciencia de la información.
Proteómica y medicina:
el proyecto proteoma
humano
En septiembre de 2010, dos centros independientes (The Institute for Systems Biology, en
Seattle, Washington y el Swiss Federal Institute
of Technology, ETH, en Zúrich) han anunciado
oficialmente que han completado la primera
fase para la generación de un mapa completo del proteoma humano, utilizando la espectrometría de masas (MS) para la identificación
Genómica, proteómica y medicina
23
A
Determinación de perfiles proteicos
órgano-específicos (cerebro, hígado) en el plasma
Distinción salud/enfermedad
B
Eliminar células
300 nl de plasma
Cuantificación
de proteínas
Nanochips (microfluídica) para el análisis del plasma sanguíneo (proteínas)
Figura 4. A) La presencia de proteínas órgano-específicas en el plasma permite la obtención de perfiles
proteicos asociados a la enfermedad. B) Representación esquemática de un nanochip para el análisis
de proteínas plasmáticas.
de las proteínas –estos datos están libremente accesibles a toda la comunidad científica en
(www.srmatlas.org; www.peptideatlas.org–. Los
investigadores han generado espectros de masas (análisis que permite identificar cada proteína) de referencia para cada una de las proteínas
correspondientes a los 20.300 genes humanos
presentes en el genoma. Este mapa de referencia permitirá a los investigadores de todo el
mundo detectar y cuantificar cualquier proteína
humana de cualquier muestra biológica (tejidos,
células, líquidos fisiológicos). Se utilizan para ello
técnicas específicas de MS, fundamentalmente
SRM (Selected Reaction Monitoring), que permiten detectar y cuantificar cada proteína indi24
vidual a partir de alguno de sus péptidos. Moritz, Hood y Aebersold han generado más de
150.000 SRM que incluyen al menos 5 péptidos
proteotípicos (específicos de cada proteína)
para la identificación de las proteínas. Además,
han dsarrollado ensayos de SRM específicos
para todas las proteínas de membrana y todas
las glucoproteínas con sitios de N-glucosilación.
Este ingente trabajo supone un avance comparable al primer borrador del genoma humano,
de forma que ahora las bases de datos con las
proteínas son de libre acceso; el costo estimado
ha sido de 5 millones de euros. El mapeo del
genoma humano requirió 10 años y un costo
de casi 3 billones de dólares; fue el origen de lo
9a edición del curso de Biotecnología Aplicada a la Salud Humana
que ahora comienza como Proyecto del Proteoma Humano (HPP), que se estima pueda estar completado en el año 2020. Con los datos,
ahora públicos, se da un paso de gigante para
reforzar el desarrollo de la MP porque facilita
hacer el tipo de análisis de alto rendimiento (miles de proteínas de un individuo) que se requiere en la MP o 4P. Pero el objetivo final del HPP
no es tener un mero listado de proteínas, sino
todas las posibles variantes de cada proteína
(isoformas), su función, abundancia, localización
subcelular y sus interacciones (redes y rutas de
señalización). Casi un tercio de los 21.000 genes del genoma humano no tiene una proteína
conocida asociada y de los otros dos tercios no
hay una información detallada. El HPP se propone obtener esta información detallada y tener
al menos una proteína correspondiente a cada
gen humano. Es un objetivo complicado, porque el proteoma es dinámico, está cambiando
constantemente y las proteínas son modificadas
de múltiples formas (fosforilación, glucosilación,
acetilación, etc.) y en distintos tiempos. Además,
se pretende tener una colección de anticuerpos
específicos para cada una de las proteínas.
De cara al futuro inmediato, uno de los mayores desafíos es almacenar, manejar y controlar
todos los datos que genera el HPP, especialmente de forma integrada entre sí y con los
datos genómicos. Es fundamental que presente
utilidad práctica y, en especial, que proporcione información útil para la medicina que pueda
trasladarse rápidamente a la práctica clínica. No
debe olvidarse que en último término son las
proteínas (y no sólo los genes) las moléculas
clave para el entendimiento de las enfermedades (y de la salud). Las proteínas son los contribuyentes fundamentales del fenotipo, y las
enfermedades se refieren fundamentalmente al
fenotipo y no al genotipo. Cualquier mejora e
implementación en la medicina y en la MP depende de un mayor conocimiento de las proteínas y del proteoma humano que ahora empieza
a desvelarse. Es importante recordar, además,
que más del 90% de las dianas terapéuticas son
proteínas, sobre las que actúan los fármacos.
Proteómica clínica
La proteómica ofrece una información altamente complementaria de la genómica;
como la mayoría de las funciones biológicas
las realizan las proteínas, la proteómica ofrece
una nueva visión de la enfermedad. A pesar
de su complejidad, el rápido y notable desarrollo en los últimos años ha conducido a su
aplicación a los procesos patológicos o proteómica clínica, la cual se ocupa de la identificación sistemática y exhaustiva, a gran escala,
de patrones proteicos de enfermedad y de la
aplicación de esos datos a los pacientes (estudio de la enfermedad, susceptibilidad, prevención, selección de terapias, seguimiento de los
tratamientos, etc.). Entender, por ejemplo, las
alteraciones tempranas en diversas enfermedades (típicamente en cáncer o en el síndrome coronario agudo), produciría una notable
mejora en la prevención e identificación de
pacientes con riesgo y/o en estado preclínico.
La proteómica clínica pretende definir patrones de proteínas que puedan generar información de valor clínico acerca de la susceptibilidad, diagnóstico, pronóstico y terapia de
la enfermedad; para que impacte de manera
real en la mejora de la salud debe identificar
y seleccionar patrones proteicos, validarlos en
estudios poblacionales muy amplios y trasladarlo a la práctica clínica. Entre sus objetivos,
se encuentran los que siguen.
Identificación de biomarcadores individuales
La búsqueda e identificación de biomarcadores individuales se lleva a cabo siguiendo
la metodología proteómica clásica de separación de proteínas (2-DE, DIGE, cromatografía
multidimensional y electroforesis capilar) y
su identificación por espectrometría de masas (MS, MALDI-TOF, ESI-Q-TOF o ESI-Trap,
MALDI-TOF/TOF). Su estrategia fundamental
es el análisis de la expresión diferencial de
proteínas entre controles y muestras patoGenómica, proteómica y medicina
25
lógicas (fig. 5), de proteomas completos (lisados celulares) o subproteomas específicos
(mitocondrias, membranas, etc.). Un aspecto
fundamental es la determinación de las modificaciones postraduccionales y su potencial
implicación en patología. En muchos casos los
biomarcadores se convierten simultáneamente en nuevas dianas terapéuticas.
Obtención de perfiles proteicos
Consiste en el estudio sistemático, a gran escala, de las proteínas de una muestra para la identificación de patrones o perfiles proteicos (huellas
dactilares proteicas), con carácter diagnóstico
(discriminatorio) y/o pronóstico. Los escasos
biomarcadores identificados y aprobados por la
FDA en los últimos años son un reflejo de la es-
trategia habitual de testar una proteína individual,
o llevar a cabo análisis en pequeña escala, etc.
Aunque existen excepciones (paraproteínas de
los mielomas, déficit de α-1-antitripsina) es muy
posible que no existan marcadores únicos de las
enfermedades complejas, por lo que la estrategia
proteómica de estudiar paneles proteicos, supone un paso cualitativo de gran trascendencia. Este
estudio se puede realizar mediante, al menos, las
tres estrategias que siguen.
Perfiles proteicos de plasma o suero
Se analiza el suero/plasma de los pacientes
con la patología objeto de estudio (cardiovascular, neurodegenerativa, infecciosas, cáncer, etc.)
y alternativamente en otros líquidos fisiológicos
(lavado broncoalveolar, líquido cefalorraquídeo,
orina). Se utiliza la técnica denominada SELDI-
Normal
RCC
Normal
RCC
Figura 5. Ejemplo de análisis proteómico de expresión diferencial mediante electroforesis bidimensional.
La comparación entre las proteínas (manchas en la figura) del tejido sano (Normal) y patológico (RCC),
permite detectar alteraciones en los niveles de expresión de varias proteínas (flechas en los paneles
de la derecha)
26
9a edición del curso de Biotecnología Aplicada a la Salud Humana
Perfiles proteicos de tejidos: MS-Imaging
En tejidos, pueden obtenerse perfiles o imágenes (mapas) bidimensionales de proteínas (MSImaging) aplicando directamente la MS sobre
cortes histológicos del tejido (cortes habituales
sobre portaobjetos para microscopia óptica, de
5-20 μm de grosor), utilizando el MALDI-TOF
o el MALDI-TOF/TOF. El mapa bidimensional se
consigue haciendo incidir el láser (que «barre»
la superficie de la muestra) del espectrómetro sobre los cortes histológicos y analizando
las proteínas que son vaporizadas. Típicamente
aparecen 500-1.000 señales de proteínas individuales en cada punto del tejido, con masas entre 2-70 kDa. De esta forma se obtiene la masa
(m/z) de las moléculas (péptidos, proteínas)
presentes en cada zona del tejido. Seleccionando una masa dada (m/z) en los distintos espectros de las diferentes zonas, se genera un mapa
3325.4
Relative intensity
TOF (Surface Enhanced Laser Desorption/
Ionization-Time of Flight) para la generación de
los perfiles proteicos, que combina la retención
de las proteínas del suero en biochips con la determinación de sus masas moleculares mediante
MS, permitiendo generar gráficos donde se representa la abundancia frente a la masa molecular de las proteínas, a modo de código de barras
proteicos constituidos por miles de líneas que
caracterizan el suero de cada individuo (fig. 6). Su
poder discriminatorio es muy superior al de marcadores únicos con los que se han comparado (p.
ej., PSA en cáncer de próstata, proteína C reactiva en infección e inflamación). Como el análisis
mediante SELDI-TOF utiliza muy poca muestra
(1 μl) y, además, es muy rápido (se pueden analizar cientos de muestras al día) y automatizado, su
potencial en clínica analítica es enorme y puede ir
sustituyendo muchas de las técnicas habituales de
los laboratorios de bioquímica clínica (enzimoinmunoanálisis), que son más lentos, más caros
(utilizan anticuerpos marcados con sondas fluorescentes), precisan mayor cantidad de muestra y
sólo informan de un único marcador, frente a los
miles que proporciona el SELDI-TOF.
3325.1
3,000
6593.8
4303.1
5392.1
6593.8
4303.1
5392.1
4,000
5,000
6,000
7,000
Figura 6. Representación de perfiles proteicos
obtenidos por SELDI-TOF.
bidimensional de la distribución de esa proteína
(esa m/z) a lo largo del corte de tejido (a modo
de cartografía proteica). Se pueden conseguir
dos tipos de datos: perfiles proteicos (mediante
una adquisición puntual) e imágenes (barriendo
todo el tejido con el láser) (fig. 7).
Las imágenes son generadas mediante un
software específico que clasifica y agrupa las
proteínas y compara diversas muestras, permitiendo obtener imágenes tridimensionales de
la distribución de las proteínas del tejido. Esta
tecnología implica un tipo de información totalmente nuevo para la descripción, clasificación
y caracterización de muestras histológicas que
está permitiendo la identificación de biomarcadores, la localización de proteínas específicas y,
en el campo de la oncología, la reclasificación de
tumores, por ejemplo.
Una técnica muy similar (SIMS-TOF, Secondary Ion Mass Spectrometry) permite el análisis
(identificación y caracterización) de moléculas
de bajo peso molecular presentes en la superficie de una muestra (determinación del metaboloma) hasta los 1.500 Da. Esta limitación en
el reducido rango de masas analizado es compensada en parte por la alta resolución obtenida (subcelular; hasta 200 nm/pixel) y por no
necesitar la utilización de ningún tipo de matriz
(evitando interferencia y deslocalización de las
muestras: se usa el tejido directamente), lo que
Genómica, proteómica y medicina
27
Tissue slide
Matrix application
Las
er
Laser ablation
Tandem MS
MS
MS/MS spectrum
Mass spectra for each xy coordinate
Single m/z values
Biocomputational analysis
Peptide fragments
Database search
0%
Protein identification
100%
Protein images
Class A
Class B
Classification images
Figura 7. Flujo de trabajo en el análisis de tejidos mediante MS-Imaging.
la convierte en una herramienta muy valiosa en
patología. Además, como ésta técnica se aplica
para localizar y mapear en el tejido moléculas
pequeñas, particularmente fármacos (y su colocalización con proteínas), es de gran interés
para la industria farmacéutica.
Chips (arrays) de proteínas
La obtención de perfiles proteicos, tanto de
suero (u otros líquidos fisiológicos) como de células o tejidos, también puede obtenerse a partir
de la utilización de chips (o micromatrices) de
proteínas. Éstos pueden clasificarse según mu28
chos parámetros (modo de fabricación, química de la superficie, especificidad, densidad, etc.),
aunque es mejor sistematizarlos en dos grandes
grupos, según lo que capturan o analizan.
Chips analíticos
Se utilizan para determinar las proteínas presentes en una muestra (perfil de expresión) y
su cuantificación. La disolución de la mezcla de
proteínas a analizar se aplica sobre el chip, que
contiene agentes de captura que actúan como
sondas. Los agentes de captura más conocidos
son los anticuerpos (Ab) en sus distintas moda-
9a edición del curso de Biotecnología Aplicada a la Salud Humana
lidades: monoclonales completos, Fab, scFv, afibodies (Ab sintéticos), dominios de Ab, etc. La
utilización de Ab no está exenta de problemas:
inespecificidad, reacciones cruzadas, orientación,
afinidad, etc. Otra alternativa son los chips de
antígeno para analizar el perfil sérico de Ab (y
autoAb en enfermedades autoinmunes), como
los chips de alérgenos para la detección de IgEs
en respuestas alérgicas.
Recientemente se está generando una plétora
de agentes de captura distintos a los Ab, como
péptidos, moléculas orgánicas, polímeros sintéticos, oligonucleótidos, aptámeros, ribozimas,
trinectinas (derivados de la fibronectina), MIP
(molecular imprinted polymers: compuestos que
se polimerizan sobre las proteínas creando moldes para su uso posterior), etc. A pesar de ésta
diversidad, la captura de las proteínas (y los métodos de detección) constituye el gran problema
de los chips proteicos: no existen todavía agentes
de captura de alta calidad que puedan inmovilizarse en la superficie de un chip y que permitan
unir, detectar y cuantificar una mezcla compleja
de proteínas. Este problema está retrasando no
sólo el desarrollo de los chips proteicos sino de
la industria proteómica en general.
Los chips de fase reversa son de especial relevancia en medicina porque permiten determinar las proteínas implicadas en las rutas de señalización celular en las biopsias de los pacientes.
En ellos, las biopsias (típicamente de tumores
o cardiacas) se lisan y se depositan en diluciones sucesivas como microgotas (utilizando los
mismos robots que para la fabricación de los
chips de ADN); posteriormente, son revelados
con Ab validados (que reconocen proteínas fosforiladas y cinasas, a fin de determinar el grado
de activación de las diferentes rutas de señalización), obteniéndose información cualitativa y
cuantitativa para cada paciente, lo que permite
un tratamiento personalizado; actualmente existen más de 1.000 Ab validados. Mediante estos
arrays puede determinarse simultáneamente el
estado de fosforilación de las proteínas impli-
cadas en las principales rutas de señalización
intracelular. La utilización de los arrays de fase
reversa permite así, obtener un tipo de información molecular único e individualizado de
cada muestra y, por tanto, de cada paciente.
Este nuevo tipo de array proporciona perfiles
de señalización intracelular, incluyendo las modificaciones postraduccionales, datos que no son
accesibles mediante técnicas genómicas.
Chips funcionales
Se utilizan para determinar actividades bioquímicas e interacciones moleculares. Las proteínas de interés se inmovilizan en el chip y se
analizan sus funciones biológicas e interacciones
incubándolas con distintas moléculas (otras
proteínas, metabolitos, sustratos de enzimas,
ADN, etc.). Los dos problemas principales de
estos chips son la producción de colecciones
extensas de proteínas y su mantenimiento en
forma activa en el chip. Sin embargo, para grupos de proteínas con características funcionales
similares (factores de trascripción, receptores,
cinasas) hay un gran campo por desarrollar en
clínica humana.
Referencias
Auffray C, Chen Z, Hood L. Systems medicine: the future of medical genomic healthcare. Genome Med.
2009;1:2.
Personalized Medicine Coalition. The case for personalized medicine, 2009. USA. (www.personalizedmedicinecoalition.org).
Genomic Medicine, vol 1. Report of Science and Technology Committee. House of Lords, 2009. London
(http://www.parliament.uk/hlscience/).
Hamburg MA, Collins FS. The path to personalized medicine. N Engl J Med. 2010;363(4):301-4.
Evans JP, Dale DC, Fomous C. Preparing for a consumerdriven genomic age. N Engl J Med. 2010;363:1099103.
Lotta LA. Genome-wide association studies in atherotrombosis. Eur J Int Med. 2010;21:74-8.
Focus on cancer proteomics. Nat Rev Cancer. 2010,
septiembre;10:605-60.
Van Eyk J, Dunn M, editores. Clinical proteomics. From
diagnosis to therapy. Wiley-VCH; 2008.
Genómica, proteómica y medicina
29

Documentos relacionados