Genómica, proteómica y medicina
Transcripción
Genómica, proteómica y medicina
2 Genómica, proteómica y medicina Fernando Vivanco Fundación Jiménez Díaz Universidad Complutense. Madrid Resumen La secuenciación del genoma humano, junto con el desarrollo y la implementación de las nuevas tecnologías «ómicas» de alto rendimiento (genómica, proteómica, metabolómica), están incrementando de manera esencial el conocimiento de la enfermedad humana y estableciendo unas bases sólidas para el desarrollo de la medicina personalizada (MP). El paradigma de la MP, y que plantea unos objetivos más ambiciosos, es la denominada «medicina 4P»: preventiva, predictiva, personalizada y participativa. Aplicando la biología de sistemas (que utiliza los datos y las técnicas genómicas, proteómicas y metabolómicas), la emergencia de nuevas tecnologías (nanochips, microfluídica, técnicas de visualización) y las nuevas herramientas computacionales, pretenden establecer nuevos estándares en salud humana. Uno de sus objetivos es incorporar el genoma de cada individuo a su historial clínico. En septiembre de 2010 se ha anunciado el lanzamiento del Proyecto del Proteoma Humano que, de forma similar al del Genoma Humano, pretende identificar y caracterizar todas las proteínas humanas. Su consecución es una pieza esencial en el establecimiento de la MP para facilitar la obtención de los perfiles proteicos (de tejidos, células y líquidos fisiológicos) que definan cada enfermedad. De la medicina personalizada a la medicina 4P La MP es una forma o modalidad de la medicina que utiliza la información de los genes, proteínas y metabolitos de cada paciente para prevenir, diagnosticar y tratar la enfermedad. Emplea la información del genoma de un individuo (y los datos que se derivan, expresión de proteínas, presencia de metabolitos) en pruebas de diagnóstico útiles y tratamientos específicos para cada enfermedad y para cada paciente. La medicina genómica hace uso de la información genómica y las tecnologías complementarias (bioinformáticas) para determinar el riesgo y la predisposición a la enfermedad, diagnóstico y pronóstico y la selección y priorización de las opciones terapéuticas. Mientras que la farmacogenética se centra en el estudio de cómo un gen (o un pequeño número de genes) afecta al metabolismo de un fármaco, la farmacogenómica lo hace en el estudio de cómo la variación genética del genoma afecta al metabolismo y respuesta frente a los fármacos. La MP utiliza los test moleculares farmacogenéticos y farmacogenómicos para estratificar a los pacientes según su respuesta predicha a un tratamiento particular y mejora la eficacia del tratamiento selec- Genómica, proteómica y medicina 15 cionando los individuos que responden bien o excluyendo a los que van a tener un efecto adverso (fig. 1). En los últimos años los genetistas han conseguido identificar los genes responsables de enfermedades que dependen de 1 solo gen (unos 2.000), como la enfermedad de Huntington, la fibrosis quística o la anemia falciforme. Sin embargo, otras enfermedades mucho más comunes, como la diabetes, la enfermedad coronaria o diversos tipos de cánceres, tienen una base genética compleja (están implicados muchos genes) y su estudio no puede realizarse por las técnicas genéticas habituales. No obstante, las nuevas técnicas de secuenciación de ADN y los microarrays de ADN han permitido la identificación de un gran número de genes de Patients can respond differently to the same medicine Anti-depressants (SSRIS) 38% Asthma drugs 40% Diabetes drugs 43% Arthritis drugs 50% Alzheimer’s drugs 70% Cancer drugs 75% Percentage of the patient population for witch particular drug in a class is ineffective, on average Figura 1A. Eficacia de distintos fármacos sobre la población general. 16 susceptibilidad para estas enfermedades complejas, abriendo la posibilidad de una detección temprana y una posible prevención en algunos casos. Los microarrays permiten evaluar miles de fragmentos de ADN o ARN y medir el nivel de expresión de cada gen, obteniéndose las firmas de expresión génica o perfiles de expresión; son, por tanto, una herramienta muy poderosa para investigar el papel de uno o múltiples genes y los polimorfismos (SNP, variaciones de secuencias en el ADN) en los procesos patológicos de individuos o de poblaciones. Asimismo, los estudios de asociación genómica (GenomicWide Association Study, GWAS) han permitido, a partir de 2006, la identificación de cientos de genes de susceptibilidad para las enfermedades prevalentes (muy recientemente para el asma). Con esta aproximación se comparan los genomas de un número de pacientes que tienen una enfermedad con un grupo control que no la tiene, para identificar las diferencias entre ambas poblaciones. Si se encuentra alguna variante genética de algún gen que aparece con mayor frecuencia en la población de pacientes que en el grupo control, esas variantes se consideran que están asociadas con la enfermedad. En cierto sentido los médicos siempre han practicado la MP, ajustando las dosis de los medicamentos a cada paciente, cambiando el tipo de fármaco, etc., pero para probar en función del resultado, lo que con frecuencia dilataba el tiempo para aplicar el tratamiento óptimo y se padecían los efectos adversos o la ineficacia de los fármacos. Actualmente, la MP incorpora la información derivada de los análisis moleculares, con nuevos perfiles proteicos en sangre que indican un riesgo elevado de enfermedad cardiovascular o la presencia de cáncer de páncreas o de próstata o de inflamación, que orientan al clínico de forma decisiva en la toma de decisiones. Cada vez más, un mayor número de enfermedades se caracteriza por su perfil molecular (genómico, proteómico), cuyo máximo exponente es el cáncer –hasta ahora el órgano, tejido, localización y caracterización histológica 9a edición del curso de Biotecnología Aplicada a la Salud Humana eran los criterios decisivos–. Hoy día, además, se caracterizan por los genes que expresa cada tumor o por las proteínas presentes en su superficie. Los test moleculares ofrecen una gran información sobre la situación de cada paciente, incluyendo la susceptibilidad a una enfermedad, su progresión y la respuesta a distintos fármacos: el fármaco adecuado, en la dosis adecuada, para el paciente adecuado, que es la esencia de la MP (farmacogenómica). Además, tienen en gran medida naturaleza predictiva, lo que favorece intervenciones preventivas (tabla 1). Los dos enfoques son complementarios, siendo los protagonistas del primero (clásico) las células, los tejidos y los fármacos de tipo general, supuestamente útiles para todos los pacientes de una misma enfermedad («talla única para todos»). En el enfoque de la MP, los protagonistas son los genes, las proteínas y los metabolitos; y las rutas, redes e interconexiones entre ellos, de Medicina personalizada Beneficio y toxicidad No beneficio y toxicidad No beneficio y no toxicidad Pacientes con el mismo diagnóstico Beneficio y no toxicidad Tratamiento óptimo para cada paciente Pacientes con el mismo diagnóstico Genotipado Figura 1B. Comparación de la estrategia utilizada en la MP, utilizando test genéticos (panel inferir), frente a la medicina clásica, que utiliza el mismo fármaco para todos los pacientes de una misma enfermedad. Genómica, proteómica y medicina 17 Tabla 1. Selected Personalized Medicine Drugs, Treatments, and Diagnostics as of March 2009* Therapy Biomarker/test Indication Herceptin® (trastuzumab) HER-2/neu receptor Breast cancer: «…for the treatment of patients with metastatic Tykerb® (lapatinib) breast cancer whose tumors overexpress the HER2 protein and who have received one or more chemotherapy regimens for their metastatic disease» Pharmaceutical and sur- BRCA 1,2 gical prevention options and surveillance Breast cancer: Guides surveillance and preventive treatment based on susceptibility risk for breast and ovarian cancer Tamoxifen Aviara Breast Cancer Breast cancer: Calculates a combined risk analysis for recurrence IndexSM (HOXB13, after tamoxifen treatment for ER-positive, node-negative breast cancer IL17BR) Chemotherapy Mammostrat® Breast cancer: Prognostic immunohistochemistry (IHC) test used for postmenopausal, node negative, estrogen receptor expressing breast cancer patients who will receive hormonal therapy and are considering adjuvant chemotherapy Chemotherapy MammaPrint® Breast cancer: Assesses risk of distant metastasis in a 70 gene expression profile Coumadin® (warfarin) CYP2C9 Cardiovascular disease: «an increased bleeding risk for patients carrying either the CYP2C9*2 or CYP2C9*3 alleles» Coumadin® (warfarin) VKORC1 Cardiovascular disease: «Certain single nucleotide polymorphisms in the VKORC1 gene (especially the -1639G > A allele) have been associated with lower dose requirements for warfarin» Coumadin® (warfarin) PGx PredictTM: Warfarin Cardiovascular disease: Determines CYP2C9 and VKORC1 genotypes to predict likelihood of adverse events with warfarin therapy. Coumadin® (warfarin) Protein C deficiencies Cardiovascular disease: Hereditary or acquired deficiencies of protein C or its cofactor, protein S, has been associated with tissue necrosis following warfarin administration Pharmaceutical and lifes- Familion® 5-gene tyle prevention options profile Cardiovascular disease: Guides prevention and drug selection for patients with inherited cardiac channelopathies such as Long QT Syndrome (LQTS ), which can lead to cardiac rhythm abnormalities Statins PhyzioType SINM Cardiovascular disease: Predicts risk of statin-induced neuro-myopathy, based on a patient’s combinatorial genotype for 50 genes Atorvastatin LDLR Cardiovascular disease: «Doses should be individualized according to the recommended goal of therapy. Homozygous Familial Hypercholestremia (10-80mg/day)and heterozygous (10-20mg/day)» Camptosar® (irinotecan) UGTIA1 18 Colon cancer: «Variations in the UGT1A1 gene can influence a patient’s ability to break down irinotecan, which can lead to increased blood levels of the drug and a higher risk of side effects» 9a edición del curso de Biotecnología Aplicada a la Salud Humana Therapy Biomarker/test Indication Erbitux® (cetuximab) Gefitinib Vectibix® (panitumab) EGFR expression Colon cancer: «Patients enrolled in the clinical studies were required to have…evidence of positive EGFR expression using the DakoCytomation EGFR pharmDx™ test kit». EGFR positive individuals are more likely to respond to the drug than those with reduced EGFR expression. Erbitux® (cetuximab) Gefitinib Vectibix® (panitumab) KRAS Colon cancer: Certain KRAS mutations lead to unresponsiveness to the drug Erbitux® (cetuximab) and Target GI™ Vectibix® (panitumab) Fluorouracil Camptosar® (irinotecan) Colon cancer: Provides information of the expression of key molecular targets–KRAS, TS, and TOPO1–to guide therapy Tagretol (carbamazepine) HLA-B*1502 Epilepsy and bipolar disorder: Serious dermatologic reactions are associated with the HLAB*1502 allele in patients treated with carbamazepine. «Prior to initiating Tegretol therapy, testing for HLA-B*1502 should be performed in patients with ancestry in populations in which HLAB*1502 may be present» Immunosuppressive drugs AlloMap® gene profile Heart transplantation: Monitors patient’s immune response to heart transplant to guide immunosuppressive therapy. Ziagen® (abacavir) HLA-B*5701 HIV: «Patients who carry the HLA-B*5701 allele are at high risk for experiencing a hypersensitivity reaction to abacavir. Prior to initiating therapy with abacavir, screening for the HLA-B*5701 allele is recommended» Selzentry® (maraviroc) CCR5 receptor (1) HIV: «Selzentry, in combination with other antiretroviral agents, is indicated for treatment experienced adult patients infected with only CCR5-tropic HIV-1 detectable...» Budesonide IBD Serology 7 Inflammatory bowel disease: Identifies subset of patients who will benefit from budesonide. Gleevec® (imatinib mesylate) BCR-ABL Leukemia: «Gleevec® (imatinib mesylate) is indicated for the treatment of newly diagnosed adult and pediatric patients with Philadelphia chromosome positive [indicated by presence of BCRABL] chronic myeloid leukemia (CML) in chronic phase» Dasatinib Philadelphia Chromosome Leukemia: «Dasatinib is indicated for the treatment of adults with Philadelphia chromosomepositive acute lymphoblastic leukemia (Ph+ AL) with resistance or intolerance to prior therapy» Busulfan Philadelphia Chromosome Leukemia: «Busulfan is clearly less effective in patients with chronic myelogenous leukemia who lack the Philadelphia (Ph1) chromosome» Purinethol® (mercaptopurine) Thiaguanine Azathioprine TPMT Leukemia: Guides adjustment of dose in treatment of acute lymphoblastic leukemia: «Patients with inherited little or no thiopurine S-methyltransferase (TPMT) activity are at increased risk for severe Purinethol toxicity from conventional doses…» Genómica, proteómica y medicina 19 Therapy Biomarker/test Indication Tarceva® (erlotinib) EGFR expression Lung cancer: The test determines patients most likely to respond. Capecitabine DPD Multiple cancers: «Rarely, unexpected severe toxicity (e.g., stomatitis, diarrhea, neutropenia and neurotoxicity) associated with 5-fluorouracil has been attributed to a deficiency of dihydropyrimidine dehydrogenase (DPD) activity» Pharmaceutical and sur- MLH1, MSH2, MSH6 Multiple cancers: Guides surveillance and preventive treatment based on susceptibility risk for colon and other cancers. gical treatment options and surveillance Chemotherapy CupPrintTM Chemotherapy Aviara Cancer TYPE Multiple cancers: Classifies 39 tumor types from tumors of unkID® nown primary origin, using a gene expression profile. Elitek® (rasburicase) G6PD deficiency Drugs metabolized by CYP P450 Amplichip® Multiple diseases: FDA classification 21 CFR 862.3360: «This device CYP2D6/CYP2C19 is used as an aid in determining treatment choice and individualizing treatment dose for therapeutics that are metabolized primarily by the specific enzyme about which the system provides genotypic information» 2C19: Celecoxib, Codeine, Diazepam, Esomeprazole, Nelfinavir, Omeprazole, Pantoprazole, Rabeprazole, Voriconazole 2D6: Acetaminophen, Aripiprazole, Atomoxetine, Carvedilol, Cevimeline hydrochloride, Clozapine, Fluoxetine HCl, Fluoxetine HCL and Olanzapine, Metoprolol, Propranolol, Propafenone, Protriptyline HCl, Risperidone, Tamoxifen, Terbinafine, Thioridazine,Timolol maleate,Tiotropium bromide inhalation, Tolterodine, Tramadol, Venlafaxine Multiple cancers: Determines cancer classification for tumors of unknown primary origin. Multiple cancers: «Rasburicase administered to patients with glucosephosphate dehydrogenase (G6PD) deficiency can cause severe hemolysis. … It is recommended that patients at higher risk for G6PD deficiency … be screened prior to starting ELITEK therapy» Rifampin Isoniazid Pyrazinamide NAT Multiple diseases: N-acetyltransferase slow and fast acetylators and toxicity- «slow acetylation may lead to higher blood levels of the drug, and thus, an increase in toxic reactions» Rituximab PGx PredictTM: Rituximab Non-Hodgkin’s lymphoma: Detects CD-20 variant (polymorphism in the IgG Fc receptor gene FcgRIIIa) to predict response to cancer drug rituximab. Celebrex® (celecoxib) CYP2C9 Pain: «Patients who are known or suspected to be P450 2C9 poor metabolizers based on a previous history should be administered celecoxib with caution as they may have abnormally high plasma levels due to reduced metabolic clearance» Risperdal® (resperidone) Zyprexa® (olanzapine) PhyzioType PIMS Psychiatric disorders: Predicts risk of psychotropic-induced metabolic syndrome, based on a patient’s combinatorial genotype for 50 genes. 20 9a edición del curso de Biotecnología Aplicada a la Salud Humana Therapy Gleevec® (imatinib mesylate) Biomarker/test c-KIT Indication Stomach cancer: «Gleevec® is also indicated for the treatment of patients with Kit (CD117) positive unresectable and/or metastatic malignant gastrointestinal stromal tumors (GIST)» *This list is not intended to be comprehensive but reflects commonly used or available products as of March 2009. Some products, for which the FDA recommends or requires pharmacogenomic testing or which have pharmacogenomic information in their label, are listed at the FDA’s Web site (http://www.fda.gov/cder/genomics/genomic_biomarkers_table.htm). Other listed products that are novel, and/or that address large populations, have been identified via websites and public announcements. Indications in quotes are taken from the therapeutic product label. BCR-ABL = breakpoint cluster region – Abelson BRCA 1,2 = breast cancer susceptibility gene 1 or 2 c-KIT = tyrosine kinase receptor CYP = cytochrome P450 enzyme DPD = dihydropyrimidine dehydrogenase TOPO1 = topoisomerase 1 G6PD = glucose 6 phosphate dehydrogenase TPMT = thiopurine S-methyltransferase HER2 = human epidermal growth factor receptor 2 TS = thymidylate synthase NAT = N-acetyltransferase UGT1A1 = UDP-glucuronosyltransferase 1A1 Therapeutic product label contains pharmacogenomic information as: forma que los fármacos (a veces en forma de cóctel) interfieren con las redes o con los nudos (intersecciones) que bloquean toda la red. Algunos test para el cáncer de mama, que evalúan 70 genes, orientan no sólo sobre el fármaco a administrar sino que predicen la probabilidad de desarrollar metástasis e incluso el grado de malignidad. La MP, por tanto, se basa en análisis moleculares, con frecuencia altamente complejos (perfiles genómicos de miles de genes, perfiles proteómicos de cientos de proteínas) y que requiere un amplio apoyo de todo el sistema de salud de los países que quieran implantarlo: nuevas regulaciones, revisión profunda de la educación en biomedicina, sistemas integrados de información sobre la salud, nueva legislación que proteja frente a la discriminación (por razones genéticas), cobertura de los test por los seguros públicos y privados, etc. A pesar de los numerosos obstáculos, lentamente, pero con paso firme, la MP se va incorporando a los sistemas de salud de los países desarrollados. La tecnología y las nuevas estrategias científicas han sido siempre los motores de las revoluciones científicas y todo indica que lo mismo va a ocurrir con la medicina. Países como Estados Unidos o el Reino Unido han aprobado recientemente en sus parlamentos las directrices para el establecimiento de la MP Information only Recommended Required como el camino óptimo para la salud de la población y, a la vez, el de menor costo a largo plazo. El paradigma de la MP, y que plantea unos objetivos más ambiciosos, es la denominada medicina 4P: preventiva, predictiva, personalizada y participativa. Sus promotores (cuyo máximo representante es L. Hood, presidente del Institute for Systems Biology, Seattle, Estados Unidos) consideran que la aplicación de la biología de sistemas (que hace uso de los datos y técnicas genómicas, proteómicas y metabolómicas) (fig. 2), la emergencia de nuevas tecnologías (nanochips, microfluídica, técnicas de visualización), y las nuevas herramientas computacionales, van a modificar significativamente la medicina y el tratamiento de la enfermedad. El carácter predictivo proviene de la estimación de la probabilidad de padecer o no una cierta enfermedad en función del genoma individual. Es personalizada porque las variaciones genéticas únicas de cada individuo orientan y/o dirigen los tratamientos: cada paciente se convierte en su propio control; a partir del genoma individual se poseen billones de datos de cada individuo y cientos de millones de individuos con esa cantidad de información. Es preventiva porque pueden diseñarse fármacos terapéuticos/preventivos a partir de la información generada mediante la biología de sistemas. Y, finalmente, es participa- Genómica, proteómica y medicina 21 • Parallel analyses of proteins, metabolites and mRNA from complex samples • Determination of molecular function and elucidation of disease mechanisms • Informatics tools to link gene response, protein activity and metabolite dynamics • BioSystematics™ to translate covariant sets of genes, proteins, metabolites into biochemical interaction and target information Metabolites protein index Proteins ge ne ind ex Clinical data BioSystematicsTM metabolite index Genes Target and System information Figura 2. Representación esquemática de los elementos que constituyen la biología de sistemas y su aplicación en medicina. tiva porque los pacientes entienden y participan en las opciones que toman los médicos, los cuales deben actuar como integradores de la información total. Utilizando los análisis moleculares de la biología de sistemas para el tratamiento de la enfermedad o su predisposición, la medicina 4P promete introducir nuevos estándares en la salud humana. El resultado es que en los próximos 5-20 años la medicina puede cambiar de ser prioritariamente reactiva (responde cuando aparecen los síntomas de la enfermedad) a ser proactiva, caracterizada por las 4P. Si se adoptan los test moleculares en la práctica clínica se puede realmente transformar la salud de la población. Gracias a la secuenciación ultrarrápida se puede obtener el perfil genómico de un individuo (o de un tumor) en cuestión de días e incluso horas, lo cual introduce unos niveles de complejidad difícilmente controlables en la actualidad. Sin embargo, el número de causas o modificaciones (mutaciones) que hacen que una célula sana se convierta en tumoral no pa22 rece ser muy elevado y son comunes a muchos tumores, lo que facilita el diagnóstico y sobre todo el tratamiento. Ya no es arriesgado decir que en un futuro inmediato la determinación del genoma completo de cada individuo es algo no sólo factible, sino de un precio asequible (unos 1.000 dólares, 800 euros): el primer genoma costó 3 billones de dólares, el segundo 100 millones y el tercero, el de James Watson, 1,5 millones (fig. 3). En el futuro cada recién nacido tendrá determinado su genoma completo antes de abandonar el hospital, lo que ya es un objetivo en Estados Unidos, donde el número de nacimientos anuales ronda los 4 millones. Los genomas individuales serán un estándar dentro de las historias clínicas en los próximos años. Sin embargo, algunas de las tecnologías de hoy día necesitan ser mejoradas de forma importante si se quieren conseguir los objetivos de la medicina 4P. Por ejemplo, los métodos nanotecnológicos para la medición de proteínas –como medir 2.500 proteínas a partir de una gota de sangre– no son posibles actualmente. 9a edición del curso de Biotecnología Aplicada a la Salud Humana $3B 20 $ Millons 3,0 2,5 $ Billons 2,0 $20M 15 10 5 $2M 0 2006 1,5 2006 $5K 2006 2006 $1K 2006 1,0 0,5 0 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 Figura 3. Descenso progresivo en el costo (en $) estimado para la determinación del genoma completo de un individuo. Existen pequeños dispositivos que son capaces de cuantificar 40-60 proteínas en líquidos fisiológicos (se han testado en saliva) que pueden ser prototipos de desarrollos posteriores (fig. 4). La propuesta de que deben desarrollarse test que evalúen 50-100 proteínas específicas de los distintos órganos, como forma de preguntarnos acerca del estado de salud en vez del estado de la enfermedad, está sin embargo mucho más cerca. Las técnicas proteómicas más recientes, como el método MRM, ya son capaces de cuantificar 50-100 proteínas/ensayo en un breve tiempo y con gran sensibilidad y exactitud. Igualmente, la capacidad de obtener análisis detallados a partir de una única célula o un pequeño grupo de ellas (actualmente se está haciendo con 1.000 células) podrá ser real en un futuro próximo. El desarrollo de herramientas computacionales y matemáticas con capacidad de gestionar la dimensionalidad de los datos es una tecnología con un alto poder transformador. En los próximos 10 años vamos a disponer de millones de datos procedentes del genoma y proteomas de cada paciente. ¿Cómo reducir esa enorme cantidad de datos a hipótesis simples de salud y enfermedad? El modo de correlacionar los datos genómicos y proteómicos con el fenotipo normal y asociado a cada enfermedad es un gran reto. Dónde y cómo se van a manejar informáticamente todos esos datos es actualmente un desafío y un tema para la reflexión. Hood considera que esta implementación abocará en una digitalización de la medicina, de forma similar a lo que ha ocurrido recientemente en el paso de la información analógica a la digital. Es posible que la medicina se convierta así en una ciencia de la información. Proteómica y medicina: el proyecto proteoma humano En septiembre de 2010, dos centros independientes (The Institute for Systems Biology, en Seattle, Washington y el Swiss Federal Institute of Technology, ETH, en Zúrich) han anunciado oficialmente que han completado la primera fase para la generación de un mapa completo del proteoma humano, utilizando la espectrometría de masas (MS) para la identificación Genómica, proteómica y medicina 23 A Determinación de perfiles proteicos órgano-específicos (cerebro, hígado) en el plasma Distinción salud/enfermedad B Eliminar células 300 nl de plasma Cuantificación de proteínas Nanochips (microfluídica) para el análisis del plasma sanguíneo (proteínas) Figura 4. A) La presencia de proteínas órgano-específicas en el plasma permite la obtención de perfiles proteicos asociados a la enfermedad. B) Representación esquemática de un nanochip para el análisis de proteínas plasmáticas. de las proteínas –estos datos están libremente accesibles a toda la comunidad científica en (www.srmatlas.org; www.peptideatlas.org–. Los investigadores han generado espectros de masas (análisis que permite identificar cada proteína) de referencia para cada una de las proteínas correspondientes a los 20.300 genes humanos presentes en el genoma. Este mapa de referencia permitirá a los investigadores de todo el mundo detectar y cuantificar cualquier proteína humana de cualquier muestra biológica (tejidos, células, líquidos fisiológicos). Se utilizan para ello técnicas específicas de MS, fundamentalmente SRM (Selected Reaction Monitoring), que permiten detectar y cuantificar cada proteína indi24 vidual a partir de alguno de sus péptidos. Moritz, Hood y Aebersold han generado más de 150.000 SRM que incluyen al menos 5 péptidos proteotípicos (específicos de cada proteína) para la identificación de las proteínas. Además, han dsarrollado ensayos de SRM específicos para todas las proteínas de membrana y todas las glucoproteínas con sitios de N-glucosilación. Este ingente trabajo supone un avance comparable al primer borrador del genoma humano, de forma que ahora las bases de datos con las proteínas son de libre acceso; el costo estimado ha sido de 5 millones de euros. El mapeo del genoma humano requirió 10 años y un costo de casi 3 billones de dólares; fue el origen de lo 9a edición del curso de Biotecnología Aplicada a la Salud Humana que ahora comienza como Proyecto del Proteoma Humano (HPP), que se estima pueda estar completado en el año 2020. Con los datos, ahora públicos, se da un paso de gigante para reforzar el desarrollo de la MP porque facilita hacer el tipo de análisis de alto rendimiento (miles de proteínas de un individuo) que se requiere en la MP o 4P. Pero el objetivo final del HPP no es tener un mero listado de proteínas, sino todas las posibles variantes de cada proteína (isoformas), su función, abundancia, localización subcelular y sus interacciones (redes y rutas de señalización). Casi un tercio de los 21.000 genes del genoma humano no tiene una proteína conocida asociada y de los otros dos tercios no hay una información detallada. El HPP se propone obtener esta información detallada y tener al menos una proteína correspondiente a cada gen humano. Es un objetivo complicado, porque el proteoma es dinámico, está cambiando constantemente y las proteínas son modificadas de múltiples formas (fosforilación, glucosilación, acetilación, etc.) y en distintos tiempos. Además, se pretende tener una colección de anticuerpos específicos para cada una de las proteínas. De cara al futuro inmediato, uno de los mayores desafíos es almacenar, manejar y controlar todos los datos que genera el HPP, especialmente de forma integrada entre sí y con los datos genómicos. Es fundamental que presente utilidad práctica y, en especial, que proporcione información útil para la medicina que pueda trasladarse rápidamente a la práctica clínica. No debe olvidarse que en último término son las proteínas (y no sólo los genes) las moléculas clave para el entendimiento de las enfermedades (y de la salud). Las proteínas son los contribuyentes fundamentales del fenotipo, y las enfermedades se refieren fundamentalmente al fenotipo y no al genotipo. Cualquier mejora e implementación en la medicina y en la MP depende de un mayor conocimiento de las proteínas y del proteoma humano que ahora empieza a desvelarse. Es importante recordar, además, que más del 90% de las dianas terapéuticas son proteínas, sobre las que actúan los fármacos. Proteómica clínica La proteómica ofrece una información altamente complementaria de la genómica; como la mayoría de las funciones biológicas las realizan las proteínas, la proteómica ofrece una nueva visión de la enfermedad. A pesar de su complejidad, el rápido y notable desarrollo en los últimos años ha conducido a su aplicación a los procesos patológicos o proteómica clínica, la cual se ocupa de la identificación sistemática y exhaustiva, a gran escala, de patrones proteicos de enfermedad y de la aplicación de esos datos a los pacientes (estudio de la enfermedad, susceptibilidad, prevención, selección de terapias, seguimiento de los tratamientos, etc.). Entender, por ejemplo, las alteraciones tempranas en diversas enfermedades (típicamente en cáncer o en el síndrome coronario agudo), produciría una notable mejora en la prevención e identificación de pacientes con riesgo y/o en estado preclínico. La proteómica clínica pretende definir patrones de proteínas que puedan generar información de valor clínico acerca de la susceptibilidad, diagnóstico, pronóstico y terapia de la enfermedad; para que impacte de manera real en la mejora de la salud debe identificar y seleccionar patrones proteicos, validarlos en estudios poblacionales muy amplios y trasladarlo a la práctica clínica. Entre sus objetivos, se encuentran los que siguen. Identificación de biomarcadores individuales La búsqueda e identificación de biomarcadores individuales se lleva a cabo siguiendo la metodología proteómica clásica de separación de proteínas (2-DE, DIGE, cromatografía multidimensional y electroforesis capilar) y su identificación por espectrometría de masas (MS, MALDI-TOF, ESI-Q-TOF o ESI-Trap, MALDI-TOF/TOF). Su estrategia fundamental es el análisis de la expresión diferencial de proteínas entre controles y muestras patoGenómica, proteómica y medicina 25 lógicas (fig. 5), de proteomas completos (lisados celulares) o subproteomas específicos (mitocondrias, membranas, etc.). Un aspecto fundamental es la determinación de las modificaciones postraduccionales y su potencial implicación en patología. En muchos casos los biomarcadores se convierten simultáneamente en nuevas dianas terapéuticas. Obtención de perfiles proteicos Consiste en el estudio sistemático, a gran escala, de las proteínas de una muestra para la identificación de patrones o perfiles proteicos (huellas dactilares proteicas), con carácter diagnóstico (discriminatorio) y/o pronóstico. Los escasos biomarcadores identificados y aprobados por la FDA en los últimos años son un reflejo de la es- trategia habitual de testar una proteína individual, o llevar a cabo análisis en pequeña escala, etc. Aunque existen excepciones (paraproteínas de los mielomas, déficit de α-1-antitripsina) es muy posible que no existan marcadores únicos de las enfermedades complejas, por lo que la estrategia proteómica de estudiar paneles proteicos, supone un paso cualitativo de gran trascendencia. Este estudio se puede realizar mediante, al menos, las tres estrategias que siguen. Perfiles proteicos de plasma o suero Se analiza el suero/plasma de los pacientes con la patología objeto de estudio (cardiovascular, neurodegenerativa, infecciosas, cáncer, etc.) y alternativamente en otros líquidos fisiológicos (lavado broncoalveolar, líquido cefalorraquídeo, orina). Se utiliza la técnica denominada SELDI- Normal RCC Normal RCC Figura 5. Ejemplo de análisis proteómico de expresión diferencial mediante electroforesis bidimensional. La comparación entre las proteínas (manchas en la figura) del tejido sano (Normal) y patológico (RCC), permite detectar alteraciones en los niveles de expresión de varias proteínas (flechas en los paneles de la derecha) 26 9a edición del curso de Biotecnología Aplicada a la Salud Humana Perfiles proteicos de tejidos: MS-Imaging En tejidos, pueden obtenerse perfiles o imágenes (mapas) bidimensionales de proteínas (MSImaging) aplicando directamente la MS sobre cortes histológicos del tejido (cortes habituales sobre portaobjetos para microscopia óptica, de 5-20 μm de grosor), utilizando el MALDI-TOF o el MALDI-TOF/TOF. El mapa bidimensional se consigue haciendo incidir el láser (que «barre» la superficie de la muestra) del espectrómetro sobre los cortes histológicos y analizando las proteínas que son vaporizadas. Típicamente aparecen 500-1.000 señales de proteínas individuales en cada punto del tejido, con masas entre 2-70 kDa. De esta forma se obtiene la masa (m/z) de las moléculas (péptidos, proteínas) presentes en cada zona del tejido. Seleccionando una masa dada (m/z) en los distintos espectros de las diferentes zonas, se genera un mapa 3325.4 Relative intensity TOF (Surface Enhanced Laser Desorption/ Ionization-Time of Flight) para la generación de los perfiles proteicos, que combina la retención de las proteínas del suero en biochips con la determinación de sus masas moleculares mediante MS, permitiendo generar gráficos donde se representa la abundancia frente a la masa molecular de las proteínas, a modo de código de barras proteicos constituidos por miles de líneas que caracterizan el suero de cada individuo (fig. 6). Su poder discriminatorio es muy superior al de marcadores únicos con los que se han comparado (p. ej., PSA en cáncer de próstata, proteína C reactiva en infección e inflamación). Como el análisis mediante SELDI-TOF utiliza muy poca muestra (1 μl) y, además, es muy rápido (se pueden analizar cientos de muestras al día) y automatizado, su potencial en clínica analítica es enorme y puede ir sustituyendo muchas de las técnicas habituales de los laboratorios de bioquímica clínica (enzimoinmunoanálisis), que son más lentos, más caros (utilizan anticuerpos marcados con sondas fluorescentes), precisan mayor cantidad de muestra y sólo informan de un único marcador, frente a los miles que proporciona el SELDI-TOF. 3325.1 3,000 6593.8 4303.1 5392.1 6593.8 4303.1 5392.1 4,000 5,000 6,000 7,000 Figura 6. Representación de perfiles proteicos obtenidos por SELDI-TOF. bidimensional de la distribución de esa proteína (esa m/z) a lo largo del corte de tejido (a modo de cartografía proteica). Se pueden conseguir dos tipos de datos: perfiles proteicos (mediante una adquisición puntual) e imágenes (barriendo todo el tejido con el láser) (fig. 7). Las imágenes son generadas mediante un software específico que clasifica y agrupa las proteínas y compara diversas muestras, permitiendo obtener imágenes tridimensionales de la distribución de las proteínas del tejido. Esta tecnología implica un tipo de información totalmente nuevo para la descripción, clasificación y caracterización de muestras histológicas que está permitiendo la identificación de biomarcadores, la localización de proteínas específicas y, en el campo de la oncología, la reclasificación de tumores, por ejemplo. Una técnica muy similar (SIMS-TOF, Secondary Ion Mass Spectrometry) permite el análisis (identificación y caracterización) de moléculas de bajo peso molecular presentes en la superficie de una muestra (determinación del metaboloma) hasta los 1.500 Da. Esta limitación en el reducido rango de masas analizado es compensada en parte por la alta resolución obtenida (subcelular; hasta 200 nm/pixel) y por no necesitar la utilización de ningún tipo de matriz (evitando interferencia y deslocalización de las muestras: se usa el tejido directamente), lo que Genómica, proteómica y medicina 27 Tissue slide Matrix application Las er Laser ablation Tandem MS MS MS/MS spectrum Mass spectra for each xy coordinate Single m/z values Biocomputational analysis Peptide fragments Database search 0% Protein identification 100% Protein images Class A Class B Classification images Figura 7. Flujo de trabajo en el análisis de tejidos mediante MS-Imaging. la convierte en una herramienta muy valiosa en patología. Además, como ésta técnica se aplica para localizar y mapear en el tejido moléculas pequeñas, particularmente fármacos (y su colocalización con proteínas), es de gran interés para la industria farmacéutica. Chips (arrays) de proteínas La obtención de perfiles proteicos, tanto de suero (u otros líquidos fisiológicos) como de células o tejidos, también puede obtenerse a partir de la utilización de chips (o micromatrices) de proteínas. Éstos pueden clasificarse según mu28 chos parámetros (modo de fabricación, química de la superficie, especificidad, densidad, etc.), aunque es mejor sistematizarlos en dos grandes grupos, según lo que capturan o analizan. Chips analíticos Se utilizan para determinar las proteínas presentes en una muestra (perfil de expresión) y su cuantificación. La disolución de la mezcla de proteínas a analizar se aplica sobre el chip, que contiene agentes de captura que actúan como sondas. Los agentes de captura más conocidos son los anticuerpos (Ab) en sus distintas moda- 9a edición del curso de Biotecnología Aplicada a la Salud Humana lidades: monoclonales completos, Fab, scFv, afibodies (Ab sintéticos), dominios de Ab, etc. La utilización de Ab no está exenta de problemas: inespecificidad, reacciones cruzadas, orientación, afinidad, etc. Otra alternativa son los chips de antígeno para analizar el perfil sérico de Ab (y autoAb en enfermedades autoinmunes), como los chips de alérgenos para la detección de IgEs en respuestas alérgicas. Recientemente se está generando una plétora de agentes de captura distintos a los Ab, como péptidos, moléculas orgánicas, polímeros sintéticos, oligonucleótidos, aptámeros, ribozimas, trinectinas (derivados de la fibronectina), MIP (molecular imprinted polymers: compuestos que se polimerizan sobre las proteínas creando moldes para su uso posterior), etc. A pesar de ésta diversidad, la captura de las proteínas (y los métodos de detección) constituye el gran problema de los chips proteicos: no existen todavía agentes de captura de alta calidad que puedan inmovilizarse en la superficie de un chip y que permitan unir, detectar y cuantificar una mezcla compleja de proteínas. Este problema está retrasando no sólo el desarrollo de los chips proteicos sino de la industria proteómica en general. Los chips de fase reversa son de especial relevancia en medicina porque permiten determinar las proteínas implicadas en las rutas de señalización celular en las biopsias de los pacientes. En ellos, las biopsias (típicamente de tumores o cardiacas) se lisan y se depositan en diluciones sucesivas como microgotas (utilizando los mismos robots que para la fabricación de los chips de ADN); posteriormente, son revelados con Ab validados (que reconocen proteínas fosforiladas y cinasas, a fin de determinar el grado de activación de las diferentes rutas de señalización), obteniéndose información cualitativa y cuantitativa para cada paciente, lo que permite un tratamiento personalizado; actualmente existen más de 1.000 Ab validados. Mediante estos arrays puede determinarse simultáneamente el estado de fosforilación de las proteínas impli- cadas en las principales rutas de señalización intracelular. La utilización de los arrays de fase reversa permite así, obtener un tipo de información molecular único e individualizado de cada muestra y, por tanto, de cada paciente. Este nuevo tipo de array proporciona perfiles de señalización intracelular, incluyendo las modificaciones postraduccionales, datos que no son accesibles mediante técnicas genómicas. Chips funcionales Se utilizan para determinar actividades bioquímicas e interacciones moleculares. Las proteínas de interés se inmovilizan en el chip y se analizan sus funciones biológicas e interacciones incubándolas con distintas moléculas (otras proteínas, metabolitos, sustratos de enzimas, ADN, etc.). Los dos problemas principales de estos chips son la producción de colecciones extensas de proteínas y su mantenimiento en forma activa en el chip. Sin embargo, para grupos de proteínas con características funcionales similares (factores de trascripción, receptores, cinasas) hay un gran campo por desarrollar en clínica humana. Referencias Auffray C, Chen Z, Hood L. Systems medicine: the future of medical genomic healthcare. Genome Med. 2009;1:2. Personalized Medicine Coalition. The case for personalized medicine, 2009. USA. (www.personalizedmedicinecoalition.org). Genomic Medicine, vol 1. Report of Science and Technology Committee. House of Lords, 2009. London (http://www.parliament.uk/hlscience/). Hamburg MA, Collins FS. The path to personalized medicine. N Engl J Med. 2010;363(4):301-4. Evans JP, Dale DC, Fomous C. Preparing for a consumerdriven genomic age. N Engl J Med. 2010;363:1099103. Lotta LA. Genome-wide association studies in atherotrombosis. Eur J Int Med. 2010;21:74-8. Focus on cancer proteomics. Nat Rev Cancer. 2010, septiembre;10:605-60. Van Eyk J, Dunn M, editores. Clinical proteomics. From diagnosis to therapy. Wiley-VCH; 2008. Genómica, proteómica y medicina 29