Indexation génomique
Transcripción
Indexation génomique
1 PROYECTO GENOMIA RE-CALCUL DES EVALUATIONS GENOMIQUES LATXA ET « INTERNATIONAL » Pau, 22/03/2012 Andrés Legarra, Eva Ugarte, (Guillaume Baloche, Francis Barillet) INRA Toulouse 2 Ce qu’on devait faire 1. Pseudo-Single Step en Latxa (DYD de carneros genotipados y NO genotipados) • Fait (avec un erreur corregible) 2. Usar DYDs como referencia en lugar de EBVs (evaluaciones) • Fait 3. Usar modelo multicaracter para valoracion « internacional » de Manech • Fait 4. Calculo de correlacion genética entre razas (MTR y LCR)(MTN y MTNNAF) • Fait 3 Traitement de génotypes • Traitement de phenotypes (DYD = production moyenne des filles, corrigées) • • J’ai refait (février 2013!) TOUT le traitement des évaluations Latxa et Multi-raciale 4 Pertes • En Latxa • 1280 beliers genotypés: • Individual Call Rate > 90% (SNP genotipados / SNPs totales): • 578 carneros con CR <90% : abandonados • 10 carneros duplicados (numeros iguales, ADN diferente) • 35 carneros con raza incorrecta (ACP) • • Finalement: • 625 beliers correctement genotypés • 279 LCN Eus, • 206 LCR, • 173 LCN Na • Voici le détail par an (genotypés / non genotypés parmi tous les béliers evalués en Latxa -> avec filles) 5 6 7 8 • Pour comparer: 9 Pérdidas SNPs descartados: • SNP call rate <97%, p-value Hardy-Weinberg <10-6, SNP posicionado correctamente en SheepHapMap • • 42655 SNPs • Entra dentro de lo normal 10 Union de genotipos Latxa + Manech (TR & TN) + BB (+ Lacaune) • Se retienen los marcadores que son polimorficos en el conjunto de las 7 poblaciones • 38287 marcadores • 11 Pérdidas Tratamiento de fenotipos • Fenotipo: Leche ordeñada (lait à la traite, en LITRES (FR en decilitres)) • • Eva Ugarte genera los DYD a partir de las valoraciones BLUP: DYD + precision (« equivalent daughter contribution ») • Je me suis trompé avec la généalogie: on n’a pas utilisé tous les individus NON-genotypés • Seulement les DYD des genotypés + ses ancêtres (génotypés ou pas) • Il a qqs trous, possiblement dans les générations anciennes • Possible source d’erreur (on verra demain !) 12 Valoraciones intra raza Latxa • 631 (436 non genotyped + 195 genotyped) LCN EUS • 663 (458 non genotyped + 195 genotyped) LCR • 358 (267 non genotyped + 91 genotyped) LCN NAF • Método: pseudo-Single Step GBLUP • Validacion « cruzada » seulement sur les beliers génotypés LCNEUS LCR LCNNAF # beliers edc moyen « training » (genotypés + non genotypé) 144+421 # beliers « validation » (genotypés ou pas) edc moyen 69 51 13 148+445 56 47 25 67+255 54 24 17 13 (Pseudo-)Single Step Extension du GBLUP Avec la généalogie, diffuse l’information génomique des individus génotypés aux non-genotypés non genotyped " H11 H12 # " A11 + A12 A !221 (G ! A 22 ) A !221 A 21 H= $ =$ % !1 H H GA & 21 22 ' & 22 A 21 A12 A !221G # % G ' genotyped X #Z % $ bˆ % $ X #y % $ X #X & Z#X Z#Z + ! H "1 ' & ˆ ' = & Z#y ' ( ) (u) ( ) Généalogie 14 Evaluation génétique « Reduced data set » 2008 f() « Full data set » Predicciones con la informacion de 2008 « Verdad » después de las pruebas con hijas en 2012 Precision: correlacion entre las dos 15 Valoraciones Latxa Générations de Validation Latxa: 2008 + 2009 • On compare DYD « observé » (avec filles) contre DYD «predit » (avec pedigree seul ou pedigree+ génomique) • Ecart type calculé par méthodes numériques (« bootstrap ») • • J’ai refait les évaluations MTR/MTN/BB (pour comparer facilement) • Validation MTR/BB: 2007-2008 • Validation MTN: 2006-2007 16 Valoraciones Latxa • Manech/BB utilise la validation « 1103 » (fin 2011) pour créer les DYD’s • Méthode légèrement optimiste • Ce n’est pas le recommandé mais ça permet de comparer avec Latxa • Cela donne des résultats très similaires aux résultats de G Baloche (qui sont plus exactes) • Latxa utilise la validation « août 2012 » fait par Eva • Si non, trop peu d’information 17 Pruebas genomicas Latxa puraescala DYD Indice de pedigri LCN EUS Genomico Diferencia # animales en validacion -0.09±0.09 51 0.23±0.19 -0.03±0.21 0.15±0.21 0.20±0.16 0.21±0.10 47 LCN NAF 0.36±0.21 0.40±0.20 0.04±0.10 24 BB 0.41±0.11 0.46±0.10 0.05±0.06 87 MTN -0.02±0.16 0.23±0.13 0.24±0.17 56 MTR 0.26±0.07 0.39±0.05 0.14±0.05 293 LCR 1. Evaluations génomiques plus précises en LCR, LCN NAF 2. Moins précises en LCN EUS???? 1. Problème des données? 3. Résultats réconfortants car + similaires à Manech/BB 18 Pruebas genomicas Latxa pura: precision Indice de pedigri LCN EAE LCR LCN NAF Genomico 0.23±0.19 -0.03±0.21 0.15±0.21 0.20±0.16 0.36±0.21 0.40±0.20 Diferencia # animales en validacion -0.09±0.09 51 0.21±0.10 47 0.04±0.10 24 escala DYD Très incertain La structure de famille de la cohorte rentre dans la capacité à differencier les animaux (il est +simple avec demi-cousins qu’avec demi-frères) 19 Parenté moyen de la validation LCN EUS LCR # animales Coeff Couples Couples en parenté parenté >= parenté validacion / 0,5 0,49-0,25 couples totales 51 / 2550 158 0,10 1 47 / 2162 0,02 0 28 Couples parenté 0,24 – 0,125 237 1 24 / 552 0,05 1 14 17 BB 87 / 7482 0,09 1 178 369 MTN 56 / 3080 0,09 0 100 79 MTR 293 / 85556 0,05 1 1208 731 LCN NAF 20 Union de genotipos Latxa + Manech (TR & TN) + BB + Lacaune • Se retienen los marcadores que son polimorficos en el conjunto de las 7 poblaciones • 38287 marcadores • 21 Un résultat de GENOMIA 0.03 0.04 PCA of 7 dairy sheep breeds BB 0.01 LCN-NA -0.01 0.00 LCN-EUS LCR Lacaune -0.02 PC 2 0.02 MTN MTR -0.01 0.00 0.01 PC 1 0.02 22 Valoraciones « internacionales » • Esto confirma: • Que MTR y Latxa Cara Rubia estan muy conectadas • Que MTN, LCN_Na y LCN_Eus estan un poco conectadas • Tres evaluaciones « pequeñas »: • LCR + MTR • LCN_Naf + MTN • LCN_Naf + LCN_Eus + MTN donne des résultats surprenants, à travailler encore • Correlations génétiques testées: 0,5 (estimée par REML) et 0,95 (hypothèse races idéntiques) • Optimum: • 0,5 pour LCR/MTR • 0,95 pour MTN/LCNNAF 23 Pruebas genomicas Latxa Indice de pedigri LCN EAE Genomico « solo » Genomico « internacional » Corr=0,95 0.23±0.19 -0.03±0.21 0.15±0.21 0.20±0.16 0.19±0.16 LCN NAF 0.36±0.21 0.40±0.20 0.43±0.20 BB 0.41±0.11 0.46±0.10 MTN -0.02±0.16 0.23±0.13 0.29±0.12 MTR 0.26±0.07 0.39±0.05 0.39±0.05 LCR MTR, LCR pas de gain (rappel: les béliers LCR fils de MTR récents ne sont pas encore là) MTN, LCNNAF gains de ~ 0,03 à 0,06 en précision 24 Conclusions: • A vérifier avec la généalogie correcte !! • Résultats + logiques qu’en Novembre 2012 • Augmentation significatif (au sens statistique) de la précision en MTR, LCR (0,10 – 0,20) • Augmentations intéressants en BB, MTN, LCNNAF • LCNEUS résultats rares, (mes) erreurs encore possibles • Toutes les populations bénéficient du « Single Step » car compense l’absence de génotypes • Petit intérêt à une évaluation génomique internationale… mais devra-t-on la faire en MTR/LCR au vu des échanges?