Análisis Estadístico de Datos Climáticos
Transcripción
Análisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos Climáticos Aplicaciones regresión-composición Marcelo Barreiro - Mario Bidegain - Alvaro Diaz Universidad de la República, 2009 1 Analisis Exploratorio Distribuciones Pruebas de Hipotesis Composites Regresion lineal Juntemos todo esto! Composites El método de “composites” consiste en clasificar los datos en categorías y comparar p. ej. los valores medios o anomalías de otras variables para las distintas categorías. Puede servir para identificar “señales” no muy fuertes que están ocultas debido a la existencia de “ruido”. Composite Eventos calidos [82; 86; 87; 91; 94; 97] Composite Eventos frios [84; 88; 95; 98; 99] Linealidad en las anomalias! Como sé cuales anomalias son estadísticamente significativas? Hay que hacer un Student Ttest para comparar la diferencia entre las dos medias muestrales. H0: misma media; H1: media es diferente Se asume las muestras proceden de la misma población, tienen distribucion normal, son independientes y tienen igual desviación típica. Que muestras comparo? Años Niño [82; 86; 87; 91; 94; 97] Años Neutros, aquellos que no son ni Niños ni Niñas. El test es: Anomalias significativas al 5% 1 extremo 2 extremos Como tenemos menos informacion el test debe ser mas fuerte %Matlab Code [clim,anom]=climatology(pre,X,Y,0); anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+... anom(12:12:end,:,:))/3; %Anos Nino nino=[82; 86; 87; 91; 94; 97]78; nina=[84; 88; 95; 98; 99]78; %Anos Neutros neutros=(79:106)78; neutros(nino)=NaN; neutros(nina)=NaN; neutros=neutros(~isnan(neutros))'; %%% Ttest anomONDnino=mean(anomOND(nino,:,:)); anomONDneut=mean(anomOND(neutros,:,:)); nino_neu=anomONDninoanomONDneut; dof=length(nino)+length(neutros)2; sp=sqrt((var(anomOND(nino,:,:))*(length(nino)1)+... var(anomOND(neutros,:,:))*(length(neutros)1) )/dof); tt=nino_neu./(sp*sqrt(1/length(nino)+1/length(neutros))); tt=squeeze(tt); tt2=tt; %5% level 1 sided jj10=find(abs(tt2)<=tinv(0.95,dof)); tt2(jj10)=NaN.*ones(size(jj10)); subplot(1,2,1) contour_map(X,Y,tt2',0,(5:1:5)); hold; shading flat contour_map(X,Y,squeeze(nino_neu)',0.5); colormap(rednblue3);caxis([6 5]); axis([280 330 55 10]) %5% level 2 sided jj5=find(abs(tt)<=tinv(0.975,dof)); tt(jj5)=NaN.*ones(size(jj5)); subplot(1,2,2) contour_map(X,Y,tt',0,(5:1:5)); hold; shading flat contour_map(X,Y,squeeze(nino_neu)',0.5); colormap(rednblue3);caxis([6 5]); axis([280 330 55 10]) Correlaciones Mapa de correlacion entre anomalias de PP_artigas5102 y TSM en OND. Como sé qué correlaciones son significativas? Para la correlacion de Pearson existe el siguiente test. H0: r=0 H1: r dif de 0 n−2 T =∣r ∣ 1−r 2 n es la longitud de la serie (considerados independientes). se compara T con valores criticos de la distribucion t con n2 grados de libertad. Regiones de TSM con correlacion significativa con pp_artigas5102 en OND. %Codigo Matlab anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)... +anom(12:12:end,:,:))/3; anompOND=(anomp(:,10)+anomp(:,11)+anomp(:,12))/3; %Calcula correlacion for i=1:96 for j=1:48 correl(j,i)=corr(anompOND,anomOND(:,j,i)); end end %Que correlacion es significativa? %Test Ho: r=0 (compare to T distribution) % 2 extremos al 5% de significancia tt=correl*sqrt(52-2)./sqrt((1-correl.^2)); jj=find(abs(tt)<=tinv(0.975,52-2)); tt(jj)=NaN; contour_map(lon,lat,tt',0,(-5:0.5:5)) hold contour_map(lon,lat,correl',0.2) n−2 T =∣r ∣ 1−r 2 Regresion Supongamos que quiero saber cual es la relacion entre el estado del Pacifico ecuatorial y la precipitacion en Sudamerica en OND. Tomo Nino3.4 como indice. Una forma de ver esto es hacer composites, como ya hicimos. Otra forma es calcular un mapa de regresion: hacer una regresion lineal entre cada punto de grilla de precipitacion y Nino3.4. Observacion: Es muy útil trabajar con anomalías estandarizadas: z=x/σ. En la regresion y = a + bx las unidades de [b]=(Unidades de y)/(Unidades de x) En este ejemplo: [b]=mm/dia / °C Si x está estandarizada, no tiene unidades y tiene desviación estandard=1 Así, b se puede interpretar como la anomalía de y asociada (dependiendo del r) a una desviacion estandard de la variable independiente x. Nino3.4 Eventos calidos [82; 86; 87; 91; 94; 97] Eventos frios [84; 88; 95; 98; 99] Azul: original Rojo:estandarizado Los dos indices son tan parecidos pues σ~1 C Regresion de precipitaciones con Nino3.4 estandarizado Una anomalia de 1mm/dia esta asociada con 1 desviacion estandard de TSM en Nino3.4. O sea, si Nino3.4 se calienta ~1C, tiende a llover 1 mm/dia mas de lo normal en el norte de Uruguay. Pero cómo sabemos en qué regiones es la regresión estadísticamente significativa? ● El coeficiente de multiple determinacion R2 S XY S XY SSR S XX R² = = SST S YY ² S XY ² ∑ x i − x y i − y = = =r² S XX SYY ∑ x i − x ² ∑ y i − y ² y representa la habilidad de la recta estimada en representar las variaciones en los datos. Entonces para saber la significancia estadística calculamos el mapa de correlacion y aplicamos el test n−2 T =∣r ∣ 2 1−r comparando con la distribucion t. ● Regresion y significancia estadistica al 5% %Anomalias de Precipitacion anompOND=(anomp(10:12:end,:,:)+anomp(11:12:end,:,:)+anomp(12:12 :end,:,:))/3; %Anomalias de TSM anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+anom(12:12:end, :,:))/3; %Niño3.4 figure plot((1979:2006),nino34,'linewidth',2) hold nino34s=nino34/std(nino34); %Estandarizo el indice Nino34 plot((1979:2006),nino34s,'r','linewidth',2) grid; axis tight %Calculo Correlacion y Regresion for i=1:144 for j=1:72 p=polyfit(nino34s',anompOND(:,j,i),1); b(j,i)=p(1); r(j,i)=corr(nino34s',anompOND(:,j,i)); end end figure %Que correlacion es significativa? %Test Ho: r=0 (compare to T distribution) tt=r*sqrt(28-2)./sqrt((1-r.^2)); jj=find(abs(tt)<=tinv(0.975,28-2)); tt(jj)=NaN; contour_map(X,Y,tt',0,(-20:20:20)) shading flat hold %Contour regresion contour_map(X,Y,b',0.5) axis([2 355 -55 60]) colormap(rednblue3) caxis([-30 20]) Diferencias entre composites y regresion En un composite se toman los extremos y se comparan con los años “neutros”. El composite se puede hacer para extremos positivos y negativos y estos resultados no tienen por que ser opuestos (respuesta nolineal). En la regresion solo se considera la relacion lineal entre el predictando (y) y el predictor (x). El composite de (maxmin)/2 da la respuesta lineal y deberia ser similar al mapa de regresion