Análisis Estadístico de Datos Climáticos

Transcripción

Análisis Estadístico de Datos Climáticos
Análisis Estadístico de Datos
Climáticos
Aplicaciones regresión-composición
Marcelo Barreiro - Mario Bidegain - Alvaro Diaz
Universidad de la República, 2009
1

Analisis Exploratorio

Distribuciones

Pruebas de Hipotesis

Composites

Regresion lineal
Juntemos todo esto!
Composites
El método de “composites” consiste en clasificar los
datos en categorías y comparar p. ej. los valores medios
o anomalías de otras variables para las distintas
categorías.
Puede servir para identificar “señales” no muy fuertes
que están ocultas debido a la existencia de “ruido”.
Composite
Eventos calidos
[82; 86; 87; 91; 94; 97]
Composite
Eventos frios
[84; 88; 95; 98; 99]
Linealidad en las
anomalias!
Como sé cuales anomalias son
estadísticamente significativas?

Hay que hacer un Student T­test para comparar la diferencia entre las dos medias muestrales. 



H0: misma media; H1: media es diferente
Se asume las muestras proceden de la misma población, tienen distribucion normal, son independientes y tienen igual desviación típica.
Que muestras comparo?

Años Niño [82; 86; 87; 91; 94; 97]

Años Neutros, aquellos que no son ni Niños ni Niñas.
El test es:
Anomalias significativas al 5%
1 extremo
2 extremos
Como
tenemos
menos
informacion
el test debe
ser mas
fuerte
%Matlab Code
[clim,anom]=climatology(pre,X,Y,0);
anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+...
anom(12:12:end,:,:))/3;
%Anos Nino
nino=[82; 86; 87; 91; 94; 97]­78;
nina=[84; 88; 95; 98; 99]­78;
%Anos Neutros
neutros=(79:106)­78; neutros(nino)=NaN; neutros(nina)=NaN;
neutros=neutros(~isnan(neutros))';
%%% T­test
anomONDnino=mean(anomOND(nino,:,:));
anomONDneut=mean(anomOND(neutros,:,:));
nino_neu=anomONDnino­anomONDneut;
dof=length(nino)+length(neutros)­2;
sp=sqrt((var(anomOND(nino,:,:))*(length(nino)­1)+...
var(anomOND(neutros,:,:))*(length(neutros)­1) )/dof);
tt=nino_neu./(sp*sqrt(1/length(nino)+1/length(neutros)));
tt=squeeze(tt); tt2=tt;
%­­5% level 1 sided
jj10=find(abs(tt2)<=tinv(0.95,dof)); tt2(jj10)=NaN.*ones(size(jj10));
subplot(1,2,1)
contour_map(X,Y,tt2',0,(­5:1:5)); hold; shading flat
contour_map(X,Y,squeeze(nino_neu)',0.5);
colormap(rednblue3);caxis([­6 5]); axis([280 330 ­55 10])
%­­5% level 2 sided
jj5=find(abs(tt)<=tinv(0.975,dof)); tt(jj5)=NaN.*ones(size(jj5));
subplot(1,2,2)
contour_map(X,Y,tt',0,(­5:1:5)); hold; shading flat
contour_map(X,Y,squeeze(nino_neu)',0.5);
colormap(rednblue3);caxis([­6 5]); axis([280 330 ­55 10])
Correlaciones

Mapa de correlacion entre anomalias de PP_artigas5102 y TSM en OND.
Como sé qué correlaciones
son significativas?

Para la correlacion de Pearson existe el siguiente test.

H0: r=0

H1: r dif de 0
n−2

T =∣r ∣
 1−r


2

n es la longitud de la serie (considerados independientes).
se compara T con valores criticos de la distribucion t con n­2 grados de libertad.
Regiones de TSM con correlacion significativa
con pp_artigas5102 en OND.
%Codigo Matlab
anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)...
+anom(12:12:end,:,:))/3;
anompOND=(anomp(:,10)+anomp(:,11)+anomp(:,12))/3;
%Calcula correlacion
for i=1:96
for j=1:48
correl(j,i)=corr(anompOND,anomOND(:,j,i));
end
end
%Que correlacion es significativa?
%Test Ho: r=0 (compare to T distribution)
% 2 extremos al 5% de significancia
tt=correl*sqrt(52-2)./sqrt((1-correl.^2));
jj=find(abs(tt)<=tinv(0.975,52-2)); tt(jj)=NaN;
contour_map(lon,lat,tt',0,(-5:0.5:5))
hold
contour_map(lon,lat,correl',0.2)
n−2

T =∣r ∣
1−r 
2
Regresion



Supongamos que quiero saber cual es la relacion entre el estado del Pacifico ecuatorial y la precipitacion en Sudamerica en OND. Tomo Nino3.4 como indice.
Una forma de ver esto es hacer composites, como ya hicimos.
Otra forma es calcular un mapa de regresion: hacer una regresion lineal entre cada punto de grilla de precipitacion y Nino3.4.


Observacion: Es muy útil trabajar con anomalías estandarizadas: z=x/σ.
En la regresion
y = a + bx
las unidades de [b]=(Unidades de y)/(Unidades de x) En este ejemplo: [b]=mm/dia / °C


Si x está estandarizada, no tiene unidades y tiene desviación estandard=1
Así, b se puede interpretar como la anomalía de y asociada (dependiendo del r) a una desviacion estandard de la variable independiente x. Nino3.4
Eventos calidos
[82; 86; 87; 91; 94; 97]
Eventos frios
[84; 88; 95; 98; 99]
Azul: original
Rojo:estandarizado
Los dos indices son tan parecidos pues σ~1 C
Regresion de precipitaciones
con Nino3.4 estandarizado
Una anomalia de 1mm/dia esta asociada
con 1 desviacion estandard de TSM en Nino3.4.
O sea, si Nino3.4 se calienta ~1C, tiende a llover
1 mm/dia mas de lo normal en el norte de Uruguay.
Pero cómo sabemos en qué
regiones es la regresión
estadísticamente significativa?
●
El coeficiente de multiple determinacion R2
S XY
S XY
SSR S XX
R² =
=
SST
S YY
  ²
S XY ²
∑  x i − 
x  y i − y
=
=
=r²
S XX SYY ∑  x i − x
 ² ∑  y i − y
 ²
y representa la habilidad de la recta estimada en representar las variaciones en los datos.
Entonces para saber la significancia estadística calculamos el mapa de correlacion y aplicamos el test n−2
T =∣r ∣
2
1−r 
comparando con la distribucion t.
●


Regresion y significancia estadistica al 5%
%Anomalias de Precipitacion
anompOND=(anomp(10:12:end,:,:)+anomp(11:12:end,:,:)+anomp(12:12
:end,:,:))/3;
%Anomalias de TSM
anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+anom(12:12:end,
:,:))/3;
%Niño3.4
figure
plot((1979:2006),nino34,'linewidth',2)
hold
nino34s=nino34/std(nino34);
%Estandarizo el indice Nino34
plot((1979:2006),nino34s,'r','linewidth',2)
grid; axis tight
%Calculo Correlacion y Regresion
for i=1:144
for j=1:72
p=polyfit(nino34s',anompOND(:,j,i),1); b(j,i)=p(1);
r(j,i)=corr(nino34s',anompOND(:,j,i));
end
end
figure
%Que correlacion es significativa?
%Test Ho: r=0 (compare to T distribution)
tt=r*sqrt(28-2)./sqrt((1-r.^2));
jj=find(abs(tt)<=tinv(0.975,28-2)); tt(jj)=NaN;
contour_map(X,Y,tt',0,(-20:20:20))
shading flat
hold
%Contour regresion
contour_map(X,Y,b',0.5)
axis([2 355 -55 60])
colormap(rednblue3)
caxis([-30 20])
Diferencias entre
composites y regresion



En un composite se toman los extremos y se comparan con los años “neutros”. El composite se puede hacer para extremos positivos y negativos y estos resultados no tienen por que ser opuestos (respuesta no­lineal).
En la regresion solo se considera la relacion lineal entre el predictando (y) y el predictor (x).
El composite de (max­min)/2 da la respuesta lineal y deberia ser similar al mapa de regresion

Documentos relacionados