Regresiones por cuantiles - Gabriel Montes
Transcripción
Regresiones por cuantiles - Gabriel Montes
Cuantiles y regresión por cuantiles Estimadores robustos STATA Regresiones por cuantiles Gabriel V. Montes-Rojas Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Valor esperado y promedio Sea y una variable aleatoria con E (y ) = µy , Var (y ) = σ2 < ∞, con función de distribución Fy , y una muestra aleatoria {yi }N i =1 . La esperanza es la solución a la minimización del valor esperado de las desviaciones al cuadrado, o sea E (y ) = arg minc E (y − c )2 . (¿Por qué?) Entonces usando el principio de analogı́a µ̂y ≡ 1 N N ∑ yi i =1 Gabriel Montes-Rojas N = arg min ∑ (yi − c )2 c i =1 Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Mediana La mediana es un estadı́stico de orden (order statistic) que informa el número ηy donde (al menos) 50% de las observaciones están por encima y 50% (como mucho) por debajo del mismo. En términos formales ηY es cualquier número que satisface P [y ≤ ηy ] ≥ 1/2 y P [y ≥ ηy ] ≤ 1/2. Si Fy es estrictamente creciente, la densidad fy es positiva y contı́nua, entonces ηy = Fy−1 (1/2). La mediana es también la solución a la minimización del valor absoluto de las desviaciones, o sea ηy = arg minc E |y − c |. Prueba: E |y − c | = E (1[y > c ](y − c ) − 1[y < c ](y − c )). Tomando derivadas direccionales, ∂E |y − c |/∂c = −E (1[y > c ]) + E (1[y < c ]) = −P [y > c ] + P [y < c ]. Notemos que en este caso la condición de primer orden es −E (sgn(y − c )) = 0 donde sgn(.) es la función signo sgn(u ) = 1 − 2 · 1[u < 0]. Usando el principio de analogı́a, N η̂y = arg min ∑ |yi − c | c Gabriel Montes-Rojas i =1 Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Estadı́stico de orden Definamos Qτ (y ) = inf {ξ : Fy (ξ ) ≥ τ } como el cuantil/percentil τ ∈ (0, 1) de y . Por ejemplo, ... si queremos separar la población en (10-90), entonces necesitamos el cuantil 10 (primer decil), τ = .1 → Q.1 (y ). ... si queremos separar la población en (25-75), entonces necesitamos el cuantil 25 (primer cuartil), τ = .25 → Q.25 (y ). ... si queremos separar la población en (50-50), entonces necesitamos el cuantil 50 (mediana), τ = .5 → Q.5 (y ). ... si queremos separar la población en (75-25), entonces necesitamos el cuantil 75 (tercer cuartil), τ = .75 → Q.75 (y ). ... si queremos separar la población en (90-10), entonces necesitamos el cuantil 90 (noveno decil), τ = .9 → Q.9 (y ). Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA MCO Consideremos ahora el modelo lineal estructural y = x β + u con E (u |x ) = 0, Var (u |x ) = σ2 < ∞, con función de distribución Fu , y una muestra aleatoria {yi , x i }N i =1 . Ahora tenemos K variables explicativas x . Una generalización del problema univariado es el análisis condicional. La esperanza condicional es la solución al problema de minimización del valor esperado de las desviaciones al cuadrado, o sea E (y |x ) = arg minm(x ) E ((y − m(x ))2 ). Para este caso, si asumimos E (y |x ) = x β, entonces β= ∂E (y |x ) , ∂x esto es, los coeficientes de la regresión son el efecto marginal de un cambio en sobre la esperanza condicional de y . Usando el principio de analogı́a, N β̂ = arg min ∑ (yi − x i b )2 b i =1 Éste es el bien conocido estimador MCO. Gabriel Montes-Rojas Regresiones por cuantiles x Cuantiles y regresión por cuantiles Estimadores robustos STATA Regresión en la mediana La mediana condicional es la solución a la minimización del valor esperado de los valores absolutos de las desviaciones, o sea Q.5 (y |x ) = arg minq (X ) E (|y − q (x )|). Si asumimos q (x ) = x β(.5) tenemos el modelo lineal de mediana condicional. También podemos escribir el modelo como yi = x i β(.5) + ui donde Q.5 (y |x ) = x β(.5) o Q.5 (u |x ) = 0. Entonces ∂Q.5 (y |x ) β(.5) = , ∂x esto es, los coeficientes de la regresión en la mediana son el efecto marginal de un cambio en x sobre la mediana condicional de y . Usando el principio de analogı́a, N β̂(.5) = arg min ∑ |yi − x i b | b i =1 Este es el estimador de regresión en la mediana, least absolute deviation (LAD) estimator. Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Regresiones por cuantiles En forma general, para cualquier cuantil τ ∈ (0, 1) de interés, el cuantil condicional es la solución a Qτ (y |x ) = arg minq (x ) ρτ (y − q (x )), donde ρτ (u ) = u · (τ − 1[u < 0]). La función ρτ (.) (check function) es asimétrica tal que τu si u ≥ 0 ρ τ (u ) = (τ − 1)u si u < 0 Si asumimos q (x ) = x β(.5) tenemos el modelo lineal del cuantil condicional τ. También podemos escribir el modelo para cada cuantil τ como yi = x i β(τ ) + ui donde Qτ (y |x ) = x β(τ ) o Qτ (u |x ) = 0. Tenemos que β(τ ) = ∂Qτ (y |x ) , ∂x esto es, el coeficiente de la regresión del cuantil τ es el efecto marginal de un cambio en x en el cuantil condicional τ de y . Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Regresiones por cuantiles Usando el principio de analogı́a, para τ ∈ (0, 1), N β̂(τ ) = arg min ∑ ρ(yi − x i b ) b i =1 Este es el estimador de regresión por cuantiles, quantile regression (QR) estimator (Koenker and Basset (1978, Econometrica). Si τ = 0.5 tenemos regresión en la mediana. La condición de primer orden es 1 N N ∑ (τ − 1(yi i =1 < x i b )x i ) = N ∑ s (τ, b; yi , x i ) = 0k i =1 donde s (τ, b ; y , x ) = (τ − 1(y < xb )) x es la función score. Notar que ρτ no es diferenciable pero tiene derivada unidireccional. Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Modelos de locación-escala El siguiente modelo se denomina de locación-escala (location-scale) ya que permite cambiar los dos tipos de caracterı́sticas y = x > γ + (x > α)e con e ∼ Fe , e ⊥ ⊥ x. En este modelo, ∂Qτ (y |x ) = β(τ ) = γ + αQτ (e), ∂x donde Qτ (e) es el cuantil τde e. Sin embargo, para la media condicional ∂E (y |x ) = γ (constante ) ∂x En este modelo se puede ver que para tener heterogeneidad en los cuantiles se requiere heteroscedasticidad. Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Máxima verosimilitud MCO se basa en la densidad condicional normal: (y − µ )2 1 exp − f (y ; µ, σ) = √ σ2 2πσ El modelo QR se basa en la densidad de Laplace asimétrica: ρ τ (y − µ ) τ (1 − τ ) exp − f (y ; µ, τ, σ ) = σ σ para dados (τ, σ). La distribució de Laplace simétrica (doble exponencial) es un caso particular para τ=1/2. Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Teorı́a asintótica Los modelos QR son diferentes de los estimadores M porque la función objetivo no es dos veces diferenciable ρτ (.). Escribamos la función objetivo como un estimador M: ρτ (y − x θ) = q (w i , θ) = τ1[yi − x i θ ≥ 0](yi − x i θ) − (1 − τ )1[yi − x i θ < 0](yi − x i θ). El score es s i (θ) = −x i0 {τ1[yi − x i θ ≥ 0] − (1 − τ )1[yi − x i θ < 0]}. Notar que si ui tiene una distribución que es contı́nua en cero, E [s i (θ0 )|x i ] = 0 porque E (1[yi − x i θ0 ≥ 0]|x i ) = P (1[yi − x i θ0 ≥ 0]|x i ) = (1 − τ ) y E (1[yi − x i θ0 < 0]|x i ) = P (1[yi − x i θ0 < 0]|x i ) = τ. En este caso, podemos no tener un cero exacto pero N −1/2 N ∑ s i (θ̂) = op (1) i =1 Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Teorı́a asintótica Asumiendo que Fu (.|x ) es contı́nuamente diferenciable en 0 con densidad fu (.|x ) > 0, E [s i (θ0 )|x i ] = = = = −x i0 {τP [yi − x i θ ≥ 0|x i ] − (1 − τ )P [yi − x i θ < 0|x i ]} −x i0 {τP [ui ≥ x i (θ − θ0 )|x i ] − (1 − τ )P [ui < x i (θ − θ0 )|x i ]} −x i0 {τ (1 − Fu [x i (θ − θ0 )|x i ]) − (1 − τ )Fu [x i (θ − θ0 )|x i ]} −x i0 [τ − Fu (x i (θ − θ0 )|x i )] Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Teorı́a asintótica Además, ∇θ E [s (θ0 )|x ] = fu (x (θ − θ0 )|x )x 0 x so that A0 = E [fu (x (θ − θ0 )|x )x 0 x ]. También, B 0 ≡ E [s (θ0 )s (θ0 )0 ] = τ (1 − τ )E [x 0 x ]. Entonces, √ N (θ̂ − θ0 ) → N (0, A0−1 B 0 A0−1 ). d Si asumimos que u es independiente de x , entonces la varianza asintótica se simplifica a τ (1 − τ ) [E (x 0 x )]−1 (fu (0))2 Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA QR como un estimador robusto Consideremos el modelo unidimensional con cdf F . Consideremos la perturbación en la muestra con probabilidad e en el valor y , y la nueva cdf : Fe = eδy + (1 − e)F . La función de influencia (influence function) para un estadı́stico θ̂ (F ) es IFθ̂ (y , F ) = lim n →0 θ̂ (F ) − θ̂ (Fe ) e Para la media, µ̂(Fe ) = Z ydFe = ey + (1 − e)µ̂(F ) IFµ̂ (y , F ) = y − µ̂(F ) Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA QR como un estimador robusto Para la estimación de un cuantil, η̂τ (Fe ) = Fe−1 (τ ) IFη̂τ (y , F ) = sgn(y − F −1 (τ )) f (F −1 (τ )) Hay una diferencia importante entre las dos funciones de influencia. Para la media una observación extraña (outlier) altera a estimación mucho, mientrs que para el cuantil la influencia es 1/f (F −1 (τ )) que se llama la sparsity a un cuantil particular. Por ejemplo, consideremos las dos muestras {0, 1, 2} y {0, 1, 100000000}. Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA QR como un estimador robusto Para MCO, IFβ̂ ((y , x ), F ) = (x 0 x )−1 x (y − x β̂) Para QR, IFβ̂(τ ) ((y , x ), F ) = Q −1 donde Q = R x sgn(y − x β̂(τ )) x 0 x f (x β(τ,ˆ x ))dG (x ) y G (.) es la cdf Gabriel Montes-Rojas de x . Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Efecto de la capacitación sobre los salarios Consideremos el estudio que se plantea en el trabajo práctico, el efecto de la capacitación sobre los salarios y = dα + xβ + u y: d: x: u: wages training treatment indicator (dummy variable: 1 if received training) other covariates (age, education, marital status, race, etc.) unobservables (ability, predisposition to work) Evaluar este programa corresponde a ver si α > 0. Sin embargo, puede haber gran heterogeneidad en los efectos de la capacitación en la población. En particular, nos interesa comparar el average treatment effect (ATE) con quantile treatment effects (QTE). Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA QR vs. OLS Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA QR en STATA OLS: reg y x1 x2 Regresión en la mediana: qreg y x1 x2, q(50) QR, τ = .1: qreg y x1 x2, q(10) QR, τ = .9: qreg y x1 x2, q(90) Si queremos hacer un gráfico del proceso de cuantiles (τ, β(τ )), τ ∈ (0, 1), consideremos el siguiente ejemplo: gen beta1s=. gen beta1ols=. reg y x1 x2 replace beta1ols= b[x1] gen tau=. forvalues tau = 1(1)100 { qreg y x1 x2, q(‘tau’) replace beta1s= b[x1] in ‘tau’ replace tau=‘tau’ in ‘tau’ } line beta1s beta1ols tau Gabriel Montes-Rojas Regresiones por cuantiles Cuantiles y regresión por cuantiles Estimadores robustos STATA Referencias Estas notas están basadas en Capı́tulo 12 de Wooldridge. Koenker, R. (2005), Quantile Regression. Cambridge: Cambridge University Press. Koenker, R. and Hallock, K. (2001) “Quantile regression,” Journal of Economic Perspectives 15(4), 143–156. Gabriel Montes-Rojas Regresiones por cuantiles