Modelo bimodal-skew-normal α-potencia
Transcripción
Modelo bimodal-skew-normal α-potencia
XXVI Simposio Internacional de Estadística 2016 Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016 Modelo bimodal-skew-normal α-potencia Guillermo Martínez Flórez1,a , Isaac Manuel Pérez Cuadrado1,b 1 Departamento de Matemáticas y Estadística, Facultad de Ciencias Básicas, Universidad de Córdoba, Montería, Colombia Resumen Este trabajo considera una generalización de la versión bimodal del modelo Skew-Normal propuesto por Elal-Olivero D. et al. (2009). Esta generalización está basada en la incorporación de un nuevo termino en el modelo bimodal skew-normal, el cual contiene un parámetro α que torna más flexible el modelo en términos de asimetría y la curtosis de la distribución. Esta nueva distribución ajusta datos de tipo unimodal y bimodal con alta asimetría y/o curtosis. Este modelo se presenta como una alternativa para modelos usados en el estudio de datos asimétricos bimodales como lo son la mistura de normales. También se estudia la extensión del modelos al caso de datos positivos la cual es una alternativa más flexible que el modelo log-skew normal bimodal, propuesta por Bolfarine et al. (2012). Para el modelo propuesto y su extensión a datos positivos, se presenta la inferencia basada en la estimación de sus parámetros usando el método de máxima verosimilitud, se encuentran el vector score y las matrices de información observada y esperada. Finalmente realizamos una aplicación a un conjunto de datos reales, donde se muestra que el modelo propuesto ajusta mejor que los modelos existentes en la literatura, y por lo tanto es una nueva alternativa al ajuste de datos asimétricos bimodales. Extensiones al caso de datos censurados y a modelos de regresión también se muestran como futuras extensiones. Palabras clave: Distribución bimodal, modelo Skew-Normal, asimetría, curtosis, modelo log-skew normal bimodal, estimación por máxima verosimilitud, matriz de información.. Abstract This paper considers a generalization of the bimodal version Skew-Normal model proposed by Elal-Olivero D. et al. (2009). This generalization is based on the incorporation of a new term inregular skew, bimodal model which contains a parameter that becomes more flexible model in terms of skewness and kurtosis of the distribution. This new distribution data sets unimodal and bimodal high skewness and / or kurtosis. This model is presented as an alternative to models used in the study of bimodal skewed data are mixed wine as normal. Extension models is also studied the case of positive data which is a more flexible alternative model bimodal log-skew standard, proposed by Bolfarine et al. (2012). For the proposed model and its extension to positive data, inference based on the estimation of parameters using the maximum likelihood method is presented, are the vector and matrix score observed and expected information. Finally we made an application to a real data set, which shows that the proposed model fits better than those reported in the literature, models and therefore is a new alternative to setting bimodal skewed data. Extensions to the case of censored data and regression models are also shown as future extensions. Key words: Bimodal distribution model Skew -Normal , skewness , kurtosis , skew log- model standard bimodal , maximum likelihood estimation , information matrix.. a Profesor titular. E-mail: [email protected] E-mail: [email protected] b Estudiante. 1 2 Guillermo Martínez Flórez & Isaac Manuel Pérez Cuadrado 1. Introducción Un la literatura actual se ha visto un gran incremento de propuestas para el estudio de datos positivos una de ellas es la de Elal-Olivero et al. (2009) la cual formula una versión para datos bimodales del modelo skew-normal propuesto por Roberts(1966), O’hagan y Leonard (1976) y estudiado de forma mas amplia por Azzalini (1985). La función de densidad de probabilidad para este modelo es la siguiente, 2 φ (z) Φ (λz) z, λ ∈ R y γ > 0 f (z) = 2 1+γz 1+γ Por otro lado, Durran’s (1992) en un contexto hidrológico introduce una extensión del modelo propuesto por Lehmann (1953), conocido en la literatura como el modelo de alternativas de Lehmann. Nos referimos a las distribuciones resultantes como las de estadísticas de orden fraccional y cuyo modelo es mas conocido en la literatura como α -potencia, con funcion de densidad de probabilidad ϕ(z, α) = αf (z) {F (z)} α−1 z ∈ R, α ∈ R+ donde α ∈ R+ y F es una función de distribución absolutamente continua y diferenciable con función de densidad ∂F = f . se denota por Z ∼ AP (α). Este modelo fue posteriormente estudiado por Gupta et al. (2008) y de formas mas profunda por Pewsey et al. (2010). 2. El modelo Bimodal-Skew-Normal Es modelo genera densidades con asimetrías y curtosis mas pronunciadas que con el modelo skewnormal obtenido a partir de la distribución normal. Su función de distribución esta dada por, n √ o 2γ F (z) = Φ(z) − 2T (z, λ) − 1+γ zφ(z)Φ(λz) + (1+λλ2 )√2π φ z 1 + λ2 donde T (z, λ) es llamada la función T (ver Owen(1956)). 2.1. Modelo de localización - escala Para efectos de trabajo de introduce el modelo de localización escala. Si z es una variable aleatoria que sigue una distribuciónbimodal-skew-normal, entonces la variable X = ξ + ηZ es una variable aleatoria con parámetro de localización ξ , parámetro de escala η y parámetro de inclinación λ. Su función de densidad esta dada por, 2 η 2 1+γ ( x−ξ η ) 1+γ φ x−ξ Φ λ x−ξ ≡ η2 f x−ξ η η η 2.2. Función generadora de momentos La función generadora de momentos de Z se puede expresar como, ( !) 2 2 2 η t δ − 1 γ MX (t) = MY (t) + 1+γ η 2 t2 MY (t) + δbηt 2 − δ 2 exp ξt + 2 donde MY (t) = 2Φ (δηt) exp ξt + η 2 t2 2 yb = √ 2π, δ = √ λ 1+λ2 XXVI Simposio de Estadística (2016) 3 XXVI Simposio Internacional de Estadística 2016. Guía para autores 2.3. Estimación via máxima verosimilitud Para este modelo la función de log-verosimilitud queda ` (θ/X) = n {log (2) − log (η)} + n P n n P P log 1 + γzi2 − nlog (1 + γ) + logφ (zi ) + logΦ (λzi ) i=1 2.3.1. i=1 i=1 Matriz de información esperada Los elementos de esta matriz corresponden a los valores esperados de los elementos de la matriz de información observada, siguiendo con la notación utilizada en los caso anteriores tenemos que, jξξ = n + λ2 (a02 + a11 ) − 2γc01 + 4γ 2 c22 /η 2 jξη = λ2 (a12 + a11 ) + c10 − 2γc11 + 4γ 2 c32 /η 2 jξγ = 2 {c11 − γc32 } /η jξλ = {a01 − λ (a12 + a21 )} /η jηη = λ2 (c12 − c21 ) + 4γ 2 c42 − 6γc21 + 3c20 − 2λa11 /η 2 jηγ = 2 {c21 − γc42 } /η jηλ = {a11 − λ (a22 + a31 )} /η jλλ = (a22 + λa31 ) jλγ = 0 jγγ = c42 − n (1+γ)2 donde ajk = E z j wk y cjk = E z j uk , siendo wi = φ (λzi ) /Φ (λzi ) , y ui = 1/ 1 + γzi2 Esta matriz de información es singular para valores cercanos a cero en el parámetro λ que controla la asimetría, por tal motivo es necesario hacer una reparametrización. 3. El modelo Bimodal-skew-normal α-potencia Ahora consideremos la extensión Bimodal-Skew-Normal de la familia de distribuciones γ−potencia, con función de densidad de probabilidad, 2 φ (z) Φ (λz) Φ(z) − 2T (z, λ) − ϕ(z, α) = α 2 1+γz 1+γ 2γ 1+γ zφ(z)Φ(λz) + λ √ φ ) 2π 1+λ2 ( √ α−1 z 1 + λ2 con z, λ ∈ R, α ∈ R+ y γ > 0 y T (z, λ) es la misma definida en la subsección 2. 3.1. Modelo de localiación - escala Si Z ∼ BSN AP (γ, λ, α) , el modelo de localización-escala sigue la transformación X = ξ + ηZ donde ξ ∈ R y η ∈ R+ . Luego la densidad de X es, ϕ(X, α, ξ, η) = α ηf α−1 (x, ξ, η, γ, λ) {F (x, ξ, η, γ, λ)} XXVI Simposio de Estadística (2016) 4 Guillermo Martínez Flórez & Isaac Manuel Pérez Cuadrado 3.2. Estimación via máxima verosimilitud 0 Para una muestra aleatoria X = (X1 , X2 , X3 , ..., Xn ) , con Xi ∼ BSN AP (ξ, η, γ, λ, α), la función de log-verosimilitud es, ` (θ/X) = nlogα − nlogη + n P log (f (x, ξ, η, γ, λ)) + (α − 1) i=1 n P log (F (x, ξ, η, γ, λ)) i=1 Las expresiones de las funciones score y las matrices de información observada y esperada, requieren un trabajo minucioso y su calculo al momento de realizar ejercicios de aplicación son largos. La experiencia nos indica que las matrices de información del la familia de distribuciones α-potencia son no singulares, para este caso no se tiene excepcion. 4. Conclusiones Este trabajo presenta un nuevo modelo que es una propuesta para el estudio de datos bimodales asimetricos positivos, cuya matriz de información es no singular debido a la construcción del modelo. Sus estimadores de máxima de verosimilitud se pueden calcular mediante el uso de software estadístico existente. Referencias [1] Azzalini, A. (1986). Further results on a class of distributions which includes the normal ones. Scandinavian Journal of Statistics, 46, 199 - 208. [2] Durrans, S. R. (1992). Distributions of fractional order statistics in hydrology. Water Resources Research, 28, 1649 - 1655. [3] Elal-Olivero D, Go?mez HW, Quintana FA. Bayesian modeling using a class of bimodal skew-elliptical distributions. J. Stat. Plann. Infer. 2009; 139, 1484 - 1492. [4] Gupta, D. and Gupta, R. C. (2008). Analyzing skewed data by power normal model. Test, 17, 197 210. [5] Olivero, D. E., G?omez, H. W. and Quintana, F.A. (2009). Bayesian modeling using a class of bimodal skew-elliptical distributions. Journal of Statistical Planning and Inference, 139, 1484?1492. [6] Pewsey, A. (2000). Problems of inference for Azzalini?s skew-normal distribution. Journal of Applied Statistics, 27, 859?870. XXVI Simposio de Estadística (2016)