Modelo bimodal-skew-normal α-potencia

Transcripción

Modelo bimodal-skew-normal α-potencia
XXVI Simposio Internacional de Estadística 2016
Sincelejo, Sucre, Colombia, 8 al 12 de Agosto de 2016
Modelo bimodal-skew-normal α-potencia
Guillermo Martínez Flórez1,a , Isaac Manuel Pérez Cuadrado1,b
1 Departamento
de Matemáticas y Estadística, Facultad de Ciencias Básicas, Universidad de Córdoba,
Montería, Colombia
Resumen
Este trabajo considera una generalización de la versión bimodal del modelo Skew-Normal propuesto por Elal-Olivero D. et al. (2009). Esta generalización está basada en la incorporación de un
nuevo termino en el modelo bimodal skew-normal, el cual contiene un parámetro α que torna más
flexible el modelo en términos de asimetría y la curtosis de la distribución. Esta nueva distribución
ajusta datos de tipo unimodal y bimodal con alta asimetría y/o curtosis. Este modelo se presenta
como una alternativa para modelos usados en el estudio de datos asimétricos bimodales como lo son
la mistura de normales. También se estudia la extensión del modelos al caso de datos positivos la cual
es una alternativa más flexible que el modelo log-skew normal bimodal, propuesta por Bolfarine et al.
(2012). Para el modelo propuesto y su extensión a datos positivos, se presenta la inferencia basada en
la estimación de sus parámetros usando el método de máxima verosimilitud, se encuentran el vector
score y las matrices de información observada y esperada. Finalmente realizamos una aplicación a un
conjunto de datos reales, donde se muestra que el modelo propuesto ajusta mejor que los modelos
existentes en la literatura, y por lo tanto es una nueva alternativa al ajuste de datos asimétricos
bimodales. Extensiones al caso de datos censurados y a modelos de regresión también se muestran
como futuras extensiones.
Palabras clave: Distribución bimodal, modelo Skew-Normal, asimetría, curtosis, modelo log-skew
normal bimodal, estimación por máxima verosimilitud, matriz de información..
Abstract
This paper considers a generalization of the bimodal version Skew-Normal model proposed by
Elal-Olivero D. et al. (2009). This generalization is based on the incorporation of a new term inregular skew, bimodal model which contains a parameter that becomes more flexible model in terms
of skewness and kurtosis of the distribution. This new distribution data sets unimodal and bimodal
high skewness and / or kurtosis. This model is presented as an alternative to models used in the
study of bimodal skewed data are mixed wine as normal. Extension models is also studied the case
of positive data which is a more flexible alternative model bimodal log-skew standard, proposed by
Bolfarine et al. (2012). For the proposed model and its extension to positive data, inference based
on the estimation of parameters using the maximum likelihood method is presented, are the vector
and matrix score observed and expected information. Finally we made an application to a real data
set, which shows that the proposed model fits better than those reported in the literature, models
and therefore is a new alternative to setting bimodal skewed data. Extensions to the case of censored
data and regression models are also shown as future extensions.
Key words: Bimodal distribution model Skew -Normal , skewness , kurtosis , skew log- model
standard bimodal , maximum likelihood estimation , information matrix..
a Profesor
titular. E-mail: [email protected]
E-mail: [email protected]
b Estudiante.
1
2
Guillermo Martínez Flórez & Isaac Manuel Pérez Cuadrado
1. Introducción
Un la literatura actual se ha visto un gran incremento de propuestas para el estudio de datos positivos
una de ellas es la de Elal-Olivero et al. (2009) la cual formula una versión para datos bimodales del modelo
skew-normal propuesto por Roberts(1966), O’hagan y Leonard (1976) y estudiado de forma mas amplia
por Azzalini (1985). La función de densidad de probabilidad para este modelo es la siguiente,
2
φ (z) Φ (λz) z, λ ∈ R y γ > 0
f (z) = 2 1+γz
1+γ
Por otro lado, Durran’s (1992) en un contexto hidrológico introduce una extensión del modelo propuesto por Lehmann (1953), conocido en la literatura como el modelo de alternativas de Lehmann. Nos
referimos a las distribuciones resultantes como las de estadísticas de orden fraccional y cuyo modelo es
mas conocido en la literatura como α -potencia, con funcion de densidad de probabilidad
ϕ(z, α) = αf (z) {F (z)}
α−1
z ∈ R, α ∈ R+
donde α ∈ R+ y F es una función de distribución absolutamente continua y diferenciable con función
de densidad ∂F = f . se denota por Z ∼ AP (α). Este modelo fue posteriormente estudiado por Gupta et
al. (2008) y de formas mas profunda por Pewsey et al. (2010).
2. El modelo Bimodal-Skew-Normal
Es modelo genera densidades con asimetrías y curtosis mas pronunciadas que con el modelo skewnormal obtenido a partir de la distribución normal. Su función de distribución esta dada por,
n
√
o
2γ
F (z) = Φ(z) − 2T (z, λ) − 1+γ
zφ(z)Φ(λz) + (1+λλ2 )√2π φ z 1 + λ2
donde T (z, λ) es llamada la función T (ver Owen(1956)).
2.1. Modelo de localización - escala
Para efectos de trabajo de introduce el modelo de localización escala. Si z es una variable aleatoria
que sigue una distribuciónbimodal-skew-normal, entonces la variable
X = ξ + ηZ
es una variable aleatoria con parámetro de localización ξ , parámetro de escala η y parámetro de inclinación λ. Su función de densidad esta dada por,
2
η
2
1+γ ( x−ξ
η )
1+γ
φ x−ξ
Φ λ x−ξ
≡ η2 f x−ξ
η
η
η
2.2. Función generadora de momentos
La función generadora de momentos de Z se puede expresar como,
(
!)
2 2
2
η
t
δ
−
1
γ
MX (t) = MY (t) + 1+γ
η 2 t2 MY (t) + δbηt 2 − δ 2 exp ξt +
2
donde MY (t) = 2Φ (δηt) exp ξt +
η 2 t2
2
yb =
√
2π, δ =
√ λ
1+λ2
XXVI Simposio de Estadística (2016)
3
XXVI Simposio Internacional de Estadística 2016. Guía para autores
2.3. Estimación via máxima verosimilitud
Para este modelo la función de log-verosimilitud queda
` (θ/X) = n {log (2) − log (η)} +
n
P
n
n
P
P
log 1 + γzi2 − nlog (1 + γ) +
logφ (zi ) +
logΦ (λzi )
i=1
2.3.1.
i=1
i=1
Matriz de información esperada
Los elementos de esta matriz corresponden a los valores esperados de los elementos de la matriz de
información observada, siguiendo con la notación utilizada en los caso anteriores tenemos que,
jξξ = n + λ2 (a02 + a11 ) − 2γc01 + 4γ 2 c22 /η 2
jξη = λ2 (a12 + a11 ) + c10 − 2γc11 + 4γ 2 c32 /η 2
jξγ = 2 {c11 − γc32 } /η
jξλ = {a01 − λ (a12 + a21 )} /η
jηη = λ2 (c12 − c21 ) + 4γ 2 c42 − 6γc21 + 3c20 − 2λa11 /η 2
jηγ = 2 {c21 − γc42 } /η
jηλ = {a11 − λ (a22 + a31 )} /η
jλλ = (a22 + λa31 )
jλγ = 0
jγγ = c42 −
n
(1+γ)2
donde ajk = E z j wk y cjk = E z j uk , siendo wi = φ (λzi ) /Φ (λzi ) , y ui = 1/ 1 + γzi2
Esta matriz de información es singular para valores cercanos a cero en el parámetro λ que controla la
asimetría, por tal motivo es necesario hacer una reparametrización.
3. El modelo Bimodal-skew-normal α-potencia
Ahora consideremos la extensión Bimodal-Skew-Normal de la familia de distribuciones γ−potencia,
con función de densidad de probabilidad,
2
φ (z) Φ (λz)
Φ(z) − 2T (z, λ) −
ϕ(z, α) = α 2 1+γz
1+γ
2γ
1+γ
zφ(z)Φ(λz) +
λ √
φ
) 2π
1+λ2
(
√
α−1
z 1 + λ2
con z, λ ∈ R, α ∈ R+ y γ > 0 y T (z, λ) es la misma definida en la subsección 2.
3.1. Modelo de localiación - escala
Si Z ∼ BSN AP (γ, λ, α) , el modelo de localización-escala sigue la transformación X = ξ + ηZ donde
ξ ∈ R y η ∈ R+ . Luego la densidad de X es,
ϕ(X, α, ξ, η) =
α
ηf
α−1
(x, ξ, η, γ, λ) {F (x, ξ, η, γ, λ)}
XXVI Simposio de Estadística (2016)
4
Guillermo Martínez Flórez & Isaac Manuel Pérez Cuadrado
3.2. Estimación via máxima verosimilitud
0
Para una muestra aleatoria X = (X1 , X2 , X3 , ..., Xn ) , con Xi ∼ BSN AP (ξ, η, γ, λ, α), la función de
log-verosimilitud es,
` (θ/X) = nlogα − nlogη +
n
P
log (f (x, ξ, η, γ, λ)) + (α − 1)
i=1
n
P
log (F (x, ξ, η, γ, λ))
i=1
Las expresiones de las funciones score y las matrices de información observada y esperada, requieren un
trabajo minucioso y su calculo al momento de realizar ejercicios de aplicación son largos. La experiencia
nos indica que las matrices de información del la familia de distribuciones α-potencia son no singulares,
para este caso no se tiene excepcion.
4. Conclusiones
Este trabajo presenta un nuevo modelo que es una propuesta para el estudio de datos bimodales
asimetricos positivos, cuya matriz de información es no singular debido a la construcción del modelo.
Sus estimadores de máxima de verosimilitud se pueden calcular mediante el uso de software estadístico
existente.
Referencias
[1] Azzalini, A. (1986). Further results on a class of distributions which includes the normal ones. Scandinavian Journal of Statistics, 46, 199 - 208.
[2] Durrans, S. R. (1992). Distributions of fractional order statistics in hydrology. Water Resources Research, 28, 1649 - 1655.
[3] Elal-Olivero D, Go?mez HW, Quintana FA. Bayesian modeling using a class of bimodal skew-elliptical
distributions. J. Stat. Plann. Infer. 2009; 139, 1484 - 1492.
[4] Gupta, D. and Gupta, R. C. (2008). Analyzing skewed data by power normal model. Test, 17, 197 210.
[5] Olivero, D. E., G?omez, H. W. and Quintana, F.A. (2009). Bayesian modeling using a class of bimodal
skew-elliptical distributions. Journal of Statistical Planning and Inference, 139, 1484?1492.
[6] Pewsey, A. (2000). Problems of inference for Azzalini?s skew-normal distribution. Journal of Applied
Statistics, 27, 859?870.
XXVI Simposio de Estadística (2016)

Documentos relacionados