IBM SPSS Complex Samples

Transcripción

IBM Software
Business Analytics
IBM SPSS Complex Samples 22
IBM SPSS
Complex Samples
Realice Estadísticos de Muestras Complejas Correctamente
Realice muestreos con un paquete estadístico especialmente diseñado para
producir estimaciones correctas de muestras complejas de sus datos. IBM
SPSS Complex Samples le permite computar estadísticos y los errores
estándar de los diseños muestrales complejos. Usted puede utilizar IBM
SPSS Complex Samples en:
• Investigación mediante encuestas - Obtenga estadísticos descriptivos e
inferenciales para datos de encuestas
• Investigación de mercados – Analice datos de satisfacción de clientes
• Investigación clínica - Analice grandes bases datos públicas sobre
cuestiones de salud como nutrición, alcoholismo y accidentes de tráfico
•
Ciencias sociales – Realice investigaciones secundarias sobre bases de
Características
datos de opinión pública
• Incremente la precisión de su • Investigación de la opinión pública - Caracterice las actitudes ante
cuestiones políticas
muestra o asegure muestras
representativas con muestreo
IBM SPSS Complex Samples le ofrece todo lo que necesita para trabajar
estratificado
con muestras complejas, e incluye:
• Seleccione grupos de
unidades de muestras con el
muestreo conglomerado
• Un Asistente de Muestreo intuitivo que le va guiando paso a paso en el
proceso de diseño y elección de la muestra
• Un Asistente de Preparación para el Análisis que le ayuda a preparar
conjuntos de datos ya muestreados para uso público como la Encuesta de
• Seleccione la muestra inicial,
Presupuestos Familiares, Encuestas Sociodemográficas, etc
después cree una estación de
• Predecir una variable de respuesta numérica a través del modelo lineal
muestra con el muestreo
general de muestras complejas (CSLGM)
polietápico
• Predecir una variable de respuesta ordinal a través de la regresión ordinal
de muestras complejas (CSORDINAL)
• Predecir una variable de respuesta categórica mediante regresión
logística de muestras complejas (CSLOGISTIC)
• Predecir el tiempo de un evento a través de regresión de Cox de muestras
complejas (CSCOXREG)
IBM Software
Business Analytics
Desde la etapa de planeación y muestreo en el
proceso de análisis, IBM SPSS Complex Samples
hace más sencillo obtener resultados precisos y
confiables. Como IBM SPSS Complex Samples
considera hasta tres etapas al momento de analizar
datos de un diseño polietápico, usted obtiene
resultados más precisos. Además, de darle la
oportunidad de evaluar el impacto de sus diseños,
IBM SPSS Complex Samples también le
proporciona una imagen más precisa de sus datos
porque la evaluación de las subpoblaciones
considera otras subpoblaciones.
Usted podrá utilizar los siguientes tipos de diseños
muestrales:
• Muestreo Estratificado – Incremente la precisión de
la muestra y asegúrese de la representación en la
muestra de los grupos clave, eligiendo la muestra
dentro de los subgrupos de la población objetivo.
Por ejemplo, los subgrupos pueden ser un número
determinado de hombres o mujeres o contener
personas de diferentes categorías laborales, de
diferentes grupos de edad, etc.
• Muestreo por Conglomerados – Seleccione los
conglomerados que son grupos de unidades
muestrales para su encuesta. Los conglomerados
pueden incluir escuelas, hospitales o áreas
geográficas cuyas unidades muestrales pueden ser
estudiantes, pacientes o los mismos ciudadanos. La
agrupación favorece que el proceso de análisis de
encuestas resulte más eficaz en términos de costovariabilidad
• Muestreo Polietápico – Seleccione una muestra
inicial basada en conglomerados de elementos en la
población: cree entonces una segunda etapa con
una submuestra en cada unidad seleccionada en la
muestra de la primera etapa. Repitiendo esta opción
podrá obtener diseños polietápico
Obtenga resultados más confiables
Como investigador, usted desea confiar en sus
resultados. Los paquetes estadísticos más
convencionales asumen que sus datos se obtienen de
un muestreo aleatorio simple. Esta clase de
muestreo, sin embargo, no es viable ni efectivo en
términos de costo para encuestas a gran escala.
Analizar los datos de esas muestras con métodos
tradicionales nos puede llevar a obtener resultados
incorrectos. Por ejemplo, la estimación del error
estándar de estadísticos es usualmente pequeña, lo
que le da un falso sentido de precisión. IBM SPSS
Complex Samples le permite realizar inferencias
válidas para poblaciones de muestras complejas
porque incorpora el diseño de la muestra en el
análisis de la encuesta.
Trabaje fácil y eficientemente
Sólo IBM SPSS Complex Samples le facilita el
trabajo con muestras complejas y la comprensión de
los resultados. A través de su intuitiva interfaz podrá
analizar datos e interpretar resultados. Cuando
termine podrá publicar sus bases de datos e incluir su
muestra o el plan de análisis.
Cada plan actúa como plantilla y le permite guardar
todas las decisiones tomadas al momento de elaborar
el plan. Esto le ahorra tiempo y mejora la precisión
de sus planes con los datos, ya sea para replicar
resultados o para continuar con el proyecto en donde
usted lo dejó.
IBM Software
Business Analytics
Figura 2. Un análisis preciso de los datos de encuestas es
sencillo en IBM SPSS Complex Samples. Inicie con uno de
los asistentes (su selcción depende de la fuente de sus
datos) y utilice la interfaz interactiva para crear planos,
analizar datos y interpretar resultados.
Para comenzar a trabajar con IBM SPSS Complex
Samples, puede utilizar los asistentes, que le
presentarán los factores que debe considerar antes de
planificar su análisis. Si está creando sus propias
muestras, utilice entonces el Asistente de Muestreo
para definir el plan de muestreo. Si utiliza conjuntos
de datos de uso público ya muestreados, entonces
utilice el Asistente para la Preparación del Análisis,
para especificar cómo se definieron las muestras y
cómo estimar los errores estándar. Una vez creada la
muestra o especificados los errores estándar, podrá
crear planes, analizar sus datos y producir los
resultados.
Figura 1. Una tienda de autoservicio desea determinar si
la frecuencia con la cual los clientes compran está
relacionada con la cantidad gastada, controlándola por el
género de los clientes e incorporando un diseño de
muestra. Primero, la tienda especifica el diseño de la
muestra utilizado en el Asistente de Preparación (arriba).
Después, la tienda establece el modelo con el botón de
Modelo General Linearizado de Muestras Complejas.
IBM Software
Business Analytics
IBM SPSS Complex Samples le facilita trabajar y
aprender con rapidez. Utilice el sistema de ayuda en
línea, explore los estudios de casos interactivos o
ejecute el tutorial en línea para aprender más sobre
cómo utilizar mejor sus datos y aprovechar el trabajo
con el software. Complex Samples le permite:
• Lograr estimaciones puntuales correctas para
estadísticos como totales, medias y ratios
• Obtener los errores estándar de esos estadísticos
• Generar intervalos de confianza y contrastes de
hipótesis
• Predecir resultados numéricos
• Predecir resultados ordinales
• Predecir resultados categóricos
• Predecir el tiempo para un evento
Obtenga un valor adicional con colaboración
Compartir y re-utilizar sus activos eficientemente,
protegerlos de forma tal que se cumplan
requerimientos internos y externos, y publicar
resultados para que varios usuarios pueden
visualizarlos e interactuar con ellos es posible con
IBM SPSS Collaboration and Deployment Services.
Características
Plan de muestras complejas (CSPLAN)
Proporciona un entorno común para especificar el
marco de muestreo para crear un diseño muestral
complejo o una especificación del análisis utilizando
los procedimientos de PASW Complex Samples.
CSPLAN no extrae las muestras ni analiza los datos.
Para extraer la muestra utilice un diseño muestra
creado por CSPLAN como input en el procedimiento
CSSELECT (descrito abajo). Para analizar los datos
muestrales, emplee el diseño creado por CSPLAN
como input de CSDESCRIPTIVES,
CSTABULATE, CSGLM, CSLOGISTIC o
CSORDINAL (descritos más adelante)
• Cree un diseño muestral simple: utilizado para
extraer unidades de muestreo desde el archivo
activo
• Cree un diseño de análisis: utilizado para analizar
muestras complejas
• Cuando crea un diseño muestral, el procedimiento
guarda automáticamente el diseño del análisis en el
archivo del plan. Se crea un archivo para diseñar la
muestra que podrá ser utilizado tanto para la
selección muestral como para el análisis
• Muestra el diseño muestral o el diseño de análisis
• Especifica el plan en un archivo de datos externo
• Permite nombrar las variables que serán creadas
cuando extraiga una muestra o la utilice como input
para el proceso de selección o estimación con el
subcomando PLANVARS
- Especifique las ponderaciones muestrales para
cada unidad que será utilizada en los procedimientos
de análisis de PASW Complex Samples en el
proceso de estimación
- Indique las ponderaciones muestrales globales que
serán generadas cuando el diseño muestral sea
ejecutado en el procedimiento CSSELECT
- Seleccione las ponderaciones que deben de ser
utilizadas cuando se computen las ponderaciones del
muestreo en un diseño polietápico
• Controle los resultados desde el procedimiento
CSPLAN con el subcomando PRINT
- Muestra un resumen de las especificaciones de
cada una de las etapas del usuario
- Muestra una tabla con las especificaciones
MATRIX
• Etapas del diseño con el subcomando DESIGN.
También podrá utilizar este subcomando para
definir las variables de estratificación, las variables
de conglomeración y crear etiquetas descriptivas
para etapas particulares
IBM Software
Business Analytics
• Especifique el método de extracción muestral
mediante el subcomando METHOD. Seleccione
entre una variedad de métodos de probabilidades
iguales y desiguales, incluyendo el muestreo
aleatorio simple y sistemático. También puede
optar por métodos de muestreo con probabilidades
proporcionales al tamaño (PPS). Las unidades
pueden ser extraídas con reemplazo (WR) o sin
reemplazo (WOR) desde la población muestral
- SIMPLE_WOR: Selecciona unidades con idéntica
probabilidad. Extracción de unidades sin reemplazo
- SEMPLE_WR: Selecciona unidades con idéntica
probabilidad. Extracción de unidades con reemplazo
- SIMPLE_SYSTEMATIC: Selecciona las unidades
con un intervalo fijo a lo largo de todo el marco
muestral o estrato. Se elige aleatoriamente el punto
de inicio dentro del primer intervalo
- SIMPLE_CHROMY: Selecciona unidades de
forma secuencial con idéntica probabilidad.
Extracción de unidades sin reemplazo
- PPS_WOR: Selecciona unidades con probabilidad
al tamaño. Extracción de unidades sin reemplazo
- PPS_WR: Selecciona unidades con probabilidad
proporcional al tamaño. Extracción de unidades con
reemplazo
- PPS_SYSTEMATIC: Selecciona unidades
mediante muestreo aleatorio sistemático con
probabilidad proporcional al tamaño. Extracción de
unidades sin reemplazo
- PSS_CRHOMY: Selecciona unidades de forma
secuencial con probabilidad proporcional al tamaño.
- PPS_BREWER: Selecciona dos unidades desde
cada estrato con probabilidad proporcional al
tamaño. Extracción de unidades sin reemplazo
- PPS_ MURTHY: Selecciona dos unidades desde
cada estrato con probabilidad proporcional al
tamaño. Extracción de unidades sin reemplazo
- PPS_ SAMPFORD: Extiende el método Brewer a
la selección de más de dos unidades desde cada
estrato con probabilidad proporcional al tamaño.
- Control del número o porcentaje de unidades que
son extraídas en cada etapa del diseño muestral.
Puede elegir también variables del output como
ponderaciones muestrales creadas durante el proceso
del creación del diseño muestral
- Métodos de estimación: Con reemplazo, sin
reemplazo pero con probabilidad idéntica en la
primera etapa y con distinta probabilidad y sin
reemplazo
- Puede elegir si incluir la corrección de población
finita al estimar la varianza en el muestreo simple
aleatorio (SRS)
- Estimación sin reemplazo con distinta probabilidad:
requisito sólo para la primera etapa
- Especifica las variables para el proceso de
estimación, incluyendo las ponderaciones de la
muestra y las probabilidades de inclusión
• Especifique el número de unidades muestrales
extraídas en la etapa actual con el subcomando
SIZE
• Especifique el porcentaje de unidades extraídas en
la etapa actual, por ejemplo, la fracción de
muestreo, utilizando el subcomando RATE
• Especifique el número mínimo de unidades
extraídas cuando especifica RATE. Esto se utiliza
cuando el rango de muestreo para un estrato
particular es muy pequeño debido al redondeo
• Especifique el número máximo de unidades
extraídas cuando el rango de muestreo para un
estrato particular es muy grande debido al redondeo
• Especifique la medida del tamaño de las unidades
poblacionales en un diseño PPS. Especifica una
variable que contiene los tamaños o requiere que se
determinen cuando el procedimiento CSSELECT
escanea el marco de la muestra
• Obtenga las variables de información de las etapas
al ejecutar un diseño muestral mediante el
subcomando STAGEVARS. Podrá obtener:
- La proporción de unidades extraídas en una
determinada etapa empleando probabilidades de
inclusión por cada etapa
- Las etapas previas cuando se utilizan proporciones
acumuladas del muestreo para una etapa determinada
- Identificación única de las unidades seleccionadas
más de una vez cuando el muestreo se realiza con
reemplazo, con un índice de duplicación para las
unidades seleccionadas en una determinada etapa
- Tamaño poblacional para una etapa determinada
- Número de unidades extraídas en una etapa
determinada
- Razón de muestreo por etapas
- Ponderaciones de muestreo para una etapa
determinada
• Elija un método de estimación para el subcomando
ESTIMATOR. Podrá indicar:
-Probabilidades iguales de selección sin reemplazo
-Probabilidades desiguales de selección sin
reemplazo
-Selección con reemplazo
• Especifica el tamaño de la población para cada
elemento de la muestra con el subcomando
POPSIZE
• Especifica la proporción de unidades extraídas de la
población en una determinada etapa con el
subcomando INCLPROB
IBM Software
Business Analytics
• Especifique el nombre del archivo del plan creado
mediante el procedimiento de CSPLAN, que
contiene las especificaciones del diseño del
análisis, con el subcomando PLAN
• Especifique los nombres de los archivos de las
probabilidades conjuntas de inclusión
• Especifique las variables de análisis utilizadas por
los subcomandos MEAN y SIM mediante el
subcomando SUMMARY
• Solicite el cálculo de las medias para las variables
especificadas en el subcomando SUMMARY
mediante los subcomandos MEAN y SUM
- Solicite la prueba t de medias y el valor de la
hipótesis nula a través de TTEST. Si define las
subpoblaciones con el subcomando SUBPOP,
entonces los valores de la hipótesis nula son
utilizados en las pruebas para cada una de las
subpoblaciones así como para la población total
• Solicite la estimación de razones para las variables
especificadas en el subcomando SUMMARY
mediante el subcomando RATIO
- Solicite la prueba t de ratios y asigne valor a la
hipótesis nula a través de TTEST
• Asocie la sintaxis con las estimaciones de medias,
sumas o ratios, incluyendo:
- El número de observaciones válidas en el conjunto
de datos para cada una de las estimaciones de la
media, suma o razón
- El tamaño poblacional para cada media, suma o
razón estimada
- El error estándar para cada media, suma o ratio
estimado
- Coeficiente de variación
- Efectos de diseño
- Raíz cuadrada de los efectos de diseño
- Intervalo de confianza
• Especifica las subpoblaciones para las que se llevan
a cabo análisis mediante el subcomando SUBPOP
- Muestra los resultados para todas las
Descriptivos de muestras complejas
subpoblaciones en la misma tabla o en tablas
(CSDESCRIPTIVES)
separadas
CSDESCRIPTIVES calcula medias, sumas y ratios, • Especifique el tratamiento de los valores perdidos
y calcula sus errores estándar, los efectos del diseño, - Base cada uno de los estadísticos en todos los datos
intervalos de confianza y contrastes de hipótesis para
válidos para las variables de análisis utilizadas en el
muestras extraídas mediante métodos complejos de
cálculo del estadístico. Calcule las razones
muestreo. El procedimiento estima las varianzas
utilizando todos los casos con datos válidos para las
teniendo en cuenta el diseño muestral utilizado en la
variables especificadas. Puede basar los estadísticos
selección de la muestra, incluyendo probabilidades
para las diferentes variables en los diferentes
iguales y métodos de muestreo como PPS, WR y
tamaños muestrales
WOR. Opcionalmente, CSDESCRIPTIVES le
- Base únicamente los casos con datos válidos para
servirá para analizar subpoblaciones
todas las variables del análisis cuando calcule los
estadísticos. Los estadísticos siempre se basan en el
mismo tamaño muestral
Procedimiento de selección de muestras complejas
(CSSELECT)
CSSELECT selecciona muestras complejas basadas
en criterios probabilísticas a partir de una población;
elige unidades de acuerdo a un diseño de muestreo
creado mediante el procedimiento CSPLAN
• Controla el alcance de la ejecución y especifica la
semilla con el subcomando CRITERIA
• Controla si los valores perdidos de las variables de
clasificación (estratificación y conglomerados) son
tratados como valores válidos con el subcomando
CLASSMISSING
• Utiliza la versión actualizada del generador
números aleatorios Mersenne Twister
• Especifica las opciones generales concernientes a
los archivos de resultados y de entradas con
subcomando DATA
- Opción para renombrar las variables existentes
cuando el procedimiento CSSELECT escribe
ponderaciones y la presentación de las variables de
los resultados de las etapas requeridas en el archivo
del plan. Tales como probabilidades de inclusión
• Escribe un archivo externo con las unidades
muestrales mediante la opción de variables
keep/drop
• Almacena automáticamente las probabilidades
conjuntas de inclusión de primera etapa a un
archivo externo cuando el archivo de plan
especifica un método muestral PPS_WR
• Genera opcionalmente archivos de texto que
contengan las reglas que describen las
características de las unidades seleccionadas
• Controle el resultado a través del subcomando
PRINT
- Resumen de la distribución de los casos
seleccionados en los estratos. La información se
desglosa por etapa muestral
- Produce un resumen del proceso por casos
IBM Software
Business Analytics
- Tamaños poblacionales esperados estimados: utilice
los tamaños poblacionales estimados bajo el
supuesto de independencia estadística entre las
variables de la tabla. Esta funcionalidad está
disponible únicamente para tablas de doble entrada
- Residuos: muestra la diferencia ente los tamaños
esperados en cada una de las celdas. Esta
funcionalidad está disponible únicamente para
Tabulación de muestras complejas (CSTABULATE)
tablas de doble entrada
CSTABULATE muestra las tablas de una o dos
entradas y los errores estándar asociados, los efectos - Residuos de Pearson: esta capacidad está
del diseño, los intervalos de confianza y las pruebas
- Residuos de Pearson ajustados: esta capacidad está
de hipótesis, para muestras extraídas mediante
métodos de muestreo complejo. El procedimiento
estima las varianzas teniendo en cuenta el diseño
• Estadísticos y pruebas para la tabla de entrada:
muestral utilizado para seleccionar la muestra,
- Prueba de homogeneidad de proporciones
incluyendo los métodos de probabilidades iguales y
- Prueba de independencia
PPS y los procedimientos de muestreo con y sin
- Cociente de ventajas (odds ratio)
reemplazo. Opcionalmente, CSTABULATE crea
- Riesgo relativo
tablas para subpoblaciones
- Diferencia de riesgo
• Especifique el nombre de un archivo XML
• Especifique las subpoblaciones para las cuales los
mediante el procedimiento CSPLAN con el diseño
análisis se llevan a cabo mediante el subcomando
del análisis mediante el subcomando PLAN
SUBPOP
• Especifique el archivo donde se guardan las
- Muestra los resultados para todas las
probabilidades conjuntas de selección
subpoblaciones en la misma tabla o en tablas
• Utilice los siguientes estadísticos en una tabla:
separadas
- Tamaño de la población: calcula el tamaño de la
• Especifica el tratamiento de los valores perdidos
población para cada celda y marginales de tabla
- Base cada tabla en los datos válidos para las
- Error estándar: Cálculo del error estándar para cada
variables de la tabulación empleadas. Puede basar
tamaño poblacional estimado
las tablas para las diferentes variables en diferentes
Porcentajes de fila y columna: expresa la estimación
tamaños muestrales
del tamaño poblacional para cada celda en una fila
- Emplee únicamente los casos con datos válidos
o columna como porcentaje del tamaño poblacional
para todas las variables de la tabulación durante el
estimado para cada fila o columna.
proceso de creación de la tabla. Utilice las tablas
• Esta funcionalidad está disponible para tablas de
para diferentes variables, siempre para el mismo
doble entrada:
tamaño muestral
- Porcentajes de tabla: Expresa el tamaño aproximado - Excluya los valores perdidos entre los estratos, el
de la población para cada celda de la tabla como
conglomerado y las variables subpoblacionales –
porcentaje del tamaño aproximado de la población
por defecto
en esa tabla
- Incluya los valores perdidos entre los estratos, el
- Coeficiente de variación
conglomerado y las variables subpoblacionales
- Raíz cuadrada de los efectos del diseño
Trate los valores perdidos para esas variables como
- Intervalo de confianza: especifica cualquier número
datos válidos
entre 0 y 100 como intervalo de confianza
- Recuentos no ponderados: utilice recuentos no
ponderados como número de observaciones válidas
en el conjunto de datos para cada tamaño
poblacional estimado
- Tamaño poblacional acumulado estimado: utilice el
tamaño poblacional acumulado para tablas
univariantes
- Porcentajes acumulados: utilice los porcentajes
acumulados que corresponden al tamaño
poblacional estimado para tablas univariantes
- Excluya los valores perdidos entre los estratos,
conglomerados y las variables subpoblacionales
- Inclusión de los valores perdidos entre los estratos,
conglomerados y variables subpoblacionales. Los
valores perdidos para esas variables pueden ser
tratados como datos válidos
IBM Software
Business Analytics
Modelos lineales generales de muestras complejas
(CSGLM)
Este procedimiento le permite construir modelos de
regresión lineal, modelos de análisis de la varianza
(ANOVA) y de análisis de la covarianza (ANOVA)
para muestras extraídas mediante métodos complejos
de muestreo. Las varianzas estimadas por el
procedimiento tienen en cuenta el diseño muestral
utilizado para seleccionar la muestra, incluyendo
probabilidades iguales, los métodos PPS y los
procedimientos de muestreo con y sin reemplazo,
WR y WOR. Opcionalmente CSGLM puede realizar
análisis para subpoblaciones:
• Modelos:
- Efectos principales
- Interacciones de orden n
- Modelo saturado
- Personalizables, incluyendo términos anidados
• Estadísticos:
- Parámetros del modelo: estimaciones, errores
estándar, intervalos de confianza, efecto de diseño
y raíz cuadrada de efecto de diseño para cada uno
de los coeficientes estimados
- Medias poblacionales de las variables dependientes
y covariables
- Ajuste del modelo
- Información del diseño muestral
• Pruebas de hipótesis
- Estadísticos de prueba: Wald F, Wald F ajustado,
Wald Chi cuadrado y Wald Chi cuadrado ajustado
- Ajustes para comparaciones múltiples: diferencia
mínima significativa, Bonferroni, Bonferroni
secuencial, Sidak y Sidak secuencial
- Grados de libertad de la muestra: se basa en el
diseño muestral o determinados por el usuario
• Medias estimadas: medias marginales estimadas
para los factores e interacciones del modelo
- Contrastes: simple, desviaciones, Herlmert,
repetidas o polinomiales
• Las variables del modelo pueden ser guardadas en
el archivo activo y ser exportadas a archivos
externos que contienen parámetros matriciales
- Variables: valores predichos y valores residuales
- Matriz de covarianza de los parámetros y los otros
estadísticos (que podrán ser exportados como
archivos de SPSS)
- Parámetros estimados y/o matriz de covarianzas
pueden ser exportados a un archivo XML
• Resultados:
- Información del diseño muestral (estrato y PSU)
- Coeficientes de regresión estimados y pruebas t
- Resúmenes sobre la variable dependiente,
covarianzas y factores
- Resúmenes sobre la muestra, incluyendo las
frecuencias no ponderadas y el tamaño poblacional
- Límites de confianza para los parámetros estimados
con niveles de confianza especificados por el
usuario
- Prueba Wald F para los efectos del modelo
- Efecto de diseño
- R2 múltiple
- Conjunto de matrices de coeficientes de contraste
(L)
- Matriz de varianzas y covarianzas estimadas de los
coeficientes de la regresión
- Error cuadrático medio
- Matrices de covarianzas y correlaciones para los
coeficientes de regresión
• Tratamiento de los valores perdidos
- Supresión según lista de valores perdidos
• Otros
- Denominador de grados de libertad, utilización en
el cálculo de p valores especificados por el usuario
- Diagnósticos de colinealidad
- El modelo puede ser ajustado por subpoblaciones
Muestras complejas ordinales (CSORDINAL)
CSORDINAL ejecuta análisis de regresión en una
variable dependiente binaria u ordinal utilizando la
función del enlace acumulativo para muestreos
obtenidos por métodos de muestras complejas. El
procedimiento estima las varianzas teniendo en
cuenta el diseño de muestreo utilizado para
seleccionar la muestra, incluyendo métodos de
probabilidades iguales y PPS, como procedimientos
de muestreo WR y WOR. De modo opcional,
CSORDINAL ejecuta análisis para una subpoblación
• Modelos
- Modelo saturado
- Personalizadas, incluyendo términos anidados
Estadísticos
- Parámetros del modelo: estimaciones de los
coeficientes, estimación de los términos
exponenciales, errores estándar de las estimaciones,
pruebas t para los coeficientes, intervalos de
confianza, efectos de diseño y raíz cuadrada de los
efectos de diseño muestral para cada coeficiente
estimado, covarianzas de los parámetros estimados
y correlaciones de los parámetros estimados
- Ajuste del modelo: pseudos R2 y tabla de
clasificación
- Prueba de líneas paralelas: prueba de Wald,
parámetros estimados para modelos generalizados,
y covarianzas de los parámetros para los modelos
generalizados
- Resumen de los estadísticos para las variables del
modelo
IBM Software
Business Analytics
• Prueba de hipótesis
- Prueba de estadísticos: Wald F, Wald F cuadrado
ajustado, Chi cuadrado de Wald
- Ajustes para comparaciones múltiples: diferencia
- Grados de libertad del muestreo: se basa en el
diseño muestral o ajustado por el usuario
• Las variables del modelo pueden ser exportadas en
el archivo activo o ser exportadas a archivos
externos que contienen matrices de parámetros
- Variables: predice categorías, probabilidades de las
categorías predichas, probabilidades de las
categorías observadas, probabilidades acumuladas
(una variable por categoría), probabilidades
predichas (una variable por categoría)
- Las matrices de covarianzas/correlaciones de los
parámetros y demás estadísticos pueden ser
exportadas como archivos SPSS
- Los parámetros estimados y/o las matrices de
covarianzas pueden ser exportados a un archivo
XML
• Tres métodos de estimación: Newton-Raphson,
Fisher Scoring y Fisher Scoring seguido por
Newton-Raphson
• Función de enlace acumulativo para especificar el
modelo: Cauchit, log-log complementario, log-log
negativo y probit
• Ratios de probabilidad acumuladas para el factor o
factores o covarianza especificadas. El subcomando
se encuentra disponible sólo para enlace LOGIT
• Resultados:
usuario
- Estadísticos de resumen del modelo
- Prueba Wald F, Wald F ajustado, Wald Chicuadrado y Wald ajustado para los efectos del
modelo
- Efectos de diseño
- Tablas de clasificación
(L)
- Matriz de varianzas y covarianzas estimadas de los
- Tabla de función general estimable
- Matrices de correlaciones para los coeficientes de
regresión
• Tratamiento de los datos perdidos
- Supresión de la lista de valores perdidos
• Otros
- Denominador especificado por el usuario, df,
utilización en p valores informáticos
Regresión logística de muestras complejas
(CSLOGISTIC)
Este procedimiento realiza análisis de regresión
logística binaria, así como regresión logística
multinomial (MLR), para muestras procedentes de
muestreos complejos. El procedimiento estima las
varianzas considerando el diseño muestral utilizado
para seleccionar la muestra, incluye probabilidades
iguales y métodos de muestreo PPS, con y sin
reemplazo. Opcionalmente, CSLOGISTIC lleva a
cabo análisis para subpoblaciones:
• Modelos
- Modelo saturado
• Estadísticos
-Parámetros del modelo: estimaciones de los
efectos del diseño muestral para cada coeficiente
estimado, covarianzas de los parámetros estimados
y correlaciones de los parámetros estimados
- Ajuste del modelo: R2 y tabla de clasificación
- Resumen de los estadísticos para las variables del
modelo
- Prueba de estadísticos: Wald F, Wald F ajustado,
Wald Chi cuadrado y Wald Chi cuadrado ajustado
• Ajustes para comparaciones múltiples: diferencia
• Grados de libertad del muestreo: se basa en el
diseño muestral o ajustados por el usuario
el archivo activo y ser exportadas a archivos
externos que contienen matrices de parámetros
- Variables: predice categorías y probabilidades
- Las matrices de covarianza/correlaciones de los
parámetros y demás estadísticos pueden ser
exportadas como archivos de SPSS
- Los parámetros estimados y/o las matrices de
covarianza pueden ser exportados a un archivo
XML
IBM Software
Business Analytics
• Predictores:
- Factores
- Covarianzas
- Predictores dependientes del tiempo
• Subgrupos: análisis estratificado y/o limitado a una
subpoblación en particular
• Modelos
• Estadísticos
- Diseño de muestras
- Resumen de eventos y de censura
- Parámetros del modelo: estimaciones de los
efectos de diseño muestral para cada coeficiente
estimado, covarianza de los parámetros estimados y
correlaciones de los parámetros estimados
- Supuestos del modelo
- Prueba proporcional de riesgo
- Estimación de parámetros para modelos
alternativos
- Matriz de covarianza para modelos alternativos
- Base de supervivencia y funciones de riesgo
cumulativo
• Gráficos
Regresión de Cox de muestras complejas
- Función de supervivencia
(CSCOXREG)
- Función de supervivencia log-menos-log
Este procedimiento aplica la regresión de Cox para
- Función de supervivencia uno menos
análisis de supervivencia – esto es, la cantidad de
- Opción para desplegar intervalos de confianza
tiempo antes de que ocurra un evento para una
- Los factores de los gráficos y las covarianzas en
muestra obtenida con métodos de muestreo
niveles específicos
complejo. CSCOXREG soporta predictores
categóricos y continuos, los cuales pueden ser
- Estadísticos de prueba: prueba F, prueba F ajustada,
dependientes del tiempo. CSCOXREG le
Chi cuadrada, Chi cuadrada ajustada
proporciona una manera fácil de localizar diferencias - Ajuste para comparaciones múltiples: diferencia
en subgrupos, así como también analizar los efectos
significativa mínima, Bonferroni, Bonferroni
de un grupo de predictores. También, este
procedimiento maneja datos en los cuales hay
- Grados de libertad del muestreo: se basa en el
múltiples casos (como por ejemplo, visitas a
diseño muestral o ajustados por el usuario
pacientes y observaciones para un solo sujeto)
• Tiempo y evento: especifica variables de
el archivo y ser exportadas a archivos externos que
supervivencia y valores que indican que el evento
contienen matrices de parámetros
ha ocurrido
- Tiempo de supervivencia
- Inicio de intervalo
- Tiempo 0
- Varía según el objeto
- Fin del intervalo
- Evento como valores individuales o como rango de
valores
Resultado:
usuario
- Estadísticos de resumen el modelo
- Pruebas Wald F para los efectos del modelo
- Efecto de diseño
- Tablas de clasificación
(L)
-Matriz de varianzas y covarianzas estimadas de los
- Error cuadrático medio
- Matrices de covarianzas y correlaciones para los
coeficientes de regresión
- Tratamiento de los valores perdidos
- Supresión de la lista de valores perdidos
- Manejo de datos perdidos
• Otros:
- Denominador especificado por el usuario, df,
utilización en p valores informáticos
IBM Software
Business Analytics
- Variables: función de supervivencia, límite inferior
y superior de intervalo de confianza para la función
de supervivencia, función de riesgo cumulativo,
límite inferior y superior de intervalo de confianza
para la función de riesgo cumulativo, valor
predicho de un predictor lineal, residuo Schoenfeld
(una variable por parámetro de modelo), residuo
Martingale, desviación residual, Cox-Snell
residual, calificación residual (una variable por
parámetro de modelo), DFBeta residual (una
variable por parámetro de modelo), Martingale
residual agregado, desviación residual agregada,
Cox-Snell residual agregado, calificación residual
agregada (una variable por parámetro de modelo), y
DFBeta resdidual agregado ( una variable por
parámetro de modelo)
• Exporte el modelo y/o la función de supervivencia
- Exporte como un archivo de SPSS
- Exporte la función de supervivencia como un
archivo de SPSS
- Exporte el modelo como un archivo XML
• Opciones para especificar el criterio de estimación,
métodos para computar las funciones de
supervivencia y los intervalos de confianza, y
manejar los valores perdidos del usuario
- Estimación: iteraciones máximas, partición máxima,
estimación de iteraciones limitadas basadas en los
cambios de los parámetros, cambio de iteraciones
basadas en la probabilidad de cambio, despliegue
de la historia de iteraciones, y un método para la
estimación de parámetros (Efron o Breslow)
- Funciones de supervivencia: método para estimar la
base de la función de supervivencia (Efron,
Breslow o límite de producto), e intervalos de
confianza para funciones de supervivencia
(transformados o unidades originales)
- Especifica el nivel de confianza del intervalo
- Manejo de datos perdidos (tratados como válidos o
inválidos)
Sobre IBM SPSS Business Analytics
El software de IBM SPSS Business Analytics le
proporciona conocimiento a través de sus datos que
le ayuda a las organizaciones a trabajar de manera
más inteligente y a superar a sus competidores. Este
portafolio incluye soluciones para inteligencia de
negocios, análisis predictivo, administración de
decisiones, del desempeño y del riesgo.
Las soluciones Business Analytics le permiten a las
empresas identificar y visualizar tendencias y
patrones en áreas como análisis de clientes, la cual
tiene un efecto importante en el desempeño de los
negocios. Podrá comparar escenarios, anticipar
amenazas potenciales y oportunidades, realizar una
mejor planeación de presupuestos y pronóstico de
recursos, balancear el riesgo contra los ingresos
esperados y trabajar para alcanzar los requerimientos
regulatorios. Al hacer el análisis más disponible, las
empresas alinean el proceso de decisión táctico y
estratégico para alcanzar los objetivos del negocio.
IBM Software
Business Analytics
© Copyright IBM Corporation 2012
IBM Corporation
Software Group
Route 100
Somers, NY 10589
IBM, the IBM logo, ibm.com and SPSS are trademarks of International
Business Machines Corporation registered in many jurisdictions worldwide.
Other product and services names might be trademarks of IBM or other
companies. A current list of IBM trademarks is available on the Web at
“Copyright and trademark information” at
www.ibm.com/legal/copytrade.shtml
BeSmart, antes AMSS
Mardoqueo Fernández 207
Providencia | Santiago
F: +56 224153478
M: [email protected]
The content in this document (including currency or printing references
which exclude applicable taxes) is current as of the initial date of publication
and may be changed by IBM at any time. Not all offerings are available in
every country in which IBM operates.
THE INFORMATION IN THIS DOCUMENT IS PROVIDED “AS IS”
WITHOUT ANY WARRANTY, EXPRESS OR IMPLIED, INCLUDING
WITHOUT ANY WARRANTIES OF MERCHANT ABILITY, FITNESS
FOR A PARTICULAR PURPOSE AND ANY WARRANTY OR
CONDITION OF NON-INFRIGEMENT. IBM products are warranted
according to the terms and conditions of the agreements under which they
are provided.

IBM SPSS Complex Samples

Transcripción

Documentos relacionados

13.- Como se produjo mi ingreso a IBM. - Sitio de los ex