ppt

Transcripción

ppt
Enero 2012
Estadísticas Inferenciales
Inferential Statistics
Estadísticas Inferenciales
Inferential Statistics
¿Qué son estadísticas inferenciales?
What Are Inferential Statistics?
• Se refiere a ciertos procedimientos que permiten que los
• Refer to certain procedures that allow researchers to make
investigadores hagan inferencias sobre una población
basados en datos obtenidos de una muestra
• Se desea obtener una muestra al azar ya que esto
asegura que la muestra representa una población más
grande
• Mientras más buena sea la muestra que representa la
población, más inferencias podrán hacer los
investigadores
• Estadísticas inferenciales se trata de hacer inferencias
sobre poblaciones
inferences about a population based on data obtained
from a sample
• Obtaining a random sample is desirable since it ensures
that this sample is representative of a larger population
• The better a sample represents a population, the more
inferences researchers will be able to make
• Making inferences about populations is what inferential
statistics are all about
1
Enero 2012
Dos Ejemplos de Dos Poblaciones Distintas
Two Samples from Two Distinct Populations
Error de Muestreo
Sampling Error
• Es razonable asumir que cada muestra le va a dar
• It is reasonable to assume that each sample will give
una idea bastante acertada de su población
• Sin embargo, las muestras probablemente no son
idénticas a las poblaciones matrices
• Esta diferencia entre una muestra y su población se
conoce como error de muestreo
• Además, no existen dos muestras idénticas en todas
las características
Error del Muestreo
you a fairly accurate picture of its population
• However, samples are not likely to be identical to
their parent populations
• This difference between a sample and its population
is known as sampling error
• Furthermore, no two samples will be identical in all
their characteristics
Sampling Error
2
Enero 2012
Distribución de las Medias del Muestreo
Distribution of Sample Means
• Existen momentos en donde la recolección de muestras
• There are times where large collections of random
al azar desarrollan patrones que le permitirán a los
investigadores a predecir acertadamente algunas de las
características de la población de donde se sacó la
muestra
• Una distribución de medias es una distribución de
frecuencias que resulta de trazar las medias de un gran
número de muestras de la misma población
samples do pattern themselves in ways that will allow
researchers to predict accurately some characteristics of
the population from which the sample was taken
• A sampling distribution of means is a frequency
distribution resulting from plotting the means of a very
large number of samples from the same population
Una Distribución de Muestreo de Medias
A Sampling Distribution of Means
Distribución de Medias de Muestreo
Distribution of Sample Means
3
Enero 2012
Error Estándar de la Media
Standard Error of the Mean
• La desviación estándar de una distribución de muestreo
• The standard deviation of a sampling distribution of
de medias se llama Error Estándar de la Media (SEM en
ingles)
• Si usted puede estimar acertadamente la media y la
desviación estándar de una distribución de muestreo,
usted puede determinar si es probable o no que una
media de muestreo en particular puede ser obtenida de
la población
• Para estimar el SEM, divida la DE de la muestra por la
raíz cuadrada del tamaño de la muestra menos uno.
means is called the Standard Error of the Mean (SEM)
• If you can accurately estimate the mean and the standard
deviation of the sampling distribution, you can determine
whether it is likely or not that a particular sample mean
could be obtained from the population
• To estimate the SEM, divide the SD of the sample by the
square root of the sample size minus one.
Intervalos de Confianza
Confidence Intervals
• Un Intervalo de Confianza es una región que se extiende
• A Confidence Interval is a region extending both above
tanto hacia arriba como hacia abajo de una estadística de
una muestra dentro del cual el parámetro de la población
se puede decir que cae bajo una probabilidad específica
de estar incorrecta
• Los SEMs pueden ser usados para determinar los límites
dentro del cuales se encuentra la media de la población
• Si el intervalo de confiaza es de 95%, habría una
“probabilidad” de que 5 de 100 (media de la población)
caería fuera de los límites.
and below a sample statistic within which a population
parameter may be said to fall with a specified probability
of being wrong
• SEMs can be used to determine boundaries or limits,
within which the population mean lies
• If a confidence interval is 95%, there would be a
“probability” that 5 out of 100 (population mean) would fall
outside the boundaries or limits
El Intervalo de Confianza de 95 por ciento
The 95 percent Confidence Interval
4
Enero 2012
El Intervalo de Confianza de 99 por ciento
The 99 percent Confidence Interval
Podemos tener una Confianza de 99 por ciento
We Can Be 99 percent Confident
¿Refleja una Diferencia de Muestra una
Diferencia en la Población?
Does a Sample Difference Reflect a
Population Difference?
5
Enero 2012
Distribución de la Diferencia Entre Medias de
Muestras
Intervalos de Confianza
Distribution of the Difference Between Sample
Means
Confidence Intervals
Prueba de Hipótesis
Hypothesis Testing
• La Prueba de hipótesis es una manera de determinar la
• Hypothesis testing is a way of determining the probability
probabilidad de que ocurrirá una estadística de muestra
obtenida dada un parámetro hipotético de población
• La Hipótesis de Investigación especifica el resultado
previsto de un estudio
• La Hipótesis Nula típicamente especifica que no hay
relación en la población
that an obtained sample statistic will occur, given a
hypothetical population parameter
• The Research Hypothesis specifies the predicted outcome
of a study
• The Null Hypothesis typically specifies that there is no
relationship in the population
6
Enero 2012
Hipótesis Nulas y de Investigación
Ilustración de cuando un Investigador Rechazaría
una Hipótesis Nula
Research and Null Hypotheses
Illustration of When a Researcher Would Reject
the Null Hypothesis
Prueba de Hipótesis: Repaso
Hypothesis Testing: A Review
• Declare la hipótesis de investigación
• State the research hypothesis
• Declare la hipótesis nula
• State the null hypothesis
• Determine las estadísticas del muestreo pertinentes a la
• Determine the sample statistics pertinent to the hypothesis
hipótesis
• Determine la probabilidad de obtener los resultados del
muestreo
• Si la probabilidad es pequeña, rechace la hipótesis nula y
ratifique la hipótesis de la investigación
• Si la probabilidad es grande, no rechace la hipótesis nula
y no ratifique la hipótesis de investigación
• Determine the probability of obtaining the sample results
• If the probability is small, reject the null hypothesis and
affirm the research hypothesis
• If the probability is large, do not reject the null hypothesis
and do not affirm the research hypothesis
7
Enero 2012
Significancia Práctica vs. Estadística
Practical vs. Statistical Significance
• El término “nivel de significancia” se refiere a la
• The terms “significance level” or “level of significance”
probabilidad de que una estadística de muestra
ocurra como resultado de un error de muestreo
• Los niveles de significancia más comunmente
utilizados en investigación educacional son de
niveles de .05 y .01
• La significancia estadística y la significancia práctica
no son necesariamente las misma cosa ya que un
resultado de significancia estadística no quiere decir
que es prácticamente significante en el sentido
educacional
refers to the probability of a sample statistic occurring
as a result of sampling error
• Significance levels most commonly used in
educational research are the .05 and .01 levels
• Statistical significance and practical significance are
not necessarily the same since a result of statistical
significance does not mean that it is practically
significant in an educational sense
Pruebas de Una y Dos Colas
One- and Two-Tailed Tests
• La prueba de una cola es cuando el investigador
• A one-tailed test is when the researcher obtains a
obtiene una diferencia positiva entre la media de la
muestra la cual respalda la hipótesis cuando se usa
solo la cola positiva de la distribución del muestreo
• La prueba de dos colas involucra el uso de
probabilidades basado en ambos lados de la
distribución del muestreo por la hipótesis de
investigación es una hipótesis no direccional
positive difference between the sample mean which
will support the hypothesis, when using only the
positive tail of the sampling distribution
• A two-tailed test involves the use of probabilities
based on both sides of a sampling distribution
because the research hypothesis is a non-directional
hypothesis
Area de Significancia de una Prueba de Una
Cola
Significance Area for a One-Tailed Test
8
Enero 2012
Prueba de Una Cola Usando una Distribución
de Diferencias Entre Medias de Muestras
One-Tailed Test Using a Distribution of
Differences Between Sample Means
Prueba de Dos Colas Usando una Distribución
de Diferencias Entre Medias de Muestras
Two-Tailed Test Using a Distribution of
Differences Between Sample Means
Valores de Coeficiente de Contingencia para
Tablas Cruzadas de Distintos Tamaños
Tamaño de la Tabla
(No. de Celdas)
2 by 2
3 by 3
4 by 4
5 by 5
6 by 6
a El
Límite Mayora
para C Calculado
.71
.82
.87
.89
.91
límite mayor para tablas de tamaños diferentes (tales como 2 por 3 or 3 por 4) es desconocido
pero puede ser estimado con los valores dados. Entoces, el límite para la tabla 3 por 4 sería
aproximadamente .85
Contingency Coefficient Values for DifferentSized Crossbreak Tables
Size of Table
(No. of Cells)
2 by 2
3 by 3
4 by 4
5 by 5
6 by 6
Upper limita
for C Calculated
.71
.82
.87
.89
.91
aThe
upper limit for unequal-sized tables (such as 2 by 3 or 3 by 4) are unknown but can be estimated
from the values given. Thus, the upper limit for a 3 by 4 table would approximate .85
9
Enero 2012
Técnicas Inferenciales Comúnmente
Usadas
Cuantitativa
Categórica
Paramétrica
No paramétrica
prueba t para medias independientes
Prueba U de Mann-Whitney
prueba t para medias correlacionadas
Análisis de Varianza (ANOVA)
Análisis de Co Varianza (ANCOVA)
Análisis de Varianza multivariada (MANOVA)
prueba t para r
Análisis de varianza de una sola vía Kruskal-Wallis
Prueba de señal
Análisis de varianza de dos vías Friedman
prueba t para diferencia en proporciones
Chi al cuadrado
Commonly Used Inferential Techniques
Quantitative
Categorical
Parametric
Nonparametric
t-test for independent means
Mann-Whitney U test
t-test for correlated means
Analysis of variance (ANOVA)
Analysis of covariance (ANCOVA)
Multivariate analysis of variance (MANOVA)
t-test for r
Kruskal-Wallis one-way analysis of variance
Sign test
Friedman two-way analysis of variance
t-test for difference in proportions
Chi square
Error Tipo I vs. Tipo II
Type I vs. Type II Error
• Una hipótesis nula predice una no relación
• A null hypothesis predicts no relationship
• Un error Tipo II resulta cuando un investigador no
• A Type II error results when the researcher fails to
rechaza la hipótesis nula que es falsa
• Un erro Tipo I resulta cuando el investigador
rechaza la nula cuando es verdadera
• A Type I error results when the researcher rejects
Ejemplo Hipotético de Errores Tipo I
y Tipo II
reject the null hypothesis that is false
the null when it is true
Hypothetical Example of Type I and Type II Errors
10
Enero 2012
Rechazando la Hipótesis Nula
Técnicas de Inferencia
•
Existen dos tipos básicos de técnicas de
inferencia:
1)
2)
Paramétrica: hace suposiciones sobre la naturaleza
de la población de donde se sacaron las muestras
del estudio de investigación
No paramétrica: hace suposiciones sobre la
naturaleza de la población de donde se sacaron las
muestras
Una Ilustración de Poder Bajo un Valor
Supuesto de la Población
Rejecting the Null Hypothesis
Inference Techniques
•
There are two basic types of inference
techniques:
1)
2)
Parametric: makes assumptions about the nature of
the population from which the samples involved in
the research study were taken
Non-parametric: makes few assumptions about the
nature of the population from which the samples are
taken
An Illustration of Power Under an
Assumed Population Value
11
Enero 2012
Técnicas Paramétricas para Analizar
Datos Cuantitativos
Parametric Techniques for Analyzing
Quantitative Data
• La prueba t es una prueba estadística paramétrica usada
• The t-test is a parametric statistical test used to see
para ver si la diferencia entre las dos medias de dos
muestras es significante
• Existen dos formas de pruebas t:
whether a difference between the means of two samples
is significant
• There are two forms of t-tests:
• Prueba t para medias correlacionadas
• Prueba t para medias independientes
• El Análisis de Varianza (ANOVA) se utiliza para
determinar si las diferencias significantes existen entre
dos o más grupos.
• T-test for correlated means
• T-test for independent means
• Analysis of Variance (ANOVA) is used to determine if
significant differences exist between two or more groups
Técnicas Paramétricas para Analizar
Datos Cuantitativos (cont.)
Parametric Techniques for Analyzing
Quantitative Data (cont.)
• Análisis de Co Varianza (ANCOVA) es una variación
• Analysis of Covariance (ANCOVA) is a variation of an
de un ANOVA que se usa cuando se les da a grupos
una pre prueba relacionada en alguna manera con la
variable dependiente y se encuentra que sus
resultados de media en esta pre prueba difieren
• Análisis de Varianza MultivariadaU (MANOVA)
incorpora dos o más variables dependientes en el
mismo análisis, permitiendo de esta manera una
prueba de diferencias entre medias mas poderosa
• La prueba t para r es utilizada ara ver si el coeficiente
de relación calculado en los datos de la muestra es
significante
ANOVA used when groups are given a pretest related
in some way to the dependent variable and their
mean scores on this pretest are found to differ
• Multivariate Analysis of Variance (MANOVA)
incorporates two or more dependent variables in the
same analysis, thus permitting a more powerful test
of differences among means
• T-test for r is used to see whether a correlation
coefficient calculated on sample data is significant
Técnicas No Paramétricas para Analizar
Datos Cuantitativos
Non-Parametric Techniques for Analyzing
Quantitative Data
• La prueba U Mann Whitney es una alternativa no
• The Mann-Whitney U test is a nonparametric alternative to
paramétrica a la prueba t utilizada cuando un investigador
desea analizar datos por rango
• El análisis de varianza de una sola vía Kruskal-Wallis se
utilia cuando usted tiene dos o más variables
independientes a comparar
• La prueba de Señal se utiliza cuando usted quiere
analizar dos muestras relacionadas
the t test used when a researcher wishes to analyze
ranked data
• The Kruskal-Wallis one-way analysis of variance is used
when you have two or more independent variables to
compare
• The Sign test is used when you want to analyze two
related samples.
• Las muestras relacionadas están conectadas de alguna manera
• El análisis de varianza de dos vías Friedman se utiliza
cuando dos o más grupos relacionados están
involucrados
• Related samples are connected in some way
• The Friedman two-way analysis of variance is used when
two or more related groups are involved
12
Enero 2012
Técnicas para Medir Datos Categóricos
Techniques for Measuring Categorical Data
• Técnica Paramétrica
• Prueba T para Proporciones (encontrar diferencias en las
proporciones dentro de categorías)
• Parametric Technique
• T-test for Proportions (finding differences in
proportions within categories)
• Técnica No Paramétrica
• La prueba de Chi al cuadrado se utiliza para analizar datos que
son reportados en categorías
• El Coeficiente de Contingencia es una estadística descriptiva
que indica el grado de la relación que existe entre dos variables
categóricas
• Non-Parametric Technique
• Chi-square test is used to analyze data that are
reported in categories
• The Contingency Coefficient is a descriptive statistic
indicating the degree of relationship that exists
between two categorical variables
Poder de una Prueba Estadística
Power of a Statistical Test
• Poder es la probabilidad de que la prueba llevará
• Power is the probability that the test will correctly
correctamente a la conclusión de que hay una
diferencia cuando existe una diferencia de hecho
• Las pruebas paramétricas son generalmente,
pero no siempre, más poderosas que las pruebas
no paramétricas
lead to the conclusion that there is a difference
when, it fact, a difference exists
• Parametric tests are generally, but not always,
more powerful than non-parametric tests
Una Curva de Poder
A Power Curve
13

Documentos relacionados