ppt
Transcripción
ppt
Enero 2012 Estadísticas Inferenciales Inferential Statistics Estadísticas Inferenciales Inferential Statistics ¿Qué son estadísticas inferenciales? What Are Inferential Statistics? • Se refiere a ciertos procedimientos que permiten que los • Refer to certain procedures that allow researchers to make investigadores hagan inferencias sobre una población basados en datos obtenidos de una muestra • Se desea obtener una muestra al azar ya que esto asegura que la muestra representa una población más grande • Mientras más buena sea la muestra que representa la población, más inferencias podrán hacer los investigadores • Estadísticas inferenciales se trata de hacer inferencias sobre poblaciones inferences about a population based on data obtained from a sample • Obtaining a random sample is desirable since it ensures that this sample is representative of a larger population • The better a sample represents a population, the more inferences researchers will be able to make • Making inferences about populations is what inferential statistics are all about 1 Enero 2012 Dos Ejemplos de Dos Poblaciones Distintas Two Samples from Two Distinct Populations Error de Muestreo Sampling Error • Es razonable asumir que cada muestra le va a dar • It is reasonable to assume that each sample will give una idea bastante acertada de su población • Sin embargo, las muestras probablemente no son idénticas a las poblaciones matrices • Esta diferencia entre una muestra y su población se conoce como error de muestreo • Además, no existen dos muestras idénticas en todas las características Error del Muestreo you a fairly accurate picture of its population • However, samples are not likely to be identical to their parent populations • This difference between a sample and its population is known as sampling error • Furthermore, no two samples will be identical in all their characteristics Sampling Error 2 Enero 2012 Distribución de las Medias del Muestreo Distribution of Sample Means • Existen momentos en donde la recolección de muestras • There are times where large collections of random al azar desarrollan patrones que le permitirán a los investigadores a predecir acertadamente algunas de las características de la población de donde se sacó la muestra • Una distribución de medias es una distribución de frecuencias que resulta de trazar las medias de un gran número de muestras de la misma población samples do pattern themselves in ways that will allow researchers to predict accurately some characteristics of the population from which the sample was taken • A sampling distribution of means is a frequency distribution resulting from plotting the means of a very large number of samples from the same population Una Distribución de Muestreo de Medias A Sampling Distribution of Means Distribución de Medias de Muestreo Distribution of Sample Means 3 Enero 2012 Error Estándar de la Media Standard Error of the Mean • La desviación estándar de una distribución de muestreo • The standard deviation of a sampling distribution of de medias se llama Error Estándar de la Media (SEM en ingles) • Si usted puede estimar acertadamente la media y la desviación estándar de una distribución de muestreo, usted puede determinar si es probable o no que una media de muestreo en particular puede ser obtenida de la población • Para estimar el SEM, divida la DE de la muestra por la raíz cuadrada del tamaño de la muestra menos uno. means is called the Standard Error of the Mean (SEM) • If you can accurately estimate the mean and the standard deviation of the sampling distribution, you can determine whether it is likely or not that a particular sample mean could be obtained from the population • To estimate the SEM, divide the SD of the sample by the square root of the sample size minus one. Intervalos de Confianza Confidence Intervals • Un Intervalo de Confianza es una región que se extiende • A Confidence Interval is a region extending both above tanto hacia arriba como hacia abajo de una estadística de una muestra dentro del cual el parámetro de la población se puede decir que cae bajo una probabilidad específica de estar incorrecta • Los SEMs pueden ser usados para determinar los límites dentro del cuales se encuentra la media de la población • Si el intervalo de confiaza es de 95%, habría una “probabilidad” de que 5 de 100 (media de la población) caería fuera de los límites. and below a sample statistic within which a population parameter may be said to fall with a specified probability of being wrong • SEMs can be used to determine boundaries or limits, within which the population mean lies • If a confidence interval is 95%, there would be a “probability” that 5 out of 100 (population mean) would fall outside the boundaries or limits El Intervalo de Confianza de 95 por ciento The 95 percent Confidence Interval 4 Enero 2012 El Intervalo de Confianza de 99 por ciento The 99 percent Confidence Interval Podemos tener una Confianza de 99 por ciento We Can Be 99 percent Confident ¿Refleja una Diferencia de Muestra una Diferencia en la Población? Does a Sample Difference Reflect a Population Difference? 5 Enero 2012 Distribución de la Diferencia Entre Medias de Muestras Intervalos de Confianza Distribution of the Difference Between Sample Means Confidence Intervals Prueba de Hipótesis Hypothesis Testing • La Prueba de hipótesis es una manera de determinar la • Hypothesis testing is a way of determining the probability probabilidad de que ocurrirá una estadística de muestra obtenida dada un parámetro hipotético de población • La Hipótesis de Investigación especifica el resultado previsto de un estudio • La Hipótesis Nula típicamente especifica que no hay relación en la población that an obtained sample statistic will occur, given a hypothetical population parameter • The Research Hypothesis specifies the predicted outcome of a study • The Null Hypothesis typically specifies that there is no relationship in the population 6 Enero 2012 Hipótesis Nulas y de Investigación Ilustración de cuando un Investigador Rechazaría una Hipótesis Nula Research and Null Hypotheses Illustration of When a Researcher Would Reject the Null Hypothesis Prueba de Hipótesis: Repaso Hypothesis Testing: A Review • Declare la hipótesis de investigación • State the research hypothesis • Declare la hipótesis nula • State the null hypothesis • Determine las estadísticas del muestreo pertinentes a la • Determine the sample statistics pertinent to the hypothesis hipótesis • Determine la probabilidad de obtener los resultados del muestreo • Si la probabilidad es pequeña, rechace la hipótesis nula y ratifique la hipótesis de la investigación • Si la probabilidad es grande, no rechace la hipótesis nula y no ratifique la hipótesis de investigación • Determine the probability of obtaining the sample results • If the probability is small, reject the null hypothesis and affirm the research hypothesis • If the probability is large, do not reject the null hypothesis and do not affirm the research hypothesis 7 Enero 2012 Significancia Práctica vs. Estadística Practical vs. Statistical Significance • El término “nivel de significancia” se refiere a la • The terms “significance level” or “level of significance” probabilidad de que una estadística de muestra ocurra como resultado de un error de muestreo • Los niveles de significancia más comunmente utilizados en investigación educacional son de niveles de .05 y .01 • La significancia estadística y la significancia práctica no son necesariamente las misma cosa ya que un resultado de significancia estadística no quiere decir que es prácticamente significante en el sentido educacional refers to the probability of a sample statistic occurring as a result of sampling error • Significance levels most commonly used in educational research are the .05 and .01 levels • Statistical significance and practical significance are not necessarily the same since a result of statistical significance does not mean that it is practically significant in an educational sense Pruebas de Una y Dos Colas One- and Two-Tailed Tests • La prueba de una cola es cuando el investigador • A one-tailed test is when the researcher obtains a obtiene una diferencia positiva entre la media de la muestra la cual respalda la hipótesis cuando se usa solo la cola positiva de la distribución del muestreo • La prueba de dos colas involucra el uso de probabilidades basado en ambos lados de la distribución del muestreo por la hipótesis de investigación es una hipótesis no direccional positive difference between the sample mean which will support the hypothesis, when using only the positive tail of the sampling distribution • A two-tailed test involves the use of probabilities based on both sides of a sampling distribution because the research hypothesis is a non-directional hypothesis Area de Significancia de una Prueba de Una Cola Significance Area for a One-Tailed Test 8 Enero 2012 Prueba de Una Cola Usando una Distribución de Diferencias Entre Medias de Muestras One-Tailed Test Using a Distribution of Differences Between Sample Means Prueba de Dos Colas Usando una Distribución de Diferencias Entre Medias de Muestras Two-Tailed Test Using a Distribution of Differences Between Sample Means Valores de Coeficiente de Contingencia para Tablas Cruzadas de Distintos Tamaños Tamaño de la Tabla (No. de Celdas) 2 by 2 3 by 3 4 by 4 5 by 5 6 by 6 a El Límite Mayora para C Calculado .71 .82 .87 .89 .91 límite mayor para tablas de tamaños diferentes (tales como 2 por 3 or 3 por 4) es desconocido pero puede ser estimado con los valores dados. Entoces, el límite para la tabla 3 por 4 sería aproximadamente .85 Contingency Coefficient Values for DifferentSized Crossbreak Tables Size of Table (No. of Cells) 2 by 2 3 by 3 4 by 4 5 by 5 6 by 6 Upper limita for C Calculated .71 .82 .87 .89 .91 aThe upper limit for unequal-sized tables (such as 2 by 3 or 3 by 4) are unknown but can be estimated from the values given. Thus, the upper limit for a 3 by 4 table would approximate .85 9 Enero 2012 Técnicas Inferenciales Comúnmente Usadas Cuantitativa Categórica Paramétrica No paramétrica prueba t para medias independientes Prueba U de Mann-Whitney prueba t para medias correlacionadas Análisis de Varianza (ANOVA) Análisis de Co Varianza (ANCOVA) Análisis de Varianza multivariada (MANOVA) prueba t para r Análisis de varianza de una sola vía Kruskal-Wallis Prueba de señal Análisis de varianza de dos vías Friedman prueba t para diferencia en proporciones Chi al cuadrado Commonly Used Inferential Techniques Quantitative Categorical Parametric Nonparametric t-test for independent means Mann-Whitney U test t-test for correlated means Analysis of variance (ANOVA) Analysis of covariance (ANCOVA) Multivariate analysis of variance (MANOVA) t-test for r Kruskal-Wallis one-way analysis of variance Sign test Friedman two-way analysis of variance t-test for difference in proportions Chi square Error Tipo I vs. Tipo II Type I vs. Type II Error • Una hipótesis nula predice una no relación • A null hypothesis predicts no relationship • Un error Tipo II resulta cuando un investigador no • A Type II error results when the researcher fails to rechaza la hipótesis nula que es falsa • Un erro Tipo I resulta cuando el investigador rechaza la nula cuando es verdadera • A Type I error results when the researcher rejects Ejemplo Hipotético de Errores Tipo I y Tipo II reject the null hypothesis that is false the null when it is true Hypothetical Example of Type I and Type II Errors 10 Enero 2012 Rechazando la Hipótesis Nula Técnicas de Inferencia • Existen dos tipos básicos de técnicas de inferencia: 1) 2) Paramétrica: hace suposiciones sobre la naturaleza de la población de donde se sacaron las muestras del estudio de investigación No paramétrica: hace suposiciones sobre la naturaleza de la población de donde se sacaron las muestras Una Ilustración de Poder Bajo un Valor Supuesto de la Población Rejecting the Null Hypothesis Inference Techniques • There are two basic types of inference techniques: 1) 2) Parametric: makes assumptions about the nature of the population from which the samples involved in the research study were taken Non-parametric: makes few assumptions about the nature of the population from which the samples are taken An Illustration of Power Under an Assumed Population Value 11 Enero 2012 Técnicas Paramétricas para Analizar Datos Cuantitativos Parametric Techniques for Analyzing Quantitative Data • La prueba t es una prueba estadística paramétrica usada • The t-test is a parametric statistical test used to see para ver si la diferencia entre las dos medias de dos muestras es significante • Existen dos formas de pruebas t: whether a difference between the means of two samples is significant • There are two forms of t-tests: • Prueba t para medias correlacionadas • Prueba t para medias independientes • El Análisis de Varianza (ANOVA) se utiliza para determinar si las diferencias significantes existen entre dos o más grupos. • T-test for correlated means • T-test for independent means • Analysis of Variance (ANOVA) is used to determine if significant differences exist between two or more groups Técnicas Paramétricas para Analizar Datos Cuantitativos (cont.) Parametric Techniques for Analyzing Quantitative Data (cont.) • Análisis de Co Varianza (ANCOVA) es una variación • Analysis of Covariance (ANCOVA) is a variation of an de un ANOVA que se usa cuando se les da a grupos una pre prueba relacionada en alguna manera con la variable dependiente y se encuentra que sus resultados de media en esta pre prueba difieren • Análisis de Varianza MultivariadaU (MANOVA) incorpora dos o más variables dependientes en el mismo análisis, permitiendo de esta manera una prueba de diferencias entre medias mas poderosa • La prueba t para r es utilizada ara ver si el coeficiente de relación calculado en los datos de la muestra es significante ANOVA used when groups are given a pretest related in some way to the dependent variable and their mean scores on this pretest are found to differ • Multivariate Analysis of Variance (MANOVA) incorporates two or more dependent variables in the same analysis, thus permitting a more powerful test of differences among means • T-test for r is used to see whether a correlation coefficient calculated on sample data is significant Técnicas No Paramétricas para Analizar Datos Cuantitativos Non-Parametric Techniques for Analyzing Quantitative Data • La prueba U Mann Whitney es una alternativa no • The Mann-Whitney U test is a nonparametric alternative to paramétrica a la prueba t utilizada cuando un investigador desea analizar datos por rango • El análisis de varianza de una sola vía Kruskal-Wallis se utilia cuando usted tiene dos o más variables independientes a comparar • La prueba de Señal se utiliza cuando usted quiere analizar dos muestras relacionadas the t test used when a researcher wishes to analyze ranked data • The Kruskal-Wallis one-way analysis of variance is used when you have two or more independent variables to compare • The Sign test is used when you want to analyze two related samples. • Las muestras relacionadas están conectadas de alguna manera • El análisis de varianza de dos vías Friedman se utiliza cuando dos o más grupos relacionados están involucrados • Related samples are connected in some way • The Friedman two-way analysis of variance is used when two or more related groups are involved 12 Enero 2012 Técnicas para Medir Datos Categóricos Techniques for Measuring Categorical Data • Técnica Paramétrica • Prueba T para Proporciones (encontrar diferencias en las proporciones dentro de categorías) • Parametric Technique • T-test for Proportions (finding differences in proportions within categories) • Técnica No Paramétrica • La prueba de Chi al cuadrado se utiliza para analizar datos que son reportados en categorías • El Coeficiente de Contingencia es una estadística descriptiva que indica el grado de la relación que existe entre dos variables categóricas • Non-Parametric Technique • Chi-square test is used to analyze data that are reported in categories • The Contingency Coefficient is a descriptive statistic indicating the degree of relationship that exists between two categorical variables Poder de una Prueba Estadística Power of a Statistical Test • Poder es la probabilidad de que la prueba llevará • Power is the probability that the test will correctly correctamente a la conclusión de que hay una diferencia cuando existe una diferencia de hecho • Las pruebas paramétricas son generalmente, pero no siempre, más poderosas que las pruebas no paramétricas lead to the conclusion that there is a difference when, it fact, a difference exists • Parametric tests are generally, but not always, more powerful than non-parametric tests Una Curva de Poder A Power Curve 13