Estadístico C
Transcripción
Estadístico C
El estadístico C surge en el estudio de las series temporales cortas para determinar si existe una tendencia; esto es, si hay variaciones sistemáticas que se apartan de la variación aleatoria, y que pueden comprobarse estadísticamente por una correlación entre los datos sucesivos. Viene dado por la siguiente ecuación: (1, n-1) C=1– 2 (1, n) (Yt (Yt – Yt+1 )2 – Media Y) 2 (n – 2) El error estándar del estadístico C es el siguiente: e.e. = rc (n –1) (n + 1) Al dividir el estadístico C por su error estándar, obtenemos el estadístico Z que, a partir de 25 observaciones se aproxima a la función normal, con media cero y varianza uno. Para muestras a partir de 8 sujetos, y con un á = 0.05, el valor crítico de Z se mantiene en torno a 1.65. De la fórmula se desprenden las siguientes características (Tyron, 1982): 1) El valor de cero para el estadístico C se da con mayor probabilidad cuando los datos no se apartan excesivamente de la media. 2) Un valor mayor de C ayuda a detectar la no estacionariedad de la serie. 3) Para la significación estadística de la prueba C (el estadístico Z) hay que dividir por el error estándar, que está en función del tamaño de la muestra. Por lo tanto, la potencia de dicha prueba está en función del número de datos del que se dispongan, pudiendo detectar cualquier efecto si hay un número de observaciones suficientes. Tyron (1982) propone también tres estrategias a emplear en el análisis de datos mediante el estadístico C: 1ª ESTRATEGIA: Aplicación del estadístico C a los datos de la Línea Base, para comprobar si en ella hay alguna tendencia. Si el resultado no es significativo, habremos de emplear la segunda estrategia. En caso contrario, hay que utilizar la segunda. 2ª ESTRATEGIA: Cuando tenemos una línea base estacionaria, se aplica el estadístico C a los datos de la línea base junto con los de la fase de tratamiento. En caso de obtener ahora significación estadística, se puede concluir que el tratamiento es efectivo 3ª ESTATEGIA: Cuando hay una tendencia en la línea base, hay que probar si se mantiene en la fase de intervención, o bien se produce algún cambio. Para ello, se puede optar entre: A) Comparar las puntuaciones directas de ambas fases (sustrayendo al valor de cada observación de la línea base con la observación correspondiente de la fase de tratamiento), y calcular el estadístico C con estos datos. Un valor significativo, indica una tendencia, o efecto del tratamiento. B) Comparar los datos de las series, ajustando previamente los datos de la Línea Base a una recta de regresión (o cualquier otra función, según sea el caso). Para evitar que valores atípicos afecten a la inclinación de la serie, se recomienda que la recta pase por las medianas de cada tercera parte de los datos. Esta última opción es la más recomendable, al ofrecer más potencia a la prueba. La comparación de series en la tercera estrategia requiere el mismo número de registros en ambas fases. En caso de que fuesen distintos, es recomendable hacer una extrapolación de la tendencia de la fase menor (normalmente la línea base), con lo que además aumenta la potencia de la prueba. Las características, tanto de la prueba como de su forma de aplicación, presentan una serie de limitaciones, presentadas por Blumberg (1984) tras un estudio sobre el estadístico C: 1.- En la aplicación de la tercera estrategia, al comparar dos tendencias, el valor de C depende del tamaño de las muestras, y es independiente de las pendientes. 2.- Cuando la tendencia es la misma en la Línea Base y en el tratamiento, es estadístico C se presenta no significativo, aunque haya un salto en los valores, o cambio de nivel; que puede indicar un efecto del tratamiento. 3.- Se puede obtener un valor de Z significativo en la tercera estrategia, aunque no haya un cambio en la tendencia. Esto es, manteniéndose la misma tendencia de la línea base en la de tratamiento, que se encuentre un cambio significativo (que no se ha producido). 4.- Al emplear la primera estrategia, podemos tomar (porque disponemos de una muestra pequeña, p. ej.) una serie que presenta una tendencia por una aleatoria (error tipo I). En la segunda estrategia, como aumenta el tamaño de la muestra, obtendremos un C significativo, concluyendo que hay tendencia, y, por lo tanto un efecto del tratamiento (error tipo II). Además, los errores de tipo I y II que se produzcan en la primera estrategia, se arrastrarán siempre a la siguiente. Tyron (1984) ha revisado estos problemas y ha realizado unas críticas a las planteadas por Blumberg, que ayudan a comprender la naturaleza de la prueba: 1.- El estadístico C se convierte en una función únicamente del número de datosen el caso único en que éstos formen una recta perfecta. Este resultado se explica porque el estadístico C mide la aleatoriedad de la serie, o las variaciones sistemáticas esperadas por variación aleatoria. 2.- Si se unen las dos fases, y se contrastan como una sola, se obtiene una C significativa tanto en cambios en la pendiente solos, como cuando van acompañados de un salto de nivel. 3.- En este ejemplo, Blumberg planteaba curvas exponenciales, que presentan la misma tendencia (exponencial) desde la línea base a la fase de tratamiento. Sin embargo, si hayamos la pendiente de los datos de la línea base, y la de los datos de la fase de intervención, observamos que son muy diferentes, lo que explica que se obtenga un valor de C significativo. 4.- El poder de C es proporcional al número de datos, por lo que emplear conjuntamente la línea base y el tratamiento es más deseable (esto sucede con todos los métodos estadísticos que dependen del tamaño de los datos). Una solución es usar el error estándar de la línea base en el estudio de los datos conjuntos, con lo que obtendríamos unos resultados más conservadores. Sin embargo, implica también dejar de usar datos (el error estándar de la fase de intervención) con lo que se pierde potencia. A modo de resumen, Tyron defendió el estadístico C como un omnibus estadístico que establece la probabilidad de una serie temporal de ser aleatoria (por lo que rechazar Ho no implica necesariamente una tendencia). Es sensible a los cambios en la pendiente y saltos de nivel, cuando se evalúan los datos de forma conjunta. Por último, C no es una medida del "tamaño del efecto", y bajo algunas circunstancias, está únicamente en función del tamaño de la muestra. Para comprobar la eficacia de la prueba C, Bono y Arnau (1996) realizaron una simulación por ordenador en forma de estudio Monte Carlo. Para ello se realizaron estudios de cada una de las estrategias, a fin de comprobar la distinta potencia de cada uno en función de: • Tamaño de la muestra (siempre empleado; entre 8 y 15 observaciones) • Valor de las pendientes (de –0.1 a –1, con diferencias de una décima) • Saltos de nivel (ninguno, o de una desviación estándar) • Métodos de análisis (en el empleo de la tercera estrategia: comparaciones directas, ajustadas a recta de regresión o comparación conjunta). El programa calculó 200 observaciones para cada una de las condiciones experimentales expuestas en cada caso, incluyendo un error normal de media cero y varianza uno. 1ª Estrategia: Se estudiaron tres líneas base estables, con variabilidad baja, media y alta, respectivamente; y líneas base con pendientes de –0.1 a –1. Los datos arrojan que el estadístico C no discrimina entre una fase estable y una variable. Sólo puede sostener si un conjunto de datos ordenados se comporta de acuerdo con lo esperado por azar. El estadístico C es siempre una función del tamaño de la muestra, por ello, a mayor número de datos, mayor es siempre la potencia de la prueba. Por otra parte, la pendiente de la recta es muy importante para muestras pequeñas. Así, con pendientes de –0.1 ó –0.2 la potencia estadística es muy baja. Por otro lado, pendientes que oscilen entre –0.7 y –0.9 presentan una alta potencia independientemente del tamaño. Por tanto una muestra pequeña con una pendiente poco pronunciada pone en duda resultados tanto significativos como no. 2ª Estrategia: Se empleó una línea base estable y una fase de intervención con pendientes de –0.1 a –1, y con cambios de nivel de cero o una desviación estándar. Al igual que en el estudio de una sola fase, para pendientes de –0.1 ó –0.2 presenta muy baja potencia. Además, cuando hay un cambio de nivel (ó = 1), la potencia de la prueba es superior a 0.8 para un á = 0.05 independientemente del tamaño de la muestra, o de la inclinación de la pendiente. 3ª Estrategia: Se introdujo la variable método de análisis, y se estudiaron tres casos distintos: • Igual pendiente, con y sin cambio de nivel: Los métodos de análisis de la comparación directa y ajustada a la recta de regresión presentaban muy bajos valores, tanto de potencia como de error tipo I. Con el método del análisis conjunto de las fases, encontramos un mayor error tipo I, y una aún mayor potencia estadística. • Pendientes opuestas, con y sin cambio de nivel: La relación entre método de análisis y potencia estadística es que ésta es mayor en el método de la regresión, y que aumenta en el de análisis conjunto cuando hay un salto. La relación entre método y las pendientes de ambas fases indica una mayor potencia del método de regresión que el de análisis conjunto, que se diluyen cuando mayor es la pendiente (a mayor pendiente, más potencia presenta la prueba). • Pendientes iguales (más pronunciada en la fase de tratamiento) sin cambio de nivel: A medida que aumenta el valor de la pendiente, aumenta también la potencia de la prueba en cada uno de los métodos, siendo mayor en el de análisis conjunto de los datos, seguido por el de regresión. Como conclusión al estudio, podemos decir que el estadístico C no es significativo para series variables o estables. Su potencia está en función del tamaño de la muestra, y del incremento de la pendiente y el nivel de significación. Si se define un cambio de nivel, la potencia de la prueba aumenta, especialmente cuando las pendientes son muy bajas. La limitación de la prueba (línea base y tratamiento con la misma tendencia) queda corroborada en el método de análisis conjunto de los datos, ya que la potencia es muy alta cuando ó = 1, y la tasa de error tipo I es muy alta también si ó = 0. Por último, decir que el estadístico C es útil en investigación aplicada, en los ámbitos clínico, cultural o educativo; así como en investigaciones de evaluación de programas de intervención social. Y permite analizar los efectos de los tratamientos sobre medidas conductuales cuando se disponen de pocos datos por fase. BIBLIOGRAFÍA BLUMBERG, C.J. (1984). Comments of “ A simplified time-series analysis for avaluating treatments interventions”. Journal of Applied Behavior Analysis. 17. (4). 539 – 542. DeCARLO, L.T. y TYRON, W. W. (1993). Estimating and testing autocorrelation winth small samples: a comparison of the C – statistic to a modifier estimator. Behavioral Research Therapy. 31. (8). 781 – 788. BONO, R. Y ARNAU, J. (1996). Análisis de la potencia del estadístico C mediante simulación. Psicothema. 8. 699 – 708. BONO, R. Y ARNAU, J. (1997). Estadístico C: Aplicación a diseños conductuales. Revista Latinoamericana de Psicología. 29 (1). 49 – 63. BONO, R. Y ARNAU, J. (1998). Estadístico C: Descripción y aplicación a diseños de caso único. Psicológica. 19. 27 – 40. TYRON, W. W. (1982). A simplified time-series analysis for evaluating treatment interventions. Journal of Applied Behavior Analysis. 15. (3) 423 – 429. TYRON, W. W. (1984). “A simplified time-series analysis for evaluating treatment interventions”: a rejoinder to Blumberg. Journal of Applied Behavior Analysis. 17. (4). 543 – 544 www.psiquiatria.com http://www.comportamental.com/articulos/21.htm