Bases Estadísticas Aplicadas a la Prevención

Transcripción

Bases Estadísticas Aplicadas a la Prevención
Bases Estadísticas
Aplicadas a la Prevención
BASES ESTADÍSTICAS APLICADAS A LA PREVENCIÓN
La estadística recoge, organiza, resume y analiza datos, obteniendo conclusiones válidas. En
prevención de riesgos laborales la estadística tiene diversas y variadas aplicaciones.
En el campo de la seguridad en el trabajo se utiliza para el seguimiento de la accidentalidad. En
los distintos campos de la higiene se utiliza para el establecimiento de valores límites
ambientales, para la determinación de la relación causa-efecto y para el muestreo ambiental.
Por último, en el campo de la medicina preventiva, se utiliza para la realización de estudios
epidemiológicos.
OBJETIVOS
Adquirir las competencias necesarias para conocer los fundamentos estadísticos y aplicarlos en
las valoraciones higiénicas clásicas de los puestos de trabajo en el campo de la prevención de
riesgos laborales.
CONOCIMIENTOS
■
■
■
■
■
■
■
Introducción a la Estadística. Conceptos.
Análisis de Datos.
Medidas Estadísticas.
Regresión.
Distribuciones.
Estimación de una Muestra.
Estadística Aplicada a la Prevención de Riesgos.
Bases Estadísticas Aplicadas a la Prevención
2
INTRODUCCIÓN A LA ESTADÍSTICA. CONCEPTOS
La palabra “estadística” proviene del término “Estado”, y designaba originalmente el análisis de
datos del Estado. Los primeros estudios manejaban grandes números y analizaban datos con el
fin de extraer conclusiones acerca de la aplicación de determinadas medidas en todo el Estado,
siendo considerada como la “ciencia del Estado”.
No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar
datos siendo aplicada bajo un enfoque distinto y ventajoso, realizando un tipo de estudio
denominado inferencial, que consiste en extraer consecuencias globales a partir de estudios
parciales.
La estadística es una ciencia con base matemática que recolecta, analiza e interpreta datos,
intentando explicar condiciones regulares en fenómenos de tipo aleatorio. Se divide en dos
ramas que comprenden la estadística aplicada:
Se dedica a los métodos de recolección, descripción,
visualización, clasificación y resumen de datos obtenidos a partir
Estadística Descriptiva
de los fenómenos de estudio. Los datos pueden ser resumidos
numérica o gráficamente.
Inferencia Estadística
Se dedica a la generación de los modelos y predicciones
asociadas a los fenómenos teniendo en cuenta la aleatoriedad de
las observaciones y extrayendo inferencias acerca de la
población.
Variables
En la estadística se pueden estudiar características medibles y no medibles. Las primeras son
las denominadas variables estadísticas, que definen las características de una población o
medio.
Una variable puede definirse como aquel atributo de individuos o cosas que pueden
tomar un conjunto prefijado de valores, como por ejemplo la edad, la altura, etc. La
variable se llamará constante si sólo toma un valor.
Bases Estadísticas Aplicadas a la Prevención
3
Tipos de Variables
Los valores se expresan en números, tales como talla, edad, etc.
Pueden ser:
■
Continuas: pueden tomar cualquier valor intermedio entre dos
valores cualesquiera de la variable. Ejemplo: concentración
ambiental de un tóxico.
■
Discretas: únicamente toman valores enteros, por su naturaleza
no admiten fraccionamiento de la unidad. Ejemplo: número de
accidentes que se producen en un lugar y en un intervalo de
tiempo.
Cuantitativas
Su valor se expresa bajo forma de categorías tales como sexo,
color, etc. Pueden ser:
Cualitativas
■
Dicotómicas: el valor sólo puede tomar dos formas: “si” o “no”.
■
Categóricas: el valor puede tomar más de dos categorías, por
ejemplo el escalafón. En función de si se mantiene o no una
relación de orden se podría distinguir entre:
−
−
Ordinales.
No ordinales.
Población y Muestra
La teoría del muestreo estudia la relación entre una población y sus muestras. Si una muestra
es representativa de una población, es posible inferir conclusiones importantes sobre la
población analizando previamente la muestra.
A partir del conocimiento de las magnitudes estadísticas de una muestra se pueden estimar
magnitudes desconocidas de una población, como son la media y la varianza.
Población
Muestra
Conjunto de todos los individuos objeto de estudio.
Ejemplo: todas las ruedas producidas en una fábrica en un día.
Subconjunto de la población.
Ejemplo: una parte de las ruedas producidas en un fábrica en un día.
Bases Estadísticas Aplicadas a la Prevención
4
ANÁLISIS DE DATOS
Cuando se utilizan gran cantidad de datos numéricos, es útil dividir o agrupar los valores de la
variable en clases o categorías. La frecuencia de clase es el número de veces que un
determinado valor aparece en cada clase.
El símbolo que define una clase se llama intervalo de clase y sus extremos, límite inferior de
clase y límite superior de clase.
La marca de clase es el punto medio del intervalo de clase y se obtiene promediando los
límites inferior y superior de clase.
Ejemplo
Se dispone de los siguientes datos:
450
1152
250
300
175
80
25
2680
605
785
1595
2300
5000
1200
100
5
180
200
675
500
375
1500
205
985
185
125
315
425
560
1100
Normalmente se suele trabajar con no más de 10 o 12 intervalos. Los intervalos serán siempre
cerrados por la izquierda y abiertos por la derecha.
Amplitud =5000/10 = 500. Por lo que se toman intervalos de amplitud 500.
Se obtiene la siguiente tabla:
[ Li-1 , Li )
Frecuencia
[ 0,500)
16
[ 500, 1000)
6
[ 1000,1500)
3
[ 1500, 2000)
2
[ 2000, 2500)
1
[ 2500, 3000)
1
[ 3000, 3500)
0
[ 3500, 4000)
0
[ 4000, 4500)
0
[ 4500, 5000)
0
[ 5000,5500)
1
Bases Estadísticas Aplicadas a la Prevención
5
Frecuencias
Uno de los primeros pasos que se realizan en cualquier estudio estadístico es recoger la
información de la muestra resumida en una tabla en la que a cada valor de la variable se le
asocian determinados números que representan el número de veces que ha aparecido, su
proporción con respecto a otros valores de la variable, etc. Estos números se denominan
frecuencias.
Tipos de Frecuencia
Absoluta
Número de veces que aparece en la muestra un determinado valor de
la variable, f i .
Está influida por el tamaño de la muestra, al aumentar el tamaño de la
muestra aumentará también el tamaño de la frecuencia absoluta.
Cociente entre la frecuencia absoluta y el tamaño de la muestra o el
número total de observaciones, fr. Para expresarla en términos de
tanto por ciento se multiplica por 100.
Relativa
Absoluta
Acumulada
Relativa
Acumulada
Número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable, Fi .
Cociente entre la frecuencia absoluta acumulada y el tamaño de la
muestra, Fr . Para expresarla en términos de tanto por ciento se
multiplica por 100.
Ejemplo
Se presenta una tabla de frecuencias de una muestra de pesos, en gramos, de 70 pastillas:
Bases Estadísticas Aplicadas a la Prevención
6
Marcas de
Clase
fi
fr
Fi
Fr
[ 1,475, 1,525)
1,50
1
0,014
1
0,014
[ 1,525, 1,575)
1,55
3
0,043
4
0,057
[ 1,575, 1,625)
1,60
8
0,114
12
0,171
[ 1,625, 1,650)
1,65
14
0,200
26
0,370
[ 1,675, 1,725)
1,70
23
0,329
49
0,700
[ 1,725, 1,775)
1,75
12
0,171
61
0,871
[ 1,775, 1,825)
1,80
7
0,100
68
0,971
[ 1,825, 1,875)
1,85
1
0,014
69
0,985
[ 1,875, 1,925)
1,90
0
0,000
69
0,985
[ 1,925, 1,975)
1,95
1
0,014
70
1,000
Intervalos
Histogramas y Polígono de Frecuencias
Los histogramas y polígonos de frecuencias son representaciones gráficas de las
distribuciones de frecuencias.
Un histograma se obtiene construyendo sobre cada intervalo de clase de la variable estadística
continua un rectángulo cuya área es proporcional a la frecuencia de dicho intervalo. Si los
intervalos tienen la misma anchura, las alturas de los rectángulos son proporcionales a las
frecuencias de clase.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases superiores de los
rectángulos del histograma.
Bases Estadísticas Aplicadas a la Prevención
7
MEDIDAS ESTADÍSTICAS
Las medidas estadísticas pretenden resumir la información de la muestra para poder tener
así un mejor conocimiento de la población. Se distinguen los siguientes tipos de medidas
estadísticas:
■
De tendencia central.
■
De dispersión.
■
De localización.
■
De la simetría.
Propiedades Deseables para una Medida Estadística
■
Debe definirse de manera objetiva, dos observadores distintos deben llegar al mismo
resultado numérico.
■
Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia
alguna observación la medida considerada debe reflejar esta variación.
■
Tener un significado concreto, la interpretación debe ser inmediata y sencilla.
■
Ser sencilla de calcular.
■
Prestarse fácilmente al cálculo algebraico.
■
Ser poco sensible a las fluctuaciones muestrales. Esta condición es imprescindible en la
Estadística Matemática y en la Teoría de Sondeos.
Medidas Estadísticas de Tendencia Central
Sirven para determinar los valores centrales o medios de la distribución:
■
Media.
−
−
−
Media aritmética.
Media geométrica.
Media armónica
■
Mediana.
■
Moda.
Bases Estadísticas Aplicadas a la Prevención
8
Media
Un promedio es un valor representativo de un conjunto de datos. Los promedios se denominan
medidas de tendencia central porque suelen situarse en el centro del grupo de datos,
ordenados según su magnitud.
Tipos de Medias
Aritmética
■
Suma de todos los datos de un conjunto de “n” datos dividido por el
número total de los mismos. También se denomina media:
■
Cuando los datos están agrupados en clases y por frecuencias, se
calcula mediante la siguiente expresión:
Raíz de índice “n” del producto de un conjunto de “n” datos positivos:
Geométrica
También se puede hallar por logaritmos, siendo su logaritmo la media
aritmética de los logaritmos de los datos. Se aplica en los casos en
que la distribución presente gran asimetría.
Inversa de la media de las inversas de los valores de un conjunto de
“n” datos:
Armónica
Mediana
La mediana de un conjunto de datos ordenados en orden creciente o decreciente, es el valor
central, o la media de los dos valores centrales, que divide al conjunto en dos mitades
iguales.
Bases Estadísticas Aplicadas a la Prevención
9
Cálculo de la Mediana
Se debe tener en cuenta el tamaño de la muestra, N:
■
Si N es Impar, hay un término central, que será el valor de la
mediana.
■
Si N es par, hay dos términos centrales, la
de esos dos valores.
Variable Discreta
mediana será la media
Si la variable es continua, la tabla vendrá en intervalos, se selecciona
el intervalo central y la mediana vale:
Variable Continua
Donde:
■
Li −1 es el valor del límite inferior del intervalo.
■
ai es la amplitud del intervalo.
Moda
La moda de un conjunto de valores es el valor que ocurre con más frecuencia, es decir, el
más frecuente. Puede no existir y, en caso de existir, puede no ser única. Se trata de la única
medida de tendencia central que tiene sentido estudiar en una variable cualitativa, ya que no
precisa la realización de ningún cálculo.
Para el cálculo en distribuciones continuas se aplica la siguiente expresión:
Donde:
■
Li −1 es el valor del límite inferior del intervalo.
■
ai es la amplitud del intervalo.
Bases Estadísticas Aplicadas a la Prevención
10
Medidas de Dispersión
Dan una idea sobre la representatividad de las medidas centrales, saber si los valores en
general están cerca o alejados de los valores centrales, a mayor dispersión menor
representatividad.
Rango
Se define como la diferencia existente entre el valor mayor y el menor de la distribución. No es
una medida muy significativa, pero es muy fácil de calcular.
Desviación
Es la diferencia que se observa entre el valor de la variable y la media aritmética. No es
una medida, son muchas medidas, pues cada valor de la variable lleva asociada su
correspondiente desviación, por lo que se precisará una medida que resuma dicha información.
Tipos de Desviación
Media
■
Media de los valores absolutos de las desviaciones, d m :
■
Para datos agrupados en clases y por frecuencias, se calcula
mediante la siguiente expresión:
Bases Estadísticas Aplicadas a la Prevención
11
Típica o Standard
Cuasidesviación
Típica
Coeficiente de
Variación
■
Raíz cuadrada de la varianza. La varianza, σ 2 , es la media de los
cuadrados de las desviaciones:
■
Para datos agrupados en clases y por frecuencias, se calcula
mediante la siguiente expresión:
■
Raíz cuadrada de la cuasivarianza. La cuasivarianza se calcula
dividiendo los cuadrados de las desviaciones por N-1:
■
Para datos agrupados en clases y por frecuencias, se calcula
mediante la siguiente expresión:
Estadístico de dispersión que no lleva asociada ninguna unidad, por lo
que permitirá comparar entre dos muestras, cual es la que presenta
mayor dispersión, C.V:
Medidas de Localización
Dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento
dentro de una determinada población o muestra. Son útiles para encontrar determinados
valores importantes para llevar a cabo una clasificación de los elementos de la muestra o
población.
Bases Estadísticas Aplicadas a la Prevención
12
Por ejemplo, en psicología, los resultados de los test o pruebas que se realizan a un
determinado individuo, sirve para clasificar a dicho sujeto en una determinada categoría en
función de la puntuación obtenida.
Clasificación
Divide la población o muestra en cuatro partes iguales. Se define:
■
Q1 como el valor de la variable que deja a la izquierda el 25% de la
distribución.
■
Q2 como el valor de la variable que deja a la izquierda el 50% de la
distribución. Es igual a la mediana.
■
Q3 como el valor de la variable que deja a la izquierda el 75% de la
distribución.
Cálculo de la Variable Cuantitativa
Discreta
■
Se observa el tamaño de la muestra N.
■
Q1 o Q3 se calculan como la mediana de
la correspondiente mitad de la muestra.
Se calculan aplicando las fórmulas:
Cuartiles
Continua
Donde:
■
■
Li −1 es el valor del límite inferior del
intervalo donde se encuentra el cuartil.
ai es la amplitud del intervalo.
Bases Estadísticas Aplicadas a la Prevención
13
Divide la población o muestra en diez partes iguales, d k . Para
variables cuantitativas contínuas el cálculo se realiza aplicando la
siguiente fórmula:
Deciles
Donde:
■
Li −1 es el valor del límite inferior del intervalo donde se encuentra el
decil.
■ ai es la amplitud del intervalo.
■
K toma los valores desde 1 hasta 9.
Divide la población o muestra en cien partes iguales, pk . Para
variables cuantitativas contínuas el cálculo se realiza aplicando la
siguiente fórmula:
Percentiles
Donde:
■
Li −1 es el valor del límite inferior del intervalo donde se encuentra el
■
percentil
ai es la amplitud del intervalo.
■
K toma los valores desde 1 hasta 99.
Medidas de Simetría
Al igual que la curtosis, son medidas de la forma de la distribución, es frecuente que los
valores de una distribución tiendan a ser similares a ambos lados de las medidas de
centralización.
La simetría es importante para saber si los valores de la variable se concentran en una
determinada zona del recorrido de la variable, siendo la asimetría la falta de simetría con
respecto a la ordenada que pasa por la abscisa que corresponde a la media aritmética.
Bases Estadísticas Aplicadas a la Prevención
14
AS<0
AS=0
AS>0
Asimetría negativa a la
izquierda
Simétrica
Asimetría positiva a la
derecha
Asimetría
La medida de la asimetría se puede realizar atendiendo básicamente a dos criterios,
comparando:
■
La media y la moda.
■
Los valores de la variable con la media.
Si la diferencia X − Mo es positiva, habrá asimetría positiva o a la
derecha. Si es negativa, la asimetría será negativa o a la izquierda.
Media y Moda
Esta medida es poco operativa por no tratarse de una medida relativa,
ya que está influida por la unidad en que se mida la variable. Se define
así el coeficiente de asimetría de Pearson como:
Se basa en la comparación con la media de todos los valores de la
variable, siendo más preciso que el anterior. Se define así el coeficiente
de asimetría de Fisher como:
Valores de la
Variable con la
Media
Bases Estadísticas Aplicadas a la Prevención
15
Curtosis
La curtosis mide lo puntiaguda que es una distribución, indica si la distribución es muy
apuntada o poco apuntada. El coeficiente de curtosis mide el grado de apuntamiento de la
distribución y se calcula según la siguiente expresión:
Curtosis Negativa
Curtosis Nula
Curtosis Positiva
Planticúrtica
Mesocúrtica
Leptocúrtica
Bases Estadísticas Aplicadas a la Prevención
16
REGRESIÓN
Está relacionada con el estudio estadístico en el que intervienen dos variables, X e Y, que
pueden estar ligadas entre sí en base a un tipo de distribución bidimensional.
El primer paso es agrupar los datos correctamente, elaborando la llamada tabla de correlación.
A cada variable se le asocia un intervalo, procediendo de igual forma que para el caso de
una única variable independiente cuando se agrupan los datos. Los intervalos se describen de
menor a mayor y se va apuntando en las casillas de cruce el número de datos que
corresponda.
Representación Gráfica
Los intervalos se representarán tridimensionalmente en forma de paralelepípedos verticales
con volúmenes proporcionales a las frecuencias, f ij , de cada rectángulo, formándose el
llamado estereograma de frecuencias relativas. Uniendo los centros de cada cara
superior del estereograma se obtendrá la superficie de frecuencias que corresponde a los
polígonos.
Bases Estadísticas Aplicadas a la Prevención
17
Correlación
Es el grado de influencia de una variable sobre otra. El caso más sencillo sería el de la
correlación lineal, se da una dependencia lineal entre las dos variables.
La recta de ecuación y = a + bx , representa, de la mejor forma posible, la ley de dependencia
de la variable Y en función de X como variable independiente. Esta recta se llama recta de
regresión de Y sobre X.
Recta de Regresión Lineal
Para saber en qué medida se aproxima cada valor observado al valor teórico obtenido
matemáticamente por la fórmula, se establece el denominado coeficiente de correlación
“r”, cuyo cuadrado es igual al cociente de la varianza debida a la influencia de X y de la
varianza total:
Bases Estadísticas Aplicadas a la Prevención
18
DISTRIBUCIONES
Una variable aleatoria discreta asume cada uno de sus valores con una cierta
probabilidad. Conviene representar mediante una fórmula todas las probabilidades de una
variable aleatoria X. Esta fórmula debe ser una función de la forma f(x), g(x), etc., y se escribe
f ( x) = P( X = x ) .
Al conjunto de pares ordenados [x, f ( x )] se le denomina función de cuantía o distribución de
probabilidad de X.
Una variable aleatoria continua tiene una probabilidad cero de asumir cualquiera de sus
valores exactamente y puede tener una fórmula que será una función de los valores
numéricos de la variable continua X y se denotará por f(x). A esta función se le llama función de
densidad de X.
La mayoría de las funciones de densidad que en la práctica se usan para el análisis de datos
estadísticos son continuas. Las áreas se usarán para representar las probabilidades que tienen
valores positivos.
Tipos de Distribuciones
Distribución discreta que tiene asociada una función de cuantía. Si
“p” es la probabilidad de que un suceso ocurra en un intento y
“q = 1 - p” es la probabilidad de que no ocurra en un intento, la
probabilidad de que el suceso ocurra X veces en “n” intentos será:
Donde:
Binomial
■
X = 0, 1, 2,..., n, es una variable discreta.
■
n! = n (n-1) (n-2)...1
■
0! = 1
Si en un problema estadístico en que se manejen variables cualitativas
se relaciona la probabilidad “p” con “X”, se aplicará la distribución
binomial siempre.
Ejemplo típico: cálculo de las probabilidades de que a lo largo de 15
meses ocurran uno, dos, tres, etc., sucesos determinados, siendo “p”
la probabilidad de que en un mes ocurra el suceso, “q” sería la
probabilidad de que no ocurriera.
En este caso n = 15 y X = 1, 2, 3, …, 15, sólo valores enteros.
Bases Estadísticas Aplicadas a la Prevención
19
Distribución discreta que expresa la probabilidad de un número k de
eventos que ocurren en un tiempo fijo, si estos eventos ocurren con
una tasa media conocida, y son independientes del tiempo desde el
último evento:
Donde:
Poisson
■
k es el número de ocurrencias de un evento.
■
λ es un número real positivo, equivalente al número esperado de
ocurrencias durante un intervalo dado.
Esta distribución se aplica con frecuencia en el caso de un suceso de
probabilidad muy pequeña en cada observación, para calcular las
probabilidades (PK) de que ocurra el suceso “K veces” en un número
muy grande de observaciones. Por ello, se denomina a veces ley de
los sucesos raros.
Determinados accidentes se ajustan a este tipo de distribución.
Bases Estadísticas Aplicadas a la Prevención
20
Distribución de probabilidad continua. Su función de densidad
viene expresada por una fórmula exponencial que se representa con
forma acampanada, campana de Gauss.
Características de la Curva Normal N ( X , σ )
■
Simétrica respecto a la ordenada de la media aritmética.
■
Decrece cuando la variable se aleja de la media.
■
El valor máximo de frecuencia corresponde a la media.
■
Los dos puntos de inflexión corresponden a (µ+σ) y (µ-σ).
■
El área comprendida entre la curva y el eje X es la unidad.
Normal o De
Gauss
Por tanto, el área bajo la curva entre X=a y X=b, con a < b, representa
la probabilidad de que X esté entre a y b: P(a < X < b) = P(b) -P(a) =
f(b) - f(a). La probabilidad de obtener un valor mayor que b será P(X >
b) = 1 - P(b) = 1 - f(b).
■
El 68% de los datos de la distribución normal están en el intervalo
( X -σ, X +σ).
■
El 95% de los datos de la distribución normal están en el intervalo
( X -2σ, X +2σ).
■
El 99% de los datos de la distribución normal están en el intervalo
( X -3σ, X +3σ).
Todo esto se observa gráficamente para el caso de la normal N(0,1):
Bases Estadísticas Aplicadas a la Prevención
21
Bases Estadísticas Aplicadas a la Prevención
22
ESTIMACIÓN DE UNA MUESTRA
Es importante inferir información sobre la población a partir de muestras tomadas de ella.
De ello trata la inferencia estadística, de la estimación de parámetros de la población, por
ejemplo la media o varianza de la población, a partir de los correspondientes estadísticos
muestrales, media o varianza de la muestra.
Cuando se intenta alcanzar una decisión, relativa a una población, es útil hacer hipótesis de la
población implicada que pueden ser ciertas o no. Generalmente, las hipótesis estadísticas son
enunciados acerca de la distribución de probabilidad de las poblaciones.
Contraste de Hipótesis y Significación
Contrastar una hipótesis estadística consiste en aceptar o rechazar, con un cierto grado de
confianza, medida numéricamente, y previa observación de muestras de una población, una
hipótesis hecha sobre dicha población.
La idea de contrastar una hipótesis consiste en tomar una muestra de observaciones y calcular
el estadístico correspondiente al parámetro a contrastar, y si el valor hallado para el estadístico
es próximo al supuesto para el parámetro se acepta la hipótesis y, en caso contrario, se
rechaza.
Rechazo de una Hipótesis
Si se supone que una hipótesis dada, sobre una población, es cierta, pero los resultados
hallados en una muestra aleatoria difieren mucho de los esperados bajo tal hipótesis, las
diferencias observadas son significativas y se debe rechazar la hipótesis.
Si se rechaza una hipótesis cuando debiera ser aceptada, se comete un error de Tipo I. Al
contrastar una hipótesis, la máxima probabilidad de correr el riesgo de rechazar una
hipótesis que debiera ser aceptada se llama nivel de significación del contraste.
Esta probabilidad se denota normalmente por α y se suele especificar antes de tomar la
muestra para que los resultados obtenidos no influyan en la elección. Si α es el nivel de
significación, 1 - α es el nivel de confianza.
En la práctica se suele tomar un nivel de significación de 0,05 (o 5%) o 0,01.
Si α = 5%, hay 5 oportunidades entre 100 de rechazar la hipótesis cuando debiera
aceptarse. Es decir, se tiene un 95% de confianza de que hemos adoptado la decisión
correcta.
Se pueden realizar contrastes mediante la distribución normal.
Bases Estadísticas Aplicadas a la Prevención
23
ESTADISTICA APLICADA A LA PREVENCIÓN DE RIESGOS LABORALES
Mediante la estadística se pueden sacar conclusiones válidas y adoptar decisiones razonables
basadas en el análisis de datos. Se puede hablar por ejemplo de estadística de accidentes y de
enfermedades profesionales teniendo en cuenta los promedios derivados de los datos.
En la prevención son las variables cuantitativas continuas las que más se emplean, para
manejar adecuadamente los valores conviene ordenarlos de menor a mayor.
Aplicaciones de la Estadística en el Campo de la Prevención
Seguridad
Seguimiento de la accidentalidad, árbol de causas y efectos, fiabilidad de
un sistema, etc.
■
Higiene teórica: establecimiento de valores límite ambientales.
■
Higiene operativa: correlación de causas y efectos y operatividad de
medidas correctoras.
■
Higiene de campo: factores determinantes (quirófanos, muestreo
ambiental y ejecución de un programa de actuación).
Higiene
Medicina
Preventiva
Estudios epidemiológicos, etc.
Muestreo Ambiental. Esquema del Planteamiento
La valoración higiénica clásica de un puesto de trabajo consiste en comparar la exposición
del trabajador que lo ocupa con las exposiciones máximas permisibles correspondientes,
indicadas en el criterio de valoración elegido.
El parámetro básico con el que se cuantifica la exposición es la concentración media
ponderada en el tiempo, y la medición de dicha exposición se hace mediante procedimientos
de toma de muestras y análisis.
En términos de la valoración higiénica, la duración del ciclo de trabajo y las concentraciones
medias que existen durante éste, determinarán la exposición a los contaminantes. Por ello, a la
hora de determinar dichas concentraciones, las medidas han de cubrir un número entero de
ciclos de trabajo.
Bases Estadísticas Aplicadas a la Prevención
24
Ciclo de Trabajo
Duración
Serie definible de tareas que se van repitiendo de forma idéntica y
sucesiva.
Del Ciclo de trabajo.
Concentraciones
Que existen durante el ciclo de trabajo.
Medias
Tipos de Errores
Se deben tener en cuenta siempre tres tipos de error para que las mediciones sean
representativas de la situación que existe realmente en el puesto de trabajo.
■
Se da cuando se analiza el puesto y se determina el ciclo de
trabajo. Si el ciclo de trabajo no se estima correctamente, las
mediciones que se hagan posteriormente serán menos
representativas.
■
No se puede tratar estadísticamente y, dependiendo de la
experiencia del higienista, podrá minimizarse más o menos.
■
Es el que se imputa al método e instrumentos de medición y
que puede dar lugar a diferencias entre la concentración media
medida y la que existe realmente durante el ciclo de trabajo
muestreado.
■
Suele ser despreciable con respecto a los otros dos.
Primer Error
Segundo Error
Bases Estadísticas Aplicadas a la Prevención
25
Tercer Error
■
Se debe a variaciones aleatorias de determinados factores,
corrientes de aire, etc., que no se observan pero que pueden
influir bastante en la concentración que exista en ese momento.
■
La concentración ambiental media que corresponde a un ciclo de
trabajo es una variable aleatoria y no se comporta como una
constante a lo largo de los sucesivos ciclos. Los posibles errores,
debido a las fluctuaciones de la concentración, pueden
controlarse haciéndose varias mediciones y tratando
estadísticamente los resultados obtenidos.
Distribución Log-Normal. Concentraciones Ambientales
La concentración medida durante un ciclo de trabajo determinado es una variable
aleatoria que sigue una distribución de probabilidad log-normal, por tanto, los logaritmos
de la variable siguen una ley normal.
Una de las condiciones importantes para que se cumpla la hipótesis de log-normal de los
resultados de las tomas de muestras ambientales es que estas sean de duración
aproximadamente igual.
Las concentraciones varían teóricamente entre cero e infinito. La probabilidad de que la
concentración medida esté más o menos alejada de la concentración media real depende de si
el valor de la desviación típica es mayor o menor, es decir, de la mayor o menor dispersión de
los factores aleatorios que influyen sobre la concentración.
En la práctica, la variabilidad de las concentraciones medidas suele ser importante. Como
medida de dispersión se suele utilizar, en lugar de la desviación standard, el valor de la
desviación standard geométrica, GSD, cuyos valores numéricos son más fáciles de manejar
ya que oscilan entre 1 (concentración constante) y 5 aproximadamente. En la práctica los
valores encontrados suelen hallarse en el intervalo de 1,25 a 2,5.
La desviación standard geométrica (GSD) de las concentraciones es un parámetro que indica la
variabilidad. La GSD es el antilogaritmo de la desviación standard de la distribución de los
logaritmos de las concentraciones y se define como:
Donde σ L es la desviación standard de los logaritmos naturales de las concentraciones.
Ejemplo
En la tabla se indica, en el supuesto de que la media aritmética real de la concentración fuese
10 ppm, la amplitud del intervalo en el que se encontrarían el 50% de las muestras obtenidas
Bases Estadísticas Aplicadas a la Prevención
26
para distintos valores de GSD, ello implica que el 50 % restante se encontraría fuera de dicho
intervalo.
GSD
Intervalo, ppm
1,25
8,6 - 11,6
1,50
7,6 - 13,2
1,75
6,8 - 14,6
2,00
6,3 - 16,0
2,25
5,8 - 17,3
2,50
5,4 - 18,6
En la figura se representan varias distribuciones log-normales con igual media aritmética, 10
ppm, y distintas GSD.
Bases Estadísticas Aplicadas a la Prevención
27

Documentos relacionados