2. Diseño de experimentos 2.1 Diseños Factoriales (dos factores)

Transcripción

2. Diseño de experimentos 2.1 Diseños Factoriales (dos factores)
2. Diseño de experimentos
Curso 2011-2012
Estadística
2.1 Diseños Factoriales
(dos factores)
Ejemplo
V
E
N
E
N
O
S
ANTÍDOTO
B
C
0.82
0.43
1.10
0.45
0.88
0.63
0.72
0.72
0.92
0.44
0.61
0.35
0.49
0.31
1.24
0.40
0.30
0.23
0.37
0.25
0.38
0.24
0.29
0.22
A
0.31
0.45
0.46
0.43
0.36
0.29
0.40
0.23
0.22
0.21
0.18
0.23
I
II
III
D
0.45
0.71
0.66
0.62
0.56
1.02
0.71
0.38
0.30
0.36
0.31
0.33
Se analiza el efecto de tres venenos y cuatro antídotos
en el tiempo de supervivencia de unas ratas.
Diseño Experimentos
3
Modelo
Factor 1
Factor 2
1
2
J
I
1
y111
2
y 211
y I 11
y112
y 212
y I 12
yijk
i
j
ij
uijk
Normalidad
y11m
y121
y 21m
y 221
y I 1m
y I 21
Independencia
y122
y 222
y I 22
Homocedasticidad
y12 m
y 22 m
yI 2m
I J tratamientos
y1J 1
y2 J1
y IJ 1
m replicaciones
y1J 2
y2 J 2
y IJ 2
n=m I J
y1Jm
y 2 Jm
Diseño Experimentos
y IJm
4
Factor 1
2
1
...
...
1
1
Factor 2
I
1
2
11
1
21
I
1
I1
I
2
I2
...
2
1
2
12
2
2
22
...
J
1
J
1J
2
J
2J
I
J
IJ
Modelo
yijk
i
I
i 1 i
0
j
J
j 1
j
ij
0
I
i 1
ij
0,
j
J
j 1
ij
0,
i
: Media global
i : Efecto del Factor 1 i, i=1,...,I
j : Efecto del Factor 2 j, j=1,...,J
ij: Interacción de niveles ij
uijk : Componente aleatoria N(0, 2),
Diseño Experimentos
uijk
6
Estimación del modelo
:
1
i :
I 1
:
j
ij
2
J 1
:
i
y
yi
j
y
ij
( I 1)( J 1)
2
:
J
m
I
k 1
y ij
m
yi
j 1 k 1
y
yi
y j
2
eijk
I
i 1 k 1
j
J
m
yijk
y
mI
y
IJ (m 1)
yijk
y
mJ
y ij
m
yijk
yijk
j
sR2
1
m
y
i 1 j 1 k 1
n
Diseño Experimentos
7
Estimación del modelo
yijk
yijk
eijk
yijk (
Diseño Experimentos
i
j
ij
uijk
i
j
ij
eijk
i
j
ij
) yijk yij
8
Estimación
V
I
E
N
II
E
N
O
III
S
A
0.31
0.45
0.46
0.43
0.41
0.36
0.29
0.40
0.23
0.32
0.22
0.21
0.18
0.23
0.21
ANTÍDOTO
B
C
0.82
0.43
1.10
0.45
0.88
0.63
0.72
0.72
0.88
0.56
0.92
0.44
0.61
0.35
0.49
0.31
1.24
0.40
0.82
0.38
0.30
0.23
0.37
0.25
0.38
0.24
0.29
0.22
0.34
0.24
D
0.45
0.71
0.66
0.62
0.61
0.56
1.02
0.71
0.38
0.67
0.30
0.36
0.31
0.33
0.33
Diseño Experimentos
9
Estimación
A
V
I
E
Medias
ij
N
E
II
N
Medias
ij
O
S
III
Medias
ij
Medias
j
ANTÍDOTO
B
C
D
0,31
0,45
0,46
0,43
0,82
1,10
0,88
0,72
0,43
0,45
0,63
0,72
0,45
0,71
0,66
0,62
0,41
-0,038
0,88
0,067
0,56
0,032
0,61
-0,061
0,36
0,29
0,40
0,23
0,92
0,61
0,49
1,24
0,44
0,35
0,31
0,40
0,56
1,02
0,71
0,38
0,32
-0,060
0,82
0,073
0,38
-0,080
0,67
0,068
0,22
0,21
0,18
0,23
0,30
0,37
0,38
0,29
0,23
0,25
0,24
0,22
0,30
0,36
0,31
0,33
0,21
0,098
0,34
-0,139
0,24
0,048
0,33
-0,007
0,314
0,677
0,389
0,534
-0,164
0,198
-0,089
0,056
Diseño Experimentos
Medias
i
0,615
0,136
0,544
0,066
0,276
-0,202
0,479
10
Residuos
RESIDUOS
V
A
-0.103
0.038
0.048
0.018
0.00
0.040
-0.030
0.080
-0.090
0.00
0.010
0.000
-0.030
0.020
0.00
I
E
N
II
E
N
O
ANTÍDOTO
B
C
-0.060
-0.128
0.220
-0.108
0.000
0.073
-0.160
0.163
0.00
0.00
0.105
0.065
-0.205
-0.025
-0.325
-0.065
0.425
0.025
0.00
0.00
-0.035
-0.005
0.035
0.015
0.045
0.005
-0.045
-0.015
0.00
0.00
III
S
D
-0.160
0.100
0.050
0.010
0.00
-0.108
0.353
0.043
-0.288
0.00
-0.025
0.035
-0.015
0.005
0.00
2
s
2
eijk
2
R
IJ (m 1)
Diseño Experimentos
0,022
11
Análisis de la varianza
yijk
i
j
uijk
ij
yijk
i
j
eijk
ij
yijk
y
( yi
y ) (y
j
y ) ( y ij
yi
y
j
y ) ( yijk
yijk
y
( yi
y ) (y
j
y ) ( y ij
yi
y
j
y ) eijk
I
J
m
I
( yijk
y )
J
m
I
2
i 1 j 1 k 1
( yi
y )
J
m
2
(y
i 1 j 1 k 1
I
J
i 1 j 1 k 1
I
yi
y
m
j
y )2
mJ
i 1 j 1 k 1
eijk2
J
( yi
(y
j
y )2
j 1
J
m
I
( y ij
i 1 j 1
Diseño Experimentos
y ) 2 mI
i 1
I
m
i 1 j 1 k 1
I
( yijk
J
y )2
i 1 j 1 k 1
J
y )2
j
m
( y ij
I
y ij )
yi
y
j
J
m
y )2
2
eijk
i 1 j 1 k 1
12
Variabilidades
I
J
m
VT
( yijk
y
)2
( yi
y
)2
y
)2
i 1 j 1 k 1
I
VE ( A)
mJ
i 1
J
VE ( B )
mI
(y
j
j 1
I
VE ( A B )
J
m
( y ij
i 1 j 1
I
J
yi
y
j
y
)2
m
VNE
( yijk
y ij ) 2
i 1 j 1 k 1
VT
VE ( A) VE ( B) VE ( A B)
(n 1)
VNE
( I 1) ( J 1) ( I 1)( J 1) IJ (m 1)
Diseño Experimentos
13
Contraste de Hipótesis
Si el Veneno no influye, los I niveles son iguales
a efectos de tiempo de supervivencia, entonces
1
H0 :
2
1
H1 : Algún
Diseño Experimentos
I
2
I
i 1 i
I
i
0
0
es distinto de 0
14
Contraste efecto principal de factor A
H0 :
1
2
H1 : Algún
E[ s R2 ]
Si Ho es cierto, s
s
s
2
A
2
R
I
mJ
i 1
VE ( A)
I 1
2
A
( yi
y
s
Si FA
0
es distinto de 0
i
VNE
IJ (m 1)
s R2
FA
I
2
E[ s A2 ]
2
)2 I 1
FI
2
R
1; IJ ( m 1)
Se rechaza Ho
F
Diseño Experimentos
15
Contraste efecto principal de factor B
H0 :
1
2
H1 : Algún
J
j
es distinto de 0
VE ( B)
J 1
Si Ho es cierto, s B2
FB
s B2
s R2
mI
Si FB
Diseño Experimentos
J
(y
j 1
y
j
s
F
0
2
R
E[ s B2 ]
2
)2 J 1
FJ
1; IJ ( m 1)
Se rechaza Ho
16
Contraste interacción AxB
H0 :
11
12
H1 : Algún
ij
es distinto de 0
VE ( A B)
( I 1)( J 1)
2
Si Ho es cierto, s AB
2
s AB
2
sR
FAB
Si FAB
0
IJ
F( I
2
E[ s AB
]
2
1)( J 1); IJ ( m 1)
Se rechaza Ho
A y B interaccio nan
F
Diseño Experimentos
17
Tabla de análisis de la varianza
Fuentes
Suma de
Grados de
Variabilid ad
Cuadrados
Libertad.
mJ
A
mI
B
A B
m
( yij
(y
j
yi
Diseño Experimentos
y
( yijk
I 1
s A2
J 1
2
B
2
j
2
eijk
Residual
Total
y )
y )2
F
s
y )2
( yi
Varianza
y )2
s
( I 1)( J 1)
2
s AB
IJ (m 1)
sR2
2
A
sB2
2
s AB
p valor
sR2
pA
sR2
pB
s R2
p AB
n 1
18
Tabla de análisis de la varianza
Fuentes
Suma de
Grados
F p valor
23.2
.0000
Variabilid ad Cuadrados. Libertad. Varianza
Veneno
1.033
0.516
2
Antídoto
0.921
3
0.307
Ven Ant
0.250
6
0.041
Residual
0.801
36
Total
3.005
47
13.8
1.87
.0000
.1123
0.022
Diseño Experimentos
19
Contrastes múltiples: Factor A
i
j
H0 :
i
j
H1 :
i
j
yi
yj
i
j
yi
sR
R.R
R.R.
tIJ(m-1)
1/2
y
i
y
N(
i
j
,
j
yi
2
2
mJ
mJ
yj
2
mJ
Diseño Experimentos
t IJ ( m
/2
R. Acept. H0
yj
-t
t
/2
/2
)
yi
yj
t
/ 2 sR
1)
2
mJ
LSD
Se rechaza Ho
20
Contrastes múltiples: Factor B
H0 :
i
j
H1 :
i
j
i
y
j
y
i
y
y
j
y
N(
i
sR
tIJ(m-1)
1/2
i
j
R.R
R.R.
i
i
y
j
,
j
2
mI
y
j
2
2
mI
mI
y
i
/2
R. Acept. H0
j
-t
t
/2
/2
)
t IJ ( m
yi
1)
y
j
t
/ 2 sR
2
mI
LSD
Se rechaza Ho
Diseño Experimentos
21
Intervalos de confianza
(interacción nula)
i
i
Diseño Experimentos
yi
y
t
j
t
/2
sR
mJ
/2
sR
mI
22
0.72
0.75
0.62
0.65
0.52
tiempo
tiempo
Intervalos de confianza
0.42
0.55
0.45
0.32
0.35
0.22
0.25
1
2
3
A
veneno
B
C
D
antidoto
Diseño Experimentos
23
Diagnosis: homocedasticidad
0.6
0.3
0.3
0
0
-0.3
-0.3
-0.6
-0.6
residuos
0.6
A B C D
antidoto
Diseño Experimentos
1
2
3
veneno
24
Heterocedasticidad
0.6
residuos
0.4
0.2
0
-0.2
-0.4
-0.6
0
0.2
0.4
0.6
0.8
1
valores previstos
Diseño Experimentos
25
probabilidad
Normalidad
99.9
99
95
80
50
20
5
1
0.1
-0.5
-0.25
0
0.25
0.5
Residuos
Diseño Experimentos
26
Diagnosis: homocedasticidad
datos transformados z=1/y
1.3
1.3
0.9
0.9
0.5
0.5
0.1
0.1
-0.3
-0.3
-0.7
-0.7
-1.1
-1.1
1
2
3
A B C D
veneno
antidoto
Diseño Experimentos
27
Datos transformados
1.2
residuos
0.8
0.4
0
-0.4
-0.8
-1.2
0
1
2
3
4
5
6
valores previstos
Diseño Experimentos
28
probabilidad
Normalidad (datos transformados)
99.9
99
95
80
50
20
5
1
0.1
-1.2 -0.8 -0.4
0
0.4
0.8
1.2
Residuos
Diseño Experimentos
29
Tabla de análisis de la varianza
datos transformados 1/y
Fuentes
Suma de
Grados
Variabilid ad Cuadrados. Libertad. Varianza
Veneno
34.87
17.4
2
Antídoto
20.41
3
6.80
Ven Ant
1.57
6
0.26
Residual
8.68
36
Total
65.50
47
Diseño Experimentos
F p valor
72.6
.0000
28.3
1.09
.0000
.3867
0.24
30
Comparaciones múltiples
4
4
3.6
3.6
1/tiempo
1/tiempo
intervalos de confianza
3.2
2.8
2.4
3.2
2.8
2.4
2
2
1.6
1.6
1
2
3
1
veneno
2
3
4
antidoto
Diseño Experimentos
31
Comandos en R
ARCHIVO TEXTO: venenos.txt
Diseño Experimentos
32
Dos factores con interacción
Diseño Experimentos
33
0.6
0.4
0.5
medias
0.5
0.4
0.2
0.3
0.3
medias
0.6
0.7
0.7
Intervalos de Confianza
I
II
VEN
Diseño Experimentos
III
A
B
C
D
ANT
34
Tabla ANOVA
Diseño Experimentos
35
Comparaciones Múltiples
Diseño Experimentos
36
Comparaciones Múltiples
Diseño Experimentos
37
Interacciones
Diseño Experimentos
38
Diagnosis
Diseño Experimentos
39
Diagnosis (Transformación)
Diseño Experimentos
40
2.2 Bloques Aleatorizados
Ejemplo de introducción
Fluorita
M
e
z
c
l
a
1
2
3
4
5
6
0%
1%
2%
3%
4%
15.02
11.86
9.94
12.45
13.23
8.42
10.15
8.54
6.98
8.93
18.31
16.84
15.86
14.64
15.96
10.49
10.52
8.04
10.50
10.34
9.78
9.59
6.96
8.15
9.24
9.28
8.84
7.04
6.66
9.46
Se desea estudiar el efecto de la Fluorita en la
reducción del coste energético en la fabricación de
cemento. Se emplean 6 mezclas distintas de materias
primas.
Diseño Experimentos
42
Modelo
Bloques
Tratamientos
1
2
I
1
y11
y21
yI1
2
y12
y22
yI 2
y1J
y2 J
y IJ
J
yij
i
Normalidad
Independencia
Homocedasticidad
: Media global
i : Efecto del tratamiento i, i=1,...,I
j : Efecto del bloque j, j=1,2,...,J
uij : Componente aleatoria N(0, 2)
I
i 1 i
J
j 1 j
Diseño Experimentos
43
Tratamientos
...
2
1
I
...
1
1
Bloques
uij
j
2
1
1
I
1
I
2
...
2
1
2
2
2
...
J
1
J
2
J
I
J
0
0
Estimación del modelo
:
i:
j:
Parámetros :
y
1
i
I 1
J 1
2
:
Estimadore s :
2
1
J
y
J
yij
i
j
uij
yij
i
j
eij
i 1
j
( I 1)( J 1)
J
yij
yij
j 1
j
y
y
eij2
s R2
I
I
yij
yi
j
yi
y
i 1j 1
y
I
eij
n
yij
yij
i
yi
j
y
y
j
Diseño Experimentos
45
Estimación
1
2
I
1
y11
y 21
y I1
y
1
y
1
y
2
y12
y 22
yI 2
y
2
y
2
y
J
y1J
y2 J
y IJ
y
J
y
J
y
y1
y2
yI
y
i
y1
y
Diseño Experimentos
y2
y
yI
j
y
46
Estimación (ejemplo)
Fluorita
M
e
z
c
l
a
1
2
3
4
5
6
0%
1%
2%
3%
4%
15.02
11.86
9.94
12.45
13.23
12.50
1.77
8.42
10.15
8.54
6.98
8.93
8.60
-2.13
18.31
16.84
15.86
14.64
15.96
16.32
5.59
10.49
10.52
8.04
10.50
10.34
9.98
-0.76
9.78
9.59
6.96
8.15
9.24
8.74
-1.99
9.28
11.88
1.15
8.84
11.30
0.57
7.04
9.40
-1.34
6.66
9.90
-0.84
9.46
11.19
0.46
8.26
-2.48
10.73
j
i
Diseño Experimentos
47
Residuos: Varianza residual
eij
yij
i
yij
j
yi
y
j
y
Fluorita
M
e
z
c
l
a
0%
1%
2%
3%
4%
1
1.37
-1.21
-1.22
0.79
0.27
2
-1.33
0.98
1.27
-0.79
-0.13
3
0.84
-0.05
0.88
-0.84
-0.82
4
-0.64
-0.02
-0.60
1.36
-0.10
5
-0.11
0.28
-0.45
0.24
0.04
6
-0.13
0.02
0.12
-0.76
0.74
sR2
Diseño Experimentos
eij2
( I 1)( J 1)
17.51
0.88
20
48
Contraste de Hipótesis
Si la Fluorita no influye, los I tratamientos
son iguales a efectos de coste, entonces
1
2
H0 :
I
i 1 i
I
1
2
H1 : Algún
0
0
I
i
es distinto de 0
Diseño Experimentos
49
Análisis de la varianza
yij
i
j
yij
i
j
eij
yij
y
( yi
y ) (y
j
y ) ( yij
yi
y
j
y )
yij
y
( yi
y ) (y
j
y ) ( yij
yi
y
j
y )
I
J
I
( yij
y )
J
I
2
i 1 j 1
I
uij
( yi
y )
i 1 j 1
J
( yij
y )
i 1 j 1
Diseño Experimentos
J
j
y )
eij2
i 1 j 1
y )
2
I
i 1 j 1
I
(y
j 1
J
2
J
( yi
i 1
I
(y
I
2
J
2
j
y )
J
2
eij2
i 1 j 1
50
Variabilidades
I
J
VT
y )2
( yij
i 1 j 1
I
VE (T )
J
y )2
( yi
i 1
J
VE ( B)
I
VT
(y
y )
j
j 1
I
(n 1) ( I 1) ( J 1) ( I 1)( J 1)
J
2
ij
VNE
VE (T) VE (B) VNE
2
e
i 1 j 1
Diseño Experimentos
51
Contraste sobre tratamientos
H0 :
1
H1 : Algún
sR2
2
I
i
VNE
( I 1)( J 1)
FT
( yi
Diseño Experimentos
s R2
F
E[ sT2 ]
2
y )2 I 1
i 1
sR2
Si FT
2
VE(Tratamient os)
I 1
I
sT2
es distinto de 0
E[ s R2 ]
Si Ho es cierto, sT2
J
0
FI
1; ( I 1)( J 1)
Se rechaza Ho
52
Explicación del contraste
Si Ho es cierto
yi
yi1
0
i
yi 2
yij
yiJ
j,
J
j 1
J
E[ y i ]
,
J
N(
2
)
j
J
2
y1 , y 2 ,..., y I
I
y
y1
y2
J
yI
sT2
I
N( ,
J
)
I
( y i - y )2
J
i 1
i 1
E
I 1
( y i - y )2
2
I 1
Cuando Ho es cierto, sT2 y sR2 serán parecidas.
Cuando Ho es falso, sT2 será mayor que sR2 .
Diseño Experimentos
53
Contraste de bloques
H0 :
1
2
H1 : Algún
J
FB
s B2
(y
j 1
s R2
Si FB
Diseño Experimentos
j
j
E[ sB2 ]
2
y )2 J 1
s R2
F
0
es distinto de 0
VE(Bloques )
J 1
Si Ho es cierto, sB2
I
J
FJ
1; ( I 1)( J 1)
Se rechaza Ho
54
Tabla de análisis de la varianza
Fuentes
Suma de
Grados de
Variabilidad
Cuadrados
Libertad.
Tratamient o
Bloque
J
I
y )2
( yi
(y
j
eij2
Residual
Total
Diseño Experimentos
y )2
( yij
y )2
I 1
Varianza
sT2
J 1
s B2
( I 1)( J 1)
s R2
F
sT2
s B2
p valor
s R2
pT
sR2
pB
n -1
55
Tabla de análisis de la varianza
Diseño Experimentos
56
Sin bloques
Diseño Experimentos
57
Intervalos de confianza
(ejemplo)
i
yi
t
/2
sR
J
Fluorita
Medias
L.inf.
L.Sup.
0%
1%
2%
3%
4%
11.88
11.30
9.40
9.90
11.19
11.09
10.50
8.60
9.10
10.40
12.68
12.10
10.19
10.69
11.99
Diseño Experimentos
58
11
10
9
medias
12
Intervalos de Confianza (% Fluorita)
0
1
2
3
4
FLUO
Diseño Experimentos
59
14
12
8
10
medias
16
Intervalos de Confianza (Mezcla)
1
2
3
4
5
6
MEZ
Diseño Experimentos
60
Contraste multiples: tratamientos
H0 :
i
j
H1 :
i
j
i
yi
y
j
yj
y
j
N(
yi
yj
i
sR
R.R
R.R.
t(I-1)(J-1)
1/2
j
yi
2
2
i
i
j,
J
t( I
2
J
/2
R. Acept. H0
yj
-t
t
/2
/2
)
J
yi
1)( J 1)
yj
t
/ 2 sR
2
J
Se rechaza H 0
LSD
Diseño Experimentos
61
Contraste multiples: bloques
H0 :
i
j
H1 :
i
j
i
y
j
y
i
y
j
y
y
j
N(
i
y
sR
2
I
t(I-1)(J-1)
1/2
i
j
2
i
R.R
R.R.
i
j
j,
t( I
Diseño Experimentos
I
y
i
y
R. Acept. H0
j
-t
2
I
1)( J 1)
/2
t
/2
/2
)
y
i
y
j
t
/ 2 sR
2
I
Se rechaza H 0
LSD
62
Comparación de medias
Fluorita
LSD
t
s
/2 R
2
J
2.085 0.93
2
6
0%
1%
2%
3%
4%
0%
0
LSD = 1.13
1%
2%
3%
0,58 2,49 1,99
0
1,90 1,40
0
-0,50
0
4%
0,69
0,11
-1,80
-1,30
0
1.13
Mezcla
LSD
t
s
/2 R
1
2
3
4
2
I
2.085 0.93
2
5
1
0,00
2
3,90
0
LSD=1.24
3
4
-3,82 2,52
6,60 -1,37
0 6,34
0
5
6
5
3,76
-0,14
7,58
1,23
6
4,24
-0,35
8,07
1,72
0
0,49
0
1.24
Diseño Experimentos
63
Comparación de medias (Tukey)
4-3
4-2
3-2
4-1
3-1
2-1
4-0
3-0
2-0
1-0
95% family-wise confidence level
-4
-2
0
2
Differences in mean levels of FLUO
Diseño Experimentos
64
Comparación de medias (Tukey)
6-5
5-4
5-3
6-2
4-2
6-1
4-1
2-1
95% family-wise confidence level
-10
-5
0
5
10
Differences in mean levels of MEZ
Diseño Experimentos
65
Diagnosis:
Homocedasticidad
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
Gráfico de residuos
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
0
1
2
3
4
5
6
Mezcla
1.6
0
1
2
Fluorita
3
4
residuos
1.2
0.8
0.4
0
-0.4
-0.8
-1.2
-1.6
5
10
15
Valores previstos
20
Diagnosis
Diseño Experimentos
2.3 Diseños Factoriales
(tres factores)
67
Diseño con tres factores
Factor A
A1 A2 A3 A4 A5 A6
Factor B
B1
B2
B3
B4
B5
C1
C2
C3
Factores A, B y C con NA, NB,
Nc niveles.
Nº de Tratamientos
T=NAxNBxNc
Efectos principales 3 A, B , C
Interacciones de orden dos 3
AxB, AxC, BxC
Interacción de orden tres 1.
AxBxC
Tratamiento: Cada combinación de niveles de los factores
6 x 5 x 3 = 90
Diseño Experimentos
69
K factores con N1, N2, ..., NK
niveles
K efectos principale s con N i 1 grados de libertad cada uno
K
2
interaccio nes de orden 2, con (N i 1 )(N j 1 ) grados
de libertad
K
3
interaccio nes de orden 3, con (N i 1 )(N j 1 )(N k 1 )
grados de libertad
...
K
K
1 interacció n de orden k, con (N 1 1 )(N 2 1 )
(N K 1 )
grados de libertad
Diseño Experimentos
70
Datos
Factor 1
11
Factor 2
11
2
...
JJ
11
22
y1111
Factor 3
1
22
......
K
K
11
22
y1121
y11K 1
y 2111
y1112
y1122
y11K 2
y111 M
11
y112 M
22
y1211
2
II
...
K
K
K
K
11
22
y 2121
y11K 1
y I 111
y I 121
y I 1K 1
y 2112
y 2122
y11K 2
y I 112
y I 122
y I 1K 2
y11KM
K
K
y 211 M
11
y 212 M
22
y11KM
K
K
y I 11M
11
y I 12 M
22
y1221
y12 K1
y 2211
y 2221
y 22 K 1
y I 211
y I 221
y I 2K1
y1212
y1222
y12 K 2
y 2212
y 2222
y 22 K 2
y I 212
y I 222
yI 2K 2
y121 M
y122 M
y12 KM
y 221 M
y 222 M
y 22 KM
y I 21M
y I 22 M
y I 2 KM
11
22
K
K
11
22
KK
11
22
y1J 11
y1J 21
y1JK1
y 2 J 11
y 2 J 21
y 2 JK1
y IJ 11
y IJ 21
y IJK1
y1J 12
y1J 22
y1JK 2
y 2 J 12
y 2 J 22
y 2 JK 2
y IJ 12
y IJ 22
y IJK 2
y1J 1M
y1J 2 M
y1JKM
y 2 J 1M
y2 J 2M
y 2 JKM
y IJ 1M
y IJ 2 M
y IJKM
......
......
......
...
......
...
...
...
...
y I 1KM
KK
...
...
K
K
......
Diseño Experimentos
71
Ejemplo: Proceso químico
Concentración
1
4%
2
6%
3
8%
4
10%
Tres factores:
Temperatuta
T-1
300º C
T-2
320º C
Catalizador
C-1
Ag
C-2
Ag+Zn
C-3
Zn
Variable respuesta: Rendimiento del proceso químico.
CONCENTRACIÓN
CATALIZADOR
1
2
3
4
T-1
T-2
T-1
T-2
T-1
T-2
T-1
T-2
C-1
72.2
74.4
64.3
65.0
71.6
61.9
74.4
66.3
66.5
69.2
71.8
64.6
75.0
78.9
64.3
70.7
80.6
73.4
80.0
65.0
82.1
73.0
74.4
78.8
T-1
T-2
T-1
T-2
T-1
T-2
T-1
T-2
C-2
62.5
65.8
71.2
75.9
72.9
77.8
70.8
63.9
76.6
79.2
80.1
75.3
76.3
79.1
89.0
83.3
88.0
84.7
72.3
72.4
75.6
80.3
86.9
86.3
T-1
T-2
T-1
T-2
T-1
T-2
T-1
T-2
C-3
69.0
70.3
68.8
73.8
59.2
80.8
69.0
68.2
78.7
84.5
93.7
80.1
72.8
73.7
80.7
94.1
87.3
89.0
78.4
79.9
80.3
87.5
79.7
79.5
Diseño Experimentos
72
K
Modelo
yijkm
i
j
k
I
i 1 i
0
J
j 1
ij
J
j 1
0
K
k 1
ik
0
J
j 1
j
K
k 1 k
I
ijk
i
0,
ij
I
i 1
ij
0,
j
0,
i
I
i 1
ik
0,
k
k
K
k 1
0,
J
j
0,
ijk
j
K
k
i, k ;
I
0,
jk
J
uijkm
ijk
i
Normalidad
uijkm
jk
0,
jk
j, k , ;
ik
0,
ijk
i, j.
K tratamientos
M replicaciones
Independencia
Homocedasticidad
J
n = I
K
M
Diseño Experimentos
73
Medias
yijkm
i
I
j
k
ij
ik
jk
ijk
uijkm
J K M
yijk
y
i 1 j 1k 1m 1
IJKM
J K M
I
yijkm
yi
j 1k 1m 1
JKM
y
i 1 k 1m 1
j
y
IKM
J M
k 1m 1
KM
yi
j 1m 1
k
JM
i 1 j 1m 1
k
I
yijkm
yijkm
J M
yijkm
yijkm
K M
y ij
I
K M
IJM
K
yijkm
y
i 1k 1
jk
IM
M
yijkm
y ijk
m 1
M
Diseño Experimentos
74
Medias: Proceso químico
Concentración
Catalizador
C-1
C-2
C-3
1
68.2
71.0
70.3
69.9
2
68.8
74.3
79.0
74.1
3
73.8
83.4
82.9
80.1
4
75.6
79.0
80.9
78.5
71.6
76.9
78.3
75.6
Temperatura
T-1
T-2
1
68.72
70.99
69.9
2
70.49
77.61
74.1
3
76.64
83.46
80.1
4
76.22
80.71
78.5
73.02
78.19
75.6
C-1
C-2
C-3
T-1
T-2
71.95
72.96
74.15
73.02
71.25
80.89
82.43
78.19
1
C-1
C-2
C-3
71.6
76.9
78.3
75.6
2
3
4
T-1
T-2
T-1
T-2
T-1
T-2
T-1
T-2
70.30
66.50
69.37
66.17
75.53
71.27
69.07
70.43
71.97
68.53
78.20
86.10
72.73
81.47
75.73
74.90
85.33
90.13
75.70
73.43
79.53
75.40
84.50
82.23
Diseño Experimentos
75
Estimación del modelo
j
y
yi
y
k
y
i
I 1
J 1
k
y
K 1
ij
y ij
ik
yi
k
jk
y
jk
ijk
2
j
y
y
s R2
y ijk
yi
y
yi
y
y
j
y ij
y
j
( I 1)( J 1)
y
k
( I 1)( K 1)
y
k
y
yi
k
y
2
eijkm
IJK ( M 1)
Diseño Experimentos
;
( J 1)( K 1)
jk
eijkm
yi
y
yijkm
y ijk
j
y
k
y
( I 1)( J 1)( K 1)
76
Modelo estimado
yijkm
i
yijkm
j
y
k
yi
y ij
ij
y
y
yi
y
y
yi
k
yi
y
jk
y
y ijk
y ij
yijkm
y ijk
y
y
jk
yi
ijk
uijkm
y
k
y
k
yi
j
jk
y
j
y
j
ik
y
k
y
k
y
y
j
y
k
Diseño Experimentos
77
Descomposición de la
variabilidad
I
J K M
yijkm
2
y
i 1 j 1k 1m 1
JKM
yi
2
y
IKM
i
y
j
2
IJM
j
KM
y ij
i
y
2
y
2
k
y
y
2
k
yi
k
y
y
k
yi
y
jk
y
j
k
2
y
k
y
yi
y
j
JM
yi
i k
IM
y
j
j k
M
i
i
y ijk
y ij
yijkm
y ijk
jk
yi
y
j
y
k
y
2
j k
2
j k m
Diseño Experimentos
78
Variabilidades
I
J K M
VT
yijkm
2
y
VE ( A)
JKM
i 1 j 1k 1m 1
VE ( B )
IKM
y
2
y
j
y ij
i
VE (C )
IJM
y
k
y
2
yi
y
k
yi
y
jk
y
y
y
2
y
2
k
y
2
k
j
j
JM
yi
i
VE ( B C )
2
k
KM
VE ( A C )
y
i
j
VE ( A B )
yi
k
IM
y
j
j k
VE ( A B C )
M
y ijk
i
VNE
yi
k
y
jk
yi
y
j
y
k
2
y
j k
yijkm
i
y ij
y ijk
2
j k m
Diseño Experimentos
79
Grados de libertad
DESCOMPOSI CIÓN DE LA VARIABILID AD
VT
VE ( A) VE ( B ) VE (C )
VE ( A B ) VE ( A C ) VE ( B C )
VE ( A B C ) VNE
GRADOS DE LIBERTAD
(n 1)
( I 1) ( J 1) ( K 1)
( I 1)( J 1) ( I 1)( K 1) ( J 1)( K 1)
( I 1)( J 1)( K 1) IJK ( M 1)
Diseño Experimentos
80
Tabla ANOVA
FUENTE VARIABILID AD
A
JKM
yi
Gr . de Lib.
2
y
I 1
Varianzas F
s A2
s2
J 1
s B2
s B2
K 1
sC2
( I 1)( J 1)
2
s AB
( I 1)( K 1)
2
s AC
( J 1)( K 1)
2
s BC
A
i
B
y
y
2
j
y
y
2
k
IKM
j
C
IJM
sC2
k
A B
KM
y ij
i
A C
2
y
2
k
y
y
2
k
yi
k
y
y
k
yi
y
jk
y
j
yi
i
y
j
j k
M
A B C
( y ijk
y ij
...
jk
j k
... y i
Residual
yijkm
i
I
s R2
2
s AB
2
s AC
k
IM
i
s R2
j
JM
B C
y
yi
s R2
y
y
j
2
y ijk
yijkm
2
y
s R2
s R2
2
s ABC
s R2
s R2
IJK ( M 1)
j k m
J K M
Total
k
)2
y
2
( I 1)( J 1)( K 1) s ABC
2
s BC
s R2
IJKM 1
i 1 j 1k 1m 1
Diseño Experimentos
81
Contraste efecto principal de factor A
H0 :
1
H1 : Algún
2
i
es distinto de 0
I
FA
s A2
s R2
FI
JKM
0
I
( yi
y
)2 I 1
i 1
FI
s R2
1; IJK ( M 1)
Si FA
F
1; IJK ( M 1)
No se rechaza Ho
RR
Si FA
F
Se rechaza Ho
F
Diseño Experimentos
82
Contraste interacción AxB
H0 :
11
H1 : Algún
ij
es distinto de 0
VE ( A B)
( I 1)( J 1)
2
Si Ho es cierto, s AB
FAB
Si FAB
2
s AB
F( I
s R2
0
IJ
12
1)( J 1); IJK ( M 1)
Se rechaza Ho
A y B interaccio nan
F
Diseño Experimentos
83
Contraste interacción AxBxC
H0 :
111
112
H1 : Algún
ijk
IJK
0
es distinto de 0
Si Ho es cierto
FABC
2
s ABC
Si FABC
Diseño Experimentos
F( I
s R2
F
1)( J 1)( K 1); IJK ( M 1)
Se rechaza Ho
84
Análisis de la varianza
Diseño Experimentos
85
Interpretación
El efecto principal del factor concentración
influye significativamente (p-valor =0.0000)
en el rendimiento. Más adelante se
compararán las medias de los cuatro niveles
de este factor. Este factor no interacciona
con ningún otro.
Los efectos principales de catalizador y de
la temperatura son significativos, además
es muy significativa la interacción de los dos
factores (p-valor 0.0064). La comparación
de medias de estos factores debe ser
conjunta.
Diseño Experimentos
86
Contrastes múltiples: Factor A
H0 :
i
j
H1 :
i
j
i
yi
y
j
yj
y
i
j
yi
/2
i
j
j,
i
JKM
yj
yi
-t
2
JKM
/2
R. Acept. H0
yj
t
/2
/2
)
t IJK ( M
2
JKM
sR
tIJK(M-1)
1-
2
N(
R.R
R.R.
Si yi
1)
yj
t
s
/2 R
2
,
JKM
se rechaza Ho
Diseño Experimentos
87
78
76
74
medias
72
74
76
medias
75
k1
k2
k3
k4
con
Diseño Experimentos
70
72
70
medias
78
80
80
80
Intervalos de Confianza
t1
t2
temp
c1
c2
c3
cat
88
Interacción: Cat. x Temp.
C-1
C-2
C-3
T-1
T-2
71.95
72.96
74.15
73.02
71.25
80.89
82.43
78.19
71.6
76.9
78.3
75.6
Medias
Interacción Cat x Temp
84.00
82.00
80.00
78.00
76.00
74.00
72.00
70.00
Temp - 1
Temp - 2
0
1
2
3
4
Catalizador
Diseño Experimentos
89
Selección de temperatura y
catalizador.
Las mejores combinaciones corresponden a la temperatura 2,
con el catalizador 2 o el 3.
Diseño Experimentos
90
2.0
3.0
con
4.0
1.4
-5
0
5
10
1.0
-10
-5
0
5
residuals(mod_qui)
10
1.0
-10
residuals(mod_qui)
5
0
-5
-10
residuals(mod_qui)
10
Diagnosis del modelo
1.8
temp
1.0
1.5
2.0
2.5
cat
Diseño Experimentos
91
Instrucciones de R utilizadas
ARCHIVO TEXTO: quimico.txt
Diseño Experimentos
92
3.0
Análisis de 3 factores con
menos observaciones
Cuando no existe interacción de orden tres.
No es necesario replicar para analizar el experimento.
La variabilidad explicada por el término A B C se
convierte en Variabilidad Residual con (I-1)(J-1)(K-1)
grados de libertad.
Las expresiones anteriores siguen siendo válidas,
sustituyendo M=1 (sin replicación) y con (I-1)(J-1)(K-1)
como grados de libertad de la varianza residual.
Cuando no existe ninguna interacción
Se puede reducir considerablemente el número de
observaciones si el número de niveles de los tres
factores es el mismo: CUADRADO LATINO
Diseño Experimentos
93
Tabla ANOVA tres factores
(sin replicación)
FUENTE VARIABILID AD
A
JK
yi
Gr . de Lib.
y
2
I 1
Varianzas F
s A2
s2
J 1
s B2
K 1
sC2
( I 1)( J 1)
2
s AB
( I 1)( K 1)
2
s AC
( J 1)( K 1)
2
s BC
A
i
B
y
y
2
j
y
y
2
k
IK
s B2
j
C
IJ
k
A B
K
y ij
i
A C
B C
2
y
2
k
y
y
2
k
yi
k
y
y
k
yi
y
jk
y
j
yi
y
j
j k
( yijk
Residual
y ij
2
s AB
2
s AC
y
J K
Total
yijk
y
j
2
y
k
2
s BC
s R2
s R2
s R2
...
jk
j k
... y i
I
s R2
k
I
i
s R2
j
J
i
y
yi
sC2
s R2
y
)
2
( I 1)( J 1)( K 1) s R2
IJK 1
i 1 j 1k 1
Diseño Experimentos
94
Ejemplo: Obleas
Horno AS
1
1
2
1
2
2
1
3
2
1
4
2
1
122.2
138.4
131.0
147.4
120.5
140.6
100.0
117.0
Temperatura
2
103.2
144.3
133.4
138.0
102.8
126.6
105.8
134.4
3
115.8
159.8
121.8
147.5
120.0
141.9
114.7
131.7
Se ha realizado un experimento para analizar la influencia de la
temperatura y el acabado superficial (AS) en el espesor de
óxido conseguido en obleas de silicio. El experimento se repitió
en cuatro hornos diferentes. ( Cada uno de los datos del cuadro
representa la media de los espesores medidos en el centro de
cada una de las 30 obleas que caben en un horno)
Diseño Experimentos
95
ANOVA: Obleas
Diseño Experimentos
96
Comparación de medias
El AS que produce mayor espesor es el 2
El horno que produce media mayor es el
2, aunque no es significativamente distinto
del 1.
Diseño Experimentos
97
Cuadrado latino
Permite analizar
tres factores con K
niveles cada uno,
utilizando sólo K2
observaciones.
Deben ser nulas
las interacciones
de orden 2 y orden
3.
Diseño Experimentos
1
2
3
4
5
1
C
A
D
B
E
2
D
C
B
E
A
3
E
B
A
D
C
4
B
E
C
A
D
5
A
D
E
C
B
98
Ejemplo: Aditivos gasolina
Una organización de consumidores estudió la eficacia de
cinco aditivos que según los fabricantes reducían el
consumo de combustible. Se realiza un diseño
experimental con cinco conductores, cinco vehículos y
cinco aditivos, eligiendo las 25 combinaciones que se
muestran en la tabla, junto con una medida del consumo.
1
Conductor
1
2
3
4
5
Vehículo
3
2
C
A
71
D
64
D
C
65
B
B
63
66
D
73
A
77
A
85
D
79
70
82
C
74
E
Aditivo
A
B
C
D
E
82
82
D
C
77
A
E
A
E
78
81
68
B
5
E
68
64
E
4
B
88
C
74
B
78
80
88
Diseño Experimentos
99
Modelo: Cuadrado Latino
yij (k )
i
j
k
uij ( k )
1
2
3
4
5
1
y11(3)
y 21(1)
y31( 4)
y 41( 2)
y51(5)
2
y12 ( 4)
y 22 (3)
y32 ( 2)
y 42 (5)
y52 (1)
3
y13(5)
y 23( 2)
y33(1)
y 43( 4)
y53(3)
4
y14 ( 2)
y 24 (5)
y34 (3)
y 44 (1)
y54 ( 4)
5
y15 (1)
y 25 ( 4)
y35 (5)
y 45 (3)
y55 ( 2)
K
i 1 i
0
K
j 1
j
0
K
k 1 k
0
Normalidad
uij (k )
Independencia
K2 Observaciones
Homocedasticidad
Diseño Experimentos
100
Estimación
yij ( k )
i
K K
( )
K
K
yij ( k )
i 1j 1
yi
2
y
y
K
y
K
k 1
(k )
K
( )
yi
( )
j
y
j( )
y
( )
K 1
k
y
(k )
y
( )
K 1
y
yij ( k )
2
yij ( k )
i 1
j( )
i
eij ( k )
K
yij ( k )
j 1
( )
uij ( k )
k
K
yij ( k )
y
j
K 1
( )
yi
y
( )
j( )
2
ij ( k )
e
s R2
( K 1)( K 2)
y
(k )
2y
( )
;
Diseño Experimentos
101
Descomposición de la
variabilidad
yij ( k )
yij ( k )
y
( )
( yi
K K
i
y
( )
( ))
(y
j( )
y
j
j( )
uij ( k )
k
y
( ))
K
y
(y
(k )
y
( ))
eij ( k )
2
yij ( k )
y
( )
yi
y
( )
i 1j 1
K
( )
2
K
i
y
j
2
( )
(k )
y
2
eij ( k )
( )
k
i
2
j
Grados de Libertad
( K 2 1)
( K 1) ( K 1) ( K 1) ( K 1)( K 2)
Diseño Experimentos
102
Tabla ANOVA
FUENTE VARIABILID AD
A
K
yi
( )
y
j( )
y
(k )
y
2
( )
Gr. de Lib.
Varianzas
K 1
s A2
K 1
sB2
K 1
sC2
F
s A2
i
B
K
y
2
( )
s B2
j
C
K
y
2
( )
k
eij2( k )
Residual
i
K
yij ( k )
sR2
sR2
( K 1)( K 2) sR2
j
K
Total
sC2
sR2
y
2
( )
K2 1
i 1 j 1
Diseño Experimentos
103
Tabla análisis de la varianza
Diseño Experimentos
104
75
65
70
medias
80
85
Comparación: vehículos
1
2
3
4
5
VEH
Diseño Experimentos
105
Diseño de experimentos
1. En una planta piloto se obtiene un nuevo producto mediante un proceso quı́mico. Con el
fin de mejorar el rendimiento se emplean dos catalizadores distintos y se trabaja con tres
temperaturas diferentes. Los resultados del experimento son
Catalizador
A
B
Temperatura
20
300
400
115 125 130 140 110 120
115 105 135 145 100 110
0
(a) Contrastar si los factores Temperatura y Catalizador tienen efectos significativos. (α =
0.05)
(b) ¿Qué tratamiento se debe utilizar para obtener el mayor rendimiento, si se desea garantizar una probabilidad de error tipo I total, αT = 0.03?
2. Se pretende estudiar el efecto que produce los factores (1) Porcentaje de algodón (10%, 20%
y 30%) (2) Tipo de confección (A y B) en la resistencia al desgaste de ciertos tejidos de fibra
sintética. Se ha realizado el siguiente diseño con tres replicaciones
A
B
10% 20% 30%
115 120 126
112 135 118
133 139 142
107 110 132
114 102 114
108 117 125
(a) Construir la tabla de Análisis de la Varianza y contrastar la influencia de los dos factores
y la presencia de la interacción.
(b) Hacer un contraste de diferencia de medias y decidir el tratamiento más adecuado para
conseguir la mayor resistencia al desgaste.
3. Cierto Organismo Público (O.P.) encargado de certificar la composición de aleaciones de
metales preciosos, debe seleccionar entre dos Laboratorios al más capacitado para la realización de futuros análisis de gran precisión. Para tomar la decisión les somete a la siguiente
prueba: Prepara tres aleaciones A, B y C que contienen proporciones distintas de oro.
De cada una de ellas envı́a cuatro muestras a cada uno de los dos laboratorios. Ası́ pues,
cada laboratorio recibe un lote de 12 muestras (codificadas) ordenadas aleatoriamente sin
conocer como han sido obtenidas. Los resultados recibidos por el O.P. son (entre paréntesis
las medias de las casillas):
1
Lab. I
Lab. II
Aleac. A
10.96 11.03
11.08 11.01
(11.02)
10.97 10.96
10.94 10.95
(10.955)
Aleac. B
10.95 11.00
11.04 10.97
(10.99)
10.97 10.96
10.97 10.98
(10.97)
Aleac. C
11.07 11.01
10.97 11.03
(11.02)
11.02 11.00
11.01 11.01
(11.01)
(a) Determinar si existen diferencias entre los resultados de los laboratorios y si éstos han
encontrado diferencias entre las aleaciones.
(b) Aceptando que los datos cumplen la hipótesis de normalidad, indicar si podemos aceptar
que verifican el resto de las hipótesis del modelo y en caso negativo que medidas se deben
adoptar para analizar los datos.
(c) Realizar un test de razón de varianzas para contrastar que las varianzas de los dos
laboratorios son iguales, sabiendo que las tres aleaciones tienen composición distinta.
Interpretar el resultado.
(d) El O.P. conoce exáctamente el porcentaje en oro de la aleación A (11 %), de la B
(11.02 %) y de la C (11.04 %). Con esta información comparar los resultados de los
laboratorios.
4. Complete la tabla ADEVA siguiente y diga de que diseño se trata.
Factor 1
Factor 2
Factor 3
Int. Segundo orden
Int. Tercer orden
TOTAL
Suma de Cuad.
20
5
G.L.
2
Varianzas
1.25
10
0.25
44
29
5. Se ha realizado un diseño factorial sin replicación con tres factores A, B, C con 5, 5 y 4
niveles respectivamente. Si la interacción de tercer orden es nula, obtener la descomposición
de la variabilidad e indicar los grados de libertad de cada término.
6. Para estudiar el efecto de tres factores (A,B,C) en el tiempo de fraguado del hormigón se ha
realizado un experimento factorial completo a dos niveles con tres replicaciones (24 datos en
total). Los resultados de la estimación han sido:
Media
92.5
A
B AB
2.4 3.3 8.5
C
AC BC ABC
15.0 -1.4 2.65 0.72
Teniendo en cuenta que la varianza residual obtenida es ŝ2R = 18.8, indicar qué efectos son
significativos para un nivel de significación α = 0.05.
2
7. Una caracterı́stica de la calidad de la gasolina es su ı́ndice de octanos. Una refinerı́a de
petróleo tiene cinco fórmulas que pueden emplearse para la obtención de gasolina con plomo
o sin plomo.
(a) Para determinar que fórmula proporciona mayor ı́ndice de octanos, con cada una de
ellas se ha repetido 10 veces en el laboratorio el proceso de fabricación de gasolina con
plomo. Si el coeficiente de determinación del análisis de la varianza de los resultados
es igual a 0.20, contrastar con α = 0.05 si existen diferencias entre las cinco fórmulas
para este tipo de gasolina.
(b) Los valores medios (ȳi• ) para cada fórmula son:
Fórmula
1
Media
89.2
2
3
4
5
90.1 90.7 90.5 89.5
Contrastar con α = 0.05 que fórmulas proporcionan ı́ndices de octanos significativamente distintos y cuales no.
(c) Debido a los problemas medio-ambientales gran parte de la producción futura debe
estar libre de plomo. Para determinar que fórmula de las anteriores produce mejores
resultados en cuanto al ı́ndice de octanos , se realizo un diseño experimental similar
al anterior (cinco fórmulas, 10 observaciones en cada fórmula) para la obtención de
gasolina sin plomo. El coeficiente de determinación en este caso es igual a 0.25 y el
ı́ndice medio para cada fórmula es,
Fórmula
1
2
3
4
5
Media
88.0 89.5 88.5 90.2 89.8
Contrastar (α = 0.05) si existe interacción entre los factores tipo de gasolina (con y sin
plomo) y fórmula.
8. Para comprobar las propiedades de rigidez de dos materiales A y B a tres temperaturas se
ha realizado un experimento con 4 replicaciones. Las medias se proporcionan en la tabla.
Teniendo en cuenta que la varianza residual ha sido 1.69 y que el análisis de la varianza ha
indicado: (1) que existen diferencias significativas entre los dos materiales, (2) que no existen
diferencias entre las tres temperaturas y (3) que la interacción de los dos factores es muy
significativa, calcula y dibuja los intervalos de confianza (α = 0.01) para la comparación de
los dos materiales, de las tres temperaturas y de la interacción. Interpretar los resultados.
3
9. Para estudiar la influencia de la temperatura y la presión sobre el rendimiento de un proceso
quı́mico se ha realizado un experimento con 5 valores de presión y 4 valores de temperatura.
Los resultados se muestran en la tabla siguiente.
Presión
1
2
3
4
5
Medias
Temperatura
10
20
65,58 96,71
66,32 101,5
74,42 99,81
80,24 104,11
79,61 112,14
73,24 102,85
30
124,20
130,37
134,63
138,42
143,58
134,24
40
156,63
161,38
160,59
166,96
170,68
163,19
Medias
110,71
114,89
117,36
122,43
126,50
118,38
(a) Considere solamente el efecto de la presión y estudie si es significativo (α = 0, 05),
sabiendo que las varianzas muestrales corregidas para los datos correspondientes a cada
presión son b
s21 = 149, 85; b
s22 = 164, 62; b
s23 = 143, 95; b
s24 = 145, 11; b
s25 = 154, 94.
(b) Incorpore el efecto de la temperatura en un modelo adecuado para los datos. Interprete
el resultado.
(c) Calcule un intervalo de confianza al 95% para la varianza del error experimental de los
modelos de los dos apartados anteriores. Interprete las diferencias.
10. Se desea estudiar la fuerza de percusión de una perforadora en función de la VELOCIDAD
de giro (baja y alta) y de un coeficiente mecánico que denominaremos RATIO (0.15, 0.30,
0.45 y 0.60). Se ha experimentado en las ocho posibles combinaciones de ambos factores,
replicando cada experimento dos veces. Los resultados se muestran en la tabla siguiente
Vel. Baja
Vel. Alta
Media
0.15
0.30
0.45
0.60 Media
270
245
260
275
266.875
278
249
272
286
283
285
286
294
286.125
286
280
287
288
279.25 264.75 276.25 285.75 276.5
Las variabilidades explicadas por el RATIO, la VELOCIDAD y la interacción RAT x VEL
son respectivamente 925, 1482.25 y 418,75 y la Variabilidad Total es 3034.
(a) Completa la tabla de análisis de la varianza e indica qué efectos son significativos para
α = 0.05.
(b) Interpreta el resultado, indicando cómo influye el RATIO y la VELOCIDAD en la fuerza
de la perforadora. Dibuja el gráfico que permite interpretar la interacción. Proporciona
el intervalo de confianza para la media de la combinación RATIO 0.30, y VELOCIDAD
baja.
4
(c) Cada tratamiento tiene dos observaciones, llamando Dij = |Yij1 − Yij2 | , al valor absoluto de la diferencia de estas observaciones, demuestra que
Dij2
→ χ21
2σ2
2
y que SD
=
P2
i=1
P4
j=1
16
2
Dij
es un estimador centrado de la varianza del modelo factorial.
(d) Supón que la varianza de las observaciones a velocidad baja es σ 21 y de las observaciones
a velocidad alta es σ 22 . Utilizando el resultado del apartado 3, realiza el siguiente
contraste con nivel de significación 0.05,
H0 : σ 21 = σ 22
H1 : σ 21 6= σ 22
11. Cuando un lenguaje de alto nivel es compilado, el tiempo de ejecución depende del compilador. Un ingeniero de software desea comparar tres compiladores (A, B y C), para ello ha
seleccionado 5 programas muy distintos, cada uno de los cuales ha sido compilado por los
tres compiladores. Los tiempos de CPU se proporcionan a continuación:
A
B
C
Medias
1
122.9
113.8
131.2
122.7
2
147.4
135.1
152.8
145.1
3
189.6
173.8
192.7
185.3
4
200.9
199.3
219.8
206.7
5
Medias
307.3 193.6
296.6 183.7
318.9 203.1
307.6
La variabilidad total es 62899.2, y las variabilidades explicadas por el tipo de compilador y
tipo de programa son 937.2 y 61868.9, respectivamente. Da un intervalo de confianza (95%)
para la diferencia de las medias entre los dos compiladores más rápidos.
12. Se ha realizado el análisis de la varianza de un diseño con un único factor a 10 niveles con 6
observaciones para cada nivel. El nivel crı́tico que muestra la tabla ADEVA es p = 0.5832.
Los niveles crı́ticos de los contrastes individuales de igualdad de medias son mayores de 0.05
para todas las parejas excepto para la comparación entre los niveles 3 y 7 que ha sido igual a
0.0405. ¿Es posible este resultado? ¿Qué se puede concluir del análisis? ¿Qué procedimiento
sugiere para realizar los contrastes individuales?
13. Se ha realizado un diseño factorial sin replicación con tres factores A, B, C con 5, 5 y 4
niveles respectivamente. Si la interacción de tercer orden es nula, obtener la descomposición
de la variabilidad e indicar los grados de libertad de cada término.
14. Sea un diseño factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el número de parámetros
totales correspondientes a efectos principales e interacciones de orden 2, 3 y 4.
5
15. Un ingeniero ha estudiado el efecto que tienen 5 niveles de iluminación en una operación
de ensamblado. El departamento en el que se ha experimentado tiene cuatro estaciones de
trabajo, que representan una fuente potencial de variabilidad. Para cada estación de trabajo
y nivel de iluminación se ejecutó la operación de ensamblado, midiendo la holgura en micras.
Los resultados fueron:
ESTAC.
1
2
3
4
ȳ•j
ILUMINACION
1
2 3 4
5
ȳi•
131 116 88 75 104
102.8
92 96 97 70
75
86.0
128 129 99 94 105
111.0
121 107 84 89
86
97.4
118 112 92 82 92.5 ȳ•• = 99.3
(a) Contrastar (α = 0.05) si la iluminación o la estación de trabajo influye en los resultados
del ensamblado.
(b) Comparar los niveles de iluminación y los niveles de las estaciones de trabajo. Indicar
en cada caso cuales se pueden considerar distintos y cuales no.
(c) Calcular la varianza teórica del valor medio previsto para cada observación.
(d) Explicar por qué no se debe contrastar la hipótesis
H0 : µ1 = µ2 = ... = µm
del modelo básico de análisis
la varianza (un factor), mediante contrastes de la t de
de m
pares de muestras.
Student a cada uno de los
2
16. Se realiza un experimento para estudiar la influencia de 2 factores en el rendimiento de un
proceso, donde el factor que se encuentra a 3 niveles (Alto, medio y bajo) es la temperatura,
el otro factor, catalizador, tiene dos niveles: catalizador I y II. Los datos del experimento
se muestran en la siguiente tabla:
CI
CII
Alto
Medio
Bajo
279 172 176 174 277 130 397 348 434
(215.6)
(193.6)
(393)
253 238 387 252 367 323 417 427 423
(292.6)
(314)
(422.3)
(Nota: Los números entre parentesis son las medias de las casillas)
(a) Contrastar con α = 0.05 que efectos son significativos. Interprete el resultado.
(b) Determinar el intervalo con el 99% de confianza para la varianza del error experimental.
6
(c) Dar un intervalo para una observación realizada en condiciones óptimas. Si se realizan
10 experimentos en estas condiciones, determinar el intervalo que con probabilidad
igual al 95% contiene a todas ellas. Utilice la aproximación
tαg = zα (1 −
zα + 1 −1
)
4g
donde g son los grados de libertad de la t y zα el valor de la normal estándar, tal que
P (Z ≥ zα ) = α
17. Un laboratorio de Análisis Clı́nicos ha adquirido un nuevo equipo (B) para medir el colesterol en la sangre de los enfermos. Para evaluar si el nuevo equipo está ajustado se decide
analizar muestras de 5 enfermos que previamente han sido analizadas con otro equipo (A),
dando como resultado
Enfermo
1
2
3
4
5 Media
Equipo A 215 305 247 221 286 254.8
Equipo B 224 312 251 232 295 262.8
Contrastar con α = 0.05 existen diferencias entre los dos equipos.
18. Para estudiar el consumo de aceite de un motor se prueban 4 motores distintos con 3 tipos
de aceites obteniendo 12 medidas de consumo. Se ha obtenido:
Variabilidad explicada por aceite = 100
Variabilidad explicada por motor = 80
Variabilidad Total = 220
Se pide escribir la tabla ADEVA correspondiente, y obtener conclusiones.
19. Para determinar el consumo de energı́a eléctrica para usos domésticos se ha medido el consumo medio por persona en las distintas estaciones del año en siete comunidades autónomas
para 1989, habiéndose obtenido los siguientes resultados:
COMUNIDAD
1
2
3
4
5
6
7
MEDIAS
INVIERNO
13.1
13.4
13.8
14.0
14.4
14.8
15.6
14.16
PRIMAVERA
11.4
12.1
12.1
12.8
12.6
13.4
14.2
12.66
VERANO
10.6
11.1
11.4
11.7
12.5
13.0
14.1
12.06
OTOÑO
11.5
12.0
12.9
12.6
13.4
14.0
14.4
12.97
MEDIAS
11.65
12.15
12.55
12.77
13.22
13.80
14.57
12.96
(a) Analizar si el factor estación del año es influyente, sabiendo que ŝ2y = 1.53.(No considerar el factor Comunidad).
7
(b) Razonar estadı́sticamente cuál es la estación de mayor consumo y la de menor, utilizando el análisis anterior. Calcular los intervalos de confianza para el consumo medio
de cada estación del año.
(c) Sabiendo que la variabilidad explicada por el factor comunidad es 23.62, construir una
nueva tabla de la varianza, con dos factores, y decidir qué factor es significativo.
(d) Utilizar los resultados del apartado anterior para realizar un contraste de igualdad de
medias del efecto estación y comparar los resultados con los del apartado 2, justificando
las diferencias encontradas.
( NOTA: Utilizar α = 0.05 en todos los contrastes )
20. Se realiza un experimento para estudiar si la presencia de fluorita reduce el coste de fabricación de clinker de cemento en tres tipos diferentes de mezcla. Los resultados del mismo
(en miles de pesetas por Tm) se muestran en la siguiente tabla:
FLUORITA
0%
1%
2%
3%
4%
y
5 X
3
X
MI MII MIII
y i•
15.4 10.6 17.8 14.6
10.3 5.5 10.9 8.9
7.4 1.2
8.1 5.5
10.7 6.5
9.6 8.9
13.5 11.6 15.5 13.5
11.4 7.1 12.4
e2ij = 10.2 ȳ•• = 10.3
i=1 j=1
(a) Determinar si el tipo de mezcla y el nivel de fluorita añadido influyen significativamente
en el coste de fabricación. Se supone que no existe interacción entre los dos factores.
(b) Contrastar que porcentaje de fluorita produce el menor coste del clinker.
21. El análisis de la varianza de un diseño en bloques aleatorizados proporciona los siguientes
resultados: V T = 232, V E(factor) = 156, V E(bloque) = 15 y V NE = 61. El número de
niveles del factor es 5 y el número de bloques 8. Construir la tabla ADEVA. ¿ Cuál serı́a
el resultado del análisis si no se tiene en cuenta el efecto de los bloques ? Indicar en qué
circunstancias es preferible cada uno de los modelos.
22. Se ha realizado un experimento con tres factores, (A, B y C), con 4, 3, y 5 niveles, sin
replicaciones. El modelo propuesto no incluye las interacciones de orden 3, por lo que la
variabilidad explicada por estas interacciones se pretende utilizar para estimar la varianza
residual. Los resultados proporcionan para la variabilidad explicada por las interacciones de
orden 3 un valor igual a 234.5; que es muy superior a lo esperado. Debido a ésto se repitió
por completo el experimento, obteniéndose para este segundo experimento un valor de 158.7
8
(para la variabilidad explicada por la interacciones de orden 3). Proponer un procedimiento
para contrastar si se ha producido un cambio significativo en esta variabilidad de uno a otro
experimento, indicando las hipótesis en las que se basa el contraste. (Dejar el resultado del
contraste indicado en función de los valores crı́ticos de la tabla correspondiente.)
23. 8.25. (2-96) En un modelo de análisis de la varianza se ha observado que la desviación tı́pica
(ŝi ) y la media (y i ) de las observaciones de cada tratamiento están relacionadas linealmente,
ŝi = ky i , donde k es una constante. ¿ Cuál de las siguientes transformaciones es la más
adecuada para corregir la heterocedasticidad ? z = log y, z = y 2 o z = ky
24. La oxidación es una etapa de la fabricación de chips y consiste en añadir una capa de
óxido sobre la placa silicio (oblea). Se está experimentando con 6 tratamientos (Ti ) para
seleccionar el que proporciona un mayor espesor de óxido en un mismo tiempo de proceso.
Una caracterı́stica que influye en el espesor es el acabado superficial de la oblea, por lo que
se tomaron 5 tipos distintos de acabado (Oj ). De cada tipo (Oj ) se tomaron 6 obleas y se
asignaron aleatoriamente a los tratamientos. En la tabla se proporciona el espesor obtenido
en cada oblea y las medias por filas y columnas.
O1
O2
O3
O4
O5
T1
85.60
89.30
84.70
87.60
87.30
86.90
T2
90.90
91.50
87.50
90.50
93.10
90.70
T3
93.00
93.60
90.90
95.60
94.90
93.60
T4
80.50
83.20
81.00
84.60
82.70
82.40
T5
85.20
87.80
83.20
87.60
86.70
86.10
T6
88.90
91.00
86.30
91.10
88.70
89.20
87.35
89.40
85.60
89.50
88.90
88.15
VT = 465.1
(a) Contrastar si el tipo de oblea y el tratamiento influyen en el espesor del óxido. Elegir el
tipo de oblea y tratamiento más adecuado, indicando si son significativamente distintos
del resto.
(b) Para fijar los seis tratamientos, se seleccionaron dos temperaturas (t1 , t2 ) y tres presiones
(p1 , p2 , p3 ) y se combinaron de forma que T1 = (t1 , p1 ), T2 = (t1 , p2 ), T3 = (t1 , p3 )
T4 = (t2 , p1 ), T5 = (t2 , p2 ) y T6 = (t2 , p3 ). Calcular las variabilidades explicadas por la
temperatura, la presión y su interacción (t × p).
(c) Indicar si sus efectos son significativos, suponiendo nulas las interacciones de los factores
O × t, O × p y O × t × p.
25. Demostrar que en un modelo de bloques aleatorizados, µ̂, α̂i y β̂ j son independientes.
26. Un centro ha realizado un experimento para mejorar la resistencia a la tensión de ciertos
muelles de acero. En una etapa del proceso el muelle caliente se sumerge en aceite templado.
Se han estudiado tres factores, A (temperatura del acero antes de la inmersión, con tres
niveles), B (temperatura del baño de aceite, dos niveles) y C (concentración de carbono en
el acero, dos niveles). El experimento se ha replicado tres veces. En la tabla se muestra la
media y la varianza (corregida) para los tres datos de cada tratamiento.
9
A
1
1
1
1
2
2
2
2
3
3
3
3
B
1
1
2
2
1
1
2
2
1
1
2
2
C
1
2
1
2
1
2
1
2
1
2
1
2
yi
ŝ2i
40.2 0.25
61.1 2.68
35.9 2.43
57.1 4.44
49.0 3.49
70.3 7.77
46.7 5.08
67.6 1.03
41.9 4.27
62.7 11.41
37.1 1.33
60.3 6.13
(a) Dar un intervalo del 95 % de confianza para la varianza del error experimental, σ 2 .
(b) Indicar si los efectos principales de A, B y C son significativamente distintos de cero.
(c) Dado σ 2 , construir un intervalo que cumpla que la probabilidad de que ŝ2i (la varianza
muestral corregida de un tratamiento) esté contenido en él sea igual a 0.95. Sustituir σ 2
por su estimador y con ayuda de este intervalo, discutir si se puede rechazar la hipótesis
de homocedasticidad de las observaciones.
27. Estimar por máxima verosimilitud los parámetros µ, αi y β j del modelo de bloques aleatorizados. Obtener la distribución de estos estimadores, indicando su media y varianza.
28. Explicar por qué en un modelo de dos factores con interacción es necesario poner las condiciones
I
X
i=1
αi = 0,
J
X
j=1
β j = 0,
I
X
(αβ)ij = 0 para todo j,
y
J
X
(αβ)ij = 0 para todo i.
j=1
i=1
¿Se podrı́an haber puesto otras condiciones distintas a las anteriores? Justificar la respuesta.
29. La calidad de un producto quı́mico despues de un largo periodo de almacenamiento depende
del conservante empleado y de las caracterı́sticas de almacenamiento. Se ha estudiado el
efecto de cuatro conservantes distintos (columnas) y cinco almacenamientos (filas) sobre la
degradación del producto:
1
2
3
4
5
Medias
1
2
3
15.1 11.0 18.8
8.1 4.3 11.8
15.3 11.5 15.6
8.0 4.4 11.0
13.5 9.3 15.8
12.0 8.1 14.6
10
4
Medias
10.3
13.8
3.8
7.0
9.2
12.9
5.8
7.3
18.2
14.2
9.46
11.04
La tabla de análisis de la varianza para los datos anteriores es:
Almacen.
Conserv.
Residuos
Total
Suma de
Cuadrados
205.488
123.676
61.484
390.648
Grados de
Libertad
4
3
12
19
S. Cuadrados
F
Medios
51.372 10.03
41.225 8.05
5.123
Nivel
Crı́tico
0.0008
0.0033
(a) Elegir con α = 0.05 el conservante y el almacenamiento que producen menor degradación.
(b) El análisis de los residuos muestra como atı́pica la observación y54 = 18.2. Un examen
quı́mico confirma el resultado anómalo por lo que se recomienda eliminar la observación.
Según el modelo de dos factores sin interacción, la predicción de la observación yIJ
(eliminada) es:
SI∗
S∗J
S∗∗
ybIJ =
+
−
(J − 1) (I − 1) (I − 1)(J − 1)
donde I = 5, J = 4, SI∗ es la suma de las observaciones de la fila I (sin incluir la eliminada), S∗J es la suma de las observaciones de la columna J (sin incluir la eliminada), y
S∗∗ es la suma de las observaciones restantes no incluidas en la fila I ni en la columna
J. Obtener la distribución (media y varianza) del error de predicción eIJ = yIJ − ybIJ .
(c) Cuando, como en el caso anterior, falta una observación se recomienda el siguiente procedimiento: sustituir la observación faltante por su predicción y aplicar los contrastes
habituales teniendo en cuenta que los residuos tienen un grado de libertad menos. La
nueva descomposición de la variabilidad es: VT=339.63, VE(Conservantes)=166.02,
VE(Almacenamiento)=164.02 y VNE=9.59. Contestar al apartado 1 con esta modificación e interpretar las diferencias.
30. Una instalación tı́pica de almacenamiento de combustible en una Estación de Servicio (gasolinera) está formada por un tanque enterrado de gran capacidad, al que se encuentran
conectados distintos surtidores. La cantidad total de gasolina suministrada en un dı́a se
puede determinar midiendo directamente la variación que se ha producido en el tanque de
almacenamiento (Y1j ) o por la suma de los suministros de los distintos surtidores (Y2j ). La
comparación de ambas medidas permite determinar pérdidas en la instalación enterrada y
otras anomalı́as. En el proceso de comparación es necesario tener en cuenta que las medidas
están afectadas por errores aleatorios. Durante 20 dı́as se han tomado los valores anteriores
en un gasolinera:
Dı́a→
Y1j
Y2j
1
4116,2
4143,6
2
5627,0
5632,0
3
2820,4
2868,1
4
2521,8
2477,7
5
2973,5
2955,4
6
2834,9
2851,9
7
2335,7
2312,7
8
2590,8
2630,6
9
2182,7
2208,9
10
2621,4
2635,9
Dı́a→
Y1j
Y2j
11
4323,6
4305,4
12
1880,7
1877,9
13
2131,4
2159,2
14
3349,6
3366,7
15
2545,0
2566,1
16
2247,3
2281,4
17
1817,5
1854,6
18
1461,3
1461,5
19
1646,5
1607,3
20
1955,4
1956,4
11
(a) Llamando Dj = Y1j − Y2j a la diferencia en las medidas de un mismo dı́a, contrastar
con α = 0.05
H0 : µD = 0
H1 : µD 6= 0
donde Dj tiene distribución N(µD , σ D ). Calcular el nivel crı́tico del contraste aproximando la distribución t de Student por la normal.
(b) Los datos anteriores pueden ser analizados mediante un modelo de bloques aleatorizados
tomando el tipo de medida (tanque, surtidores) como un factor y los dı́as como bloques.
Demostrar con caracter general que en el modelo de bloques aleatorizados si el factor
tiene dos niveles la varianza residual cumple:
1
sb2R = sb2D
2
donde sb2D es la estimación de σ 2D del apartado 1.
(c) Teniendo en cuenta lo anterior, demostrar que el contraste correspondiente al factor en
el modelo de bloques aleatorizados es equivalente al contraste del apartado 1.
31. Una forma alternativa de la ecuación del modelo para comparar I tratamientos es
yij = µ + τ i + uij ,
i = 1, 2, ..., I;
j = 1, 2, ..., m
donde
µ es la media global
τ 1 , τP
2 , ..., τ I son los parámetros que determinan los efectos de cada tratamiento, cumplen
que Ii=1 τ i = 0
uij son variables aleatorias independientes con idéntica distribución normal de media cero y
varianza σ 2 .
(a) Obtener el estimador máximo verosı́mil de τ i , indicar su distribución de probabilidad,
media y varianza.
P
(b) Calcular la esperanza de la variabilidad explicada (V E = m Ii=1 b
τ 2i ) cuando los
parámetros τ i no son todos nulos.
(c) Calcular la correlación entre b
τ i y un residuo eij cualquiera (del mismo o diferente
tratamiento). Que implicación tiene este resultado en el contraste de análisis de la
varianza.
32. Un ingeniero está estudiando métodos para mejorar ciertas propiedades mecánicas de una
aleación metálica. Los dos factores que considera más importantes son la cantidad de Manganeso y la temperatura de templado. Se diseña un experimento empleando tres niveles
para el factor manganeso y dos para la temperatura, en total 3×2 = 6 tratamientos. Se
dispone de 6 hornos diferentes para realizar la fundición. Cada horno requiere un operador
y se disponen de seis operadores cada uno de los cuales es capaz de manejar los seis hornos.
Diseñar un experimento que con 36 observaciones permita estudiar las diferencias entre los
12
seis tratamientos y que tenga en cuenta el tipo de horno y el operador como variables bloques. Construir la tabla de análisis de la varianza, indicando los grados de libertadad de
cada variabilidad, separando en ella el factor manganeso, el factor temperatura y su interacción. (Los bloques y los factores no interaccionan). (Nota: no es necesario indicar en la
tabla como se obtienen las distintas variabilidades).
33. Una asociación de consumidores para comprobar la utilidad de ciertos compuestos que según
sus fabricantes reducen el consumo de gasolina de los automóviles realizó el siguiente experimento: eligió al azar 9 vehı́culos nuevos de distintas marcas con cilindrada similar y con
cada uno de ellos recorrió tres veces un mismo trayecto con conductores distintos. Además
en cada uno de estos tres trayectos empleó un tratamiento diferente para la gasolina:

 A:
B:
Tratamiento

C:
Gasolina con Cyber-Gas
Gasolina con Consumin
Gasolina sin aditivo
En la tabla siguiente se muestra el consumo en litros de gasolina en cada uno de los recorridos
y el tipo de tratamiento (letra latina).
Número
Vehı́culo
1
2
3
4
5
6
7
8
9
Media
Columna
Conductores
1
2
3
15,5 (A) 15,6 (B) 16,6 (C)
13,0 (B) 13,3 (A) 13,0 (C)
11,8 (B) 13,1 (C) 12,5 (A)
14,4 (A) 14,8 (C) 15,0 (B)
12,4 (B) 14,3 (A) 14,1 (C)
15,6 (C) 15,3 (A) 14,7 (B)
12,7 (C) 12,0 (B) 12,0 (A)
14,2 (C) 14,0 (B) 15,1 (A)
12,6 (A) 13,5 (C) 12,3 (B)
13,58
13,99
13,92
Media
fila
15,90
13,10
12,47
14,73
13,60
15,20
12,23
14,43
12,80
Media Total
13,83

 A:13,89
Media de
B:13,42
Tratam. 
C:14,18
El análisis de los datos se realiza con el siguiente modelo
yijk = µ + αi + β j + γ k + uijk
dónde yijk representa el consumo en litros, µ la media global; αi , i = 1, 2, ..., 9 y β j , j =
1, 2, 3 los efectos correspondientes a los vehı́culos (filas) y los conductores (columnas). La
estimación e interpretación de estos parámetros es similar al modelo de bloques aleatorizados.
Además se incluye los parámetros
γ k , k = 1, 2, 3 que miden el efecto de los tratamientos (tipo
P
de aditivo) y cumplen 3k=1 γ k = 0. Por último, uijk la componente aleatoria son variables
aleatorias independientes con distribución normal de media cero y varianza σ 2 para todas
las observaciones.
(a) Obtener razonadamente los estimadores máximo verosı́miles de γ k .
13
(b) La tabla del análisis de la varianza del modelo anterior es
Tratamiento
Vehı́culo
Conductor
Residual
Total
Suma de
Cuadrados
2,67
40,2
0,876
Grados de
Libertad
2
8
2
2,73
46,4
14
26
Varianza
1,31
5,02
0,438
F
p-Valor
6,7 0,0091
25,7 0,0000
2,2 0,1428
0,195
¿Reducen los aditivos el consumo de gasolina? ¿ Existen diferencias significativas entre
Cyber-gas (A) y Consumin (B)? (Realizar los contrastes con nivel de significación 0.05).
(c) Demostrar que el diseño anterior, independientemente de los valores numéricos (yijk )
obtenidos, es un diseño ortogonal, es decir que cumple:
VT = VE(Vehı́culos) + VE(Conductores) + VE(Tratamientos) + VNE
(Nota.- Es suficiente con demostrar la ortogonalidad del vector correspondiente a los
tratamientos con respecto a los otros tres).
34. Un informático quiere comparar los tiempos de ejecución de tres programas realizados en
lenguajes diferentes que realizan el mismo proceso. Para hacer la comparación utilizan 4
ordenadores con microprocesadores distintos. Los tiempos requeridos por cada programa en
cada ordenador han sido:
ORDENADOR
↓
1
2
3
4
ȳ•j
PROGRAMA
A
B
C
1,36 2,23 1,54
0,97 0,70 0,76
1,79 1,74 1,84
0,64 0,69 0,74
1,19 1,34 1,22
ȳi•
1,71
0,81
1,79
0,69
1,25
¿Existen diferencias significativas en los tiempos requeridos por los 3 programas?
35. Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20%
de la variabilidad total está explicada por la interacción de los dos factores y el 40% de
la variabilidad total es debida a la variabilidad residual. Determinar el número de replicaciones necesarias en cada tratamiento para que la interacción sea significativa con α = 0.01.
(Explicar el procedimiento de cálculo, dejando el resultado indicado en función de las tablas).
14
36. Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formación (ciencias, letras) en el dominio del inglés escrito en profesores universitarios. Para ello analiza el
número de incorrecciones gramaticales en artı́culos cientı́ficos enviados a publicación. Para
cada combinación de niveles de los factores se han elegido al azar tres profesores. En la tabla
se proporciona el número de fallos detectados en artı́culos de 15 páginas
Hombre
Mujer
Letras
8, 6, 13
5, 10, 6
Ciencias
22, 28, 33
12, 14, 9
Contrastar con nivel de significación 0.05 si los efectos principales y la interacción son significativos. Tener en cuenta que P (F1,8 ≤ 5.32) = 0.95, siendo F1,8 la distribución F con grados de
libertad 1 y 8. Interpretar los resultados.
37. Un alumno, como trabajo de la asignatura de estadı́stica, ha comparado tres marcas distintas
(A,B,C) de palomitas de maı́z precocinadas. Cada marca puede prepararse friendolas en
una sartén (método 1) o en el horno microondas (método 2). El alumno ha realizado un
diseño factorial completo 3×2 con cinco replicaciones en cada uno de los seis tratamientos.
La variable respuesta medida es el porcentaje de granos de maı́z que no se han inflado
adecuadamente. Los resultados del experimento se muestran en la tabla, en cada tratamiento
se proporciona la media y entre paréntesis la desviación tı́pica corregida para las cinco
replicaciones. Contrastar si la interacción entre los dos factores es significativa.
Sartén
Horno
A
5.5
(1,4)
3.8
(1,3)
B
3.6
(1,8)
3.4
(0,9)
C
7.5
(2,5)
4.3
(1,3)
38. Se ha realizado un experimento con dos factores, A (temperatura con tres niveles), B (concentración con cuatro niveles). El experimento se ha replicado 5 veces. En la tabla se
15
muestra la media y la varianza (corregida) para los 5 datos de cada tratamiento.
A
1
1
1
1
2
2
2
2
3
3
3
3
B
1
2
3
4
1
2
3
4
1
2
3
4
yi
240
261
235
257
249
270
246
267
241
262
237
260
ŝ2i
1.2
1.6
1.4
2.4
1.4
5.7
5.8
1.7
4.2
9.4
1.3
6.1
Escribir la tabla de análisis de la varianza.
39. Se desea estudiar la influencia de 2 factores en el error de medida de un equipo de visión
artificial. Un factor F es la distancia focal, para el que se han fijado 4 niveles y el otro factor
L es el nivel de iluminación con 2 niveles. Además se dispone de 2 equipos diferentes para
realizar las medidas. Se ha tomado un patrón y se ha medido en las combinaciones indicadas
en la tabla, donde yijk es el error obtenido al situar la distancia focal i, con iluminación j y
el equipo k.
F −→
1
L −→
1
Equipo 1 y111
Equipo 2 y112
2
1
3
1
4
1
1
2
2
2
3
2
4
2
y211
y212
y311
y312
y411
y412
y121
y122
y221
y222
y321
y322
y421
y422
Construir la tabla de análisis de la varianza, que incluya los efectos principales debidos a la
distancia focal (F ), la iluminación (L) y el equipo, y además la interacción F ×L, suponiendo
que son nulas el resto de interacciones.
40. Cierta industria de lentes para gafas desea comparar dos tipos de recubrimiento antireflectante A, B. Los dos tipos tienen idéntico aspecto y prestaciones, pero antes de decidirse por
uno u otro desean comprobar si el tipo de recubrimiento influye en el desgaste que sufre la
lente. Para ello construyen gafas con una lente de cada tipo que distribuyen entre 10 personas seleccionadas al azar que habitualmente utilizan gafas. Al cabo de seis meses miden
el desgaste y se obtienen los valores que se indican en la tabla.
16
Persona
1
2
3
4
5
6
7
8
9
10
Lente A
6.7
5.0
3.6
6.2
5.9
4.0
5.2
4.5
4.4
4.1
Lente B
6.9
5.8
4.1
7.0
7.0
4.6
5.5
5.0
4.3
4.8
¿Qué tipo de recubrimiento recomendarı́a a los fabricantes con el criterio de mı́nimo desgaste?.
41. Demuestre que en un modelo en bloques aleatorizados, con I niveles para el factor y J niveles
para el bloque, con modelo
yij = µ+αi+ β j +uij ,el valor esperado de la variabilidad explicada por el factor es: E[V E(α)] =
P
(I − 1)σ 2 + J Ji=1 α2i ,siendo σ 2 la varianza del error experimental.
42. Se desea comprobar si el orden en el que aparecen las preguntas de un examen test influye
en resultado obtenido por el alumno. Se han preparado dos examenes, el Test A tiene
las preguntas en orden de dificultad creciente y el Test B a la inversa. Se ha elegido una
muestra aleatoria de 20 alumnos y se han emparejado según su habilidad, de forma que los
dos alumnos de cada pareja han demostrado durante el curso una habilidad similar. De
cada pareja, un alumno se ha asignado aleatoriamente al Test A y el otro al Test B. Los
resultados finales del ejercicio han sido (cada pareja es una columna)
Test A:
Test B:
83 82 95 92
76 62 70 74
91 60 89 69 70 72
52 63 48 80 76 74
¿Es evidente que las puntuaciones del Test B son mas bajas que las del Test A?
43. El análisis de la varianza de un diseño en bloques aleatorizados proporciona los si-guientes
resultados: V T = 129, V E(factor) = 38, 5 y V E(bloque) = 82, 5. El número de niveles del
factor es 4 y el número de bloques 4. Construir la tabla de análisis de la varianza y hacer
los contrastes correspondientes con nivel de significación 0,05.
44. Se ha estudiado la influencia de la cantidad de cierto aditivo en la opacidad de un material
plástico que se puede fabricar por tres métodos de extrusión. El objetivo es conseguir el
tratamiento con opacidad mı́nima. Cada tratamiento se ha replicado 5 veces, los valores
medios y las desviaciones tı́picas corregidas para cada caso se proporcionan en la tabla 1.
La tabla 2 corresponde al análisis de la varianza. Se ha comprobado que se verifican las
condiciones de normalidad y homocedasticidad.
17
Método
1
1
2
2
3
3
Extrus.
Aditivo
Interac.
Residual
Total
Aditivo
1
2
1
2
1
2
Suma de
cuadrad.
2.210
47.636
37.572
24.728
112.146
Medias
9.5
9.3
10.0
8.1
11.5
6.0
g.l.
2
1
2
24
29
Desv. Tı́p.
0.83
0.67
1.53
(TABLA 1)
0.77
0.78
1.23
Var.
F
p-valor
1.105 1.072
0.358
47.636 46.2
0.000 (TABLA 2)
18.786 18.2
0.000
1.030
(a) A la vista de los resultados de las dos tablas indica qué método de extrusión es aconsejable para conseguir la opacidad mı́nima.
(b) Da un intervalo del 95% de confianza para la opacidad media en las condiciones óptimas.
(c) Sea
di = y i1 − y i2
la diferencia entre las medias observadas en los dos niveles del factor aditivos para el
método de extrusión i. Calcula el valor esperado y la varianza de di en términos de los
parámetros del modelo factorial.
(d) Si E(di) = 0 para los tres métodos, obtén la distribución de probabilidad de
5 d21 + d22 + d23
×
.
2
σ2
45. Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290 o C y 320 o C)
en la duración de cierto componente. Para cada combinación de horno y temperatura se
ha replicado el experimento 3 veces. En la tabla siguiente se proporcionan las medias y
desviaciones tı́picas de los datos de cada tratamiento.
Temperatura o C
290 o C
320 o C
Media Desv. T. Media Desv. T.
Horno 1 245.6
8.50
180.0
2.65
Horno 2 191.0
15.39
144.0
2.65
Horno 3 187.0
4.58
134.3
8.62
18
Fuente
Horno
Temp.
HxT
Residual
Total
Suma
Cuadrado
9646.3
13667.6
274.8
837.3
24426
Grados
Libertad
2
1
2
12
17
Varianza
F
p-valor
4823.2
69.1
0.000
13667.6 195.9 0.000
137.4
1.97
0.182
69.8
Seleccionar el horno y la temperatura que proporcionan máxima duración, haciendo los contrastes de igualdad de medias con nivel de significación 0.01.
19

Documentos relacionados