ANOVA y Otras Pruebas PDF
ANOVA y Otras Pruebas PDF
capítulo
SlS
•IN• Introducción
En el capítulo 13 utilizamos la metodología de la prueba de hipótesis para llegar a
conclusiones acerca de posibles diferencias entre los parámetros de dos grupos,
cuando tratamos con datos numéricos. A menudo, sin embargo, es necesario eva
luar las diferencias entre los parámetros de varios (c) grupos. Podríamos desear
comparar métodos alternativos, tratamientos o materiales de acuerdo con algún
criterio predeterminado. Una organización de consumidores, por ejemplo, puede
desear determinar qué tipo de llantas duran más en.condiciones de carretera; a un
investigador agrícola le gustaría saber qué variedad de ejotes dará la mayor pro
ducción; un investigador médico desearía evaluar el efecto de las diferentes marcas
de un tipo de medicina para la reducción de la presión diastólica de la sangre. En
cada uno de los ejemplos anteriores se comparan varios grupos y los datos de cada
grupo son numéricos.
Empezaremos el presente capítulo con el examen del modelo de diseño comple
tamente aleatorizado en el que tendremos solamente un factor con varios grupos
(como el tipo de llantas, la variedad de ejote o la marca de medicina), desarrollan
do procedimientos para analizar los datos numéricos y ampliando éstos con la
descripción del modelo de diseño de bloque aleatorizado y el más sofisticado modelo
de diseño factorial (en el que es estudiado más de un factor a la vez en un experi
mento), y desarrollando procedimientos para el análisis de datos numéricos. A
través de todo el capítulo, se pondrá énfasis en las suposiciones que se encuentran
detrás del uso de los diferentes procedimientos de prueba:
Al terminar el capítulo, usted deberá ser capaz de:
l. Comparar y contrastar las características que diferencian a los mode
los de diseño completamente aleatorizado, de diseño de bloque
aleatorizado y de diseño factorial.
2. Entender los conceptos que se encuentran detrás de la división de la
variación total en sus diferentes fuentes de variación en los tres modelos
3. Entender las premisas de ANOVA.
4. Saber cuándo y cómo utilizar la prueba de Hartley para varianzas
homogéneas.
S. Saber cuándo y cómo conocer la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de c
poblaciones independientes.
6. Saber cuándo y cómo utilizar la prueba de rangos de Kruskal-Wallis
para examinar posibles diferencias en las medianas de c poblaciones
independientes.
7. Saber cuándo y cómo utilizar los procedimientos de compara
ción múltiples para evaluar combinaciones por parejas de
medias o de medianas de grupo.
8. Saber cuándo y cómo utilizar la prueba F de bloque aleatorizado para
examinar posibles diferencias en las medias de c poblaciones rela
cionadas.
9. Saber cuándo y cómo utilizar la prueba de rangos de Friedman para
examinar posibles diferencias en las medianas de c poblaciones rela
cionadas.
10. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles diferencias en las medias de cada factor de un diseño
factorial.
11. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles interacciones en los niveles de los factores en un diseño
factorial.
12. Describir el concepto de interacción en un diseño factorial.
14.4.1 Introducción
Cuando las mediciones resultantes en los c grupos son continuas y se cumplen
ciertas suposiciones, se puede emplear una metodología conocida como análisis
de varianza (o ANOVA; por su nombre: ANalysis Of VAriance) para comparar las
medias de los grupos. En un cierto sentido, el término análisis de varianza" parece
II
no ser el correcto, pues el objetivo consiste en analizar diferencias entre las medias
14.4.2 Desarrollo
Bajo las premisas de que los e grupos o niveles del factor que se van a estudiar repre
sentan poblaciones cuyas mediciones resultantes son tomadas de manera aleatoria
e independiente, que siguen una distribución normal y tienen varianzas iguales, la
hipótesis nula de no diferencias en las medias de población
Ho: µ1 = µz = ·· · = µe
En la figura 14.2 se representa una gráfica de la forma en que se vería una hipóte
sis nula verdadera cuando se comparan cinco grupos, y son válidas las suposiciones
de normalidad y de igualdad de varianzas.
Figura 14.2
Las cinco poblaciones tienen la
misma media: µ1 = µz = µ3 = µ4 = µ5.
Figura 14.3
Un efecto de tratamiento se
encuentra presente: µ4 > IJ 1 >
1-12 : 1,13 : 1,15,
Observamos que, excepto para diferencias en la tendencia central (es decir, µ 4 > µ 1
> µ 2 = µ 3 = µ 5) las cinco poblaciones tienen la misma apariencia.
Para llevar a cabo una prueba ANOVA de la igualdad de las medias de población,
subdividimos la variación total en las mediciones resultantes en dos partes, la que
se puede atribuir a las diferencias entre los grupos y la que se debe a variaciones inhe
rentes dentro de los grupos. La variación total generalmente se representa con la
suma del total de cuadrados (o SST, por sus siglas Sum of Squares Total). Puesto
que bajo la hipótesis nula las medias de población de los e grupos se suponen iguales,
se puede obtener una medición de la variación total entre todas las observaciones,
mediante la suma de las diferencias aj cuadrado entre cada observación individual y
la gran media o media general, X, que está basada en las observaciones de todos
los grupos combinados. La variación total se calcularía como
j= 1i=1
n¡
2
(14.1)
j = 1i = 1
en la que X se conoce como gran media o media general
n
X¡¡ es la i-ésima observación del grupo o nivel j
n¡ es el número de observaciones del grupo o nivel j
n es el total de número de observaciones en todos los grupos combinados
(n = n 1 + n 2 + ·· · + n e)
e es el número de grupos o niveles del factor de interés
L n (x; - X)
e - 2
variación entre grupos (SSA) = ¡ (14.2)
; = 1
L L (X;¡ - X )
e n¡
variación dentro del grupo (ssw) ¡
z
(14.3)
; = 1i = 1
en la que
X;¡ es la í-ésima observación del grupo o nivel j
X¡ es la media de muestra del grupo j
Puesto que e niveles del factor están siendo comparados, existen e - 1 grados
de libertad asociados con la suma de cuadrados entre grupos. Como cada uno de
los e niveles contribuye con n¡- 1 grados de libertad y
L (n
e
¡
- 1) = n-e
i=1
existen n - e grados de libertad asociados con la suma de cuadrados dentro de grupos.
Además, existen n - 1 grados de libertad asociados con la suma de totales al cuadrad...9
porque cada observación, X;¡, es comparada con la media general o gran media, X,
basándose en las n observaciones.
Si cada una de estas sumas de cuadrados se divide entre sus grados de libertad
asociados, obtendremos tres varianzas o términos cuadráticos medios: MSA,
MSWyMST:
SSA
=
MSA (14.4a)
e-1
SSW
MSW = (14.4b)
n-c
= SST
MST (14.4c)
n-l
MSA
F = (14.5)
MSW
1-
Figura 14.4
Regiones de rechazo y de no
rechazo cuando se utiliza
ANOVA para probar H 0 .
L I (X,¡ -X)'
e "1
14.4.3 Aplicación
Para ilustrar la prueba FA OVA de una dirección, suponga que el gerente de
producción de la planta en que se está empacando cereal en cajas de 368 gramos
está considerando la sustitución de una vieja máquina que afecta directamente el
resultado del proceso de producción. Tres proveedores, competidores entre sí, han
permitido que el gerente de producción utilice su equipo a modo de prueba. Los
precios de adquisición y de los contratos por servicio de las tres marcas de equipo
son esencialmente iguales. Con el propósito de tomar una decisión de compra, el
gerente de producción decide efectuar un experimento para determinar si existen
diferencias significativas entre los tres tipos de máquinas respecto al tiempo prome
dio (en segundos) que les lleva a los trabajadores de la planta terminar el proceso
de llenado, utilizando cada uno de los equipos. Quince trabajadores de la planta,
con experiencia, habilidad y edad semejantes, fueron asignados para recibir entre
namiento para operar uno de los tres tipos de equipo, de tal modo que se tienen
cinco obreros por cada máquina. Después de un tiempo adecuado de entre
namiento y práctica, el gerente de producción mide el tiempo (en segundos) que
les lleva a los trabajadores de la planta efectuar completamente el proceso de lle
nado, utilizando su respectivo equipo. Los resultados de este experimento se mues
tran en la tabla 14.2, junto con algunos cálculos sumarios. En la figura 14.5 se
presenta una gráfica de dispersión, de manera que se puedan inspeccionar visual
mente los datos y ver cómo se distribuyen las mediciones (en segundos) alrededQ_r
de su propia media de grupo, así como alrededor de la media general de grupo X.
Máquina
11 III
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40
Media X1 = 24.93 X2 = 22.61 X 3 = 20.59
28
26
•
'ü,
x,
o 24
e:
Q)
e: 22
Q) 20
18
Figura 14.S
o 11 111 Gráfica de dispersión del tiempo (en
segundos) para completar una tarea
Máquina utilizando diferentes máquinas.
Fuente: Tabla 14.2
Los respectivos términos cuadráticos medios se obtienen dividiendo estas sumas de cuadrados
entre sus correspondientes grados de libertad. Como e= 3 y n = 15, tenemos
F = MSA = 23.582 =
25_60
MSW 0.9211
Figura 14.6
Regiones de rechazo y de no rechazo
o FU(2, 12)
para el análisis de varianza al nivel de
significación de O.OS, con 2 y 12 grados
de libertad.
5 6.61 5. 9 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68
6 5.99 5. 4 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00
7 5.59 4. 4 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57
8 5.32 4. 6 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07
10 4.96 4)0 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91
11 4.84 3.'98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79
12 4.75 ) 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53
Fuente: Tomado de la tabla E.5.
el valor crítico de F al nivel de significación de .OS, es e.le 3.89. Debido a que nues
tra estadística de prueba calculada F = 25.60 es mayor que este valor crítico, la
hipótesis nula puede ser rechazada (véase figura 14.6 de la página 535). El gerente
de producción puede llegar a la conclusión de que existe una diferencia significa
tiva en el tiempo promedio requerido para terminar el proceso de llenado en las
tres máquinas.
La correspondiente tabla de resumen ANOVA se presenta en la tabla 14.4 y
contiene el valor p exacto para el valor calculado de F, obtenido con el paquete de
software MI1 ITAB (véase referencia 10). Observe que el valor p o la probabilidad
de obtener una estadística F de 25.60 o mayor cuando la hipótesis nula es ver
dadera es de .000. Puesto que este valor p es menor que el valor especificado de a,
.OS, la hipótesis nula es rechazada.
.
Ta bl a 14 4 T:a bl a d e anaT1s1s
. d e varianza para e estu d'10 d e pro d uc t·1v1'dad .
14.4.4 Reflexión
Revisemos lo que acabamos de desarrollar. De la tabla 14.2 y de la figura 14.5 obser
vamos que había diferencias entre las tres medias de muestra. Bajo la hipótesis nula
de que las medias de población de los tres grupos se suponen iguales, se obtuvo una
medida de la variación total (o STI) entre todos los trabajadores sumé!n?o las
diferencias al cuadrado entre cada observación y la media general, 22.7'1', basán
donos en todas las observaciones. La variación total se subdividió entonces en dos
componentes separadas (véase figura 14.1 de la página 528), una parte consistente
en la variación e�tre los grupos y la otra en la variación dentro de los grupos.
Si los tamaños de muestra difieren, se calcularía un alcance crítico para cada com
paración por pareja de las medias de muestra. El paso final consiste en comparar
cada uno de los c(c - 1)/2 pares de medias respecto a su correspondiente alcance
crítico. Un par específico sería declarado significativamente diferente, si la diferen
cia absoluta en las medias de muestra IX¡ - Xr I es mayor que el alcance crítico.
Para aplicar el procedimiento de Tukey-Kramer, regresemos al estudio sobre
productividad. Utilizando el procedimiento ANOVA, llegamos a la ·conclusión de
que había una diferencia en el tiempo promedio necesario para terminar una tarea
con el uso de tres máquinas diferentes. Puesto que existen tres grupos, hay
(3)(3 - 1)/2 = 3 posibles comparaciones de pareja que se tienen que tomar en cuenta.
De la tabla 14.2 de la página 533 las diferencias medias absolutas son
1. l ..\\ - x 21 = 124.93 - 22.611 = 2.32.
2. lx 1 - x 31 = 124.93 - 20.591 = 4.34.
3. lx 2 -x 31 = 122.61 - 20.591 = 2.02.
En este caso, solamente se necesita obtener un alcance crítico porque los tres gru
pos tienen muestras del mismo tamaño. Para determinar el alcance crítico, de la
tabla 14.4 de la página 536, tenemos MSW = 0.9211 y n¡ = 5. De la tabla E.12, para
a= O.OS, e= 3 y n - e= 15 - 3 = 12, el valor crítico de extremo superior de Ouc3,12)
es 3.77 (véase la tabla 1 4.5). De la ecuación (14.6), tenemos
)0· i)
9 11
alcance crítico= 3.77 { �
1 \ +
= 1.6 1 8
Puesto que 2.32 > 1.618, 4.34 > 1 .618 y 2.02 > 1.618, podemos concluir que ésta es
una diferencia importante entre cada par de medias. De aquí que la producción
representó utilidades para la máquina III, porque el tiempo promedio para com
pletar la tarea fue el más breve.
Tabla 14.S Obtención de la estadística Q de alcance estudehtizado para a= .05, con 3 y 12 grados de libertad.
Grados de Grados de libertad del numerador
libertad del
denominador 2 4 5 6 7 8 9 10 11 12 13 14 15 16
1 18.0 32.8 37.1 40.4 43.1 45.4 47.4 49.1 50.6 52.0 53.2 54.3 55.4 56.3
2 6.09 9.8 10 9 11.7 12.4 13.0 13.5 14.0 14.4 14.7 15.l 15.4 15.7 15.9
3 4.50 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.52 10.69
11 3.11 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.99 6.06
3.08) 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.62 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.72 5.79
Fuente: Tomada de la tabla E.12.
(14.7)
F,.a,
:: 1.065
:: 1.369
máx .778
Tabla 14,6 Obtención del valor crítico de Fmóx con 3 y 4 grados de libertad, al
nivel de significación de .OS.
Programas
A B e D
66 72 61 63
74 51 60 61
82 59 57 76
75 62 60 84
73 74 81 58
97 64 SS 65
87 78 70 69
78 63 71 80
Conjunto de materiales
II III
87 58 81
80 63 62
74 64 70
82 75 64
74 70 70
81 73 72
97 80 92
62 63
71
Estrategia
Cuenta diez Cuenta diez
Repartidor Cuenta cinco básica avanzada
- $56 - $26 + $16 + $60
- $78 - $12 + $20 + $40
- $20 + $18 - $14 - $16
- $46 -$8 + $ 6 + $12
- $60 - $16 - $25 +$ 4
El profesor desea saber si existe evidencia de una diferencia entre las cuatro
estrategias y, si esto es así, qué estrategias son superiores respecto a su rentabi
lidad potencial.
(a) Analice completamente los datos. (Utilice el nivel a= .01.)
(b) p.y¡¡fü¡.,.¡,p Escriba una carta al profesor en la que explique sus hallazgos.
14.5.1 lntrQducción
La prueba de rangos de Kruskal-Wallis para la diferencias en e medianas (en
la que e> 2) puede ser considerada como una extensión de la suma de rangos de
Wilcoxon para dos muestras independientes analizadas en la sección 13.5. Así pues
la prueba de Kruskal-Wallis posee las mismas propiedades de potencia con relación
a la prueba FANO VA de una dirección que la prueba de suma de rangos de Wilcoxon
respecto a la prueba t para dos variables independientes (sección 13.3). Esto significa
que, el procedimiento de Kruskal-Wallis ha resultado ser casi tan poderoso que la
prueba F en condiciones apropiadas a esta última, e incluso más poderoso que el
procedimiento clásico cuando sus premisas (véase sección 14.4.6) son violadas.
14.5.2 Desarrollo
La prueba de rangos de Kruskal-Wallis se utiliza más a menudo para probar e gru
pos de muestra independientes que han sido tomados de poblaciones que poseen
medianas iguales.Esto es, podemos probar
Ho: M1 = Mz = ... = Me
contra la hipótesis alternativa
H1: No todas las M¡ son iguales ( donde j = 1, 2, ... , e).
H = [
12
I-' - 3(n + 1)
e
n(n + 1) ; = 1 n¡
T
2
l (14.8)
en la que
n es el número total de observaciones sobre las muestras combinadas, es
decir, n = n1 + n2 + ... + ne
n¡ es el número de observaciones de la j-ésima muestra; j = 1, 2, ..., e
T¡ es la suma de los rangos asignados a la j-ésima muestra
T¡2 es el cuadrado de la suma de los rangos asignados a la j-ésima muestra
A medida que los tamaños de muestra de cada grupo se hacen grandes (mayo
res que cinco), la estadística de prueba H puede ser aproximada por la distribución
chi-cuadrada con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de
significación a, la regla de decisión sería rechazar la hipótesis nula si el valor calcu
lado de Hes mayor que el valor crítico, X2, y no rechazar la hipótesis nula si Hes
menor o igual que el valor críticoX2 (véase figura 14.7). Es decir de extremo supe
rior (véase figura 14.7). Esto es
Rechace H0 si H > X u(e-l);
En cualquier otro caso no rechace H0
o xtc-1)
Figura 14.7
Determinación de la región de
rechazo.
Tabla 1 4. 7 Conversión de
datos a rangos.
Máquina
II III
14 9 2
15 6 7
12 10 1
11 8 4
13 5 3
Fuente: Datos tomados de la tabla 14.2
de la página 533.
(l 5)(l6)
65 + 38 + 17 =
2
120 = 120
Si escogemos un nivel de significación de O.OS, para probar la hipótesis nula de
iguales medianas de población utilizamos la ecuación (14.8):
H =[ 12 :tTf ]- 3(n + 1)
n(n + 1) ; = 1 n¡
= (J¿_)[1, 191.6) - 48
240
= 59.58 - 48 = 11.58
x
Tabla 14.8 Obtención del valor crítico aproximado 2 para la prueba de Kruskal-Wallis, al nivel de significación
de .OS con dos grados de libertad.
- T.
R¡ = � (dondej= 1, . .. , e)
n;
Entonces calculamos las diferencias R¡ - R¡ ', (en la que j -:t- j') entre todos los
c(c - 1)/2 pares de rangos promedio. El alcance crítico para el procedimiento de
Dunn se obtiene de
n( n + 1) 1 1
alcance crítico= Z u (- + -) (14.9)
12 n¡ ni '
Puesto que cada uno de los tres grupos tienen el mismo tamaño de muestra, sola
mente hay un alcance crítico que sería utilizado en todas las comparaciones posi
bles. Escogiendo un nivel de significación general de O.OS, determinamos el
alcance crítico con la ecuación (14.9) obteniendo primero Z u = +2.39 (puesto que
el área del extremo superior bajo la curva es 0.05/6 o 0.0083, como se muestra en
la figura 14.8) de modo que
[J:._ l._)
n(n 1)
alcance crítico
12+ n¡ + n i '
= 2.39
(15)(16)
12 (.! .!J
5 + 5
= 6.76
Observamos que solamente la segunda comparación (es decir, 1 R 1 - R 3 I = l 13.0 -
3.4 I = 9.6) es mayor que el alcance crítico de 6. 76, así que el gerente de producción
llega a la conclusión de que la máquina III es significativamente más rápida que
la máquina I, pero no existe evidencia de una diferencia significativa entre las
máquinas I y II, así como entre las máquinas II y III. Podemos recordar que si el
gerente de producción hubiera utilizado el procedimiento paramétrico de Tukey
Kramer, descrito en la sección 14.4.5, hubiera llegado a la conclusión de que exis
ten diferencias significativas entre todos los pares de máquinas y, en consecuencia,
hubiera adquirido la máquina III debido a que el tiempo promedio para llevar a
cabo el proceso de llenado con tal equipo es el menor.
Debido a nuestros resultados incompatibles, el procedimiento de Tukey
Kramer debería utilizarse después de efectuar una prueba F ANOVA de una direc
ción, si la suposición de normalidad en las tres poblaciones subyacentes es viable.
Si no, debería emplearse el procedimiento de Dunn como el paso siguiente a la
prueba de rangos de Kruskal-Wallis.
Presión
Baja Normal Alta Muy alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8
v
14.14
en el que exprese sus hallazgos.
(c) Recomiende una póliza de garantía respecto a la vida útil de las baterías.
La ingeniero de control de calidad de una planta en donde se fabrican equipos
de sonido estéreo desea estudiar el efecto de la temperatura sobre el tiempo de
falla de un componente electrónico en particular. Para tal efecto, diseñó un
experimento en el cual 24 de estos componentes, todos tomados del mismo
lote, fueron asignados a uno de tres niveles de temperatura y luego fueron
activados de manera simultánea. A continuación presentamos los rangos
obtenidos para los tiempos de falla (es decir, se le dio el rango de 1 al primer
componente que falló).
Figura 14.9
Resultado obtenido con el paquete Microsoft Excel para Windows, donde se muestran las
estadísticas sumarias.
F.náx
(12.51) 2
=
(8.00) 2
= 2.45 > F. áx [7 57]
11 =
2.26 J
Uso de paquetes estadísticos para la evaluación de diferencias entre los e grupos 553
r
= 2.26,
2
- (0.2283)
Fmáx - = 1.97 < F, ,¡,11 [7,57]
(Ü.l629) 2
la hipótesis nula no puede ser rechazada y se puede llegar a la conclusión de que
no existe evidencia de una falta de homogeneidad de varianzas de los datos trans
formados.
Con un nivel de significación de O.OS, podemos probar la hipótesis nula
respecto a la igualdad de las siete medias de población
Figura 1 4. 1 O
Resultado obtenido con MINITAB de la prueba F ANOVA de una dirección, después de una
transformación de datos de logaritmo natural.
*
o
70 ......................................................................................................................................
*
t
40 ............ ........... ........................ ............................... ............................... ...................
10
IDEaDE
400 cases
Figura 1 4. 1 1
Resultado obtenido con el paquete STATISTIX donde se muestran las gráficas de caja y sesgos
del ingreso personal, basándose en el nivel de participación percibido en las decisiones
relacionadas con el trabajo.
Para probar las posibles diferencias entre las cuatro medianas de población, se
utilizó el paquete SAS (referencia 12) para efectuar la prueba de rangos de Kruskal
Wallis. En la figura 14.12 de la página 556 se presenta una parte de lo obtenido con
el paquete, en donde se ilustran los resultados de la prueba. Utilizando un nivel de
significación de O.OS, para probar la hipótesis nula de igualdad en la mediana del
ingreso personal para los cuatro niveles de participación en la toma de decisiones:
Uso de paquetes estadísticos para la evaluación de diferencias entre los c grupos SSS
H0 : M1 = M2 = M3 = M4
contra la hipótesis alternativa
H 1 : No todas las M¡ son iguales (donde j = 1, ... , 4)
observamos que la estadística de prueba H, 21.172, es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con tres grados de libertad (véase
tabla E.4). El valor p es de .0001. Por consiguiente, rechazamos la hipótesis nula y
podemos llegar a la conclusión de que existe evidencia de una diferencia entre las me
dianas de los ingresos personales, basándonos en los niveles conocidos de participación
en la toma de decisiones relacionadas con el trabajo.
NPARlWAY PROCEOORE
Wilcoxon seores (Rank Swas) for Variable RINCOKE
Classified by Variable !DECIDE
(400)(401) J_ + J_)
IR3 - R4 I = 1179.8 - 135.81 = 44.o 2.64
12
(
60 45
= 60.2 No significativo
Los siguientes problemas se refieren a los datos de muestra obtenidos del cues
tionario de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 de las
páginas 33-40. Deberán ser resueltos con la ayuda de un paquete de computación.
Suponga que usted ha sido contratado como asistente de investigación de Bud
Conley, el vicepresidente de recursos humanos de Industrias Kalosha. Éste le
ha dado una lista de preguntas (véanse problemas 14.18 a 14.30) que él nece
sita responder antes de su reunión con el representante de B & L Corporation,
la empresa que da asesorías sobre paquetes de prestaciones para los traba
jadores que ha contratado. Un análisis estadístico confirmatorio, basado en las
respuestas a estas preguntas pertenecientes a las variables numéricas de la
Encuesta de satisfacción de los empleados, le proporcionará un mejor
entendimiento de la composición de la fuerza de trabajo de tiempo completo
de Industrias Kalosha, y le será de utilidad en sus deliberaciones con el repre
sentante de B & L Corporation con el propósito de desarrollar un paquete de
prestaciones para los empleados.
A partir de las respuestas a las preguntas que tratan sobre variables numéricas
de la Encuesta de satisfacción de los empleados (véanse páginas 33-40) en los
problemas 14.18 a 14.30, y que se dan a continuación,
(a) Obtenga un conjunto de estadísticas descriptivas para cada grupo.
(b) Desarrolle una representación de tallo y hojas para cada grupo.
(c) Trace la gráfica de caja y bigotes para cada grupo.
(d) Desarrolle la gráfica de probabilidad normal para cada grupo.
(e) Basándose en un análisis descriptivo de los resultados del inciso (a) al (d),
respecto a las suposiciones de la prueba F ANOVA de una dirección y a la
prueba de rangos de Kruskal-Wallis, seleccione un procedimiento ade
cuado y efectúe la prueba de hipótesis al nivel de significación de a= .05.
(f) tHd12i•tl•> Escriba un memorándum a Bud Conley donde explique su
elección del procedimiento de prueba y los resultados.
14.18 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre
gunta 1), basándose en las características importantes de trabajo (véase pregunta 11)?
14.19 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre
gunta 1), basándose en las percepciones por seguir adelante (véase pregunta 12)?
14.20 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en la participación conocida en las decisiones
relacionadas con el trabajo (véase pregunta 21)?
14.21 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en qué tan orgullosos se sienten por ser parte de
la organización (véase pregunta 23)?
14.22 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en la agrupación ocupacional (véase pregunta 2)?
14.8.1 Introducción
Como en la sección 14.4, cuando las mediciones resultantes a través de los e gru
pos son continuas y se cumplen ciertas suposiciones, puede utilizarse una meto
dología conocida como análisis de varianza (o ANOVA,) para comparar las medias
de los grupos. En la presente sección ampliaremos nuestro análisis anterior de
ANOVA y el desarrollo de la prueba F de bloque aleatorizado con el fin de eva
luar las diferencias entre las medias de e grupos.
Recordamos de la figura 14. l de la página 528, que en el modelo completa
mente aleatorizado o análisis de varianza de una dirección, la variación total de las
mediciones resultantes (SST) se divide en la variación que es atribuible a las dife
rencias entre los e grupos (SSA) y la que se debe al azar o se puede atribuir a la
variación inherente dentro de los grupos (SSW). La variación dentro de los grupos
se considera como error experimental, y la variación entre grupos se atribuye a
efectos de tratamiento.
Para el modelo de diseño de bloque aleatorizado, con el objeto de filtrar los
efectos de conformar bloques, necesitamos dividir aún más la variación dentro de
los grupos (SSW) en la variación atribuible a diferencias entre los bloques (SSBL) y
la que se puede atribuir a error aleatorio inherente (SSE). Por consiguiente, como
se presenta en la figura 14.13, en el modelo de diseño de bloque aleatorizado, la
variación total de las mediciones resultantes es la suma de tres componentes: la va
riación entre grupos (SSA), la variación entre bloques (SSBL) y el error aleatorio
inherente (SSE).
--«
Variación entre grupos (SSA)
14.8.2 Desarrollo
Para desarrollar el procedimiento ANOVA respecto al modelo de diseño de bloques
aleatorizados, necesitamos definir los términos que se presentan a continuación:
L L X;¡ = esto
e r
la sumatoria de los valores de todos los bloques y de todos los grupos,
¡= 1; = 1 es, del gran total
r = al número de bloques
e = al número de grupos
n = al número total de observaciones (cuando n= re)
L L ( X - X)
e r
= 2
SST = ij (14.10)
j = li = 1
donde X =
i = 1; = 1 (esto es, la gran gran media o media general)
re
e
SSA = r I, ( X.¡ - X)
- - 2
(14.11)
j =1
I,xij
donde _x.1 = �(esto es, el tratamiento de las medias de grupo)
r
La variación entre bloques, también conocida como suma de cuadrados
entre bloques (SSBL, por sus siglas: sum of squares among blocks), se mide a
través de la suma de las diferengas al cuadrado entre la media de cada bloque, X¡ _ y
la gran media o media general, X, pesadas o ponderadas por el número de grupos, e.
La variación entre bloques se calcula con:
SSBL = e :t (
i = 1
X¡_ - X )
2
(14.12)
LX;¡
donde 5( = 1-::..2__ (esto es, la media del bloque)
e
SSE = {-
LL � (x.,, - )(.,. - )(.,. + x) 2 (14.13)
j = 1i = 1
Puesto que existen e niveles de tratamiento del factor que está siendo com
parado, hay e - 1 grados de libertad asociados con la suma de cuadrados entre gru
pos (SSA). De forma parecida, como se tienen r bloques, hay r - 1 grados de
libertad asociados con la suma de cuadrados entre bloques (SSBL). Además, exis
ten n - 1 grados de libertad asociados con la suma del total de cuadrados (SST)
porque �acta observación, X¡¡, se está comparando con la media general o gran
media, X, basándonos en las n observaciones. Por consiguiente, como se deben
sumar los grados de libertad de cada una de las fuentes de variación a los grados
de libertad de la variación total, podemos obtener los correspondientes a la com
ponente del error de la suma de cuadrados (SSE) mediante sustracción y manipu
lación algebraica.4 Los grados de libertad están dados por (r - l)(c - 1)
Si cada uno de los componentes de la suma de cuadrados se divide entre los corres
pondientes grados de libertad asociados, obtendremos los tres términos de varianza o
cuadráticos medios (MSA, MSBL y MSE) necesarios para llevar a cabo el ANOVA:
SSA
MSA = (14.14a)
e-1
SSBL
MSBL = (14.14b)
r-1
SSE
MSE = (14.14c)
(r - l)(c - 1)
Ho: µ1 = µ_z = · · · = µe
puede ser probada contra la hipótesis alternativa de que no todas las e medias de
población son iguales:
H1: No todas las µi son iguales (con j = 1, 2, ..., e)
mediante el cálculo de la estadística de prueba F:
contra la alternativa:
H1: No todas lasµ¡. son iguales
MSBL (14.16)
F =
MSE
_ MSBL
F > FU[r-1,(r-l)(c-l)]
- MSE
14.8.3 Aplicación
Para ilustrar la prueba F de bloques aleatorizados, suponga que la administración
de una cadena de restaurantes de comida rápida que tienen cuatro sucursales en una
cierta área geográfica desea evaluar el servicio en esos restaurantes. El director de
investigación de la cadena contrata a 24 investigadores (estimadores) con experien
cia variada en evaluaciones en servicio de comida. Después de realizar consultas pre
liminares, los 24 investigadores son clasificados en seis bloques de cuatro elementos,
basándose en su experiencia sobre evaluación de servicios de comida, de modo que
los cuatro investigadores con mayor experiencia quedan asignados al bloque 1, los
Bloques Restaurantes
de
evaluadores A B e D Totales Medias
1 70 61 82 74 287 71.75
2 77 75 88 76 316 79.00
3 76 67 90 80 313 78.25
4 80 63 96 76 315 78.75
5 84 66 92 84 326 81.50
6 78 68 98 86 330 82.50
Totales 465 400 546 476 1,887
Medias 77.50 66.67 91.00 79.33 78.625
r = 6, e= 4, n = re = 24
y, según lo establecido
e r
¿,¿,X;¡
X = ; = 1i = I = 1, 887 = 78.625
re 24
Aunque se sugiere con insistencia que se utilice algún paquete de software estadís
tico (veánse referencias 10, 12 y 13) para determinar los resultados de un experi-
90 .
+x:3
(/)
80 x .
fx.1
X.4
·¡:;
cii
70
-.. X.2
60
50
Figura 14. 14
o
Gráfica de dispersión de las
evaluaciones de los servicios prestados
A B e D
en cuatro restaurantes. Restaurantes
Fuente: Tabla 14.10.
mento de diseño de bloques aleatorizados, con fines ilustrativos, haremos los si
guientes cálculos:
Utilizando la ecuación (14.10),
SST= _¿ _¿(X;¡-X)
e r
2 2
= (70-78.625) 2 +(77-78.625) +···+ (86-78.625)2
= 2,295.63
= 1,787.46
�� 1/ l.
(70 - 77.50 - 71.75 + 78.625)2
j = 1i = 1
+ (77 - 77.50 - 79.00 + 78.625)2
+
SSA l, 787.46
MSA = = 595.820
e -1 3
SSBL = 283.38
MSBL = = 56.676
r -1 5
SSE 224.79
MSE = 14.986
(r-l)(c-1) 15
1,787.46
Entre grupos 4-1= 3 1,787.46 MSA = F= 595.820
3 14.986
595.820
Entre bloques 6-1= 5 283.38 MSBL =
283.38 F = 56.676
5 14.986
= 56.676
224.79
Error (6-1)(4-1)= 15 224.79 MSE =
15
14.986
Figura 1 4. 1 6
Regiones de rechazo y de no rechazo para
el estudio sobre la cadena de restaurantes o FU(5, 15)
de comida rápida, al nivel de significación
de O.OS, con 5 y 15 grados de libertad.
,.
3 Canee CfltlCO =
1 �MSE (14.17)
QU[c,(r-I)(c-I)] -r-
14·:86
alcance crítico = 4.08� = 6.448
Observamos que todos los contrastes, excepto I X_ 1 - X.4 I, son mayores que el
alcance crítico. Por consiguiente, podemos llegar a la conclusión de que existe evi
dencia de una diferencia significativa en la asistencia promedio de todas las pare
jas de restaurantes, excepto para las sucursales A y D. Además, la sucursal C tiene
la mayor asistencia (es decir, es el más preferido) y la sucursal Bes la de menor asis
tencia (es decir, es la menos preferida).
Así pues, de la tabla 14.11 de la página 565, para el estudio de la cadena de res
taurantes de comida rápida, tenemos
(5)(56.676) + (6)(3)(14.986)
RE 1.60
(23)(14.986)
Esto significa que se necesitarían 1.6 veces más observaciones en cada grupo de
tratamiento en un disefío ANOVA de una dirección para obtener la misma pre
cisión en la comparación de las medias de los grupos de tratamiento que en el caso
de nuestro diseño de bloques aleatorizados.
Marcas
Experto A B e D
E.B 24 26 25 22
N.B. 27 27 26 24
M.D. 19 22 20 16
M.H. 24 27 25 23
B.J. 22 25 22 21
R.J. 26 27 24 24
B.K. 27 26 22 23
B.M. 25 27 24 21
J.S. 22 23 20 19
(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, analice completamente los datos para
determinar si existe evidencia de una diferencia en las estimaciones con
juntas de las cuatro marcas de café colombiano y, si ése es el caso, cuáles
de las marcas tienen los mayores resultados (es decir, son las mejores).
(c) t·fiiiNM·f•), Basándose en sus resultados, escriba un borrador para un artículo
que pueda ser enviado al editor de la sección de alimentos del periódico local.
e 14.33 Un investigador médico desea efectuar un experimento para determinar si la
elección de la sustancia de tratamiento afecta el tiempo de coagulación de
plasma (en minutos). Se van a comparar cinco diferentes sustancias que mejo
ran la coagulación (es decir, tratamientos) y se estudiarán siete pacientes
mujeres que se encuentran en la primera etapa del embarazo. Se tomaron
cinco muestras de sangre a cada paciente y cada una de éstas se asigna
aleatoriamente a cada uno de los cinco tratamientos. Los datos correspondien
tes al tiempo de coagulación se muestran en la siguiente tabla:
(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, ¿existe evidencia de una diferencia en el
tiempo promedio de coagulación de plasma entre las cinco sustancias de
tratamiento?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar la
sustancia de tratamiento que difiere respecto al tiempo promedio de
coagulación.
(d) Determine la eficiencia relativa del diseño de bloques aleatorizado
respecto al diseño completamente aleatorizado.
(e) f·fiiiM•t·I•> Escriba un informe para el investigador médico basándose en
los resultados anteriores.
14.34 Una nutrióloga desea comparar tres productos dietéticos bien conocidos.
Basándose en datos correspondientes a gordura (es decir, una función de la
altura y el peso), edad y metabolismo, clasifica a 18 de sus clientes hombres en
seis grupos de tres cada uno y asigna aleatoriamente a un miembro de cada
grupo a uno de los tres tratamientos dietéticos. Los siguientes datos represen
tan la cantidad de peso (en libras) perdido por los 18 clientes después de seis
semanas de tratamiento:
Tratamiento dietético
Grupos de clientes 1 2 3
1 10.4 12.1 9.0
2 9.8 14.5 9.6
3 7.3 10.0 9.8
4 7.5 9.9 10.7
5 8.6 14.2 11.1
6 10.7 10.5 10.5
(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de .05, ¿existe evidencia de una diferencia en la
cantidad promedio de peso (en libras) perdido entre los tres tratamientos
dietéticos?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar los
tratamientos dietéticos que difieren respecto a la pérdida promedio de
peso. (Utilice el nivel a= .05)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados
respecto al diseño completamente aleatorizado.
(e) f·fiidi)i•t·I•> Escriba un informe que la nutrióloga pueda utilizar en futuras
recomendaciones dietéticas a sus clientes, basándose en los hallazgos de
este estudio.
Nivel de Estudio
Miembro Curso de Bachillerato
docente bachillerato avanzado Requisitos
L.M. 4.12 4.06 3.38
N.R. 4.87 4.72 4.60
A.C. 3.46 3.49 2.39
J.K. 3.87 3.61 3.23
J.B. 4.04 3.83 3.55
D.B. 2.90 3.23 3.52
W.F. 4.16 4.07 3.68
R.S. 4.19 3.76 3.83
M.L. 4.75 4.39 4.22
V.P. 4.29 4.34 3.67
(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Utilizando un nivel de significación a= .OS, ¿Existe alguna evidencia de
una diferencia en las evaluaciones, basándose en el tipo de clase?
(c) Si es apropiado, utilice el procedimiento de Tukey para determinar qué
tipos de clases difieren en sus evaluaciones (Utilice el nivel a= .05.)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados con
respecto al diseño completamente aleatorizado.
(e) t-t;d')i•i-i•� Escriba un memorándum que el decano pueda enviar a sus jefes
de departamento tomando en cuenta los resultados de los incisos (b) y (c), y
que les sea de ayuda en la toma de decisiones respecto a reasi.gnación, pro
moción y/o inamovilidad, basándose en las evaluaciones de la enseñanza.
1
1 e!·) Prueba de rango de Friedman para diferencias
en e medianas
14.9.1 Introducción
A menudo sucede que, a pesar de que el modelo de diseño de bloques aleatoriza
dos se considera apropiado para un experimento particular, podemos preferir
alguna alternativa libre de distribución a la prueba F de bloques aleatorizados, para
analizar los datos. Si los datos recolectados se encuentran solamente en forma de
rango dentro de cada bloque o si no se puede suponer la normalidad, se puede uti
lizar un procedimiento sencillo pero bastante poderoso conocido como prueba
de rango de Friedman.
14.9.l. Desarrollo
La prueba de rangos de Friedman se utiliza principalmente para probar si e grupos
de muestra han sido tomados de poblaciones que tienen medianas iguales. Es
decir, podemos probar la hipótesis
Ho : M1 = M2 = ... = Me
contra la hipótesis alternativa:
H 1 : No todas las M¡ son iguales (en la que j = 1, 2, ... , e)
Para desarrollar la prueba, primero sustituimos los datos por sus rangos, en
cada uno de los bloques. Esto es, en cada uno de los rbloques independientes susti
tuimos las e observaciones por sus correspondientes rangos, de modo que el rango
1 es asignado a la observación más pequeña y el rango e a la observación más
grande. Si algunos de los valores del bloque son iguales, se les asigna el promedio
de los rangos que les serían asignados si no hubiera habido empates. Así pues, R¡¡
es el rango (de 1 a e) asociado con el j-ésimo grupo (en el que j = 1, 2, ..., e) en el
i-ésimo bloque (con i = 1, 2, ... , r).
Bajo la hipótesis nula de no diferencias en los e grupos, cada asignación de ran
gos dentro de un bloque es igualmente probable. Así pues, existen e! formas posibles
de asignar rangos dentro de un bloque particular y (e!)' posibles ordenamientos de
rangos sobre los r bloques independientes. Además, si la hipótesis nula es verdadera,
no habría diferencias reales entre los rangos promedio de cada grupo (tomados sobre
los r bloques).
De lo anterior se puede derivar la siguiente estadística de prueba FR :
12 '
---¿R� - 3r(c + 1) (14.19)
rc(c + 1) i = l
en la que
R.f es el cuadrado del total de los rangos para el grupo j (j = 1,
2, ..., e).
r es el número de bloques independientes.
e es el número de grupos.
A medida que el número de bloques del experimento se hace grande (mayor
que 5), la estadística de prueba FR puede ser aproximada por la distribución chi
cuadrada, con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de sig-
Figura 14.1 7
Determinación de la región de
rechazo.
14.9.3 A p licación
Para ilustrar la prueba de rangos de Friedman para diferencias en e medianas, regre
semos a nuestro estudio sobre la cadena de restaurantes de comida rápida de la sec
ción anterior. Podemos recordar que el director de investigaciones de la cadena
diseñó un experimento de bloques aleatorizados en el cual 24 investigadores fueron
estratificados en seis bloques de cuatro, basándose en la experiencia en evaluación
de servicio de comida, y los cuatro miembros de cada bloque fueron asignados
aleatoriamente para evaluar el servicio en uno de los cuatro restaurantes que posee
la cadena. Los resultados del experimento se presentan en la tabla 14.10 de la página
563, junto con algunos cálculos sumarios y una gráfica de dispersión que se mues
tra en la figura 14.14 de la página 564, de modo que se pueda realizar una evalua
ción exploratoria visual de las tendencias y las relaciones potenciales, así como de
las violaciones en las suposiciones de los procedimientos de prueba particulares. Si
el director de investigación no desea hacer la suposición de que las evaluaciones de
servicio se encuentran distribuidas normalmente en cada restaurante, se puede em
plear la prueba de rangos de Friedman, libre de distribución, para diferencias en las
cuatro medianas de población.
La hipótesis nula que se va a probar es que las medianas de las evaluaciones de
servicio de los cuatro restaurantes son iguales; la hipótesis alternativa es que al
menos una de las medianas de los restaurantes difiere de las otras. Así pues, susti
tuyendo 1, 2, 3, 4 por A, B, C, D, tenemos:
Bloques Restaurantes
de
evaluadores A B e D
1 2.0 1.0 4.0 3.0
2 3.0 1.0 4.0 2.0
3 2.0 1.0 4.0 3.0
4 3.0 1.0 4.0 2.0
5 2.5 1.0 4.0 2.5
6 2.0 1.0 4.0 3.0
Total de rangos: 14.5 6.0 24.0 15.5
Fuente: Los datos fueron tomados de la tabla 14.10 de la página 563.
rc(c + 1)
R_ 1 + R_ 2 + R.3 (14.20)
2
14.5 + 6 + 2 4 + 15.5 =
( 6)(4)(S)
2
60 = 6 0
12 e
L z
FR = re ( e + 1 ) ¡ = R.¡ - 3r(c + 1)
1
= 1 06.25 - 9 0 = 16. 25
Puesto que la estadística de prueba FR calculada es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con e -1 = 3 grados de liber
tad (véase tabla E.4), la hipótesis nula puede ser rechazada al nivel de significación
de a= . 05. Podemos llegar a la conclusión de que existen diferencias significativas
(percibidas por los estimadores) respecto al servicio prestado en los cuatro restau
rantes.
Podemos observar que éstos son los mismos resultados que se obtuvieron para
los datos utilizando la prueba F de bloques aleatorizados de la sección 14.8.
- R
R.1 =.; (donde j = 1, ... , e)
n¡
..
Luego calculamos las diferencias R.¡ - R.¡' (en la que j * j') entre todas las
c(c - 1)/2 parejas de rangos promedio. El alcance crítico para el procedimiento de
Nemenyi se obtiene de
c(c + 1)
alcance crítico = Qu¡c,-J (14.21)
l2r
Existen (4)(4 -1)/2 = 6 comparaciones por pareja que se deben realizar porque exis
ten cuatro restaurantes. Las diferencias absolutas de los rangos promedio son
l. IR.1 - R2 I = 12.42 - 1.001 = 1.42
2. IR1 - R.31 = 12.42 - 4.0ül = 1.58
3. IR.1 - R.41 = J2.42 - 2.58J = 0.16
c(c + 1)
alcance crítico = Q U[4.=J
12r
= 3.63
= 1.91
Observamos que solamente la cuarta comparación por parejas (1 R. 2 - .R.31 = l 1.00 -
4.001 = 3.00) es mayor que el alcance crítico de 1.91, de manera que el director de
investigación puede llegar a la conclusión de que el servicio en el restaurante C es
significativamente mejor que el del restaurante B, pero no hay evidencia de una
diferencia significativa en las estimaciones de servicio entre cualquiera de las
demás parejas de restaurantes. Podemos recordar que si el director de investigación
hubiera utilizado el procedimiento paramétrico de Tukey, descrito en la sección
14.8.4, hubiera llegado a la conclusión de que hay una diferencia significativa en
las estimaciones promedio de servicio entre todas las parejas de restaurantes de la
cadena, excepto para los restaurantes A y D.
Debido a los resultados conflictivos que obtuvimos, el procedimiento de Tukey
deberá utilizarse después de llevar a cabo una prueba F de bloques aleatorizados, si
la suposición de normalidad en las cuatro poblaciones subyacentes es viable. Si no,
se deberá utilizar el procedimiento de Nemenyi como el siguiente paso de la prueba
de rangos de Friedman.
Ejercicio
Característica Ciclismo Calistenia Trote Natación Tenis
Equilibrio 5.0 2.0 4.0 1.0 3.0
Digestión 2.5 1.0 4.5 4.5 2.5
Flexibilidad 1.5 5.0 1.5 4.0 3.0
Definición muscular 4.0 5.0 2.5 2.5 1.0
Resistencia muscular 3.0 1.0 4.5 4.5 2.0
Fortaleza muscular 3.5 3.5 5.0 1.5 1.5
Sueño 3.0 2.0 4.5 4.5 1.0
Estamina 3.0 1.0 4.5 4.5 2.0
Control de peso 4.0 1.0 5.0 2.0 3.0
Equipo
Braves de Cowboys de Bulls de Penguins
Experto Beisbol futbol americano basquetbol de hockey
B.M. 3 2 1 4
L.D. 2 3 4
H.C. 1 3 4 2
F.C. 4 1 2 3
T.]. 2 3 1 4
T.A. 1 2 3 4
H.B. 3 1 2 4
H.D. 3 2 1 4
T.D. 3 1 2 4
S.D. 4 2 3 1
Nivel de observación
Conjunto de tercias
(sujetos) Mínimo Moderado Alto
55 68 67
II 78 83 84
III 34 53 54
IV 56 67 65
V 79 78 85
VI 20 29 30
VII 68 88 92
VIII 59 58 72
14.10.1 Introducción
En las secciones 14.3 a 14.6 estudiamos el análisis de varianza de una dirección o el
modelo de diseño completamente aleatorizado, y en las secciones 14.7 a 14.9 intro
dujimos el modelo de diseño de bloques aleatorizados. En la presente sección exten
deremos nuestro análisis al estudio de un modelo de diseño experimental en el cual
dos factores son de interés. Los dos factores pueden ser diferentes con respecto al nú
mero de niveles (o grupos) que contengan. Sin embargo, centraremos nuestra aten
ción solamente en situaciones en las que se tienen tamaños de muestra iguales, n',
para cada combinación de los niveles del factor A con los del factor B. (Véase refe
rencia 1 para un análisis de los modelos ANOVA con tamaños de muestra diferentes.)
1
1
X ¡¡k = valor de la k-ésima observación del nivel i del
factor A y del nivel j del factor B
X ¡¡_ = suma de los valores de la celda ij (las observaciones del nivel i del
factor A y del nivel j del factor B)
X; .. = suma de los valores de la hilera i del factor A
X.¡. = suma de los valores de la columna j del factor B
GT = gran total de todos los valores en todas las hileras y columnas
r = número de niveles del factor A
e = número de niveles del factor B
n' = número de valores (réplicas) para cada celda
n = número total de observaciones del experimento (con n = rcn')
Figura 14. 1 8
División de la variación total de un modelo de diseño factorial
de dos factores.
L L L (X - (GT) 2
r e 11'
i = 1 j = 1k = 1 rcn'
r e n'
rrrxijk
donde x=; = 1 i = 1k = 1
rcn'
(esto es, la gran media o media general
e n'
LLX;¡k
j = 1k = 1
donde X;. (esto es, la media de cada nivel del factor A)
en'
SSFB = rn'
i
L (X.;. - X)
= 1
2
(14.24)
LLX;¡k
r n'
1 1
donde X; _; =_ _k_=_ __ (esto es, la media de cada nivel del factor B)
rn'
n'I L (X;¡.
r e
SSAB = -X i .. -X.¡.+ x)
2
i = 1j = 1
(14.25)
r e XZ r XZ e XZ )2
I 1--+- l____!L¿-- I�+�
(G
n
; = 1; = 1
; = 1 en
ren ; = 1 rn
,,. X
donde
X;; = L _!!f.-
k = 1n
(esto es, la media de cada celda)
X :Z
L L L(X;¡k -X;¡/= L L rx:k - L L
r e 11' r e 11' r e
SSE= n·:· (14.26)
i=I j = 1k = 1 i = 1 j = 1k = 1 i = 1 j = 1
SSFA
MSFA = (14.27a)
r-1
SSFB
MSFB = (14.27b)
e-1
SSAB
MSAB = (14.27c)
(r - l)(c - 1)
= _S_S _E_
MSE (14.27d)
rc(n' - 1)
En el modelo ANOVA de dos factores existen tres pruebas distintas que pueden
llevarse a cabo. Si suponemos que los niveles del factor A y los del factor B fueron
específicamente seleccionados para el análisis (en lugar de ser seleccionados aleato
riamente de una población de niveles posibles), entonces hubiéramos tenido las
siguientes tres pruebas de hipótesis:
Para probar la hipótesis de no diferencia debida al factor A
Ho: µl.. = µz .. = ... = µr..
contra la hipótesis alternativa
H 1 : No todas las µ¡ __ son iguales
formamos la estadística F
MSFA
F = (14.28)
MSE
_ MSFA > F:
F U[(r-1),rc(n'-l)]
- MSE
formamos la estadística F
F = MSFB
(14.29)
MSE
formamos la estadística F
= MSAB
F (14.30)
MSE
14. 1 O. 3 Aplicación
Para ilustrar el modelo de diseño factorial de dos factores, suponga que el director
de investigaciones de mercado de una cadena de supermercados está interesado en
el estudio del efecto de la colocación de los estantes sobre la venta de un producto.
Se estudiarían cuatro lugares distintos donde colocar los estantes: colocación nor
mal (A), colocación adicional en la tienda (B), nueva colocación solamente y un
L� -
' X¡ (GT) 2 = SSFA = MSFA
A r-1 rcn' MSFA F
i = 1 r-1 MSE
e X�. (GT)2
B e-1 L
i=1
--;:-;¡ - r en' MSFB = SSFB
e-1
F = MSFB
MSE
= __S_S A
_ __
B
AB (r - l)(c - 1) MSAB F = MSAB
(r - l)(c - 1) MSE
Total rcn' - 1
.
T abl a 14 14 V,entas semana es por tamano
- d e t'1end a y co ocac1on
.
, d e estantes.
Tamaño de tienda
Colocación A B e D Totales Medias
de estante
Pequeña 45
50 ':) cr 56 1 \ �
63
65 ,�
(o
48 '<2> \
53 451 56.375
\\+
71
Mediana 57
65
'2.2 �: \/14
73
80
¡s� 60
57 539 67.375
Grande 70
78 \ B 75
82 ':)-t �; I'+ I 7
75
114w
622 77.750
Totales 365 423 460 364 1,612
Medias 60.83 70.50 76.67 60.67 67.167
L, L, rxik
e 11'
= 45 2 + 50 2 + ... + 75 2 = 111,550
i=lj=lk=l
X2 451 2 +539 2 + 6 22 2
L,�
r
= ------ = 110,100.75
i=lcn (4)(2)
�� -------- = 111,292
i=li=l n' (2)
(GT)2 1' 612
2
= 108 , 272.66
ren' (3)( 4)( 2 )
SST = i i ± X� - (GT) 2
ren ,
¡ = 1 ; =1 k = 1
k
SSFA =
i X¡ - (GT) 2
¡ = 1 en' ren'
= 110 ,100.75 - 108 ,272. 66 = 1, 828.09
¡ = 1; = 1 n ¡ = 1 en ¡ =
1
rn ren
= 111 , 292 -110,100.75 - 109, 375 + 108 , 27 2 . 66
= 88.91
ssE = x�k - n
i=li=lk=l i=li=l
Para calcular las varianzas utilizamos las ecuaciones (14.27a) hasta (14.27d).
De la ecuación (14. 27a):
SSFA 1, 828.09
MSFA = = = 914.045
r-1 3 -1
SSAB 88·91
MSAB = = = 14.818
(r - l)(c -1) (3-1)(4-1)
De la ecuación ( 1 4.2 7d):
_S_S_E_ __2_ 5_8 __ =
MSE = 2 1 .5
rc(n' - 1) (3)(4)(2 -1)
En el estudio del supermercado, los cálculos que acabamos de realizar pueden
resumirse en la tabla 14.15.
Figura 14.20
o 3.49 FLJ<.3, 12¡
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 3 y
12 grados de libertad.
Figura 14.21
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 6 y
12 grados de libertad.
60
E
50
Q)
E 40
C/l
30
20
10
Figura 14.22
Ventas promedio semanales, basadas en el tamaño de tienda para
diferentes colocaciones de estantes.
,. MSE (14.31)
a1Canee CiltlCO = Q U[r,rc(n'-J)] �
en'
,. MSE
a1 Canee CiltiCO = Q U[c,rc(n'-1)] �--;:;::¡;- (14.32)
Al igual que en las secciones 14.4.5 y 14.8.4, cada una de las c(c - 1)/2 o r(r - 1)/2
parejas de medias se comparan respecto el alcance crítico apropiado. Una pareja
específica de medias sería declarada significativamente diferente si la diferencia
absoluta en las medias de muestra ( 1 X¡ . - X¡ ,..1) para el factor A o IX.¡. - X.r.1 para
el factor B) es mayor a su respectivo alcance crítico.
Para aplicar el procedimientq de Tukey, regresemos a nuestro ejemplo del
supermercado. Respecto al factor A, puesto que tenemos tres grupos, existen (3)(3
-1)/2 = 3 posibles comparaciones por pares que se deben realizar. De la tabla 14.14
de la página 582, las diferencias medias absolutas son:
l. IX1 .. - X2 .I = l 56.375 - 67.3751 = 11.000
2. IX1.. - X3 .. I = 1 56.375 - 77.7501 = 21.375
3. IX2 .. - X3 .. I = 1 67.375 - 77.7501 = 10.375
Para determinar el alcance crítico, de la tabla 14.15 de la página 584, tenemos: MSE
= 21.5, r = 3 y e= 4. De la tabla E.12, para a= .05, r = 3 y rc(n' - 1) = (3)(4)(2 - 1) =
12, el valor crítico de extremo superior, Qu(3 ,12i, es 3.77. De la ecuación (14.31),
tenemos
2 5
alcance crítico = 4.20� �· = 7.95
Observamos que todos los contrastes son mayores que el alcance crítico. Por con
siguiente, podemos llegar a la conclusión de que las tiendas pequeñas, medianas y
grandes difieren entre sí respecto a sus ventas semanales.
En lo que concierne al factor B, puesto que se tienen cuatro grupos, existen
(4)(4 - 1)/2 = 6 posibles comparaciones por parejas que se deben realizar. De la
tabla 14.14 de la página 582, las diferencias medias absolutas son
1. IX.1 - x.2.I = 160.83 - 70.501 = 9.67
2. 1x 1 - x. 3 .I = 160.83 - 76.671 = 15.84
3. 1x 1 . - x.4.1 = 160.83 - 60.671 = .16
4. lx.2. - X 3 .I = 170.50 - 76.671 = 6.17
5. 1x.2. - x 4.I = 170.50 - 60.671 = 9.83
6. IX 3 . - x.4.1 = 176.67 - 60.671 = 16.00
2 5
alcance crítico = 4.20� �· = 7.95
Observamos que X.1. es diferente de X.2. (9.67 > 7.95) y X. 3. (15.84> 7.95), y X.4. es
diferente de X.z. (9.83 > 7.95) y X.3.(16 > 7.95). Así pues, podemos llegar a la conclusión
de que la colocación de estantes A (normal) y D (normal más "listones de propaganda")
son, cada uno, diferentes de las colocaciones B (colocación adicional en la tienda) y C
(nueva colocación con "anunciante"). Sin embargo, no existe evidencia de que haya
una dife-rencia entre las colocaciones A y D o entre las colocaciones B y C.
µ;._ = o F = MSFA
MSE
F = MSFA
MSAB
F = MSFA
MSAB
F =
MSFA
MSE
o F = MSFB F = MSFB F = MSFB F = MSFB
µ_¡. = MSE MSAB MSE MSAB
AB;¡ = o F
= MSAB
F =
MSAB F = MSAB F =
MSAB
MSE MSE MSE MSE
Como observamos en la tabla 14.16, las pruebas para los efectos principales son
distintas, dependiendo del tipo de modelo elegido. Para el modelo de efectos fijos,
las pruebas F implican el cociente de MSFA o MSFB entre MSE. Para el modelo de
efectos aleatorios, las pruebas F (para los efectos principales) implican el cociente
MSFA o MSFB entre MSAB. Para el modelo de efectos mezclados con el factor A fijo
y el factor B aleatorio, la prueba F para el factor A implica el cociente de MSFA entre
MSAB, y la prueba para el factor B implica el cociente de MSFB entre MSE. Para
el modelo fijo con el factor A aleatorio y el factor B fijo, la prueba F para el factor
A implica el cociente de MSFA entre MSE, mientras que la prueba para el factor B
implica el cociente de MSFB entre MSAB.
Marcas de VCR
Centros de servicio A B e
1 52 48 59
57 39 67
2 51 61 58
43 52 64
3 37 44 65
46 50 69
Amplificadores
Receptor A B e D
9 8 8 10
R¡ 4 11 7 15
12 16 1 9
7 5 o 6
R2 1 9 1 7
4 6 7 5
Grupo de edad
Tipo de cirugía de rodilla Menos de 30 De 30 a 50 Más de 50
1 4 3
3 3 5
Artroscopía 2 2 2
6 3 3
2 2 3
3 4 4
10 5 8
Artrotomía 6 11 12
7 5 10
�-
8 6 3
Máquina
Operador II III
115 111 109
A 115 108 110
119 114 107
117 105 110
B 114 102 113
114 106 114
109 100 103
e 110 103 102
106 101 105
112 105 108
D 115 107 111
111 107 110
1 4. 1 1 • 1 Dificultades potenciales
En el presente capítulo enfocamos nuestra atención a varios modelos de diseño
experimental e introdujimos algunos procedimientos paramétricos y libres de dis
tribución que pueden utilizarse cuando se analizan posibles diferencias en los
resultados numéricos o en las mediciones de respuesta entre los niveles (de
tratamiento) de algún factor de interés. Luego ampliamos lo anterior para tomar
en consideración los efectos de dos factores en el diseño de experimentos. De
nuevo, parte de un buen análisis de datos consiste en entender las suposiciones
que subyacen en cada uno de los procedimientos de prueba de hipótesis y, uti
lizándolos junto con otros criterios, seleccionar el más adecuado para un conjunto
dado de condiciones. Así pues, incluso cuando nuestro objetivo principal es
realizar un análisis confirmatorio de un experimento en particular o de un con
junto de datos, siempre debemos llevar a cabo, primero, un análisis exploratorio y
descriptivo, de manera que a través de la observación podamos entender mejor lo
que los datos contienen y qué tendencias, relaciones y efectos potenciales nos
están indicando. El hecho de no considerar los datos con este cuidado no es en sí
falta de ética. Sin embargo, por lo generé!! trae como resultado un análisis que no
es óptimo.
s:
o
Procedimientos de
e muestras
.¡:a, 1
z
)>
o lipo
Categóricos Cuestiones
'<
o.... 1 de
datos
éticas
;;¡
VI Véase
-o
..., capitulo 15
e:
Numéricos
"'o-
(D
1 1
VI
c..
"
(D
�
3e:
(D
....
VI Diseño Diseño Disef\o
"'..., completamente de bloques factorial
VI
aleatorio aleatorio
o::,
('l
c..
; ;
1 1
�
o
VI
::,
e:
3
1 \ 1 1 \ 1
Prueba de Prueba de Prueba Prueba de Sumas Modelos fijos,
(D,
..., Prueba
¡:;· Hartley para rangos de rangos de Interacción aleatorios y
r
o FANOVA FANOVA de cuadrados
VI homoscedasticidad Kruskal-Wallis Friedman mezclados
1 ' 1 í 1
1
l
1
1
Comparaciones
múltiples
( ¡
l. ¿Cuáles son las características distintivas de los modelos de diseño
completamente aleatorizado, de bloques aleatorizados y factorial de
dos factores?
2. ¿Cuáles son las principales suposiciones de A OVA?
3. ¿En que condiciones debe utilizarse la prueba Fmáx de Hartley?
4. ¿En qué condiciones debe seleccionarse la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de e
poblaciones independientes?
S. ¿En qué condiciones debe seleccionarse la prueba de rangos de
Kruskal-Wallis para examinar posibles diferencias en las medianas de
e poblaciones independientes?
6. ¿Cuándo y cómo debería utilizarse el procedimiento de compara
ciones múltiples para evaluar combinaciones por parejas de las
medias o de las medianas?
7. ¿En qué condiciones debe seleccionarse la prueba F de bloques
aleatorizados para examinar posibles diferencias en las medias de e
poblaciones relacionadas?
8. ¿En qué condiciones debería seleccionarse la prueba de rangos de
Friedman para examinar posibles diferencias en las medianas de e
poblaciones relacionadas?
9. ¿En qué condiciones debería seleccionarse la prueba F ANOVA de
dos direcciones para examinar las posibles diferencias en las medias
de cada factor de un diseño factorial?
10. ¿Qué queremos decir con el concepto de interacción en un diseño
factorial?
11. ¿Cómo podemos utilizar la prueba F ANOVA de dos direcciones para
examinar la posible interacción en los niveles de los factores de un
diseño factorial?
Revise la lista de preguntas para ver si, efectivamente, conoce las respuestas y
puede (1) explicarlas a alguna persona que no haya leído el capítulo y (2) dar refe
rencias de lecturas específicas o de ejemplos que apoyen su respuesta. También,
vuelva a leer cualquier sección que le haya parecido confusa para ver si ahora tiene
sentido.
Juntando todo
TÉRMINOS CLAVE
alcance crítico 537 distribución F 531
aleatoriedad 539 distribución Fmáx 540
análisis de varianza (ANOVA)527 distribución (Q) de rangos
ANOVA de dos direcciones 577 studentizados 574
a posteriori 537 efectos de interacción 586
bloques 558 efectos principales 586
comparaciones múltiples 537 eficiencia relativa (RE) 567
cuadrados medios 530 error aleatorio inherente'(SSE) 561
diseño completamente aleatorizado 527 error experimental 528
diseño de bloques aleatorizados 558 grupos de tratamiento 558
diseño factorial 577 homogeneidad de varianza 539
14.50 t•füiM•i·Y·� Escriba una carta a un amigo que no ha tomado ningún curso de
estadística y explíquele de que se trata el presente capítulo. Para resaltar el
contenido del mismo, asegúrese de incorporar sus respuestas a las once pre
guntas de repaso de la página 595.
14.51 El gerente de ventas al detalle de una cadena de supermercados desea determi
nar si la colocación de juguetes para mascotas tiene algún efecto sobre la venta
del producto. Se van a considerar tres lugares en pasillo: anterior, en medio y
posterior. Se seleccionó una muestra aleatoria de 18 tiendas y en seis de ellas
fueron asignadas aleatoriamente un lugar en pasillo. El tamaño del área de
exhibición y el precio del producto fueron constantes en todas las tiendas. Al
final de un periodo de prueba de una semana, el volumen de ventas (en miles
de dólares) del producto en cada tienda fue el siguiente:
Colocación en pasillo
Anterior En medio Posterior
8.6 2.0 4.6
7.2 3.2 2.8
5.4 2.4 6.0
4.0 1.8 2.2
5.0 1.4 2.8
6.2 1.6 4.0
Altura en estante
Colocación Superior En medio Inferior
en pasillo
Anterior 8.6 6.2 5.0
7.2 5.4 4.0
En medio 3.2 2.0 1.8
2.4 1.4 1.6
Posterior 6.0 4.0 2.8
4.6 2.8 2.2
Vino
Catador 1 2 3 4 5 6 7 8
A 10 17 15 9 12 6 15 9
B 9 14 11 5 16 2 15 7
e 10 18 10 5 18 5 10 10
D 9 11 13 10 17 11 14 9
E 10 16 12 8 18 8 10 10
F 6 16 3 8 4 2 2 5
G 9 12 14 9 9 6 6 5
H 7 12 11 8 15 9 12 8
I 10 18 12 12 16 10 10 16
J 16 9 10 13 18 11 15 14
K 14 16 13 12 15 15 17 11
L 15 17 10 13 15 16 16 13
Proyectos de minicasos de
aprendizaje colaborativo
Para cada uno de los siguientes, ref'iérase a las instrucciones de la página 101
CL 14.1 Refiérase al CL 3.2 de la página 101, CL 4.2 de la página 165 y al CL5.2 de la
página 199. Su grupo la empresa , ha sido contratada por el edi
tor de la sección de alimentos de una popular revista familiar para estudiar el
costo y las características de los cereales listos para comer. Armados con el
Conjunto especial de datos 2 del apéndice D de las páginas D-6 y D-7, la
empresa desea determinar si existe evidencia de una diferen
cia en el costo promedio por ración de cereales listos para servirse, basándose
en la clasificación en alto contenido de fibra o bajo contenido de fibra.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos d� prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de alimentos de la revista.
CL 14.2 Refiérase al CL 3.3 de la página 102, CL 4.3 de la página 165 y al CL 5.3 de la
página 199. Su grupo, la empresa , ha sido contratada por el direc
tor de comercialización de una fábrica de fragancias bien conocidas para hom
bre y mujer, para estudiar las características de las fragancia actualmente
disponibles. Armados con el Conjunto especial de datos 3 del apéndice D de
las páginas D8 y D9, la empresa desea determinar si existe evi
dencia de una diferencia en el costo promedio por onza, basándose en la
intensidad (muy fuerte, fuerte, medio, ligero).
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al director de
comercialización.
CL 14.3 Refiérase al CL 3.4 de la página 102, al CL 4.4 de la página 166 y al CL 5.4 de la
página 200. Su grupo, la empresa ha sido contratada por el editor
de la sección de viajes <;le un famoso periódico, quien está preparando un
artículo principal sobre cámaras compactas de 35 mm. Armados con el
Conjunto especial de datos 4 del apéndice D de las páginas D-10 y D-11, la
empresa desea determinar si existe evidencia de una diferencia en
la precisión promedio de encuadre basándose en el tipo de cámara de 35 mm.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de viajes.
_,
Extremadamente Extremadamente
mala Neutral buena
Apariencia 1 2 3 4 5 6 7
Durabilidad 2 3 4 5 6 7
Desempeño en escritura 1 2 3 4 5 6 7
--
-John, ése podría ser un interesante mación para una muestra de ocho estu
argumento estadístico -intervino Nat diantes de preparatoria son:
Notas finales
l. En algunas ocasiones la variación entre grupos se conoce y como n = re, haciendo un poco de álgebra tenemos:
como variación entre dos grupos. En tales situaciones, la n -1 - (e - 1) - ( r - 1) = re - 1 - e+ 1 - r + 1
suma de los términos cuadráticos se conoce como suma
de cuadrados entre grupos o SSB (por sus siglas Sum of =re-e- r +l
Squares Between). = (r - l)(e - 1)
2. Además de este análisis exploratorio de datos, se debería 5. En esencia, en un modelo de diseño de bloques aleatori
contemplar un planteamiento más confirmativo para zado, los bloques no tienen la misma posición que un fac
examinar las suposiciones de un procedimiento de prueba tor. En la sección 14.10 veremos que cuando los bloques
particular, antes de decidir si el procedimiento es viable son considerados con la importancia suficiente para cons
para un conjunto de datos dado. Para la prueba F ANOVA tituir un segundo factor, el diseño se conoce como mode
de una dirección, las principales suposiciones son que los lo factorial de dos factores, y la prueba del efecto de cada
datos de muestra de cada grupo son tomados de maneras factor sería, potencialmente, importante.
aleatoria e independiente de una población subyacente 6. Tomaremos en consideración el caso general en el que se
normal, y que estas poblaciones tienen igual variabilidad tienen n' observaciones para cada combinación del factor
(véanse figuras 14.2 y 14.3 de las páginas 528 y 529). Para A y el factor B (es decir, cada celda). Si hay sólo una obser
probar la condición de normalidad véase la referencia 2. vación por celda, la notación del modelo de diseño de
Para probar la igualdad de las varianzas de las pobla bloques aleatorizados puede utilizarse con los bloques
ciones, en la sección 14.4.7 se presenta un procedimiento considerados como un segundo factor de interés.
desarrollado por H. O. Hartley.
7. Los grados de libertad asociados con la componente de
3. Puesto que e(e - 1)/2 combinaciones por parejas se reali interacción (SSAB) se encuentran mediante sustracción:
zan de manera simultánea, es necesario ajustar el área de
extremo superior bajo la curva de distribución normal n - 1 - (e - 1) - (r - 1) - re(n' - 1)
estándar con el fin de obtener el valor crítico Zu adecuado y, como n = rcn', haciendo un poco de álgebra tenemos
que permita que el alcance crítico calculado mantenga un n-l - (e-l)-(r-l)-re(n' - l)=rcn' -l-e+l-r+l-rcn'+re
nivel general de significación a, a través del experimento
(véanse referencias 3 y 6). =re-e-r+l