0% encontró este documento útil (0 votos)

664 vistas79 páginas

ANOVA y Otras Pruebas PDF

Este documento describe los objetivos y contenidos de un capítulo sobre análisis de varianza (ANOVA) y otras pruebas estadísticas para comparar múltiples muestras con datos numéricos. Introduce los conceptos de diseño experimental completamente aleatorizado, de bloque aleatorizado y factorial, y explica cómo dividir la variación total en sus fuentes. También describe los procedimientos ANOVA de una dirección, de bloque aleatorizado y factorial, así como otras pruebas como la de Hartley y Kruskal-Wallis. El objetivo es que los lectores apre

Cargado por

Wilber Contreras

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

664 vistas79 páginas

ANOVA y Otras Pruebas PDF

Cargado por

Wilber Contreras

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 79

í

capítulo

--VA y ot_ras priueb�

d/e e muestrcas
, .
con dato
numeri1co
••••••••••••••••••••••••••• ••••••••••••••••••••••••••••••
OBJETIVOS DEL Introducir los conceptos de diseño
experimental a través del desarrollo
CAPÍTULO del modelo de diseño completamente
aleatorizado y del procedimiento
ANOVA de una dirección, utilizado
para probar las diferencias entre las
medias de e grupos, y extender este
análisis hasta incluir los modelos de
diseño (con interacción) de bloque y
factorial aleatorizados.

SlS
•IN• Introducción
En el capítulo 13 utilizamos la metodología de la prueba de hipótesis para llegar a
conclusiones acerca de posibles diferencias entre los parámetros de dos grupos,
cuando tratamos con datos numéricos. A menudo, sin embargo, es necesario eva
luar las diferencias entre los parámetros de varios (c) grupos. Podríamos desear
comparar métodos alternativos, tratamientos o materiales de acuerdo con algún
criterio predeterminado. Una organización de consumidores, por ejemplo, puede
desear determinar qué tipo de llantas duran más en.condiciones de carretera; a un
investigador agrícola le gustaría saber qué variedad de ejotes dará la mayor pro
ducción; un investigador médico desearía evaluar el efecto de las diferentes marcas
de un tipo de medicina para la reducción de la presión diastólica de la sangre. En
cada uno de los ejemplos anteriores se comparan varios grupos y los datos de cada
grupo son numéricos.
Empezaremos el presente capítulo con el examen del modelo de diseño comple
tamente aleatorizado en el que tendremos solamente un factor con varios grupos
(como el tipo de llantas, la variedad de ejote o la marca de medicina), desarrollan
do procedimientos para analizar los datos numéricos y ampliando éstos con la
descripción del modelo de diseño de bloque aleatorizado y el más sofisticado modelo
de diseño factorial (en el que es estudiado más de un factor a la vez en un experi
mento), y desarrollando procedimientos para el análisis de datos numéricos. A
través de todo el capítulo, se pondrá énfasis en las suposiciones que se encuentran
detrás del uso de los diferentes procedimientos de prueba:
Al terminar el capítulo, usted deberá ser capaz de:
l. Comparar y contrastar las características que diferencian a los mode
los de diseño completamente aleatorizado, de diseño de bloque
aleatorizado y de diseño factorial.
2. Entender los conceptos que se encuentran detrás de la división de la
variación total en sus diferentes fuentes de variación en los tres modelos
3. Entender las premisas de ANOVA.
4. Saber cuándo y cómo utilizar la prueba de Hartley para varianzas
homogéneas.
S. Saber cuándo y cómo conocer la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de c
poblaciones independientes.
6. Saber cuándo y cómo utilizar la prueba de rangos de Kruskal-Wallis
para examinar posibles diferencias en las medianas de c poblaciones
independientes.
7. Saber cuándo y cómo utilizar los procedimientos de compara
ción múltiples para evaluar combinaciones por parejas de
medias o de medianas de grupo.
8. Saber cuándo y cómo utilizar la prueba F de bloque aleatorizado para
examinar posibles diferencias en las medias de c poblaciones rela
cionadas.
9. Saber cuándo y cómo utilizar la prueba de rangos de Friedman para
examinar posibles diferencias en las medianas de c poblaciones rela
cionadas.
10. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles diferencias en las medias de cada factor de un diseño
factorial.
11. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles interacciones en los niveles de los factores en un diseño
factorial.
12. Describir el concepto de interacción en un diseño factorial.

526 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

1 e!) Elección del procedimiento de prueba
apropiado al comparar e muestras
Cuando nos preparamos para evaluar diferencias entre c grupos que contienen
datos numéricos, debemos seleccionar un procedimiento de prueba adecuado. Esta
elección depende de varios criterios:
• El tipo de modelo de diseño experimental desarrollado (por ejemplo,
completamente aleatorizado, de bloque aleatorizado o factorial).
• El nivel de medición con que se tomaron los datos (es decir, ordinal
contra escala de intervalo o de cociente).
• La viabilidad de las hiptotesis que subyacen en los procedimientos de
prueba alternativos.
• La capacidad de generalización de las conclusiones por obtener.
• La accesibilidad de las tablas de valores críticos para la estadística de
prueba.
• La disponibilidad de paquetes de software de computación que con
tengan el procedimiento de prueba.
• La potencia estadística del procedimiento de prueba.
En las secciones siguientes del presente capítulo, describiremos los procedimientos
paramétricos y libres de distribución más ampliamente utilizados para la evalua
ción de diferencias en c grupos.

1 e !1 El modelo completamente aleatorizado: análisis

de varianza de un factor
A menudo resulta de interés comparar diferencias en los resultados entre varios ""''J
t, .
.•

grupos. Muchas aplicaciones industriales implican experimentos en los que se

toman en cuenta solamente los grupos o niveles pertenecientes a un factor de
interés (como la temperatura de horneado o la preferencia de sabor). Un factor
como la temperatura de horneado puede tener varios niveles numéricos (por ejem
plo, 300º, 350º, 400º, 450º) o un factor como la preferencia de sabor puede tener
varios niveles categóricos (vainilla, chocolate, frambuesa, pistache). Tales experi
mentos diseñados de un factor, en los cuales los sujetos o unidades experimentales
son asignadas aleatoriamente a grupos o niveles de un solo factor se conocen como 1
modelos de diseño de un sentido o completamente aleatorizados. ...

1 e!! Prueba F ANOVA de una dirección para

diferencias en e medias

14.4.1 Introducción
Cuando las mediciones resultantes en los c grupos son continuas y se cumplen
ciertas suposiciones, se puede emplear una metodología conocida como análisis
de varianza (o ANOVA; por su nombre: ANalysis Of VAriance) para comparar las
medias de los grupos. En un cierto sentido, el término análisis de varianza" parece
II

no ser el correcto, pues el objetivo consiste en analizar diferencias entre las medias

Prueba F ANOVA de una dirección para diferencias en e medias 527

de los grupos. Sin embargo, a través del análisis de la variación de los datos, tanto
entre los e grupos como dentro de ellos, seremos capaces de llegar a conclusiones
acerca de posibles diferencias en las medias de los grupos. En ANOVA subdividimos
la variación total de las mediciones resultantes en lo que se puede atribuir a
diferencias entre los e grupos y lo que se debe al azar o que se puede atribuir a una
variación inherente dentro de los e grupos (véase figura 14.1). La variación "dentro
de grupos" se considera error experimental, mientras que la variación "entre
grupos" se atribuye a efectos de tratamiento.

Variación entre grupos (SSA)

va,lación total ¡ssn �

Figura 14.1
División de la variación
total en un modelo .\
completamente
Variación dentro de grupos (SSW)
aleatorizado.

14.4.2 Desarrollo
Bajo las premisas de que los e grupos o niveles del factor que se van a estudiar repre
sentan poblaciones cuyas mediciones resultantes son tomadas de manera aleatoria
e independiente, que siguen una distribución normal y tienen varianzas iguales, la
hipótesis nula de no diferencias en las medias de población
Ho: µ1 = µz = ·· · = µe

puede probarse contra la hipótesis alternativa de que no todas las e medias de

población son iguales

H1 : No todas las µj son iguales (con j = 1, 2, ..., e)

En la figura 14.2 se representa una gráfica de la forma en que se vería una hipóte
sis nula verdadera cuando se comparan cinco grupos, y son válidas las suposiciones
de normalidad y de igualdad de varianzas.

Figura 14.2
Las cinco poblaciones tienen la
misma media: µ1 = µz = µ3 = µ4 = µ5.

528 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Las cinco poblaciones que representan los diferentes niveles del factor son idénti
cas y, en consecuencia, se superponen entre sí. Las propiedades de la tendencia
central, la variación y la forma son idénticas para todas.
Por otro lado, suponga que la hipótesis nula es realmente falsa, que el nivel
cuatro posee la media más grande, siguiéndole en valor la del nivel uno y que los
restantes niveles poseen medias de población iguales. En la figura 14.3 se tiene una
representación gráfica de lo anterior.

Figura 14.3
Un efecto de tratamiento se
encuentra presente: µ4 > IJ 1 >
1-12 : 1,13 : 1,15,

Observamos que, excepto para diferencias en la tendencia central (es decir, µ 4 > µ 1
> µ 2 = µ 3 = µ 5) las cinco poblaciones tienen la misma apariencia.
Para llevar a cabo una prueba ANOVA de la igualdad de las medias de población,
subdividimos la variación total en las mediciones resultantes en dos partes, la que
se puede atribuir a las diferencias entre los grupos y la que se debe a variaciones inhe
rentes dentro de los grupos. La variación total generalmente se representa con la
suma del total de cuadrados (o SST, por sus siglas Sum of Squares Total). Puesto
que bajo la hipótesis nula las medias de población de los e grupos se suponen iguales,
se puede obtener una medición de la variación total entre todas las observaciones,
mediante la suma de las diferencias aj cuadrado entre cada observación individual y
la gran media o media general, X, que está basada en las observaciones de todos
los grupos combinados. La variación total se calcularía como

variación total (SST) = L L (X;¡ - X)

j= 1i=1
n¡
2
(14.1)

j = 1i = 1
en la que X se conoce como gran media o media general
n
X¡¡ es la i-ésima observación del grupo o nivel j
n¡ es el número de observaciones del grupo o nivel j
n es el total de número de observaciones en todos los grupos combinados
(n = n 1 + n 2 + ·· · + n e)
e es el número de grupos o niveles del factor de interés

Prueba F ANOVA de una dirección para diferencias en c medias Sl9

La variación entre grupos, por lo general conocida como suma de cuadra
dos entre grupos (o SSA; por sus siglas Sum of Squares Among), se mide medi<!_nte
la suma de las diferencias al cuac_!_rado entre la media de la muestra de cada grupo, X¡, y
la media general o gran media, X, ponderadas o pesadas con el tamaño de muestra, n¡,
de cada grupo. 1 La variación entre grupos se calcula a partir de

L n (x; - X)
e - 2
variación entre grupos (SSA) = ¡ (14.2)
; = 1

en la que e es el número de grupos o niveles que se están comparando

n¡ es el número de observaciones del grupo o nivel j
8'.i es la media de muestra del grupo j
X es la media general o gran media
La variación dentro del grupo, por lo general conocida como la suma
de cuadrados dentro de los grupos (o SSW, por sus siglas Sum of Squares
Within), mide la diferencia entre cada observación y la media de su propio
grupo, y suma los cuadrados de tales diferencias sobre todos los grupos. La
variación dentro de los grupos puede calcularse con

L L (X;¡ - X )
e n¡
variación dentro del grupo (ssw) ¡
z
(14.3)
; = 1i = 1

en la que
X;¡ es la í-ésima observación del grupo o nivel j
X¡ es la media de muestra del grupo j
Puesto que e niveles del factor están siendo comparados, existen e - 1 grados
de libertad asociados con la suma de cuadrados entre grupos. Como cada uno de
los e niveles contribuye con n¡- 1 grados de libertad y

L (n
e

¡
- 1) = n-e
i=1
existen n - e grados de libertad asociados con la suma de cuadrados dentro de grupos.
Además, existen n - 1 grados de libertad asociados con la suma de totales al cuadrad...9
porque cada observación, X;¡, es comparada con la media general o gran media, X,
basándose en las n observaciones.
Si cada una de estas sumas de cuadrados se divide entre sus grados de libertad
asociados, obtendremos tres varianzas o términos cuadráticos medios: MSA,
MSWyMST:

SSA
=
MSA (14.4a)
e-1
SSW
MSW = (14.4b)
n-c
= SST
MST (14.4c)
n-l

S30 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Debido a que una varianza se calcula dividiendo la suma de diferencias al
cuadrado entre los correspondientes grados de libertad, los términos cuadráticos
medios son todas las varianzas.
A pesar de que el principal interés consiste en comparar las medias de los e gru
pos o niveles de un factor para determinar si existe un efecto de tratamiento entre
los e grupos, el procedimiento ANOVA adquiere su nombre del hecho de que lo ante
rior se logra mediante el análisis de las varianzas. Si la hipótesis nula es verdadera y
no existen diferencias reales en las medias de los e grupos, los tres términos cuadráti
cos medios, MSA, MSW y MST, proporcionan estimaciones de la varianza, cr2, inhe
rentes a los datos. Así pues, para probar la hipótesis nula

contra la hipótesis alternativa

H1 : No todas lasµ¡ son iguales (en las que j = 1, 2, ... , e)

calculamos la estadística de prueba F, que es el cociente de MSA entre MSW, como

MSA
F = (14.5)
MSW

La estadística F sigue una distribución F con e - 1 y n - e grados de libertad. Para un

nivel de significación dado, cr, podemos rechazar la hipótesis nula si la estadística de
prueba F excede al valor crítico de extremo superior, Furc-I,n-<J de la distribución F (véase
tabla E.5). Esto es, como se muestra en la figura 14.4, nuestra regla de decisión es:

Rechazar H0 si F > Fu(c-1,n-<)

en cualquier otro caso, no rechazar H0 .

Figura 14.4
Regiones de rechazo y de no
rechazo cuando se utiliza
ANOVA para probar H 0 .

Si la hipótesis nula fuera verdadera, deberíamos esperar que la estadística F

calculada fuera aproximadamente igual a 1, pues los términos cuadráticos medios
tanto del numerador como del denominador son estimaciones de la varianza ver
dadera, cr2, inherente a los datos. En el otro extremo, si H0 es falsa (y si existen
diferencias reales en las medias), deberíamos esperar que la estadística F calculada
sea sustantivamente mayor que uno, pues el numerador, MSA, estaría estimando
el efecto del tratamiento o la diferencia entre grupos, además de la variabilidad
inherente de los datos, mientras que el denominador, MSW, estaría midiendo sola
mente la variabilidad inherente. En consecuencia, el procedimiento ANOVA pro-

Prueba F ANOVA de una dirección para diferencias en e medias S3 1

duce una prueba F en la cual la hipótesis nula puede ser rechazada a un nivel de
significación a, solamente si la estadística F calculada es lo suficiente grande para
exceder a Fucc-l,n-cJ, el valor crítico de extremo superior de la distribución F, con
e- 1 y n - e grados de libertad,.según se ilustra en la figura 14.4 de la página 531.
Los resultados de un procedimiento de análisis de varianza por lo general se pre
sentan en una tabla de resumen ANOVA, cuyo formato se presenta en la tabla 14.1.
Las entradas de esta tabla incluyen las fuentes de variación (es decir, entre grupos, den
tro de grupos y total), los grados de libertad, las sumas de cuadrados, los cuadrados
medios (es decir, las varianzas) y la estadística F calculada. Además, el valor p (esto es, la
probabilidad de obtener una estadística F mayor o igual que la alcanzada, dado que la
hipótesis nula es verdadera) se incluye en la tabla ANOVA de la mayoría de los paque
tes de software estadístico (véase sección 14.6). Esto nos permite llegar directamente a
conclusiones con respecto a la hipótesis nula sin tener que referirnos a una tabla de
valores críticos de la distribución F. Si el valor p es menor que el nivel elegido de sig
nificación, a, la hipótesis nula es rechazada.

Tabla 14, 1 Tabla resumen del análisis de varianza.

Grados de Cuadrado
Fuente libertad Sumas de cuadrados medio (varianza) F

'Entre grupos c-1 SSA = L n ¡(X, - X)'

j:1
e
MSA =
SSA
e- 1
F =
MSA
MSW

L L"' (X,¡ - X )'

e
Dentro de grupos n-c ssw =
¡ MSW =
SSW
1: 1 ¡: 1 n-c

L I (X,¡ -X)'
e "1

Total n-1 SST =

j = l i = 1

14.4.3 Aplicación
Para ilustrar la prueba FA OVA de una dirección, suponga que el gerente de
producción de la planta en que se está empacando cereal en cajas de 368 gramos
está considerando la sustitución de una vieja máquina que afecta directamente el
resultado del proceso de producción. Tres proveedores, competidores entre sí, han
permitido que el gerente de producción utilice su equipo a modo de prueba. Los
precios de adquisición y de los contratos por servicio de las tres marcas de equipo
son esencialmente iguales. Con el propósito de tomar una decisión de compra, el
gerente de producción decide efectuar un experimento para determinar si existen
diferencias significativas entre los tres tipos de máquinas respecto al tiempo prome
dio (en segundos) que les lleva a los trabajadores de la planta terminar el proceso
de llenado, utilizando cada uno de los equipos. Quince trabajadores de la planta,
con experiencia, habilidad y edad semejantes, fueron asignados para recibir entre
namiento para operar uno de los tres tipos de equipo, de tal modo que se tienen
cinco obreros por cada máquina. Después de un tiempo adecuado de entre
namiento y práctica, el gerente de producción mide el tiempo (en segundos) que
les lleva a los trabajadores de la planta efectuar completamente el proceso de lle
nado, utilizando su respectivo equipo. Los resultados de este experimento se mues
tran en la tabla 14.2, junto con algunos cálculos sumarios. En la figura 14.5 se
presenta una gráfica de dispersión, de manera que se puedan inspeccionar visual
mente los datos y ver cómo se distribuyen las mediciones (en segundos) alrededQ_r
de su propia media de grupo, así como alrededor de la media general de grupo X.

532 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

También obtenemos una visión de cómo cada media de grupo se compara con la
media general. Así pues, al examinar la figura 14.5, tenemos la oportunidad de
observar posibles tendencias o relaciones a lo largo de los grupos, así como obser
var patrones dentro de los mismos y, lo que es más importante, esto nos permite
considerar cualquier violación potencial en las suposiciones requeridas por un pro
cedimiento de prueba particular. De ser más grandes los tamaños de muestra de
cada grupo, también se hubieran obtenido representaciones de tallo y hojas y grá
ficas de caja y sesgos, que proporcionan información visual adicional.2

Tabla 14.l Tiempo (en segundos) para realizar

un proceso de llenado utilizando tres
máquinas diferentes.

Máquina
11 III
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40
Media X1 = 24.93 X2 = 22.61 X 3 = 20.59

26
•

'ü,
x,
o 24
e:

e: 22

Q) 20

Figura 14.S
o 11 111 Gráfica de dispersión del tiempo (en
segundos) para completar una tarea
Máquina utilizando diferentes máquinas.
Fuente: Tabla 14.2

Observamos de la tabla 14.2 y de la figurá 14.5 que existen diferencias en las

medias de muestra para las tres máquinas. En promedio, el proceso de llenado tarda
24.93 segundos en quedar terminado, si se utiliza la máquina I; 22.61 segundos, si
se utiliza la máquina II; y 20.59 segundos, si se emplea la máquina III. La pregunta
que debe responderse es si estos resultados de muestra son lo suficientemente dife-

Prueba F ANOYA de una dirección para diferencias en e medias S33

rentes para que el gerente de producción decida que los promedios de población no
son todos iguales.
La hipótesis nula establece que no existe diferencia entre los grupos respecto
al tiempo medio para llevar a cabo completamente el proceso de llenado. Así pues,
sustituyendo 1, 2, 3 por I, II, III tenemos

La hipótesis alternativa establece que existe un efecto de tratamiento; es decir, que al

menos una de las máquinas difiere respecto al tiempo promedio requerido para
completar el proceso de llenado:

H1 : o todas las medias son iguales

Para establecer la tabla de resumen de A OVA, primero calculamos las medias

de muestra de cada grupo (véase tabla 14.2 de la página 533); después calculamos
la media general o gran media:

x =i = li = l 25.40 + 26.31 + ... + 23.40 + ... + 20.40

15
340.65
= = 22.71
15
seguida de las sumas de cuadrados:

(5)(24.93 - 22.71) 2 + (5)(22.61 - 22.71) 2 +(5)(20.59 - 22.71) 2

(5)(2.22) 2 +(5)(-.10) 2 +(5)(-2.12) 2
24.642 +.05 + 22.472
47.164

(25.40 - 24.93) 2 (23.40 - 22.61) 2 (20.00 - 20.59) 2

2
+ (26.31 - 24.93) +(21.80 - 22.61) 2 + (22.20 - 20.59) 2
e n¡
SSW= 2.,2.,(X¡¡-X¡r = +(24.10 - 24.93) 2 + +(23.50 - 22.61) 2 + +(19.75 - 20.59) 2
i = 1i = 1
2
+ (23.74 - 24.93) 2 + (22.75 - 22.61) +(20.60 - 20.59) 2
+(25.10 - 24.93) 2 + (21.60 - 22.61) 2 +(20.40 - 20.59) 2
.2209 .6241 .3481
+ 1.9044 + .6561 + 2.5921
+ .6889 + + .7921 + + .7056
+ 1.4161 + .0196 + .0001
+ .0289 + 1.0201 + .0361
11.0532

534 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

(25.40 -22.71)2 (23.40 -22.71) 2 (20.00 - 22.71) 2
+(26.31 - 22.71) 2 +(21.80 - 22.71)2 +(22.20 - 22.71) 2
L ¿,(X;¡ -xr =
e n¡
SST= +(24.10 - 22.71) 2 + +(23.50 -22.71) 2 + +(19.75 - 22.71) 2
i =1i = 1
+(23.74 - 22.71)2 +(22.75 - 22.71) 2 +(20.60 - 22.71) 2
+(25.10 -22.71)2 +(21.60 -22.71) 2 +(20.40 - 22.71)2

7.2361 .4761 7.3441

+ 12.9600 + .8281 + .2601
+ 1.9321 + + .6241 + + 8.7616
+ 1.0609 + .0016 + 4.4521
+ 5.7121 + 1.2321 + 5.3361
58.2172

Los respectivos términos cuadráticos medios se obtienen dividiendo estas sumas de cuadrados
entre sus correspondientes grados de libertad. Como e= 3 y n = 15, tenemos

SSA = 47.164 = 47.164 = _

MSA = 23 582
c-1 3-1 2
SSW 11.0532 = 11.0532 =
MSW = = 0_9211
n -e 15 - 3 12
de modo que, utilizando la ecuación (14.1) para probar H0 , obtenemos

F = MSA = 23.582 =
25_60
MSW 0.9211

Si se elige un nivel de significación de 0.05, el valor crítico de la estadística F se obtendría de la

tabla E.5, de la cual presentamos una réplica en la tabla 14.3 (en la página 536). Los valores que
se encuentran en el cuerpo de esta tabla se refieren a puntos porcentuales de extremo superior
seleccionados de la distribución F. En nuestro estudio de productividad, dado que existen dos
grados de libertad en el numerador del cociente F y 12 grados de libertad en el denominador,

Figura 14.6
Regiones de rechazo y de no rechazo
o FU(2, 12)
para el análisis de varianza al nivel de
significación de O.OS, con 2 y 12 grados
de libertad.

Prueba F ANOVA de una dirección para diferencias en e medias 535

Tabla 14. 3 Obtención del valor crítico de F con 2 y 12 grados de libertad, al nivel de .OS.
Numerador, df1
Denominador,
df2 1 2 3 4 5 6 7 8 9 10 12

5 6.61 5. 9 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68
6 5.99 5. 4 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00
7 5.59 4. 4 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57
8 5.32 4. 6 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07
10 4.96 4)0 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91
11 4.84 3.'98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79
12 4.75 ) 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53
Fuente: Tomado de la tabla E.5.

el valor crítico de F al nivel de significación de .OS, es e.le 3.89. Debido a que nues
tra estadística de prueba calculada F = 25.60 es mayor que este valor crítico, la
hipótesis nula puede ser rechazada (véase figura 14.6 de la página 535). El gerente
de producción puede llegar a la conclusión de que existe una diferencia significa
tiva en el tiempo promedio requerido para terminar el proceso de llenado en las
tres máquinas.
La correspondiente tabla de resumen ANOVA se presenta en la tabla 14.4 y
contiene el valor p exacto para el valor calculado de F, obtenido con el paquete de
software MI1 ITAB (véase referencia 10). Observe que el valor p o la probabilidad
de obtener una estadística F de 25.60 o mayor cuando la hipótesis nula es ver
dadera es de .000. Puesto que este valor p es menor que el valor especificado de a,
.OS, la hipótesis nula es rechazada.

.
Ta bl a 14 4 T:a bl a d e anaT1s1s
. d e varianza para e estu d'10 d e pro d uc t·1v1'dad .

Grados de Cuadrado medio

Fuente libertad Sumas de cuadros (varianza) F Valor p
Entre grupos (máquina) 3 - 1= 2 47.1640 23.5820 25.60 .000
Dentro grupos (máquina) 15 - 3 = 12 11.0532 .9211
Total 15 - 1 = 14 58.2172

14.4.4 Reflexión
Revisemos lo que acabamos de desarrollar. De la tabla 14.2 y de la figura 14.5 obser
vamos que había diferencias entre las tres medias de muestra. Bajo la hipótesis nula
de que las medias de población de los tres grupos se suponen iguales, se obtuvo una
medida de la variación total (o STI) entre todos los trabajadores sumé!n?o las
diferencias al cuadrado entre cada observación y la media general, 22.7'1', basán
donos en todas las observaciones. La variación total se subdividió entonces en dos
componentes separadas (véase figura 14.1 de la página 528), una parte consistente
en la variación e�tre los grupos y la otra en la variación dentro de los grupos.

536 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

¿Por qué existe variación entre los valores? es decir, ¿por qué las observaciones no
son iguales? Una razón es que al tratar a las personas de manera diferente (en este caso
dándoles a utilizar máquinas diferentes) afectamos su productividad. Esto explicaría
parte de la razón por la cual los grupos tienen medias diferentes: cuanto más grande
sea el efecto del tratamiento, mayor será la variación que encontraremos en las
medias de los grupos. Pero existe otra razón para la variabilidad en los resultados: que
las personas son naturalmente variables, ya sea que los tratemos de la misma manera
o no. Así que, incluso dentro de un grupo particular en el que todos reciben el mismo
trato (es decir, la misma máquina) tendremos variabilidad. Debido a que se presenta
dentro de cada grupo, se le conoce como variación dentro de grupos (o SSW).
Las diferencias entre las medias de los grupos se conocen como variación entre
grupos (o SSA). Parte de la variación entre grupos, como lo observamos anterior
mente, se debe al efecto de estar en grupos diferentes. Pero, incluso si no existiera un
efecto real por estar en grupos diferentes (es decir, la hipótesis nula es verdadera),
habrá posibilidad de diferencias entre las medias de los grupos. Esto es así debido a
que la variabilidad entre los trabajadores hará que las medias de muestra sean diferen
tes simplemente porque tenemos muestras diferentes. Por consiguiente, si la hipóte
sis nula es verdadera, entonces la variación entre grupos estimará la variabilidad de la
población, así como la variación dentro de los grupos. Pero si la hipótesis nula es falsa,
entonces la variación entre grupos será mayor. Este hecho forma la base de la prueba
F ANOVA de una dirección de las diferencias en las medias de los grupos.
Revisemos lo que acabamos de lograr. De nuevo, de la tabla 14.2, y la figura 14.5
en la página 533, observamos que existen diferencias entre las tres medias de mues
tra. Utilizando la prueba F ANOVA de una dirección, el gerente de producción
encuentra evidencia suficiente para llegar a la conclusión de que existe un efecto de
tratamiento significativo en los niveles (o grupos) del factor de interés, las marcas de
las máquinas. Esto es, existe evidencia de que las medias de población difieren res
pecto al tiempo requerido para llevar a cabo el proceso de llenado.
Sin embargo, lo que todavía no sabemos es qué máquina o máquinas difieren
de las otras. Todo lo que sabemos es que existe evidencia suficiente para establecer
que las medias de población no son todas iguales; es decir, al menos una o alguna
combinación de eUas es significativamente diferente. Para determinar exactamente
qué máquina o máquinas son diferentes, realizaremos todas las comparaciones de
pares posibles entre las máquinas, y utilizaremos un procedimiento desarrollado
por John Tukey (y modificado posteriormente, de manera independiente, por Tukey
y C. Y. Kramer, para situaciones en las que los tamaños de muestra son diferentes)
para llegar a nuestras conclusiones. (Véanse referencias 6, 7 y 14.)

14.4.5 Comparaciones múltiples: el procedimiento

de Tukey Kramer
En el estudio de productividad analizado hasta este momento en el presente capí
tulo, el análisis de varianza se utiliza para determinar si existe una diferencia entre
varios grupos respecto al tiempo promedio para llevar a cabo una tarea. Ya que se
han encontrado las diferencias en las medias de los grupos, es importante que
determinemos qué grupos en particular son diferentes.
A pesar de que se tienen a disposición muchos procedimientos (véanse referen
cias 6 y 9), enfocaremos nuestra atención en el procedimiento de Tukey-Kramer,
con el fin de determinar cuáles de las e medias son significativamente diferentes de
las otras. Este método es un ejemplo de un procedimiento de comparación post hoc
(o a posteriori), pues las hipótesis de interés son formuladas después de que los
datos han sido inspeccionados.
El procedimiento de Tukey-Kramer nos permite examinar simultáneamente
comparaciones entre todo�los pares de grupos. El primer paso implicado consiste
en calcular las diferencias X¡ - X)' (con j * j') entre los c(c - 1)/2 pares de medias. El
alcance crítico para el procedimiento de Tukey-Kramer se obtiene entonces de
la cantidad dada en la ecuación (14.6) de la página 538.

Prueba F ANOVA de una dirección para diferencias en c medias 537

,. MSW 1 1
al Canee CfltlCO = Q U(c,n-c) -- ( - + -. - ) (14.6)
2 n¡ ni'

Si los tamaños de muestra difieren, se calcularía un alcance crítico para cada com
paración por pareja de las medias de muestra. El paso final consiste en comparar
cada uno de los c(c - 1)/2 pares de medias respecto a su correspondiente alcance
crítico. Un par específico sería declarado significativamente diferente, si la diferen
cia absoluta en las medias de muestra IX¡ - Xr I es mayor que el alcance crítico.
Para aplicar el procedimiento de Tukey-Kramer, regresemos al estudio sobre
productividad. Utilizando el procedimiento ANOVA, llegamos a la ·conclusión de
que había una diferencia en el tiempo promedio necesario para terminar una tarea
con el uso de tres máquinas diferentes. Puesto que existen tres grupos, hay
(3)(3 - 1)/2 = 3 posibles comparaciones de pareja que se tienen que tomar en cuenta.
De la tabla 14.2 de la página 533 las diferencias medias absolutas son
1. l ..\\ - x 21 = 124.93 - 22.611 = 2.32.
2. lx 1 - x 31 = 124.93 - 20.591 = 4.34.
3. lx 2 -x 31 = 122.61 - 20.591 = 2.02.
En este caso, solamente se necesita obtener un alcance crítico porque los tres gru
pos tienen muestras del mismo tamaño. Para determinar el alcance crítico, de la
tabla 14.4 de la página 536, tenemos MSW = 0.9211 y n¡ = 5. De la tabla E.12, para
a= O.OS, e= 3 y n - e= 15 - 3 = 12, el valor crítico de extremo superior de Ouc3,12)
es 3.77 (véase la tabla 1 4.5). De la ecuación (14.6), tenemos

)0· i)
9 11
alcance crítico= 3.77 { �
1 \ +
= 1.6 1 8

Puesto que 2.32 > 1.618, 4.34 > 1 .618 y 2.02 > 1.618, podemos concluir que ésta es
una diferencia importante entre cada par de medias. De aquí que la producción
representó utilidades para la máquina III, porque el tiempo promedio para com
pletar la tarea fue el más breve.

Tabla 14.S Obtención de la estadística Q de alcance estudehtizado para a= .05, con 3 y 12 grados de libertad.
Grados de Grados de libertad del numerador
libertad del
denominador 2 4 5 6 7 8 9 10 11 12 13 14 15 16
1 18.0 32.8 37.1 40.4 43.1 45.4 47.4 49.1 50.6 52.0 53.2 54.3 55.4 56.3
2 6.09 9.8 10 9 11.7 12.4 13.0 13.5 14.0 14.4 14.7 15.l 15.4 15.7 15.9
3 4.50 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.52 10.69

11 3.11 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.99 6.06
3.08) 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.62 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.72 5.79
Fuente: Tomada de la tabla E.12.

ne Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos

14.4.6 Premisas ANOVA
En nuestro estudio de productividad parece que el análisis está completo. ¿Es cierto?
Además de nuestras investigaciones exploratorias de la figura 14.5 de la página 533,
todavía no hemos evaluado completamente las premisas que subyacen en la prueba F
de una dirección. ¿Cómo puede el gerente de producción saber si la prueba F de una
dirección fue el procedimiento adecuado para analizar sus datos experimentales?
En los capítulos 12 y 13 mencionamos las premisas hechas en la aplicación de cada
procedimiento de prueba de hipótesis y las consecuencias a las violaciones de tales
premisas. Para emplear la prueba F ANOVA de una dirección, también debemos hacer
ciertas premisas respecto a los datos que se están investigando. En el análisis de varianza
se tienen tres suposiciones principales:
l. Aleatoriedad e independencia de errores.
2. Normalidad.
3. Homogeneidad de varianzas.
La primera premisa, aleatoriedad e independencia de errores, debe
cumplirse para todos los procedimientos analizados en el presente capítulo, no sola
mente para aquellos que tratan con ANOVA, pues la validez de un experimento
depende del muestreo aleatorio y/o del proceso de aleatorización. Para evitar ten
dencias en los resultados, es esencial que se considere que los datos sean obtenidos de
manera aleatoria e independiente de las e poblaciones, o que los elementos o sujetos
sean asignados aleatoriamente a los e niveles del factor de interés (es decir, los grupos
de tratamiento). Por consiguiente, la premisa de aleatoriedad e independencia no
sólo se refiere a errores fortuitos, sino también a la diferencia de cada valor observado
respecto a la media de su propio grupo. La premisa es que tales diferencias deben ser
independientes de cada valor observado. Esto es, la diferencia (o error) de una obser
vación no debería estar relacionada con la diferencia (o error) de cualquier otra
observación. Esta premisa podría ser violada, por ejemplo, en nuestro estudio de pro
ductividad, si uno de los trabajadores ayuda a otro a terminar el proceso de llenado.
La premisa se violaría también si dos de los trabajadores de un grupo fueran gemelos
idénticos: es probable que su comportamiento sea más parecido entre sí que el com
portamiento de cualesquiera otros dos individuos del estudio. Más a menudo, sin
embargo, esta premisa es violada cuando los datos son recabados en un cierto perio
do, pues las observaciones hechas en puntos adyacentes del tiempo pueden ser más
parecidas que las que se hicieron en tiempos muy diferentes. Por ejemplo, considere
la temperatura registrada diariamente durante un mes. Es más probable que la tem
peratura de un día esté más cercana a la del día anterior, pero es menos probable que
esté cercana a la temperatura registrada varias semanas después.
De nuevo, las desviaciones de esta premisa pueden afectar seriamente las
inferencias del análisis de varianza. Estos problemas son analizados con más
detalle en las referencias 1 y 6.
La segunda premisa, sobre normalidad, establece que los valores de cada
grupo están distribuidos de manera normal. Al igual que en el caso de la prueba t,
la prueba FANO VA de una dirección es bastante robusta respecto a las desviaciones
de la distribución normal; esto es, siempre y cuando las distribuciones no sean
extremadamente diferentes de una distribución normal, el nivel de significación
de la prueba de análisis de varianza, por lo general, no se ve muy afectado por la
falta de normalidad, particularmente en muestras grandes.
Sólo cuando, la premisa de normalidad es violada seriamente, se tienen dispo
nibles alternativas libres de distribución a la prueba F ANOVA de una dirección
(véase sección 14.5). La tercera premisa, homogeneidad de varianzas, establece
que la varianza dentro de cada población debería ser igual para todas las pobla
ciones (esto es, ay = a1 = . . . = cr¡). Esta suposición es necesaria con el fin de com
binar o agrupar las varianzas en una sola fuente de variación dentro de grupos,

Prueba F ANOVA de una dirección para diferencias en e medias S39

SSW. Si se tienen tamaños de muestra iguales en cada grupo, las inferencias basadas
en la distribución F tal vez no son afectadas seriamente por varianzas desiguales.
Sin embargo, si existen tamaños de muestra desiguales en grupos diferentes, las va
rianzas distintas de un grupo a otro pueden tener serios efectos en las inferencias
obtenidas del análisis de varianza. Así pues, desde la perspectiva de la sencillez
computacional, la robustez y la potencia, debería haber tamaños de muestra iguales
en todos los grupos, siempre que sea posible.
Cuando solamente se viola la premisa de homogeneidad de las varianzas, se
tienen disponibles procedimientos parecidos a los utilizados en la prueba t' de va
rianzas separadas de la sección 13.4 (véase referencia 1). Sin embargo, si se violan
las premisa de normalidad y de homogeneidad de varianzas, se puede utilizar una
transformación de datos apropiada que normalizará los datos y reducirá las diferen
cias en las varianzas (véanse referencias 1 y 11) o, de manera alternativa, se puede
emplear un procedimiento no paramétrico más general (véanse referencias 2 y 3).

14.4. 7 Prueba Fmáx de Hartley para la homogeneidad

de varianzas
A pesar de que la prueba F ANOVA de una dirección es relativamente robusta
respecto a la premisa de varianzas de grupo iguales, grandes desviaciones de esta
suposición pueden afectar seriamente el nivel y la potencia de la prueba. Por con
siguiente, se han desarrollado varios procedimientos para probar de manera más
formal la suposición de homogeneidad de varianzas. Tal vez el más simple y el
mejor conocido sea el procedimiento Fmáx de Hartley (véase referencia 1). Para pro
bar la hipótesis nula de igualdad de las e varianzas de población

compare con la alternativa

H1 : No todas las cr f son iguales (j = 1, 2, ... , e)

obtenemos la siguiente estadística de prueba Fmáx de la distribución Fmáx de Hartley

con e y (ñ - 1) grados de libertad:

(14.7)
F,.a,

donde S,!áx = muestra de varianza mayor

S,;1. = muestra de varianza menor
'
Iin¡
ñ = � = !2. (sólo se utiliza la porción entera de este valor)
e e
Usando un nivel de significación, a, la hipótesis nula de la igualdad de varian
zas de grupo será rechi;tzada solamente cuando la estadística Fmáx calculada sea
mayor que el valor crítico de extremo superior de la distribución Fmáx de Hartley,
basada en e y (ñ - 1) grados de libertad (véase tabla E.8, de la cual la tabla 14.6 es
una réplica). Esto es,

S40 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos

r Rechazar Ha si Fmáx > Fm áx [(e, (ñ-1)];
en cualquier otro caso no rechazar H0.

Con el propósito de ilustrar el procedimiento Fmáx de Hartley, regresemos a los

datos correspondientes a estudio de productividad, que se presentan en la tabla
14.2 de la página 533. Utilizando la ecuación (4.6) de la página 120, podemos
calcular las varianzas de muestra de los tres grupos de la manera siguiente:

s1 = 1.06s, s� = .778, si= .921

Puesto que cada grupo contiene una muestra de tamaño 5, n = (5 + 5 + 5)/3 = 5 y,

al probar la hipótesis nula

contra la hipótesis alternativa

f
H1: No todas las cr �on iguales (j = 1, 2, 3)

la estadística Fmáx se calcula a partir de la ecuación (14.7) como

:: 1.065
:: 1.369
máx .778

Si se selecciona el nivel de significación de O.OS, la regla de decisión sería re

chazar Ho si Fmáx > Fmáx[J, 4] = 15.5 (véase tabla 14.6). En nuestro estudio sobre pro
ductividad, como Fmax= 1.369 < Fmax [J, 4] = 15.5, no rechazaríamos H0 y llegaríamos
a la conclusión de que no existe evidencia de una diferencia en las varianzas de los
tres grupos.
Aunque la prueba Fmáx es sencilla de utilizar, desafortunadamente no es robusta.
Es en extremo sensible a desviaciones de la normalidad en los datos. Así pues, en
situaciones en donde somos incapaces de suponer la normalidad de cada grupo
deberían aplicarse otros procedimientos alternativos (veánse referencias 2 y 3).

Tabla 14,6 Obtención del valor crítico de Fmóx con 3 y 4 grados de libertad, al
nivel de significación de .OS.

Puntos 5% superior (a= .05)

n -1 \C 2 3 4 5 6 7 8 9
2 39.0 87 5 142 202 266 333 403 475
3 15.4 27':la 39.2 50.7 62.0 72.9 83.5 93.9
4 9.60 ) 15.5 20.6 25.2 29.5 33.6 37.5 41.1
5 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7
6 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5
Ff!ente: Tomada de la tabla E.8.

Problemas de la sección 14.4

Q 14.1 Explique la diferencia entre la varianza entre grupos MSA y la varianza dentro
de grupos MSW.

Prueba F ANOVA de una dirección para diferencias en e medias 541

Q 14.2 ¿De qué manera difiere la prueba FA OVA de una dirección de la prueba de
las diferencias de dos varianzas de la sección 13.6?
Q 14.3 Compare y contraste las premisas de la prueba F ANOVA de una dirección con
las suposiciones de la prueba t para la diferencia entre las medias de dos pobla
ciones. Discuta ampliamente su respuesta.
Q 14.4 Explique cómo los métodos gráficos de los capítulos 3 y 4 podrían ser utiliza
dos para evaluar la validez de las premisas del an_álisis de varianza.
e 14.5 El gerente de personal de una compañía de seguros grande desea evaluar la
efectividad de cuatro programas de entrenamiento de ventas diseñados para
los nuevos empleados. Un grupo de 32 graduados universitarios contratados
recientemente fueron asignados aleatoriamente a los cuatro programas, de
modo que se tenían ocho sujetos en cada programa. Al final del periodo de
entrenamiento de un mes, se les aplicó a los 32 sujetos un examen estándar;
los resultados se presentan a continuación:

Programas
A B e D
66 72 61 63
74 51 60 61
82 59 57 76
75 62 60 84
73 74 81 58
97 64 SS 65
87 78 70 69
78 63 71 80

(a) Construya una gráfica o un diagrama apropiado de los datos.

(b) Describa cualquier tendencia o relación que pueda ser evidente dentro de
los grupos o entre ellos.
(c) ¿La variación dentro de los grupos parece ser similar para todos los gru
pos? Explique su respuesta.
(d) Al nivel de significación a= .05, utilice la prueba Fmáx de Hartley para pro
bar la premisa de homogeneidad de las varianzas.
(e) Basándose en los resultados obtenidos en el inciso (d), ¿puede continuar
con la aplicación de una prueba F ANOVA de una dirección para las
diferencias en las medias de población o es necesario llevar a cabo una
transformación de datos? Explique su respuesta.
(f) Si las condiciones son apropiadas, en el nivel de significación a= .05,
utilice la prueba F de una dirección para determinar si existe evidencia de
una diferencia en los cuatro programas de entrenamiento en ventas.
(g) Basándose en los resultados obtenidos en el inciso (f), si es adecuado, utili
ce el procedimiento de Tukey-Kramer para hacer todas las comparaciones
por pares de los programas de entrenamiento. (Utilice un nivel general de
significación de O.OS.)
(h) t-t;iM•ti•� Prepare un resumen ejecutivo que el gerente de personal
pueda enviar al vicepresidente de operaciones de su compañía.
14.6 Un investigador médico decidió comparar varios medicamentos para dormir
que se venden sin presentar receta. Algunas personas que tienen problemas
para dormir acudieron al laboratorio de sueños del investigador y fueron asig
nados de manera aleatoria para tomar un medicamento inocuo (una píldora
sin ingredientes activos), o las píldoras para dormir Noche Oscura, Duerma
Bien y Mr. Sandman. El número de horas que cada sujeto durmió están dadas
en la tabla siguiente:

S42 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Inocuo: 2, 4, 3, 5, 2, 4, 3
Noche obscura: 3, 4, 5, 3, 5, 4, 6, 5
Dormite: 6, 5, 7, 4, 8, 6
Mr. Sandman: 5, 4, 7, 5, 8, 6, 7

· (a) Construya una gráfica o un diagrama apropiado de los datos.

(b) Describa cualquier tendencia o relación que pueda ser evidente dentro de
los grupos o entre ellos.
(c) ¿La variación dentro de los grupos parece ser similar para todos los
grupos? Explique su respuesta.
(d) Al nivel de significación a= .OS, utilice la prueba Fmax de Hartley para
probar la premisa de homogeneidad de las varianzas.
(e) Basándose en los resultados obtenidos en el inciso (d), ¿puede continuar
con la aplicación de una prueba F ANOVA de una dirección para las
diferencias en las medias de población o es necesario llevar a cabo una
transformación de datos? Explique su respuesta.
(f) Si las condiciones son apropiadas, al nivel de significación a= .OS, utilice
la prueba F de una dirección para determinar si existe evidencia de una
diferencia entre los medicamentos para dormir.
(g) Basándose en los resultados obtenidos en el inciso (f), si es adecuado,
utilice el procedimiento de Tukey-Kramer para hacer todas las
comparaciones por pares de los medicamentos. (Utilice un nivel general
de significación de O.OS.)
(h) Comente sobre la precisión de las mediciones hechas en este
experimento.
(i) t·i.Jd?i•i·l•P Escriba un borrador de un artículo que el investigador médico
pueda enviar al editor de la columna de salud de su periódico local.
14.7 Suponga que el superintendente asistente para asuntos curriculares desea eva
luar tres conjuntos alternativos de materiales de matemáticas, de modo que un
conjunto pueda ser elegido para que el distrito escolar entero lo adquiera. Una
maestra de tercer grado del distrito se ofreció como voluntario para realizar la
comparación. Los 24 estudiantes de su clase tienen habilidades académicas
homogéneas; se les va a dividir aleatoriamente en tres grupos, con 7, 9 y 8
estudiantes cada uno. Al primer grupo se le asigna el conjunto I, al segundo
grupo se le asigna el conjunto II y al tercero el conjunto III.
Al final del año los 24 estudiantes son sometidos al mismo examen de
matemáticas. Los resultados, en una escala de cero a cien (bajo-alto) se mues
tran a continuación:

Conjunto de materiales
II III
87 58 81
80 63 62
74 64 70
82 75 64
74 70 70
81 73 72
97 80 92
62 63
71

Prueba F ANOVA de una dirección para diferencias en e medias 543

Basándose en estos resultados, al superintendente asistente le gustaría saber
si existe alguna diferencia entre los conjuntos respecto a los resultados logrados
y, si es así, qué conjunto o conjuntos es superior o superiores a los otros.
(a) Analice completamente los datos. (Utilice a= .05.)
(b) p.f¡¡¡¡q,,,,j,p Escriba un informe que la maestra de tercer año pueda enviar
al superintendente asistente.
e 14.8 Un ingeniero metalúrgico probó en cinco diferentes aleaciones la resistencia
tensil. Probó varias muestras de cada aleación; la resistencia tensil de cada una
fue

Aleación 1: 12.4, 19.8, 15.2, 14.8, 18.5

Aleación 2: 8.9, 11.6, 10.0, 10.3
Aleación 3: 10.5, 13.8, 12.1, 11.9,12.6
Aleación 4: 12.8, 14.2, 15.9, 14.1
Aleación 5: 16.4, 15.9, 17.8, 20.3

Al ingeniero le gustaría saber si existe evidencia de una diferencia en la

resistencia tensil de las diferentes aleaciones y, si esto es así, qué aleaciones son
significativamente más resistentes que las otras.
(a) Analice completamente los datos. (Utilice el nivel a= .05.)
(b) t,t;m,,,,j,p Describa los resultados al ingeniero metalurgista en un
memorándum.
14.9 Un profesor de estadística desea estudiar cuatro diferentes estrategias para
jugar el juego de cartas Blackjack (Veintiuno). Las cuatro estrategias son:

l. Estrategia del líder.

2. Estrategia de cuenta cinco.
3. Estrategia de cuenta diez básica.
4. Estrategia de cuenta diez avanzada.
Se utilizó una calculadora que puede jugar Veintiuno y los datos de las cinco
sesiones de cada estrategia se registraron. Las ganancias (o pérdidas) de cada
sesión fueron:

Estrategia
Cuenta diez Cuenta diez
Repartidor Cuenta cinco básica avanzada
- $56 - $26 + $16 + $60
- $78 - $12 + $20 + $40
- $20 + $18 - $14 - $16
- $46 -$8 + $ 6 + $12
- $60 - $16 - $25 +$ 4

El profesor desea saber si existe evidencia de una diferencia entre las cuatro
estrategias y, si esto es así, qué estrategias son superiores respecto a su rentabi
lidad potencial.
(a) Analice completamente los datos. (Utilice el nivel a= .01.)
(b) p.y¡¡fü¡.,.¡,p Escriba una carta al profesor en la que explique sus hallazgos.

Problemas intercapítulo de la sección 14.4

14.10 En el problema 13.11 de la página 472, usted utilizó una prueba tpara comparar
los gastos escolares en las escuelas preparatorias en el noreste y en el medio oeste
estadounidense. (Los datos se tomaron del problema 4.80 de la página 163.)

S44 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

(a) Efectúe una prueba F ANOVA sobre este conjunto de datos. (Utilice el
nivel a = .01.)
(b) Eleve al cuadrado el valor de t calculado en el problema 13.11; observe
que este valor es el mismo (excepto por errores de redondeo) que el valor
F. Exprese con sus propias palabras la relación entre t y F.
14.11 En el problema 13.12 de la página 472, usted utilizó una prueba t para comparar el
costo de los champues destinados a cabello fino respecto a los destinados a cabello
normal. (Los datos son tomados del problema 3.9 de la página 62.)
(a) Efectúe una prueba F ANOVA sobre este conjunto de datos. (Utilice el
nivel a= 0.05.)
(b) Eleve al cuadrado el valor de tcalculado en el problema 13.12; observe
que este valor es el mismo (excepto por errores de redondeo) que el valor
F. Exprese con sus palabras la relación entre t y F.

1 e 81 Prueba de rangos de Kruskal-Wallis para

diferencias en e medianas

14.5.1 lntrQducción
La prueba de rangos de Kruskal-Wallis para la diferencias en e medianas (en
la que e> 2) puede ser considerada como una extensión de la suma de rangos de
Wilcoxon para dos muestras independientes analizadas en la sección 13.5. Así pues
la prueba de Kruskal-Wallis posee las mismas propiedades de potencia con relación
a la prueba FANO VA de una dirección que la prueba de suma de rangos de Wilcoxon
respecto a la prueba t para dos variables independientes (sección 13.3). Esto significa
que, el procedimiento de Kruskal-Wallis ha resultado ser casi tan poderoso que la
prueba F en condiciones apropiadas a esta última, e incluso más poderoso que el
procedimiento clásico cuando sus premisas (véase sección 14.4.6) son violadas.

14.5.2 Desarrollo
La prueba de rangos de Kruskal-Wallis se utiliza más a menudo para probar e gru
pos de muestra independientes que han sido tomados de poblaciones que poseen
medianas iguales.Esto es, podemos probar

Ho: M1 = Mz = ... = Me
contra la hipótesis alternativa
H1: No todas las M¡ son iguales ( donde j = 1, 2, ... , e).

Para tales situaciones es necesario suponer que

l. Las e muestras son tomadas de manera aleatoria e independiente de
sus respectivas poblaciones.
2. El fenómeno aleatorio subyacente de interés es continuo (para evitar
empates).
3. Los datos observados constituyen al menos una escala ordinal de
medición, tanto dentro de las e muestras como entre éstas.
4. Las e poblaciones tienen la misma variabilidad.
5. Las e poblaciones tienen la misma forma.

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 545

Resulta interesante observar que el procedimiento de Kruskal-Wallis aún tiene
menos premisas limitantes que la prueba F. Para emplear el procedimiento, las
mediciones sólo necesitan ser ordinales en todos los grupos de muestra, y las dis
tribuciones de población comunes solamente necesitan ser continuas: sus formas
comunes son irrelevantes. Por otro lado, para utilizar la prueba F clásica, el nivel
de medición debe ser más sofisticado, y debemos suponer que las e muestras
vienen de poblaciones normales con igual varianza.
Para llevar a cabo la prueba de rangos de Kruskal-Wallis primero debemos (si
es necesario) sustituir las observaciones de las e muestras con sus rangos combina
dos de tal modo que el rango 1 sea asignado a la menor de las observaciones com
binadas y el rango na la mayor de las observaciones combinadas (donde n = n1 +
n2 + ... + ne)- Si cualesquiera valores están empatados, se les asigna el promedio de
los rangos que tendrían asignados si no se hubieran presentado empates en los
datos.
La estadística de prueba H de Kruskal-Wallis puede calcularse con

H = [
12
I-' - 3(n + 1)
e
n(n + 1) ; = 1 n¡
T
2
l (14.8)

en la que
n es el número total de observaciones sobre las muestras combinadas, es
decir, n = n1 + n2 + ... + ne
n¡ es el número de observaciones de la j-ésima muestra; j = 1, 2, ..., e
T¡ es la suma de los rangos asignados a la j-ésima muestra
T¡2 es el cuadrado de la suma de los rangos asignados a la j-ésima muestra
A medida que los tamaños de muestra de cada grupo se hacen grandes (mayo
res que cinco), la estadística de prueba H puede ser aproximada por la distribución
chi-cuadrada con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de
significación a, la regla de decisión sería rechazar la hipótesis nula si el valor calcu
lado de Hes mayor que el valor crítico, X2, y no rechazar la hipótesis nula si Hes
menor o igual que el valor críticoX2 (véase figura 14.7). Es decir de extremo supe
rior (véase figura 14.7). Esto es
Rechace H0 si H > X u(e-l);
En cualquier otro caso no rechace H0

Los valores críticos X2 se especifican en la tabla E.4.

o xtc-1)
Figura 14.7
Determinación de la región de
rechazo.

546 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

14.S.3 Aplicación
Para ilustrar la prueba de rangos de Kruskal-Wallis en cuanto a la diferencia de e
medianas, regresemos a nuestro estudio de productividad de la sección anterior.
Podemos recordar que el gerente de producción de la planta donde se empaca
cereal en cajas con un contenido de 368 gramos ha estado considerando la susti
tución de una máquina vieja que afecta directamente los resultados del proceso de
producción, y ha efectuado un experimento para determinar si existe alguna dife
rencia significativa entre los tres tipos de máquina respecto al tiempo promedio
(en segundos) que les lleva a los trabajadores de la fábrica efectuar completamente
el proceso de llenado con ellas. Quince obreros de experiencia, habilidad y edad
parecidas fueron asignados aleatoriamente a fin de recibir entrenamiento para operar
uno de los tres tipos de máquina, de tal modo que se tienen cinco trabajadores para
cada tipo de máquina. Después de un tiempo adecuado de entrenamiento y práctica,
el gerente de producción midió el tiempo (en segundos) que les lleva a los trabaja
dores entrenados terminar el proceso de llenado utilizando su equipo respectivo. Los
resultados de este experimento se presentan en la tabla 14.2 de la página 533, junto
con algunos cálculos sumarios y una gráfica de dispersión que se muestra en la
figura 14.5 de la página 533, de modo que se puede hacer una evaluación visual y
exploratoria de las tendencias potenciales, relaciones y violaciones de las suposi
ciones de los procedimientos de prueba particulares. Si el gerente de producción
no desea hacer la suposición de que las mediciones de tiempo (en segundos) están
distribuidas de manera normal en las poblaciones subyacentes, se puede utilizar el
procedimiento libre de distribución conocido como prueba de rangos de Kruskal
Wallis para las diferencias en las tres medianas de población.
La hipótesis nula que se va a probar es que las medianas de los tiempos nece
sarios para llevar a cabo el proceso de llenado con las tres máquinas son iguales.
Así pues, sustituyendo 1, 2 y 3 en lugar de I, II y III, tenemos:
Ho: M1 = Mz = M3
H1 : No todas las medianas son iguales

Al convertir las quince mediciones de tiempo de la tabla 14.2 (página 533) a

rangos, obtenemos la tabla 14. 7.

Tabla 1 4. 7 Conversión de
datos a rangos.

Máquina
II III
14 9 2
15 6 7
12 10 1
11 8 4
13 5 3
Fuente: Datos tomados de la tabla 14.2
de la página 533.

Observamos que en proceso de asignación de rangos de manera combinada, el ter

cer empleado asignado a la máquina III llevó a cabo el proceso de llenado con
mayor rapidez y recibió un rango de l. El primer empleado asignado a la máquina
III fue el siguiente más rápido y recibió un rango de 2. El segundo trabajador asig
nado a la máquina I terminó el proceso de llenado en el mayor tiempo y recibió
un rango de 15.

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 547

Después de que los rangos fueron asignados, entonces obtenemos la suma de
los rangos de cada grupo:
Suma de rangos: T1 = 65 T2 = 38 T3 = 17

Como una verificación de la asignación correcta de los rangos tenemos

(l 5)(l6)
65 + 38 + 17 =
2
120 = 120
Si escogemos un nivel de significación de O.OS, para probar la hipótesis nula de
iguales medianas de población utilizamos la ecuación (14.8):

H =[ 12 :tTf ]- 3(n + 1)
n(n + 1) ; = 1 n¡

12 (65)2 + (38)2 + (17)2

= { [ ]}- 3(16)
(15)(16) 5 5 5

= (J¿_)[1, 191.6) - 48
240
= 59.58 - 48 = 11.58

Utilizando la tabla E.4, el valor crítico x2 de extremo superior, con e - 1 = 2 grados

de libertad, y correspondiente a un nivel de significación de .OS es de 5.991 (véase
tabla 14.8, que es una réplica de la tabla E.4). Puesto que el valor calculado de la
estadística de prueba Hes mayor que el valor crítico, podemos rechazar la hipóte
sis nula y llegar a la conclusión de que no todas las máquinas se comportaron igual
respecto a la mediana del tiempo requerido para que un trabajador lleve a cabo el
proceso de llenado. (Esto es, si la hipótesis nula fuera realmente verdadera, la
probabilidad de obtener tal resultado o incluso uno más extremoso, es menor a
.05.)
Podemos observar que éstos son los mismos resultados que obtuvimos uti
lizando la prueba F ANOVA de una dirección en la sección 14.4.

x
Tabla 14.8 Obtención del valor crítico aproximado 2 para la prueba de Kruskal-Wallis, al nivel de significación
de .OS con dos grados de libertad.

Grados Área de extremo superior

de
libertad .995 .99 .975 .95 .90 .75 .25 .10 .os1
.025
1 0.001 0.004 0.016 0.102 1.323 2.706 3.841 5.024
2 0.010 0.020 0.051 0.103 0.211 0.575 2.773 4.605 ::, 5.991 7.378
3 0.072 0.115 0.216 0.352 0.584 1.213 4.108 6.251 7.815 9.348
4 0.207 0.297 0.484 0.711 1.064 1.923 5.385 7.779 9.488 11.143
5 0.412 0.554 0.831 1.145 1.610 2.675 6.626 9.236 11.071 12.833
Fuente: Tomada de la tabla E.4.

S48 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

14.5.4 Comparaciones múltiples: procedimiento de Dunn
Puesto que rechazamos la hipótesis nula y llegamos a la conclusión de que hay evi
dencia de una diferencia significativa entre el desempeñ.o de las máquinas con
respecto a la mediana del tiempo que le lleva a un trabajador efectuar el proceso
de llenado, el siguiente paso sería realizar una comparación simultánea de todos
los pares posibles de máquinas para determinar cuál o cuáles difieren de los otros.
Como continuación de la prueba de rangos de Kruskal-Wallis, presentaremos un
procedimiento de comparaciones múltiples post hoc o a posteriori, desarrollado por
O. J. Dunn (véanse referencias 3 y 4).
En general, con e grupos o niveles de un factor de interés, existen c(c - 1)/2
posibles comparaciones por pares a efectuar.El primer paso consiste en obtener el
rango promedio, R¡, para cada uno de los j grupos (en donde j = 1, ..., e). Podemos
recordar, de la ecuación (14.8), que cuando calculamos la estadística de prueba H,
obtuvimos !l rango total, T¡, para cada grupo. Así pues, para calcular el rango
promedio, R ¡, para elj-ésimo grupo, tenemos

- T.
R¡ = � (dondej= 1, . .. , e)
n;
Entonces calculamos las diferencias R¡ - R¡ ', (en la que j -:t- j') entre todos los
c(c - 1)/2 pares de rangos promedio. El alcance crítico para el procedimiento de
Dunn se obtiene de

n( n + 1) 1 1
alcance crítico= Z u (- + -) (14.9)
12 n¡ ni '

donde n es el número total de observaciones de todos los grupos combinados, n¡ y

n¡, son, respectivamente, el número de observaciones en los grupos j y j', y, para un
nivel seleccionado de significación a general, Z u es el valor crítico de una dis
tribución normal estandarizada (tabla E.2) que contiene un área de a/[c(c - 1)] en
el extremo superior.3
Si los tamaños de muestra son diferentes, debe calcularse el alcance crítico para
cada comparación por pares.
El paso final consiste en comparar la diferencia en cada uno de los c(c - 1)/2·
pares de rangos promedio respecto al correspondiente alcance crítico obtenido con
la ecuación (14.9). Un par específico de grupos sería declarado significativamente
diferente si las diferencias absolutas de sus correspondientes rangos promedios
exceden al alcance crítico.
Para aplicar el procedimiento de Dunn a nuestro estudio de productividad,
primero obtenemos los rangos promedio de los tres grupos, a partir de los corres
pondientes totales de rango obtenidos de la tabla 14.7 de la página 547:

R, = 13.ü R2 = 7.6 R 3 = 3.4

Existen (3)(3 - 1)/2 = 3 comparaciones por pares que se deben hacer, debido a que
hay tres máquinas. Las diferencias absolutas de los rangos promedio son

1. JR1 - R2 J = J13.ü - 7.6J = 5.4

2. IR1 - R3 J = J13.0 - 3.4J = 9.6
3. JR2 - R3 J = J7.6 - 3.4J = 4.2

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 549

Figura 14.8
Obtención de los valores críticos,
Zu, para el área de extremo
superior, a, de 0.0083 utilizada en
el procedimiento de Dunn para
o +2.39 Zu
establecer el alcance crítico.

Puesto que cada uno de los tres grupos tienen el mismo tamaño de muestra, sola
mente hay un alcance crítico que sería utilizado en todas las comparaciones posi
bles. Escogiendo un nivel de significación general de O.OS, determinamos el
alcance crítico con la ecuación (14.9) obteniendo primero Z u = +2.39 (puesto que
el área del extremo superior bajo la curva es 0.05/6 o 0.0083, como se muestra en
la figura 14.8) de modo que

[J:._ l._)
n(n 1)
alcance crítico
12+ n¡ + n i '

= 2.39
(15)(16)
12 (.! .!J
5 + 5
= 6.76
Observamos que solamente la segunda comparación (es decir, 1 R 1 - R 3 I = l 13.0 -
3.4 I = 9.6) es mayor que el alcance crítico de 6. 76, así que el gerente de producción
llega a la conclusión de que la máquina III es significativamente más rápida que
la máquina I, pero no existe evidencia de una diferencia significativa entre las
máquinas I y II, así como entre las máquinas II y III. Podemos recordar que si el
gerente de producción hubiera utilizado el procedimiento paramétrico de Tukey
Kramer, descrito en la sección 14.4.5, hubiera llegado a la conclusión de que exis
ten diferencias significativas entre todos los pares de máquinas y, en consecuencia,
hubiera adquirido la máquina III debido a que el tiempo promedio para llevar a
cabo el proceso de llenado con tal equipo es el menor.
Debido a nuestros resultados incompatibles, el procedimiento de Tukey
Kramer debería utilizarse después de efectuar una prueba F ANOVA de una direc
ción, si la suposición de normalidad en las tres poblaciones subyacentes es viable.
Si no, debería emplearse el procedimiento de Dunn como el paso siguiente a la
prueba de rangos de Kruskal-Wallis.

Problemas de la sección 14.5

e 14.12 Un psicólogo industrial desea probar si los tiempos de reacción de los traba
jadores de una línea de ensamblado son equivalentes en tres métodos de apren
dizaje diferentes. De un grupo de 25 empleados nuevos, nueve son asignados
de manera aleatoria al método A, ocho al método B y ocho al método C. Los
datos que se presentan a continuación presenta la asignación de rangos, desde
1 (el más rápido) hasta 25 (el más lento), de los tiempos de reacción para llevar
a cabo una tarea asignada por el psicólogo después del periodo de aprendizaje.

S50 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos

Método
A B e
2 1 5
3 6 7
4 8 11
9 15 12
10 16 13
14 17 18
19 21 24
20 22 25
23

¿Existe evidencia de una diferencia en los tiempos de reacción para estos

métodos de aprendizaje? (Utilice el nivel a= .01.)
14.13 Un ingeniero en control de calidad de una compañía fabricante de equipos
electrónicos de audio se encuentra inspeccionando un nuevo tipo de batería
que tal vez pueda utilizar. Un lote de 20 baterías fue dividido aleatoriamente
en cuatro grupos (de modo que había cinco baterías en cada uno). Cada grupo
de baterías fue sometido a un nivel particular de presión: baja, normal, alta y
muy alta. Las baterías se probaron simultáneamente bajo estos niveles de pre
sión y se registraron los tiempos de falla (en horas):

Presión
Baja Normal Alta Muy alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8

El ingeniero de control de calidad, por experiencia, sabe que tales datos

provienen de poblaciones que no están distribuidas de manera normal, y desea·
utilizar un procedimiento libre de distribución para el análisis de los datos.
(a) Al nivel de significación de O.OS, analice completamente los datos para
determinar si existe evidencia de una diferencia en los cuatro niveles de
presión respecto a la mediana de la vida de las baterías y, si éste es el caso,
funcionamiento de las baterías
(b) f·tiiil')l•i·I·� Escriba un memorándum al ingeniero encargado de la calidad

v
14.14
en el que exprese sus hallazgos.
(c) Recomiende una póliza de garantía respecto a la vida útil de las baterías.
La ingeniero de control de calidad de una planta en donde se fabrican equipos
de sonido estéreo desea estudiar el efecto de la temperatura sobre el tiempo de
falla de un componente electrónico en particular. Para tal efecto, diseñó un
experimento en el cual 24 de estos componentes, todos tomados del mismo
lote, fueron asignados a uno de tres niveles de temperatura y luego fueron
activados de manera simultánea. A continuación presentamos los rangos
obtenidos para los tiempos de falla (es decir, se le dio el rango de 1 al primer
componente que falló).

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas SS 1

Temperatura
lSO'F 200'F 250'F
4 2 1
7 8 3
10 11 5
13 12 6
18 17 9
21 19 14
22 20 15
24 23 16

(a) Al nivel de significación de O.OS, ¿existe evidencia de un efecto de la tem

peratura sobre la vida útil de este tipo de componente electrónico?
(b) PNiiW.t-1•> Escriba un informe para la ingeniero de control de calidad,
basándose en sus hallazgos.
e 14.15 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi
miento de Dunn para responder los incisos (f) y (g) del problema 14.5 (resulta
dos de desempeño) de la página 542. (Utilice el nivel a= .05.) ¿Existe alguna
diferencia en sus resultados actuales de los obtenidos anteriormente? Analice
su respuesta.
14.16 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi
miento de Dunn para responder el inciso (a) del problema 14.7 (resultados de
la prueba matemática) de la página 543. (Utilice el nivel a= .05.) ¿Existe
alguna diferencia en sus resultados actuales de los obtenidos previamente?
Analice su respuesta.
14.17 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi
miento de Dunn para responder el inciso (a) del problema 14.9 (rentabilidad)
de la página 544. (Utilice el nivel a= .01.) ¿Existe alguna diferencia en sus
resultados actuales y los obtenidos anteriormente? Analice su respuesta.

Uso de la computadora para la prueba de hipótesis

con e muestras independientes: la encuesta de
satisfacción de los empleados de Industrias Kalosha

14.6.1 Introducción y resumen

Cuando tratamos con conjuntos grandes de datos, podemos utilizar la computadora
para ayudarnos no sólo en nuestro análisis de estadística descriptiva, sino también
en nuestro análisis confirmatorio. En la presente sección demostraremos cómo los pa
quetes de software estadísticos pueden ser utilizados para efectuar varias pruebas de
hipótesis cuando analizamos diferencias en los resultados a través de diferentes gru
pos de datos numéricos. Para llevar a efecto lo anterior, regresemos a la Encuesta de
satisfacción de los empleados de Industrias Kalosha, desarrollada en el capítulo 2.

14.6.l Encuesta de satisfacción de los empleados de

Industrias Kalosha
Bud Conley, vicepresidente de recursos humanos, se está preparando para otra
reunión más con un representante de la empresa B & L Corporation para analizar
los contenidos potenciales de un paquete de prestaciones para los empleados que
se ha estado desarrollando. Antes de la reunión, le gustaría obtener respuestas a las

5S2 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos

siguientes preguntas mediante un análisis confirmatorio basado en los resultados de
la encuesta de satisfacción de los empleados (véase tabla 2.3 de las páginas 33-40):
l. ¿Había evidencia de una diferencia en el número promedio de horas
de trabajo por semana (pregunta 1) basándose en el agrupamiento
ocupacional de todos los empleados de tiempo completo de Industrias
Kalosha (pregunta 2)?
2. ¿Había evidencia de una diferencia en la mediana de los ingresos per
sonales de los empleados de tiempo completo de Industrias Kalosha
(pregunta 7) basándose en su nivel de participación en las decisiones
que afectan su trabajo (pregunta 21)?
Las respuestas a estas dos preguntas, así como a otras planteadas por Bud Conley
(véase el Proyecto Encuesta/Base de datos que se encuentra al final de la sección)
requieren un análisis descriptivo detallado de las 400 respuestas a la encuesta junto
con un análisis confirmatorio.

14.6. 3 Uso de paquetes estadísticos para la evaluación de

diferencias entre los e grupos
En respuesta a la primera pregunta de Bud Conley, referente a si existen diferencias
significativas en la cantidad de tiempo promedio (en horas) de trabajo a la semana,
basados en la agrupación laboral, se realizará un análisis descriptivo de modo que
se puedan evaluar las suposiciones de los procedimientos de prueba.
En la figura 14.9 se presenta el resultado obtenido con el programa EXCEL de
Microsoft (referencia 8) sobre algunas de las estadísticas sumarias pertenecientes a
una interrupción en el tiempo de trabajo por las agrupaciones laborales. Aunque
no se muestran, también se obtuvieron representaciones de tallo y hojas y gráficas
de caja y bigotes y de probabilidad normal, que nos indican que existe algo de
desviación de la normalidad por parte de las poblaciones subyacentes.

Occup N MEAN MEDIAN STDEV SEMEAN

workhre l=M 65 46.00 43.00 9.14 1.13
2=P 66 45.14 40.00 9.11 1.12
3=T S7 46.72 40.00 12.51 1.66
4=A 65 42.23 40.00 8.00 0.99
S=S 29 43.52 40.00 8.65 1.61
6=R 54 48.11 41.00 11.84 1.61
7=L 64 45.88 43.00 9.62 1.20

Figura 14.9
Resultado obtenido con el paquete Microsoft Excel para Windows, donde se muestran las
estadísticas sumarias.

Para probar la suposición de homogeneidad de varianzas, se calculó, a partir

de los resultados impresos en la figura 14.9, la estadística de prueba Fmáx de Hartley,
que representa el cociente de la varianza de población mayor entre la varianza de
población menor. Esta prueba debe utilizarse con precaución en este caso debido a
que es sensible a una violación de la suposición de normalidad subyacente. (En las
referencias 1-3 se presentan algunos procedimientos alternativos.) Utilizando un
nivel de significación de O.OS, puesto que

F.náx
(12.51) 2
=
(8.00) 2
= 2.45 > F. áx [7 57]
11 =
2.26 J

el valor crítico de extremo superior obtenido por interpolación de la tabla E.8, la

hipótesis nula de variaciones de población iguales, es rechazada.

Uso de paquetes estadísticos para la evaluación de diferencias entre los e grupos 553
r

Con el propósito de utilizar la prueba F ANOVA de una dirección, se debe encon

trar una transformación adecuada que normalice los datos y estabilice las varianzas
entre los grupos. Después de utilizar una transformación de logaritmo natural sobre la
variable original (tiempo de trabajo en horas), en la figura 14.10 se muestra el resultado
obtenido con el paquete MINITAB (referencia 10) para la prueba FANOVA de una direc
ción. Una verificación de la suposición de homogeneidad de varianzas nos indica que
la variabilidad de los datos transformados se ha estabilizado. Esto es, usando un nivel
de significación de O.OS, como

= 2.26,
2
- (0.2283)
Fmáx - = 1.97 < F, ,¡,11 [7,57]
(Ü.l629) 2
la hipótesis nula no puede ser rechazada y se puede llegar a la conclusión de que
no existe evidencia de una falta de homogeneidad de varianzas de los datos trans
formados.
Con un nivel de significación de O.OS, podemos probar la hipótesis nula
respecto a la igualdad de las siete medias de población

contra la hipótesis alternativa

H1 : No todas lasµ¡ son iguales (j = 1, 2, ... , 7)

MI'B > let c36 = loge{c2)

Ml'B > oneway c36 by c3;
SUBC> tukey .

.ANALYSIS OF V�CE rn 1n (workhre)

SOURCE DF SS MS F p
Occup 6 o.5224 0.0871 2.22 0.041
ERROR 393 15.4160 0.0392
399 15.9383
INDIVIDUAL 9 5 PCT CI 'S FOR MEAN
BASED 0N POOLED STDEV
LEVEL N � STDEV -------+---------+---------+---------
l=M 65 3.8105 0.1890 (-------·-------)
2�P 66 3.7905 0.1955 {-------·-------)
3=T 57 3,8158 0.2283 (--------·--------)
4=A 65 3.7289 0.1629 (-------·--------)
5=S 29 3,7572 0.1746 (-----------·-----------)
6=R 54 3,8472 0.2249 (--------·--------)
7=L 64 3.8059 0,1990 (-------·-------)
-------+---·-····+---------+---------
I'OOLED STDEV"" 0.1981 3.720 3.780 3.840

Tukey's pairwise canparisons

Family error rate = 0.0500

Individual error rate"" 0.00338

Critical value = 4.17

Figura 1 4. 1 O
Resultado obtenido con MINITAB de la prueba F ANOVA de una dirección, después de una
transformación de datos de logaritmo natural.

SS4 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Del resultado obtenido con MINITAB, presentado en la figura 14.10, observamos que
la estadística de prueba F de una dirección, 2.22, es mayor que el valor crítico,
Fuc6,393) = 2.10 (tomado de la tabla E.5), de manera que la hipótesis nula puede ser
rechazada. Existe evidencia de una diferencia significativa entre las medias de los
datos transformados correspondientes al tiempo (en horas) de trabajo semanal de las
diferentes agrupaciones laborales. El valor p es de 0.041. Utilizando los resultados
que se presentan en la figura 14.10 y empleando el procedimiento de Tukey-Kramer,
se encuentra que la diferencia significativa en los datos transformados con logarit
mos naturales, correspondientes al tiempo en horas de trabajo semanal, se presenta
entre el grupo de apoyo administrativo (A) y el grupo de producción y reparaciones
(R). Existe evidencia de que los empleados de apoyo administrativo trabajan signi
ficativamente menos tiempo a la semana que los de producción y reparaciones.
Como respuesta a la segunda pregunta que se hace Bud Conley, acerca de si
existen diferencias significativas en la mediana del ingreso personal, basándose en
la participación de los empleados en las decisiones relacionadas con el trabajo, se
efectuará otro análisis descriptivo, de manera que puedan ser evaluadas las suposi
ciones de los procedimientos de prueba.
En la figura 14.11 se presenta el resultado obtenido con STATISTIX (referencia
13), en el cual se ilustran las gráficas de caja y bigotes. Estas gráficas indican la exis
tencia de un sesgo hacia la derecha en las poblaciones muestreadas. Aunque no se
exhiben, también se obtuvieron representaciones de tallo y hojas y gráficas de pro
babilidad normal que confirmaron el sesgo hacia la derecha presente en las pobla
ciones muestreadas.

Box and Whi.sker Plot

100 ······································································································································

*
o
70 ......................................................................................................................................

*
t
40 ............ ........... ........................ ............................... ............................... ...................

IDEaDE
400 cases

Figura 1 4. 1 1
Resultado obtenido con el paquete STATISTIX donde se muestran las gráficas de caja y sesgos
del ingreso personal, basándose en el nivel de participación percibido en las decisiones
relacionadas con el trabajo.

Para probar las posibles diferencias entre las cuatro medianas de población, se
utilizó el paquete SAS (referencia 12) para efectuar la prueba de rangos de Kruskal
Wallis. En la figura 14.12 de la página 556 se presenta una parte de lo obtenido con
el paquete, en donde se ilustran los resultados de la prueba. Utilizando un nivel de
significación de O.OS, para probar la hipótesis nula de igualdad en la mediana del
ingreso personal para los cuatro niveles de participación en la toma de decisiones:

Uso de paquetes estadísticos para la evaluación de diferencias entre los c grupos SSS
H0 : M1 = M2 = M3 = M4
contra la hipótesis alternativa
H 1 : No todas las M¡ son iguales (donde j = 1, ... , 4)
observamos que la estadística de prueba H, 21.172, es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con tres grados de libertad (véase
tabla E.4). El valor p es de .0001. Por consiguiente, rechazamos la hipótesis nula y
podemos llegar a la conclusión de que existe evidencia de una diferencia entre las me
dianas de los ingresos personales, basándonos en los niveles conocidos de participación
en la toma de decisiones relacionadas con el trabajo.

The SAS Sy&tea

NPARlWAY PROCEOORE
Wilcoxon seores (Rank Swas) for Variable RINCOKE
Classified by Variable !DECIDE

Su.a ot Expected Std oev Mean

!DECIDE N seores Under HO Under HO Seora
Figura 14. 1 2 ALWAYS 138 30483. 5000 27669. 0000 1099 .16981 220, 894928
Resultado parcial obtenido IIUCH 157 32817. 5000 31478.5000 1129. 08741 209. 028662
SOMETIHES 60 10789. 0000 12030.0000 825. 63802 179.816667
con SAS, en el que se ilustra NEVER 45 6110. 0000 9022. 5000 730. 62585 135. 777778
la prueba de rangos de Average Seores were used for Ties
Kruskal-Wallis para las Kruskal-Wallis Test (Chi-Square Approx.i.mation)
CHISQ= 21.172 DF• 3 Prob > CH.ISO-, O. 0001
diferencias en c medianas.

Del resultado mostrado en la figura 14.12, podemos continuar con la prueba de

Kruskal-Wallis si restamos los rangos promedio, obtenemos las diferencias absolutas
de todas las comparaciones por parejas de los grupos y calculamos los alcances críticos
correspondientes [con la ecuación (14.9) de la página 549] necesarios para emplear el
procedimiento de comparación múltiple de Dunn.
Con un nivel general de significación de O.OS para estos datos, Z u es de +2.64,
puesto que el área contenida en el extremo superior de la distribución normal
estandarizada es de 0.05/12 o 0.0042. Por tanto, tenemos

Diferencias absolutas Alcance crítico Decisión

(400)(401) -1- + _1_ =
IR 1 - R2 1 = 1220.9 - 209.ol = 1 1.9 2.64
12
(
138 157
) 35.6 No significativo

IR1 - R3I = 1220.9 - 179.81 = 41.1 2.64

(400)(401) -1- +
(
J_) = 47.2 No significativo
12 138 60

IR1 - R4I = 1220.9 - 135.81 = 85.1 2.64

(400)(401) -1-
( +
J_) = 52.4 significativo
12 138 45

(400)(401) -1- + J_) No significativo

JR2 - R3I = 1209.o -179.81 = 29.2 2.64
12
(
157 60
= 46.3

IR2 - R3 I = 1209.o - 135.81 = 73.2 2.64

(400)(401) -1-
( +
J_)
157 45
= 51 .6 significativo
12

(400)(401) J_ + J_)
IR3 - R4 I = 1179.8 - 135.81 = 44.o 2.64
12
(
60 45
= 60.2 No significativo

S56 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Debemos informar a Bud Conley que la mediana de los ingresos personales son sig
nificativamente diferentes respecto al nivel conocido de participación en las deci
siones relacionadas con el trabajo. En particular, los empleados que afirmaron que
siempre participan tienen una mediana de ingreso personal significativamente
más alta que los trabajadores que afirman que nunca participan. Todas las demás
diferencias entre los grupos apareados se deben al azar.

Proyecto de encuesta/base de datos de la sección 14.6

Los siguientes problemas se refieren a los datos de muestra obtenidos del cues
tionario de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 de las
páginas 33-40. Deberán ser resueltos con la ayuda de un paquete de computación.
Suponga que usted ha sido contratado como asistente de investigación de Bud
Conley, el vicepresidente de recursos humanos de Industrias Kalosha. Éste le
ha dado una lista de preguntas (véanse problemas 14.18 a 14.30) que él nece
sita responder antes de su reunión con el representante de B & L Corporation,
la empresa que da asesorías sobre paquetes de prestaciones para los traba
jadores que ha contratado. Un análisis estadístico confirmatorio, basado en las
respuestas a estas preguntas pertenecientes a las variables numéricas de la
Encuesta de satisfacción de los empleados, le proporcionará un mejor
entendimiento de la composición de la fuerza de trabajo de tiempo completo
de Industrias Kalosha, y le será de utilidad en sus deliberaciones con el repre
sentante de B & L Corporation con el propósito de desarrollar un paquete de
prestaciones para los empleados.
A partir de las respuestas a las preguntas que tratan sobre variables numéricas
de la Encuesta de satisfacción de los empleados (véanse páginas 33-40) en los
problemas 14.18 a 14.30, y que se dan a continuación,
(a) Obtenga un conjunto de estadísticas descriptivas para cada grupo.
(b) Desarrolle una representación de tallo y hojas para cada grupo.
(c) Trace la gráfica de caja y bigotes para cada grupo.
(d) Desarrolle la gráfica de probabilidad normal para cada grupo.
(e) Basándose en un análisis descriptivo de los resultados del inciso (a) al (d),
respecto a las suposiciones de la prueba F ANOVA de una dirección y a la
prueba de rangos de Kruskal-Wallis, seleccione un procedimiento ade
cuado y efectúe la prueba de hipótesis al nivel de significación de a= .05.
(f) tHd12i•tl•> Escriba un memorándum a Bud Conley donde explique su
elección del procedimiento de prueba y los resultados.
14.18 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre
gunta 1), basándose en las características importantes de trabajo (véase pregunta 11)?
14.19 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre
gunta 1), basándose en las percepciones por seguir adelante (véase pregunta 12)?
14.20 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en la participación conocida en las decisiones
relacionadas con el trabajo (véase pregunta 21)?
14.21 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en qué tan orgullosos se sienten por ser parte de
la organización (véase pregunta 23)?
14.22 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en la agrupación ocupacional (véase pregunta 2)?

Uso de paquetes estadísticos para la evaluación de diferencias entre los e grupos SS 7

14.23 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en las características de trabajo importante (véase pregunta 11)?
14.24 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en las percepciones por ir a la cabeza (véase pregunta 12)?
14.25 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en el avance dentro de la organización (véase pregunta 20)?
14.26 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en la participación conocida en las decisiones relacionadas con el
trabajo (véase pregunta 21)?
14.27 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en qué tan orgulloso se sienten por ser parte de la organización
(véase pregunta 23)?
14.28 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7), basán
dose en la percepción de la importancia de la escolaridad (véase pregunta 27)?
14.29 ¿Existe evidencia de que hay una diferencia en la antigüedad (es decir, el
tiempo promedio que tienen los trabajadores de tiempo completo de
Industrias Kalosha en el empleo, véase pregunta 16), basándose en la satisfac
ción con el trabajo (véase pregunta 9)?
14.30 ¿Existe evidencia de una diferencia en la antigüedad en el trabajo (es decir, el
tiempo promedio que tienen los trabajadores de tiempo completo de
Industrias Kalosha en el empleo, véase pregunta 16), basándose en qué tan
orgullosos se sienten por ser parte de la organización (véase pregunta 23)?

1 e!) El modelo de diseño de bloque aleatorizado

En la sección 14.4 desarrollamos la pruebaF ANOVA de una dirección para evaluar
diferencias en las medias de c grupos, y en la sección 14.5 estudiamos la prueba de
rangos de Kruskal-Wallis para evaluar las diferencias en las medianas de c grupos.
Procedimientos de prueba como los mencionados serían utilizados en situaciones
experimentales en las cuales n elementos o individuos homogéneos (es decir, uni
dades experimentales) son asignados aleatoriamente a los c niveles de un factor de
interés (es decir, los grupos de tratamiento). Como podemos recordar de la sección
14.3, estos experimentos de un factbr se conocen como modelos de diseño comple
tamente aleatorizados o de una dirección.
Alternativamente, en las secciones 13.8 a 13.10 utilizamos la prueba t para la
diferencia media o la prueba de rangos con signo de Wilcoxon para la diferencia
mediana en situaciones que implican mediciones repetidas o muestras apareadas,
con el propósito de evaluar diferencias entre dos condiciones de tratamiento. Su
ponga, ahora, que deseamos extender lo anterior a situaciones en las que existen más
de dos grupos de tratamiento o niveles de un factor de interés. En tales casos, los con
juntos heterogéneos de elementos o de individuos que han sido apareados (o sobre
los que se han hecho mediciones repetidas) se conocen como bloques. Los datos
numéricos pueden, entonces, obtenerse como respuesta o resultado de cada combi
nación de grupo de tratamiento y de bloque. Así pues, al diseñar experimentos de
este tipo, debería haber dos cosas a considerar: tratamientos y bloques. Sin embargo,
respecto a nuestras pruebas de hipótesis, enfocamos la atención en las diferencias
entre los c niveles del factor de interés (es decir, los grupos de tratamiento).
Las situaciones experimentales como éstas se conocen como modelos de di
seño de bloques aleatorizados. El propósito al conformar bloques es eliminar

558 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

toda la variabilidad que sea posible, de manera que podamos enfocar nuestra aten
ción en las diferencias entre las e condiciones de tratamiento. Así pues, cuando sea
apropiado, el propósito de elegir un modelo de diseño de bloque aleatorizado en
lugar de un modelo de diseño completamente aleatorizado es proporcionar un
análisis más eficiente mediante la reducción del error experimental y, en conse
cuencia, obtener resultados más precisos (véanse referencias 1, 5, 6 y 11).

i e H=i Prueba F de bloque aleatorizado para

diferencias en e medias

14.8.1 Introducción
Como en la sección 14.4, cuando las mediciones resultantes a través de los e gru
pos son continuas y se cumplen ciertas suposiciones, puede utilizarse una meto
dología conocida como análisis de varianza (o ANOVA,) para comparar las medias
de los grupos. En la presente sección ampliaremos nuestro análisis anterior de
ANOVA y el desarrollo de la prueba F de bloque aleatorizado con el fin de eva
luar las diferencias entre las medias de e grupos.
Recordamos de la figura 14. l de la página 528, que en el modelo completa
mente aleatorizado o análisis de varianza de una dirección, la variación total de las
mediciones resultantes (SST) se divide en la variación que es atribuible a las dife
rencias entre los e grupos (SSA) y la que se debe al azar o se puede atribuir a la
variación inherente dentro de los grupos (SSW). La variación dentro de los grupos
se considera como error experimental, y la variación entre grupos se atribuye a
efectos de tratamiento.
Para el modelo de diseño de bloque aleatorizado, con el objeto de filtrar los
efectos de conformar bloques, necesitamos dividir aún más la variación dentro de
los grupos (SSW) en la variación atribuible a diferencias entre los bloques (SSBL) y
la que se puede atribuir a error aleatorio inherente (SSE). Por consiguiente, como
se presenta en la figura 14.13, en el modelo de diseño de bloque aleatorizado, la
variación total de las mediciones resultantes es la suma de tres componentes: la va
riación entre grupos (SSA), la variación entre bloques (SSBL) y el error aleatorio
inherente (SSE).

--«
Variación entre grupos (SSA)

Variadó, total (SST) Va,tactó, '"'" bloq,es (SSBL)

Figura 1 4. 1 3
División de la variación
total en un modelo de
Variación aleatoria (SSE) diseño de bloques
aleatorizados.

14.8.2 Desarrollo
Para desarrollar el procedimiento ANOVA respecto al modelo de diseño de bloques
aleatorizados, necesitamos definir los términos que se presentan a continuación:

Prueba F de bloque aleatorizado para diferencias en e medias S S9

X;¡ = er valor· del bloque í-ésiina· para e1 tratamiento del grupo í-ésima
X¡ _ = la media de todos los valores en el bloque i
X_¡ = la media de todos los valores para el tratamiento del grupo j

L L X;¡ = esto
e r
la sumatoria de los valores de todos los bloques y de todos los grupos,
¡= 1; = 1 es, del gran total

r = al número de bloques
e = al número de grupos
n = al número total de observaciones (cuando n= re)

La variación total, conocida también como suma del total de cuadrados

(SST), por sus siglas, Sum of Squares Total), es una medida de la variación entre
todas las observaciones. Puede ser obtenida al sumar las diferencias al cuadrado
entre cada observación individual y la gran media o media general, X, que está
basada en las n observaciones. SST se calcularía como

L L ( X - X)
e r
= 2
SST = ij (14.10)
j = li = 1

donde X =
i = 1; = 1 (esto es, la gran gran media o media general)
re

La variación entre grupos, también conocida como la suma de cuadrados

entre grupos (SSA, por sus siglas de, sum of squares among), se mide a través
�e la suma de las difere.Dcias al cuadrado entre la media de muestra de cada grupo,
X_¡, y la gran media, X, pesadas o ponderadas con el número de bloques r. La
variación entre grupos se calcula con la ecuación

e
SSA = r I, ( X.¡ - X)
- - 2
(14.11)
j =1

I,xij
donde _x.1 = �(esto es, el tratamiento de las medias de grupo)
r
La variación entre bloques, también conocida como suma de cuadrados
entre bloques (SSBL, por sus siglas: sum of squares among blocks), se mide a
través de la suma de las diferengas al cuadrado entre la media de cada bloque, X¡ _ y
la gran media o media general, X, pesadas o ponderadas por el número de grupos, e.
La variación entre bloques se calcula con:

SSBL = e :t (
i = 1
X¡_ - X )
2
(14.12)

560 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

LX;¡
donde 5( = 1-::..2__ (esto es, la media del bloque)
e

La variación aleatoria inherente, también conocida como suma de errores

al cuadrado (SSE, por sus siglas, sum of squares error), se mide a través de la
suma de las diferencias al cuadrado entre todas las observaciones después de que
el efecto de los tratamientos y de los bloques particulares ha sido tomado en
cuenta. SSE se calcula con la ecuación:

SSE = {-
LL � (x.,, - )(.,. - )(.,. + x) 2 (14.13)
j = 1i = 1

Puesto que existen e niveles de tratamiento del factor que está siendo com
parado, hay e - 1 grados de libertad asociados con la suma de cuadrados entre gru
pos (SSA). De forma parecida, como se tienen r bloques, hay r - 1 grados de
libertad asociados con la suma de cuadrados entre bloques (SSBL). Además, exis
ten n - 1 grados de libertad asociados con la suma del total de cuadrados (SST)
porque �acta observación, X¡¡, se está comparando con la media general o gran
media, X, basándonos en las n observaciones. Por consiguiente, como se deben
sumar los grados de libertad de cada una de las fuentes de variación a los grados
de libertad de la variación total, podemos obtener los correspondientes a la com
ponente del error de la suma de cuadrados (SSE) mediante sustracción y manipu
lación algebraica.4 Los grados de libertad están dados por (r - l)(c - 1)
Si cada uno de los componentes de la suma de cuadrados se divide entre los corres
pondientes grados de libertad asociados, obtendremos los tres términos de varianza o
cuadráticos medios (MSA, MSBL y MSE) necesarios para llevar a cabo el ANOVA:

SSA
MSA = (14.14a)
e-1

SSBL
MSBL = (14.14b)
r-1

SSE
MSE = (14.14c)
(r - l)(c - 1)

Si las suposiciones correspondientes al análisis de varianza se cumplen, la hipóte

sis nula de no diferencias entre las medias de población (es decir, de la no existen
cia de efectos de tratamiento)

Ho: µ1 = µ_z = · · · = µe
puede ser probada contra la hipótesis alternativa de que no todas las e medias de
población son iguales:
H1: No todas las µi son iguales (con j = 1, 2, ..., e)
mediante el cálculo de la estadística de prueba F:

Prueba F de bloque aleatorizado para diferencias en e medias S6 I

F = MSA (14.15)
MSE

La estadística de prueba F sigue una distribución F con e - 1 y (r - l)(c - 1) grados

de libertad. Para un nivel de significación, a, dado, podemos rechazar la hipótesis
nula si la estadística de prueba F calculada es mayor que el valor crítico de extremo
superior, Fu[(c-l), (r-l)(c-l)l de la distribución F (véase tabla E.5). Esto es, tenemos la
siguiente regla de decisión:
Rechace Ho si F > FU[(c-1),(r-l)(c-1)];
en cualquier otro caso, no rechace H0.

Para examinar si resulta ventajoso formar bloques, algunos investigadores su

gieren que se efectúe la prueba de la hipótesis nula de no efectos de bloque. Así
pues, podemos probar

contra la alternativa:
H1: No todas lasµ¡. son iguales

Definimos la estadística de prueba F

MSBL (14.16)
F =
MSE

y la hipótesis nula será rechazada al nivel de significación a, si

_ MSBL
F > FU[r-1,(r-l)(c-l)]
- MSE

Sin embargo, se puede argumentar que hacer lo anterior no es necesario, que el

único propósito de establecer los bloques es proporcionar medios más eficientes para
probar los efectos de tratamiento mediante la reducción del error experimental.5
Como en la sección 14.4.2, los resultados de un procedimiento de análisis de
varianza por lo general se muestran en una tabla resumen ANOVA, cuyo formato
se presenta en la tabla 14.9.

14.8.3 Aplicación
Para ilustrar la prueba F de bloques aleatorizados, suponga que la administración
de una cadena de restaurantes de comida rápida que tienen cuatro sucursales en una
cierta área geográfica desea evaluar el servicio en esos restaurantes. El director de
investigación de la cadena contrata a 24 investigadores (estimadores) con experien
cia variada en evaluaciones en servicio de comida. Después de realizar consultas pre
liminares, los 24 investigadores son clasificados en seis bloques de cuatro elementos,
basándose en su experiencia sobre evaluación de servicios de comida, de modo que
los cuatro investigadores con mayor experiencia quedan asignados al bloque 1, los

S62 Capítulo 14 ANOVA y otras pruebas de e mu_estras con datos numéricos

Tabla 14.9 Tabla de análisis de varianza para el diseño de bloques aleatorizados.

Grados Cuadrado medio

Fuente de libertad Suma de cuadros (varianza) F

entre tratamientos e -1 SSA = r!(x ¡ -x)' MSA = SSA

c-1
F = MSA
MSE
; : l
'
entre bloques T -1 SSBL =c¿,(x;-x) 2 MSBL = SSBL
T - 1
F = MSBL
MSE
i = 1

I.I(x;; -x; -x, + x)'

e r
SSE = SSE
Error (r - l)(c - 1) MSE =
i= 1 i= I (r - l)(c - 1)
Total re - 1 SST = !!(x,; -x)'
j = l j = l

siguientes cuatro con mayor experiencia al bloque 2, y así sucesivamente. Dentro de

cada uno de los seis bloques homogéneos, los cuatro estimadores son asignados de
manera aleatoria para realizar la evaluación del servicio de un restaurante en particu
lar, utilizando una escala de asistencia que va de O (baja) hasta 100 (alta). Los resulta
dos se resumen en la tabla 14.10. Los totales de grupo, las medias de grupo, los totales
de bloque, las medias de bloque, el gran total y la gran media también se presentan
en la tabla 14.10, y algunas de estas estadísticas se resaltan junto con las evaluaciones
de los datos originales en la gráfica de dispersión de la figura 14.14 (de la página 564)
para proporcionar una representación visual de los resultados del experimento.

( Tabla 14. 1 O Evaluaciones de los restaurantes para cuatro sucursales de

una cadena de comida rápida.

Bloques Restaurantes
de
evaluadores A B e D Totales Medias
1 70 61 82 74 287 71.75
2 77 75 88 76 316 79.00
3 76 67 90 80 313 78.25
4 80 63 96 76 315 78.75
5 84 66 92 84 326 81.50
6 78 68 98 86 330 82.50
Totales 465 400 546 476 1,887
Medias 77.50 66.67 91.00 79.33 78.625

Además, de la tabla 14.10 tenemos:

r = 6, e= 4, n = re = 24
y, según lo establecido
e r

¿,¿,X;¡
X = ; = 1i = I = 1, 887 = 78.625
re 24

Aunque se sugiere con insistencia que se utilice algún paquete de software estadís
tico (veánse referencias 10, 12 y 13) para determinar los resultados de un experi-

Prueba F de bloque aleatorizado para diferencias en e medias 563

100

90 .
+x:3

(/)
80 x .
fx.1
X.4

·¡:;

cii
70
-.. X.2
60

Figura 14. 14
o
Gráfica de dispersión de las
evaluaciones de los servicios prestados
A B e D
en cuatro restaurantes. Restaurantes
Fuente: Tabla 14.10.

mento de diseño de bloques aleatorizados, con fines ilustrativos, haremos los si
guientes cálculos:
Utilizando la ecuación (14.10),

SST= _¿ _¿(X;¡-X)
e r
2 2
= (70-78.625) 2 +(77-78.625) +···+ (86-78.625)2
= 2,295.63

Utilizando la ecuación (14.11),

SSA =r Í.. (X; - .X) = 6[(77.50-78.625) +(66.67-78.625) +·· ·+(79.33-78.625) ]

j = 1
2 2 2 2

= 1,787.46

Utilizando la ecuación (14.12),

SSBL=c Í, (X; - X)2 = 4[ (71.75-78.625)2+(79.00-78.625/+···+(82.50-78.625)2 ]

j = 1
= 283.38

Utilizando la ecuación (14.13),

SSE = "' "'(X - X.¡. - X + .X)2

e r

�� 1/ l.
(70 - 77.50 - 71.75 + 78.625)2
j = 1i = 1
+ (77 - 77.50 - 79.00 + 78.625)2
+

+ (86 - 79.33 - 82.50 + 78.625) 2

224.79

564 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Así pues, utilizando las ecuaciones (14.14a), (14.14b) y (14.14c),

SSA l, 787.46
MSA = = 595.820
e -1 3
SSBL = 283.38
MSBL = = 56.676
r -1 5
SSE 224.79
MSE = 14.986
(r-l)(c-1) 15

En el estudio sobre la cadena de restaurantes de comida rápida, los cálculos que

acabamos de realizar pueden resumirse en la cuadro de análisis de varianza que se
muestra en la tabla 14.11.

Tabla 14.11 Tabla de análisis de varianza para el estudio de la cadena de

restaurantes de comida rápida.

Grados Sumas Cuadrado medio

Fuente de libertad de cuadrados (varianza) F

1,787.46
Entre grupos 4-1= 3 1,787.46 MSA = F= 595.820
3 14.986
595.820
Entre bloques 6-1= 5 283.38 MSBL =
283.38 F = 56.676
5 14.986
= 56.676
224.79
Error (6-1)(4-1)= 15 224.79 MSE =
15
14.986

Total (6)(4)-1= 23 2,295.63

Además de las entradas de la tabla anterior, en las tablas ANOVA de la mayoría de

los paquetes de software estadístico se incluye también el valor p (es decir, la proba
bilidad de obtener una estadística F igual o mayor a la obtenida dado que la hipóte
sis nula sea verdadera). Como la mayoría de los individuos que necesitan evaluar
datos de los modelos de diseño de bloque aleatorizado realizarían su análisis con
la ayuda de un paquete estadístico, la inclusión del valor p nos permite llegar a con
clusiones directamente acerca de la hipótesis nula, sin referimos a una tabla de·
valores críticos de la distribución F. Si el valor pes menor que el nivel especificado
de significación a., la hipótesis nula es rechazada. En este caso, sin embargo,
analizaremos los datos que se encuentran resumidos en la tabla 14.11.
Sustituyendo 1, 2, 3, 4 por A, B, C, D cuando probamos las diferencias entre
los restaurantes, y utilizando el nivel de significación de O.OS, la regla de decisión
consistiría en rechazar la hipótesis nula (H0 : µ.1 = µ.2 = µ.3 = µ.4) si el valor F calcu
lado es mayor que 3.29 (véase figura 14.15 de la página 566). Puesto que F = 39.758
> Fu(3,15) = 3.29, podemos rechazar la hipótesis nula H0 y llegar a la conclusión de
que existe evidencia de una diferencia en la asistencia promedio entre los diferentes
restaurantes.

Prueba F de bloque aleatorizado para diferencias en e medias S6S

Figura 1 4. 1 S
Regiones de rechazo y de no rechazo
para el estudio sobre la cadena de
restaurantes de comida rápida, al nivel o 3.29 FU(s, 15)
de significación de O.OS, con 3 y 15
grados de libertad.

Como una verificación de la efectividad de la conformación de bloques,

podemos probar una diferencia entre los grupos de estimadores. La regla de decisión,
utilizando el nivel de significación de .05, sería rechazar la hipótesis nula (Ha : Ha :
µ1. = µ2. = . . . = µ6.) si el valor F calculado excede a 2.90 (véase figura 14.16). Puesto
que F = 3.782 > Fu(s,isi = 2.90, podemos rechazar Ha y llegar a la conclusión de que
existe evidencia de una diferencia entre los grupos de estimadores. Así pues, pode
mos concluir que la conformación de bloques ha sido ventajosa para reducir el
error experimental.
Además de las suposiciones del análisis de varianza de una dirección mencio
nadas anteriormente en la sección 14.4.6, necesitamos suponer que no hay efecto
de interacción entre los tratamientos y los bloques. Esto es, necesitamos suponer
que cualesquiera diferencias entre los tratamientos (restaurantes) son consistentes
a través del conjunto entero de bloques (el grupo de estimadores). El concepto de
interacción se analizará en la sección 14.10.4 ..

Figura 1 4. 1 6
Regiones de rechazo y de no rechazo para
el estudio sobre la cadena de restaurantes o FU(5, 15)
de comida rápida, al nivel de significación
de O.OS, con 5 y 15 grados de libertad.

14.8.4 Comparaciones múltiples: el procedimiento

deTukey
Como en el caso del modelo ANOVA de una dirección, cuando la hipótesis nula de
no diferencias entre los grupos de tratamiento es rechazada, necesitamos determi
nar cuáles de estos grupos de tratamiento son significativamente diferentes de los
demás. Para el modelo de diseño de bloques aleatorizados, como los tamaños de
muestra de cada grupo de tratamiento son iguales, utilizamos un procedimiento
desarrollado por John Tukey (veánse referencias 6 y 14). El alcance crítico para el
procedimiento de Tukey está dado por la ecuación (14.17):

,.
3 Canee CfltlCO =
1 �MSE (14.17)
QU[c,(r-I)(c-I)] -r-

S66 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Cada uno de los c(c - 1)/2 pares de medias es comparado con respecto al
alcance crítico. Un par específico sería declarado diferente si la diferencia absoluta
de las medias de muestra IX.¡ -X.r I es mayor que el alcance crítico.
Para aplicar el procedimiento de Tukey, regresemos a nuestro estudio de la
cadena de restaurantes de comida rápida. Como se tienen cuatro restaurantes, se
deben llevar a cabo (4)(4 -1)/2 = 6 posibles comparaciones por pares. En la tabla
14.10 de la página 563, las diferencias medias absolutas son
1. lx., - x 2 I = In.so - 66.671 = 10.83
2. lx. 1 - x_ 3 I = In.so - 91.ool = 13.50
3. lx_ 1 - x.41 = 177.50 - 79.331 = 1.83
4. lx2 - x_ 3 1 = 166.67 - 91.ool = 24.33
s. lx_ 2 - X.4 1 = 166.67 - 79.331 = 12.66
6. lx_ 3 - x.41 = 191.00 - 79.331 = 11.67
Para determinar el alcance crítico, utilizamos la tabla 14.11 de la página 565, para
obtener MSE = 14.986 y r = 6. De la tabla E.12 [para a= .05, e= 4 y (r -l)(c -1) =
(6-1)(4 -1) = 15], el valor crítico de extremo superior, Qu(4 ,15), es de 4.08. Por con
siguiente, utilizando la ecuación (14.17) tenemos

14·:86
alcance crítico = 4.08� = 6.448

Observamos que todos los contrastes, excepto I X_ 1 - X.4 I, son mayores que el
alcance crítico. Por consiguiente, podemos llegar a la conclusión de que existe evi
dencia de una diferencia significativa en la asistencia promedio de todas las pare
jas de restaurantes, excepto para las sucursales A y D. Además, la sucursal C tiene
la mayor asistencia (es decir, es el más preferido) y la sucursal Bes la de menor asis
tencia (es decir, es la menos preferida).

14.8.5 Comparación del diseño de bloques aleatorizados

respecto al diseño de una dirección
( completamente aleatorizado)
Ahora que hemos realizado el modelo de bloques aleatorizados y lo hemos uti
lizado en el estudio de los restaurantes de comida rápida, surge la pregunta acerca
de qué efecto tiene la conformación de bloques sobre el análisis. Esto es, la con
formación de bloques ¿tuvo como resultado un aumento en la precisión de la com
paración de los diferentes grupos de tratamiento?
La eficiencia relativa (RE, por sus siglas: relative efficiency) estimada
del diseño de bloques aleatorizado, comparado con el diseño completamente
aleatorizado, puede calcularse con la ecuación (14.18):

RE = (r - l)MSBL + r(c - l)MSE (14.18)

(re - l)MSE

Así pues, de la tabla 14.11 de la página 565, para el estudio de la cadena de res
taurantes de comida rápida, tenemos

Prueba F de bloque aleatorizado para diferencias en e medias 567

(5)(56.676) + (6)(3)(14.986)
RE 1.60
(23)(14.986)

Esto significa que se necesitarían 1.6 veces más observaciones en cada grupo de
tratamiento en un disefío ANOVA de una dirección para obtener la misma pre
cisión en la comparación de las medias de los grupos de tratamiento que en el caso
de nuestro diseño de bloques aleatorizados.

Problemas de la sección 14. 8

14.31 Explique las diferencias entre el modelo de disefío de bloque aleatorizado y el
modelo de disefío completamente aleatorizado
14.32 Se ha disefíado un experimento de prueba de sabores, de modo que nueve
expertos van a evaluar cuatro marcas de café colombiano. Para evitar cualquier
efecto de interferencia, la secuencia de prueba de las cuatro marcas es determi
nada aleatoriamente por cada uno de los nueve probadores expertos, hasta que
se alcanza una estimación en una escala de siete puntos (1 = extremadamente
malo, 7 = extremadamente bueno) respecto a cada una de las cuatro caracterís
ticas siguientes: sabor, aroma, riqueza y acidez. La siguiente tabla muestra las
estimaciones conjuntas acumuladas para las cuatro características.

Evaluaciones sumadas de cuatro

marcas de café colombiano

Marcas
Experto A B e D
E.B 24 26 25 22
N.B. 27 27 26 24
M.D. 19 22 20 16
M.H. 24 27 25 23
B.J. 22 25 22 21
R.J. 26 27 24 24
B.K. 27 26 22 23
B.M. 25 27 24 21
J.S. 22 23 20 19

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, analice completamente los datos para
determinar si existe evidencia de una diferencia en las estimaciones con
juntas de las cuatro marcas de café colombiano y, si ése es el caso, cuáles
de las marcas tienen los mayores resultados (es decir, son las mejores).
(c) t·fiiiNM·f•), Basándose en sus resultados, escriba un borrador para un artículo
que pueda ser enviado al editor de la sección de alimentos del periódico local.
e 14.33 Un investigador médico desea efectuar un experimento para determinar si la
elección de la sustancia de tratamiento afecta el tiempo de coagulación de
plasma (en minutos). Se van a comparar cinco diferentes sustancias que mejo
ran la coagulación (es decir, tratamientos) y se estudiarán siete pacientes
mujeres que se encuentran en la primera etapa del embarazo. Se tomaron
cinco muestras de sangre a cada paciente y cada una de éstas se asigna
aleatoriamente a cada uno de los cinco tratamientos. Los datos correspondien
tes al tiempo de coagulación se muestran en la siguiente tabla:

S68 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Sustancia de tratamiento
Paciente 1 2 3 4 5
1 8.4 8.1 8.5 8.6 8.5
2 10.3 10.0 9.9 10.6 10.2
3 12.4 11.8 12.3 12.5 12.2
4 9.7 9.8 9.9 10.4 10.4
5 8.6 8.4 9.7 9.9 9.5
6 9.3 9.6 10.3 10.5 10.2
7 11.1 10.6 11.6 10.9 11.4

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, ¿existe evidencia de una diferencia en el
tiempo promedio de coagulación de plasma entre las cinco sustancias de
tratamiento?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar la
sustancia de tratamiento que difiere respecto al tiempo promedio de
coagulación.
(d) Determine la eficiencia relativa del diseño de bloques aleatorizado
respecto al diseño completamente aleatorizado.
(e) f·fiiiM•t·I•> Escriba un informe para el investigador médico basándose en
los resultados anteriores.
14.34 Una nutrióloga desea comparar tres productos dietéticos bien conocidos.
Basándose en datos correspondientes a gordura (es decir, una función de la
altura y el peso), edad y metabolismo, clasifica a 18 de sus clientes hombres en
seis grupos de tres cada uno y asigna aleatoriamente a un miembro de cada
grupo a uno de los tres tratamientos dietéticos. Los siguientes datos represen
tan la cantidad de peso (en libras) perdido por los 18 clientes después de seis
semanas de tratamiento:

Tratamiento dietético
Grupos de clientes 1 2 3
1 10.4 12.1 9.0
2 9.8 14.5 9.6
3 7.3 10.0 9.8
4 7.5 9.9 10.7
5 8.6 14.2 11.1
6 10.7 10.5 10.5

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de .05, ¿existe evidencia de una diferencia en la
cantidad promedio de peso (en libras) perdido entre los tres tratamientos
dietéticos?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar los
tratamientos dietéticos que difieren respecto a la pérdida promedio de
peso. (Utilice el nivel a= .05)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados
respecto al diseño completamente aleatorizado.
(e) f·fiidi)i•t·I•> Escriba un informe que la nutrióloga pueda utilizar en futuras
recomendaciones dietéticas a sus clientes, basándose en los hallazgos de
este estudio.

Prueba F de bloque aleatorizado para diferencias en e medias 569

14.35 El decano de una bien conocida escuela de negocios desea estudiar el proceso de
evaluación estudiantes-planta docente en su campus, pues tal evaluación se utiliza
en decisiones de reasignación, promoción e inamovilidad. En particular, está
interesado en determinar la estructura educativa más apropiada para lograr evalua
ciones de la planta docente más altas por parte de los estudiantes. Las estructuras
son: cursos de licenciatura, cursos avanzados de bachillerato o cursos de requisito
del bachillerato. Como la carga de trabajo semestral de la planta docente en esta
institución es de tres cursos, el decano tomó una muestra aleatoria de diez
docentes de su escuela, quienes habían sido asignados a un curso de cada una de
las ya mencionadas tres estructuras educativas y recuperó sus formas de evaluación
de final de semestre. Los resultados que se presentan a continuación son las evalua
ciones promedio sobre una escala de cinco puntos (1= muy pobre, 5 = sobre
saliente) respecto a la pregunta: ¿En comparación con otros maestros que has
tenido, cómo evaluarías la habilidad para enseñar de este profesor?; cada una de las
evaluaciones provienen de grupos formados con 25-30 estudiantes.

Nivel de Estudio
Miembro Curso de Bachillerato
docente bachillerato avanzado Requisitos
L.M. 4.12 4.06 3.38
N.R. 4.87 4.72 4.60
A.C. 3.46 3.49 2.39
J.K. 3.87 3.61 3.23
J.B. 4.04 3.83 3.55
D.B. 2.90 3.23 3.52
W.F. 4.16 4.07 3.68
R.S. 4.19 3.76 3.83
M.L. 4.75 4.39 4.22
V.P. 4.29 4.34 3.67

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Utilizando un nivel de significación a= .OS, ¿Existe alguna evidencia de
una diferencia en las evaluaciones, basándose en el tipo de clase?
(c) Si es apropiado, utilice el procedimiento de Tukey para determinar qué
tipos de clases difieren en sus evaluaciones (Utilice el nivel a= .05.)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados con
respecto al diseño completamente aleatorizado.
(e) t-t;d')i•i-i•� Escriba un memorándum que el decano pueda enviar a sus jefes
de departamento tomando en cuenta los resultados de los incisos (b) y (c), y
que les sea de ayuda en la toma de decisiones respecto a reasi.gnación, pro
moción y/o inamovilidad, basándose en las evaluaciones de la enseñanza.

Problemas intercapítulo de la sección 14.8

14.36 En el problema 13.62 de la página 509, usted utilizó una prueba t para com
parar el desgaste promedio basándose en dos tipos de material que se usa para
las suelas de zapatos.
(a) Utilice la prueba F de bloques aleatorizados en este conjunto de datos.
(Use el nivel a= .05.)
(b) Eleve al cuadrado el valor de t que calculó en el problema 13.62; observe
que es el mismo (excepto por error de redondeo) que el valor F. Exprese
con sus propias palabras la relación que hay entre t y F.
• 14.37 En el problema 13.63 de la página 510, usted utilizó una prueba t para comparar el
kilometraje de gasolina promedio entre gasolina regular y de alto octanaje.
(a) Utilice la prueba F de bloques aleatorizados en este conjunto de datos.
(Use el nivel a= .05.)
(b) Eleve al cuadrado el valor de t que calculó en el problema 13.63; observe
que es el mismo (excepto por error de redondeo) que el valor F. Exprese
con sus palabras la relación que hay entre t y F.

S70 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

1
1 e!·) Prueba de rango de Friedman para diferencias
en e medianas

14.9.1 Introducción
A menudo sucede que, a pesar de que el modelo de diseño de bloques aleatoriza
dos se considera apropiado para un experimento particular, podemos preferir
alguna alternativa libre de distribución a la prueba F de bloques aleatorizados, para
analizar los datos. Si los datos recolectados se encuentran solamente en forma de
rango dentro de cada bloque o si no se puede suponer la normalidad, se puede uti
lizar un procedimiento sencillo pero bastante poderoso conocido como prueba
de rango de Friedman.

14.9.l. Desarrollo
La prueba de rangos de Friedman se utiliza principalmente para probar si e grupos
de muestra han sido tomados de poblaciones que tienen medianas iguales. Es
decir, podemos probar la hipótesis

Ho : M1 = M2 = ... = Me
contra la hipótesis alternativa:
H 1 : No todas las M¡ son iguales (en la que j = 1, 2, ... , e)

Para desarrollar la prueba, primero sustituimos los datos por sus rangos, en
cada uno de los bloques. Esto es, en cada uno de los rbloques independientes susti
tuimos las e observaciones por sus correspondientes rangos, de modo que el rango
1 es asignado a la observación más pequeña y el rango e a la observación más
grande. Si algunos de los valores del bloque son iguales, se les asigna el promedio
de los rangos que les serían asignados si no hubiera habido empates. Así pues, R¡¡
es el rango (de 1 a e) asociado con el j-ésimo grupo (en el que j = 1, 2, ..., e) en el
i-ésimo bloque (con i = 1, 2, ... , r).
Bajo la hipótesis nula de no diferencias en los e grupos, cada asignación de ran
gos dentro de un bloque es igualmente probable. Así pues, existen e! formas posibles
de asignar rangos dentro de un bloque particular y (e!)' posibles ordenamientos de
rangos sobre los r bloques independientes. Además, si la hipótesis nula es verdadera,
no habría diferencias reales entre los rangos promedio de cada grupo (tomados sobre
los r bloques).
De lo anterior se puede derivar la siguiente estadística de prueba FR :

12 '
---¿R� - 3r(c + 1) (14.19)
rc(c + 1) i = l

en la que
R.f es el cuadrado del total de los rangos para el grupo j (j = 1,
2, ..., e).
r es el número de bloques independientes.
e es el número de grupos.
A medida que el número de bloques del experimento se hace grande (mayor
que 5), la estadística de prueba FR puede ser aproximada por la distribución chi
cuadrada, con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de sig-

Prueba de rango de Friedman para diferencias en e medias S7 I

nificancia, a, la regla de decisión sería rechazar la hipótesis nula si el valor calcu
lado de FR es mayor que el valor crítico de extremo superior de la distribución chi
cuadrada, con e - 1 grados de libertad, como se muestra en la figura 14.17. Esto es
Rechazar Ho si FR > X2 u(c-l);
en cualquier otro caso, no rechazar H0.
Los valores críticos x2 se presentan en la tabla E.4.

Figura 14.1 7
Determinación de la región de
rechazo.

14.9.3 A p licación
Para ilustrar la prueba de rangos de Friedman para diferencias en e medianas, regre
semos a nuestro estudio sobre la cadena de restaurantes de comida rápida de la sec
ción anterior. Podemos recordar que el director de investigaciones de la cadena
diseñó un experimento de bloques aleatorizados en el cual 24 investigadores fueron
estratificados en seis bloques de cuatro, basándose en la experiencia en evaluación
de servicio de comida, y los cuatro miembros de cada bloque fueron asignados
aleatoriamente para evaluar el servicio en uno de los cuatro restaurantes que posee
la cadena. Los resultados del experimento se presentan en la tabla 14.10 de la página
563, junto con algunos cálculos sumarios y una gráfica de dispersión que se mues
tra en la figura 14.14 de la página 564, de modo que se pueda realizar una evalua
ción exploratoria visual de las tendencias y las relaciones potenciales, así como de
las violaciones en las suposiciones de los procedimientos de prueba particulares. Si
el director de investigación no desea hacer la suposición de que las evaluaciones de
servicio se encuentran distribuidas normalmente en cada restaurante, se puede em
plear la prueba de rangos de Friedman, libre de distribución, para diferencias en las
cuatro medianas de población.
La hipótesis nula que se va a probar es que las medianas de las evaluaciones de
servicio de los cuatro restaurantes son iguales; la hipótesis alternativa es que al
menos una de las medianas de los restaurantes difiere de las otras. Así pues, susti
tuyendo 1, 2, 3, 4 por A, B, C, D, tenemos:

Ho: M.1 = M.z = M,3 = M.4

H 1 : No todas las medianas son iguales

Convirtiendo las 24 evaluaciones de servicio de la tabla 14.10 (página 563) a

rangos dentro de cada bloque, obtenemos la tabla 14.12. Como se muestra en esta
tabla, se obtuvo la suma de los rangos para cada grupo:
Sumas de rangos: R.1 = 14.5 R. 2 = 6.0 R. 3 = 24.0 R.4 = 15.5

S72 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Tabla 14. 11 Conversión de datos a rangos dentro
de los bloques.

Bloques Restaurantes
de
evaluadores A B e D
1 2.0 1.0 4.0 3.0
2 3.0 1.0 4.0 2.0
3 2.0 1.0 4.0 3.0
4 3.0 1.0 4.0 2.0
5 2.5 1.0 4.0 2.5
6 2.0 1.0 4.0 3.0
Total de rangos: 14.5 6.0 24.0 15.5
Fuente: Los datos fueron tomados de la tabla 14.10 de la página 563.

Como una verificación de la asignación de rangos tenemos

rc(c + 1)
R_ 1 + R_ 2 + R.3 (14.20)
2

Para nuestros datos, utilizando la ecuación (14.2 0):

14.5 + 6 + 2 4 + 15.5 =
( 6)(4)(S)
2
60 = 6 0

Usando, ahora, la ecuación (14.19), obtenemos:

12 e
L z
FR = re ( e + 1 ) ¡ = R.¡ - 3r(c + 1)
1

= { :: [14.5 2 + 6. 0 2 + 24. 0 2 + 15.5 2 ] }- (3)( 6)(5)

( 6) )(5)

= ( /Jo }1, 062.s) - 90

= 1 06.25 - 9 0 = 16. 25

Puesto que la estadística de prueba FR calculada es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con e -1 = 3 grados de liber
tad (véase tabla E.4), la hipótesis nula puede ser rechazada al nivel de significación
de a= . 05. Podemos llegar a la conclusión de que existen diferencias significativas
(percibidas por los estimadores) respecto al servicio prestado en los cuatro restau
rantes.
Podemos observar que éstos son los mismos resultados que se obtuvieron para
los datos utilizando la prueba F de bloques aleatorizados de la sección 14.8.

Prueba de rango de Friedman para diferencias en e medias 573

14.9.4 Comparaciones múltiples: procedimiento
de Nemenyi
Ya que rechazamos la hipótesis nula y llegamos a la conclusión de que existía evi
dencia de una diferencia significativa entre los restaurantes en lo que respecta a las
medianas de las estimaciones de servicio, el siguiente paso consiste en una com
paración simultánea de todas las parejas posibles de restaurantes, para determinar
cuál o cuáles difieren de los demás. Como el paso siguiente de la prueba de rangos
de Friedman, describiremos un procedimiento de comparación múltiple post hoc o
a posteriori propuesto por P. Nemenyi (véase referencia 9).
En general, con e grupos de tratamiento o niveles de un factor, existen c(c - 1)/2
posibles comparaciones por parejas que se deben realizar. El primer paso consiste
en obtener el rango promedio, R.¡, para cada uno de los j grupos (con j = 1, ... , e).
De la ecuación (14.19), podemos recordar que cuando calculamos la estadística de
prueba FR , obtuvimos el !_otal de los rangos, R.¡ de cada grupo. Así pues, para cal
cular el rango promedio R.; para el j-ésimo grupo, tenemos

- R
R.1 =.; (donde j = 1, ... , e)
n¡
..
Luego calculamos las diferencias R.¡ - R.¡' (en la que j * j') entre todas las
c(c - 1)/2 parejas de rangos promedio. El alcance crítico para el procedimiento de
Nemenyi se obtiene de

c(c + 1)
alcance crítico = Qu¡c,-J (14.21)
l2r

en la que, para un nivel seleccionado de significación a, Qu [e, �J es el valor crítico

de extremo superior de una distribución de rangos studenbzada (tabla E.12),
con e e grados de libertad. Podemos recordar que la estadística Q se utilizó tam
00

bién en la obtención de los alcances críticos-de las comparaciones múltiples que se

realizaron después del rechazo de la hipótesis nula acerca de la igualdad de e
medias tanto en la prueba F ANOVA clásica de una dirección y la prueba F de blo
ques aleatorizados.
El paso final consiste en comparar cada uno de los c(c - 1)/2 pares de rangos
promedio obtenidos con la ecuación (14.21). Una pareja específica de grupos sería
declarada significativamente diferente si la diferencia absoluta en sus correspon
dientes rangos promedio es mayor que el alcance crítico.
Para aplicar el procedimiento de Nemenyi a nuestro estudio de la cadena de
restaurantes de comida rápida, primero obtenemos los rangos promedio sobre los
cuatro grupos de las correspondientes sumas de rangos dadas en la página 5 72:
Sumas de rangos: R_ 1 14.5 R.2 = 6.0 R. 3 = 24.0 R.4 = 15.5
Rangos promedio: R.1 = 2.42 R. 2 = 1.00 R.3 = 4.00 R.4 = 2.58

Existen (4)(4 -1)/2 = 6 comparaciones por pareja que se deben realizar porque exis
ten cuatro restaurantes. Las diferencias absolutas de los rangos promedio son
l. IR.1 - R2 I = 12.42 - 1.001 = 1.42
2. IR1 - R.31 = 12.42 - 4.0ül = 1.58
3. IR.1 - R.41 = J2.42 - 2.58J = 0.16

S74 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos

4. jR 2 - R.31 = ¡1.00 - 4.oo¡ = 3.oo
s. jR 2 - R.4 I = ¡1.00 - 2.s8¡ = 1.58
6. ¡R.3 - R.4 I = 14.üü - 2.s8I = 1.42
Puesto que los tres grupos tienen el mismo tamaño de muestra, solamente hay un
alcance crítico que sería utilizado eh todas las comparaciones posibles. Al selec
cionar un nivel de significación de 0.05, determinamos el alcance crítico de la
ecuación (14.21) obteniendo primero Quc4, 00) = 3.63 de la tabla E,12, de modo que

c(c + 1)
alcance crítico = Q U[4.=J
12r

= 3.63

= 1.91
Observamos que solamente la cuarta comparación por parejas (1 R. 2 - .R.31 = l 1.00 -
4.001 = 3.00) es mayor que el alcance crítico de 1.91, de manera que el director de
investigación puede llegar a la conclusión de que el servicio en el restaurante C es
significativamente mejor que el del restaurante B, pero no hay evidencia de una
diferencia significativa en las estimaciones de servicio entre cualquiera de las
demás parejas de restaurantes. Podemos recordar que si el director de investigación
hubiera utilizado el procedimiento paramétrico de Tukey, descrito en la sección
14.8.4, hubiera llegado a la conclusión de que hay una diferencia significativa en
las estimaciones promedio de servicio entre todas las parejas de restaurantes de la
cadena, excepto para los restaurantes A y D.
Debido a los resultados conflictivos que obtuvimos, el procedimiento de Tukey
deberá utilizarse después de llevar a cabo una prueba F de bloques aleatorizados, si
la suposición de normalidad en las cuatro poblaciones subyacentes es viable. Si no,
se deberá utilizar el procedimiento de Nemenyi como el siguiente paso de la prueba
de rangos de Friedman.

Problemas de la sección 14. 9

e 14.38 El consejo de presidentes de la empresa Physical Fitness and Sports consultó a
un grupo de expertos médicos para clasificar cinco formas distintas de ejerci
cios respecto a su contribución a la condición física y al bienestar físico gene
ral. La clasificación (1 = menos benéfico, 5 = más benéfico) se muestra a
continuación para cada una de las nueve características igualmente impor
tantes de condición y bienestar físicos.

Ejercicio
Característica Ciclismo Calistenia Trote Natación Tenis
Equilibrio 5.0 2.0 4.0 1.0 3.0
Digestión 2.5 1.0 4.5 4.5 2.5
Flexibilidad 1.5 5.0 1.5 4.0 3.0
Definición muscular 4.0 5.0 2.5 2.5 1.0
Resistencia muscular 3.0 1.0 4.5 4.5 2.0
Fortaleza muscular 3.5 3.5 5.0 1.5 1.5
Sueño 3.0 2.0 4.5 4.5 1.0
Estamina 3.0 1.0 4.5 4.5 2.0
Control de peso 4.0 1.0 5.0 2.0 3.0

Prueba de rango de Friedman para diferencias en e medias S7S

(a) ¿Existe evidencia de una diferencia en las estimaciones de "beneficio
percibido" de las cinco formas de ejercicio? (Utilice el nivel a= .OS.)
(Sugerencia: trate las nueve características como bloques.)
(b) Basándose en los resultados obtenidos en el inciso (a), utilice el procedi
miento de Nemenyi para determinar qué ejercicios son más benéficos.
(Utilice el nivel a= .OS.)
(c) t.f.iil?i-t·I•> Escriba una carta a un amigo en la que describa sus hallazgos.
14.39 El locutor de un programa radial sobre deportes en Estados Unidos encuestó a
su audiencia para determinar qué equipos fueron los más dominantes en el
deporte profesional durante el inicio de la década de los noventa. Los equipos
seleccionados por los aficionados fueron Atlanta Braves de beisbol, Dallas
Cowboys en futbol americano, Chicago Bulls en basquetbol y los Pittsburgh
Penguins en hockey sobre hielo. Luego formó un panel de 10 expertos y les
pidió que clasificaran estos equipos desde 1 (más dominante) hasta 4 (menos
dominante). Los resultados se presentan a continuación:

Equipo
Braves de Cowboys de Bulls de Penguins
Experto Beisbol futbol americano basquetbol de hockey
B.M. 3 2 1 4
L.D. 2 3 4
H.C. 1 3 4 2
F.C. 4 1 2 3
T.]. 2 3 1 4
T.A. 1 2 3 4
H.B. 3 1 2 4
H.D. 3 2 1 4
T.D. 3 1 2 4
S.D. 4 2 3 1

(a) Al nivel de significación de O.OS, analice completamente los datos para

determinar si existe evidencia que muestre que los cuatro equipos
deportivos no son considerados como igualmente dominantes y, si ése es
el caso, cuáles son considerados mejores.
(b) t.f.ii19i•f.l•> Escriba una carta al locutor del programa deportivo en la que
le indique cómo interpretaría usted los resultados del inciso (a).
14.40 Se diseña un experimento psicológico para determinar si existen diferencias en
la habilidad para recordar debidas a diferentes niveles de observación de un
objeto. Se consideraron tres niveles de observación (en milésimas de segundo).
Se escogieron ocho conjuntos de tres miembros como sujetos. En cada uno de
los ocho conjuntos, los miembros son asignados aleatoriamente para ser
examinados bajo un nivel de observación.

Nivel de observación
Conjunto de tercias
(sujetos) Mínimo Moderado Alto
55 68 67
II 78 83 84
III 34 53 54
IV 56 67 65
V 79 78 85
VI 20 29 30
VII 68 88 92
VIII 59 58 72

(a) Al nivel de significación de .05, ¿existe evidencia de una diferencia en la

mediana de la habilidad para recordar entre los niveles de observación? -

576 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

(b) Si es adecuado, utilice el procedimiento de Nemenyi para determinar los
niveles de observación que difieren en la habilidad promedio para recor-
dar. (Utilice el nivel a= .05.)
(c) f.y;iJl)i,,.¡,, Escriba un memorandum a su profesor de psicología industrial
con relación a los resultados y posibles implicaciones en la publicidad.
14.41 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder al inciso (b) del problema 14.32 (evaluación de café) de
la página 568. (Utilice el nivel a= .OS.) ¿Hay algunas diferencias en sus resultados
actuales con relación a los obtenidos anteriormente? Explique su respuesta.
e 14.42 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder a los incisos (b) y (c) del problema 14.33 (tiempo de coa
gulación) de la página 568. (Utilice el nivel a= .OS.) ¿Existen algunas diferencias en
los resultados actuales y los obtenidos anteriormente? Explique su respuesta.
14.43 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder a los incisos (b) y (c) del problema 14.35 (resultados
de la evaluación estudiantes/planta docente) de la página 570. (Utilice el nivel
a= .OS.) ¿Existen algunas diferencias en los resultados actuales y los obtenidos
anteriormente? Explique su respuesta.

i i H l•l El modelo de diseño factorial y el análisis de

dos direcciones de varianza

14.10.1 Introducción
En las secciones 14.3 a 14.6 estudiamos el análisis de varianza de una dirección o el
modelo de diseño completamente aleatorizado, y en las secciones 14.7 a 14.9 intro
dujimos el modelo de diseño de bloques aleatorizados. En la presente sección exten
deremos nuestro análisis al estudio de un modelo de diseño experimental en el cual
dos factores son de interés. Los dos factores pueden ser diferentes con respecto al nú
mero de niveles (o grupos) que contengan. Sin embargo, centraremos nuestra aten
ción solamente en situaciones en las que se tienen tamaños de muestra iguales, n',
para cada combinación de los niveles del factor A con los del factor B. (Véase refe
rencia 1 para un análisis de los modelos ANOVA con tamaños de muestra diferentes.)

14.1 O.l Desarrollo

Con el propósito de extender nuestro estudio al análisis de varianza y desarrollar
1 los procedimientos de prueba F para el modelo de diseño factorial de dos factores
1
con igual réplica 6 , necesitamos definir los siguientes términos:

1
1
X ¡¡k = valor de la k-ésima observación del nivel i del
factor A y del nivel j del factor B
X ¡¡_ = suma de los valores de la celda ij (las observaciones del nivel i del
factor A y del nivel j del factor B)
X; .. = suma de los valores de la hilera i del factor A
X.¡. = suma de los valores de la columna j del factor B
GT = gran total de todos los valores en todas las hileras y columnas
r = número de niveles del factor A
e = número de niveles del factor B
n' = número de valores (réplicas) para cada celda
n = número total de observaciones del experimento (con n = rcn')

El modelo de diseño factorial y el análsis de dos direcciones de varianza 577

Estos nuevos términos son necesarios para el uso de fórmulas de computo en el aná
lisis de los datos obtenidos de los experimentos de diseño factorial de dos factores.
Con fines ilustrativos, presentamos planteamientos tanto conceptuales como de
cálculo para la descomposición de la variación total necesaria en el desarrollo de los
procedimientos de prueba F. Sin embargo, debido a la cantidad de cálculos implica
dos, en particular a medida que el número de niveles de cada factor aumenta al igual
que aumenta el número de réplicas en cada celda, sugerimos enfáticamente que se
utilice alguno de los paquetes de software estadísticos, de los muchos que se encuen
tran disponibles, cuando se analicen los datos obtenidos de los modelos de diseño
factorial.
De la figura 14.1 (pág. 528) recordamos que en el modelo de diseño completa
mente aleatorizado, el total de la suma de cuadrados (o SST) se subdivide en la
suma de cuadrados entre grupos (SSA) y en la suma de cuadrados dentro de lo gru
pos (SSW). También, de la figura 14.13 (página 559), observamos que en el mode
lo de diseño de bloques aleatorizados, la variación total (es decir, SST) se dividió en
la suma de cuadrados entre grupos de tratamiento (SSA), la suma de cuadrados
entre bloques (SSBL) y la suma de errores al cuadrado (SSE). Para el modelo de dise
ño factorial de dos factores con réplica (es decir, n' > 1 en cada celda), necesitamos
dividir la variación total (SST) en la suma de cuadrados debidos al factor A (o SSFA),
la suma de cuadrados debidos al factor B (o SSFB), la suma de cuadrados debidos al
efecto de interacción de A y B (o SSAB) y la suma de cuadrados debidos al error
aleatorio inherente (o SSE). Esta descomposición de la variación total (SST) se pre
senta en la figura 14.18.

Variación en el factor A (SSFA)

Variación en el factor B (SSFB)

Variación total (SST)
Interacción (SSAB)

Variación aleatoria (SSE)

Figura 14. 1 8
División de la variación total de un modelo de diseño factorial
de dos factores.

La suma del total de cuadrados (o SST) representa la variación total entre

todas las observaciones alrededor de la gran media. SST se puede calcular como

L L L (X - (GT) 2
r e 11'

SST = ijk X) (14.22)

i = 1 j = 1k = 1 rcn'

r e n'

rrrxijk
donde x=; = 1 i = 1k = 1
rcn'
(esto es, la gran media o media general

La suma de cuadrados debida al factor A (o SSFA) representa las diferen

cias entre los diferentes niveles del factor A y la gran media. SSFA se puede calcu
lar como
_/

578 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

r _ r
X Z (GT)Z
= L_i.. ---
2
SSFA = cn'L(X; ·· -X) (14.23)
; = 1 ; = 1 en' ren'

e n'

LLX;¡k
j = 1k = 1
donde X;. (esto es, la media de cada nivel del factor A)
en'

La suma de cuadrados debida al factor B (o SSFB) representa las diferen

cias entre los diferentes niveles del factor B y la gran media. SSFB se puede calcular
como

SSFB = rn'
i
L (X.;. - X)
= 1
2
(14.24)

LLX;¡k
r n'

1 1
donde X; _; =_ _k_=_ __ (esto es, la media de cada nivel del factor B)
rn'

La suma de cuadrados debida al efecto de interacción de A y B (o SSAB)

representa el efecto de las combinaciones del factor A y el factor B. SSAB se puede
calcular como

n'I L (X;¡.
r e
SSAB = -X i .. -X.¡.+ x)
2

i = 1j = 1
(14.25)
r e XZ r XZ e XZ )2
I 1--+- l____!L¿-- I�+�
(G
n
; = 1; = 1
; = 1 en
ren ; = 1 rn

,,. X
donde
X;; = L _!!f.-
k = 1n
(esto es, la media de cada celda)

La suma de errores cuadrados (o SSE) representa las diferencias entre las

observaciones de cada celda y la correspondiente media de celda. SSE puede calcu
larse como

X :Z
L L L(X;¡k -X;¡/= L L rx:k - L L
r e 11' r e 11' r e
SSE= n·:· (14.26)
i=I j = 1k = 1 i = 1 j = 1k = 1 i = 1 j = 1

Puesto que existen e niveles de tratamiento del factor A, se tienen e - 1 grados

de libertad asociados con SSA. De forma parecida, como existen r niveles de
tratamiento del factor B, se tienen r - 1 grados de libertad asociados con SSB.
Además, como existen n' réplicas en cada uno de las re celdas, se tienen re(n' - 1)

El modelo de diseño factorial y el análsis de dos direcciones de varianza S79

grados de libertad asociados con el término correspondiente al error aleatorio
inherente. Avanzando un poco más en este sentido, existen n - 1 grados de liber
tad asociados con la suma del total de cuadrados (SST) porqu� cada observación
X;¡k está siendo comparada con la media general o gran media, X, basándose en las
n observaciones. Por consiguiente, puesto que los grados de libertad de cada una
de las fuentes de variación deben agregarse a los grados de libertad de la variación
total (SST), podemos obtener los grados de libertad para la componente de inter
acción (SSAB) mediante sustracción y algo de manipulación algebraica.7 Los gra
dos de libertad están dados por (r - l)(c - 1).
Si cada una de las sumas de cuadrados se divide entre sus grados de libertad
asociados, obtendremos los cuatro términos de varianza o cuadráticos medios
(MSFA, MSFB, MSAB y MSE) necesarios para efectuar ANOVA:

SSFA
MSFA = (14.27a)
r-1
SSFB
MSFB = (14.27b)
e-1

SSAB
MSAB = (14.27c)
(r - l)(c - 1)
= _S_S _E_
MSE (14.27d)
rc(n' - 1)

En el modelo ANOVA de dos factores existen tres pruebas distintas que pueden
llevarse a cabo. Si suponemos que los niveles del factor A y los del factor B fueron
específicamente seleccionados para el análisis (en lugar de ser seleccionados aleato
riamente de una población de niveles posibles), entonces hubiéramos tenido las
siguientes tres pruebas de hipótesis:
Para probar la hipótesis de no diferencia debida al factor A
Ho: µl.. = µz .. = ... = µr..
contra la hipótesis alternativa
H 1 : No todas las µ¡ __ son iguales
formamos la estadística F

MSFA
F = (14.28)
MSE

y la hipótesis nula sería rechazada al nivel de significación, a, si

_ MSFA > F:
F U[(r-1),rc(n'-l)]
- MSE

sao Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Para probar la hipótesis de no diferencia debida al factor B

Ho: µ,1. = µ.z. = ... = µ.,.

contra la hipótesis alternativa

H1: No todas las µ,j. son iguales

formamos la estadística F

F = MSFB
(14.29)
MSE

y la hipótesis nula sería rechazada al nivel de significación a, si

F _ MSFB > FU((c-l),rc(n'-1)]

- MSE

Para probar la hipótesis nula de no interacción de los factores A y B

H0 : AB ¡¡ = O (para todos i y j)
contra la hipótesis alternativa

formamos la estadística F

= MSAB
F (14.30)
MSE

y la hipótesis nula sería rechazada al nivel de significación a, si

F -_ MSAB > FU( r-l)(c-1),rc(

( n'-1)]
MSE

Como en las secciones 14.4.2 y 14.8.2, el conjunto completo de pasos puede

resumirse en una tabla de análisis de varianza (ANOVA), como la tabla 14.13, de la
página 582.

14. 1 O. 3 Aplicación
Para ilustrar el modelo de diseño factorial de dos factores, suponga que el director
de investigaciones de mercado de una cadena de supermercados está interesado en
el estudio del efecto de la colocación de los estantes sobre la venta de un producto.
Se estudiarían cuatro lugares distintos donde colocar los estantes: colocación nor
mal (A), colocación adicional en la tienda (B), nueva colocación solamente y un

El modelo de diseño factorial y el análsis de dos direcciones de varianza S8 I

Tabla 14. 1 3 Tabla de análisis de varianza para e modelo de dos factores con réplica.

Grados Cuadrado medio

Fuente de libertad Sumas de cuadrados (varianza) F

L� -
' X¡ (GT) 2 = SSFA = MSFA
A r-1 rcn' MSFA F
i = 1 r-1 MSE
e X�. (GT)2
B e-1 L
i=1
--;:-;¡ - r en' MSFB = SSFB
e-1
F = MSFB
MSE

= __S_S A
_ __
B
AB (r - l)(c - 1) MSAB F = MSAB
(r - l)(c - 1) MSE

Error rc(n' - 1) MSE = __S_SE__

rc(n' - 1)

Total rcn' - 1

"anunciador del producto" (C) y colocación normal con "listones de propaganda"

(D). Se tomaron tres tamaños de tienda diferentes: pequeña, mediana y grande.
Para cada colocación de estantes se seleccionó una muestra aleatoria de dos tiendas
de cada tamaño. Los resultados en ventas semanales se resumen en la tabla 14.14.

.
T abl a 14 14 V,entas semana es por tamano
- d e t'1end a y co ocac1on
.
, d e estantes.

Tamaño de tienda
Colocación A B e D Totales Medias
de estante
Pequeña 45
50 ':) cr 56 1 \ �
63
65 ,�
(o
48 '<2> \
53 451 56.375
\\+
71
Mediana 57
65
'2.2 �: \/14
73
80
¡s� 60
57 539 67.375
Grande 70
78 \ B 75
82 ':)-t �; I'+ I 7
75
114w
622 77.750
Totales 365 423 460 364 1,612
Medias 60.83 70.50 76.67 60.67 67.167

De esta tabla tenemos:

r= 3, C= 4, n'= 2, X 1 .. = 451, Xz .. = 539, X3 .. = 622
X.1. = 365, X.2. = 423, x_ 3 _ = 460, x.4. = 364, GT = 1,612
X11_ = 95, X12. = 119, X13_ = 136, X14. = 101, X21. = 122, X22. = 147
X23_ = 153, X24_ = 117, X3 1. = 148, X32_ = 157, X33_ = 171, X34_ = 146
r

L, L, rxik
e 11'

= 45 2 + 50 2 + ... + 75 2 = 111,550
i=lj=lk=l

X2 451 2 +539 2 + 6 22 2
L,�
r

= ------ = 110,100.75
i=lcn (4)(2)

582 Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos

X2
e
365
2 + 4232 + 460 2 + 364 2
�; = = 109, 375
;� r ( 3)( 2 )

,f � X� __ 95 + 119 + ... + 146

2 2 2

�� -------- = 111,292
i=li=l n' (2)
(GT)2 1' 612
2
= 108 , 272.66
ren' (3)( 4)( 2 )

Utilizando la ecuación (14. 22),

SST = i i ± X� - (GT) 2
ren ,
¡ = 1 ; =1 k = 1
k

= 111, 550 - 108 , 2 7 2. 66 = 3 ,277. 34

Utilizando la ecuación (1 4. 23),

SSFA =
i X¡ - (GT) 2

¡ = 1 en' ren'
= 110 ,100.75 - 108 ,272. 66 = 1, 828.09

Utilizando la ecuación (14. 24),

e X2 (G ) 2
SSFB = I-i - T
; =1 rn' ren'
= 109, 375 - 108, 27 2. 66 = 1,102. 34

Utilizando la ecuación (14.25),

r e X� r X2 X z. (GT)2
SSAB = II-+- I�- I�+-,
e

¡ = 1; = 1 n ¡ = 1 en ¡ =
1
rn ren
= 111 , 292 -110,100.75 - 109, 375 + 108 , 27 2 . 66
= 88.91

Utilizando la ecuación (14. 2 6),

X�
LLL L L-+
r e n' r e

ssE = x�k - n
i=li=lk=l i=li=l

= 111 ,550 -111, 292 = 258

Para calcular las varianzas utilizamos las ecuaciones (14.27a) hasta (14.27d).
De la ecuación (14. 27a):

SSFA 1, 828.09
MSFA = = = 914.045
r-1 3 -1

De la ecuación (14. 27b):

El modelo de diseño factorial y el análsis de dos direcciones de varianza S83

SSFB 1 , 102 .34
MSFB = = = 367.447
c-1 4-1
De la ecuación ( 1 4.2 7c):

SSAB 88·91
MSAB = = = 14.818
(r - l)(c -1) (3-1)(4-1)
De la ecuación ( 1 4.2 7d):
_S_S_E_ __2_ 5_8 __ =
MSE = 2 1 .5
rc(n' - 1) (3)(4)(2 -1)
En el estudio del supermercado, los cálculos que acabamos de realizar pueden
resumirse en la tabla 14.15.

Tabla 14.1 5 Tabla de análisis de varianza para el ejemplo del supermercado.

Grados Cuadrado medio
Fuente de libertad Sumas de cuadrados (varianza) F
1,828.09 914.045
A(Tamaño 3-1=2 110,100.75-108,272.66 = 1,828.09 MSFA = F=
2 21.5
de tienda)
= 914.045 = 42.51
1,102.34 F= 367.447
B(Localización 4-1 = 3 109,375-108,272.66 = 1,102.34 MSFB =
21.5
3
de estantes) = 367.447 = 17.09

AB(Tamaño de (3-1)(4-1) = 6 111,292 - 110,100.75 - 109,375 MSAB =

88.91 F = 14.818
6 21.5
tienda x localiza- +108,272.66 = 88.91 = 14.818 = .69
ción de estantes
258
Error (3)(4)(2 - 1) = 12 111,550 -111,292 =258 MSE =
12
= 21.5

Total (3)(4)(2) - 1 = 23 111,550 -108,272.66 = 3,277.34

Si utilizamos el nivel de significación de O.OS y probamos la diferencia entre

los tamaños de tienda, la regla de decisión sería rechazar la hipótesis nula (H0: µ1 .
= µ 2_ = ... =µ,.) si el valor calculado Fes mayor a 3.89 (véase figura 14.19). Como F
= 42.51 > Fu(Z,I Z) = 3.89, podemos rechazar H0 y llegar a la conclusión de que existe
evidencia de una diferencia entre los tamaños de tienda en términos de las ventas
semanales promedio.
Si utilizamos el nivel a = .OS y probamos si existe alguna diferencia entre la
colocación de los estantes, la regla de decisión sería rechazar la hipótesis nula (H0:
µ_1. = µ_ 2_ = ... =µ_e) si el valor calculado de Fes mayor que 3.49 (véase figura 14.20).
Puesto que F = 17.09 > Fu(3,12) = 3.49, podemos rechazar la hipótesis nula y llegar
a la conclusión de que existe evidencia de una diferencia entre la colocación de los
estantes en términos de las ventas semanales promedio.
Finalmente, podemos probar si existe algún efecto de interacción entre el fac
tor A (tamaño de la tienda) y el factor B (colocación de los estantes). Utilizando el
nivel de significación de a= .05, la regla de decisión sería rechazar la hipótesis nula
[AB ¡¡ = O (para todo i y j)] si el valor calculado de Fes mayor que 3.00 (véase figura
14.21). Puesto que F = .69 < Fuc6 ,12) = 3.00, no rechazamos la hipótesis nula y llega
mos a la conclusión de que no existe evidencia de un efecto de interacción entre
el tamaño de la tienda y la colocación de los estantes.

584 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Figura 14.19
o FU(2, 12¡
Reglones de rechazo y de no rechazo,
al nivel de significación de .OS, con 2 y
12 grados de libertad.

Figura 14.20
o 3.49 FLJ<.3, 12¡
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 3 y
12 grados de libertad.

Figura 14.21
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 6 y
12 grados de libertad.

1 4. 1 0.4 Interpretación de los efectos de interacción

Ahora que hemos realizado las pruebas para la significación del factor A, del factor
B y de su interacción, podemos obtener un mejor entendimiento de la inter
pretación del concepto de interacción si graficamos las medias de celda como se
muestra en la figura 14.22 de la página 586. Como X;¡.= X;¡./n', tenemos

- 95 - 119 - 136 - 101

= = 47.5, X 12_ = = 59.5, X 13 _= = 68.0, X 14_= = 50.5
X 1 1.
2 2 2 2
_ 122 _ 147 - 15 3 11
X 2 1. =
2 = 61.0, X 22_ =
2 = 73.5, X 23. =
2
= 76 .5, x-· 24. __ 2
1 = 58.5

- 148 - 157 - 171 - 146

X 3 1.= 74.0, X 78.5, X 33 = 85.5, X 34_= 3.0
2 = 3 2 _=
2 = =
2 2=7

El modelo de diseño factorial y el análsis de dos direcciones de varianza SSS

90
•C
80 B
A
70 D
C/l
Q)

60
E
50
Q)
E 40

C/l

o Pequeño Mediano Grande

Figura 14.22
Ventas promedio semanales, basadas en el tamaño de tienda para
diferentes colocaciones de estantes.

En la figura 14.22 hemos graficado las ventas semanales promedio de cada

tamaño de tienda y de cada colocación. Para nuestros datos, las cuatro líneas (que
representan las cuatro colocaciones de estantes) aparecen apuntando casi en la
mjsma dirección. Este fenómeno puede interpretarse como que la diferencia en las
ventas semanales entre las cuatro colocaciones de estantes es virtualmente la
misma para los tres tamaños de tienda. En otras palabras, no existe interacción entre
estos dos factores, como claramente se evidenció en la prueba F de la página 584.
¿Cuál sería la interpretación si hubiera un efecto de interacción? En tal situación,
algunos niveles del factor A responderían mejor con ciertos niveles del factor B. Por
ejemplo, suponga que algunas colocaciones de estantes fueran mejores para tiendas
grandes y otras para tiendas pequeñas. Si éste fuera el caso, las líneas de la figura
14.22 no estarían apuntando en una dirección que las hace casi paralelas y el efecto
de interacción sería estadísticamente significativo. En está situación, las diferencias
entre las diferentes localizaciones de estantes no serían las mismas para todos los
tamaños de tiendas. Tal resultado tendría como consecuencia una complicación de
la interpretación del los efectos principales, ya que las diferencias en un factor (colo
cación de estantes) no serían consistentes a través del otro factor (tamaño de tienda).

14. 1 O. 5 Comparaciones múltiples

Como en el caso de los modelos de una dirección y de bloques aleatorizados, ya
que se ha rechazado la hipótesis nula de no diferencias en los niveles de un factor,
necesitamos determinar los grupos o niveles particulares que son significativa
mente diferentes entre sí. Se puede emplear un procedimiento desarrollado por
John Tukey (referencias 6 y 14) tanto para el factor A como para el factor B.

586 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

Para el factor A tenemos:

,. MSE (14.31)
a1Canee CiltlCO = Q U[r,rc(n'-J)] �
en'

y para el factor B tenemos

,. MSE
a1 Canee CiltiCO = Q U[c,rc(n'-1)] �--;:;::¡;- (14.32)

Al igual que en las secciones 14.4.5 y 14.8.4, cada una de las c(c - 1)/2 o r(r - 1)/2
parejas de medias se comparan respecto el alcance crítico apropiado. Una pareja
específica de medias sería declarada significativamente diferente si la diferencia
absoluta en las medias de muestra ( 1 X¡ . - X¡ ,..1) para el factor A o IX.¡. - X.r.1 para
el factor B) es mayor a su respectivo alcance crítico.
Para aplicar el procedimientq de Tukey, regresemos a nuestro ejemplo del
supermercado. Respecto al factor A, puesto que tenemos tres grupos, existen (3)(3
-1)/2 = 3 posibles comparaciones por pares que se deben realizar. De la tabla 14.14
de la página 582, las diferencias medias absolutas son:
l. IX1 .. - X2 .I = l 56.375 - 67.3751 = 11.000
2. IX1.. - X3 .. I = 1 56.375 - 77.7501 = 21.375
3. IX2 .. - X3 .. I = 1 67.375 - 77.7501 = 10.375
Para determinar el alcance crítico, de la tabla 14.15 de la página 584, tenemos: MSE
= 21.5, r = 3 y e= 4. De la tabla E.12, para a= .05, r = 3 y rc(n' - 1) = (3)(4)(2 - 1) =
12, el valor crítico de extremo superior, Qu(3 ,12i, es 3.77. De la ecuación (14.31),
tenemos
2 5
alcance crítico = 4.20� �· = 7.95

Observamos que todos los contrastes son mayores que el alcance crítico. Por con
siguiente, podemos llegar a la conclusión de que las tiendas pequeñas, medianas y
grandes difieren entre sí respecto a sus ventas semanales.
En lo que concierne al factor B, puesto que se tienen cuatro grupos, existen
(4)(4 - 1)/2 = 6 posibles comparaciones por parejas que se deben realizar. De la
tabla 14.14 de la página 582, las diferencias medias absolutas son
1. IX.1 - x.2.I = 160.83 - 70.501 = 9.67
2. 1x 1 - x. 3 .I = 160.83 - 76.671 = 15.84
3. 1x 1 . - x.4.1 = 160.83 - 60.671 = .16
4. lx.2. - X 3 .I = 170.50 - 76.671 = 6.17
5. 1x.2. - x 4.I = 170.50 - 60.671 = 9.83
6. IX 3 . - x.4.1 = 176.67 - 60.671 = 16.00

El modelo de diseño factorial y el análsis de dos direcciones de varianza S87

Para determinar el alcance crítico, de la tabla 14.15 de la página 584, tenemos MSE =
21.5, r = 3 y e = 4. De la tabla E.12, para a= .05, c = 4 y rc(n' - 1) = (3)(4)(2 - 1) = 12, el
valor crítico de extremo superior, Qi:¡(4,12), es 4.20. De la ecuación (14.32), tenemos

2 5
alcance crítico = 4.20� �· = 7.95

Observamos que X.1. es diferente de X.2. (9.67 > 7.95) y X. 3. (15.84> 7.95), y X.4. es
diferente de X.z. (9.83 > 7.95) y X.3.(16 > 7.95). Así pues, podemos llegar a la conclusión
de que la colocación de estantes A (normal) y D (normal más "listones de propaganda")
son, cada uno, diferentes de las colocaciones B (colocación adicional en la tienda) y C
(nueva colocación con "anunciante"). Sin embargo, no existe evidencia de que haya
una dife-rencia entre las colocaciones A y D o entre las colocaciones B y C.

14. 1 0.6 Modelos fijo, aleatorio y mezclado

En nuestro estudio de los modelos de análisis de varianza no hemos centrado nues
tra atención en cuáles de los diferentes niveles de un factor han sido seleccionados.
Desde esta perspectiva, existen tres modelos alternativos:
l. Modelo de efectos fijos (modelo 1).
2. Modelo de efectos aleatorios (modelo II).
3. Modelo de efectos mezclados (modelo III).
El primero, modelo de efectos fijos (modelo 1), descrito hasta este punto de
la presente sección, supone que los niveles de un factor ha sido seleccionados
específicamente para el análisis. Esto significa que los niveles del factor no fueron
seleccionados aleatoriamente de una población y que no se pueden hacer inferen
cias con respecto a cualesquiera otros niveles, con excepción de los utilizados en el
estudio.
En contraste con el modelo de efectos fijos, el modelo II, modelos de efec
tos aleatorios, contiene factores en los que los niveles son seleccionados aleatoria
mente de una población. El objetivo de un modelo de efectos aleatorios no es
necesariamente examinar las diferencias entre niveles, sino, lo que es más impor
tante, estimar la variabilidad debida a cada factor (véase referencia 5). Por ejemplo,
si deseáramos estudiar el efecto sobre la productividad de diferentes trabajadores y
diferentes máquinas, podríamos elegir aleatoriamente una muestra de máquinas
y asignar una muestra aleatoria de trabajadores a cada una, durante un número
dado de días. No solamente seríamos capaces de medir si los trabajadores y las
máquinas tienen efectos significativos sobre la productividad, sino que también
estaríamos en la posibilidad de estimar la variabilidad debida a diferentes máquinas
y la debida a diferentes trabajadores.
El modelo de efectos mezclados (modelo III), contiene una mezcla de efec
tos fijos y aleatorios.
Aunque los modelos de efectos aleatorios y de efectos mezclados pueden
analizarse con una profundidad mucho mayor (véanse referencias 5 y 6), nuestra
atención se centra en las consecuencias de los diferentes modelos de la prueba F.
Puesto que los componentes de los modelos difieren respecto a sus suposiciones,
también conducen a diferentes pruebas F en la evaluación de la significación de los
efectos principales (factores A y B). Por consiguiente, las pruebas F apropiadas para
cada uno de los tres modelos se resumen en la tabla 14.16

S88 Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos

Tabla 14.16 Pruebas F para modelos ANOVA de dos factores con réplica.
Hipótesis Efectos fijos Efectos aleatorios Efectos mezclados Efectos mezclados
nula (A y B fijos) (A y B aleatorios) (A fijo, B aleatorio) (A aleatorio, B fijo)

µ;._ = o F = MSFA
MSE
F = MSFA
MSAB
F = MSFA
MSAB
F =
MSFA
MSE
o F = MSFB F = MSFB F = MSFB F = MSFB
µ_¡. = MSE MSAB MSE MSAB
AB;¡ = o F
= MSAB
F =
MSAB F = MSAB F =
MSAB
MSE MSE MSE MSE

Como observamos en la tabla 14.16, las pruebas para los efectos principales son
distintas, dependiendo del tipo de modelo elegido. Para el modelo de efectos fijos,
las pruebas F implican el cociente de MSFA o MSFB entre MSE. Para el modelo de
efectos aleatorios, las pruebas F (para los efectos principales) implican el cociente
MSFA o MSFB entre MSAB. Para el modelo de efectos mezclados con el factor A fijo
y el factor B aleatorio, la prueba F para el factor A implica el cociente de MSFA entre
MSAB, y la prueba para el factor B implica el cociente de MSFB entre MSE. Para
el modelo fijo con el factor A aleatorio y el factor B fijo, la prueba F para el factor
A implica el cociente de MSFA entre MSE, mientras que la prueba para el factor B
implica el cociente de MSFB entre MSAB.

Problemas de la sección 14. I O

V 14.44 Explique la diferencia entre:
(a) Los modelos ANOVA de un factor y de dos factores.
(b) El modelo de diseño de bloques aleatorizados y el modelo de diseño facto
rial de dos factores.
• 14.45 Una empresa reparadora de videocaseteras (VCR) desea estudiar el efecto de la
marca de VCR y el centro de servicio sobre el tiempo de reparación en minu
tos. Se eligieron específicamente para el análisis tres marcas de VCR (A, By C).
También se seleccionaron tres centros de servicio. Cada centro de servicio fue
asignado para efectuar una reparación particular en dos videocaseteras de cada
marca. Los resultados se presentan a continuación:

Marcas de VCR
Centros de servicio A B e
1 52 48 59
57 39 67
2 51 61 58
43 52 64
3 37 44 65
46 50 69

(a) Al nivel de significación de O.OS

(1) ¿Existe algún efecto debido a los centros de servicio?
(2) ¿Existe algún efecto debido a la marca de VCR?
(3) ¿Existe alguna interacción debida al centro de servicio y a la marca de
VCR?
(b) Trace una gráfica del tiempo de servicio promedio para cada centro de
servicio y para cada marca de VCR.

El modelo de diseño factorial y el análsis de dos direcciones de varianza 589

(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
centros de servicio y qué marcas de VCR difieren en el tiempo de servicio
promedio. (Utilice el nivel a= .05.)
(d) Basándose en los resultados obtenidos, ¿a qué conclusiones puede llegar
respecto al tiempo de servicio promedio?
(e) tNil'2i•t-i•> Escriba un memorándum al director del centro de repara
ciones en el cual se describan sus resultados.
(f) Si los tres centros de servicio fueran elegidos de manera aleatoria, ¿de qué
manera se vería afectado el análisis que realizó en el inciso (a)?
14.46 Se diseñó un experimento para estudiar el efecto de dos factores sobre la
amplificación de un aparato de sonido estéreo. Los factores son el tipo de
amplificador (cuatro marcas) y el tipo de receptor (dos marcas). Para cada
combinación de niveles de factor, se llevaron a cabo tres pruebas en las que se
midió la salida en decibeles. Una salida en decibeles más alta significa un
mejor resultado. Los resultados codificados son los siguientes:

Amplificadores
Receptor A B e D
9 8 8 10
R¡ 4 11 7 15
12 16 1 9
7 5 o 6
R2 1 9 1 7
4 6 7 5

(a) Al nivel de significación de 0.01:

(1) ¿Existe algún efecto debido a los receptores?
(2) ¿Existe algún efecto debido a los amplificadores?
(3) ¿Existe alguna interacción entre receptores y amplificadores?
(b) Trace una gráfica de la salida en decibeles para cada receptor y para cada
amplificador.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
amplificadores difieren respecto a la salida promedio en decibeles. (Utilice
el nivel a= .01.)
(d) M;M/•t-1•> Basándose en los resultados obtenidos, ¿a qué conclusiones
puede usted llegar respecto a la salida promedio en decibeles? Escriba un
memorándum sobre esto a su profesor de música.
14.47 El administrador de un hospital desea examinar los periodos de hospitali
zación después de una operación quirúrgica en la rodilla. Se seleccionó una
muestra aleatoria de de 30 pacientes, cinco para cada combinación de grupo
de edad y tipo de cirugía. Los resultados, en la cantidad de días de hospitali
zación después de la intervención, son los siguientes:

Grupo de edad
Tipo de cirugía de rodilla Menos de 30 De 30 a 50 Más de 50
1 4 3
3 3 5
Artroscopía 2 2 2
6 3 3
2 2 3
3 4 4
10 5 8
Artrotomía 6 11 12
7 5 10

�-
8 6 3

S90 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

(a) Al nivel de significación de O.OS:
(1) ¿Existe alguna diferencia entre los tipos de cirugía?
(2) ¿Existe alguna diferencia entre los grupos de edad?
(3) ¿Existe alguna interacción entre el tipo de cirugía de rodilla y el grupo
de edad?
(b) Trace una gráfica de la cantidad promedio de días de hospitalización después
de la intervención para cada tipo de cirugía y para cada grupo de edad.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar los gru
pos de edad que difieren en la cantidad promedio de días de hospitali
zación después de una operación. (Utilice el nivel a= .OS.)
(d) t·tiid'Ji•t-1•> Basándose en los resultados obtenidos ¿a qué conclusiones
puede llegar el administrador del hospital? Escriba una carta al admin
istrador acerca de esto.
• 14.48 El director de control de calidad de una fábrica de telas desea estudiar el efecto
de los operadores y de las máquinas sobre la resistencia al rompimiento (en
libras) del material de sarga de lana. Un lote del material se cortó en piezas de
una yarda cuadrada y éstas fueron asignadas aleatoriamente, de tres en tres, a
doce combinaciones de cuatro operadores y tres máquinas, escogidas específi
camente para el experimento. A continuación se presentan los resultados:

Máquina
Operador II III
115 111 109
A 115 108 110
119 114 107
117 105 110
B 114 102 113
114 106 114
109 100 103
e 110 103 102
106 101 105
112 105 108
D 115 107 111
111 107 110

(a) Al nivel de significación de O.OS:

(1) ¿Existe algún efecto debido al operador?
(2) ¿Existe algún efecto debido a la máquina?
(3) ¿Existe alguna interacción debida al operador y la máquina?
(b) Trace una gráfica de la resistencia promedio al rompimiento para cada
operador y para cada máquina.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
operadores y qué máquinas difieren en la resistencia promedio al
rompimiento. (Utilice el nivel a= .05.)
(d) t·tiiiM•i·f•> Prepare un informe dirigido al director de control de calidad
con respecto a sus resultados sobre la resistencia promedio al rompimiento.
14.49 El gerente de producción de un fabricante de enseres electrodomésticos desea
determinar la cantidad óptima de tiempo para el ciclo de lavado de una
lavadora de ropa doméstica. Se diseñó un experimento para medir el efecto del
detergente utilizado y del tiempo del ciclo de lavado sobre la cantidad de
suciedad eliminada de una carga de lavadora estándar: Se seleccionaron especí
ficamente cuatro marcas de detergente (A, B, C y D) y cuatro niveles de ciclo
de lavado (18, 20, 22 y 24) para el análisis. Con el propósito de efectuar el
experimento, se asignaron de manera aleatoria 32 cargas estándar de lavado
doméstico (con igual peso y cantidad de mugre), de dos en dos, a las 16 com
binaciones de detergente y de tiempo de ciclo de lavado. Los resultados (en
libras de suciedad eliminada) se muestran en la tabla siguiente:

El modelo de diseño factorial y el análsis de dos direcciones de varianza 591

Tipo de ciclo de lavado
(en minutos)
Marca de detergente 18 20 22 24
A .11 .13 .17 .17
.09 .13 .19 .18
B .12 .14 .17 .19
.10 .15 .18 .17
e .08 .16 .18 .20
.09 .13 .17 .16
D .11 .12 .16 .15
.13 .13 .17 .17

(a) Al nivel de significación de O.OS:

(1) ¿Existe algún efecto debido al detergente?
(2) ¿Existe algún efecto debido al tiempo del ciclo de lavado?
(3) ¿Existe alguna interacción debida al detergente y al tiempo de ciclo de
lavado?
(b) Trace una gráfica de la cantidad promedio de suciedad eliminada (en
libras) para cada detergente y para cada tiempo de ciclo de lavado.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
detergentes y qué tiempos de ciclo de lavado difieren respecto a la canti
dad promedio de suciedad eliminada. (Utilice el nivel a= .05.)
(d) P·tiiMi•t-i•) Prepare un informe para el gerente de producción tomando
en cuenta los resultados obtenidos sobre la cantidad promedio de
suciedad. Asegúrese de ofrecer una recomendación de cuál podría ser el
ciclo de lavado óptimo para este tipo de lavadora de ropa doméstica.
(e) Si las cuatro marcas de detergente fueran elegidas de manera aleatoria, ¿de
que manera se vería afectado su análisis del inciso (a)?

i e H 11 Dificultades potenciales de la prueba de

hipótesis y cuestiones éticas

1 4. 1 1 • 1 Dificultades potenciales
En el presente capítulo enfocamos nuestra atención a varios modelos de diseño
experimental e introdujimos algunos procedimientos paramétricos y libres de dis
tribución que pueden utilizarse cuando se analizan posibles diferencias en los
resultados numéricos o en las mediciones de respuesta entre los niveles (de
tratamiento) de algún factor de interés. Luego ampliamos lo anterior para tomar
en consideración los efectos de dos factores en el diseño de experimentos. De
nuevo, parte de un buen análisis de datos consiste en entender las suposiciones
que subyacen en cada uno de los procedimientos de prueba de hipótesis y, uti
lizándolos junto con otros criterios, seleccionar el más adecuado para un conjunto
dado de condiciones. Así pues, incluso cuando nuestro objetivo principal es
realizar un análisis confirmatorio de un experimento en particular o de un con
junto de datos, siempre debemos llevar a cabo, primero, un análisis exploratorio y
descriptivo, de manera que a través de la observación podamos entender mejor lo
que los datos contienen y qué tendencias, relaciones y efectos potenciales nos
están indicando. El hecho de no considerar los datos con este cuidado no es en sí
falta de ética. Sin embargo, por lo generé!! trae como resultado un análisis que no
es óptimo.

592 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

14. 1 1 .2 Cuestiones éticas
Las consideraciones éticas surgen cuando un investigador manipula el proceso d�
prueba de hipótesis de manera que le produzca una ganancia personal. Al coordinar y
administrar un proyecto que trate sobre un experimento diseñado a largo plazo o al
efectuar ensayos clínicos en industrias como la del tabaco, farmacéutica y de salubri
dad, es imperativo que el investigador principal desarrolle un plan operativo o un pro
tocolo que trate sobre el proceso de recolección de datos, de evaluación y de análisis.
Particularmente, cuando muchas personas están involucradas en el proceso, se debe
establecer un sistema de verificaciones y balances para evitar el fraude, así como el pla
gio, la tergiversación de datos o la falsificación de resultados. Como se analizó previa
mente en la sección 11.11.2 (páginas 412 a 415), las siguientes son algunas de las
cuestiones éticas que surgen cuando se diseñan experimentos y se analizan resultados:
• Método de recolección de datos: aleatorización.
• Consentimiento informado por parte de los sujetos humanos que son
"tratados".
• Tipo de prueba: dos extremos o un extremo.
• Selección del nivel de significación.
• Curioseo de datos.
• Depuración y elíminación de datos.
• Informe de los resultados.
• Metanálisis.
La vida de algunos seres humanos puede depender de la aceptación y aplicación de
una investigación falseada. Esto se vuelve aún más importante cuando hay involu
cradas cuestiones éticas. Debería regresar y volver a leer la sección 11.11, de modo que
quede arraigada en su proceso de pensamiento. De nuevo, Cuando se tratan temas
sobre ética relacionados con metodología de la hipótesis prueba, la clave es la intención:
debemos diferenciar entre un análisis confirmatorio pobre y una práctica no ética. El
comportamiento no ético se presenta cuando un investigador, con conocimiento de
causa, propicia que haya parcialidad en la selección de los datos, manipula el
tratamiento de los sujetos humanos sin obtener de ellos un consentimiento informado
para hacerlo, utiliza el curioseo de datos para elegir el tipo de prueba (de dos extremos o
de un extremo) y/o el nivel de significación para su provecho, esconde los hechos
mediante la eliminación de las observaciones que no apoyan una hipótesis establecida
y no informa sobre los hallazgos pertinentes.

i e H FI Prueba de hipótesis basada en e muestras

de datos numéricos: un repaso
Como se puede ver en el diagrama resumen del presente capítulo (véase página
594), podemos distinguir entre los planteamientos para comparar e grupos que
contienen datos numéricos, basándose en el modelo de diseño experimental uti
lizado para obtener las respuestas o resultados medidos. La metodología de la
prueba de hipótesis fue desarrollada, de manera separada, para analizar los datos
obtenidos de modelos de diseño de una dirección o completamente aleatorizados,
modelos de diseño de bloques aleatorizados y modelos de diseño factorial de dos
factores. Después de centrar nuestra atención en un agrupamiento adecuado de
procedimientos de prueba parecidos, necesitamos observar cuidadosamente las
suposiciones y los otros criterios antes de seleccionar un procedimiento en particu
lar. En la página 526 de la sección 14.1, se le dio una lista en la que se pone énfa
sis en los puntos importantes que se analizan en el capítulo. Revise ahora esa lista
para ver si siente que tiene un entendimiento de tales puntos clave. Para asegu
rarse, debería ser capaz de responder las siguientes preguntas conceptuales:

Prueba de hipótesis basada en e muestras de datos numéricos: un repaso 593

n
,,¡;
QI

s:
o
Procedimientos de
e muestras
.¡:a, 1
z
)>

o lipo
Categóricos Cuestiones
'<
o.... 1 de
datos
éticas

;;¡
VI Véase
-o
..., capitulo 15
e:
Numéricos
"'o-
(D

1 1
VI
c..

"
(D

�
3e:
(D
....
VI Diseño Diseño Disef\o
"'..., completamente de bloques factorial
VI
aleatorio aleatorio
o::,
('l

c..
; ;
1 1
�
o
VI
::,
e:
3
1 \ 1 1 \ 1
Prueba de Prueba de Prueba Prueba de Sumas Modelos fijos,
(D,
..., Prueba
¡:;· Hartley para rangos de rangos de Interacción aleatorios y

r
o FANOVA FANOVA de cuadrados
VI homoscedasticidad Kruskal-Wallis Friedman mezclados

1 ' 1 í 1
1
l
1

Comparaciones Comparaciones Comparaciones Comparaciones Prueba

múltiples múltiples múltiples múltiples FANOVA

1
Comparaciones
múltiples

Sumario de la gráfica del capítulo 14.

( ¡
l. ¿Cuáles son las características distintivas de los modelos de diseño
completamente aleatorizado, de bloques aleatorizados y factorial de
dos factores?
2. ¿Cuáles son las principales suposiciones de A OVA?
3. ¿En que condiciones debe utilizarse la prueba Fmáx de Hartley?
4. ¿En qué condiciones debe seleccionarse la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de e
poblaciones independientes?
S. ¿En qué condiciones debe seleccionarse la prueba de rangos de
Kruskal-Wallis para examinar posibles diferencias en las medianas de
e poblaciones independientes?
6. ¿Cuándo y cómo debería utilizarse el procedimiento de compara
ciones múltiples para evaluar combinaciones por parejas de las
medias o de las medianas?
7. ¿En qué condiciones debe seleccionarse la prueba F de bloques
aleatorizados para examinar posibles diferencias en las medias de e
poblaciones relacionadas?
8. ¿En qué condiciones debería seleccionarse la prueba de rangos de
Friedman para examinar posibles diferencias en las medianas de e
poblaciones relacionadas?
9. ¿En qué condiciones debería seleccionarse la prueba F ANOVA de
dos direcciones para examinar las posibles diferencias en las medias
de cada factor de un diseño factorial?
10. ¿Qué queremos decir con el concepto de interacción en un diseño
factorial?
11. ¿Cómo podemos utilizar la prueba F ANOVA de dos direcciones para
examinar la posible interacción en los niveles de los factores de un
diseño factorial?
Revise la lista de preguntas para ver si, efectivamente, conoce las respuestas y
puede (1) explicarlas a alguna persona que no haya leído el capítulo y (2) dar refe
rencias de lecturas específicas o de ejemplos que apoyen su respuesta. También,
vuelva a leer cualquier sección que le haya parecido confusa para ver si ahora tiene
sentido.

Juntando todo

TÉRMINOS CLAVE
alcance crítico 537 distribución F 531
aleatoriedad 539 distribución Fmáx 540
análisis de varianza (ANOVA)527 distribución (Q) de rangos
ANOVA de dos direcciones 577 studentizados 574
a posteriori 537 efectos de interacción 586
bloques 558 efectos principales 586
comparaciones múltiples 537 eficiencia relativa (RE) 567
cuadrados medios 530 error aleatorio inherente'(SSE) 561
diseño completamente aleatorizado 527 error experimental 528
diseño de bloques aleatorizados 558 grupos de tratamiento 558
diseño factorial 577 homogeneidad de varianza 539

Términos clave 595

independencia de errores 539 suma de bloques cuadrados
interacción 586 (SSBL) 560
media general o gran media 529 suma de cuadrados debida a la
interacción (SSAB) 579
modelo de efectos aleatorios 588
suma de cuadrados debida al factor A
modelo de efectos fijos 588
(SSFA) 578
modelo de efectos mezclados 588
suma de cuadrados debida al factor B
niveles 577 (SSFB) 579
procedimiento de Dunn 549 suma de errores cuadrados (SSE) 561
procedimiento de Nemenyi 574 suma dentro de cuadrados (SSW)
procedimiento de Tukey 566 suma entre cuadrados (SSA) 530
procedimiento de Tukey-Kramer 537 suma total de cuadrados (SST) 529
prueba de Fmáx de Hartley 540 tabla de resumen ANOVA 532
prueba de rangos de Friedman 571 unidades experimentales 558
prueba de rangos de Kruskal-Wallis 545 variación dentro de grupos (SSW) 530
prueba F ANOVA de bloques variación entre bloques (SSBL) 560
aleatorizado 559
variación entre grupos (SSA) 530
prueba F ANOVA de una dirección 527
variación total (SST) 529
prueba F de dos direcciones 580

Problemas de repaso del capítulo

14.50 t•füiM•i·Y·� Escriba una carta a un amigo que no ha tomado ningún curso de
estadística y explíquele de que se trata el presente capítulo. Para resaltar el
contenido del mismo, asegúrese de incorporar sus respuestas a las once pre
guntas de repaso de la página 595.
14.51 El gerente de ventas al detalle de una cadena de supermercados desea determi
nar si la colocación de juguetes para mascotas tiene algún efecto sobre la venta
del producto. Se van a considerar tres lugares en pasillo: anterior, en medio y
posterior. Se seleccionó una muestra aleatoria de 18 tiendas y en seis de ellas
fueron asignadas aleatoriamente un lugar en pasillo. El tamaño del área de
exhibición y el precio del producto fueron constantes en todas las tiendas. Al
final de un periodo de prueba de una semana, el volumen de ventas (en miles
de dólares) del producto en cada tienda fue el siguiente:

Colocación en pasillo
Anterior En medio Posterior
8.6 2.0 4.6
7.2 3.2 2.8
5.4 2.4 6.0
4.0 1.8 2.2
5.0 1.4 2.8
6.2 1.6 4.0

(a) Al nivel de significación de .OS, ¿existe evidencia de una diferencia en las

varianzas de las tres colocaciones en pasillo?
(b) Al nivel de significación de .OS, ¿existe evidencia de una diferencia en las
ventas promedio entre las diferentes colocaciones en pasillo?

S96 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

(c) Si es adecuado, utilice el procedimiento de Tukey-Kramer para determinar
que colocaciones en pasillo son diferentes respecto al promedio de ventas.
(Utilice el nivel a= .OS)
(d) ¿A qué conclusión debería llegar el gerente de ventas al menudeo? Discuta
completamente las opciones del gerente respecto a la colocación en
pasillo.
Suponga que, cuando se está estableciendo el experimento, el gerente de
ventas al detalle es capaz de estudiar los efectos de la altura de los estantes,
además de la colocación en pasillo. Así, en lugar del anterior modelo de diseñ.o
completamente aleatorizado de un factor, puede establecer un modelo de
diseñ.o factorial de dos factores, cada factor con tres niveles y dos réplicas para
cada combinación de colocación en pasillo-altura de estante. Esto es, se tienen
dos factores a ser estudiados: (1) colocación en pasillo (anterior, en medio y
posterior) y (2) altura en estante (superior, media, inferior). Una muestra de 18
tiendas es asignada de manera aleatoria: dos a cada una de las nueve
combinaciones colocación en pasillo-altura en estante. De nuevo, el tamañ.o
del área de exhibición y el precio del producto fueron constantes en todas las
tiendas. Al final de un periodo de prueba de una semana, el volumen de
ventas (en miles de dólares) del producto en cada tienda fue el siguiente:

Altura en estante
Colocación Superior En medio Inferior
en pasillo
Anterior 8.6 6.2 5.0
7.2 5.4 4.0
En medio 3.2 2.0 1.8
2.4 1.4 1.6
Posterior 6.0 4.0 2.8
4.6 2.8 2.2

Observe que el volumen de ventas (en miles) es el mismo en ambas tablas. En

este caso, sin embargo, las seis mediciones de resultado para cada colocación
en pasillo se presentan en grupos de dos, correspondiendo a las tres combina
ciones de altura en estante.
(e) Al nivel de significación de O.OS:
(1) ¿Existe algún efecto debido a la colocación en pasillo?
(2) ¿Existe algún efecto debido a la altura en estante?
(3) ¿Existe alguna intuacción entre la colocación en pasillo y la altura en
estante?
(f) Trace una gráfica de las ventas promedio para cada una de las coloca
ciones en pasillo y para cada una de las alturas en estante.
(g) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
colocaciones de pasillo y qué alturas de estante difieren en las ventas.
(Utilice el nivel a= .OS.)
(h) Basándose en los resultados obtenidos, ¿a qué conclusiones puede usted
llegar respecto a las ventas? Explique su respuesta.
(i) Compare y contraste los resultados del presente problema con los
obtenidos del experimento de una dirección de los incisos (a) a (c).
Explique ampliamente su respuesta.
14.S2 Para examinar los efectos del ambiente laboral en la actitud hacia el trabajo,
un psicólogo industrial asignó de manera aleatoria un grupo de 18 agentes de
ventas recién contratados a tres "salas de trabajo": seis agentes por sala. Todas
las salas eran idénticas, excepto por su color. Una era verde claro, otra azul
claro y la tercera era rojo oscuro.
Durante el programa de entrenamiento de una semana, los agentes per
manecieron, principalmente, en sus respectivas salas de trabajo. Al final del pro
grama, se utilizó una escala de actitudes para mediar la actitud hacia el trabajo de
cada agente (un resultado bajo indicaba una actitud pobre y un resultado alto era
señ.al de una buena actitud). Se obtuvieron los siguientes resultados:

Problemas de repaso del capítulo 597

Color de la sala
Verde claro Azul claro Rojo oscuro
46 59 34
51 54 29
48 47 43
42 55 40
58 49 45
50 44 34

Basándose en estos datos, el psicólogo industrial desea determinar si existe

alguna evidencia de que el ambiente de trabajo (es decir el color de la sala)
tiene un efecto sobre la actitud respecto al trabajo, y si éste es el caso, qué
color o colores mejoran significativamente la actitud.
(a) Analice completamente los datos.
(Utilice el nivel a= O.OS.)
(b) PHMM·i•> Basándose en el análisis completo del inciso (a), escriba un
informe en el que se analicen las implicaciones de los hallazgos respecto al
diseño de oficinas en empresas grandes, en el entendimiento de que el
psicólogo industrial podría utilizar el informe en una reunión con el vicepresi
dente de recursos humanos de la compañía.
Suponga que el vicepresidente desea saber si hay presente algún efecto del
sexo. Si, en la tabla anterior, las tres primeras observaciones de cada nivel de
color de sala correspondieron a hombres y las tres últimas observaciones de
cada nivel correspondieron a mujeres:
(c) De nuevo analice completamente los datos como un conjunto de resulta
dos de un modelo de diseño factorial de dos factores (efectos fijos), en el
cual el factor sexo tiene dos niveles, el factor color de la sala tiene tres
niveles y se tienen tres réplicas para cada una de las seis combinaciones
sexo-color de sala. (Utilice el nivel a= .OS.)
(d) Compare y contraste los resultados obtenidos en el inciso (c) con los
obtenidos del experimento de una dirección del inciso (a). Explique
ampliamente su respuesta.
14.53 Un socio principal de una empresa de corretaje desea determinar si realmente
existe alguna diferencia entre el desempeño a largo plazo de las diferentes
categorías de personas contratadas como representantes ante los clientes. Los
miembros recientes de la empresa están clasificados en cuatro grupos:
profesionales que han cambiado de carrera, graduados recientes de escuelas de
negocios, antiguos agentes de ventas, y corredores de bolsa contratados por la
empresa y que trabajaban para empresas competidoras. Se selecciona una
muestra aleatoria de seis individuos de cada una de estas categorías y se
obtiene un registro de desempeño detallado.

Antecedentes de los representantes ante los clientes

graduados de escuelas
Profesionales negocios vendedores Corredores
de bolsa
88 65 61 83
85 73 67 87
95 54 74 90
96 72 65 84
91 81 68 92
88 69 77 94

(a) ¿Existe evidencia de una diferencia en los resultados de desempeño

promedio para las diferentes categorías? (Utilice el nivel a= O.OS.)
(b) PHMi•ti•> Escriba un memorándum dirigido al socio principal en el
cual le explique sus resultados.

598 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricós

Suponga que el socio principal deseara saber si se encuentra presente algún
efecto debido al sexo de los empleados. Si en la tabla anterior las primeras tres
observaciones para cada nivel del factor de antecedentes de los representantes
ante los clientes son hombres y las tres últimas observaciones de cada nivel
corresponde a mujeres:
(c) Vuelva a analizar completamente los datos como un conjunto de resulta
dos de un modelo de diseño factorial de dos factores (efectos fijos) en el
que el factor sexo tiene dos niveles, el factor antecedentes tiene cuatro
niveles y existen tres réplicas para cada una de las ocho combinaciones
sexo-antecedentes. (Utilice el nivel a= .05.)
(d) Compare y contraste los resultados obtenidos en el inciso (c) con los del
experimento de una dirección del inciso (a). Explique ampliamente su
respuesta.
14.54 Recientemente se efectuó una prueba de vinos patrocinada por el Club J. S.
Wine, en la que se clasificaron ocho vinos por parte de los miembros del club.
La información respecto al país de origen y el precio no fue conocida por los
catadores hasta que hubo terminado la prueba. Los vinos clasificados (y los
precios de venta) fueron:
l. Blanco francés, $8.59
2. Blanco italiano, $6.50
3. Tinto italiano, $6.50
4. Borgoña francés (tinto), $8.69
S. Borgoña francés (tinto), $9.75
6. Beaujolais de California (tinto), $8.50
7. Blanco francés, $7.75
8. Blanco de California, $11.59
Las estimaciones acumuladas sobre varias características correspondientes a los
doce miembros del club son las siguientes:

Vino
Catador 1 2 3 4 5 6 7 8
A 10 17 15 9 12 6 15 9
B 9 14 11 5 16 2 15 7
e 10 18 10 5 18 5 10 10
D 9 11 13 10 17 11 14 9
E 10 16 12 8 18 8 10 10
F 6 16 3 8 4 2 2 5
G 9 12 14 9 9 6 6 5
H 7 12 11 8 15 9 12 8
I 10 18 12 12 16 10 10 16
J 16 9 10 13 18 11 15 14
K 14 16 13 12 15 15 17 11
L 15 17 10 13 15 16 16 13

(a) Al nivel de significación de 0.01, ¿existe evidencia de una diferencia en

los resultados promedio de las estimaciones entre los vinos?
(b) ¿Qué suposiciones son necesarias con el propósito de efectuar el inciso (a)
del problema? Comente sobre la validez de tales suposiciones.
. (c) Si es adecuado, utilice el procedimiento de Tukey para determinar los
vinos que difieren en la estimación promedio. (Utilice el nivel a = .01.)
Q (d) Basándose en los resultados obtenidos en el inciso (c)
(1) ¿Piensa usted que el país de origen ha tenido un efecto sobre los resul
tados?
(2) ¿Piensa que el tipo de vino (tinto contra blanco) ha tenido algún
efecto sobre los resultados? Explique ampliamente su respuesta.
(e) Determine la eficiencia relativa del diseño de bloques aleatorizados en
comparación con el diseño completamente aleatorizado.

Problemas de repaso del capítulo S99

(f) Ignore la variable de bloqueo y vuelva a analizar "erróneamente" los datos
como si se tratara de un modelo de diseño completamente aleatorizado de
un factor en el cual el factor (marca de los vinos) tiene ocho niveles y
cada nivel contiene una muestra de doce observaciones independientes.
(g) Compare los términos SSBL y SSE del inciso (a) con el término SSW del
inciso (f). Explique.
(h) Utilizando los resultados obtenidos en los incisos (a), (f) y (g) como base,
describa los problemas que pueden surgir cuando se analizan los datos si se
aplica el procedimiento equivocado.

Proyectos de minicasos de
aprendizaje colaborativo

Para cada uno de los siguientes, ref'iérase a las instrucciones de la página 101
CL 14.1 Refiérase al CL 3.2 de la página 101, CL 4.2 de la página 165 y al CL5.2 de la
página 199. Su grupo la empresa , ha sido contratada por el edi
tor de la sección de alimentos de una popular revista familiar para estudiar el
costo y las características de los cereales listos para comer. Armados con el
Conjunto especial de datos 2 del apéndice D de las páginas D-6 y D-7, la
empresa desea determinar si existe evidencia de una diferen
cia en el costo promedio por ración de cereales listos para servirse, basándose
en la clasificación en alto contenido de fibra o bajo contenido de fibra.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos d� prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de alimentos de la revista.
CL 14.2 Refiérase al CL 3.3 de la página 102, CL 4.3 de la página 165 y al CL 5.3 de la
página 199. Su grupo, la empresa , ha sido contratada por el direc
tor de comercialización de una fábrica de fragancias bien conocidas para hom
bre y mujer, para estudiar las características de las fragancia actualmente
disponibles. Armados con el Conjunto especial de datos 3 del apéndice D de
las páginas D8 y D9, la empresa desea determinar si existe evi
dencia de una diferencia en el costo promedio por onza, basándose en la
intensidad (muy fuerte, fuerte, medio, ligero).
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al director de
comercialización.
CL 14.3 Refiérase al CL 3.4 de la página 102, al CL 4.4 de la página 166 y al CL 5.4 de la
página 200. Su grupo, la empresa ha sido contratada por el editor
de la sección de viajes <;le un famoso periódico, quien está preparando un
artículo principal sobre cámaras compactas de 35 mm. Armados con el
Conjunto especial de datos 4 del apéndice D de las páginas D-10 y D-11, la
empresa desea determinar si existe evidencia de una diferencia en
la precisión promedio de encuadre basándose en el tipo de cámara de 35 mm.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara
mente todas las hipótesis, niveles elegidos de significación y las suposi
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de viajes.
_,

600 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

ESTUDIO DE CASO E: Comercialización y promoción
de prueba de un bolígrafo
La empresa Publicidad EPC ha sido con Los resultados combinados de las tres
tratada por un fabricante bien estable evaluaciones (apariencia, durabilidad y
cido de bolígrafos para desarrollar una desempeño de escritura) se presentan a
serie de anuncios publicitarios y promo continuación para los 30 sujetos.
ciones a nivel nacional para la próxima
temporada de vacaciones. A fin de Estimaciones de producto para
prepararse para realizar el proyecto, Nat cinco anuncios publicitarios
Berry, director de investigaciones de la
EPC, decidió empezar un estudio del
A B e D E
efecto de la publicidad sobre la percep 15 16 8 5 12
ción del producto. Después de tener una 18 17 7 6 19
reunión con Kate Hansen, la jefa del 17 21 10 13 18
grupo de estadística, se diseñó un experi 19 16 15 11 12
mento en el cual cinco diferentes anun 19 19 14 9 17
cios publicitarios iban a ser comparados 20 17 14 10 14
en la comercialización de un bolígrafo. El
anuncio A tendía ampliamente a subesti
mar las características de los bolígrafos. El Como asistente de investigación de
anuncio B tendía a subestimar ligera Kate Hansen, usted ha sido asignado para
mente las características del producto. El trabajar en este proyecto. Tiene una cita
anuncio C tendía a sobrestimar ligera con ella para analizar este proyecto,
mente las características del bolígrafo. El cuando usted llega a su oficina le dice:
anuncio D tendía a sobrestimar amplia -Hola, pasa y siéntate. Te ofrecería una
taza de café, pero me acaban de llamar a
mente las características del bolígrafo. El
reunión, de modo que vamos a ser
anuncio E intentaba establecer correcta breves. at Berry cree que realmente
mente las características del producto. tiene algo importante, probar los anun
Una muestra de 30 sujetos adultos, toma cios publicitarios, y espero que tenga
dos de un grupo de atención grande, fue razón. Le he sugerido que establezcamos
asignada de manera aleatoria a los cinco un modelo de diseño factorial de dos fac
anuncios publicitarios (de modo que tores con el sexo del público como uno
hubiera seis individuos para cada anun de los factores y el anuncio publicitario
cio). Después de leer el anuncio y desarro como el segundo factor, pero Nat argu
llar un sentido de la "expectación del menta que tendrá problemas para con
producto", los sujetos recibieron un bolí vencer al director ejecutivo de efectuar
grafo para ser evaluado, sin que éstos un plan tan sofisticado. Me recordó el
supieran que se trataba del mismo tipo de principio del BESO (KlSS, en inglés, Keep
bolígrafo. A los sujetos se les pidió que It Sound and Simple: mantenlo sólido y
probaran su bolígrafo y la plausibilidad sencillo) y me dijo que cualquier cosa que
del anuncio publicitario. Luego se les fuera más allá de un modelo de diseño
pidió a los sujetos que clasificaran el bolí completamente aleatorizado de una
grafo de 1 a 7 respecto a las tres caracte dirección no pasaría con nuestros direc
rísticas del producto; los resultados se tivos. De todos modos, Nat afirmó que
presentan a continuación: estaba preocupado principalmente por el

Extremadamente Extremadamente
mala Neutral buena
Apariencia 1 2 3 4 5 6 7
Durabilidad 2 3 4 5 6 7
Desempeño en escritura 1 2 3 4 5 6 7

Estudio del caso E 60 1

contenido de los cinco posibles anun Berry-. Tenemos que estar lo más
cios, de modo que el modelo de una seguros posible de que estamos reali
dirección es lo que ha pensado para el zando un buen análisis de datos -con
experimento. No es adecuado, sin cluyó.
embargo, que no podamos evaluar el fac -Bueno, Nat -intervino Kate Han
tor sexo en los anuncios de vacaciones. sen-. Ésa es precisamente la cuestión.
Kate continuó: Estaba, y todavía lo estoy, preocupada
-Deseo estar preparada para · 1a con respecto a un efecto potencial del
reunión de la semana próxima con el sexo del auditorio que deberíamos
equipo de investigación de nuestro conocer si en realidad deseamos tener
grupo de relaciones públicas, de modo una publicidad efectiva en nuestra cam
que no haya ninguna reacción nega paña. Afortunadamente, mi ayudante
tiva por el modelo que hayamos uti de investigación me acaba de hacer ver
lizado. Por favor, prepárame un que de las evaluaciones registradas en
resumen ejecutivo en donde me nuestra tabla, las tres primeras fueron
muestres las ventajas y las desventajas hechas por hombres y las tres últimas
del modelo de diseño completamente por mujeres, en cada uno de las cinco
aleatorizado y las del modelo de diseño muestras de anuncios. Ahora podemos
factorial de dos factores. Eso nos per considerar el experimento como un
mitirá analizar las dos alternativas y modelo de diseño factorial de dos fac
avanzar en el proyecto del cliente de tores y determinar si existe un efecto
manera positiva. Me gustaría también significativo del sexo y, también, estu
que analizaras completamente los diar alguna posible interacción.
datos que obtuvimos del experimerito -Muy bien -dijo Nat Berry.
completamente aleatorizado. Me gus -Perfecto -acotó John Mack.
taría tener en mi escritorio dentro de Kate Hansen cotinuó:
cuatro días un informe detallado que -Me gustaría que nos reuniéramos
resuma tus resultados e incluya, como de nuevo la semana entrante y anali
apéndice, una discusión del análisis záramos esos resultados. os dará a
estadístico utilizado. Luego nos vamos todos la oportunidad de considerar las
a comer juntos para revisar los detalles ventajas y las desventajas del modelo
y preparar la presentación para Nat y el de dos factores respecto al modelo de un
ejecutivo en jefe. ¿Hay alguna pre factor que mi ayudante acaba de expon
gunta que quieras hacer antes de ernos hace unos minutos.
empezar? ¿No? Muy bien, buena -Bueno, reunámonos otra vez la se
suerte, y no dejes de llamarme por telé mana próxima, aquí mismo y a la
fono si surge algo. misma hora -ordenó Nat Berry.
John Mack continuó:
-Muy bien, pero mientras te estás
preparando para la siguiente reunión,
-----UNA SEMANA DESPUÉS ¿podrías también echarle un vistazo a
estos datos que recabé de manera pare
Después de la presentación en la reunión cida a tu experimento? En este con
con el equipo de investigación del grupo junto de datos la audiencia muestreada
de relaciones públicas de la agencia, el estuvo compuesta solamente por estu
director estadístico, John Mack, sugirió diantes de preparatoria que son parte
que se tomara en cuenta un método libre del grupo objetivo, no hubo ningún
de distribución adecuado para el análisis adulto. Y los datos corresponden úni
de los datos presentados en la tabla de la camente a las evaluaciones o respuestas
página 601. de estudiantes expuestos al anunció E,
-Muchos investigadores argumen que, como podrás recordar, tiene la
tarían -observó Mack- que las "escalas intención de establecer correctamente
de características del producto" utilizadas las característica del bolígrafo. Por
no satisfacen verdaderamente los criterios favor, revisa de nuevo los datos corres
pondientes al público adulto de tu
de escalamiento de intervalo o de cociente estudio y analiza las diferencias que
y, por consiguiente, que los métodos existen en sus respuestas.
libres de distribución son más adecuados. Los ya mencionados datos de esti

--
-John, ése podría ser un interesante mación para una muestra de ocho estu
argumento estadístico -intervino Nat diantes de preparatoria son:

602 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos

14 13 15 9 2. Si existe evidencia de que la
11 13 12 16 mediana de las estima
ciones combinadas de los
1
Usted sale de la sala de juntas pen entrevistados estudiantes de
sando en las últimas observaciones de preparatoria sujetos al anun
John Mack. Además de analizar los cio E es mayor que 12.
datos originales como un modelo de Una respuesta a la primera evaluación
diseño factorial de dos factores y identificará posibles diferencias en las
preparar el análisis de las diferencias de percepciones de los adultos y de los
los resultados obtenidos utilizando ese estudiantes respecto al producto. Una
modelo y los obtenidos con el modelo respuesta a la segunda identificará si el
de diseño completamente aleatorizado producto es "preferido" por la audien
que acaba de realizar, decide responder cia de estudiantes de preparatoria,
a las interrogantes de John evaluando puesto que una mediana de 12 es la
lo siguiente: estimación "neutral" de características
1. Si existe evidencia de una combinadas esperada: la suma de las
diferencia en las estima evaluaciones de apariencia, durabili
ciones combinadas de los dad y desempeño en la escritura en las
entrevistados adultos y los tres escalas de siete puntos, en las
entrevistados estudiantes de cuales el valor 4 es neutral. Usted
preparatoria sujetos al anun preparará un informe detallado sobre
cio publicitario E (que
intenta establecer correcta esto a Kate Hansen.
mente las características del
bolígrafo).

Notas finales
l. En algunas ocasiones la variación entre grupos se conoce y como n = re, haciendo un poco de álgebra tenemos:
como variación entre dos grupos. En tales situaciones, la n -1 - (e - 1) - ( r - 1) = re - 1 - e+ 1 - r + 1
suma de los términos cuadráticos se conoce como suma
de cuadrados entre grupos o SSB (por sus siglas Sum of =re-e- r +l
Squares Between). = (r - l)(e - 1)
2. Además de este análisis exploratorio de datos, se debería 5. En esencia, en un modelo de diseño de bloques aleatori
contemplar un planteamiento más confirmativo para zado, los bloques no tienen la misma posición que un fac
examinar las suposiciones de un procedimiento de prueba tor. En la sección 14.10 veremos que cuando los bloques
particular, antes de decidir si el procedimiento es viable son considerados con la importancia suficiente para cons
para un conjunto de datos dado. Para la prueba F ANOVA tituir un segundo factor, el diseño se conoce como mode
de una dirección, las principales suposiciones son que los lo factorial de dos factores, y la prueba del efecto de cada
datos de muestra de cada grupo son tomados de maneras factor sería, potencialmente, importante.
aleatoria e independiente de una población subyacente 6. Tomaremos en consideración el caso general en el que se
normal, y que estas poblaciones tienen igual variabilidad tienen n' observaciones para cada combinación del factor
(véanse figuras 14.2 y 14.3 de las páginas 528 y 529). Para A y el factor B (es decir, cada celda). Si hay sólo una obser
probar la condición de normalidad véase la referencia 2. vación por celda, la notación del modelo de diseño de
Para probar la igualdad de las varianzas de las pobla bloques aleatorizados puede utilizarse con los bloques
ciones, en la sección 14.4.7 se presenta un procedimiento considerados como un segundo factor de interés.
desarrollado por H. O. Hartley.
7. Los grados de libertad asociados con la componente de
3. Puesto que e(e - 1)/2 combinaciones por parejas se reali interacción (SSAB) se encuentran mediante sustracción:
zan de manera simultánea, es necesario ajustar el área de
extremo superior bajo la curva de distribución normal n - 1 - (e - 1) - (r - 1) - re(n' - 1)
estándar con el fin de obtener el valor crítico Zu adecuado y, como n = rcn', haciendo un poco de álgebra tenemos
que permita que el alcance crítico calculado mantenga un n-l - (e-l)-(r-l)-re(n' - l)=rcn' -l-e+l-r+l-rcn'+re
nivel general de significación a, a través del experimento
(véanse referencias 3 y 6). =re-e-r+l

4. Los grados de libertad asociados con la componente de = (r - l)(c - 1)

suma de errores cuadrados (SSE) se encuentran mediante
sustracción:
n - 1 - (e - 1) - (r - 1)

Notas finales 603

También podría gustarte

Formacion de Bloques y Confusion PDF
100% (1)
Formacion de Bloques y Confusion PDF
27 páginas
Análisis Multivariante y ACP
Aún no hay calificaciones
Análisis Multivariante y ACP
22 páginas
Análisis de Diseños Factoriales 2k
Aún no hay calificaciones
Análisis de Diseños Factoriales 2k
16 páginas
Diseño Factorial para Mejorar Rendimiento en Semiconductores
Aún no hay calificaciones
Diseño Factorial para Mejorar Rendimiento en Semiconductores
8 páginas
Conceptos Estadísticos
50% (2)
Conceptos Estadísticos
36 páginas
Análisis de Efectos en Teñido Textil
Aún no hay calificaciones
Análisis de Efectos en Teñido Textil
2 páginas
Diseno Factorial 2k Final
Aún no hay calificaciones
Diseno Factorial 2k Final
24 páginas
Técnicas de Minería de Datos
Aún no hay calificaciones
Técnicas de Minería de Datos
3 páginas
Diagrama Flujo Análisis Univariado
Aún no hay calificaciones
Diagrama Flujo Análisis Univariado
1 página
Analisis de Varianza Greco Latino 2
Aún no hay calificaciones
Analisis de Varianza Greco Latino 2
9 páginas
Experimentos Con Un Solo Factor
100% (1)
Experimentos Con Un Solo Factor
54 páginas
Diseños Factoriales
0% (1)
Diseños Factoriales
7 páginas
Actividad 2 U5 Javier Ruiz
Aún no hay calificaciones
Actividad 2 U5 Javier Ruiz
10 páginas
Etapas Del Diseño de Experimentos
Aún no hay calificaciones
Etapas Del Diseño de Experimentos
5 páginas
Diseño Cross-Over 2x2 para Comparar Dos Tratamientos en Dos Periodos Con Respuesta Continua
100% (1)
Diseño Cross-Over 2x2 para Comparar Dos Tratamientos en Dos Periodos Con Respuesta Continua
1 página
Efectos de Dietas y Medicamentos en Colesterol
Aún no hay calificaciones
Efectos de Dietas y Medicamentos en Colesterol
1 página
DISEÑO FACTORIAL FRACCIONADO 2 (K-P)
100% (1)
DISEÑO FACTORIAL FRACCIONADO 2 (K-P)
9 páginas
Diseños Factoriales Fraccionados IV y V
Aún no hay calificaciones
Diseños Factoriales Fraccionados IV y V
10 páginas
Practica Calificada 6 Estadistica
Aún no hay calificaciones
Practica Calificada 6 Estadistica
8 páginas
1-Introduccion Al Analisis y Diseno de Experimentos
Aún no hay calificaciones
1-Introduccion Al Analisis y Diseno de Experimentos
10 páginas
Diseño de Plackett Burman
Aún no hay calificaciones
Diseño de Plackett Burman
2 páginas
Diseno y Analisis de Experimentos M Parte59
Aún no hay calificaciones
Diseno y Analisis de Experimentos M Parte59
10 páginas
Análisis de Varianza: Datos y Resultados
Aún no hay calificaciones
Análisis de Varianza: Datos y Resultados
27 páginas
Chi Cuadrado
Aún no hay calificaciones
Chi Cuadrado
4 páginas
8-Cap 3 Diseno Exp 1 Fact
Aún no hay calificaciones
8-Cap 3 Diseno Exp 1 Fact
42 páginas
Capitulo 5 Introducción A Los Diseños Factoriales
100% (1)
Capitulo 5 Introducción A Los Diseños Factoriales
50 páginas
Análisis de Diseños Factoriales
100% (2)
Análisis de Diseños Factoriales
8 páginas
Comparación de Parejas de Medias de Tratamientos
Aún no hay calificaciones
Comparación de Parejas de Medias de Tratamientos
9 páginas
1-Análisis Estadístico de Datos de Laboratorio
Aún no hay calificaciones
1-Análisis Estadístico de Datos de Laboratorio
8 páginas
Optimización con Metodología RSM
Aún no hay calificaciones
Optimización con Metodología RSM
20 páginas
Diseño Factorial en Electrónica
Aún no hay calificaciones
Diseño Factorial en Electrónica
10 páginas
Diseño de Experimentos en Ingeniería
Aún no hay calificaciones
Diseño de Experimentos en Ingeniería
24 páginas
TP 7
Aún no hay calificaciones
TP 7
10 páginas
Balanceo de Línea de Producción
Aún no hay calificaciones
Balanceo de Línea de Producción
11 páginas
Cuadrado Latino PDF
Aún no hay calificaciones
Cuadrado Latino PDF
6 páginas
Diseño Factorial
0% (1)
Diseño Factorial
12 páginas
Act - 8 - Diseño Factorial Con Tres Factores
Aún no hay calificaciones
Act - 8 - Diseño Factorial Con Tres Factores
3 páginas
Introducción Al Diseño Experimental - SpringerLink
Aún no hay calificaciones
Introducción Al Diseño Experimental - SpringerLink
22 páginas
Diseños Factoriales Con Tres Factores
Aún no hay calificaciones
Diseños Factoriales Con Tres Factores
10 páginas
Diseños de Bloques en Estadística
Aún no hay calificaciones
Diseños de Bloques en Estadística
7 páginas
Diseño de Experimentos Evidencia 2
Aún no hay calificaciones
Diseño de Experimentos Evidencia 2
9 páginas
Prueba de Rachas para Aleatoriedad
0% (1)
Prueba de Rachas para Aleatoriedad
4 páginas
Ejercicio de Grecolatino
Aún no hay calificaciones
Ejercicio de Grecolatino
3 páginas
Actividad Grupal Diseño Factorial N°3
100% (1)
Actividad Grupal Diseño Factorial N°3
4 páginas
Diseño Factorial Equipo 2 ALA 5 Fraccionado
Aún no hay calificaciones
Diseño Factorial Equipo 2 ALA 5 Fraccionado
14 páginas
Trabajo Doe Final
Aún no hay calificaciones
Trabajo Doe Final
14 páginas
Ejemplo
0% (1)
Ejemplo
4 páginas
Diseños Factoriales 2k
100% (2)
Diseños Factoriales 2k
15 páginas
Capítulo 3 Montgomery
0% (1)
Capítulo 3 Montgomery
49 páginas
232 - 11s - DOS FACTORES - Nomenclaturas
Aún no hay calificaciones
232 - 11s - DOS FACTORES - Nomenclaturas
11 páginas
Taller 4 Experimentos 4-10
Aún no hay calificaciones
Taller 4 Experimentos 4-10
10 páginas
Problema 6.5
100% (1)
Problema 6.5
12 páginas
Examen Diseño Experimental PDF
Aún no hay calificaciones
Examen Diseño Experimental PDF
3 páginas
Clase 3. Analisis de Varianza
Aún no hay calificaciones
Clase 3. Analisis de Varianza
44 páginas
Diseño de Cuadros Latinos
Aún no hay calificaciones
Diseño de Cuadros Latinos
1 página
Prueba de Independencia Chi-cuadrado
Aún no hay calificaciones
Prueba de Independencia Chi-cuadrado
6 páginas
Diseño Factorial
Aún no hay calificaciones
Diseño Factorial
10 páginas
Cap 07. Analisi de La Varianza.
Aún no hay calificaciones
Cap 07. Analisi de La Varianza.
15 páginas
Uns - Diseño Del Experimento - 28 Soles
Aún no hay calificaciones
Uns - Diseño Del Experimento - 28 Soles
17 páginas
Los Significados de Las Fracciones - 21
Aún no hay calificaciones
Los Significados de Las Fracciones - 21
18 páginas
Fuentes de Energía para 2° Grado
100% (1)
Fuentes de Energía para 2° Grado
2 páginas
Alcantarilla Tipo Cajon 147584 Downloable 36419
Aún no hay calificaciones
Alcantarilla Tipo Cajon 147584 Downloable 36419
10 páginas
Algoritmo Del Método de Crank Nicolson PDF
Aún no hay calificaciones
Algoritmo Del Método de Crank Nicolson PDF
5 páginas
Convalidación de Planes 118-5-6-7-8
Aún no hay calificaciones
Convalidación de Planes 118-5-6-7-8
8 páginas
Fuerza Masa y Peso
100% (1)
Fuerza Masa y Peso
5 páginas
5.galvanometro y Motor Electrico.13
Aún no hay calificaciones
5.galvanometro y Motor Electrico.13
5 páginas
T1 Estructura Materiales Ejercicios
Aún no hay calificaciones
T1 Estructura Materiales Ejercicios
5 páginas
Lavadora Plastico
100% (5)
Lavadora Plastico
57 páginas
Clases y Tipos de Ejes
100% (1)
Clases y Tipos de Ejes
6 páginas
Catálogo General 2007 Suntec
100% (1)
Catálogo General 2007 Suntec
231 páginas
Equipos de Flotación
Aún no hay calificaciones
Equipos de Flotación
4 páginas
Otros Tipos de Chavetas
Aún no hay calificaciones
Otros Tipos de Chavetas
3 páginas
Práctica Física General Semana 8
Aún no hay calificaciones
Práctica Física General Semana 8
13 páginas
S05.s1 - Material
Aún no hay calificaciones
S05.s1 - Material
18 páginas
El Motor
100% (2)
El Motor
22 páginas
Byagm Tarea 4 2022 Unahur
100% (1)
Byagm Tarea 4 2022 Unahur
5 páginas
Chasis en Radiología: Convencional vs Digital
Aún no hay calificaciones
Chasis en Radiología: Convencional vs Digital
4 páginas
Estadistica 3.3
Aún no hay calificaciones
Estadistica 3.3
11 páginas
Química Orgánica para Ingeniería Alimentaria
Aún no hay calificaciones
Química Orgánica para Ingeniería Alimentaria
13 páginas
Manual Caja Automática Suzuki SZ
84% (19)
Manual Caja Automática Suzuki SZ
36 páginas
PTS Chipeadora
100% (1)
PTS Chipeadora
13 páginas
17.1 Distribución Binomial y Normal
Aún no hay calificaciones
17.1 Distribución Binomial y Normal
6 páginas
Relaciones Socioafectivas en Baloncesto
Aún no hay calificaciones
Relaciones Socioafectivas en Baloncesto
33 páginas
Guía de Ejercicios Capítulo VII
Aún no hay calificaciones
Guía de Ejercicios Capítulo VII
12 páginas
Informe de Flujo Uniforme
Aún no hay calificaciones
Informe de Flujo Uniforme
17 páginas
Muros Estructurales: Diseño y Ductilidad
Aún no hay calificaciones
Muros Estructurales: Diseño y Ductilidad
2 páginas
Componentes de Un Sistema de Refrigeracion
Aún no hay calificaciones
Componentes de Un Sistema de Refrigeracion
7 páginas
G83 Castellano
Aún no hay calificaciones
G83 Castellano
6 páginas
AC-1-Aire Acondicionado 2 Psicrometría
100% (1)
AC-1-Aire Acondicionado 2 Psicrometría
36 páginas