[go: up one dir, main page]

0% encontró este documento útil (0 votos)
664 vistas79 páginas

ANOVA y Otras Pruebas PDF

Este documento describe los objetivos y contenidos de un capítulo sobre análisis de varianza (ANOVA) y otras pruebas estadísticas para comparar múltiples muestras con datos numéricos. Introduce los conceptos de diseño experimental completamente aleatorizado, de bloque aleatorizado y factorial, y explica cómo dividir la variación total en sus fuentes. También describe los procedimientos ANOVA de una dirección, de bloque aleatorizado y factorial, así como otras pruebas como la de Hartley y Kruskal-Wallis. El objetivo es que los lectores apre

Cargado por

Wilber Contreras
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
664 vistas79 páginas

ANOVA y Otras Pruebas PDF

Este documento describe los objetivos y contenidos de un capítulo sobre análisis de varianza (ANOVA) y otras pruebas estadísticas para comparar múltiples muestras con datos numéricos. Introduce los conceptos de diseño experimental completamente aleatorizado, de bloque aleatorizado y factorial, y explica cómo dividir la variación total en sus fuentes. También describe los procedimientos ANOVA de una dirección, de bloque aleatorizado y factorial, así como otras pruebas como la de Hartley y Kruskal-Wallis. El objetivo es que los lectores apre

Cargado por

Wilber Contreras
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 79

í

capítulo

--VA y ot_ras priueb�


d/e e muestrcas
, .
con dato
numeri1co
••••••••••••••••••••••••••• ••••••••••••••••••••••••••••••
OBJETIVOS DEL Introducir los conceptos de diseño
experimental a través del desarrollo
CAPÍTULO del modelo de diseño completamente
aleatorizado y del procedimiento
ANOVA de una dirección, utilizado
para probar las diferencias entre las
medias de e grupos, y extender este
análisis hasta incluir los modelos de
diseño (con interacción) de bloque y
factorial aleatorizados.

SlS
•IN• Introducción
En el capítulo 13 utilizamos la metodología de la prueba de hipótesis para llegar a
conclusiones acerca de posibles diferencias entre los parámetros de dos grupos,
cuando tratamos con datos numéricos. A menudo, sin embargo, es necesario eva­
luar las diferencias entre los parámetros de varios (c) grupos. Podríamos desear
comparar métodos alternativos, tratamientos o materiales de acuerdo con algún
criterio predeterminado. Una organización de consumidores, por ejemplo, puede
desear determinar qué tipo de llantas duran más en.condiciones de carretera; a un
investigador agrícola le gustaría saber qué variedad de ejotes dará la mayor pro­
ducción; un investigador médico desearía evaluar el efecto de las diferentes marcas
de un tipo de medicina para la reducción de la presión diastólica de la sangre. En
cada uno de los ejemplos anteriores se comparan varios grupos y los datos de cada
grupo son numéricos.
Empezaremos el presente capítulo con el examen del modelo de diseño comple­
tamente aleatorizado en el que tendremos solamente un factor con varios grupos
(como el tipo de llantas, la variedad de ejote o la marca de medicina), desarrollan­
do procedimientos para analizar los datos numéricos y ampliando éstos con la
descripción del modelo de diseño de bloque aleatorizado y el más sofisticado modelo
de diseño factorial (en el que es estudiado más de un factor a la vez en un experi­
mento), y desarrollando procedimientos para el análisis de datos numéricos. A
través de todo el capítulo, se pondrá énfasis en las suposiciones que se encuentran
detrás del uso de los diferentes procedimientos de prueba:
Al terminar el capítulo, usted deberá ser capaz de:
l. Comparar y contrastar las características que diferencian a los mode­
los de diseño completamente aleatorizado, de diseño de bloque
aleatorizado y de diseño factorial.
2. Entender los conceptos que se encuentran detrás de la división de la
variación total en sus diferentes fuentes de variación en los tres modelos
3. Entender las premisas de ANOVA.
4. Saber cuándo y cómo utilizar la prueba de Hartley para varianzas
homogéneas.
S. Saber cuándo y cómo conocer la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de c
poblaciones independientes.
6. Saber cuándo y cómo utilizar la prueba de rangos de Kruskal-Wallis
para examinar posibles diferencias en las medianas de c poblaciones
independientes.
7. Saber cuándo y cómo utilizar los procedimientos de compara­
ción múltiples para evaluar combinaciones por parejas de
medias o de medianas de grupo.
8. Saber cuándo y cómo utilizar la prueba F de bloque aleatorizado para
examinar posibles diferencias en las medias de c poblaciones rela­
cionadas.
9. Saber cuándo y cómo utilizar la prueba de rangos de Friedman para
examinar posibles diferencias en las medianas de c poblaciones rela­
cionadas.
10. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles diferencias en las medias de cada factor de un diseño
factorial.
11. Saber cuándo y cómo utilizar la prueba F ANOVA para examinar
posibles interacciones en los niveles de los factores en un diseño
factorial.
12. Describir el concepto de interacción en un diseño factorial.

526 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


1 e!) Elección del procedimiento de prueba
apropiado al comparar e muestras
Cuando nos preparamos para evaluar diferencias entre c grupos que contienen
datos numéricos, debemos seleccionar un procedimiento de prueba adecuado. Esta
elección depende de varios criterios:
• El tipo de modelo de diseño experimental desarrollado (por ejemplo,
completamente aleatorizado, de bloque aleatorizado o factorial).
• El nivel de medición con que se tomaron los datos (es decir, ordinal
contra escala de intervalo o de cociente).
• La viabilidad de las hiptotesis que subyacen en los procedimientos de
prueba alternativos.
• La capacidad de generalización de las conclusiones por obtener.
• La accesibilidad de las tablas de valores críticos para la estadística de
prueba.
• La disponibilidad de paquetes de software de computación que con­
tengan el procedimiento de prueba.
• La potencia estadística del procedimiento de prueba.
En las secciones siguientes del presente capítulo, describiremos los procedimientos
paramétricos y libres de distribución más ampliamente utilizados para la evalua­
ción de diferencias en c grupos.

1 e !1 El modelo completamente aleatorizado: análisis


de varianza de un factor
A menudo resulta de interés comparar diferencias en los resultados entre varios ""''J
t, .
.•

grupos. Muchas aplicaciones industriales implican experimentos en los que se


toman en cuenta solamente los grupos o niveles pertenecientes a un factor de
interés (como la temperatura de horneado o la preferencia de sabor). Un factor
como la temperatura de horneado puede tener varios niveles numéricos (por ejem­
plo, 300º, 350º, 400º, 450º) o un factor como la preferencia de sabor puede tener
varios niveles categóricos (vainilla, chocolate, frambuesa, pistache). Tales experi­
mentos diseñados de un factor, en los cuales los sujetos o unidades experimentales
son asignadas aleatoriamente a grupos o niveles de un solo factor se conocen como 1
modelos de diseño de un sentido o completamente aleatorizados. ...

1 e!! Prueba F ANOVA de una dirección para


diferencias en e medias

14.4.1 Introducción
Cuando las mediciones resultantes en los c grupos son continuas y se cumplen
ciertas suposiciones, se puede emplear una metodología conocida como análisis
de varianza (o ANOVA; por su nombre: ANalysis Of VAriance) para comparar las
medias de los grupos. En un cierto sentido, el término análisis de varianza" parece
II

no ser el correcto, pues el objetivo consiste en analizar diferencias entre las medias

Prueba F ANOVA de una dirección para diferencias en e medias 527


de los grupos. Sin embargo, a través del análisis de la variación de los datos, tanto
entre los e grupos como dentro de ellos, seremos capaces de llegar a conclusiones
acerca de posibles diferencias en las medias de los grupos. En ANOVA subdividimos
la variación total de las mediciones resultantes en lo que se puede atribuir a
diferencias entre los e grupos y lo que se debe al azar o que se puede atribuir a una
variación inherente dentro de los e grupos (véase figura 14.1). La variación "dentro
de grupos" se considera error experimental, mientras que la variación "entre
grupos" se atribuye a efectos de tratamiento.

Variación entre grupos (SSA)

va,lación total ¡ssn �


Figura 14.1
División de la variación
total en un modelo .\
completamente
Variación dentro de grupos (SSW)
aleatorizado.

14.4.2 Desarrollo
Bajo las premisas de que los e grupos o niveles del factor que se van a estudiar repre­
sentan poblaciones cuyas mediciones resultantes son tomadas de manera aleatoria
e independiente, que siguen una distribución normal y tienen varianzas iguales, la
hipótesis nula de no diferencias en las medias de población
Ho: µ1 = µz = ·· · = µe

puede probarse contra la hipótesis alternativa de que no todas las e medias de


población son iguales

H1 : No todas las µj son iguales (con j = 1, 2, ..., e)

En la figura 14.2 se representa una gráfica de la forma en que se vería una hipóte­
sis nula verdadera cuando se comparan cinco grupos, y son válidas las suposiciones
de normalidad y de igualdad de varianzas.

Figura 14.2
Las cinco poblaciones tienen la
misma media: µ1 = µz = µ3 = µ4 = µ5.

528 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Las cinco poblaciones que representan los diferentes niveles del factor son idénti­
cas y, en consecuencia, se superponen entre sí. Las propiedades de la tendencia
central, la variación y la forma son idénticas para todas.
Por otro lado, suponga que la hipótesis nula es realmente falsa, que el nivel
cuatro posee la media más grande, siguiéndole en valor la del nivel uno y que los
restantes niveles poseen medias de población iguales. En la figura 14.3 se tiene una
representación gráfica de lo anterior.

Figura 14.3
Un efecto de tratamiento se
encuentra presente: µ4 > IJ 1 >
1-12 : 1,13 : 1,15,

Observamos que, excepto para diferencias en la tendencia central (es decir, µ 4 > µ 1
> µ 2 = µ 3 = µ 5) las cinco poblaciones tienen la misma apariencia.
Para llevar a cabo una prueba ANOVA de la igualdad de las medias de población,
subdividimos la variación total en las mediciones resultantes en dos partes, la que
se puede atribuir a las diferencias entre los grupos y la que se debe a variaciones inhe­
rentes dentro de los grupos. La variación total generalmente se representa con la
suma del total de cuadrados (o SST, por sus siglas Sum of Squares Total). Puesto
que bajo la hipótesis nula las medias de población de los e grupos se suponen iguales,
se puede obtener una medición de la variación total entre todas las observaciones,
mediante la suma de las diferencias aj cuadrado entre cada observación individual y
la gran media o media general, X, que está basada en las observaciones de todos
los grupos combinados. La variación total se calcularía como

variación total (SST) = L L (X;¡ - X)


e

j= 1i=1

2
(14.1)

j = 1i = 1
en la que X se conoce como gran media o media general
n
X¡¡ es la i-ésima observación del grupo o nivel j
n¡ es el número de observaciones del grupo o nivel j
n es el total de número de observaciones en todos los grupos combinados
(n = n 1 + n 2 + ·· · + n e)
e es el número de grupos o niveles del factor de interés

Prueba F ANOVA de una dirección para diferencias en c medias Sl9


La variación entre grupos, por lo general conocida como suma de cuadra­
dos entre grupos (o SSA; por sus siglas Sum of Squares Among), se mide medi<!_nte
la suma de las diferencias al cuac_!_rado entre la media de la muestra de cada grupo, X¡, y
la media general o gran media, X, ponderadas o pesadas con el tamaño de muestra, n¡,
de cada grupo. 1 La variación entre grupos se calcula a partir de

L n (x; - X)
e - 2
variación entre grupos (SSA) = ¡ (14.2)
; = 1

en la que e es el número de grupos o niveles que se están comparando


n¡ es el número de observaciones del grupo o nivel j
8'.i es la media de muestra del grupo j
X es la media general o gran media
La variación dentro del grupo, por lo general conocida como la suma
de cuadrados dentro de los grupos (o SSW, por sus siglas Sum of Squares
Within), mide la diferencia entre cada observación y la media de su propio
grupo, y suma los cuadrados de tales diferencias sobre todos los grupos. La
variación dentro de los grupos puede calcularse con

L L (X;¡ - X )
e n¡
variación dentro del grupo (ssw) ¡
z
(14.3)
; = 1i = 1

en la que
X;¡ es la í-ésima observación del grupo o nivel j
X¡ es la media de muestra del grupo j
Puesto que e niveles del factor están siendo comparados, existen e - 1 grados
de libertad asociados con la suma de cuadrados entre grupos. Como cada uno de
los e niveles contribuye con n¡- 1 grados de libertad y

L (n
e

¡
- 1) = n-e
i=1
existen n - e grados de libertad asociados con la suma de cuadrados dentro de grupos.
Además, existen n - 1 grados de libertad asociados con la suma de totales al cuadrad...9
porque cada observación, X;¡, es comparada con la media general o gran media, X,
basándose en las n observaciones.
Si cada una de estas sumas de cuadrados se divide entre sus grados de libertad
asociados, obtendremos tres varianzas o términos cuadráticos medios: MSA,
MSWyMST:

SSA
=
MSA (14.4a)
e-1
SSW
MSW = (14.4b)
n-c
= SST
MST (14.4c)
n-l

S30 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Debido a que una varianza se calcula dividiendo la suma de diferencias al
cuadrado entre los correspondientes grados de libertad, los términos cuadráticos
medios son todas las varianzas.
A pesar de que el principal interés consiste en comparar las medias de los e gru­
pos o niveles de un factor para determinar si existe un efecto de tratamiento entre
los e grupos, el procedimiento ANOVA adquiere su nombre del hecho de que lo ante­
rior se logra mediante el análisis de las varianzas. Si la hipótesis nula es verdadera y
no existen diferencias reales en las medias de los e grupos, los tres términos cuadráti­
cos medios, MSA, MSW y MST, proporcionan estimaciones de la varianza, cr2, inhe­
rentes a los datos. Así pues, para probar la hipótesis nula

contra la hipótesis alternativa


H1 : No todas lasµ¡ son iguales (en las que j = 1, 2, ... , e)

calculamos la estadística de prueba F, que es el cociente de MSA entre MSW, como

MSA
F = (14.5)
MSW

La estadística F sigue una distribución F con e - 1 y n - e grados de libertad. Para un


nivel de significación dado, cr, podemos rechazar la hipótesis nula si la estadística de
prueba F excede al valor crítico de extremo superior, Furc-I,n-<J de la distribución F (véase
tabla E.5). Esto es, como se muestra en la figura 14.4, nuestra regla de decisión es:

Rechazar H0 si F > Fu(c-1,n-<)


en cualquier otro caso, no rechazar H0 .

1-

Figura 14.4
Regiones de rechazo y de no
rechazo cuando se utiliza
ANOVA para probar H 0 .

Si la hipótesis nula fuera verdadera, deberíamos esperar que la estadística F


calculada fuera aproximadamente igual a 1, pues los términos cuadráticos medios
tanto del numerador como del denominador son estimaciones de la varianza ver­
dadera, cr2, inherente a los datos. En el otro extremo, si H0 es falsa (y si existen
diferencias reales en las medias), deberíamos esperar que la estadística F calculada
sea sustantivamente mayor que uno, pues el numerador, MSA, estaría estimando
el efecto del tratamiento o la diferencia entre grupos, además de la variabilidad
inherente de los datos, mientras que el denominador, MSW, estaría midiendo sola­
mente la variabilidad inherente. En consecuencia, el procedimiento ANOVA pro-

Prueba F ANOVA de una dirección para diferencias en e medias S3 1


duce una prueba F en la cual la hipótesis nula puede ser rechazada a un nivel de
significación a, solamente si la estadística F calculada es lo suficiente grande para
exceder a Fucc-l,n-cJ, el valor crítico de extremo superior de la distribución F, con
e- 1 y n - e grados de libertad,.según se ilustra en la figura 14.4 de la página 531.
Los resultados de un procedimiento de análisis de varianza por lo general se pre­
sentan en una tabla de resumen ANOVA, cuyo formato se presenta en la tabla 14.1.
Las entradas de esta tabla incluyen las fuentes de variación (es decir, entre grupos, den­
tro de grupos y total), los grados de libertad, las sumas de cuadrados, los cuadrados
medios (es decir, las varianzas) y la estadística F calculada. Además, el valor p (esto es, la
probabilidad de obtener una estadística F mayor o igual que la alcanzada, dado que la
hipótesis nula es verdadera) se incluye en la tabla ANOVA de la mayoría de los paque­
tes de software estadístico (véase sección 14.6). Esto nos permite llegar directamente a
conclusiones con respecto a la hipótesis nula sin tener que referirnos a una tabla de
valores críticos de la distribución F. Si el valor p es menor que el nivel elegido de sig­
nificación, a, la hipótesis nula es rechazada.

Tabla 14, 1 Tabla resumen del análisis de varianza.


Grados de Cuadrado
Fuente libertad Sumas de cuadrados medio (varianza) F

'Entre grupos c-1 SSA = L n ¡(X, - X)'


j:1
e
MSA =
SSA
e- 1
F =
MSA
MSW

L L"' (X,¡ - X )'


e
Dentro de grupos n-c ssw =
¡ MSW =
SSW
1: 1 ¡: 1 n-c

L I (X,¡ -X)'
e "1

Total n-1 SST =


j = l i = 1

14.4.3 Aplicación
Para ilustrar la prueba FA OVA de una dirección, suponga que el gerente de
producción de la planta en que se está empacando cereal en cajas de 368 gramos
está considerando la sustitución de una vieja máquina que afecta directamente el
resultado del proceso de producción. Tres proveedores, competidores entre sí, han
permitido que el gerente de producción utilice su equipo a modo de prueba. Los
precios de adquisición y de los contratos por servicio de las tres marcas de equipo
son esencialmente iguales. Con el propósito de tomar una decisión de compra, el
gerente de producción decide efectuar un experimento para determinar si existen
diferencias significativas entre los tres tipos de máquinas respecto al tiempo prome­
dio (en segundos) que les lleva a los trabajadores de la planta terminar el proceso
de llenado, utilizando cada uno de los equipos. Quince trabajadores de la planta,
con experiencia, habilidad y edad semejantes, fueron asignados para recibir entre­
namiento para operar uno de los tres tipos de equipo, de tal modo que se tienen
cinco obreros por cada máquina. Después de un tiempo adecuado de entre­
namiento y práctica, el gerente de producción mide el tiempo (en segundos) que
les lleva a los trabajadores de la planta efectuar completamente el proceso de lle­
nado, utilizando su respectivo equipo. Los resultados de este experimento se mues­
tran en la tabla 14.2, junto con algunos cálculos sumarios. En la figura 14.5 se
presenta una gráfica de dispersión, de manera que se puedan inspeccionar visual­
mente los datos y ver cómo se distribuyen las mediciones (en segundos) alrededQ_r
de su propia media de grupo, así como alrededor de la media general de grupo X.

532 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


También obtenemos una visión de cómo cada media de grupo se compara con la
media general. Así pues, al examinar la figura 14.5, tenemos la oportunidad de
observar posibles tendencias o relaciones a lo largo de los grupos, así como obser­
var patrones dentro de los mismos y, lo que es más importante, esto nos permite
considerar cualquier violación potencial en las suposiciones requeridas por un pro­
cedimiento de prueba particular. De ser más grandes los tamaños de muestra de
cada grupo, también se hubieran obtenido representaciones de tallo y hojas y grá­
ficas de caja y sesgos, que proporcionan información visual adicional.2

Tabla 14.l Tiempo (en segundos) para realizar


un proceso de llenado utilizando tres
máquinas diferentes.

Máquina
11 III
25.40 23.40 20.00
26.31 21.80 22.20
24.10 23.50 19.75
23.74 22.75 20.60
25.10 21.60 20.40
Media X1 = 24.93 X2 = 22.61 X 3 = 20.59

28

26

'ü,
x,
o 24
e:

Q)

e: 22

Q) 20

18

Figura 14.S
o 11 111 Gráfica de dispersión del tiempo (en
segundos) para completar una tarea
Máquina utilizando diferentes máquinas.
Fuente: Tabla 14.2

Observamos de la tabla 14.2 y de la figurá 14.5 que existen diferencias en las


medias de muestra para las tres máquinas. En promedio, el proceso de llenado tarda
24.93 segundos en quedar terminado, si se utiliza la máquina I; 22.61 segundos, si
se utiliza la máquina II; y 20.59 segundos, si se emplea la máquina III. La pregunta
que debe responderse es si estos resultados de muestra son lo suficientemente dife-

Prueba F ANOYA de una dirección para diferencias en e medias S33


rentes para que el gerente de producción decida que los promedios de población no
son todos iguales.
La hipótesis nula establece que no existe diferencia entre los grupos respecto
al tiempo medio para llevar a cabo completamente el proceso de llenado. Así pues,
sustituyendo 1, 2, 3 por I, II, III tenemos

La hipótesis alternativa establece que existe un efecto de tratamiento; es decir, que al


menos una de las máquinas difiere respecto al tiempo promedio requerido para
completar el proceso de llenado:

H1 : o todas las medias son iguales

Para establecer la tabla de resumen de A OVA, primero calculamos las medias


de muestra de cada grupo (véase tabla 14.2 de la página 533); después calculamos
la media general o gran media:

x =i = li = l 25.40 + 26.31 + ... + 23.40 + ... + 20.40


15
340.65
= = 22.71
15
seguida de las sumas de cuadrados:

(5)(24.93 - 22.71) 2 + (5)(22.61 - 22.71) 2 +(5)(20.59 - 22.71) 2


(5)(2.22) 2 +(5)(-.10) 2 +(5)(-2.12) 2
24.642 +.05 + 22.472
47.164

(25.40 - 24.93) 2 (23.40 - 22.61) 2 (20.00 - 20.59) 2


2
+ (26.31 - 24.93) +(21.80 - 22.61) 2 + (22.20 - 20.59) 2
e n¡
SSW= 2.,2.,(X¡¡-X¡r = +(24.10 - 24.93) 2 + +(23.50 - 22.61) 2 + +(19.75 - 20.59) 2
i = 1i = 1
2
+ (23.74 - 24.93) 2 + (22.75 - 22.61) +(20.60 - 20.59) 2
+(25.10 - 24.93) 2 + (21.60 - 22.61) 2 +(20.40 - 20.59) 2
.2209 .6241 .3481
+ 1.9044 + .6561 + 2.5921
+ .6889 + + .7921 + + .7056
+ 1.4161 + .0196 + .0001
+ .0289 + 1.0201 + .0361
11.0532

534 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


(25.40 -22.71)2 (23.40 -22.71) 2 (20.00 - 22.71) 2
+(26.31 - 22.71) 2 +(21.80 - 22.71)2 +(22.20 - 22.71) 2
L ¿,(X;¡ -xr =
e n¡
SST= +(24.10 - 22.71) 2 + +(23.50 -22.71) 2 + +(19.75 - 22.71) 2
i =1i = 1
+(23.74 - 22.71)2 +(22.75 - 22.71) 2 +(20.60 - 22.71) 2
+(25.10 -22.71)2 +(21.60 -22.71) 2 +(20.40 - 22.71)2

7.2361 .4761 7.3441


+ 12.9600 + .8281 + .2601
+ 1.9321 + + .6241 + + 8.7616
+ 1.0609 + .0016 + 4.4521
+ 5.7121 + 1.2321 + 5.3361
58.2172

Los respectivos términos cuadráticos medios se obtienen dividiendo estas sumas de cuadrados
entre sus correspondientes grados de libertad. Como e= 3 y n = 15, tenemos

SSA = 47.164 = 47.164 = _


MSA = 23 582
c-1 3-1 2
SSW 11.0532 = 11.0532 =
MSW = = 0_9211
n -e 15 - 3 12
de modo que, utilizando la ecuación (14.1) para probar H0 , obtenemos

F = MSA = 23.582 =
25_60
MSW 0.9211

Si se elige un nivel de significación de 0.05, el valor crítico de la estadística F se obtendría de la


tabla E.5, de la cual presentamos una réplica en la tabla 14.3 (en la página 536). Los valores que
se encuentran en el cuerpo de esta tabla se refieren a puntos porcentuales de extremo superior
seleccionados de la distribución F. En nuestro estudio de productividad, dado que existen dos
grados de libertad en el numerador del cociente F y 12 grados de libertad en el denominador,

Figura 14.6
Regiones de rechazo y de no rechazo
o FU(2, 12)
para el análisis de varianza al nivel de
significación de O.OS, con 2 y 12 grados
de libertad.

Prueba F ANOVA de una dirección para diferencias en e medias 535


Tabla 14. 3 Obtención del valor crítico de F con 2 y 12 grados de libertad, al nivel de .OS.
Numerador, df1
Denominador,
df2 1 2 3 4 5 6 7 8 9 10 12

5 6.61 5. 9 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68
6 5.99 5. 4 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00
7 5.59 4. 4 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57
8 5.32 4. 6 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07
10 4.96 4)0 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91
11 4.84 3.'98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79
12 4.75 ) 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53
Fuente: Tomado de la tabla E.5.

el valor crítico de F al nivel de significación de .OS, es e.le 3.89. Debido a que nues­
tra estadística de prueba calculada F = 25.60 es mayor que este valor crítico, la
hipótesis nula puede ser rechazada (véase figura 14.6 de la página 535). El gerente
de producción puede llegar a la conclusión de que existe una diferencia significa­
tiva en el tiempo promedio requerido para terminar el proceso de llenado en las
tres máquinas.
La correspondiente tabla de resumen ANOVA se presenta en la tabla 14.4 y
contiene el valor p exacto para el valor calculado de F, obtenido con el paquete de
software MI1 ITAB (véase referencia 10). Observe que el valor p o la probabilidad
de obtener una estadística F de 25.60 o mayor cuando la hipótesis nula es ver­
dadera es de .000. Puesto que este valor p es menor que el valor especificado de a,
.OS, la hipótesis nula es rechazada.

.
Ta bl a 14 4 T:a bl a d e anaT1s1s
. d e varianza para e estu d'10 d e pro d uc t·1v1'dad .

Grados de Cuadrado medio


Fuente libertad Sumas de cuadros (varianza) F Valor p
Entre grupos (máquina) 3 - 1= 2 47.1640 23.5820 25.60 .000
Dentro grupos (máquina) 15 - 3 = 12 11.0532 .9211
Total 15 - 1 = 14 58.2172

14.4.4 Reflexión
Revisemos lo que acabamos de desarrollar. De la tabla 14.2 y de la figura 14.5 obser­
vamos que había diferencias entre las tres medias de muestra. Bajo la hipótesis nula
de que las medias de población de los tres grupos se suponen iguales, se obtuvo una
medida de la variación total (o STI) entre todos los trabajadores sumé!n?o las
diferencias al cuadrado entre cada observación y la media general, 22.7'1', basán­
donos en todas las observaciones. La variación total se subdividió entonces en dos
componentes separadas (véase figura 14.1 de la página 528), una parte consistente
en la variación e�tre los grupos y la otra en la variación dentro de los grupos.

536 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


¿Por qué existe variación entre los valores? es decir, ¿por qué las observaciones no
son iguales? Una razón es que al tratar a las personas de manera diferente (en este caso
dándoles a utilizar máquinas diferentes) afectamos su productividad. Esto explicaría
parte de la razón por la cual los grupos tienen medias diferentes: cuanto más grande
sea el efecto del tratamiento, mayor será la variación que encontraremos en las
medias de los grupos. Pero existe otra razón para la variabilidad en los resultados: que
las personas son naturalmente variables, ya sea que los tratemos de la misma manera
o no. Así que, incluso dentro de un grupo particular en el que todos reciben el mismo
trato (es decir, la misma máquina) tendremos variabilidad. Debido a que se presenta
dentro de cada grupo, se le conoce como variación dentro de grupos (o SSW).
Las diferencias entre las medias de los grupos se conocen como variación entre
grupos (o SSA). Parte de la variación entre grupos, como lo observamos anterior­
mente, se debe al efecto de estar en grupos diferentes. Pero, incluso si no existiera un
efecto real por estar en grupos diferentes (es decir, la hipótesis nula es verdadera),
habrá posibilidad de diferencias entre las medias de los grupos. Esto es así debido a
que la variabilidad entre los trabajadores hará que las medias de muestra sean diferen­
tes simplemente porque tenemos muestras diferentes. Por consiguiente, si la hipóte­
sis nula es verdadera, entonces la variación entre grupos estimará la variabilidad de la
población, así como la variación dentro de los grupos. Pero si la hipótesis nula es falsa,
entonces la variación entre grupos será mayor. Este hecho forma la base de la prueba
F ANOVA de una dirección de las diferencias en las medias de los grupos.
Revisemos lo que acabamos de lograr. De nuevo, de la tabla 14.2, y la figura 14.5
en la página 533, observamos que existen diferencias entre las tres medias de mues­
tra. Utilizando la prueba F ANOVA de una dirección, el gerente de producción
encuentra evidencia suficiente para llegar a la conclusión de que existe un efecto de
tratamiento significativo en los niveles (o grupos) del factor de interés, las marcas de
las máquinas. Esto es, existe evidencia de que las medias de población difieren res­
pecto al tiempo requerido para llevar a cabo el proceso de llenado.
Sin embargo, lo que todavía no sabemos es qué máquina o máquinas difieren
de las otras. Todo lo que sabemos es que existe evidencia suficiente para establecer
que las medias de población no son todas iguales; es decir, al menos una o alguna
combinación de eUas es significativamente diferente. Para determinar exactamente
qué máquina o máquinas son diferentes, realizaremos todas las comparaciones de
pares posibles entre las máquinas, y utilizaremos un procedimiento desarrollado
por John Tukey (y modificado posteriormente, de manera independiente, por Tukey
y C. Y. Kramer, para situaciones en las que los tamaños de muestra son diferentes)
para llegar a nuestras conclusiones. (Véanse referencias 6, 7 y 14.)

14.4.5 Comparaciones múltiples: el procedimiento


de Tukey Kramer
En el estudio de productividad analizado hasta este momento en el presente capí­
tulo, el análisis de varianza se utiliza para determinar si existe una diferencia entre
varios grupos respecto al tiempo promedio para llevar a cabo una tarea. Ya que se
han encontrado las diferencias en las medias de los grupos, es importante que
determinemos qué grupos en particular son diferentes.
A pesar de que se tienen a disposición muchos procedimientos (véanse referen­
cias 6 y 9), enfocaremos nuestra atención en el procedimiento de Tukey-Kramer,
con el fin de determinar cuáles de las e medias son significativamente diferentes de
las otras. Este método es un ejemplo de un procedimiento de comparación post hoc
(o a posteriori), pues las hipótesis de interés son formuladas después de que los
datos han sido inspeccionados.
El procedimiento de Tukey-Kramer nos permite examinar simultáneamente
comparaciones entre todo�los pares de grupos. El primer paso implicado consiste
en calcular las diferencias X¡ - X)' (con j * j') entre los c(c - 1)/2 pares de medias. El
alcance crítico para el procedimiento de Tukey-Kramer se obtiene entonces de
la cantidad dada en la ecuación (14.6) de la página 538.

Prueba F ANOVA de una dirección para diferencias en c medias 537


,. MSW 1 1
al Canee CfltlCO = Q U(c,n-c) -- ( - + -. - ) (14.6)
2 n¡ ni'

Si los tamaños de muestra difieren, se calcularía un alcance crítico para cada com­
paración por pareja de las medias de muestra. El paso final consiste en comparar
cada uno de los c(c - 1)/2 pares de medias respecto a su correspondiente alcance
crítico. Un par específico sería declarado significativamente diferente, si la diferen­
cia absoluta en las medias de muestra IX¡ - Xr I es mayor que el alcance crítico.
Para aplicar el procedimiento de Tukey-Kramer, regresemos al estudio sobre
productividad. Utilizando el procedimiento ANOVA, llegamos a la ·conclusión de
que había una diferencia en el tiempo promedio necesario para terminar una tarea
con el uso de tres máquinas diferentes. Puesto que existen tres grupos, hay
(3)(3 - 1)/2 = 3 posibles comparaciones de pareja que se tienen que tomar en cuenta.
De la tabla 14.2 de la página 533 las diferencias medias absolutas son
1. l ..\\ - x 21 = 124.93 - 22.611 = 2.32.
2. lx 1 - x 31 = 124.93 - 20.591 = 4.34.
3. lx 2 -x 31 = 122.61 - 20.591 = 2.02.
En este caso, solamente se necesita obtener un alcance crítico porque los tres gru­
pos tienen muestras del mismo tamaño. Para determinar el alcance crítico, de la
tabla 14.4 de la página 536, tenemos MSW = 0.9211 y n¡ = 5. De la tabla E.12, para
a= O.OS, e= 3 y n - e= 15 - 3 = 12, el valor crítico de extremo superior de Ouc3,12)
es 3.77 (véase la tabla 1 4.5). De la ecuación (14.6), tenemos

)0· i)
9 11
alcance crítico= 3.77 { �
1 \ +
= 1.6 1 8

Puesto que 2.32 > 1.618, 4.34 > 1 .618 y 2.02 > 1.618, podemos concluir que ésta es
una diferencia importante entre cada par de medias. De aquí que la producción
representó utilidades para la máquina III, porque el tiempo promedio para com­
pletar la tarea fue el más breve.

Tabla 14.S Obtención de la estadística Q de alcance estudehtizado para a= .05, con 3 y 12 grados de libertad.
Grados de Grados de libertad del numerador
libertad del
denominador 2 4 5 6 7 8 9 10 11 12 13 14 15 16
1 18.0 32.8 37.1 40.4 43.1 45.4 47.4 49.1 50.6 52.0 53.2 54.3 55.4 56.3
2 6.09 9.8 10 9 11.7 12.4 13.0 13.5 14.0 14.4 14.7 15.l 15.4 15.7 15.9
3 4.50 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.52 10.69

11 3.11 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.81 5.90 5.99 6.06
3.08) 4.20 4.51 4.75 4.95 5.12 5.27 5.40 5.51 5.62 5.71 5.80 5.88 5.95
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32 5.43 5.53 5.63 5.71 5.79 5.86
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13 5.25 5.36 5.46 5.55 5.64 5.72 5.79
Fuente: Tomada de la tabla E.12.

ne Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos


14.4.6 Premisas ANOVA
En nuestro estudio de productividad parece que el análisis está completo. ¿Es cierto?
Además de nuestras investigaciones exploratorias de la figura 14.5 de la página 533,
todavía no hemos evaluado completamente las premisas que subyacen en la prueba F
de una dirección. ¿Cómo puede el gerente de producción saber si la prueba F de una
dirección fue el procedimiento adecuado para analizar sus datos experimentales?
En los capítulos 12 y 13 mencionamos las premisas hechas en la aplicación de cada
procedimiento de prueba de hipótesis y las consecuencias a las violaciones de tales
premisas. Para emplear la prueba F ANOVA de una dirección, también debemos hacer
ciertas premisas respecto a los datos que se están investigando. En el análisis de varianza
se tienen tres suposiciones principales:
l. Aleatoriedad e independencia de errores.
2. Normalidad.
3. Homogeneidad de varianzas.
La primera premisa, aleatoriedad e independencia de errores, debe
cumplirse para todos los procedimientos analizados en el presente capítulo, no sola­
mente para aquellos que tratan con ANOVA, pues la validez de un experimento
depende del muestreo aleatorio y/o del proceso de aleatorización. Para evitar ten­
dencias en los resultados, es esencial que se considere que los datos sean obtenidos de
manera aleatoria e independiente de las e poblaciones, o que los elementos o sujetos
sean asignados aleatoriamente a los e niveles del factor de interés (es decir, los grupos
de tratamiento). Por consiguiente, la premisa de aleatoriedad e independencia no
sólo se refiere a errores fortuitos, sino también a la diferencia de cada valor observado
respecto a la media de su propio grupo. La premisa es que tales diferencias deben ser
independientes de cada valor observado. Esto es, la diferencia (o error) de una obser­
vación no debería estar relacionada con la diferencia (o error) de cualquier otra
observación. Esta premisa podría ser violada, por ejemplo, en nuestro estudio de pro­
ductividad, si uno de los trabajadores ayuda a otro a terminar el proceso de llenado.
La premisa se violaría también si dos de los trabajadores de un grupo fueran gemelos
idénticos: es probable que su comportamiento sea más parecido entre sí que el com­
portamiento de cualesquiera otros dos individuos del estudio. Más a menudo, sin
embargo, esta premisa es violada cuando los datos son recabados en un cierto perio­
do, pues las observaciones hechas en puntos adyacentes del tiempo pueden ser más
parecidas que las que se hicieron en tiempos muy diferentes. Por ejemplo, considere
la temperatura registrada diariamente durante un mes. Es más probable que la tem­
peratura de un día esté más cercana a la del día anterior, pero es menos probable que
esté cercana a la temperatura registrada varias semanas después.
De nuevo, las desviaciones de esta premisa pueden afectar seriamente las
inferencias del análisis de varianza. Estos problemas son analizados con más
detalle en las referencias 1 y 6.
La segunda premisa, sobre normalidad, establece que los valores de cada
grupo están distribuidos de manera normal. Al igual que en el caso de la prueba t,
la prueba FANO VA de una dirección es bastante robusta respecto a las desviaciones
de la distribución normal; esto es, siempre y cuando las distribuciones no sean
extremadamente diferentes de una distribución normal, el nivel de significación
de la prueba de análisis de varianza, por lo general, no se ve muy afectado por la
falta de normalidad, particularmente en muestras grandes.
Sólo cuando, la premisa de normalidad es violada seriamente, se tienen dispo­
nibles alternativas libres de distribución a la prueba F ANOVA de una dirección
(véase sección 14.5). La tercera premisa, homogeneidad de varianzas, establece
que la varianza dentro de cada población debería ser igual para todas las pobla­
ciones (esto es, ay = a1 = . . . = cr¡). Esta suposición es necesaria con el fin de com­
binar o agrupar las varianzas en una sola fuente de variación dentro de grupos,

Prueba F ANOVA de una dirección para diferencias en e medias S39


SSW. Si se tienen tamaños de muestra iguales en cada grupo, las inferencias basadas
en la distribución F tal vez no son afectadas seriamente por varianzas desiguales.
Sin embargo, si existen tamaños de muestra desiguales en grupos diferentes, las va­
rianzas distintas de un grupo a otro pueden tener serios efectos en las inferencias
obtenidas del análisis de varianza. Así pues, desde la perspectiva de la sencillez
computacional, la robustez y la potencia, debería haber tamaños de muestra iguales
en todos los grupos, siempre que sea posible.
Cuando solamente se viola la premisa de homogeneidad de las varianzas, se
tienen disponibles procedimientos parecidos a los utilizados en la prueba t' de va­
rianzas separadas de la sección 13.4 (véase referencia 1). Sin embargo, si se violan
las premisa de normalidad y de homogeneidad de varianzas, se puede utilizar una
transformación de datos apropiada que normalizará los datos y reducirá las diferen­
cias en las varianzas (véanse referencias 1 y 11) o, de manera alternativa, se puede
emplear un procedimiento no paramétrico más general (véanse referencias 2 y 3).

14.4. 7 Prueba Fmáx de Hartley para la homogeneidad


de varianzas
A pesar de que la prueba F ANOVA de una dirección es relativamente robusta
respecto a la premisa de varianzas de grupo iguales, grandes desviaciones de esta
suposición pueden afectar seriamente el nivel y la potencia de la prueba. Por con­
siguiente, se han desarrollado varios procedimientos para probar de manera más
formal la suposición de homogeneidad de varianzas. Tal vez el más simple y el
mejor conocido sea el procedimiento Fmáx de Hartley (véase referencia 1). Para pro­
bar la hipótesis nula de igualdad de las e varianzas de población

compare con la alternativa

H1 : No todas las cr f son iguales (j = 1, 2, ... , e)

obtenemos la siguiente estadística de prueba Fmáx de la distribución Fmáx de Hartley


con e y (ñ - 1) grados de libertad:

(14.7)
F,.a,

donde S,!áx = muestra de varianza mayor


S,;1. = muestra de varianza menor
'
Iin¡
ñ = � = !2. (sólo se utiliza la porción entera de este valor)
e e
Usando un nivel de significación, a, la hipótesis nula de la igualdad de varian­
zas de grupo será rechi;tzada solamente cuando la estadística Fmáx calculada sea
mayor que el valor crítico de extremo superior de la distribución Fmáx de Hartley,
basada en e y (ñ - 1) grados de libertad (véase tabla E.8, de la cual la tabla 14.6 es
una réplica). Esto es,

S40 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos


r Rechazar Ha si Fmáx > Fm áx [(e, (ñ-1)];
en cualquier otro caso no rechazar H0.

Con el propósito de ilustrar el procedimiento Fmáx de Hartley, regresemos a los


datos correspondientes a estudio de productividad, que se presentan en la tabla
14.2 de la página 533. Utilizando la ecuación (4.6) de la página 120, podemos
calcular las varianzas de muestra de los tres grupos de la manera siguiente:

s1 = 1.06s, s� = .778, si= .921

Puesto que cada grupo contiene una muestra de tamaño 5, n = (5 + 5 + 5)/3 = 5 y,


al probar la hipótesis nula

contra la hipótesis alternativa


f
H1: No todas las cr �on iguales (j = 1, 2, 3)

la estadística Fmáx se calcula a partir de la ecuación (14.7) como

:: 1.065
:: 1.369
máx .778

Si se selecciona el nivel de significación de O.OS, la regla de decisión sería re­


chazar Ho si Fmáx > Fmáx[J, 4] = 15.5 (véase tabla 14.6). En nuestro estudio sobre pro­
ductividad, como Fmax= 1.369 < Fmax [J, 4] = 15.5, no rechazaríamos H0 y llegaríamos
a la conclusión de que no existe evidencia de una diferencia en las varianzas de los
tres grupos.
Aunque la prueba Fmáx es sencilla de utilizar, desafortunadamente no es robusta.
Es en extremo sensible a desviaciones de la normalidad en los datos. Así pues, en
situaciones en donde somos incapaces de suponer la normalidad de cada grupo
deberían aplicarse otros procedimientos alternativos (veánse referencias 2 y 3).

Tabla 14,6 Obtención del valor crítico de Fmóx con 3 y 4 grados de libertad, al
nivel de significación de .OS.

Puntos 5% superior (a= .05)


n -1 \C 2 3 4 5 6 7 8 9
2 39.0 87 5 142 202 266 333 403 475
3 15.4 27':la 39.2 50.7 62.0 72.9 83.5 93.9
4 9.60 ) 15.5 20.6 25.2 29.5 33.6 37.5 41.1
5 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7
6 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5
Ff!ente: Tomada de la tabla E.8.

Problemas de la sección 14.4


Q 14.1 Explique la diferencia entre la varianza entre grupos MSA y la varianza dentro
de grupos MSW.

Prueba F ANOVA de una dirección para diferencias en e medias 541


Q 14.2 ¿De qué manera difiere la prueba FA OVA de una dirección de la prueba de
las diferencias de dos varianzas de la sección 13.6?
Q 14.3 Compare y contraste las premisas de la prueba F ANOVA de una dirección con
las suposiciones de la prueba t para la diferencia entre las medias de dos pobla­
ciones. Discuta ampliamente su respuesta.
Q 14.4 Explique cómo los métodos gráficos de los capítulos 3 y 4 podrían ser utiliza­
dos para evaluar la validez de las premisas del an_álisis de varianza.
e 14.5 El gerente de personal de una compañía de seguros grande desea evaluar la
efectividad de cuatro programas de entrenamiento de ventas diseñados para
los nuevos empleados. Un grupo de 32 graduados universitarios contratados
recientemente fueron asignados aleatoriamente a los cuatro programas, de
modo que se tenían ocho sujetos en cada programa. Al final del periodo de
entrenamiento de un mes, se les aplicó a los 32 sujetos un examen estándar;
los resultados se presentan a continuación:

Programas
A B e D
66 72 61 63
74 51 60 61
82 59 57 76
75 62 60 84
73 74 81 58
97 64 SS 65
87 78 70 69
78 63 71 80

(a) Construya una gráfica o un diagrama apropiado de los datos.


(b) Describa cualquier tendencia o relación que pueda ser evidente dentro de
los grupos o entre ellos.
(c) ¿La variación dentro de los grupos parece ser similar para todos los gru­
pos? Explique su respuesta.
(d) Al nivel de significación a= .05, utilice la prueba Fmáx de Hartley para pro­
bar la premisa de homogeneidad de las varianzas.
(e) Basándose en los resultados obtenidos en el inciso (d), ¿puede continuar
con la aplicación de una prueba F ANOVA de una dirección para las
diferencias en las medias de población o es necesario llevar a cabo una
transformación de datos? Explique su respuesta.
(f) Si las condiciones son apropiadas, en el nivel de significación a= .05,
utilice la prueba F de una dirección para determinar si existe evidencia de
una diferencia en los cuatro programas de entrenamiento en ventas.
(g) Basándose en los resultados obtenidos en el inciso (f), si es adecuado, utili­
ce el procedimiento de Tukey-Kramer para hacer todas las comparaciones
por pares de los programas de entrenamiento. (Utilice un nivel general de
significación de O.OS.)
(h) t-t;iM•ti•� Prepare un resumen ejecutivo que el gerente de personal
pueda enviar al vicepresidente de operaciones de su compañía.
14.6 Un investigador médico decidió comparar varios medicamentos para dormir
que se venden sin presentar receta. Algunas personas que tienen problemas
para dormir acudieron al laboratorio de sueños del investigador y fueron asig­
nados de manera aleatoria para tomar un medicamento inocuo (una píldora
sin ingredientes activos), o las píldoras para dormir Noche Oscura, Duerma
Bien y Mr. Sandman. El número de horas que cada sujeto durmió están dadas
en la tabla siguiente:

S42 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Inocuo: 2, 4, 3, 5, 2, 4, 3
Noche obscura: 3, 4, 5, 3, 5, 4, 6, 5
Dormite: 6, 5, 7, 4, 8, 6
Mr. Sandman: 5, 4, 7, 5, 8, 6, 7

· (a) Construya una gráfica o un diagrama apropiado de los datos.


(b) Describa cualquier tendencia o relación que pueda ser evidente dentro de
los grupos o entre ellos.
(c) ¿La variación dentro de los grupos parece ser similar para todos los
grupos? Explique su respuesta.
(d) Al nivel de significación a= .OS, utilice la prueba Fmax de Hartley para
probar la premisa de homogeneidad de las varianzas.
(e) Basándose en los resultados obtenidos en el inciso (d), ¿puede continuar
con la aplicación de una prueba F ANOVA de una dirección para las
diferencias en las medias de población o es necesario llevar a cabo una
transformación de datos? Explique su respuesta.
(f) Si las condiciones son apropiadas, al nivel de significación a= .OS, utilice
la prueba F de una dirección para determinar si existe evidencia de una
diferencia entre los medicamentos para dormir.
(g) Basándose en los resultados obtenidos en el inciso (f), si es adecuado,
utilice el procedimiento de Tukey-Kramer para hacer todas las
comparaciones por pares de los medicamentos. (Utilice un nivel general
de significación de O.OS.)
(h) Comente sobre la precisión de las mediciones hechas en este
experimento.
(i) t·i.Jd?i•i·l•P Escriba un borrador de un artículo que el investigador médico
pueda enviar al editor de la columna de salud de su periódico local.
14.7 Suponga que el superintendente asistente para asuntos curriculares desea eva­
luar tres conjuntos alternativos de materiales de matemáticas, de modo que un
conjunto pueda ser elegido para que el distrito escolar entero lo adquiera. Una
maestra de tercer grado del distrito se ofreció como voluntario para realizar la
comparación. Los 24 estudiantes de su clase tienen habilidades académicas
homogéneas; se les va a dividir aleatoriamente en tres grupos, con 7, 9 y 8
estudiantes cada uno. Al primer grupo se le asigna el conjunto I, al segundo
grupo se le asigna el conjunto II y al tercero el conjunto III.
Al final del año los 24 estudiantes son sometidos al mismo examen de
matemáticas. Los resultados, en una escala de cero a cien (bajo-alto) se mues­
tran a continuación:

Conjunto de materiales
II III
87 58 81
80 63 62
74 64 70
82 75 64
74 70 70
81 73 72
97 80 92
62 63
71

Prueba F ANOVA de una dirección para diferencias en e medias 543


Basándose en estos resultados, al superintendente asistente le gustaría saber
si existe alguna diferencia entre los conjuntos respecto a los resultados logrados
y, si es así, qué conjunto o conjuntos es superior o superiores a los otros.
(a) Analice completamente los datos. (Utilice a= .05.)
(b) p.f¡¡¡¡q,,,,j,p Escriba un informe que la maestra de tercer año pueda enviar
al superintendente asistente.
e 14.8 Un ingeniero metalúrgico probó en cinco diferentes aleaciones la resistencia
tensil. Probó varias muestras de cada aleación; la resistencia tensil de cada una
fue

Aleación 1: 12.4, 19.8, 15.2, 14.8, 18.5


Aleación 2: 8.9, 11.6, 10.0, 10.3
Aleación 3: 10.5, 13.8, 12.1, 11.9,12.6
Aleación 4: 12.8, 14.2, 15.9, 14.1
Aleación 5: 16.4, 15.9, 17.8, 20.3

Al ingeniero le gustaría saber si existe evidencia de una diferencia en la


resistencia tensil de las diferentes aleaciones y, si esto es así, qué aleaciones son
significativamente más resistentes que las otras.
(a) Analice completamente los datos. (Utilice el nivel a= .05.)
(b) t,t;m,,,,j,p Describa los resultados al ingeniero metalurgista en un
memorándum.
14.9 Un profesor de estadística desea estudiar cuatro diferentes estrategias para
jugar el juego de cartas Blackjack (Veintiuno). Las cuatro estrategias son:

l. Estrategia del líder.


2. Estrategia de cuenta cinco.
3. Estrategia de cuenta diez básica.
4. Estrategia de cuenta diez avanzada.
Se utilizó una calculadora que puede jugar Veintiuno y los datos de las cinco
sesiones de cada estrategia se registraron. Las ganancias (o pérdidas) de cada
sesión fueron:

Estrategia
Cuenta diez Cuenta diez
Repartidor Cuenta cinco básica avanzada
- $56 - $26 + $16 + $60
- $78 - $12 + $20 + $40
- $20 + $18 - $14 - $16
- $46 -$8 + $ 6 + $12
- $60 - $16 - $25 +$ 4

El profesor desea saber si existe evidencia de una diferencia entre las cuatro
estrategias y, si esto es así, qué estrategias son superiores respecto a su rentabi­
lidad potencial.
(a) Analice completamente los datos. (Utilice el nivel a= .01.)
(b) p.y¡¡fü¡.,.¡,p Escriba una carta al profesor en la que explique sus hallazgos.

Problemas intercapítulo de la sección 14.4


14.10 En el problema 13.11 de la página 472, usted utilizó una prueba tpara comparar
los gastos escolares en las escuelas preparatorias en el noreste y en el medio oeste
estadounidense. (Los datos se tomaron del problema 4.80 de la página 163.)

S44 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


(a) Efectúe una prueba F ANOVA sobre este conjunto de datos. (Utilice el
nivel a = .01.)
(b) Eleve al cuadrado el valor de t calculado en el problema 13.11; observe
que este valor es el mismo (excepto por errores de redondeo) que el valor
F. Exprese con sus propias palabras la relación entre t y F.
14.11 En el problema 13.12 de la página 472, usted utilizó una prueba t para comparar el
costo de los champues destinados a cabello fino respecto a los destinados a cabello
normal. (Los datos son tomados del problema 3.9 de la página 62.)
(a) Efectúe una prueba F ANOVA sobre este conjunto de datos. (Utilice el
nivel a= 0.05.)
(b) Eleve al cuadrado el valor de tcalculado en el problema 13.12; observe
que este valor es el mismo (excepto por errores de redondeo) que el valor
F. Exprese con sus palabras la relación entre t y F.

1 e 81 Prueba de rangos de Kruskal-Wallis para


diferencias en e medianas

14.5.1 lntrQducción
La prueba de rangos de Kruskal-Wallis para la diferencias en e medianas (en
la que e> 2) puede ser considerada como una extensión de la suma de rangos de
Wilcoxon para dos muestras independientes analizadas en la sección 13.5. Así pues
la prueba de Kruskal-Wallis posee las mismas propiedades de potencia con relación
a la prueba FANO VA de una dirección que la prueba de suma de rangos de Wilcoxon
respecto a la prueba t para dos variables independientes (sección 13.3). Esto significa
que, el procedimiento de Kruskal-Wallis ha resultado ser casi tan poderoso que la
prueba F en condiciones apropiadas a esta última, e incluso más poderoso que el
procedimiento clásico cuando sus premisas (véase sección 14.4.6) son violadas.

14.5.2 Desarrollo
La prueba de rangos de Kruskal-Wallis se utiliza más a menudo para probar e gru­
pos de muestra independientes que han sido tomados de poblaciones que poseen
medianas iguales.Esto es, podemos probar

Ho: M1 = Mz = ... = Me
contra la hipótesis alternativa
H1: No todas las M¡ son iguales ( donde j = 1, 2, ... , e).

Para tales situaciones es necesario suponer que


l. Las e muestras son tomadas de manera aleatoria e independiente de
sus respectivas poblaciones.
2. El fenómeno aleatorio subyacente de interés es continuo (para evitar
empates).
3. Los datos observados constituyen al menos una escala ordinal de
medición, tanto dentro de las e muestras como entre éstas.
4. Las e poblaciones tienen la misma variabilidad.
5. Las e poblaciones tienen la misma forma.

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 545


Resulta interesante observar que el procedimiento de Kruskal-Wallis aún tiene
menos premisas limitantes que la prueba F. Para emplear el procedimiento, las
mediciones sólo necesitan ser ordinales en todos los grupos de muestra, y las dis­
tribuciones de población comunes solamente necesitan ser continuas: sus formas
comunes son irrelevantes. Por otro lado, para utilizar la prueba F clásica, el nivel
de medición debe ser más sofisticado, y debemos suponer que las e muestras
vienen de poblaciones normales con igual varianza.
Para llevar a cabo la prueba de rangos de Kruskal-Wallis primero debemos (si
es necesario) sustituir las observaciones de las e muestras con sus rangos combina­
dos de tal modo que el rango 1 sea asignado a la menor de las observaciones com­
binadas y el rango na la mayor de las observaciones combinadas (donde n = n1 +
n2 + ... + ne)- Si cualesquiera valores están empatados, se les asigna el promedio de
los rangos que tendrían asignados si no se hubieran presentado empates en los
datos.
La estadística de prueba H de Kruskal-Wallis puede calcularse con

H = [
12
I-' - 3(n + 1)
e
n(n + 1) ; = 1 n¡
T
2
l (14.8)

en la que
n es el número total de observaciones sobre las muestras combinadas, es
decir, n = n1 + n2 + ... + ne
n¡ es el número de observaciones de la j-ésima muestra; j = 1, 2, ..., e
T¡ es la suma de los rangos asignados a la j-ésima muestra
T¡2 es el cuadrado de la suma de los rangos asignados a la j-ésima muestra
A medida que los tamaños de muestra de cada grupo se hacen grandes (mayo­
res que cinco), la estadística de prueba H puede ser aproximada por la distribución
chi-cuadrada con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de
significación a, la regla de decisión sería rechazar la hipótesis nula si el valor calcu­
lado de Hes mayor que el valor crítico, X2, y no rechazar la hipótesis nula si Hes
menor o igual que el valor críticoX2 (véase figura 14.7). Es decir de extremo supe­
rior (véase figura 14.7). Esto es
Rechace H0 si H > X u(e-l);
En cualquier otro caso no rechace H0

Los valores críticos X2 se especifican en la tabla E.4.

o xtc-1)
Figura 14.7
Determinación de la región de
rechazo.

546 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


14.S.3 Aplicación
Para ilustrar la prueba de rangos de Kruskal-Wallis en cuanto a la diferencia de e
medianas, regresemos a nuestro estudio de productividad de la sección anterior.
Podemos recordar que el gerente de producción de la planta donde se empaca
cereal en cajas con un contenido de 368 gramos ha estado considerando la susti­
tución de una máquina vieja que afecta directamente los resultados del proceso de
producción, y ha efectuado un experimento para determinar si existe alguna dife­
rencia significativa entre los tres tipos de máquina respecto al tiempo promedio
(en segundos) que les lleva a los trabajadores de la fábrica efectuar completamente
el proceso de llenado con ellas. Quince obreros de experiencia, habilidad y edad
parecidas fueron asignados aleatoriamente a fin de recibir entrenamiento para operar
uno de los tres tipos de máquina, de tal modo que se tienen cinco trabajadores para
cada tipo de máquina. Después de un tiempo adecuado de entrenamiento y práctica,
el gerente de producción midió el tiempo (en segundos) que les lleva a los trabaja­
dores entrenados terminar el proceso de llenado utilizando su equipo respectivo. Los
resultados de este experimento se presentan en la tabla 14.2 de la página 533, junto
con algunos cálculos sumarios y una gráfica de dispersión que se muestra en la
figura 14.5 de la página 533, de modo que se puede hacer una evaluación visual y
exploratoria de las tendencias potenciales, relaciones y violaciones de las suposi­
ciones de los procedimientos de prueba particulares. Si el gerente de producción
no desea hacer la suposición de que las mediciones de tiempo (en segundos) están
distribuidas de manera normal en las poblaciones subyacentes, se puede utilizar el
procedimiento libre de distribución conocido como prueba de rangos de Kruskal­
Wallis para las diferencias en las tres medianas de población.
La hipótesis nula que se va a probar es que las medianas de los tiempos nece­
sarios para llevar a cabo el proceso de llenado con las tres máquinas son iguales.
Así pues, sustituyendo 1, 2 y 3 en lugar de I, II y III, tenemos:
Ho: M1 = Mz = M3
H1 : No todas las medianas son iguales

Al convertir las quince mediciones de tiempo de la tabla 14.2 (página 533) a


rangos, obtenemos la tabla 14. 7.

Tabla 1 4. 7 Conversión de
datos a rangos.

Máquina
II III
14 9 2
15 6 7
12 10 1
11 8 4
13 5 3
Fuente: Datos tomados de la tabla 14.2
de la página 533.

Observamos que en proceso de asignación de rangos de manera combinada, el ter­


cer empleado asignado a la máquina III llevó a cabo el proceso de llenado con
mayor rapidez y recibió un rango de l. El primer empleado asignado a la máquina
III fue el siguiente más rápido y recibió un rango de 2. El segundo trabajador asig­
nado a la máquina I terminó el proceso de llenado en el mayor tiempo y recibió
un rango de 15.

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 547


Después de que los rangos fueron asignados, entonces obtenemos la suma de
los rangos de cada grupo:
Suma de rangos: T1 = 65 T2 = 38 T3 = 17

Como una verificación de la asignación correcta de los rangos tenemos

(l 5)(l6)
65 + 38 + 17 =
2
120 = 120
Si escogemos un nivel de significación de O.OS, para probar la hipótesis nula de
iguales medianas de población utilizamos la ecuación (14.8):

H =[ 12 :tTf ]- 3(n + 1)
n(n + 1) ; = 1 n¡

12 (65)2 + (38)2 + (17)2


= { [ ]}- 3(16)
(15)(16) 5 5 5

= (J¿_)[1, 191.6) - 48
240
= 59.58 - 48 = 11.58

Utilizando la tabla E.4, el valor crítico x2 de extremo superior, con e - 1 = 2 grados


de libertad, y correspondiente a un nivel de significación de .OS es de 5.991 (véase
tabla 14.8, que es una réplica de la tabla E.4). Puesto que el valor calculado de la
estadística de prueba Hes mayor que el valor crítico, podemos rechazar la hipóte­
sis nula y llegar a la conclusión de que no todas las máquinas se comportaron igual
respecto a la mediana del tiempo requerido para que un trabajador lleve a cabo el
proceso de llenado. (Esto es, si la hipótesis nula fuera realmente verdadera, la
probabilidad de obtener tal resultado o incluso uno más extremoso, es menor a
.05.)
Podemos observar que éstos son los mismos resultados que obtuvimos uti­
lizando la prueba F ANOVA de una dirección en la sección 14.4.

x
Tabla 14.8 Obtención del valor crítico aproximado 2 para la prueba de Kruskal-Wallis, al nivel de significación
de .OS con dos grados de libertad.

Grados Área de extremo superior


de
libertad .995 .99 .975 .95 .90 .75 .25 .10 .os1
.025
1 0.001 0.004 0.016 0.102 1.323 2.706 3.841 5.024
2 0.010 0.020 0.051 0.103 0.211 0.575 2.773 4.605 ::, 5.991 7.378
3 0.072 0.115 0.216 0.352 0.584 1.213 4.108 6.251 7.815 9.348
4 0.207 0.297 0.484 0.711 1.064 1.923 5.385 7.779 9.488 11.143
5 0.412 0.554 0.831 1.145 1.610 2.675 6.626 9.236 11.071 12.833
Fuente: Tomada de la tabla E.4.

S48 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


14.5.4 Comparaciones múltiples: procedimiento de Dunn
Puesto que rechazamos la hipótesis nula y llegamos a la conclusión de que hay evi­
dencia de una diferencia significativa entre el desempeñ.o de las máquinas con
respecto a la mediana del tiempo que le lleva a un trabajador efectuar el proceso
de llenado, el siguiente paso sería realizar una comparación simultánea de todos
los pares posibles de máquinas para determinar cuál o cuáles difieren de los otros.
Como continuación de la prueba de rangos de Kruskal-Wallis, presentaremos un
procedimiento de comparaciones múltiples post hoc o a posteriori, desarrollado por
O. J. Dunn (véanse referencias 3 y 4).
En general, con e grupos o niveles de un factor de interés, existen c(c - 1)/2
posibles comparaciones por pares a efectuar.El primer paso consiste en obtener el
rango promedio, R¡, para cada uno de los j grupos (en donde j = 1, ..., e). Podemos
recordar, de la ecuación (14.8), que cuando calculamos la estadística de prueba H,
obtuvimos !l rango total, T¡, para cada grupo. Así pues, para calcular el rango
promedio, R ¡, para elj-ésimo grupo, tenemos

- T.
R¡ = � (dondej= 1, . .. , e)
n;
Entonces calculamos las diferencias R¡ - R¡ ', (en la que j -:t- j') entre todos los
c(c - 1)/2 pares de rangos promedio. El alcance crítico para el procedimiento de
Dunn se obtiene de

n( n + 1) 1 1
alcance crítico= Z u (- + -) (14.9)
12 n¡ ni '

donde n es el número total de observaciones de todos los grupos combinados, n¡ y


n¡, son, respectivamente, el número de observaciones en los grupos j y j', y, para un
nivel seleccionado de significación a general, Z u es el valor crítico de una dis­
tribución normal estandarizada (tabla E.2) que contiene un área de a/[c(c - 1)] en
el extremo superior.3
Si los tamaños de muestra son diferentes, debe calcularse el alcance crítico para
cada comparación por pares.
El paso final consiste en comparar la diferencia en cada uno de los c(c - 1)/2·
pares de rangos promedio respecto al correspondiente alcance crítico obtenido con
la ecuación (14.9). Un par específico de grupos sería declarado significativamente
diferente si las diferencias absolutas de sus correspondientes rangos promedios
exceden al alcance crítico.
Para aplicar el procedimiento de Dunn a nuestro estudio de productividad,
primero obtenemos los rangos promedio de los tres grupos, a partir de los corres­
pondientes totales de rango obtenidos de la tabla 14.7 de la página 547:

R, = 13.ü R2 = 7.6 R 3 = 3.4


Existen (3)(3 - 1)/2 = 3 comparaciones por pares que se deben hacer, debido a que
hay tres máquinas. Las diferencias absolutas de los rangos promedio son

1. JR1 - R2 J = J13.ü - 7.6J = 5.4


2. IR1 - R3 J = J13.0 - 3.4J = 9.6
3. JR2 - R3 J = J7.6 - 3.4J = 4.2

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas 549


Figura 14.8
Obtención de los valores críticos,
Zu, para el área de extremo
superior, a, de 0.0083 utilizada en
el procedimiento de Dunn para
o +2.39 Zu
establecer el alcance crítico.

Puesto que cada uno de los tres grupos tienen el mismo tamaño de muestra, sola­
mente hay un alcance crítico que sería utilizado en todas las comparaciones posi­
bles. Escogiendo un nivel de significación general de O.OS, determinamos el
alcance crítico con la ecuación (14.9) obteniendo primero Z u = +2.39 (puesto que
el área del extremo superior bajo la curva es 0.05/6 o 0.0083, como se muestra en
la figura 14.8) de modo que

[J:._ l._)
n(n 1)
alcance crítico
12+ n¡ + n i '

= 2.39
(15)(16)
12 (.! .!J
5 + 5
= 6.76
Observamos que solamente la segunda comparación (es decir, 1 R 1 - R 3 I = l 13.0 -
3.4 I = 9.6) es mayor que el alcance crítico de 6. 76, así que el gerente de producción
llega a la conclusión de que la máquina III es significativamente más rápida que
la máquina I, pero no existe evidencia de una diferencia significativa entre las
máquinas I y II, así como entre las máquinas II y III. Podemos recordar que si el
gerente de producción hubiera utilizado el procedimiento paramétrico de Tukey­
Kramer, descrito en la sección 14.4.5, hubiera llegado a la conclusión de que exis­
ten diferencias significativas entre todos los pares de máquinas y, en consecuencia,
hubiera adquirido la máquina III debido a que el tiempo promedio para llevar a
cabo el proceso de llenado con tal equipo es el menor.
Debido a nuestros resultados incompatibles, el procedimiento de Tukey­
Kramer debería utilizarse después de efectuar una prueba F ANOVA de una direc­
ción, si la suposición de normalidad en las tres poblaciones subyacentes es viable.
Si no, debería emplearse el procedimiento de Dunn como el paso siguiente a la
prueba de rangos de Kruskal-Wallis.

Problemas de la sección 14.5


e 14.12 Un psicólogo industrial desea probar si los tiempos de reacción de los traba­
jadores de una línea de ensamblado son equivalentes en tres métodos de apren­
dizaje diferentes. De un grupo de 25 empleados nuevos, nueve son asignados
de manera aleatoria al método A, ocho al método B y ocho al método C. Los
datos que se presentan a continuación presenta la asignación de rangos, desde
1 (el más rápido) hasta 25 (el más lento), de los tiempos de reacción para llevar
a cabo una tarea asignada por el psicólogo después del periodo de aprendizaje.

S50 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos


Método
A B e
2 1 5
3 6 7
4 8 11
9 15 12
10 16 13
14 17 18
19 21 24
20 22 25
23

¿Existe evidencia de una diferencia en los tiempos de reacción para estos


métodos de aprendizaje? (Utilice el nivel a= .01.)
14.13 Un ingeniero en control de calidad de una compañía fabricante de equipos
electrónicos de audio se encuentra inspeccionando un nuevo tipo de batería
que tal vez pueda utilizar. Un lote de 20 baterías fue dividido aleatoriamente
en cuatro grupos (de modo que había cinco baterías en cada uno). Cada grupo
de baterías fue sometido a un nivel particular de presión: baja, normal, alta y
muy alta. Las baterías se probaron simultáneamente bajo estos niveles de pre­
sión y se registraron los tiempos de falla (en horas):

Presión
Baja Normal Alta Muy alta
8.0 7.6 6.0 5.1
8.1 8.2 6.3 5.6
9.2 9.8 7.1 5.9
9.4 10.9 7.7 6.7
11.7 12.3 8.9 7.8

El ingeniero de control de calidad, por experiencia, sabe que tales datos


provienen de poblaciones que no están distribuidas de manera normal, y desea·
utilizar un procedimiento libre de distribución para el análisis de los datos.
(a) Al nivel de significación de O.OS, analice completamente los datos para
determinar si existe evidencia de una diferencia en los cuatro niveles de
presión respecto a la mediana de la vida de las baterías y, si éste es el caso,
funcionamiento de las baterías
(b) f·tiiil')l•i·I·� Escriba un memorándum al ingeniero encargado de la calidad

v
14.14
en el que exprese sus hallazgos.
(c) Recomiende una póliza de garantía respecto a la vida útil de las baterías.
La ingeniero de control de calidad de una planta en donde se fabrican equipos
de sonido estéreo desea estudiar el efecto de la temperatura sobre el tiempo de
falla de un componente electrónico en particular. Para tal efecto, diseñó un
experimento en el cual 24 de estos componentes, todos tomados del mismo
lote, fueron asignados a uno de tres niveles de temperatura y luego fueron
activados de manera simultánea. A continuación presentamos los rangos
obtenidos para los tiempos de falla (es decir, se le dio el rango de 1 al primer
componente que falló).

Prueba de rangos de Kruskal-Wallis para diferencias en e medianas SS 1


Temperatura
lSO'F 200'F 250'F
4 2 1
7 8 3
10 11 5
13 12 6
18 17 9
21 19 14
22 20 15
24 23 16

(a) Al nivel de significación de O.OS, ¿existe evidencia de un efecto de la tem­


peratura sobre la vida útil de este tipo de componente electrónico?
(b) PNiiW.t-1•> Escriba un informe para la ingeniero de control de calidad,
basándose en sus hallazgos.
e 14.15 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi­
miento de Dunn para responder los incisos (f) y (g) del problema 14.5 (resulta­
dos de desempeño) de la página 542. (Utilice el nivel a= .05.) ¿Existe alguna
diferencia en sus resultados actuales de los obtenidos anteriormente? Analice
su respuesta.
14.16 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi­
miento de Dunn para responder el inciso (a) del problema 14.7 (resultados de
la prueba matemática) de la página 543. (Utilice el nivel a= .05.) ¿Existe
alguna diferencia en sus resultados actuales de los obtenidos previamente?
Analice su respuesta.
14.17 Utilice la prueba de rangos de Kruskal-Wallis y, si es adecuado, el procedi­
miento de Dunn para responder el inciso (a) del problema 14.9 (rentabilidad)
de la página 544. (Utilice el nivel a= .01.) ¿Existe alguna diferencia en sus
resultados actuales y los obtenidos anteriormente? Analice su respuesta.

Uso de la computadora para la prueba de hipótesis


con e muestras independientes: la encuesta de
satisfacción de los empleados de Industrias Kalosha

14.6.1 Introducción y resumen


Cuando tratamos con conjuntos grandes de datos, podemos utilizar la computadora
para ayudarnos no sólo en nuestro análisis de estadística descriptiva, sino también
en nuestro análisis confirmatorio. En la presente sección demostraremos cómo los pa­
quetes de software estadísticos pueden ser utilizados para efectuar varias pruebas de
hipótesis cuando analizamos diferencias en los resultados a través de diferentes gru­
pos de datos numéricos. Para llevar a efecto lo anterior, regresemos a la Encuesta de
satisfacción de los empleados de Industrias Kalosha, desarrollada en el capítulo 2.

14.6.l Encuesta de satisfacción de los empleados de


Industrias Kalosha
Bud Conley, vicepresidente de recursos humanos, se está preparando para otra
reunión más con un representante de la empresa B & L Corporation para analizar
los contenidos potenciales de un paquete de prestaciones para los empleados que
se ha estado desarrollando. Antes de la reunión, le gustaría obtener respuestas a las

5S2 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos


siguientes preguntas mediante un análisis confirmatorio basado en los resultados de
la encuesta de satisfacción de los empleados (véase tabla 2.3 de las páginas 33-40):
l. ¿Había evidencia de una diferencia en el número promedio de horas
de trabajo por semana (pregunta 1) basándose en el agrupamiento
ocupacional de todos los empleados de tiempo completo de Industrias
Kalosha (pregunta 2)?
2. ¿Había evidencia de una diferencia en la mediana de los ingresos per­
sonales de los empleados de tiempo completo de Industrias Kalosha
(pregunta 7) basándose en su nivel de participación en las decisiones
que afectan su trabajo (pregunta 21)?
Las respuestas a estas dos preguntas, así como a otras planteadas por Bud Conley
(véase el Proyecto Encuesta/Base de datos que se encuentra al final de la sección)
requieren un análisis descriptivo detallado de las 400 respuestas a la encuesta junto
con un análisis confirmatorio.

14.6. 3 Uso de paquetes estadísticos para la evaluación de


diferencias entre los e grupos
En respuesta a la primera pregunta de Bud Conley, referente a si existen diferencias
significativas en la cantidad de tiempo promedio (en horas) de trabajo a la semana,
basados en la agrupación laboral, se realizará un análisis descriptivo de modo que
se puedan evaluar las suposiciones de los procedimientos de prueba.
En la figura 14.9 se presenta el resultado obtenido con el programa EXCEL de
Microsoft (referencia 8) sobre algunas de las estadísticas sumarias pertenecientes a
una interrupción en el tiempo de trabajo por las agrupaciones laborales. Aunque
no se muestran, también se obtuvieron representaciones de tallo y hojas y gráficas
de caja y bigotes y de probabilidad normal, que nos indican que existe algo de
desviación de la normalidad por parte de las poblaciones subyacentes.

Occup N MEAN MEDIAN STDEV SEMEAN


workhre l=M 65 46.00 43.00 9.14 1.13
2=P 66 45.14 40.00 9.11 1.12
3=T S7 46.72 40.00 12.51 1.66
4=A 65 42.23 40.00 8.00 0.99
S=S 29 43.52 40.00 8.65 1.61
6=R 54 48.11 41.00 11.84 1.61
7=L 64 45.88 43.00 9.62 1.20

Figura 14.9
Resultado obtenido con el paquete Microsoft Excel para Windows, donde se muestran las
estadísticas sumarias.

Para probar la suposición de homogeneidad de varianzas, se calculó, a partir


de los resultados impresos en la figura 14.9, la estadística de prueba Fmáx de Hartley,
que representa el cociente de la varianza de población mayor entre la varianza de
población menor. Esta prueba debe utilizarse con precaución en este caso debido a
que es sensible a una violación de la suposición de normalidad subyacente. (En las
referencias 1-3 se presentan algunos procedimientos alternativos.) Utilizando un
nivel de significación de O.OS, puesto que

F.náx
(12.51) 2
=
(8.00) 2
= 2.45 > F. áx [7 57]
11 =
2.26 J

el valor crítico de extremo superior obtenido por interpolación de la tabla E.8, la


hipótesis nula de variaciones de población iguales, es rechazada.

Uso de paquetes estadísticos para la evaluación de diferencias entre los e grupos 553
r

Con el propósito de utilizar la prueba F ANOVA de una dirección, se debe encon­


trar una transformación adecuada que normalice los datos y estabilice las varianzas
entre los grupos. Después de utilizar una transformación de logaritmo natural sobre la
variable original (tiempo de trabajo en horas), en la figura 14.10 se muestra el resultado
obtenido con el paquete MINITAB (referencia 10) para la prueba FANOVA de una direc­
ción. Una verificación de la suposición de homogeneidad de varianzas nos indica que
la variabilidad de los datos transformados se ha estabilizado. Esto es, usando un nivel
de significación de O.OS, como

= 2.26,
2
- (0.2283)
Fmáx - = 1.97 < F, ,¡,11 [7,57]
(Ü.l629) 2
la hipótesis nula no puede ser rechazada y se puede llegar a la conclusión de que
no existe evidencia de una falta de homogeneidad de varianzas de los datos trans­
formados.
Con un nivel de significación de O.OS, podemos probar la hipótesis nula
respecto a la igualdad de las siete medias de población

contra la hipótesis alternativa


H1 : No todas lasµ¡ son iguales (j = 1, 2, ... , 7)

MI'B > let c36 = loge{c2)


Ml'B > oneway c36 by c3;
SUBC> tukey .

.ANALYSIS OF V�CE rn 1n (workhre)


SOURCE DF SS MS F p
Occup 6 o.5224 0.0871 2.22 0.041
ERROR 393 15.4160 0.0392
399 15.9383
INDIVIDUAL 9 5 PCT CI 'S FOR MEAN
BASED 0N POOLED STDEV
LEVEL N � STDEV -------+---------+---------+---------
l=M 65 3.8105 0.1890 (-------·-------)
2�P 66 3.7905 0.1955 {-------·-------)
3=T 57 3,8158 0.2283 (--------·--------)
4=A 65 3.7289 0.1629 (-------·--------)
5=S 29 3,7572 0.1746 (-----------·-----------)
6=R 54 3,8472 0.2249 (--------·--------)
7=L 64 3.8059 0,1990 (-------·-------)
-------+---·-····+---------+---------
I'OOLED STDEV"" 0.1981 3.720 3.780 3.840

Tukey's pairwise canparisons

Family error rate = 0.0500


Individual error rate"" 0.00338

Critical value = 4.17

Figura 1 4. 1 O
Resultado obtenido con MINITAB de la prueba F ANOVA de una dirección, después de una
transformación de datos de logaritmo natural.

SS4 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Del resultado obtenido con MINITAB, presentado en la figura 14.10, observamos que
la estadística de prueba F de una dirección, 2.22, es mayor que el valor crítico,
Fuc6,393) = 2.10 (tomado de la tabla E.5), de manera que la hipótesis nula puede ser
rechazada. Existe evidencia de una diferencia significativa entre las medias de los
datos transformados correspondientes al tiempo (en horas) de trabajo semanal de las
diferentes agrupaciones laborales. El valor p es de 0.041. Utilizando los resultados
que se presentan en la figura 14.10 y empleando el procedimiento de Tukey-Kramer,
se encuentra que la diferencia significativa en los datos transformados con logarit­
mos naturales, correspondientes al tiempo en horas de trabajo semanal, se presenta
entre el grupo de apoyo administrativo (A) y el grupo de producción y reparaciones
(R). Existe evidencia de que los empleados de apoyo administrativo trabajan signi­
ficativamente menos tiempo a la semana que los de producción y reparaciones.
Como respuesta a la segunda pregunta que se hace Bud Conley, acerca de si
existen diferencias significativas en la mediana del ingreso personal, basándose en
la participación de los empleados en las decisiones relacionadas con el trabajo, se
efectuará otro análisis descriptivo, de manera que puedan ser evaluadas las suposi­
ciones de los procedimientos de prueba.
En la figura 14.11 se presenta el resultado obtenido con STATISTIX (referencia
13), en el cual se ilustran las gráficas de caja y bigotes. Estas gráficas indican la exis­
tencia de un sesgo hacia la derecha en las poblaciones muestreadas. Aunque no se
exhiben, también se obtuvieron representaciones de tallo y hojas y gráficas de pro­
babilidad normal que confirmaron el sesgo hacia la derecha presente en las pobla­
ciones muestreadas.

Box and Whi.sker Plot


100 ······································································································································

*
o
70 ......................................................................................................................................

*
t
40 ............ ........... ........................ ............................... ............................... ...................

10

IDEaDE
400 cases

Figura 1 4. 1 1
Resultado obtenido con el paquete STATISTIX donde se muestran las gráficas de caja y sesgos
del ingreso personal, basándose en el nivel de participación percibido en las decisiones
relacionadas con el trabajo.

Para probar las posibles diferencias entre las cuatro medianas de población, se
utilizó el paquete SAS (referencia 12) para efectuar la prueba de rangos de Kruskal­
Wallis. En la figura 14.12 de la página 556 se presenta una parte de lo obtenido con
el paquete, en donde se ilustran los resultados de la prueba. Utilizando un nivel de
significación de O.OS, para probar la hipótesis nula de igualdad en la mediana del
ingreso personal para los cuatro niveles de participación en la toma de decisiones:

Uso de paquetes estadísticos para la evaluación de diferencias entre los c grupos SSS
H0 : M1 = M2 = M3 = M4
contra la hipótesis alternativa
H 1 : No todas las M¡ son iguales (donde j = 1, ... , 4)
observamos que la estadística de prueba H, 21.172, es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con tres grados de libertad (véase
tabla E.4). El valor p es de .0001. Por consiguiente, rechazamos la hipótesis nula y
podemos llegar a la conclusión de que existe evidencia de una diferencia entre las me­
dianas de los ingresos personales, basándonos en los niveles conocidos de participación
en la toma de decisiones relacionadas con el trabajo.

The SAS Sy&tea

NPARlWAY PROCEOORE
Wilcoxon seores (Rank Swas) for Variable RINCOKE
Classified by Variable !DECIDE

Su.a ot Expected Std oev Mean


!DECIDE N seores Under HO Under HO Seora
Figura 14. 1 2 ALWAYS 138 30483. 5000 27669. 0000 1099 .16981 220, 894928
Resultado parcial obtenido IIUCH 157 32817. 5000 31478.5000 1129. 08741 209. 028662
SOMETIHES 60 10789. 0000 12030.0000 825. 63802 179.816667
con SAS, en el que se ilustra NEVER 45 6110. 0000 9022. 5000 730. 62585 135. 777778
la prueba de rangos de Average Seores were used for Ties
Kruskal-Wallis para las Kruskal-Wallis Test (Chi-Square Approx.i.mation)
CHISQ= 21.172 DF• 3 Prob > CH.ISO-, O. 0001
diferencias en c medianas.

Del resultado mostrado en la figura 14.12, podemos continuar con la prueba de


Kruskal-Wallis si restamos los rangos promedio, obtenemos las diferencias absolutas
de todas las comparaciones por parejas de los grupos y calculamos los alcances críticos
correspondientes [con la ecuación (14.9) de la página 549] necesarios para emplear el
procedimiento de comparación múltiple de Dunn.
Con un nivel general de significación de O.OS para estos datos, Z u es de +2.64,
puesto que el área contenida en el extremo superior de la distribución normal
estandarizada es de 0.05/12 o 0.0042. Por tanto, tenemos

Diferencias absolutas Alcance crítico Decisión


(400)(401) -1- + _1_ =
IR 1 - R2 1 = 1220.9 - 209.ol = 1 1.9 2.64
12
(
138 157
) 35.6 No significativo

IR1 - R3I = 1220.9 - 179.81 = 41.1 2.64


(400)(401) -1- +
(
J_) = 47.2 No significativo
12 138 60

IR1 - R4I = 1220.9 - 135.81 = 85.1 2.64


(400)(401) -1-
( +
J_) = 52.4 significativo
12 138 45

(400)(401) -1- + J_) No significativo


JR2 - R3I = 1209.o -179.81 = 29.2 2.64
12
(
157 60
= 46.3

IR2 - R3 I = 1209.o - 135.81 = 73.2 2.64


(400)(401) -1-
( +
J_)
157 45
= 51 .6 significativo
12

(400)(401) J_ + J_)
IR3 - R4 I = 1179.8 - 135.81 = 44.o 2.64
12
(
60 45
= 60.2 No significativo

S56 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Debemos informar a Bud Conley que la mediana de los ingresos personales son sig­
nificativamente diferentes respecto al nivel conocido de participación en las deci­
siones relacionadas con el trabajo. En particular, los empleados que afirmaron que
siempre participan tienen una mediana de ingreso personal significativamente
más alta que los trabajadores que afirman que nunca participan. Todas las demás
diferencias entre los grupos apareados se deben al azar.

Proyecto de encuesta/base de datos de la sección 14.6

Los siguientes problemas se refieren a los datos de muestra obtenidos del cues­
tionario de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 de las
páginas 33-40. Deberán ser resueltos con la ayuda de un paquete de computación.
Suponga que usted ha sido contratado como asistente de investigación de Bud
Conley, el vicepresidente de recursos humanos de Industrias Kalosha. Éste le
ha dado una lista de preguntas (véanse problemas 14.18 a 14.30) que él nece­
sita responder antes de su reunión con el representante de B & L Corporation,
la empresa que da asesorías sobre paquetes de prestaciones para los traba­
jadores que ha contratado. Un análisis estadístico confirmatorio, basado en las
respuestas a estas preguntas pertenecientes a las variables numéricas de la
Encuesta de satisfacción de los empleados, le proporcionará un mejor
entendimiento de la composición de la fuerza de trabajo de tiempo completo
de Industrias Kalosha, y le será de utilidad en sus deliberaciones con el repre­
sentante de B & L Corporation con el propósito de desarrollar un paquete de
prestaciones para los empleados.
A partir de las respuestas a las preguntas que tratan sobre variables numéricas
de la Encuesta de satisfacción de los empleados (véanse páginas 33-40) en los
problemas 14.18 a 14.30, y que se dan a continuación,
(a) Obtenga un conjunto de estadísticas descriptivas para cada grupo.
(b) Desarrolle una representación de tallo y hojas para cada grupo.
(c) Trace la gráfica de caja y bigotes para cada grupo.
(d) Desarrolle la gráfica de probabilidad normal para cada grupo.
(e) Basándose en un análisis descriptivo de los resultados del inciso (a) al (d),
respecto a las suposiciones de la prueba F ANOVA de una dirección y a la
prueba de rangos de Kruskal-Wallis, seleccione un procedimiento ade­
cuado y efectúe la prueba de hipótesis al nivel de significación de a= .05.
(f) tHd12i•tl•> Escriba un memorándum a Bud Conley donde explique su
elección del procedimiento de prueba y los resultados.
14.18 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre­
gunta 1), basándose en las características importantes de trabajo (véase pregunta 11)?
14.19 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de trabajo
semanal de los empleados de tiempo completo de Industrias Kalosha (véase pre­
gunta 1), basándose en las percepciones por seguir adelante (véase pregunta 12)?
14.20 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra­
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en la participación conocida en las decisiones
relacionadas con el trabajo (véase pregunta 21)?
14.21 ¿Existe evidencia de una diferencia en el tiempo promedio (en horas) de tra­
bajo semanal de los empleados de tiempo completo de Industrias Kalosha
(véase pregunta 1), basándose en qué tan orgullosos se sienten por ser parte de
la organización (véase pregunta 23)?
14.22 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en la agrupación ocupacional (véase pregunta 2)?

Uso de paquetes estadísticos para la evaluación de diferencias entre los e grupos SS 7


14.23 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en las características de trabajo importante (véase pregunta 11)?
14.24 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en las percepciones por ir a la cabeza (véase pregunta 12)?
14.25 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en el avance dentro de la organización (véase pregunta 20)?
14.26 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en la participación conocida en las decisiones relacionadas con el
trabajo (véase pregunta 21)?
14.27 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7),
basándose en qué tan orgulloso se sienten por ser parte de la organización
(véase pregunta 23)?
14.28 ¿Existe evidencia de una diferencia en el ingreso personal promedio de los
empleados de tiempo completo de Industrias Kalosha (véase pregunta 7), basán­
dose en la percepción de la importancia de la escolaridad (véase pregunta 27)?
14.29 ¿Existe evidencia de que hay una diferencia en la antigüedad (es decir, el
tiempo promedio que tienen los trabajadores de tiempo completo de
Industrias Kalosha en el empleo, véase pregunta 16), basándose en la satisfac­
ción con el trabajo (véase pregunta 9)?
14.30 ¿Existe evidencia de una diferencia en la antigüedad en el trabajo (es decir, el
tiempo promedio que tienen los trabajadores de tiempo completo de
Industrias Kalosha en el empleo, véase pregunta 16), basándose en qué tan
orgullosos se sienten por ser parte de la organización (véase pregunta 23)?

1 e!) El modelo de diseño de bloque aleatorizado


En la sección 14.4 desarrollamos la pruebaF ANOVA de una dirección para evaluar
diferencias en las medias de c grupos, y en la sección 14.5 estudiamos la prueba de
rangos de Kruskal-Wallis para evaluar las diferencias en las medianas de c grupos.
Procedimientos de prueba como los mencionados serían utilizados en situaciones
experimentales en las cuales n elementos o individuos homogéneos (es decir, uni­
dades experimentales) son asignados aleatoriamente a los c niveles de un factor de
interés (es decir, los grupos de tratamiento). Como podemos recordar de la sección
14.3, estos experimentos de un factbr se conocen como modelos de diseño comple­
tamente aleatorizados o de una dirección.
Alternativamente, en las secciones 13.8 a 13.10 utilizamos la prueba t para la
diferencia media o la prueba de rangos con signo de Wilcoxon para la diferencia
mediana en situaciones que implican mediciones repetidas o muestras apareadas,
con el propósito de evaluar diferencias entre dos condiciones de tratamiento. Su­
ponga, ahora, que deseamos extender lo anterior a situaciones en las que existen más
de dos grupos de tratamiento o niveles de un factor de interés. En tales casos, los con­
juntos heterogéneos de elementos o de individuos que han sido apareados (o sobre
los que se han hecho mediciones repetidas) se conocen como bloques. Los datos
numéricos pueden, entonces, obtenerse como respuesta o resultado de cada combi­
nación de grupo de tratamiento y de bloque. Así pues, al diseñar experimentos de
este tipo, debería haber dos cosas a considerar: tratamientos y bloques. Sin embargo,
respecto a nuestras pruebas de hipótesis, enfocamos la atención en las diferencias
entre los c niveles del factor de interés (es decir, los grupos de tratamiento).
Las situaciones experimentales como éstas se conocen como modelos de di­
seño de bloques aleatorizados. El propósito al conformar bloques es eliminar

558 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


toda la variabilidad que sea posible, de manera que podamos enfocar nuestra aten­
ción en las diferencias entre las e condiciones de tratamiento. Así pues, cuando sea
apropiado, el propósito de elegir un modelo de diseño de bloque aleatorizado en
lugar de un modelo de diseño completamente aleatorizado es proporcionar un
análisis más eficiente mediante la reducción del error experimental y, en conse­
cuencia, obtener resultados más precisos (véanse referencias 1, 5, 6 y 11).

i e H=i Prueba F de bloque aleatorizado para


diferencias en e medias

14.8.1 Introducción
Como en la sección 14.4, cuando las mediciones resultantes a través de los e gru­
pos son continuas y se cumplen ciertas suposiciones, puede utilizarse una meto­
dología conocida como análisis de varianza (o ANOVA,) para comparar las medias
de los grupos. En la presente sección ampliaremos nuestro análisis anterior de
ANOVA y el desarrollo de la prueba F de bloque aleatorizado con el fin de eva­
luar las diferencias entre las medias de e grupos.
Recordamos de la figura 14. l de la página 528, que en el modelo completa­
mente aleatorizado o análisis de varianza de una dirección, la variación total de las
mediciones resultantes (SST) se divide en la variación que es atribuible a las dife­
rencias entre los e grupos (SSA) y la que se debe al azar o se puede atribuir a la
variación inherente dentro de los grupos (SSW). La variación dentro de los grupos
se considera como error experimental, y la variación entre grupos se atribuye a
efectos de tratamiento.
Para el modelo de diseño de bloque aleatorizado, con el objeto de filtrar los
efectos de conformar bloques, necesitamos dividir aún más la variación dentro de
los grupos (SSW) en la variación atribuible a diferencias entre los bloques (SSBL) y
la que se puede atribuir a error aleatorio inherente (SSE). Por consiguiente, como
se presenta en la figura 14.13, en el modelo de diseño de bloque aleatorizado, la
variación total de las mediciones resultantes es la suma de tres componentes: la va­
riación entre grupos (SSA), la variación entre bloques (SSBL) y el error aleatorio
inherente (SSE).

--«
Variación entre grupos (SSA)

Variadó, total (SST) Va,tactó, '"'" bloq,es (SSBL)


Figura 1 4. 1 3
División de la variación
total en un modelo de
Variación aleatoria (SSE) diseño de bloques
aleatorizados.

14.8.2 Desarrollo
Para desarrollar el procedimiento ANOVA respecto al modelo de diseño de bloques
aleatorizados, necesitamos definir los términos que se presentan a continuación:

Prueba F de bloque aleatorizado para diferencias en e medias S S9


X;¡ = er valor· del bloque í-ésiina· para e1 tratamiento del grupo í-ésima
X¡ _ = la media de todos los valores en el bloque i
X_¡ = la media de todos los valores para el tratamiento del grupo j

L L X;¡ = esto
e r
la sumatoria de los valores de todos los bloques y de todos los grupos,
¡= 1; = 1 es, del gran total

r = al número de bloques
e = al número de grupos
n = al número total de observaciones (cuando n= re)

La variación total, conocida también como suma del total de cuadrados


(SST), por sus siglas, Sum of Squares Total), es una medida de la variación entre
todas las observaciones. Puede ser obtenida al sumar las diferencias al cuadrado
entre cada observación individual y la gran media o media general, X, que está
basada en las n observaciones. SST se calcularía como

L L ( X - X)
e r
= 2
SST = ij (14.10)
j = li = 1

donde X =
i = 1; = 1 (esto es, la gran gran media o media general)
re

La variación entre grupos, también conocida como la suma de cuadrados


entre grupos (SSA, por sus siglas de, sum of squares among), se mide a través
�e la suma de las difere.Dcias al cuadrado entre la media de muestra de cada grupo,
X_¡, y la gran media, X, pesadas o ponderadas con el número de bloques r. La
variación entre grupos se calcula con la ecuación

e
SSA = r I, ( X.¡ - X)
- - 2
(14.11)
j =1

I,xij
donde _x.1 = �(esto es, el tratamiento de las medias de grupo)
r
La variación entre bloques, también conocida como suma de cuadrados
entre bloques (SSBL, por sus siglas: sum of squares among blocks), se mide a
través de la suma de las diferengas al cuadrado entre la media de cada bloque, X¡ _ y
la gran media o media general, X, pesadas o ponderadas por el número de grupos, e.
La variación entre bloques se calcula con:

SSBL = e :t (
i = 1
X¡_ - X )
2
(14.12)

560 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


e

LX;¡
donde 5( = 1-::..2__ (esto es, la media del bloque)
e

La variación aleatoria inherente, también conocida como suma de errores


al cuadrado (SSE, por sus siglas, sum of squares error), se mide a través de la
suma de las diferencias al cuadrado entre todas las observaciones después de que
el efecto de los tratamientos y de los bloques particulares ha sido tomado en
cuenta. SSE se calcula con la ecuación:

SSE = {-
LL � (x.,, - )(.,. - )(.,. + x) 2 (14.13)
j = 1i = 1

Puesto que existen e niveles de tratamiento del factor que está siendo com­
parado, hay e - 1 grados de libertad asociados con la suma de cuadrados entre gru­
pos (SSA). De forma parecida, como se tienen r bloques, hay r - 1 grados de
libertad asociados con la suma de cuadrados entre bloques (SSBL). Además, exis­
ten n - 1 grados de libertad asociados con la suma del total de cuadrados (SST)
porque �acta observación, X¡¡, se está comparando con la media general o gran
media, X, basándonos en las n observaciones. Por consiguiente, como se deben
sumar los grados de libertad de cada una de las fuentes de variación a los grados
de libertad de la variación total, podemos obtener los correspondientes a la com­
ponente del error de la suma de cuadrados (SSE) mediante sustracción y manipu­
lación algebraica.4 Los grados de libertad están dados por (r - l)(c - 1)
Si cada uno de los componentes de la suma de cuadrados se divide entre los corres­
pondientes grados de libertad asociados, obtendremos los tres términos de varianza o
cuadráticos medios (MSA, MSBL y MSE) necesarios para llevar a cabo el ANOVA:

SSA
MSA = (14.14a)
e-1

SSBL
MSBL = (14.14b)
r-1

SSE
MSE = (14.14c)
(r - l)(c - 1)

Si las suposiciones correspondientes al análisis de varianza se cumplen, la hipóte­


sis nula de no diferencias entre las medias de población (es decir, de la no existen­
cia de efectos de tratamiento)

Ho: µ1 = µ_z = · · · = µe
puede ser probada contra la hipótesis alternativa de que no todas las e medias de
población son iguales:
H1: No todas las µi son iguales (con j = 1, 2, ..., e)
mediante el cálculo de la estadística de prueba F:

Prueba F de bloque aleatorizado para diferencias en e medias S6 I


F = MSA (14.15)
MSE

La estadística de prueba F sigue una distribución F con e - 1 y (r - l)(c - 1) grados


de libertad. Para un nivel de significación, a, dado, podemos rechazar la hipótesis
nula si la estadística de prueba F calculada es mayor que el valor crítico de extremo
superior, Fu[(c-l), (r-l)(c-l)l de la distribución F (véase tabla E.5). Esto es, tenemos la
siguiente regla de decisión:
Rechace Ho si F > FU[(c-1),(r-l)(c-1)];
en cualquier otro caso, no rechace H0.

Para examinar si resulta ventajoso formar bloques, algunos investigadores su­


gieren que se efectúe la prueba de la hipótesis nula de no efectos de bloque. Así
pues, podemos probar

contra la alternativa:
H1: No todas lasµ¡. son iguales

Definimos la estadística de prueba F

MSBL (14.16)
F =
MSE

y la hipótesis nula será rechazada al nivel de significación a, si

_ MSBL
F > FU[r-1,(r-l)(c-l)]
- MSE

Sin embargo, se puede argumentar que hacer lo anterior no es necesario, que el


único propósito de establecer los bloques es proporcionar medios más eficientes para
probar los efectos de tratamiento mediante la reducción del error experimental.5
Como en la sección 14.4.2, los resultados de un procedimiento de análisis de
varianza por lo general se muestran en una tabla resumen ANOVA, cuyo formato
se presenta en la tabla 14.9.

14.8.3 Aplicación
Para ilustrar la prueba F de bloques aleatorizados, suponga que la administración
de una cadena de restaurantes de comida rápida que tienen cuatro sucursales en una
cierta área geográfica desea evaluar el servicio en esos restaurantes. El director de
investigación de la cadena contrata a 24 investigadores (estimadores) con experien­
cia variada en evaluaciones en servicio de comida. Después de realizar consultas pre­
liminares, los 24 investigadores son clasificados en seis bloques de cuatro elementos,
basándose en su experiencia sobre evaluación de servicios de comida, de modo que
los cuatro investigadores con mayor experiencia quedan asignados al bloque 1, los

S62 Capítulo 14 ANOVA y otras pruebas de e mu_estras con datos numéricos


í

Tabla 14.9 Tabla de análisis de varianza para el diseño de bloques aleatorizados.

Grados Cuadrado medio


Fuente de libertad Suma de cuadros (varianza) F

entre tratamientos e -1 SSA = r!(x ¡ -x)' MSA = SSA


c-1
F = MSA
MSE
; : l
'
entre bloques T -1 SSBL =c¿,(x;-x) 2 MSBL = SSBL
T - 1
F = MSBL
MSE
i = 1

I.I(x;; -x; -x, + x)'


e r
SSE = SSE
Error (r - l)(c - 1) MSE =
i= 1 i= I (r - l)(c - 1)
Total re - 1 SST = !!(x,; -x)'
j = l j = l

siguientes cuatro con mayor experiencia al bloque 2, y así sucesivamente. Dentro de


cada uno de los seis bloques homogéneos, los cuatro estimadores son asignados de
manera aleatoria para realizar la evaluación del servicio de un restaurante en particu­
lar, utilizando una escala de asistencia que va de O (baja) hasta 100 (alta). Los resulta­
dos se resumen en la tabla 14.10. Los totales de grupo, las medias de grupo, los totales
de bloque, las medias de bloque, el gran total y la gran media también se presentan
en la tabla 14.10, y algunas de estas estadísticas se resaltan junto con las evaluaciones
de los datos originales en la gráfica de dispersión de la figura 14.14 (de la página 564)
para proporcionar una representación visual de los resultados del experimento.

( Tabla 14. 1 O Evaluaciones de los restaurantes para cuatro sucursales de


una cadena de comida rápida.

Bloques Restaurantes
de
evaluadores A B e D Totales Medias
1 70 61 82 74 287 71.75
2 77 75 88 76 316 79.00
3 76 67 90 80 313 78.25
4 80 63 96 76 315 78.75
5 84 66 92 84 326 81.50
6 78 68 98 86 330 82.50
Totales 465 400 546 476 1,887
Medias 77.50 66.67 91.00 79.33 78.625

Además, de la tabla 14.10 tenemos:

r = 6, e= 4, n = re = 24
y, según lo establecido
e r

¿,¿,X;¡
X = ; = 1i = I = 1, 887 = 78.625
re 24

Aunque se sugiere con insistencia que se utilice algún paquete de software estadís­
tico (veánse referencias 10, 12 y 13) para determinar los resultados de un experi-

Prueba F de bloque aleatorizado para diferencias en e medias 563


100

90 .
+x:3

(/)
80 x .
fx.1
X.4

·¡:;

cii
70
-.. X.2
60

50

Figura 14. 14
o
Gráfica de dispersión de las
evaluaciones de los servicios prestados
A B e D
en cuatro restaurantes. Restaurantes
Fuente: Tabla 14.10.

mento de diseño de bloques aleatorizados, con fines ilustrativos, haremos los si­
guientes cálculos:
Utilizando la ecuación (14.10),

SST= _¿ _¿(X;¡-X)
e r
2 2
= (70-78.625) 2 +(77-78.625) +···+ (86-78.625)2
= 2,295.63

Utilizando la ecuación (14.11),

SSA =r Í.. (X; - .X) = 6[(77.50-78.625) +(66.67-78.625) +·· ·+(79.33-78.625) ]


j = 1
2 2 2 2

= 1,787.46

Utilizando la ecuación (14.12),

SSBL=c Í, (X; - X)2 = 4[ (71.75-78.625)2+(79.00-78.625/+···+(82.50-78.625)2 ]


j = 1
= 283.38

Utilizando la ecuación (14.13),

SSE = "' "'(X - X.¡. - X + .X)2


e r

�� 1/ l.
(70 - 77.50 - 71.75 + 78.625)2
j = 1i = 1
+ (77 - 77.50 - 79.00 + 78.625)2
+

+ (86 - 79.33 - 82.50 + 78.625) 2


224.79

564 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


r

Así pues, utilizando las ecuaciones (14.14a), (14.14b) y (14.14c),

SSA l, 787.46
MSA = = 595.820
e -1 3
SSBL = 283.38
MSBL = = 56.676
r -1 5
SSE 224.79
MSE = 14.986
(r-l)(c-1) 15

En el estudio sobre la cadena de restaurantes de comida rápida, los cálculos que


acabamos de realizar pueden resumirse en la cuadro de análisis de varianza que se
muestra en la tabla 14.11.

Tabla 14.11 Tabla de análisis de varianza para el estudio de la cadena de


restaurantes de comida rápida.

Grados Sumas Cuadrado medio


Fuente de libertad de cuadrados (varianza) F

1,787.46
Entre grupos 4-1= 3 1,787.46 MSA = F= 595.820
3 14.986
595.820
Entre bloques 6-1= 5 283.38 MSBL =
283.38 F = 56.676
5 14.986
= 56.676
224.79
Error (6-1)(4-1)= 15 224.79 MSE =
15
14.986

Total (6)(4)-1= 23 2,295.63

Además de las entradas de la tabla anterior, en las tablas ANOVA de la mayoría de


los paquetes de software estadístico se incluye también el valor p (es decir, la proba­
bilidad de obtener una estadística F igual o mayor a la obtenida dado que la hipóte­
sis nula sea verdadera). Como la mayoría de los individuos que necesitan evaluar
datos de los modelos de diseño de bloque aleatorizado realizarían su análisis con
la ayuda de un paquete estadístico, la inclusión del valor p nos permite llegar a con­
clusiones directamente acerca de la hipótesis nula, sin referimos a una tabla de·
valores críticos de la distribución F. Si el valor pes menor que el nivel especificado
de significación a., la hipótesis nula es rechazada. En este caso, sin embargo,
analizaremos los datos que se encuentran resumidos en la tabla 14.11.
Sustituyendo 1, 2, 3, 4 por A, B, C, D cuando probamos las diferencias entre
los restaurantes, y utilizando el nivel de significación de O.OS, la regla de decisión
consistiría en rechazar la hipótesis nula (H0 : µ.1 = µ.2 = µ.3 = µ.4) si el valor F calcu­
lado es mayor que 3.29 (véase figura 14.15 de la página 566). Puesto que F = 39.758
> Fu(3,15) = 3.29, podemos rechazar la hipótesis nula H0 y llegar a la conclusión de
que existe evidencia de una diferencia en la asistencia promedio entre los diferentes
restaurantes.

Prueba F de bloque aleatorizado para diferencias en e medias S6S


Figura 1 4. 1 S
Regiones de rechazo y de no rechazo
para el estudio sobre la cadena de
restaurantes de comida rápida, al nivel o 3.29 FU(s, 15)
de significación de O.OS, con 3 y 15
grados de libertad.

Como una verificación de la efectividad de la conformación de bloques,


podemos probar una diferencia entre los grupos de estimadores. La regla de decisión,
utilizando el nivel de significación de .05, sería rechazar la hipótesis nula (Ha : Ha :
µ1. = µ2. = . . . = µ6.) si el valor F calculado excede a 2.90 (véase figura 14.16). Puesto
que F = 3.782 > Fu(s,isi = 2.90, podemos rechazar Ha y llegar a la conclusión de que
existe evidencia de una diferencia entre los grupos de estimadores. Así pues, pode­
mos concluir que la conformación de bloques ha sido ventajosa para reducir el
error experimental.
Además de las suposiciones del análisis de varianza de una dirección mencio­
nadas anteriormente en la sección 14.4.6, necesitamos suponer que no hay efecto
de interacción entre los tratamientos y los bloques. Esto es, necesitamos suponer
que cualesquiera diferencias entre los tratamientos (restaurantes) son consistentes
a través del conjunto entero de bloques (el grupo de estimadores). El concepto de
interacción se analizará en la sección 14.10.4 ..

Figura 1 4. 1 6
Regiones de rechazo y de no rechazo para
el estudio sobre la cadena de restaurantes o FU(5, 15)
de comida rápida, al nivel de significación
de O.OS, con 5 y 15 grados de libertad.

14.8.4 Comparaciones múltiples: el procedimiento


deTukey
Como en el caso del modelo ANOVA de una dirección, cuando la hipótesis nula de
no diferencias entre los grupos de tratamiento es rechazada, necesitamos determi­
nar cuáles de estos grupos de tratamiento son significativamente diferentes de los
demás. Para el modelo de diseño de bloques aleatorizados, como los tamaños de
muestra de cada grupo de tratamiento son iguales, utilizamos un procedimiento
desarrollado por John Tukey (veánse referencias 6 y 14). El alcance crítico para el
procedimiento de Tukey está dado por la ecuación (14.17):

,.
3 Canee CfltlCO =
1 �MSE (14.17)
QU[c,(r-I)(c-I)] -r-

S66 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Cada uno de los c(c - 1)/2 pares de medias es comparado con respecto al
alcance crítico. Un par específico sería declarado diferente si la diferencia absoluta
de las medias de muestra IX.¡ -X.r I es mayor que el alcance crítico.
Para aplicar el procedimiento de Tukey, regresemos a nuestro estudio de la
cadena de restaurantes de comida rápida. Como se tienen cuatro restaurantes, se
deben llevar a cabo (4)(4 -1)/2 = 6 posibles comparaciones por pares. En la tabla
14.10 de la página 563, las diferencias medias absolutas son
1. lx., - x 2 I = In.so - 66.671 = 10.83
2. lx. 1 - x_ 3 I = In.so - 91.ool = 13.50
3. lx_ 1 - x.41 = 177.50 - 79.331 = 1.83
4. lx2 - x_ 3 1 = 166.67 - 91.ool = 24.33
s. lx_ 2 - X.4 1 = 166.67 - 79.331 = 12.66
6. lx_ 3 - x.41 = 191.00 - 79.331 = 11.67
Para determinar el alcance crítico, utilizamos la tabla 14.11 de la página 565, para
obtener MSE = 14.986 y r = 6. De la tabla E.12 [para a= .05, e= 4 y (r -l)(c -1) =
(6-1)(4 -1) = 15], el valor crítico de extremo superior, Qu(4 ,15), es de 4.08. Por con­
siguiente, utilizando la ecuación (14.17) tenemos

14·:86
alcance crítico = 4.08� = 6.448

Observamos que todos los contrastes, excepto I X_ 1 - X.4 I, son mayores que el
alcance crítico. Por consiguiente, podemos llegar a la conclusión de que existe evi­
dencia de una diferencia significativa en la asistencia promedio de todas las pare­
jas de restaurantes, excepto para las sucursales A y D. Además, la sucursal C tiene
la mayor asistencia (es decir, es el más preferido) y la sucursal Bes la de menor asis­
tencia (es decir, es la menos preferida).

14.8.5 Comparación del diseño de bloques aleatorizados


respecto al diseño de una dirección
( completamente aleatorizado)
Ahora que hemos realizado el modelo de bloques aleatorizados y lo hemos uti­
lizado en el estudio de los restaurantes de comida rápida, surge la pregunta acerca
de qué efecto tiene la conformación de bloques sobre el análisis. Esto es, la con­
formación de bloques ¿tuvo como resultado un aumento en la precisión de la com­
paración de los diferentes grupos de tratamiento?
La eficiencia relativa (RE, por sus siglas: relative efficiency) estimada
del diseño de bloques aleatorizado, comparado con el diseño completamente
aleatorizado, puede calcularse con la ecuación (14.18):

RE = (r - l)MSBL + r(c - l)MSE (14.18)


(re - l)MSE

Así pues, de la tabla 14.11 de la página 565, para el estudio de la cadena de res­
taurantes de comida rápida, tenemos

Prueba F de bloque aleatorizado para diferencias en e medias 567


r

(5)(56.676) + (6)(3)(14.986)
RE 1.60
(23)(14.986)

Esto significa que se necesitarían 1.6 veces más observaciones en cada grupo de
tratamiento en un disefío ANOVA de una dirección para obtener la misma pre­
cisión en la comparación de las medias de los grupos de tratamiento que en el caso
de nuestro diseño de bloques aleatorizados.

Problemas de la sección 14. 8


14.31 Explique las diferencias entre el modelo de disefío de bloque aleatorizado y el
modelo de disefío completamente aleatorizado
14.32 Se ha disefíado un experimento de prueba de sabores, de modo que nueve
expertos van a evaluar cuatro marcas de café colombiano. Para evitar cualquier
efecto de interferencia, la secuencia de prueba de las cuatro marcas es determi­
nada aleatoriamente por cada uno de los nueve probadores expertos, hasta que
se alcanza una estimación en una escala de siete puntos (1 = extremadamente
malo, 7 = extremadamente bueno) respecto a cada una de las cuatro caracterís­
ticas siguientes: sabor, aroma, riqueza y acidez. La siguiente tabla muestra las
estimaciones conjuntas acumuladas para las cuatro características.

Evaluaciones sumadas de cuatro


marcas de café colombiano

Marcas
Experto A B e D
E.B 24 26 25 22
N.B. 27 27 26 24
M.D. 19 22 20 16
M.H. 24 27 25 23
B.J. 22 25 22 21
R.J. 26 27 24 24
B.K. 27 26 22 23
B.M. 25 27 24 21
J.S. 22 23 20 19

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, analice completamente los datos para
determinar si existe evidencia de una diferencia en las estimaciones con­
juntas de las cuatro marcas de café colombiano y, si ése es el caso, cuáles
de las marcas tienen los mayores resultados (es decir, son las mejores).
(c) t·fiiiNM·f•), Basándose en sus resultados, escriba un borrador para un artículo
que pueda ser enviado al editor de la sección de alimentos del periódico local.
e 14.33 Un investigador médico desea efectuar un experimento para determinar si la
elección de la sustancia de tratamiento afecta el tiempo de coagulación de
plasma (en minutos). Se van a comparar cinco diferentes sustancias que mejo­
ran la coagulación (es decir, tratamientos) y se estudiarán siete pacientes
mujeres que se encuentran en la primera etapa del embarazo. Se tomaron
cinco muestras de sangre a cada paciente y cada una de éstas se asigna
aleatoriamente a cada uno de los cinco tratamientos. Los datos correspondien­
tes al tiempo de coagulación se muestran en la siguiente tabla:

S68 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Sustancia de tratamiento
Paciente 1 2 3 4 5
1 8.4 8.1 8.5 8.6 8.5
2 10.3 10.0 9.9 10.6 10.2
3 12.4 11.8 12.3 12.5 12.2
4 9.7 9.8 9.9 10.4 10.4
5 8.6 8.4 9.7 9.9 9.5
6 9.3 9.6 10.3 10.5 10.2
7 11.1 10.6 11.6 10.9 11.4

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de O.OS, ¿existe evidencia de una diferencia en el
tiempo promedio de coagulación de plasma entre las cinco sustancias de
tratamiento?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar la
sustancia de tratamiento que difiere respecto al tiempo promedio de
coagulación.
(d) Determine la eficiencia relativa del diseño de bloques aleatorizado
respecto al diseño completamente aleatorizado.
(e) f·fiiiM•t·I•> Escriba un informe para el investigador médico basándose en
los resultados anteriores.
14.34 Una nutrióloga desea comparar tres productos dietéticos bien conocidos.
Basándose en datos correspondientes a gordura (es decir, una función de la
altura y el peso), edad y metabolismo, clasifica a 18 de sus clientes hombres en
seis grupos de tres cada uno y asigna aleatoriamente a un miembro de cada
grupo a uno de los tres tratamientos dietéticos. Los siguientes datos represen­
tan la cantidad de peso (en libras) perdido por los 18 clientes después de seis
semanas de tratamiento:

Tratamiento dietético
Grupos de clientes 1 2 3
1 10.4 12.1 9.0
2 9.8 14.5 9.6
3 7.3 10.0 9.8
4 7.5 9.9 10.7
5 8.6 14.2 11.1
6 10.7 10.5 10.5

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Al nivel de significación de .05, ¿existe evidencia de una diferencia en la
cantidad promedio de peso (en libras) perdido entre los tres tratamientos
dietéticos?
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar los
tratamientos dietéticos que difieren respecto a la pérdida promedio de
peso. (Utilice el nivel a= .05)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados
respecto al diseño completamente aleatorizado.
(e) f·fiidi)i•t·I•> Escriba un informe que la nutrióloga pueda utilizar en futuras
recomendaciones dietéticas a sus clientes, basándose en los hallazgos de
este estudio.

Prueba F de bloque aleatorizado para diferencias en e medias 569


14.35 El decano de una bien conocida escuela de negocios desea estudiar el proceso de
evaluación estudiantes-planta docente en su campus, pues tal evaluación se utiliza
en decisiones de reasignación, promoción e inamovilidad. En particular, está
interesado en determinar la estructura educativa más apropiada para lograr evalua­
ciones de la planta docente más altas por parte de los estudiantes. Las estructuras
son: cursos de licenciatura, cursos avanzados de bachillerato o cursos de requisito
del bachillerato. Como la carga de trabajo semestral de la planta docente en esta
institución es de tres cursos, el decano tomó una muestra aleatoria de diez
docentes de su escuela, quienes habían sido asignados a un curso de cada una de
las ya mencionadas tres estructuras educativas y recuperó sus formas de evaluación
de final de semestre. Los resultados que se presentan a continuación son las evalua­
ciones promedio sobre una escala de cinco puntos (1= muy pobre, 5 = sobre­
saliente) respecto a la pregunta: ¿En comparación con otros maestros que has
tenido, cómo evaluarías la habilidad para enseñar de este profesor?; cada una de las
evaluaciones provienen de grupos formados con 25-30 estudiantes.

Nivel de Estudio
Miembro Curso de Bachillerato
docente bachillerato avanzado Requisitos
L.M. 4.12 4.06 3.38
N.R. 4.87 4.72 4.60
A.C. 3.46 3.49 2.39
J.K. 3.87 3.61 3.23
J.B. 4.04 3.83 3.55
D.B. 2.90 3.23 3.52
W.F. 4.16 4.07 3.68
R.S. 4.19 3.76 3.83
M.L. 4.75 4.39 4.22
V.P. 4.29 4.34 3.67

(a) Construya una gráfica o un diagrama apropiado con los datos y describa
cualquier tendencia o relación que se haga evidente entre los grupos de
tratamiento y entre los bloques
(b) Utilizando un nivel de significación a= .OS, ¿Existe alguna evidencia de
una diferencia en las evaluaciones, basándose en el tipo de clase?
(c) Si es apropiado, utilice el procedimiento de Tukey para determinar qué
tipos de clases difieren en sus evaluaciones (Utilice el nivel a= .05.)
(d) Determine la eficiencia relativa del diseño de bloques aleatorizados con
respecto al diseño completamente aleatorizado.
(e) t-t;d')i•i-i•� Escriba un memorándum que el decano pueda enviar a sus jefes
de departamento tomando en cuenta los resultados de los incisos (b) y (c), y
que les sea de ayuda en la toma de decisiones respecto a reasi.gnación, pro­
moción y/o inamovilidad, basándose en las evaluaciones de la enseñanza.

Problemas intercapítulo de la sección 14.8


14.36 En el problema 13.62 de la página 509, usted utilizó una prueba t para com­
parar el desgaste promedio basándose en dos tipos de material que se usa para
las suelas de zapatos.
(a) Utilice la prueba F de bloques aleatorizados en este conjunto de datos.
(Use el nivel a= .05.)
(b) Eleve al cuadrado el valor de t que calculó en el problema 13.62; observe
que es el mismo (excepto por error de redondeo) que el valor F. Exprese
con sus propias palabras la relación que hay entre t y F.
• 14.37 En el problema 13.63 de la página 510, usted utilizó una prueba t para comparar el
kilometraje de gasolina promedio entre gasolina regular y de alto octanaje.
(a) Utilice la prueba F de bloques aleatorizados en este conjunto de datos.
(Use el nivel a= .05.)
(b) Eleve al cuadrado el valor de t que calculó en el problema 13.63; observe
que es el mismo (excepto por error de redondeo) que el valor F. Exprese
con sus palabras la relación que hay entre t y F.

S70 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


r

1
1 e!·) Prueba de rango de Friedman para diferencias
en e medianas

14.9.1 Introducción
A menudo sucede que, a pesar de que el modelo de diseño de bloques aleatoriza­
dos se considera apropiado para un experimento particular, podemos preferir
alguna alternativa libre de distribución a la prueba F de bloques aleatorizados, para
analizar los datos. Si los datos recolectados se encuentran solamente en forma de
rango dentro de cada bloque o si no se puede suponer la normalidad, se puede uti­
lizar un procedimiento sencillo pero bastante poderoso conocido como prueba
de rango de Friedman.

14.9.l. Desarrollo
La prueba de rangos de Friedman se utiliza principalmente para probar si e grupos
de muestra han sido tomados de poblaciones que tienen medianas iguales. Es
decir, podemos probar la hipótesis

Ho : M1 = M2 = ... = Me
contra la hipótesis alternativa:
H 1 : No todas las M¡ son iguales (en la que j = 1, 2, ... , e)

Para desarrollar la prueba, primero sustituimos los datos por sus rangos, en
cada uno de los bloques. Esto es, en cada uno de los rbloques independientes susti­
tuimos las e observaciones por sus correspondientes rangos, de modo que el rango
1 es asignado a la observación más pequeña y el rango e a la observación más
grande. Si algunos de los valores del bloque son iguales, se les asigna el promedio
de los rangos que les serían asignados si no hubiera habido empates. Así pues, R¡¡
es el rango (de 1 a e) asociado con el j-ésimo grupo (en el que j = 1, 2, ..., e) en el
i-ésimo bloque (con i = 1, 2, ... , r).
Bajo la hipótesis nula de no diferencias en los e grupos, cada asignación de ran­
gos dentro de un bloque es igualmente probable. Así pues, existen e! formas posibles
de asignar rangos dentro de un bloque particular y (e!)' posibles ordenamientos de
rangos sobre los r bloques independientes. Además, si la hipótesis nula es verdadera,
no habría diferencias reales entre los rangos promedio de cada grupo (tomados sobre
los r bloques).
De lo anterior se puede derivar la siguiente estadística de prueba FR :

12 '
---¿R� - 3r(c + 1) (14.19)
rc(c + 1) i = l

en la que
R.f es el cuadrado del total de los rangos para el grupo j (j = 1,
2, ..., e).
r es el número de bloques independientes.
e es el número de grupos.
A medida que el número de bloques del experimento se hace grande (mayor
que 5), la estadística de prueba FR puede ser aproximada por la distribución chi­
cuadrada, con e - 1 grados de libertad. Así pues, para cualquier nivel elegido de sig-

Prueba de rango de Friedman para diferencias en e medias S7 I


nificancia, a, la regla de decisión sería rechazar la hipótesis nula si el valor calcu­
lado de FR es mayor que el valor crítico de extremo superior de la distribución chi­
cuadrada, con e - 1 grados de libertad, como se muestra en la figura 14.17. Esto es
Rechazar Ho si FR > X2 u(c-l);
en cualquier otro caso, no rechazar H0.
Los valores críticos x2 se presentan en la tabla E.4.

Figura 14.1 7
Determinación de la región de
rechazo.

14.9.3 A p licación
Para ilustrar la prueba de rangos de Friedman para diferencias en e medianas, regre­
semos a nuestro estudio sobre la cadena de restaurantes de comida rápida de la sec­
ción anterior. Podemos recordar que el director de investigaciones de la cadena
diseñó un experimento de bloques aleatorizados en el cual 24 investigadores fueron
estratificados en seis bloques de cuatro, basándose en la experiencia en evaluación
de servicio de comida, y los cuatro miembros de cada bloque fueron asignados
aleatoriamente para evaluar el servicio en uno de los cuatro restaurantes que posee
la cadena. Los resultados del experimento se presentan en la tabla 14.10 de la página
563, junto con algunos cálculos sumarios y una gráfica de dispersión que se mues­
tra en la figura 14.14 de la página 564, de modo que se pueda realizar una evalua­
ción exploratoria visual de las tendencias y las relaciones potenciales, así como de
las violaciones en las suposiciones de los procedimientos de prueba particulares. Si
el director de investigación no desea hacer la suposición de que las evaluaciones de
servicio se encuentran distribuidas normalmente en cada restaurante, se puede em­
plear la prueba de rangos de Friedman, libre de distribución, para diferencias en las
cuatro medianas de población.
La hipótesis nula que se va a probar es que las medianas de las evaluaciones de
servicio de los cuatro restaurantes son iguales; la hipótesis alternativa es que al
menos una de las medianas de los restaurantes difiere de las otras. Así pues, susti­
tuyendo 1, 2, 3, 4 por A, B, C, D, tenemos:

Ho: M.1 = M.z = M,3 = M.4


H 1 : No todas las medianas son iguales

Convirtiendo las 24 evaluaciones de servicio de la tabla 14.10 (página 563) a


rangos dentro de cada bloque, obtenemos la tabla 14.12. Como se muestra en esta
tabla, se obtuvo la suma de los rangos para cada grupo:
Sumas de rangos: R.1 = 14.5 R. 2 = 6.0 R. 3 = 24.0 R.4 = 15.5

S72 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Tabla 14. 11 Conversión de datos a rangos dentro
de los bloques.

Bloques Restaurantes
de
evaluadores A B e D
1 2.0 1.0 4.0 3.0
2 3.0 1.0 4.0 2.0
3 2.0 1.0 4.0 3.0
4 3.0 1.0 4.0 2.0
5 2.5 1.0 4.0 2.5
6 2.0 1.0 4.0 3.0
Total de rangos: 14.5 6.0 24.0 15.5
Fuente: Los datos fueron tomados de la tabla 14.10 de la página 563.

Como una verificación de la asignación de rangos tenemos

rc(c + 1)
R_ 1 + R_ 2 + R.3 (14.20)
2

Para nuestros datos, utilizando la ecuación (14.2 0):

14.5 + 6 + 2 4 + 15.5 =
( 6)(4)(S)
2
60 = 6 0

Usando, ahora, la ecuación (14.19), obtenemos:

12 e
L z
FR = re ( e + 1 ) ¡ = R.¡ - 3r(c + 1)
1

= { :: [14.5 2 + 6. 0 2 + 24. 0 2 + 15.5 2 ] }- (3)( 6)(5)


( 6) )(5)

= ( /Jo }1, 062.s) - 90

= 1 06.25 - 9 0 = 16. 25

Puesto que la estadística de prueba FR calculada es mayor que 7.815, el valor crítico
de extremo superior de la distribución chi-cuadrada, con e -1 = 3 grados de liber­
tad (véase tabla E.4), la hipótesis nula puede ser rechazada al nivel de significación
de a= . 05. Podemos llegar a la conclusión de que existen diferencias significativas
(percibidas por los estimadores) respecto al servicio prestado en los cuatro restau­
rantes.
Podemos observar que éstos son los mismos resultados que se obtuvieron para
los datos utilizando la prueba F de bloques aleatorizados de la sección 14.8.

Prueba de rango de Friedman para diferencias en e medias 573


14.9.4 Comparaciones múltiples: procedimiento
de Nemenyi
Ya que rechazamos la hipótesis nula y llegamos a la conclusión de que existía evi­
dencia de una diferencia significativa entre los restaurantes en lo que respecta a las
medianas de las estimaciones de servicio, el siguiente paso consiste en una com­
paración simultánea de todas las parejas posibles de restaurantes, para determinar
cuál o cuáles difieren de los demás. Como el paso siguiente de la prueba de rangos
de Friedman, describiremos un procedimiento de comparación múltiple post hoc o
a posteriori propuesto por P. Nemenyi (véase referencia 9).
En general, con e grupos de tratamiento o niveles de un factor, existen c(c - 1)/2
posibles comparaciones por parejas que se deben realizar. El primer paso consiste
en obtener el rango promedio, R.¡, para cada uno de los j grupos (con j = 1, ... , e).
De la ecuación (14.19), podemos recordar que cuando calculamos la estadística de
prueba FR , obtuvimos el !_otal de los rangos, R.¡ de cada grupo. Así pues, para cal­
cular el rango promedio R.; para el j-ésimo grupo, tenemos

- R
R.1 =­.; (donde j = 1, ... , e)

..
Luego calculamos las diferencias R.¡ - R.¡' (en la que j * j') entre todas las
c(c - 1)/2 parejas de rangos promedio. El alcance crítico para el procedimiento de
Nemenyi se obtiene de

c(c + 1)
alcance crítico = Qu¡c,-J (14.21)
l2r

en la que, para un nivel seleccionado de significación a, Qu [e, �J es el valor crítico


de extremo superior de una distribución de rangos studenbzada (tabla E.12),
con e e grados de libertad. Podemos recordar que la estadística Q se utilizó tam­
00

bién en la obtención de los alcances críticos-de las comparaciones múltiples que se


realizaron después del rechazo de la hipótesis nula acerca de la igualdad de e
medias tanto en la prueba F ANOVA clásica de una dirección y la prueba F de blo­
ques aleatorizados.
El paso final consiste en comparar cada uno de los c(c - 1)/2 pares de rangos
promedio obtenidos con la ecuación (14.21). Una pareja específica de grupos sería
declarada significativamente diferente si la diferencia absoluta en sus correspon­
dientes rangos promedio es mayor que el alcance crítico.
Para aplicar el procedimiento de Nemenyi a nuestro estudio de la cadena de
restaurantes de comida rápida, primero obtenemos los rangos promedio sobre los
cuatro grupos de las correspondientes sumas de rangos dadas en la página 5 72:
Sumas de rangos: R_ 1 14.5 R.2 = 6.0 R. 3 = 24.0 R.4 = 15.5
Rangos promedio: R.1 = 2.42 R. 2 = 1.00 R.3 = 4.00 R.4 = 2.58

Existen (4)(4 -1)/2 = 6 comparaciones por pareja que se deben realizar porque exis­
ten cuatro restaurantes. Las diferencias absolutas de los rangos promedio son
l. IR.1 - R2 I = 12.42 - 1.001 = 1.42
2. IR1 - R.31 = 12.42 - 4.0ül = 1.58
3. IR.1 - R.41 = J2.42 - 2.58J = 0.16

S74 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricos


4. jR 2 - R.31 = ¡1.00 - 4.oo¡ = 3.oo
s. jR 2 - R.4 I = ¡1.00 - 2.s8¡ = 1.58
6. ¡R.3 - R.4 I = 14.üü - 2.s8I = 1.42
Puesto que los tres grupos tienen el mismo tamaño de muestra, solamente hay un
alcance crítico que sería utilizado eh todas las comparaciones posibles. Al selec­
cionar un nivel de significación de 0.05, determinamos el alcance crítico de la
ecuación (14.21) obteniendo primero Quc4, 00) = 3.63 de la tabla E,12, de modo que

c(c + 1)
alcance crítico = Q U[4.=J
12r

= 3.63

= 1.91
Observamos que solamente la cuarta comparación por parejas (1 R. 2 - .R.31 = l 1.00 -
4.001 = 3.00) es mayor que el alcance crítico de 1.91, de manera que el director de
investigación puede llegar a la conclusión de que el servicio en el restaurante C es
significativamente mejor que el del restaurante B, pero no hay evidencia de una
diferencia significativa en las estimaciones de servicio entre cualquiera de las
demás parejas de restaurantes. Podemos recordar que si el director de investigación
hubiera utilizado el procedimiento paramétrico de Tukey, descrito en la sección
14.8.4, hubiera llegado a la conclusión de que hay una diferencia significativa en
las estimaciones promedio de servicio entre todas las parejas de restaurantes de la
cadena, excepto para los restaurantes A y D.
Debido a los resultados conflictivos que obtuvimos, el procedimiento de Tukey
deberá utilizarse después de llevar a cabo una prueba F de bloques aleatorizados, si
la suposición de normalidad en las cuatro poblaciones subyacentes es viable. Si no,
se deberá utilizar el procedimiento de Nemenyi como el siguiente paso de la prueba
de rangos de Friedman.

Problemas de la sección 14. 9


e 14.38 El consejo de presidentes de la empresa Physical Fitness and Sports consultó a
un grupo de expertos médicos para clasificar cinco formas distintas de ejerci­
cios respecto a su contribución a la condición física y al bienestar físico gene­
ral. La clasificación (1 = menos benéfico, 5 = más benéfico) se muestra a
continuación para cada una de las nueve características igualmente impor­
tantes de condición y bienestar físicos.

Ejercicio
Característica Ciclismo Calistenia Trote Natación Tenis
Equilibrio 5.0 2.0 4.0 1.0 3.0
Digestión 2.5 1.0 4.5 4.5 2.5
Flexibilidad 1.5 5.0 1.5 4.0 3.0
Definición muscular 4.0 5.0 2.5 2.5 1.0
Resistencia muscular 3.0 1.0 4.5 4.5 2.0
Fortaleza muscular 3.5 3.5 5.0 1.5 1.5
Sueño 3.0 2.0 4.5 4.5 1.0
Estamina 3.0 1.0 4.5 4.5 2.0
Control de peso 4.0 1.0 5.0 2.0 3.0

Prueba de rango de Friedman para diferencias en e medias S7S


(a) ¿Existe evidencia de una diferencia en las estimaciones de "beneficio
percibido" de las cinco formas de ejercicio? (Utilice el nivel a= .OS.)
(Sugerencia: trate las nueve características como bloques.)
(b) Basándose en los resultados obtenidos en el inciso (a), utilice el procedi­
miento de Nemenyi para determinar qué ejercicios son más benéficos.
(Utilice el nivel a= .OS.)
(c) t.f.iil?i-t·I•> Escriba una carta a un amigo en la que describa sus hallazgos.
14.39 El locutor de un programa radial sobre deportes en Estados Unidos encuestó a
su audiencia para determinar qué equipos fueron los más dominantes en el
deporte profesional durante el inicio de la década de los noventa. Los equipos
seleccionados por los aficionados fueron Atlanta Braves de beisbol, Dallas
Cowboys en futbol americano, Chicago Bulls en basquetbol y los Pittsburgh
Penguins en hockey sobre hielo. Luego formó un panel de 10 expertos y les
pidió que clasificaran estos equipos desde 1 (más dominante) hasta 4 (menos
dominante). Los resultados se presentan a continuación:

Equipo
Braves de Cowboys de Bulls de Penguins
Experto Beisbol futbol americano basquetbol de hockey
B.M. 3 2 1 4
L.D. 2 3 4
H.C. 1 3 4 2
F.C. 4 1 2 3
T.]. 2 3 1 4
T.A. 1 2 3 4
H.B. 3 1 2 4
H.D. 3 2 1 4
T.D. 3 1 2 4
S.D. 4 2 3 1

(a) Al nivel de significación de O.OS, analice completamente los datos para


determinar si existe evidencia que muestre que los cuatro equipos
deportivos no son considerados como igualmente dominantes y, si ése es
el caso, cuáles son considerados mejores.
(b) t.f.ii19i•f.l•> Escriba una carta al locutor del programa deportivo en la que
le indique cómo interpretaría usted los resultados del inciso (a).
14.40 Se diseña un experimento psicológico para determinar si existen diferencias en
la habilidad para recordar debidas a diferentes niveles de observación de un
objeto. Se consideraron tres niveles de observación (en milésimas de segundo).
Se escogieron ocho conjuntos de tres miembros como sujetos. En cada uno de
los ocho conjuntos, los miembros son asignados aleatoriamente para ser
examinados bajo un nivel de observación.

Nivel de observación
Conjunto de tercias
(sujetos) Mínimo Moderado Alto
55 68 67
II 78 83 84
III 34 53 54
IV 56 67 65
V 79 78 85
VI 20 29 30
VII 68 88 92
VIII 59 58 72

(a) Al nivel de significación de .05, ¿existe evidencia de una diferencia en la


mediana de la habilidad para recordar entre los niveles de observación? -

576 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


(b) Si es adecuado, utilice el procedimiento de Nemenyi para determinar los
niveles de observación que difieren en la habilidad promedio para recor-
dar. (Utilice el nivel a= .05.)
(c) f.y;iJl)i,,.¡,, Escriba un memorandum a su profesor de psicología industrial
con relación a los resultados y posibles implicaciones en la publicidad.
14.41 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder al inciso (b) del problema 14.32 (evaluación de café) de
la página 568. (Utilice el nivel a= .OS.) ¿Hay algunas diferencias en sus resultados
actuales con relación a los obtenidos anteriormente? Explique su respuesta.
e 14.42 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder a los incisos (b) y (c) del problema 14.33 (tiempo de coa­
gulación) de la página 568. (Utilice el nivel a= .OS.) ¿Existen algunas diferencias en
los resultados actuales y los obtenidos anteriormente? Explique su respuesta.
14.43 Utilice la prueba de rangos de Friedman y, si es adecuado, el procedimiento de
Nemenyi para responder a los incisos (b) y (c) del problema 14.35 (resultados
de la evaluación estudiantes/planta docente) de la página 570. (Utilice el nivel
a= .OS.) ¿Existen algunas diferencias en los resultados actuales y los obtenidos
anteriormente? Explique su respuesta.

i i H l•l El modelo de diseño factorial y el análisis de


dos direcciones de varianza

14.10.1 Introducción
En las secciones 14.3 a 14.6 estudiamos el análisis de varianza de una dirección o el
modelo de diseño completamente aleatorizado, y en las secciones 14.7 a 14.9 intro­
dujimos el modelo de diseño de bloques aleatorizados. En la presente sección exten­
deremos nuestro análisis al estudio de un modelo de diseño experimental en el cual
dos factores son de interés. Los dos factores pueden ser diferentes con respecto al nú­
mero de niveles (o grupos) que contengan. Sin embargo, centraremos nuestra aten­
ción solamente en situaciones en las que se tienen tamaños de muestra iguales, n',
para cada combinación de los niveles del factor A con los del factor B. (Véase refe­
rencia 1 para un análisis de los modelos ANOVA con tamaños de muestra diferentes.)

14.1 O.l Desarrollo


Con el propósito de extender nuestro estudio al análisis de varianza y desarrollar
1 los procedimientos de prueba F para el modelo de diseño factorial de dos factores
1
con igual réplica 6 , necesitamos definir los siguientes términos:

1
1
X ¡¡k = valor de la k-ésima observación del nivel i del
factor A y del nivel j del factor B
X ¡¡_ = suma de los valores de la celda ij (las observaciones del nivel i del
factor A y del nivel j del factor B)
X; .. = suma de los valores de la hilera i del factor A
X.¡. = suma de los valores de la columna j del factor B
GT = gran total de todos los valores en todas las hileras y columnas
r = número de niveles del factor A
e = número de niveles del factor B
n' = número de valores (réplicas) para cada celda
n = número total de observaciones del experimento (con n = rcn')

El modelo de diseño factorial y el análsis de dos direcciones de varianza 577


Estos nuevos términos son necesarios para el uso de fórmulas de computo en el aná­
lisis de los datos obtenidos de los experimentos de diseño factorial de dos factores.
Con fines ilustrativos, presentamos planteamientos tanto conceptuales como de
cálculo para la descomposición de la variación total necesaria en el desarrollo de los
procedimientos de prueba F. Sin embargo, debido a la cantidad de cálculos implica­
dos, en particular a medida que el número de niveles de cada factor aumenta al igual
que aumenta el número de réplicas en cada celda, sugerimos enfáticamente que se
utilice alguno de los paquetes de software estadísticos, de los muchos que se encuen­
tran disponibles, cuando se analicen los datos obtenidos de los modelos de diseño
factorial.
De la figura 14.1 (pág. 528) recordamos que en el modelo de diseño completa­
mente aleatorizado, el total de la suma de cuadrados (o SST) se subdivide en la
suma de cuadrados entre grupos (SSA) y en la suma de cuadrados dentro de lo gru­
pos (SSW). También, de la figura 14.13 (página 559), observamos que en el mode­
lo de diseño de bloques aleatorizados, la variación total (es decir, SST) se dividió en
la suma de cuadrados entre grupos de tratamiento (SSA), la suma de cuadrados
entre bloques (SSBL) y la suma de errores al cuadrado (SSE). Para el modelo de dise­
ño factorial de dos factores con réplica (es decir, n' > 1 en cada celda), necesitamos
dividir la variación total (SST) en la suma de cuadrados debidos al factor A (o SSFA),
la suma de cuadrados debidos al factor B (o SSFB), la suma de cuadrados debidos al
efecto de interacción de A y B (o SSAB) y la suma de cuadrados debidos al error
aleatorio inherente (o SSE). Esta descomposición de la variación total (SST) se pre­
senta en la figura 14.18.

Variación en el factor A (SSFA)

Variación en el factor B (SSFB)


Variación total (SST)
Interacción (SSAB)

Variación aleatoria (SSE)

Figura 14. 1 8
División de la variación total de un modelo de diseño factorial
de dos factores.

La suma del total de cuadrados (o SST) representa la variación total entre


todas las observaciones alrededor de la gran media. SST se puede calcular como

L L L (X - (GT) 2
r e 11'

SST = ijk X) (14.22)


2

i = 1 j = 1k = 1 rcn'

r e n'

rrrxijk
donde x=; = 1 i = 1k = 1
rcn'
(esto es, la gran media o media general

La suma de cuadrados debida al factor A (o SSFA) representa las diferen­


cias entre los diferentes niveles del factor A y la gran media. SSFA se puede calcu­
lar como
_/

578 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


r _ r
X Z (GT)Z
= L_i.. ---
2
SSFA = cn'L(X; ·· -X) (14.23)
; = 1 ; = 1 en' ren'

e n'

LLX;¡k
j = 1k = 1
donde X;. (esto es, la media de cada nivel del factor A)
en'

La suma de cuadrados debida al factor B (o SSFB) representa las diferen­


cias entre los diferentes niveles del factor B y la gran media. SSFB se puede calcular
como

SSFB = rn'
i
L (X.;. - X)
= 1
2
(14.24)

LLX;¡k
r n'

1 1
donde X; _; =_ _k_=_ __ (esto es, la media de cada nivel del factor B)
rn'

La suma de cuadrados debida al efecto de interacción de A y B (o SSAB)


representa el efecto de las combinaciones del factor A y el factor B. SSAB se puede
calcular como

n'I L (X;¡.
r e
SSAB = -X i .. -X.¡.+ x)
2

i = 1j = 1
(14.25)
r e XZ r XZ e XZ )2
I 1--+- l____!L¿-- I�+�
(G
n
; = 1; = 1
; = 1 en
ren ; = 1 rn

,,. X
donde
X;; = L _!!f.-
k = 1n
(esto es, la media de cada celda)

La suma de errores cuadrados (o SSE) representa las diferencias entre las


observaciones de cada celda y la correspondiente media de celda. SSE puede calcu­
larse como

X :Z
L L L(X;¡k -X;¡/= L L rx:k - L L
r e 11' r e 11' r e
SSE= n·:· (14.26)
i=I j = 1k = 1 i = 1 j = 1k = 1 i = 1 j = 1

Puesto que existen e niveles de tratamiento del factor A, se tienen e - 1 grados


de libertad asociados con SSA. De forma parecida, como existen r niveles de
tratamiento del factor B, se tienen r - 1 grados de libertad asociados con SSB.
Además, como existen n' réplicas en cada uno de las re celdas, se tienen re(n' - 1)

El modelo de diseño factorial y el análsis de dos direcciones de varianza S79


grados de libertad asociados con el término correspondiente al error aleatorio
inherente. Avanzando un poco más en este sentido, existen n - 1 grados de liber­
tad asociados con la suma del total de cuadrados (SST) porqu� cada observación
X;¡k está siendo comparada con la media general o gran media, X, basándose en las
n observaciones. Por consiguiente, puesto que los grados de libertad de cada una
de las fuentes de variación deben agregarse a los grados de libertad de la variación
total (SST), podemos obtener los grados de libertad para la componente de inter­
acción (SSAB) mediante sustracción y algo de manipulación algebraica.7 Los gra­
dos de libertad están dados por (r - l)(c - 1).
Si cada una de las sumas de cuadrados se divide entre sus grados de libertad
asociados, obtendremos los cuatro términos de varianza o cuadráticos medios
(MSFA, MSFB, MSAB y MSE) necesarios para efectuar ANOVA:

SSFA
MSFA = (14.27a)
r-1
SSFB
MSFB = (14.27b)
e-1

SSAB
MSAB = (14.27c)
(r - l)(c - 1)
= _S_S _E_
MSE (14.27d)
rc(n' - 1)

En el modelo ANOVA de dos factores existen tres pruebas distintas que pueden
llevarse a cabo. Si suponemos que los niveles del factor A y los del factor B fueron
específicamente seleccionados para el análisis (en lugar de ser seleccionados aleato­
riamente de una población de niveles posibles), entonces hubiéramos tenido las
siguientes tres pruebas de hipótesis:
Para probar la hipótesis de no diferencia debida al factor A
Ho: µl.. = µz .. = ... = µr..
contra la hipótesis alternativa
H 1 : No todas las µ¡ __ son iguales
formamos la estadística F

MSFA
F = (14.28)
MSE

y la hipótesis nula sería rechazada al nivel de significación, a, si

_ MSFA > F:
F U[(r-1),rc(n'-l)]
- MSE

sao Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Para probar la hipótesis de no diferencia debida al factor B

Ho: µ,1. = µ.z. = ... = µ.,.

contra la hipótesis alternativa

H1: No todas las µ,j. son iguales

formamos la estadística F

F = MSFB
(14.29)
MSE

y la hipótesis nula sería rechazada al nivel de significación a, si

F _ MSFB > FU((c-l),rc(n'-1)]


- MSE

Para probar la hipótesis nula de no interacción de los factores A y B


H0 : AB ¡¡ = O (para todos i y j)
contra la hipótesis alternativa

formamos la estadística F

= MSAB
F (14.30)
MSE

y la hipótesis nula sería rechazada al nivel de significación a, si

F -_ MSAB > FU( r-l)(c-1),rc(


( n'-1)]
MSE

Como en las secciones 14.4.2 y 14.8.2, el conjunto completo de pasos puede


resumirse en una tabla de análisis de varianza (ANOVA), como la tabla 14.13, de la
página 582.

14. 1 O. 3 Aplicación
Para ilustrar el modelo de diseño factorial de dos factores, suponga que el director
de investigaciones de mercado de una cadena de supermercados está interesado en
el estudio del efecto de la colocación de los estantes sobre la venta de un producto.
Se estudiarían cuatro lugares distintos donde colocar los estantes: colocación nor­
mal (A), colocación adicional en la tienda (B), nueva colocación solamente y un

El modelo de diseño factorial y el análsis de dos direcciones de varianza S8 I


Tabla 14. 1 3 Tabla de análisis de varianza para e modelo de dos factores con réplica.

Grados Cuadrado medio


Fuente de libertad Sumas de cuadrados (varianza) F

L� -
' X¡ (GT) 2 = SSFA = MSFA
A r-1 rcn' MSFA F
i = 1 r-1 MSE
e X�. (GT)2
B e-1 L
i=1
--;:-;¡ - r en' MSFB = SSFB
e-1
F = MSFB
MSE

= __S_S A
_ __
B
AB (r - l)(c - 1) MSAB F = MSAB
(r - l)(c - 1) MSE

Error rc(n' - 1) MSE = __S_SE__


rc(n' - 1)

Total rcn' - 1

"anunciador del producto" (C) y colocación normal con "listones de propaganda"


(D). Se tomaron tres tamaños de tienda diferentes: pequeña, mediana y grande.
Para cada colocación de estantes se seleccionó una muestra aleatoria de dos tiendas
de cada tamaño. Los resultados en ventas semanales se resumen en la tabla 14.14.

.
T abl a 14 14 V,entas semana es por tamano
- d e t'1end a y co ocac1on
.
, d e estantes.

Tamaño de tienda
Colocación A B e D Totales Medias
de estante
Pequeña 45
50 ':) cr 56 1 \ �
63
65 ,�
(o
48 '<2> \
53 451 56.375
\\+
71
Mediana 57
65
'2.2 �: \/14
73
80
¡s� 60
57 539 67.375
Grande 70
78 \ B 75
82 ':)-t �; I'+ I 7
75
114w
622 77.750
Totales 365 423 460 364 1,612
Medias 60.83 70.50 76.67 60.67 67.167

De esta tabla tenemos:


r= 3, C= 4, n'= 2, X 1 .. = 451, Xz .. = 539, X3 .. = 622
X.1. = 365, X.2. = 423, x_ 3 _ = 460, x.4. = 364, GT = 1,612
X11_ = 95, X12. = 119, X13_ = 136, X14. = 101, X21. = 122, X22. = 147
X23_ = 153, X24_ = 117, X3 1. = 148, X32_ = 157, X33_ = 171, X34_ = 146
r

L, L, rxik
e 11'

= 45 2 + 50 2 + ... + 75 2 = 111,550
i=lj=lk=l

X2 451 2 +539 2 + 6 22 2
L,�
r

= ------ = 110,100.75
i=lcn (4)(2)

582 Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos


X2
e
365
2 + 4232 + 460 2 + 364 2
�; = = 109, 375
;� r ( 3)( 2 )

,f � X� __ 95 + 119 + ... + 146


2 2 2

�� -------- = 111,292
i=li=l n' (2)
(GT)2 1' 612
2
= 108 , 272.66
ren' (3)( 4)( 2 )

Utilizando la ecuación (14. 22),

SST = i i ± X� - (GT) 2
ren ,
¡ = 1 ; =1 k = 1
k

= 111, 550 - 108 , 2 7 2. 66 = 3 ,277. 34

Utilizando la ecuación (1 4. 23),

SSFA =
i X¡ - (GT) 2

¡ = 1 en' ren'
= 110 ,100.75 - 108 ,272. 66 = 1, 828.09

Utilizando la ecuación (14. 24),


e X2 (G ) 2
SSFB = I-i - T
; =1 rn' ren'
= 109, 375 - 108, 27 2. 66 = 1,102. 34

Utilizando la ecuación (14.25),


r e X� r X2 X z. (GT)2
SSAB = II-+- I�- I�+-,
e

¡ = 1; = 1 n ¡ = 1 en ¡ =
1
rn ren
= 111 , 292 -110,100.75 - 109, 375 + 108 , 27 2 . 66
= 88.91

Utilizando la ecuación (14. 2 6),


X�
LLL L L-+
r e n' r e

ssE = x�k - n
i=li=lk=l i=li=l

= 111 ,550 -111, 292 = 258

Para calcular las varianzas utilizamos las ecuaciones (14.27a) hasta (14.27d).
De la ecuación (14. 27a):

SSFA 1, 828.09
MSFA = = = 914.045
r-1 3 -1

De la ecuación (14. 27b):

El modelo de diseño factorial y el análsis de dos direcciones de varianza S83


SSFB 1 , 102 .34
MSFB = = = 367.447
c-1 4-1
De la ecuación ( 1 4.2 7c):

SSAB 88·91
MSAB = = = 14.818
(r - l)(c -1) (3-1)(4-1)
De la ecuación ( 1 4.2 7d):
_S_S_E_ __2_ 5_8 __ =
MSE = 2 1 .5
rc(n' - 1) (3)(4)(2 -1)
En el estudio del supermercado, los cálculos que acabamos de realizar pueden
resumirse en la tabla 14.15.

Tabla 14.1 5 Tabla de análisis de varianza para el ejemplo del supermercado.


Grados Cuadrado medio
Fuente de libertad Sumas de cuadrados (varianza) F
1,828.09 914.045
A(Tamaño 3-1=2 110,100.75-108,272.66 = 1,828.09 MSFA = F=
2 21.5
de tienda)
= 914.045 = 42.51
1,102.34 F= 367.447
B(Localización 4-1 = 3 109,375-108,272.66 = 1,102.34 MSFB =
21.5
3
de estantes) = 367.447 = 17.09

AB(Tamaño de (3-1)(4-1) = 6 111,292 - 110,100.75 - 109,375 MSAB =


88.91 F = 14.818
6 21.5
tienda x localiza- +108,272.66 = 88.91 = 14.818 = .69
ción de estantes
258
Error (3)(4)(2 - 1) = 12 111,550 -111,292 =258 MSE =
12
= 21.5

Total (3)(4)(2) - 1 = 23 111,550 -108,272.66 = 3,277.34

Si utilizamos el nivel de significación de O.OS y probamos la diferencia entre


los tamaños de tienda, la regla de decisión sería rechazar la hipótesis nula (H0: µ1 .
= µ 2_ = ... =µ,.) si el valor calculado Fes mayor a 3.89 (véase figura 14.19). Como F
= 42.51 > Fu(Z,I Z) = 3.89, podemos rechazar H0 y llegar a la conclusión de que existe
evidencia de una diferencia entre los tamaños de tienda en términos de las ventas
semanales promedio.
Si utilizamos el nivel a = .OS y probamos si existe alguna diferencia entre la
colocación de los estantes, la regla de decisión sería rechazar la hipótesis nula (H0:
µ_1. = µ_ 2_ = ... =µ_e) si el valor calculado de Fes mayor que 3.49 (véase figura 14.20).
Puesto que F = 17.09 > Fu(3,12) = 3.49, podemos rechazar la hipótesis nula y llegar
a la conclusión de que existe evidencia de una diferencia entre la colocación de los
estantes en términos de las ventas semanales promedio.
Finalmente, podemos probar si existe algún efecto de interacción entre el fac­
tor A (tamaño de la tienda) y el factor B (colocación de los estantes). Utilizando el
nivel de significación de a= .05, la regla de decisión sería rechazar la hipótesis nula
[AB ¡¡ = O (para todo i y j)] si el valor calculado de Fes mayor que 3.00 (véase figura
14.21). Puesto que F = .69 < Fuc6 ,12) = 3.00, no rechazamos la hipótesis nula y llega­
mos a la conclusión de que no existe evidencia de un efecto de interacción entre
el tamaño de la tienda y la colocación de los estantes.

584 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Figura 14.19
o FU(2, 12¡
Reglones de rechazo y de no rechazo,
al nivel de significación de .OS, con 2 y
12 grados de libertad.

Figura 14.20
o 3.49 FLJ<.3, 12¡
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 3 y
12 grados de libertad.

Figura 14.21
Regiones de rechazo y de no rechazo,
al nivel de significación de .OS, con 6 y
12 grados de libertad.

1 4. 1 0.4 Interpretación de los efectos de interacción


Ahora que hemos realizado las pruebas para la significación del factor A, del factor
B y de su interacción, podemos obtener un mejor entendimiento de la inter­
pretación del concepto de interacción si graficamos las medias de celda como se
muestra en la figura 14.22 de la página 586. Como X;¡.= X;¡./n', tenemos

- 95 - 119 - 136 - 101


= = 47.5, X 12_ = = 59.5, X 13 _= = 68.0, X 14_= = 50.5
X 1 1.
2 2 2 2
_ 122 _ 147 - 15 3 11
X 2 1. =
2 = 61.0, X 22_ =
2 = 73.5, X 23. =
2
= 76 .5, x-· 24. __ 2
1 = 58.5

- 148 - 157 - 171 - 146


X 3 1.= 74.0, X 78.5, X 33 = 85.5, X 34_= 3.0
2 = 3 2 _=
2 = =
2 2=7

El modelo de diseño factorial y el análsis de dos direcciones de varianza SSS


90
•C
80 B
A
70 D
C/l
Q)

60
E
50
Q)
E 40

C/l

30

20

10

o Pequeño Mediano Grande

Figura 14.22
Ventas promedio semanales, basadas en el tamaño de tienda para
diferentes colocaciones de estantes.

En la figura 14.22 hemos graficado las ventas semanales promedio de cada


tamaño de tienda y de cada colocación. Para nuestros datos, las cuatro líneas (que
representan las cuatro colocaciones de estantes) aparecen apuntando casi en la
mjsma dirección. Este fenómeno puede interpretarse como que la diferencia en las
ventas semanales entre las cuatro colocaciones de estantes es virtualmente la
misma para los tres tamaños de tienda. En otras palabras, no existe interacción entre
estos dos factores, como claramente se evidenció en la prueba F de la página 584.
¿Cuál sería la interpretación si hubiera un efecto de interacción? En tal situación,
algunos niveles del factor A responderían mejor con ciertos niveles del factor B. Por
ejemplo, suponga que algunas colocaciones de estantes fueran mejores para tiendas
grandes y otras para tiendas pequeñas. Si éste fuera el caso, las líneas de la figura
14.22 no estarían apuntando en una dirección que las hace casi paralelas y el efecto
de interacción sería estadísticamente significativo. En está situación, las diferencias
entre las diferentes localizaciones de estantes no serían las mismas para todos los
tamaños de tiendas. Tal resultado tendría como consecuencia una complicación de
la interpretación del los efectos principales, ya que las diferencias en un factor (colo­
cación de estantes) no serían consistentes a través del otro factor (tamaño de tienda).

14. 1 O. 5 Comparaciones múltiples


Como en el caso de los modelos de una dirección y de bloques aleatorizados, ya
que se ha rechazado la hipótesis nula de no diferencias en los niveles de un factor,
necesitamos determinar los grupos o niveles particulares que son significativa­
mente diferentes entre sí. Se puede emplear un procedimiento desarrollado por
John Tukey (referencias 6 y 14) tanto para el factor A como para el factor B.

586 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


Para el factor A tenemos:

,. MSE (14.31)
a1Canee CiltlCO = Q U[r,rc(n'-J)] �
en'

y para el factor B tenemos

,. MSE
a1 Canee CiltiCO = Q U[c,rc(n'-1)] �--;:;::¡;- (14.32)

Al igual que en las secciones 14.4.5 y 14.8.4, cada una de las c(c - 1)/2 o r(r - 1)/2
parejas de medias se comparan respecto el alcance crítico apropiado. Una pareja
específica de medias sería declarada significativamente diferente si la diferencia
absoluta en las medias de muestra ( 1 X¡ . - X¡ ,..1) para el factor A o IX.¡. - X.r.1 para
el factor B) es mayor a su respectivo alcance crítico.
Para aplicar el procedimientq de Tukey, regresemos a nuestro ejemplo del
supermercado. Respecto al factor A, puesto que tenemos tres grupos, existen (3)(3
-1)/2 = 3 posibles comparaciones por pares que se deben realizar. De la tabla 14.14
de la página 582, las diferencias medias absolutas son:
l. IX1 .. - X2 .I = l 56.375 - 67.3751 = 11.000
2. IX1.. - X3 .. I = 1 56.375 - 77.7501 = 21.375
3. IX2 .. - X3 .. I = 1 67.375 - 77.7501 = 10.375
Para determinar el alcance crítico, de la tabla 14.15 de la página 584, tenemos: MSE
= 21.5, r = 3 y e= 4. De la tabla E.12, para a= .05, r = 3 y rc(n' - 1) = (3)(4)(2 - 1) =
12, el valor crítico de extremo superior, Qu(3 ,12i, es 3.77. De la ecuación (14.31),
tenemos
2 5
alcance crítico = 4.20� �· = 7.95

Observamos que todos los contrastes son mayores que el alcance crítico. Por con­
siguiente, podemos llegar a la conclusión de que las tiendas pequeñas, medianas y
grandes difieren entre sí respecto a sus ventas semanales.
En lo que concierne al factor B, puesto que se tienen cuatro grupos, existen
(4)(4 - 1)/2 = 6 posibles comparaciones por parejas que se deben realizar. De la
tabla 14.14 de la página 582, las diferencias medias absolutas son
1. IX.1 - x.2.I = 160.83 - 70.501 = 9.67
2. 1x 1 - x. 3 .I = 160.83 - 76.671 = 15.84
3. 1x 1 . - x.4.1 = 160.83 - 60.671 = .16
4. lx.2. - X 3 .I = 170.50 - 76.671 = 6.17
5. 1x.2. - x 4.I = 170.50 - 60.671 = 9.83
6. IX 3 . - x.4.1 = 176.67 - 60.671 = 16.00

El modelo de diseño factorial y el análsis de dos direcciones de varianza S87


Para determinar el alcance crítico, de la tabla 14.15 de la página 584, tenemos MSE =
21.5, r = 3 y e = 4. De la tabla E.12, para a= .05, c = 4 y rc(n' - 1) = (3)(4)(2 - 1) = 12, el
valor crítico de extremo superior, Qi:¡(4,12), es 4.20. De la ecuación (14.32), tenemos

2 5
alcance crítico = 4.20� �· = 7.95

Observamos que X.1. es diferente de X.2. (9.67 > 7.95) y X. 3. (15.84> 7.95), y X.4. es
diferente de X.z. (9.83 > 7.95) y X.3.(16 > 7.95). Así pues, podemos llegar a la conclusión
de que la colocación de estantes A (normal) y D (normal más "listones de propaganda")
son, cada uno, diferentes de las colocaciones B (colocación adicional en la tienda) y C
(nueva colocación con "anunciante"). Sin embargo, no existe evidencia de que haya
una dife-rencia entre las colocaciones A y D o entre las colocaciones B y C.

14. 1 0.6 Modelos fijo, aleatorio y mezclado


En nuestro estudio de los modelos de análisis de varianza no hemos centrado nues­
tra atención en cuáles de los diferentes niveles de un factor han sido seleccionados.
Desde esta perspectiva, existen tres modelos alternativos:
l. Modelo de efectos fijos (modelo 1).
2. Modelo de efectos aleatorios (modelo II).
3. Modelo de efectos mezclados (modelo III).
El primero, modelo de efectos fijos (modelo 1), descrito hasta este punto de
la presente sección, supone que los niveles de un factor ha sido seleccionados
específicamente para el análisis. Esto significa que los niveles del factor no fueron
seleccionados aleatoriamente de una población y que no se pueden hacer inferen­
cias con respecto a cualesquiera otros niveles, con excepción de los utilizados en el
estudio.
En contraste con el modelo de efectos fijos, el modelo II, modelos de efec­
tos aleatorios, contiene factores en los que los niveles son seleccionados aleatoria­
mente de una población. El objetivo de un modelo de efectos aleatorios no es
necesariamente examinar las diferencias entre niveles, sino, lo que es más impor­
tante, estimar la variabilidad debida a cada factor (véase referencia 5). Por ejemplo,
si deseáramos estudiar el efecto sobre la productividad de diferentes trabajadores y
diferentes máquinas, podríamos elegir aleatoriamente una muestra de máquinas
y asignar una muestra aleatoria de trabajadores a cada una, durante un número
dado de días. No solamente seríamos capaces de medir si los trabajadores y las
máquinas tienen efectos significativos sobre la productividad, sino que también
estaríamos en la posibilidad de estimar la variabilidad debida a diferentes máquinas
y la debida a diferentes trabajadores.
El modelo de efectos mezclados (modelo III), contiene una mezcla de efec­
tos fijos y aleatorios.
Aunque los modelos de efectos aleatorios y de efectos mezclados pueden
analizarse con una profundidad mucho mayor (véanse referencias 5 y 6), nuestra
atención se centra en las consecuencias de los diferentes modelos de la prueba F.
Puesto que los componentes de los modelos difieren respecto a sus suposiciones,
también conducen a diferentes pruebas F en la evaluación de la significación de los
efectos principales (factores A y B). Por consiguiente, las pruebas F apropiadas para
cada uno de los tres modelos se resumen en la tabla 14.16

S88 Capítulo 14 ANOVA y otras pruebas de c muestras con datos numéricos


Tabla 14.16 Pruebas F para modelos ANOVA de dos factores con réplica.
Hipótesis Efectos fijos Efectos aleatorios Efectos mezclados Efectos mezclados
nula (A y B fijos) (A y B aleatorios) (A fijo, B aleatorio) (A aleatorio, B fijo)

µ;._ = o F = MSFA
MSE
F = MSFA
MSAB
F = MSFA
MSAB
F =
MSFA
MSE
o F = MSFB F = MSFB F = MSFB F = MSFB
µ_¡. = MSE MSAB MSE MSAB
AB;¡ = o F
= MSAB
F =
MSAB F = MSAB F =
MSAB
MSE MSE MSE MSE

Como observamos en la tabla 14.16, las pruebas para los efectos principales son
distintas, dependiendo del tipo de modelo elegido. Para el modelo de efectos fijos,
las pruebas F implican el cociente de MSFA o MSFB entre MSE. Para el modelo de
efectos aleatorios, las pruebas F (para los efectos principales) implican el cociente
MSFA o MSFB entre MSAB. Para el modelo de efectos mezclados con el factor A fijo
y el factor B aleatorio, la prueba F para el factor A implica el cociente de MSFA entre
MSAB, y la prueba para el factor B implica el cociente de MSFB entre MSE. Para
el modelo fijo con el factor A aleatorio y el factor B fijo, la prueba F para el factor
A implica el cociente de MSFA entre MSE, mientras que la prueba para el factor B
implica el cociente de MSFB entre MSAB.

Problemas de la sección 14. I O


V 14.44 Explique la diferencia entre:
(a) Los modelos ANOVA de un factor y de dos factores.
(b) El modelo de diseño de bloques aleatorizados y el modelo de diseño facto­
rial de dos factores.
• 14.45 Una empresa reparadora de videocaseteras (VCR) desea estudiar el efecto de la
marca de VCR y el centro de servicio sobre el tiempo de reparación en minu­
tos. Se eligieron específicamente para el análisis tres marcas de VCR (A, By C).
También se seleccionaron tres centros de servicio. Cada centro de servicio fue
asignado para efectuar una reparación particular en dos videocaseteras de cada
marca. Los resultados se presentan a continuación:

Marcas de VCR
Centros de servicio A B e
1 52 48 59
57 39 67
2 51 61 58
43 52 64
3 37 44 65
46 50 69

(a) Al nivel de significación de O.OS


(1) ¿Existe algún efecto debido a los centros de servicio?
(2) ¿Existe algún efecto debido a la marca de VCR?
(3) ¿Existe alguna interacción debida al centro de servicio y a la marca de
VCR?
(b) Trace una gráfica del tiempo de servicio promedio para cada centro de
servicio y para cada marca de VCR.

El modelo de diseño factorial y el análsis de dos direcciones de varianza 589


(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
centros de servicio y qué marcas de VCR difieren en el tiempo de servicio
promedio. (Utilice el nivel a= .05.)
(d) Basándose en los resultados obtenidos, ¿a qué conclusiones puede llegar
respecto al tiempo de servicio promedio?
(e) tNil'2i•t-i•> Escriba un memorándum al director del centro de repara­
ciones en el cual se describan sus resultados.
(f) Si los tres centros de servicio fueran elegidos de manera aleatoria, ¿de qué
manera se vería afectado el análisis que realizó en el inciso (a)?
14.46 Se diseñó un experimento para estudiar el efecto de dos factores sobre la
amplificación de un aparato de sonido estéreo. Los factores son el tipo de
amplificador (cuatro marcas) y el tipo de receptor (dos marcas). Para cada
combinación de niveles de factor, se llevaron a cabo tres pruebas en las que se
midió la salida en decibeles. Una salida en decibeles más alta significa un
mejor resultado. Los resultados codificados son los siguientes:

Amplificadores
Receptor A B e D
9 8 8 10
R¡ 4 11 7 15
12 16 1 9
7 5 o 6
R2 1 9 1 7
4 6 7 5

(a) Al nivel de significación de 0.01:


(1) ¿Existe algún efecto debido a los receptores?
(2) ¿Existe algún efecto debido a los amplificadores?
(3) ¿Existe alguna interacción entre receptores y amplificadores?
(b) Trace una gráfica de la salida en decibeles para cada receptor y para cada
amplificador.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
amplificadores difieren respecto a la salida promedio en decibeles. (Utilice
el nivel a= .01.)
(d) M;M/•t-1•> Basándose en los resultados obtenidos, ¿a qué conclusiones
puede usted llegar respecto a la salida promedio en decibeles? Escriba un
memorándum sobre esto a su profesor de música.
14.47 El administrador de un hospital desea examinar los periodos de hospitali­
zación después de una operación quirúrgica en la rodilla. Se seleccionó una
muestra aleatoria de de 30 pacientes, cinco para cada combinación de grupo
de edad y tipo de cirugía. Los resultados, en la cantidad de días de hospitali­
zación después de la intervención, son los siguientes:

Grupo de edad
Tipo de cirugía de rodilla Menos de 30 De 30 a 50 Más de 50
1 4 3
3 3 5
Artroscopía 2 2 2
6 3 3
2 2 3
3 4 4
10 5 8
Artrotomía 6 11 12
7 5 10

�-
8 6 3

S90 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


(a) Al nivel de significación de O.OS:
(1) ¿Existe alguna diferencia entre los tipos de cirugía?
(2) ¿Existe alguna diferencia entre los grupos de edad?
(3) ¿Existe alguna interacción entre el tipo de cirugía de rodilla y el grupo
de edad?
(b) Trace una gráfica de la cantidad promedio de días de hospitalización después
de la intervención para cada tipo de cirugía y para cada grupo de edad.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar los gru­
pos de edad que difieren en la cantidad promedio de días de hospitali­
zación después de una operación. (Utilice el nivel a= .OS.)
(d) t·tiid'Ji•t-1•> Basándose en los resultados obtenidos ¿a qué conclusiones
puede llegar el administrador del hospital? Escriba una carta al admin­
istrador acerca de esto.
• 14.48 El director de control de calidad de una fábrica de telas desea estudiar el efecto
de los operadores y de las máquinas sobre la resistencia al rompimiento (en
libras) del material de sarga de lana. Un lote del material se cortó en piezas de
una yarda cuadrada y éstas fueron asignadas aleatoriamente, de tres en tres, a
doce combinaciones de cuatro operadores y tres máquinas, escogidas específi­
camente para el experimento. A continuación se presentan los resultados:

Máquina
Operador II III
115 111 109
A 115 108 110
119 114 107
117 105 110
B 114 102 113
114 106 114
109 100 103
e 110 103 102
106 101 105
112 105 108
D 115 107 111
111 107 110

(a) Al nivel de significación de O.OS:


(1) ¿Existe algún efecto debido al operador?
(2) ¿Existe algún efecto debido a la máquina?
(3) ¿Existe alguna interacción debida al operador y la máquina?
(b) Trace una gráfica de la resistencia promedio al rompimiento para cada
operador y para cada máquina.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
operadores y qué máquinas difieren en la resistencia promedio al
rompimiento. (Utilice el nivel a= .05.)
(d) t·tiiiM•i·f•> Prepare un informe dirigido al director de control de calidad
con respecto a sus resultados sobre la resistencia promedio al rompimiento.
14.49 El gerente de producción de un fabricante de enseres electrodomésticos desea
determinar la cantidad óptima de tiempo para el ciclo de lavado de una
lavadora de ropa doméstica. Se diseñó un experimento para medir el efecto del
detergente utilizado y del tiempo del ciclo de lavado sobre la cantidad de
suciedad eliminada de una carga de lavadora estándar: Se seleccionaron especí­
ficamente cuatro marcas de detergente (A, B, C y D) y cuatro niveles de ciclo
de lavado (18, 20, 22 y 24) para el análisis. Con el propósito de efectuar el
experimento, se asignaron de manera aleatoria 32 cargas estándar de lavado
doméstico (con igual peso y cantidad de mugre), de dos en dos, a las 16 com­
binaciones de detergente y de tiempo de ciclo de lavado. Los resultados (en
libras de suciedad eliminada) se muestran en la tabla siguiente:

El modelo de diseño factorial y el análsis de dos direcciones de varianza 591


Tipo de ciclo de lavado
(en minutos)
Marca de detergente 18 20 22 24
A .11 .13 .17 .17
.09 .13 .19 .18
B .12 .14 .17 .19
.10 .15 .18 .17
e .08 .16 .18 .20
.09 .13 .17 .16
D .11 .12 .16 .15
.13 .13 .17 .17

(a) Al nivel de significación de O.OS:


(1) ¿Existe algún efecto debido al detergente?
(2) ¿Existe algún efecto debido al tiempo del ciclo de lavado?
(3) ¿Existe alguna interacción debida al detergente y al tiempo de ciclo de
lavado?
(b) Trace una gráfica de la cantidad promedio de suciedad eliminada (en
libras) para cada detergente y para cada tiempo de ciclo de lavado.
(c) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
detergentes y qué tiempos de ciclo de lavado difieren respecto a la canti­
dad promedio de suciedad eliminada. (Utilice el nivel a= .05.)
(d) P·tiiMi•t-i•) Prepare un informe para el gerente de producción tomando
en cuenta los resultados obtenidos sobre la cantidad promedio de
suciedad. Asegúrese de ofrecer una recomendación de cuál podría ser el
ciclo de lavado óptimo para este tipo de lavadora de ropa doméstica.
(e) Si las cuatro marcas de detergente fueran elegidas de manera aleatoria, ¿de
que manera se vería afectado su análisis del inciso (a)?

i e H 11 Dificultades potenciales de la prueba de


hipótesis y cuestiones éticas

1 4. 1 1 • 1 Dificultades potenciales
En el presente capítulo enfocamos nuestra atención a varios modelos de diseño
experimental e introdujimos algunos procedimientos paramétricos y libres de dis­
tribución que pueden utilizarse cuando se analizan posibles diferencias en los
resultados numéricos o en las mediciones de respuesta entre los niveles (de
tratamiento) de algún factor de interés. Luego ampliamos lo anterior para tomar
en consideración los efectos de dos factores en el diseño de experimentos. De
nuevo, parte de un buen análisis de datos consiste en entender las suposiciones
que subyacen en cada uno de los procedimientos de prueba de hipótesis y, uti­
lizándolos junto con otros criterios, seleccionar el más adecuado para un conjunto
dado de condiciones. Así pues, incluso cuando nuestro objetivo principal es
realizar un análisis confirmatorio de un experimento en particular o de un con­
junto de datos, siempre debemos llevar a cabo, primero, un análisis exploratorio y
descriptivo, de manera que a través de la observación podamos entender mejor lo
que los datos contienen y qué tendencias, relaciones y efectos potenciales nos
están indicando. El hecho de no considerar los datos con este cuidado no es en sí
falta de ética. Sin embargo, por lo generé!! trae como resultado un análisis que no
es óptimo.

592 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


14. 1 1 .2 Cuestiones éticas
Las consideraciones éticas surgen cuando un investigador manipula el proceso d�
prueba de hipótesis de manera que le produzca una ganancia personal. Al coordinar y
administrar un proyecto que trate sobre un experimento diseñado a largo plazo o al
efectuar ensayos clínicos en industrias como la del tabaco, farmacéutica y de salubri­
dad, es imperativo que el investigador principal desarrolle un plan operativo o un pro­
tocolo que trate sobre el proceso de recolección de datos, de evaluación y de análisis.
Particularmente, cuando muchas personas están involucradas en el proceso, se debe
establecer un sistema de verificaciones y balances para evitar el fraude, así como el pla­
gio, la tergiversación de datos o la falsificación de resultados. Como se analizó previa­
mente en la sección 11.11.2 (páginas 412 a 415), las siguientes son algunas de las
cuestiones éticas que surgen cuando se diseñan experimentos y se analizan resultados:
• Método de recolección de datos: aleatorización.
• Consentimiento informado por parte de los sujetos humanos que son
"tratados".
• Tipo de prueba: dos extremos o un extremo.
• Selección del nivel de significación.
• Curioseo de datos.
• Depuración y elíminación de datos.
• Informe de los resultados.
• Metanálisis.
La vida de algunos seres humanos puede depender de la aceptación y aplicación de
una investigación falseada. Esto se vuelve aún más importante cuando hay involu­
cradas cuestiones éticas. Debería regresar y volver a leer la sección 11.11, de modo que
quede arraigada en su proceso de pensamiento. De nuevo, Cuando se tratan temas
sobre ética relacionados con metodología de la hipótesis prueba, la clave es la intención:
debemos diferenciar entre un análisis confirmatorio pobre y una práctica no ética. El
comportamiento no ético se presenta cuando un investigador, con conocimiento de
causa, propicia que haya parcialidad en la selección de los datos, manipula el
tratamiento de los sujetos humanos sin obtener de ellos un consentimiento informado
para hacerlo, utiliza el curioseo de datos para elegir el tipo de prueba (de dos extremos o
de un extremo) y/o el nivel de significación para su provecho, esconde los hechos
mediante la eliminación de las observaciones que no apoyan una hipótesis establecida
y no informa sobre los hallazgos pertinentes.

i e H FI Prueba de hipótesis basada en e muestras


de datos numéricos: un repaso
Como se puede ver en el diagrama resumen del presente capítulo (véase página
594), podemos distinguir entre los planteamientos para comparar e grupos que
contienen datos numéricos, basándose en el modelo de diseño experimental uti­
lizado para obtener las respuestas o resultados medidos. La metodología de la
prueba de hipótesis fue desarrollada, de manera separada, para analizar los datos
obtenidos de modelos de diseño de una dirección o completamente aleatorizados,
modelos de diseño de bloques aleatorizados y modelos de diseño factorial de dos
factores. Después de centrar nuestra atención en un agrupamiento adecuado de
procedimientos de prueba parecidos, necesitamos observar cuidadosamente las
suposiciones y los otros criterios antes de seleccionar un procedimiento en particu­
lar. En la página 526 de la sección 14.1, se le dio una lista en la que se pone énfa­
sis en los puntos importantes que se analizan en el capítulo. Revise ahora esa lista
para ver si siente que tiene un entendimiento de tales puntos clave. Para asegu­
rarse, debería ser capaz de responder las siguientes preguntas conceptuales:

Prueba de hipótesis basada en e muestras de datos numéricos: un repaso 593


n
,,¡;
QI

s:
o
Procedimientos de
e muestras
.¡:a, 1
z
)>

o lipo
Categóricos Cuestiones
'<
o.... 1 de
datos
éticas

;;¡
VI Véase
-o
..., capitulo 15
e:
Numéricos
"'o-
(D

1 1
VI
c..

"
(D


3e:
(D
....
VI Diseño Diseño Disef\o
"'..., completamente de bloques factorial
VI
aleatorio aleatorio
o::,
('l

c..
; ;
1 1

o
VI
::,
e:
3
1 \ 1 1 \ 1
Prueba de Prueba de Prueba Prueba de Sumas Modelos fijos,
(D,
..., Prueba
¡:;· Hartley para rangos de rangos de Interacción aleatorios y

r
o FANOVA FANOVA de cuadrados
VI homoscedasticidad Kruskal-Wallis Friedman mezclados

1 ' 1 í 1
1
l
1

Comparaciones Comparaciones Comparaciones Comparaciones Prueba


múltiples múltiples múltiples múltiples FANOVA

1
Comparaciones
múltiples

Sumario de la gráfica del capítulo 14.

( ¡
l. ¿Cuáles son las características distintivas de los modelos de diseño
completamente aleatorizado, de bloques aleatorizados y factorial de
dos factores?
2. ¿Cuáles son las principales suposiciones de A OVA?
3. ¿En que condiciones debe utilizarse la prueba Fmáx de Hartley?
4. ¿En qué condiciones debe seleccionarse la prueba F ANOVA de una
dirección para examinar posibles diferencias en las medias de e
poblaciones independientes?
S. ¿En qué condiciones debe seleccionarse la prueba de rangos de
Kruskal-Wallis para examinar posibles diferencias en las medianas de
e poblaciones independientes?
6. ¿Cuándo y cómo debería utilizarse el procedimiento de compara­
ciones múltiples para evaluar combinaciones por parejas de las
medias o de las medianas?
7. ¿En qué condiciones debe seleccionarse la prueba F de bloques
aleatorizados para examinar posibles diferencias en las medias de e
poblaciones relacionadas?
8. ¿En qué condiciones debería seleccionarse la prueba de rangos de
Friedman para examinar posibles diferencias en las medianas de e
poblaciones relacionadas?
9. ¿En qué condiciones debería seleccionarse la prueba F ANOVA de
dos direcciones para examinar las posibles diferencias en las medias
de cada factor de un diseño factorial?
10. ¿Qué queremos decir con el concepto de interacción en un diseño
factorial?
11. ¿Cómo podemos utilizar la prueba F ANOVA de dos direcciones para
examinar la posible interacción en los niveles de los factores de un
diseño factorial?
Revise la lista de preguntas para ver si, efectivamente, conoce las respuestas y
puede (1) explicarlas a alguna persona que no haya leído el capítulo y (2) dar refe­
rencias de lecturas específicas o de ejemplos que apoyen su respuesta. También,
vuelva a leer cualquier sección que le haya parecido confusa para ver si ahora tiene
sentido.

Juntando todo

TÉRMINOS CLAVE
alcance crítico 537 distribución F 531
aleatoriedad 539 distribución Fmáx 540
análisis de varianza (ANOVA)527 distribución (Q) de rangos
ANOVA de dos direcciones 577 studentizados 574
a posteriori 537 efectos de interacción 586
bloques 558 efectos principales 586
comparaciones múltiples 537 eficiencia relativa (RE) 567
cuadrados medios 530 error aleatorio inherente'(SSE) 561
diseño completamente aleatorizado 527 error experimental 528
diseño de bloques aleatorizados 558 grupos de tratamiento 558
diseño factorial 577 homogeneidad de varianza 539

Términos clave 595


independencia de errores 539 suma de bloques cuadrados
interacción 586 (SSBL) 560
media general o gran media 529 suma de cuadrados debida a la
interacción (SSAB) 579
modelo de efectos aleatorios 588
suma de cuadrados debida al factor A
modelo de efectos fijos 588
(SSFA) 578
modelo de efectos mezclados 588
suma de cuadrados debida al factor B
niveles 577 (SSFB) 579
procedimiento de Dunn 549 suma de errores cuadrados (SSE) 561
procedimiento de Nemenyi 574 suma dentro de cuadrados (SSW)
procedimiento de Tukey 566 suma entre cuadrados (SSA) 530
procedimiento de Tukey-Kramer 537 suma total de cuadrados (SST) 529
prueba de Fmáx de Hartley 540 tabla de resumen ANOVA 532
prueba de rangos de Friedman 571 unidades experimentales 558
prueba de rangos de Kruskal-Wallis 545 variación dentro de grupos (SSW) 530
prueba F ANOVA de bloques variación entre bloques (SSBL) 560
aleatorizado 559
variación entre grupos (SSA) 530
prueba F ANOVA de una dirección 527
variación total (SST) 529
prueba F de dos direcciones 580

Problemas de repaso del capítulo

14.50 t•füiM•i·Y·� Escriba una carta a un amigo que no ha tomado ningún curso de
estadística y explíquele de que se trata el presente capítulo. Para resaltar el
contenido del mismo, asegúrese de incorporar sus respuestas a las once pre­
guntas de repaso de la página 595.
14.51 El gerente de ventas al detalle de una cadena de supermercados desea determi­
nar si la colocación de juguetes para mascotas tiene algún efecto sobre la venta
del producto. Se van a considerar tres lugares en pasillo: anterior, en medio y
posterior. Se seleccionó una muestra aleatoria de 18 tiendas y en seis de ellas
fueron asignadas aleatoriamente un lugar en pasillo. El tamaño del área de
exhibición y el precio del producto fueron constantes en todas las tiendas. Al
final de un periodo de prueba de una semana, el volumen de ventas (en miles
de dólares) del producto en cada tienda fue el siguiente:

Colocación en pasillo
Anterior En medio Posterior
8.6 2.0 4.6
7.2 3.2 2.8
5.4 2.4 6.0
4.0 1.8 2.2
5.0 1.4 2.8
6.2 1.6 4.0

(a) Al nivel de significación de .OS, ¿existe evidencia de una diferencia en las


varianzas de las tres colocaciones en pasillo?
(b) Al nivel de significación de .OS, ¿existe evidencia de una diferencia en las
ventas promedio entre las diferentes colocaciones en pasillo?

S96 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


(c) Si es adecuado, utilice el procedimiento de Tukey-Kramer para determinar
que colocaciones en pasillo son diferentes respecto al promedio de ventas.
(Utilice el nivel a= .OS)
(d) ¿A qué conclusión debería llegar el gerente de ventas al menudeo? Discuta
completamente las opciones del gerente respecto a la colocación en
pasillo.
Suponga que, cuando se está estableciendo el experimento, el gerente de
ventas al detalle es capaz de estudiar los efectos de la altura de los estantes,
además de la colocación en pasillo. Así, en lugar del anterior modelo de diseñ.o
completamente aleatorizado de un factor, puede establecer un modelo de
diseñ.o factorial de dos factores, cada factor con tres niveles y dos réplicas para
cada combinación de colocación en pasillo-altura de estante. Esto es, se tienen
dos factores a ser estudiados: (1) colocación en pasillo (anterior, en medio y
posterior) y (2) altura en estante (superior, media, inferior). Una muestra de 18
tiendas es asignada de manera aleatoria: dos a cada una de las nueve
combinaciones colocación en pasillo-altura en estante. De nuevo, el tamañ.o
del área de exhibición y el precio del producto fueron constantes en todas las
tiendas. Al final de un periodo de prueba de una semana, el volumen de
ventas (en miles de dólares) del producto en cada tienda fue el siguiente:

Altura en estante
Colocación Superior En medio Inferior
en pasillo
Anterior 8.6 6.2 5.0
7.2 5.4 4.0
En medio 3.2 2.0 1.8
2.4 1.4 1.6
Posterior 6.0 4.0 2.8
4.6 2.8 2.2

Observe que el volumen de ventas (en miles) es el mismo en ambas tablas. En


este caso, sin embargo, las seis mediciones de resultado para cada colocación
en pasillo se presentan en grupos de dos, correspondiendo a las tres combina­
ciones de altura en estante.
(e) Al nivel de significación de O.OS:
(1) ¿Existe algún efecto debido a la colocación en pasillo?
(2) ¿Existe algún efecto debido a la altura en estante?
(3) ¿Existe alguna intuacción entre la colocación en pasillo y la altura en
estante?
(f) Trace una gráfica de las ventas promedio para cada una de las coloca­
ciones en pasillo y para cada una de las alturas en estante.
(g) Si es adecuado, utilice el procedimiento de Tukey para determinar qué
colocaciones de pasillo y qué alturas de estante difieren en las ventas.
(Utilice el nivel a= .OS.)
(h) Basándose en los resultados obtenidos, ¿a qué conclusiones puede usted
llegar respecto a las ventas? Explique su respuesta.
(i) Compare y contraste los resultados del presente problema con los
obtenidos del experimento de una dirección de los incisos (a) a (c).
Explique ampliamente su respuesta.
14.S2 Para examinar los efectos del ambiente laboral en la actitud hacia el trabajo,
un psicólogo industrial asignó de manera aleatoria un grupo de 18 agentes de
ventas recién contratados a tres "salas de trabajo": seis agentes por sala. Todas
las salas eran idénticas, excepto por su color. Una era verde claro, otra azul
claro y la tercera era rojo oscuro.
Durante el programa de entrenamiento de una semana, los agentes per­
manecieron, principalmente, en sus respectivas salas de trabajo. Al final del pro­
grama, se utilizó una escala de actitudes para mediar la actitud hacia el trabajo de
cada agente (un resultado bajo indicaba una actitud pobre y un resultado alto era
señ.al de una buena actitud). Se obtuvieron los siguientes resultados:

Problemas de repaso del capítulo 597


Color de la sala
Verde claro Azul claro Rojo oscuro
46 59 34
51 54 29
48 47 43
42 55 40
58 49 45
50 44 34

Basándose en estos datos, el psicólogo industrial desea determinar si existe


alguna evidencia de que el ambiente de trabajo (es decir el color de la sala)
tiene un efecto sobre la actitud respecto al trabajo, y si éste es el caso, qué
color o colores mejoran significativamente la actitud.
(a) Analice completamente los datos.
(Utilice el nivel a= O.OS.)
(b) PHMM·i•> Basándose en el análisis completo del inciso (a), escriba un
informe en el que se analicen las implicaciones de los hallazgos respecto al
diseño de oficinas en empresas grandes, en el entendimiento de que el
psicólogo industrial podría utilizar el informe en una reunión con el vicepresi­
dente de recursos humanos de la compañía.
Suponga que el vicepresidente desea saber si hay presente algún efecto del
sexo. Si, en la tabla anterior, las tres primeras observaciones de cada nivel de
color de sala correspondieron a hombres y las tres últimas observaciones de
cada nivel correspondieron a mujeres:
(c) De nuevo analice completamente los datos como un conjunto de resulta­
dos de un modelo de diseño factorial de dos factores (efectos fijos), en el
cual el factor sexo tiene dos niveles, el factor color de la sala tiene tres
niveles y se tienen tres réplicas para cada una de las seis combinaciones
sexo-color de sala. (Utilice el nivel a= .OS.)
(d) Compare y contraste los resultados obtenidos en el inciso (c) con los
obtenidos del experimento de una dirección del inciso (a). Explique
ampliamente su respuesta.
14.53 Un socio principal de una empresa de corretaje desea determinar si realmente
existe alguna diferencia entre el desempeño a largo plazo de las diferentes
categorías de personas contratadas como representantes ante los clientes. Los
miembros recientes de la empresa están clasificados en cuatro grupos:
profesionales que han cambiado de carrera, graduados recientes de escuelas de
negocios, antiguos agentes de ventas, y corredores de bolsa contratados por la
empresa y que trabajaban para empresas competidoras. Se selecciona una
muestra aleatoria de seis individuos de cada una de estas categorías y se
obtiene un registro de desempeño detallado.

Antecedentes de los representantes ante los clientes


graduados de escuelas
Profesionales negocios vendedores Corredores
de bolsa
88 65 61 83
85 73 67 87
95 54 74 90
96 72 65 84
91 81 68 92
88 69 77 94

(a) ¿Existe evidencia de una diferencia en los resultados de desempeño


promedio para las diferentes categorías? (Utilice el nivel a= O.OS.)
(b) PHMi•ti•> Escriba un memorándum dirigido al socio principal en el
cual le explique sus resultados.

598 Capítulo 14 ANOYA y otras pruebas de e muestras con datos numéricós


Suponga que el socio principal deseara saber si se encuentra presente algún
efecto debido al sexo de los empleados. Si en la tabla anterior las primeras tres
observaciones para cada nivel del factor de antecedentes de los representantes
ante los clientes son hombres y las tres últimas observaciones de cada nivel
corresponde a mujeres:
(c) Vuelva a analizar completamente los datos como un conjunto de resulta­
dos de un modelo de diseño factorial de dos factores (efectos fijos) en el
que el factor sexo tiene dos niveles, el factor antecedentes tiene cuatro
niveles y existen tres réplicas para cada una de las ocho combinaciones
sexo-antecedentes. (Utilice el nivel a= .05.)
(d) Compare y contraste los resultados obtenidos en el inciso (c) con los del
experimento de una dirección del inciso (a). Explique ampliamente su
respuesta.
14.54 Recientemente se efectuó una prueba de vinos patrocinada por el Club J. S.
Wine, en la que se clasificaron ocho vinos por parte de los miembros del club.
La información respecto al país de origen y el precio no fue conocida por los
catadores hasta que hubo terminado la prueba. Los vinos clasificados (y los
precios de venta) fueron:
l. Blanco francés, $8.59
2. Blanco italiano, $6.50
3. Tinto italiano, $6.50
4. Borgoña francés (tinto), $8.69
S. Borgoña francés (tinto), $9.75
6. Beaujolais de California (tinto), $8.50
7. Blanco francés, $7.75
8. Blanco de California, $11.59
Las estimaciones acumuladas sobre varias características correspondientes a los
doce miembros del club son las siguientes:

Vino
Catador 1 2 3 4 5 6 7 8
A 10 17 15 9 12 6 15 9
B 9 14 11 5 16 2 15 7
e 10 18 10 5 18 5 10 10
D 9 11 13 10 17 11 14 9
E 10 16 12 8 18 8 10 10
F 6 16 3 8 4 2 2 5
G 9 12 14 9 9 6 6 5
H 7 12 11 8 15 9 12 8
I 10 18 12 12 16 10 10 16
J 16 9 10 13 18 11 15 14
K 14 16 13 12 15 15 17 11
L 15 17 10 13 15 16 16 13

(a) Al nivel de significación de 0.01, ¿existe evidencia de una diferencia en


los resultados promedio de las estimaciones entre los vinos?
(b) ¿Qué suposiciones son necesarias con el propósito de efectuar el inciso (a)
del problema? Comente sobre la validez de tales suposiciones.
. (c) Si es adecuado, utilice el procedimiento de Tukey para determinar los
vinos que difieren en la estimación promedio. (Utilice el nivel a = .01.)
Q (d) Basándose en los resultados obtenidos en el inciso (c)
(1) ¿Piensa usted que el país de origen ha tenido un efecto sobre los resul
tados?
(2) ¿Piensa que el tipo de vino (tinto contra blanco) ha tenido algún
efecto sobre los resultados? Explique ampliamente su respuesta.
(e) Determine la eficiencia relativa del diseño de bloques aleatorizados en
comparación con el diseño completamente aleatorizado.

Problemas de repaso del capítulo S99


(f) Ignore la variable de bloqueo y vuelva a analizar "erróneamente" los datos
como si se tratara de un modelo de diseño completamente aleatorizado de
un factor en el cual el factor (marca de los vinos) tiene ocho niveles y
cada nivel contiene una muestra de doce observaciones independientes.
(g) Compare los términos SSBL y SSE del inciso (a) con el término SSW del
inciso (f). Explique.
(h) Utilizando los resultados obtenidos en los incisos (a), (f) y (g) como base,
describa los problemas que pueden surgir cuando se analizan los datos si se
aplica el procedimiento equivocado.

Proyectos de minicasos de
aprendizaje colaborativo

Para cada uno de los siguientes, ref'iérase a las instrucciones de la página 101
CL 14.1 Refiérase al CL 3.2 de la página 101, CL 4.2 de la página 165 y al CL5.2 de la
página 199. Su grupo la empresa , ha sido contratada por el edi­
tor de la sección de alimentos de una popular revista familiar para estudiar el
costo y las características de los cereales listos para comer. Armados con el
Conjunto especial de datos 2 del apéndice D de las páginas D-6 y D-7, la
empresa desea determinar si existe evidencia de una diferen­
cia en el costo promedio por ración de cereales listos para servirse, basándose
en la clasificación en alto contenido de fibra o bajo contenido de fibra.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara­
mente todas las hipótesis, niveles elegidos de significación y las suposi­
ciones de los procedimientos d� prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de alimentos de la revista.
CL 14.2 Refiérase al CL 3.3 de la página 102, CL 4.3 de la página 165 y al CL 5.3 de la
página 199. Su grupo, la empresa , ha sido contratada por el direc­
tor de comercialización de una fábrica de fragancias bien conocidas para hom­
bre y mujer, para estudiar las características de las fragancia actualmente
disponibles. Armados con el Conjunto especial de datos 3 del apéndice D de
las páginas D8 y D9, la empresa desea determinar si existe evi­
dencia de una diferencia en el costo promedio por onza, basándose en la
intensidad (muy fuerte, fuerte, medio, ligero).
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara­
mente todas las hipótesis, niveles elegidos de significación y las suposi­
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al director de
comercialización.
CL 14.3 Refiérase al CL 3.4 de la página 102, al CL 4.4 de la página 166 y al CL 5.4 de la
página 200. Su grupo, la empresa ha sido contratada por el editor
de la sección de viajes <;le un famoso periódico, quien está preparando un
artículo principal sobre cámaras compactas de 35 mm. Armados con el
Conjunto especial de datos 4 del apéndice D de las páginas D-10 y D-11, la
empresa desea determinar si existe evidencia de una diferencia en
la precisión promedio de encuadre basándose en el tipo de cámara de 35 mm.
(a) Analice completamente los datos.
(b) Escriba y entregue un resumen ejecutivo en el cual se especifiquen clara­
mente todas las hipótesis, niveles elegidos de significación y las suposi­
ciones de los procedimientos de prueba escogidos.
(c) Prepare y realice una presentación oral de cinco minutos al editor de la
sección de viajes.
_,

600 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


ESTUDIO DE CASO E: Comercialización y promoción
de prueba de un bolígrafo
La empresa Publicidad EPC ha sido con­ Los resultados combinados de las tres
tratada por un fabricante bien estable­ evaluaciones (apariencia, durabilidad y
cido de bolígrafos para desarrollar una desempeño de escritura) se presentan a
serie de anuncios publicitarios y promo­ continuación para los 30 sujetos.
ciones a nivel nacional para la próxima
temporada de vacaciones. A fin de Estimaciones de producto para
prepararse para realizar el proyecto, Nat cinco anuncios publicitarios
Berry, director de investigaciones de la
EPC, decidió empezar un estudio del
A B e D E
efecto de la publicidad sobre la percep­ 15 16 8 5 12
ción del producto. Después de tener una 18 17 7 6 19
reunión con Kate Hansen, la jefa del 17 21 10 13 18
grupo de estadística, se diseñó un experi­ 19 16 15 11 12
mento en el cual cinco diferentes anun­ 19 19 14 9 17
cios publicitarios iban a ser comparados 20 17 14 10 14
en la comercialización de un bolígrafo. El
anuncio A tendía ampliamente a subesti­
mar las características de los bolígrafos. El Como asistente de investigación de
anuncio B tendía a subestimar ligera­ Kate Hansen, usted ha sido asignado para
mente las características del producto. El trabajar en este proyecto. Tiene una cita
anuncio C tendía a sobrestimar ligera­ con ella para analizar este proyecto,
mente las características del bolígrafo. El cuando usted llega a su oficina le dice:
anuncio D tendía a sobrestimar amplia­ -Hola, pasa y siéntate. Te ofrecería una
taza de café, pero me acaban de llamar a
mente las características del bolígrafo. El
reunión, de modo que vamos a ser
anuncio E intentaba establecer correcta­ breves. at Berry cree que realmente
mente las características del producto. tiene algo importante, probar los anun­
Una muestra de 30 sujetos adultos, toma­ cios publicitarios, y espero que tenga
dos de un grupo de atención grande, fue razón. Le he sugerido que establezcamos
asignada de manera aleatoria a los cinco un modelo de diseño factorial de dos fac­
anuncios publicitarios (de modo que tores con el sexo del público como uno
hubiera seis individuos para cada anun­ de los factores y el anuncio publicitario
cio). Después de leer el anuncio y desarro­ como el segundo factor, pero Nat argu­
llar un sentido de la "expectación del menta que tendrá problemas para con­
producto", los sujetos recibieron un bolí­ vencer al director ejecutivo de efectuar
grafo para ser evaluado, sin que éstos un plan tan sofisticado. Me recordó el
supieran que se trataba del mismo tipo de principio del BESO (KlSS, en inglés, Keep
bolígrafo. A los sujetos se les pidió que It Sound and Simple: mantenlo sólido y
probaran su bolígrafo y la plausibilidad sencillo) y me dijo que cualquier cosa que
del anuncio publicitario. Luego se les fuera más allá de un modelo de diseño
pidió a los sujetos que clasificaran el bolí­ completamente aleatorizado de una
grafo de 1 a 7 respecto a las tres caracte­ dirección no pasaría con nuestros direc­
rísticas del producto; los resultados se tivos. De todos modos, Nat afirmó que
presentan a continuación: estaba preocupado principalmente por el

Extremadamente Extremadamente
mala Neutral buena
Apariencia 1 2 3 4 5 6 7
Durabilidad 2 3 4 5 6 7
Desempeño en escritura 1 2 3 4 5 6 7

Estudio del caso E 60 1


contenido de los cinco posibles anun­ Berry-. Tenemos que estar lo más
cios, de modo que el modelo de una seguros posible de que estamos reali­
dirección es lo que ha pensado para el zando un buen análisis de datos -con­
experimento. No es adecuado, sin cluyó.
embargo, que no podamos evaluar el fac­ -Bueno, Nat -intervino Kate Han­
tor sexo en los anuncios de vacaciones. sen-. Ésa es precisamente la cuestión.
Kate continuó: Estaba, y todavía lo estoy, preocupada
-Deseo estar preparada para · 1a con respecto a un efecto potencial del
reunión de la semana próxima con el sexo del auditorio que deberíamos
equipo de investigación de nuestro conocer si en realidad deseamos tener
grupo de relaciones públicas, de modo una publicidad efectiva en nuestra cam­
que no haya ninguna reacción nega­ paña. Afortunadamente, mi ayudante
tiva por el modelo que hayamos uti­ de investigación me acaba de hacer ver
lizado. Por favor, prepárame un que de las evaluaciones registradas en
resumen ejecutivo en donde me nuestra tabla, las tres primeras fueron
muestres las ventajas y las desventajas hechas por hombres y las tres últimas
del modelo de diseño completamente por mujeres, en cada uno de las cinco
aleatorizado y las del modelo de diseño muestras de anuncios. Ahora podemos
factorial de dos factores. Eso nos per­ considerar el experimento como un
mitirá analizar las dos alternativas y modelo de diseño factorial de dos fac­
avanzar en el proyecto del cliente de tores y determinar si existe un efecto
manera positiva. Me gustaría también significativo del sexo y, también, estu­
que analizaras completamente los diar alguna posible interacción.
datos que obtuvimos del experimerito -Muy bien -dijo Nat Berry.
completamente aleatorizado. Me gus­ -Perfecto -acotó John Mack.
taría tener en mi escritorio dentro de Kate Hansen cotinuó:
cuatro días un informe detallado que -Me gustaría que nos reuniéramos
resuma tus resultados e incluya, como de nuevo la semana entrante y anali­
apéndice, una discusión del análisis záramos esos resultados. os dará a
estadístico utilizado. Luego nos vamos todos la oportunidad de considerar las
a comer juntos para revisar los detalles ventajas y las desventajas del modelo
y preparar la presentación para Nat y el de dos factores respecto al modelo de un
ejecutivo en jefe. ¿Hay alguna pre­ factor que mi ayudante acaba de expon­
gunta que quieras hacer antes de ernos hace unos minutos.
empezar? ¿No? Muy bien, buena -Bueno, reunámonos otra vez la se­
suerte, y no dejes de llamarme por telé­ mana próxima, aquí mismo y a la
fono si surge algo. misma hora -ordenó Nat Berry.
John Mack continuó:
-Muy bien, pero mientras te estás
preparando para la siguiente reunión,
-----UNA SEMANA DESPUÉS ¿podrías también echarle un vistazo a
estos datos que recabé de manera pare­
Después de la presentación en la reunión cida a tu experimento? En este con­
con el equipo de investigación del grupo junto de datos la audiencia muestreada
de relaciones públicas de la agencia, el estuvo compuesta solamente por estu­
director estadístico, John Mack, sugirió diantes de preparatoria que son parte
que se tomara en cuenta un método libre del grupo objetivo, no hubo ningún
de distribución adecuado para el análisis adulto. Y los datos corresponden úni­
de los datos presentados en la tabla de la camente a las evaluaciones o respuestas
página 601. de estudiantes expuestos al anunció E,
-Muchos investigadores argumen­ que, como podrás recordar, tiene la
tarían -observó Mack- que las "escalas intención de establecer correctamente
de características del producto" utilizadas las característica del bolígrafo. Por
no satisfacen verdaderamente los criterios favor, revisa de nuevo los datos corres­
pondientes al público adulto de tu
de escalamiento de intervalo o de cociente estudio y analiza las diferencias que
y, por consiguiente, que los métodos existen en sus respuestas.
libres de distribución son más adecuados. Los ya mencionados datos de esti­

--
-John, ése podría ser un interesante mación para una muestra de ocho estu­
argumento estadístico -intervino Nat diantes de preparatoria son:

602 Capítulo 14 ANOVA y otras pruebas de e muestras con datos numéricos


14 13 15 9 2. Si existe evidencia de que la
11 13 12 16 mediana de las estima­
ciones combinadas de los
1
Usted sale de la sala de juntas pen­ entrevistados estudiantes de
sando en las últimas observaciones de preparatoria sujetos al anun­
John Mack. Además de analizar los cio E es mayor que 12.
datos originales como un modelo de Una respuesta a la primera evaluación
diseño factorial de dos factores y identificará posibles diferencias en las
preparar el análisis de las diferencias de percepciones de los adultos y de los
los resultados obtenidos utilizando ese estudiantes respecto al producto. Una
modelo y los obtenidos con el modelo respuesta a la segunda identificará si el
de diseño completamente aleatorizado producto es "preferido" por la audien­
que acaba de realizar, decide responder cia de estudiantes de preparatoria,
a las interrogantes de John evaluando puesto que una mediana de 12 es la
lo siguiente: estimación "neutral" de características
1. Si existe evidencia de una combinadas esperada: la suma de las
diferencia en las estima­ evaluaciones de apariencia, durabili­
ciones combinadas de los dad y desempeño en la escritura en las
entrevistados adultos y los tres escalas de siete puntos, en las
entrevistados estudiantes de cuales el valor 4 es neutral. Usted
preparatoria sujetos al anun­ preparará un informe detallado sobre
cio publicitario E (que
intenta establecer correcta­ esto a Kate Hansen.
mente las características del
bolígrafo).

Notas finales
l. En algunas ocasiones la variación entre grupos se conoce y como n = re, haciendo un poco de álgebra tenemos:
como variación entre dos grupos. En tales situaciones, la n -1 - (e - 1) - ( r - 1) = re - 1 - e+ 1 - r + 1
suma de los términos cuadráticos se conoce como suma
de cuadrados entre grupos o SSB (por sus siglas Sum of =re-e- r +l
Squares Between). = (r - l)(e - 1)
2. Además de este análisis exploratorio de datos, se debería 5. En esencia, en un modelo de diseño de bloques aleatori­
contemplar un planteamiento más confirmativo para zado, los bloques no tienen la misma posición que un fac­
examinar las suposiciones de un procedimiento de prueba tor. En la sección 14.10 veremos que cuando los bloques
particular, antes de decidir si el procedimiento es viable son considerados con la importancia suficiente para cons­
para un conjunto de datos dado. Para la prueba F ANOVA tituir un segundo factor, el diseño se conoce como mode­
de una dirección, las principales suposiciones son que los lo factorial de dos factores, y la prueba del efecto de cada
datos de muestra de cada grupo son tomados de maneras factor sería, potencialmente, importante.
aleatoria e independiente de una población subyacente 6. Tomaremos en consideración el caso general en el que se
normal, y que estas poblaciones tienen igual variabilidad tienen n' observaciones para cada combinación del factor
(véanse figuras 14.2 y 14.3 de las páginas 528 y 529). Para A y el factor B (es decir, cada celda). Si hay sólo una obser­
probar la condición de normalidad véase la referencia 2. vación por celda, la notación del modelo de diseño de
Para probar la igualdad de las varianzas de las pobla­ bloques aleatorizados puede utilizarse con los bloques
ciones, en la sección 14.4.7 se presenta un procedimiento considerados como un segundo factor de interés.
desarrollado por H. O. Hartley.
7. Los grados de libertad asociados con la componente de
3. Puesto que e(e - 1)/2 combinaciones por parejas se reali­ interacción (SSAB) se encuentran mediante sustracción:
zan de manera simultánea, es necesario ajustar el área de
extremo superior bajo la curva de distribución normal n - 1 - (e - 1) - (r - 1) - re(n' - 1)
estándar con el fin de obtener el valor crítico Zu adecuado y, como n = rcn', haciendo un poco de álgebra tenemos
que permita que el alcance crítico calculado mantenga un n-l - (e-l)-(r-l)-re(n' - l)=rcn' -l-e+l-r+l-rcn'+re
nivel general de significación a, a través del experimento
(véanse referencias 3 y 6). =re-e-r+l

4. Los grados de libertad asociados con la componente de = (r - l)(c - 1)


suma de errores cuadrados (SSE) se encuentran mediante
sustracción:
n - 1 - (e - 1) - (r - 1)

Notas finales 603

También podría gustarte