11 No Paramètrico y Factorial2
11 No Paramètrico y Factorial2
Pruebas no paramétricas
5.1 Introducción
Las pruebas estadísticas con las que se encuentran más familiarizados los investigadores
y a las que se dedica la mayor parte de los libre de texto son las referidas a la estadística
paramétrica. Las pruebas estadísticas correspondientes se aplican principalmente a datos
de tipo cuantitativo y cada una de ellas tiene algunos supuestos que deben ser verificados
antes de la realización de la prueba.
Además del problema de los supuestos, algunos experimentos o estudios que se deseen
realizar producen respuestas que no es posible evaluar con la escala que tiene más
ventajas, por ejemplo, cuando los datos solamente se encuentran en una escala ordinal
como cuando se evalúan las habilidades de los vendedores, o el atractivo de cinco
modelos de casas, o la preferencia por sabor de una determinada marca de yogurt. En
general, aspectos como la habilidad o preferencias de un alimento o producto, solamente
los podemos ordenar, resultados de este tipo se presentan frecuentemente en estudio de
mercado y en otro del campo de las ciencias sociales.
Las pruebas que se mencionarán son las que se podrían necesitar con mayor frecuencia.
Algunas de las pruebas no paramétricas permiten analizar datos sólo en escala nominal
u ordinal mientras que otras pruevas pueden ser aplicadas para datos de cualquier escala.
60
5.3 Cuadro comparativo de las Pruebas Paramétricas con las No Paramétricas
Mediante este cuadro se pretende brindar un resumen que ayude al fácil uso de las
pruebas no paramétricas.
Ventajas:
Desventajas:
Aspectos Generales
61
Esta prueba sirve para probar la hipótesis nula de que varias poblaciones tienen las
mismas medianas. Así, es el equivalente no paramétrico del diseño completamente al
azar de un factor de análisis de la varianza.
Es decir, esta prueba puede ser utilizada cuando no se cumplen las suposiciones de que
las poblaciones de las cuales se extraen las muestras no están distribuidas normalmente
con variancias iguales, o cuando los datos constan sólo de rangos.
Supuestos
a. Las n1, n2,…, nk observaciones de los k grupos se combian en una sola serie de tamaño
n y se disponen en orden de magnitud desde la más pequeña hasta la más grande. Cuando
dos o más observaciones tienen el mismo valor, a cada una de ellas se le asigna la media
de los rangos con los cuales está relacionado.
b. Los rangos asignados a las observaciones en cada uno de los k grupos se suman por
separado para dar k sumas de rangos.
𝑛𝑖
𝑅𝑖 = ∑ 𝑅(𝑋)𝑖𝑗
𝑗=1
𝑘
1 𝑅𝑖2 𝑛(𝑛 + 1)2 2
𝑇 = 2 [∑ − ] ~𝜒(1−𝛼,𝑘−1)
𝑆 𝑛𝑖 4
𝑖=1
Donde:
𝑘 𝑛𝑖
1 𝑛(𝑛 + 1)2
𝑆2 = [∑ ∑ 𝑅2 (𝑋𝑖𝑗 ) − ]
𝑛−1 4
𝑖=1 𝑗=1
𝑛(𝑛+1)2
Si no hay empates 𝑆 2 se simplifica a , entonces T se simplifica a:
4
𝑘
12 𝑅𝑖2 2
𝑇 = {[ ] [∑ ]} − 3(𝑛 + 1)~𝜒(1−𝛼,𝑘−1)
𝑛(𝑛 + 1) 𝑛𝑖
𝑖=1
Donde:
n: Tamaño total de la muestra.
Rj: Suma de los rangos de la j-ésima muestra o grupo de tratamientos.
nj: Número de observaciones de la j-ésima muestra.
62
k: Número de tratamientos o grupos.
𝑅𝑖 𝑅𝑗
| − |
𝑛𝑖 𝑛𝑗
𝑆 2 (𝑛−1−𝑇) 1 1
Con 𝐴𝐿𝑆(𝐾𝑊 ) = 𝑡(1−𝛼,𝑛−𝑘) √[ ( + )]
2 𝑛−𝑘 𝑛
𝑖 𝑛 𝑗
𝑅 𝑅
𝑗 𝑆 2 (𝑛−1−𝑇) 1 1
Así, si: |𝑛𝑖 − 𝑛 | > 𝑡(1−𝛼,𝑛−𝑘) √[ ( + )]
𝑖 𝑗 2 𝑛−𝑘 𝑛 𝑛𝑖 𝑗
63
Ejemplo1
Quince alumnos del curso técnico son aleatoriamente asignados a tres tipo diferentes de
métodos de instrucción, todos los cuales persiguen el desarrollo de un nivel específico de
habilidad en diseño asistido por computadora. Para analizar la efectividad de los programas
se realizó una prueba consistente en 100 preguntas del tipo verdadero y falso. Las calificaciones
de la prueba de aprovechamiento al término de la unidad de instrucción se reportan en la
siguiente tabla:
Pruebe si al menos uno de los métodos produce calificaciones distintas. Use un nivel de
significación de 0.05.
a. Ordenando datos
b. Hipótesis
H0: Las calificaciones bajo los métodos de instrucción en estudio son las mismas.
Hp: Las calificaciones bajo los métodos de instrucción en estudio no son las mismas.
𝛼 = 0.05
c. Prueba Estadística
𝑘
1 𝑅𝑖2 𝑛(𝑛 + 1)2 2
𝑇 = 2 [∑ − ] ~𝜒(1−𝛼,𝑘−1)
𝑆 𝑛𝑖 4
𝑖=1
Donde:
64
𝑘 𝑛𝑖
1 𝑛(𝑛 + 1)2
𝑆2 = [∑ ∑ 𝑅2 (𝑋𝑖𝑗 ) − ]
𝑛−1 4
𝑖=1 𝑗=1
Desarrollo de la Prueba
1 15(15 + 1)2
𝑆2 = [(122 + ⋯ + 12 ) − ] = 1239.5 − 960 = 19.9643
15 − 1 4
Criterio de Decisión
2
Como 𝜒(0.95,2) = 5.99 < 6.917 ,se rechaza H0
d. Comparación de medias
Como las calificaciones no son las mismas bajo al menos uno de los métodos de instrucción se
debe proceder a realizar pruebas de comparación.
𝛼 = 0.05
𝑆 2 (𝑛 − 1 − 𝑇 ) 1 1
𝐴𝐿𝑆(𝐾𝑊 ) = 𝑡(1−𝛼,𝑛−𝑘) √[ ( + )]
2 𝑛−𝑘 𝑛𝑖 𝑛𝑗
65
19.9643(15 − 1 − 6.917) 1 1
𝐴𝐿𝑆(𝐾𝑊 ) = 𝑡(0.975,12) √[ ( + )] = 2.18(2.17) = 4.7306
15 − 3 5 5
𝑅𝑖 𝑅𝑗
Comparaciones | − | ALS(KW) Sig
𝑛𝑖 𝑛𝑗
42 57.5
A1 vs A2 | − | = 3.3 4.7306 n.s.
5 5
42 20.5
A1 vs A3 | − | = 3.9 4.7306 n.s.
5 5
57.5 20.5
A2 vs A3 | − | = 7.2 4.7306 *
5 5
Conclusión
A un nivel de significación de 0.05 se puede afirmar que las puntuaciones de los estudiantes que
utilizaron los métodos A2 y A3 difieren significativamente.
A un nivel de significación de 0.05 no se puede afirmar que las puntuaciones de los estudiantes
que utilizaron los métodos A1 y A2 difieren significativamente.
A un nivel de significación de 0.05 no se puede afirmar que las puntuaciones de los estudiantes
que utilizaron los métodos A1 y A3 difieren significativamente.
Resumen
M3 M1 M2
_________
H = 6.50 DF = 2 P = 0.039
H = 6.52 DF = 2 P = 0.038 (adjusted for ties)
66
Ejemplo 2
Un inversionista desea construir un gran centro comercial en una ciudad. Se elegirá aquella
ciudad donde se demuestre que se tienen los mayores ingresos familiares promedio. Para tomar
la decisión más adecuada selecciona al azar muestras de familias provenientes de 3 ciudades.
Los resultados en (miles de soles) se presentan a continuación:
A un nivel de significación de 0.05, diga Ud en que ciudad se debe construir el centro comercial.
Solución
Conclusión
A un nivel de significación de 0.05, no existe evidencia estadística para rechazar H0.
Por lo tanto, no se puede afirmar que los errores no se distribuyan normalmente.
Homogeneidad de varianzas
H0: 𝜎12 = 𝜎22 = 𝜎32
H1: Al menos un 𝜎𝑖2 es diferente 𝑖 = 1,2,3
𝛼 = 0.05
Pvalor = 0.009
Conclusión: A un nivel de significación de 0.05, existe evidencia estadística para afirmar que
las variancias de los tratamientos sean heterogéneas.
67
Probability Plot of RESI1
Normal
Mean 2.66453SE – 16
91 StDev 0.6376
N 15
81 AD 0.310
P-Value 0.516
71
61
Percent
51
41
31
21
11
1
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
RESI1
Bartlett's Test
Test Statistic 9.42
P-Value 0.009
1
Levene's Test
Test Statistic 4.11
P-Value 0.044
Ciudad
0 1 2 3 4 5
95% Bonferroni Confidence Intervals for StDevs
68
5.7 Prueba de Friedman
5.7.2 Supuestos
𝑘 𝑏 𝑘
2 1
𝐴 = ∑ ∑[𝑅(𝑋𝑖𝑗 )] 𝐵 = ∑ 𝑅𝑖2
𝑏
𝑖=1 𝑗=1 𝑖=1
𝑏2 𝑘(𝑘 + 1)2
(𝑘 − 1) [𝑏𝐵 − ]
4
𝑇= ~𝜒[(2 𝑘−1),1−𝛼]
𝑏𝑘 (𝑘 + 1)2
𝐴−
4
𝑏𝑘(𝑘+1)(2𝑘+1)
𝐴= y por lo tanto, la expresión de T se reduce a:
6
𝑘
12
𝑇= ∑ 𝑅𝑖2 − 3𝑏(𝑘 + 1)~𝜒[(2 𝑘−1),1−𝛼]
𝑏𝑘 (𝑘 + 1)
𝑖=1
69
d. Comparar este valor calculado con el valor 𝜒2 tabulado con k-1 grados de libertad y 1-
α.
2
Si 𝑇 > 𝜒(1−𝛼,𝑘−1) se rechaza H0.
2𝑏(𝐴 − 𝐵)
|𝑅𝑖 − 𝑅𝑗 | > 𝑡(1−𝛼,(𝑏−1)(𝑘−1))√
2 (𝑏 − 1)(𝑘 − 1)
70
Ejercicio 3
Se está realizando un experimento para analizar el sabor de una nueva marca de gaseosa cola
antes de que se lance al mercado. Las marcas de gaseosas colas en comparación fueron dadas
a 5 jueces especializados y se estableció una escala de valores de (1-5) donde 1 es el de peor
sabor y 5 el de mejor sabor.
Solución
a. Hipótesis
𝛼 = 0.05
b. Prueba Estadística
𝑏2 𝑘 (𝑘 + 1)2
(𝑘 − 1) [𝑏𝐵 − ]
4
𝑇=
𝑏𝑘 (𝑘 + 1)2
𝐴− 4
71
Donde:
𝑘 𝑏 𝑘
2 1
𝐴 = ∑ ∑[𝑅(𝑋𝑖𝑗 )] 𝐵 = ∑ 𝑅𝑖2
𝑏
𝑖=1 𝑗=1 𝑖=1
Desarrollo de la prueba
52 4(4 + 1)2
(4 − 1) [5(143.3) − ]
4
𝑇= = 11.93
5(4)(4 + 1)2
148 −
4
2
Criterio de Decisión: Como 𝜒(0.95,3) = 7.81 < 11.93 se rechaza H0
Conclusión
A un nivel de significación de 0.05 se puede afirmar que las gaseosas de sabor cola en estudio
no tienen igual preferencia.
c. Comparación
𝛼 = 0.05
72
2𝑏(𝐴 − 𝐵) 2(5)(148 − 143.3)
𝐴𝐿𝑆(𝐹𝑟) = 𝑡(1−𝛼,(𝑏−1)(𝑘−1)) √ = 𝑡(0.975,(5−1)(4−1)) √
2 (𝑏 − 1)(𝑘 − 1) (5 − 1)(4 − 1)
= 2.18(3.92)
𝐴𝐿𝑆(𝐹𝑟) = 8.538
Resumen
C2 C3 C4 C1
Se puede afirmar a un nivel de significación de 0.05 que la cola de mayor preferencia en cuanto
al sabor, es la Cola 1.
73
6. Experimentos factoriales
De esta forma se debe dejar en claro que el diseño de tratamientos es independiente del
diseño experimental, el cual hace referencia a la manera en que los tratamientos se
aleatorizan a las diferentes unidades experimentales y la forma como se controla la
variabilidad natural de las mismas. Así el diseño experimental puede ser completamente
aleatorizado, bloques completamente aleatorizados, cuadros latinos, etc., y para cada
uno de estos diseños se puede tener un arreglo factorial.
a. Factor
Los factores son designados por letras mayúsculas. Por ejemplo, en un experimento en el
que se evalúan 3 cantidades de semilla con 4 dosis de nitrógeno por parcela y 2 variedades
de maíz destinado a chala, el factor cantidad de semilla se puede denotar por A, el factor
dosis de nitrógeno por B y el factor variedad de maíz por C.
b. Niveles de un Factor
Los niveles de un factor son denotados por letras minúsculas con subíndices. Por ejemplo,
las 3 cantidades de semilla podrían ser denotadas por a1, a2 y a3, las 4 dosis de nitrógeno
por b1, b2, b3 y b4, y las 2 variedades de maíz por c1 y c2.
Una combinación de letras minúsculas con sus respectivos subíndices es utilizada para
denotar una combinación de los niveles de los factores. Por ejemplo, la combinación
a2b2c1 denotará el tratamiento conformado por la aplicación de la cantidad a2 de semilla
con la dosis b2 de nitrógeno y la variedad c1 de maíz.
c. Tipos de Factores
Dependiendo de la naturaleza de los niveles de los factores, estos pueden ser cualitativos
o cuantitativos. En el ejemplo, los factores A y B son cuantitativos y el factor C cualitativo.
En el caso de factores cuantitativos, estos pueden ser igualmente espaciados o no. Así, por
ejemplo, para el factor B, niveles de 0, 10, 20 y 30 kg/parcela y de 10, 20, 40 y 80
kg/parcela constituirían niveles igualmente espaciados y no igualmente espaciados
respectivamente.
Adicionalmente, los factores pueden ser fijos o al azar, dependiendo de la forma en que
son seleccionados sus niveles (ver capítulo II). Un experimento factorial con todos sus
factores fijos corresponderá a un modelo I o de efectos fijos, un experimento factorial con
todos sus factores aleatorios corresponderá a un modelo II o de efectos aleatorios y un
experimento factorial con algunos factores fijos y otros aleatorios corresponderá a un
modelo III o de efectos mixtos. En el desarrollo de este capítulo se considerará que todos
los factores son fijos.
75
6.4 Efectos en los Experimentos Factoriales
Efecto Principal: Es el efecto de un factor en promedio sobre los niveles de los otros
factores.
Efecto de Interacción: Está dado por la variación que tiene un efecto simple de un factor
al pasar de un nivel a otro de otro factor.
Efecto Cruzado: Está dado por las combinaciones cruzadas de dos factores.
Efectos Simples:
- de A en b1: ES(A(b1)) = a1 b1 – a2 b1 = 54 – 45 = 9
- de A en b2: ES(A(b2)) = a1 b2 – a2 b2 = 38 – 56 = -18
- de B en a1: ES(B(a1)) = a1 b1 – a1 b2 = 54 – 38 = 16
- de B en a2: ES(B(a2)) = a2 b1 – a2 b2 = 45 – 56 = -11
Efectos Principales:
1 9−18
- de 𝐴: EP(𝐴) = 2 [ES(𝐴(𝑏1 )) + ES(𝐴(𝑏2 ))] = = −4.5
2
1 16−11
- de 𝐵: EP(𝐵) = 2 [ES(𝐵(𝑎1 )) + ES(𝐵(𝑎2 ))] = = 2.5
2
Efecto de Interacción:
1 9+18
- de 𝐴𝐵: EI(𝐴𝐵) = 2𝑥2 [ES(𝐴(𝑏1 )) + ES(𝐴(𝑏2 ))] = = 6.75
2
1 16+11
EI(𝐴𝐵) = 2𝑥2 [ES(𝐵(𝑎1 )) + ES(𝐵(𝑎2 ))] = 2
= 6.75
Efectos cruzados:
76
La interacción entre dos factores puede también analizarse gráficamente. El gráfico de la
interacción presenta las medias de los niveles de un factor en cada uno de los niveles del
otro. Con los datos del ejemplo se tienen los siguientes gráficos:
B A
55
55
------ b2 ------ a2
---- - - - - a1
b1
50
50
mean of Y
mean of Y
45
45
40
40
a1 a2 b1 b2
A B
Cada línea corresponde a un efecto simple, y la interacción puede notarse cuando las líneas tienen
pendientes diferentes, esto es, cuando el efecto simple de un factor no es el mismo en todos los
niveles del otro. En el primer gráfico se presentan los efectos simples de A en b1 (línea punteada)
y de A en b2 (línea continua) y es claro que el efecto de A depende del nivel de B (esto es, que
existe interacción). A continuación se presenta otro ejemplo de interacción:
B A
48
48
------ b2 ------ a2
- - - - b1 - - - - a1
46
46
mean of Y
mean of Y
44
44
42
42
40
40
38
38
a1 a2 b1 b2
A B
Note que no es necesario que las líneas se crucen para evidenciar una interacción entre ambos
factores. Un caso de factores sin interacción aparente sería el siguiente:
45
45
B A
------ b2 ------ a2
- - - - b1 - - - - a1
40
40
mean of Y
mean of Y
35
35
30
30
a1 a2 b1 b2
A B
77
6.5 Experimento Factorial pxq
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 𝑖 = 1, … , 𝑡
Ahora, dado que los tratamientos son generados por las combinaciones entre los niveles
de dos factores, el efecto de los tratamientos se descompone en el efecto del factor A, el
efecto del factor B y el efecto de la interacción entre los dos factores. Así, el modelo aditivo
lineal para un factorial pxq en DCA será:
donde:
𝑌𝑖𝑗𝑘 es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésimo nivel
del factor B, k-ésima repetición.
𝜇 es el efecto de la media general.
𝛼𝑖 es el efecto del i-ésimo nivel del factor A.
𝛽𝑗 es el efecto del j-ésimo nivel del factor B.
(𝛼𝛽)𝑖𝑗 es el efecto de la interacción en el i-ésimo nivel del factor A, j-ésimo nivel del
factor B.
𝜀𝑖𝑗𝑘 es el efecto del error experimental en el i-ésimo nivel del factor A, j-ésimo nivel del
factor B, k-ésima repetición.
𝑝 es el número de niveles del factor A.
𝑞 es el número de niveles del factor B.
𝑟𝑖𝑗 es el número de repeticiones en el i-ésimo nivel del factor A, j-ésimo nivel del factor
B.
donde:
Los supuestos del modelo serán los mismos que para el DCA o DBCA con un solo factor
vistos en capítulos anteriores. Los cálculos y procedimientos presentados de aquí en
adelante corresponderán al caso del experimento factorial pxq en DBCA. El caso del
experimento factorial en DCA es similar al del DBCA y será ilustrado mediante un
ejemplo.
78
Ejemplo 2 (Experimento Factorial en DBCA)
a1 a2
Campos b1 b2 b3 b1 b2 b3
1 1.9 1.8 2.7 1.8 2.9 3.0
2 2.3 2.1 2.4 2.2 2.7 3.2
3 2.0 2.4 2.9 2.0 3.2 2.9
4 2.1 2.9 2.8 2.4 3.5 3.4
Total 8.3 9.2 10.8 8.4 12.3 12.5
donde:
𝑌𝑖𝑗𝑘 es el valor o rendimiento de maíz en Tm/Ha obtenido con el i-ésimo tipo de abono,
j-ésima dosis, k-ésimo campo de cultivo.
𝜇 es el efecto de la media general.
𝛼𝑖 es el efecto del i-ésimo tipo de abono.
𝛽𝑗 es el efecto del j-ésima dosis de abono.
(𝛼𝛽)𝑖𝑗 es el efecto de la interacción en el i-ésimo tipo de abono, j-ésima dosis.
𝛾𝑘 es el efecto del k-ésimo campo de cultivo.
𝜀𝑖𝑗𝑘 es el efecto del error experimental en el i-ésimo tipo de abono, j-ésima dosis, k-ésimo
campo de cultivo.
𝑝 = 2 es el número de niveles del factor A.
𝑞 = 3 es el número de niveles del factor B.
b = 4 es el número de bloques.
Los efectos del modelo 𝜇, 𝛼𝑖 , 𝛽𝑗 , (𝛼𝛽)𝑖𝑗 y 𝛾𝑘 son estimados de modo que se minimice
la siguiente expresión (Método de Mínimos Cuadrados):
𝑝 𝑞 𝑏 𝑝 𝑞 𝑏
2 2
𝑄= ∑ ∑ ∑ 𝜀𝑖𝑗𝑘 = ∑ ∑ ∑(𝑌𝑖𝑗𝑘 − 𝜇 − 𝛼𝑖 − 𝛽𝑗 − (𝛼𝛽)𝑖𝑗 − 𝛾𝑘 )
𝑖=1 𝑗=1 𝑘=1 𝑖=1 𝑗=1 𝑘=1
∑ 𝛼𝑖 = 0 ∑ 𝛽𝑗 = 0 ∑(𝛼𝛽)𝑖𝑗 = 0 ∑(𝛼𝛽)𝑖𝑗 = 0 ∑ 𝛾𝑘 = 0
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑘=1
79
La aplicación de este método da los siguientes resultados para la estimación de los parámetros:
Ejemplo 2 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
𝜇̂ = 𝑌̅••• = 2.5625
El efecto estimado de la interacción entre el nivel 1 del factor A y el nivel 2 del factor B:
𝜀̂234 = 𝑌234 − 𝑌̅23• − 𝑌̅••4 + 𝑌̅••• = 3.4 − 3.125 − 2.85 + 2.5625 = −0.0125
c. Análisis de Variancia
80
La variabilidad correspondiente a los tratamientos, la cual corresponde al efecto
combinado de los factores A y B, se calcula por:
𝑝 𝑞
2
𝑌𝑖𝑗•
SC(Comb. 𝐴𝐵) = SC(𝐴) + SC(𝐵) + SC(𝐴𝐵) = ∑ ∑ − 𝑇𝐶
𝑏
𝑖=1 𝑗=1
Las sumas de cuadrado para los factores A y B, para la interacción, bloques y error se
calculan de la siguiente manera:
𝑝
2
𝑌𝑖••
SC(𝐴) = ∑ − 𝑇𝐶
𝑞𝑏
𝑖=1
𝑞
2
𝑌•𝑗•
SC(𝐵) = ∑ − 𝑇𝐶
𝑝𝑏
𝑗=1
𝑏
2
𝑌••𝑘
SC(Bloques) = ∑ − 𝑇𝐶
𝑝𝑞
𝑘=1
Cuadro ANVA
81
Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los niveles
de los factores, las siguientes:
2
Para el efecto de la interacción AB: H0 : 𝜎𝛼𝛽 =0
2
H1 : 𝜎𝛼𝛽 > 0
Estadístico de Prueba:
CM(𝐴)
Para el efecto principal de A: 𝐹𝑐 = ~𝐹(gl(𝐴),gl(Error))
CM(Error)
CM(𝐵)
Para el efecto principal de B: 𝐹𝑐 = CM(Error) ~𝐹(gl(𝐵),gl(Error))
CM(𝐴𝐵)
Para el efecto de la interacción AB: 𝐹𝑐 = CM(Error) ~𝐹(gl(𝐴𝐵),gl(Error))
Regla de Decisión:
𝑝 𝑞 𝑏
2
2 𝑌•••
SC(Total) = ∑ ∑ ∑ 𝑌𝑖𝑗𝑘 −
𝑝𝑞𝑏
𝑖=1 𝑗=1 𝑘=1
61.52
= (1.92 + 2.32 + ⋯ + 3.42 ) − (2)(3)(4) = 6.0763
𝑝 𝑞
2
𝑌𝑖𝑗•
SC(Comb. 𝐴𝐵) = ∑ ∑ − 𝑇𝐶
𝑏
𝑖=1 𝑗=1
𝑝
2
𝑌𝑖••
SC(𝐴) = ∑ − 𝑇𝐶
𝑞𝑏
𝑖=1
𝑞
2
𝑌•𝑗•
SC(𝐵) = ∑ − 𝑇𝐶
𝑝𝑏
𝑗=1
83
Cuadro ANVA
CME 0.0532
𝑐𝑣 = √ =√ = 9%
̅
𝑌••• 2.5625
Este análisis debe ser efectuado en el caso que la interacción resulte significativa y consiste
en evaluar a cada factor en cada uno de los niveles del otro. Las hipótesis a contrastar en
este caso, asumiento un Modelo I (Efectos fijos), son los siguientes:
84
b. Para el efecto simple de B en el i-ésimo nviel de A:
Los grados de libertad para cada efecto simple serán iguales a los grados de libertad del
correspondiente efecto principal y las sumas de cuadrados son calculadas de acuerdo con
las siguientes fórmulas:
Para cada efecto simple el estadístico de prueba Fc se calcula dividiendo el cuadrado medio
del efecto simple entre el cuadrado medio del error. El efecto será significativo con un
nivel de significación 𝛼 si es que el Fc es mayor que el valor F de tabla con los grados de
libertad del efecto y del error.
𝑝
2 2
𝑌𝑖2• 𝑌•2• 9.22 12.32 21.52
SC(𝐴𝑏2 ) = ∑ − = + − = 1.20125
𝑏 𝑝𝑏 4 4 (2)(4)
𝑖=1
𝑝
2 2
𝑌𝑖3• 𝑌•3• 10.82 12.52 23.32
SC(𝐴𝑏3 ) = ∑ − = + − = 0.36125
𝑏 𝑝𝑏 4 4 (2)(4)
𝑖=1
𝑞
2 2
𝑌1𝑗• 𝑌1•• 8.32 9.22 10.82 28.32
SC(𝐵𝑎1 ) = ∑ − = + + − = 0.80167
𝑏 𝑞𝑏 4 4 4 (3)(4)
𝑖=1
𝑞
2 2
𝑌2𝑗• 𝑌2•• 8.42 12.32 12.52 33.22
SC(𝐵𝑎2 ) = ∑ − = + + − = 2.67167
𝑏 𝑞𝑏 4 4 4 (3)(4)
𝑖=1
85
Cuadro ANVA para efectos simples
Los efectos simples del factor A son comparados con el valor de tabla 𝐹(0.95,1,15) = 4.54 y los
efectos simples del factor B con 𝐹(0.95,2,15) = 3.68. Note que sólo el efecto simple de A en b1
resulta no significativo. Las conclusiones en este experimento serían las siguientes:
• No existe suficiente evidencia estadística para aceptar que con los dos tipos de abono se
obtengan resultados diferentes en el rendimiento de maíz cuando se aplican en la dosis b1
(20 kg/ha).
• Existe suficiente evidencia estadística para aceptar que con los dos tipos de abono se
obtienen resultados diferentes en el rendimiento del maíz cuando se aplican las dosis b2
(30 kg/ha) y b3 (40 kg/ha).
• Existe suficiente evidencia estadística para aceptar que con al menos una de las dosis se
obtienen resultados diferentes en el rendimiento de maíz tanto con el abono a1 como con
el a2.
86
Estos resultados pueden apreciarse en el siguiente gráfico:
B A
------ 3 ------ 2
3.0
3.0
----2 ----1
……… 1
2.8
2.8
mean of Y
mean of Y
2.6
2.6
2.4
2.4
2.2
2.2
1 2 1 2 3
A B
Para comparar las medias de los niveles i y j de un factor sobre todos los niveles del otro
utilice las siguientes fórmulas para la desviación estándar:
CME CME
Tukey 𝑆𝑑 = √ 𝑆𝑑 = √
𝑞𝑏 𝑝𝑏
Para comparar las medias de los niveles k y l de un factor en un nivel del otro uitlice las
siguientes fórmulas para las desviaciones estándar:
CME CME
Tukey 𝑆𝑑 = √ 𝑆𝑑 = √
𝑏 𝑏
87
Ejemplo 2 (Cont.): En el análisis de variancia de efectos simples se obtuvo resultados
significativos para los efectos simples de A en b2, A en b3, B en a1 y B en a2. Dado que el
factor A sólo tiene dos niveles, no será necesario efectuar pruebas de comparaciones múltiples.
En el factor B, en cambio, sí se podrían realizar comparaciones por pares entre sus tres niveles.
A continuación se presenta la prueba Tukey para B en a1.
CME 0.05319
ALS(T) = AES(T)√ = 3.67√ = 0.4232
𝑏 4
Ejemplo 2 (Cont.): Ahora se aplicará la prueba t para evaluar si con el nivel 3 de B se obtienen
mejores resultados que con el nivel 1 cuando se aplica el abono 2.
H0 : 𝜇21• = 𝜇23•
H1 : 𝜇21• < 𝜇23•
El valor de tabla con 𝛼 = 5% y 15 grados de libertad para el error 𝑡(0.05,15) = −1.753. Como
estadístico de prueba resulta menor que el valor de tabla, se rechaza H0 y se concluye que
existe suficiente evidencia estadística para aceptar que con las dosis 3 se obtienen mejores
resultados que con la dosis 1 cuando se aplica el abono de tipo 2.
88
Ejemplo 3 (Experimento factorial en DCA)
Los siguientes datos muestran los aumentos de peso en gramos de ratas machos bajo 6
tratamientos de alimentación en un experimento conducido en un DCA. Los factores en estudio
y los resultados del experimento son:
a1 a2 a3
b1 b2 b1 b2 b1 b2
88 83 91 107 64 93
74 102 81 95 83 78
90 108 75 97 74 95
83 104 101 80 73 97
335 397 348 379 294 363
a. Modelo Aditivo Lineal: En este caso el diseño utilizado es un DCA, por lo que el modelo
aditivo lineal será el siguiente:
donde:
𝑌𝑖𝑗𝑘 es la ganancia de peso obtenida con la i-ésima fuente de proteína en la j-ésima dosis,
k-ésima repetición.
𝜇 es el efecto de la media general.
𝛼𝑖 es el efecto de la i-ésima fuente de proteína.
𝛽𝑗 es el efecto de la j-ésima dosis de proteína.
(𝛼𝛽)𝑖𝑗 es el efecto de la interacción en la i-ésima fuente de proteína, j-ésima dosis.
𝜀𝑖𝑗𝑘 es el efecto del error experimental en la i-ésima fuente de proteína, j-ésima dosis, k-
ésima repetición.
𝑝 = 3 es el número de niveles del factor A.
𝑞 = 2 es el número de niveles del factor B.
r = 4 es el número de repeticiones.
𝜇̂ = 𝑌̅••• = 88.17
c. Análisis de variancia:
𝜌 𝑞 𝑟
2 𝑌⋯2 21162
𝑆𝐶 (𝑇𝑜𝑡𝑎𝑙 ) = ∑. ∑. ∑ 𝑌𝑖𝑗𝑘 − = (882 + 742 + ⋯ + 972 ) − = 3329.33
𝑝𝑞𝑟 (3)(2)(4)
𝑖=1 𝑗=1 𝑘=1
𝜌 𝑞
2 3352 3972 3632 21162
𝑆𝐶 (𝐶𝑜𝑚𝑏𝐴𝐵 ) = ∑. ∑ 𝑌𝑖𝑗. − 𝑇𝐶 = ( + +⋯+ )− = 1635.33
4 4 4 (3)(2)(4)
𝑖=1 𝑗=1
𝜌
𝑌𝑖..2 7322 7272 6572 21162
𝑆𝐶 (𝐴) = ∑ − 𝑇𝐶 = ( + + )− = 439.58
𝑞𝑟 2∗4 2∗4 2∗4 (3)(2)(4)
𝑖=1
𝑞
𝑌.𝑗.2 9772 11392 21162
𝑆𝐶 (𝐵) = ∑ − 𝑇𝐶 = ( + )− = 1093.5
𝑝𝑟 3∗4 3∗4 (3)(2)(4)
𝑖=1
Cuadro ANVA
Fuente de Gl SC CM Fc
variación
A 2 439.58 219.79 2.34
B 1 1093.5 1093.5 11.62
AB 2 102.25 51.13 0.54
Error 18 1694.00 94.11
experimental
Total 23 3329.33
90
Para un modelo de efectos fijos las hipótesis serán:
𝐻0 : 𝛼𝑖 = 0 𝑖 = 1,2,3
𝐻1 : 𝛼𝑖 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔𝑢𝑛 𝑖
𝐻0 : 𝛽𝑗 = 0 𝑗 = 1,2
𝐻1 : 𝛽𝑗 ≠ 0 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑎𝑙𝑔𝑢𝑛 𝑗
Para la interacción el estadístico de prueba es Fc= 0.54 y el valor de tabla, con un nivel de
significación del 5% es 𝐹(0.95,2,18)) = 3.55. como el estadístico de prueba resulta menor que el
valor de tabla no se rechaza Ho y se concluye que no hay suficiente evidencia estadística para
aceptar la existencia de interacción entre la fuente de proteína y la dosis. Dado que la interacción
resulta no significativa, las conclusiones para un factor serán independientes del otro; por lo tanto,
se procede al análisis de los efectos principales.
Para el factor A se obtiene un Fc de 2.34 menor que el valor de la tabla 𝐹(0.95,2,18)) = 3.55, por lo
que se rechaza Ho y se concluye que no existe suficiente evidencia estadística para aceptar que
con al menos una de las fuentes de proteína se obtenga una ganancia de peso diferente en las razas.
Para el factor B en cambio, se obtiene un Fc de 11.62 mayor que el valor de la tabla 𝐹(0.95,2,18)) =
4.41, por lo tanto se rechaza Ho y se concluye que si existe suficiente evidencia estadística para
aceptar que la ganancia de peso de las ratas es diferente en as dos dosis de proteína.
El coeficiente de variación para este experimento es:
√𝐶𝑀𝐸 √94.11
𝑐𝑣 = = = 11%
𝑌̅ … 88.17
91
Ejemplo 4
a. Ordenando los datos y hallando las sumatorias respectivas para los tratamientos,
especies, porciones y bloques tenemos:
A B C
Especie p1 p2 p3 p1 p2 p3 p1 p2 p3
Porcion 95 67 74 74 71 68 87 70 67
I 90 68 64 85 68 73 93 75 70
673
II 686
III 87 78 67 79 69 65 89 69 71 674
272 213 205 238 208 206 269 214 208 2033
p1 779 p2 635 p3 619 2033
A 690 B 652 C 691
2033
92
b. Efectuando los cálculos para el ANVA tenemos:
Ft
Fuentes de
GL SC CM Fc 5% 1%
variaciòn
Bloques 2 11.62963 5.814815 0.3168 3.634 6.226 ns
Tratamientos 8 1970.2963 246.287 13.417 2.591 3.89 **
Especie 2 109.85185 54.92593 2.9922 3.634 6.226 ns
Porcion 2 1725.6296 862.8148 47.003 3.634 6.226 **
ExP 4 134.81481 33.7037 1.8361 3.007 4.773 ns
Error 16 293.7037 18.35648
Total 26 2275.6296
√CMErr
CV = Promedio total x 100
√18.35648148
CV = 75.2962963 x 100
CV = 5.69%
El Coeficiente de variabilidad nos indica que los datos son homogéneos, y que por lo tanto
podemos continuar con los análisis
93
c. Comparación de medias
Se encontró diferencias altamente significativas (con un 99% de certeza) entre los tratamientos
y entre las porciones, por lo que es necesario efectuar la prueba de Tukey para determinar cuál
es el mejor de los tratamientos, y cuál es la mejor porción.
Para efectuar la prueba de Tukey entre los tratamientos, en primer lugar hallamos el valor
crítico de Tukey de la siguiente forma:
18.35648148
W1% = 6.22 √ = 15.39
3
18.35648148
W5% = 5.03 √ = 12.44
3
Efectuando los constrastes entre las diferencias de promedios y los valores críticos de
Tukey tenemos:
94
CP1 89.67 0.00 10.34 18.34 18.67 20.34 20.34 21.00 21.34
BP1 79.33 0.00 8.00 8.33 10.00 10.00 10.66 11.00
CP2 71.33 0.00 0.33 2.00 2.00 2.66 3.00
AP2 71.00 0.00 1.67 1.67 2.33 2.67
BP1 69.33 0.00 0.00 0.66 1.00
CP3 69.33 0.00 0.66 1.00
BP3 68.67 0.00 0.34
AP3 68.33 0.00
Se observa que los valores de la parte sombreada son superiores a los valores de Tukey al 1%
y al 5%, por lo tanto a estas celdas le correspondería dos asteriscos como señal de que existen
diferencias entre los tratamientos comparados.
Grupo
Tratamient Promedi 5% 1%
o AP o 90.67 a a
1
CP1 89.67 a b a b
BP1 79.33 a b c a b c
CP2 71.33 c c
AP 71.00 c c
2
BP1 69.33 c c
CP3 69.33 c c
BP3 68.67 c c
AP 68.33 c c
3
Se concluye, con un 99% de certeza, de que los tratamientos: AP1, CP1 y BP1 son
estadísticamente iguales, y que al mismo tiempo son superiores al resto de tratamientos.
De la misma forma efectuamos la prueba de Tukey para las porciones, donde los valores críticos de
Tukey son los siguientes:
18.35648148
W1% = 4.78 √ = 6.82
9
18.35648148
W5% = 3.65 √ = 5.21
9
P1 P2 P3
86.556 70.556 68.778
P1 86.556 0 16 17.778
P2 70.556 0 1.778
P3 68.778 0
95
Efectuando los constrastes entre las diferencias de promedios y los valores críticos de
Tukey tenemos:
P1 P2 P3
86.556 70.556 68.778
P1 86.556 0 16 17.778
P2 70.556 0 1.778
P3 68.778 0
Grupo
Porcion Promedio 5% 1%
a a
P2
P1 70.556
86.556 b b
P3 68.778 b b
Se encontró con un 99% de certeza que la porción 1 tiene un mejor efecto en el peso
de los peces.
96
Bloque I Bloque II Bloque III Bloque IV
C B A C A B A C B B C A
D D4 D D3 D D2 D D2 D3 D2 D D4
25
1 24 12
1 27 19 20 418 23 15 18 24
1 10
D2 D3 D3 D D4 D D2 D3 D D3 D4 D3
20 13 11 26
1 14 11
1 22 22 18
1 16 25 15
D D D4 D2 D2 D4 D D4 D4 D D3 D
429 13
1 14 25 22 29 17
1 16 19 17
1 27 12
1
D D2 D2 D4 D3 D3 D D D2 D4 D2 D2
332 28 8 23 16 23 311 23
1 19 20 26 13
97
Ejemplo con R
A B C
Bloque
p1 p2 p3 p1 p2 p3 p1 p2 p3
I 95 67 74 74 71 68 87 70 67
II 90 68 64 85 68 73 93 75 70
III 87 78 67 79 69 65 89 69 71
22
a. Ordenando los datos
canal<-odbcDriverConnect()
peso<-sqlFetch(canal,"peso")
str(peso)
b. Análisis de Variancia
attach(peso)
modelo<-aov(Peso~Bloque+Especie+Porcion+Especie*Porcion)
summary(modelo)
cv.model(modelo)
[1] 5.690116
El Coeficiente de variabilidad nos indica que los datos son homogéneos, y que por lo tanto podemos
continuar con los análisis
Se encontró diferencias altamente significativas (con un 99% de certeza) entre las porciones, por lo que
es necesario efectuar la prueba de Tukey para determinar cuál es la mejor porción.
Asi mismo, con un 90% de probabilidades también se encontró diferencias entre las especies.
23
c. Comparación de medias
Se encontró que la porción 1 es la que produce mejor ganancia de peso entre los peces al
final del experimento.
Se encontró que la porción 1 es la que produce mejor ganancia de peso entre los peces al
final del experimento.
24
Prueba de Tukey al 15% para Especies
HSD.test(Peso,Especie,16,18.36, alpha=0.15)
25
Ejemplo 2
N60 N120
P60 P120 P60 P120
k60 k120 k60 k120 k60 k120 k60 k120
i ii 37.6 41.15 41.2 43.55 37.55 38.7 36.65 39.45
iii 36.85 41.95 42.65 44.25 38.15 39.9 39.55 43.15
iv 35.7 39.3 41.35 43.6 37.9 43.15 37.95 42.15
v 36.35 34.65 39.3 44.8 41.85 36.4 32.05 44.45
37.85 37.1 39.05 35.65 37.7 35.55 35.95 39.45
Ordenando los datos (ver anexo 6) del problema planteado para que R pueda reconocerlo
fácilmente y para iniciar los análisis de variancia y pruebas de Tukey respectivamente
26
Análisis de Variancia
attach(fertilizantes)
summary(modelo)
cv.model(modelo)
[1] 5.845661
El Coeficiente de variabilidad nos indica que los datos son homogéneos, y que por lo tanto
podemos continuar con los análisis
Se encontró diferencias altamente significativas (con un 99% de certeza) entre las dosis
de Fosforo y de Potasio, por lo que es necesario efectuar la prueba de Tukey para
determinar cuál es la mejor dosis de Fosforo, y cuál es la mejor dosis de Potasio.
27
Prueba de Tukey para el Fosforo al 5%
HSD.test(Rendimiento,Fosforo,28,5.275)
Se encontró, con un 95% de probabilidades, que el fosforo al nivel de 120 produce mejores
rendimientos en el cultivo de arroz.
Se encontró, con un 95% de probabilidades, que el potasio al nivel de 120 produce mejores
rendimientos en el cultivo de arroz.
28
Prueba de Tukey para la interacción NxP al 5%
> HSD.test(Rendimiento,Nitrogeno:Fosforo,28,5.275)
29
Interpretación de la Prueba de Tukey al 1% para la interacción NxP
30
Prueba de Tukey para la interacción NxPxK al 1%
HSD.test(Rendimiento,Nitrogeno:Fosforo:Potasio,28,5.275,alpha=0.01)
31