Distribución t-Student
La fórmula general para la T de Student es la siguiente:
En donde el numerador representa la diferencia a probar y el denominador la
desviación estándar de la diferencia llamado también Error Estándar. En esta
fórmula t representa al valor estadístico que estamos buscando X barra es el
promedio de la variable analizada de la muestra, y μ es el promedio
poblacional de la variable a estudiar. En el denominador tenemos a s como
representativo de la desviación estándar de la muestra y n el tamaño de ésta.
Grados de libertad: El número de grados de libertad es igual al tamaño de la
muestra (número de observaciones independientes) menos 1.
                                     gl = df = (n – 1) =k
La distribución t de Student o distribución t es un modelo teórico utilizado para
aproximar el momento de primer orden de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño y se desconoce la desviación típica.
En otras palabras, la distribución t es una distribución de probabilidad que estima el valor
de la media de una muestra pequeña extraída de una población que sigue una distribución
normal y de la cual no conocemos su desviación típica.
n<30 y σ desconocida, emplear para1−α=0.95 de dos colas y encontrar el valor de t
asociado.
        INTERVALO DE CONFIANZA PARA               ; CON      DESCONOCIDA
Si    y s son la media y la desviación estándar de una muestra aleatoria de una
población normal con varianza         , desconocida, un intervalo de confianza de
(       )100% para es:
donde       /2 es el valor t con   = n-1 grados de libertad, que deja un área de
/2 a la derecha.
jemplos:
     1. El contenido de siete contenedores similares de ácido sulfúrico son 9.8,
        10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza
        del 95% para la media de todos los contenedores si se supone una
        distribución aproximadamente normal.
        Solución:
        La media muestral y la desviación estándar para los datos dados son:
                                           10 y s= 0.283
        En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aquí,
        el intervalo de confianza de 95% para es:
        Con un nivel de confianza del 95% se sabe que el promedio del contenido
        de los contenedores está entre 9.47 y 10.26 litros.
   2. Un artículo publicado en el Journal of Testing and Evaluation presenta las
      siguientes 20 mediciones del tiempo de combustión residual en segundos
      de especímenes tratados de ropa de dormir para niños:
      9.85 9.93 9.75 9.77 9.67
      9.87 9.67 9.94 9.85 9.75
      9.83 9.92 9.74 9.99 9.88
      9.95 9.95 9.93 9.92 9.89
      Se desea encontrar un nivel de confianza del 95% para el tiempo de
      combustión residual promedio. Supóngase que el tiempo de combustión
      residual sigue una distribución normal.
Solución:
La media muestral y la desviación estándar para los datos dados son:
                                  9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el
intervalo de confianza de 95% para es:
Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión
residual promedio se encuentra entre 9.8073 y 9.8977 segundos.
          Pruebas de hipótesis empleando la T-Student
Si pudiera expresar en un cierto número de pasos para resolver un problema de t de student
tendría que declarar los siguientes:
Paso 1. Plantear las hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis
alternativa plantea matemáticamente lo que queremos demostrar, en tanto que la hipótesis
nula plantea exactamente lo contrario.
Paso 2. Determinar el nivel de significancia (rango de aceptación de la hipótesis
alternativa), a .
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para
aseguramiento de la calidad; y 0.10 para estudios o encuestas de mercadotecnia.
Paso 3. Evidencia muestral, se calcula la media y la desviación estándar a partir de la
muestra.
Paso 4. Se aplica la distribución T de Student para calcular la probabilidad de error por
medio de la fórmula general presentada al principio y se contrasta con el valor T obtenido
de la tabla correspondiente.
Paso 5. En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa. Si
la probabilidad de error (p) es mayor que el nivel de significancia se rechaza la hipótesis
alternativa. Si la probabilidad de error (p) es menor que  el nivel de significancia se acepta
la hipótesis alternativa.
Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos
obtenido en el problema contra el valor T crítico que obtenemos de la tabla de T de Student.
Aquí puedes bajar la tabla de T de Student: Tabla T de Student un extremo y Tabla T de
Student de dos extremos: Tabla T de Student dos extremos.
Si el resultado del problema cae en la región de H0 se acepta ésta, de lo contrario se
rechaza. Por supuesto, si rechazas H0 aceptarás H1. 
En la gráfica precedente se aprecian las regiones de aceptación y de rechazo con respecto a
H0.
Ejercicio 1: Se aplica una prueba de autoestima a 25 personas quienes obtienen una
calificación promedio de 62.1 con una desviación estándar de 5.83. Se sabe que el valor
correcto de la prueba debe ser mayor a 60. ¿Existe suficiente evidencia para comprobar que
no hay problemas de autoestima en el grupo seleccionado?
Paso 1. Hipótesis alternativa: la que se va a comprobar. El grupo no tiene problemas de
autoestima. Valor de prueba para determinar autoestima mayor a 60. Hipótesis nula, lo
contrario a la hipótesis alternativa.
H1 > 60;
H0 =< 60.
Paso 2. Determinar el nivel de significancia alfa: alfa = 0.05.
Paso 3. Resultados de la evidencia muestral: X = 62.1; s = 5.83
Paso 4. Aplicar la distribución de probabilidad calculando T:
El resultado de la ecuación es 1.8. Dado que 1.8 es mayor que 1.7109 cae en la
región de H1 y se rechaza la hipótesis nula a favor de la hipótesis alternativa.
Si buscamos el valor de 1.8 bajo la curva normal encontraremos que es
de 0.0359 el cual es menor que 0.05. La conclusión es que no hay problemas
de autoestima en el grupo estudiado. Esto con el diseño de la investigación
presentado.
Ejemplo 2: Suponga que Ud. tiene una técnica que puede modificar la edad a
la cual los niños comienzan a hablar. En su localidad, el promedio de edad en
la cual un niño emite su primera palabra es de 13.0 meses. No se conoce la
desviación estándar poblacional. Usted aplica dicha técnica a una muestra
aleatoria de 15 niños. Los resultados arrojan que la edad media muestral en la
que se pronuncia la primera palabra es de 11.0 meses, con una desviación
estándar de 3.34. Pruebe la hipótesis de que la técnica afecta la edad en que
los niños empiezan a hablar con un nivel de significancia alfa del 0.05.
Aquí las preguntas de la investigación serían ¿Cuales son las hipótesis nula y
la alternativa? y si con el procesamiento estadístico se puede afirmar que la
técnica es efectiva para modificar la edad en que los niños empiezan a hablar.
Hipótesis nula: La técnica no afecta la edad en que los niños comienzan a
hablar, matemáticamente sería, H0 = 13.0
Hipótesis alternativa: La técnica afecta la edad en que los niños comienzan a
hablar, matemáticamente sería, H1 ≠ 13.0
El resultado de Tp es -2.32. Si lo comparamos con el resultado de T crítico o
Tc obtenido de tablas con un nivel de significancia alfa de 0.05 y 14 grados de
libertad para dos extremos, el resultado de Tc es 2.145
Con los resultados anteriores se rechaza la hipótesis nula y se decide que, la técnica afecta
la edad en que los niños comienzan a hablar con un nivel de significancia de 0.05. El valor
P correspondiente si lo buscamos en la curva normal de probabilidades sería de 0.010, por
debajo del nivel de significancia.
Tabla de valores bajo la curva normal.
Ejemplo 3. Una profesora del programa de estudios para la mujer cree que la cantidad de
cigarrillos fumados por las mujeres se ha incrementado en años recientes. Un censo
realizado hace dos años con mujeres de una ciudad vecina mostró que el número promedio
de cigarrillos fumados diariamente por una mujer era de 5.4 con una desviación estándar de
2.5. Para evaluar esta hipótesis, la profesora determinó el número de cigarrillos fumados
diariamente por una muestra aleatoria de 120 mujeres que viven actualmente en la ciudad
donde habita. Los datos muestran que el número de cigarrillos fumados diariamente por las
120 mujeres tiene una media de 6.1 y una desviación estándar de 2.7. Con esa información
y un nivel de significancia de 0.05, ¿tiene razón la profesora al afirmar que la cantidad de
cigarrillos fumados por las mujeres se ha incrementado?
Los resultados de la ecuación muestran una Tp de 2.9 que, contrastada con la Tc obtenida
de tablas para un extremo que resulta en 1.6449 cae en la región de rechazo de H0. Si
calculamos P en tablas para 2.90 es 0.002, muy por debajo del 0.05 del nivel de
significancia.
Ejercicio 4. La siguiente es una tabla de resultados del coeficiente intelectual entre niños
que tienen buenas calificaciones en lectura y de aquellos que tienen bajas calificaciones en
lectura. A un nivel de significancia del 0.05, ¿hay diferencia significativa entre el
coeficiente intelectual entre los grupos? Utilice la prueba de T de Student contrastando las
hipótesis contra el valor crítico.
       No        Coeficiente Intelectual Coeficiente Intelectual de
    Progresivo    de Buenos Lectores          Malos Lectores
        1                 105                        94
        2                 110                        95
        3                 100                        93
        4                 102                        93
        5                 103                        92
        6                 104                        95
        7                 108                       100