PROBABILIDAD Y
ESTADISTICA.
Tema 1: Introducción a la estadística
Tema 1: Introducción. 1
¿PARA QUÉ SIRVE LA ESTADÍSTICA?
◼ La Ciencia se ocupa en general de fenómenos observables
◼ La Ciencia se desarrolla observando hechos, formulando
leyes que los explican y realizando experimentos para validar
o rechazar dichas leyes
◼ La Estadística se utiliza como tecnología al servicio de las
ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza
Tema 1: Introducción. 2
DEFINICIÓN
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y presentación de los
datos referentes a un fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con objeto de sintetizar
la informacion.
• Deducir las leyes que rigen esos fenómenos y poder de esa
forma hacer previsiones sobre los mismos, tomar decisiones u
obtener conclusiones.
Tema 1: Introducción. 3
POBLACIÓN, MUESTRA, PARAMETRO Y ESTADISTICO
◼ Población Es el conjunto sobre el que estamos interesados en obtener
conclusiones (hacer inferencia).
❑ Normalmente es demasiado grande para poder abarcarlo.
◼ Muestra Es un subconjunto suyo al que tenemos acceso y sobre el que
realmente hacemos las observaciones (mediciones)
❑ Debería ser “representativo”
❑ Esta formado por miembros “seleccionados” de la población (individuos,
unidades experimentales).
◼ Parámetro Es una medición numérica que describe algunas características
de una población.
◼ Estadístico Es una medición numérica que describe algunas características
de una muestra.
Tema 1: Introducción. 4
Tema 1: Introducción. 5
EJEMPLOS
1. Parámetro: En la ciudad de Nueva York hay 3250 botones para
caminar, que los peatones emplean en las intersecciones de tránsito.
Se descubrió que el 77% de dichos botones no funciona. La cifra del
77% es un parámetro porque está basada en la población de todos los
3250 botones para peatones.
2. Estadístico: Con base en una muestra de 877 ejecutivos
encuestados, se encontró que el 45% de ellos no contrataría a alguien
con un error ortográfico en su solicitud de empleo. Esta cifra del 45%
es un estadístico, ya que está basada en una muestra y no en la
población completa de todos los ejecutivos.
Tema 1: Introducción. 6
VARIABLES
◼ Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que disponemos
de cada individuo es resumida en variables.
◼ En los individuos de la población humana, de uno a
otro es variable:
❑ El grupo sanguíneo
◼ {A, B, AB, O} Var. Cualitativa
❑ Su nivel de felicidad “declarado”
◼ {Deprimido, Ni fu ni fa, Muy Feliz} Var.
Ordinal
❑ El número de hijos
◼ {0,1,2,3,...} Var. Numérica discreta
❑ La altura
◼ {1’62 ; 1’74; ...} Var. Numérica continua
Tema 1: Introducción. 7
TIPOS DE VARIABLES
◼ Cualitativas
Si sus valores no se pueden asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con ellos)
❑ Nominales: Si sus valores no se pueden ordenar
◼ Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
❑ Ordinales: Si sus valores se pueden ordenar
◼ Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
◼ Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas
con ellos)
❑ Discretas: Si toma valores enteros
◼ Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
❑ Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
◼ Altura, Presión intraocular, Dosis de medicamento administrado, edad
Tema 1: Introducción. 8
◼ Es buena idea codificar las variables como números para poder
procesarlas con facilidad en un ordenador.
◼ Es conveniente asignar “etiquetas” a los valores de las variables para
recordar qué significan los códigos numéricos.
❑ Sexo (Cualit: Códigos arbitrarios)
◼ 1 = Hombre
◼ 2 = Mujer
❑ Raza (Cualit: Códigos arbitrarios)
◼ 1 = Blanca
◼ 2 = Negra,...
❑ Felicidad Ordinal: Respetar un orden al codificar.
◼ 1 = Muy feliz
◼ 2 = Bastante feliz
◼ 3 = No demasiado feliz
◼ Se pueden asignar códigos a respuestas especiales como
◼ 0 = No sabe
◼ 99 = No contesta...
Tema 1: Introducción. 9
Tema 1: Introducción. 10
PRESENTACIÓN ORDENADA DE DATOS
7
6
Género Frec. 5
4
Hombre 4
3
2
Mujer 6 1
0
Hombre Mujer
◼ Las tablas de frecuencias y las representaciones gráficas son dos
maneras equivalentes de presentar la información. Las dos
exponen ordenadamente la información recogida en una muestra.
Tema 1: Introducción. 11
TABLAS DE FRECUENCIA
◼ Exponen la información recogida en la muestra, de forma que no se pierda nada de
información (o poca).
❑ Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad
❑ Frecuencias relativas (porcentajes): Idem, pero dividido por el total
❑ Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas
Tema 1: Introducción. 12
TABLAS DE FRECUENCIA
Número de hijos
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 0 419 27, 6 27, 8 27, 8
1 255 16, 8 16, 9 44, 7
2 375 24, 7 24, 9 69, 5
3 215 14, 2 14, 2 83, 8
4 127 8,4 8,4 92, 2
5 54 3,6 3,6 95, 8
6 24 1,6 1,6 97, 3
7 23 1,5 1,5 98, 9
Oc ho o más 17 1,1 1,1 100,0
Tot al 1509 99, 5 100,0
Perdidos No contesta 8 ,5
Tot al 1517 100,0
❑ ¿Qué porcentaje de individuos tiene menos de 3 hijos?
❑ Sol: 69,5%
❑ ¿Entre 4 y 6 hijos?
❑ Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% -
83,8% = 13,5%
Tema 1: Introducción. 13
Tema 1: Introducción. 14
Tema 1: Introducción. 15
Tema 1: Introducción. 16
DATOS DESORDENADOS Y ORDENADOS EN
TABLAS
◼ Variable: Género Género Frec. Frec. relat.
porcentaje
❑ Modalidades:
◼ H = Hombre Hombre 4 4/10=0,4=40%
◼ M = Mujer
Mujer 6 6/10=0,6=60%
10=tamaño
muestral
◼ Muestra:
MHHMMHMMMH
❑ equivale a
HHHH MMMMMM
Tema 1: Introducción. 17
Ejemplo
◼ ¿Cuántos individuos tienen Número de hijos
menos de 2 hijos?
Porcent. Porcent.
❑ frec. indiv. sin hijos
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27, 8 27, 8
= 419 + 255 1 255 16, 9 44, 7
= 674 individuos 2 375 24, 9 69, 5 ≥50%
3 215 14, 2 83, 8
◼ ¿Qué porcentaje de individuos 4 127 8,4 92, 2
tiene 6 hijos o menos? 5 54 3,6 95, 8
❑ 97,3% 6 24 1,6 97, 3
7 23 1,5 98, 9
◼ ¿Qué cantidad de hijos es tal Oc ho+ 17 1,1 100,0
que al menos el 50% de la Tot al 1509 100,0
población tiene una cantidad
inferior o igual?
❑ 2 hijos
Tema 1: Introducción. 18
Ejercicio: Se le pidió a un grupo de personas que indiquen su color
favorito, y se obtuvo los siguientes resultados:
negro azul amarillo rojo azul
azul rojo negro amarillo rojo
rojo amarillo amarillo azul rojo
negro azul rojo negro amarillo
Con los resultados obtenidos, elaborar una tabla de frecuencias
Tema 1: Introducción. 19
Solución:
En la primera columna, colocamos los valores de nuestra variable, en la segunda la
frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia relativa, y
finalmente la frecuencia relativa acumulada. Por ser el primer problema, no haremos
uso de las frecuencias porcentuales.
Frecuencia
Frecuencia Frecuencia Frecuencia
Color relativa
absoluta acumulada relativa
acumulada
Negro 4 4 0,20 0,20
Azul 5 9 0,25 0,45
Amarillo 5 14 0,25 0,70
Rojo 6 20 0,30 1
Total 20 1
Tema 1: Introducción. 20
Ejercicio: En una tienda de autos, se registra la cantidad de autos
Toyota vendidos en cada día del mes de Setiembre.
0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2;
3
Con los datos obtenidos, elaborar una tabla de frecuencias.
Tema 1: Introducción. 21
Solución:
En la primera columna, colocamos los valores de nuestra variable, en la
segunda la frecuencia absoluta, luego la frecuencia acumulada,
seguida por la frecuencia relativa, y finalmente la frecuencia relativa
acumulada. Ahora vamos a agregar la columna de frecuencia
porcentual, y frecuencia porcentual acumulada.
Frec.
Frecu
porce
Autos Frecuencia Frecuencia Frecuencia Frec. relativa encia
ntual
vendidos absoluta acumulada relativa acumulada porce
acumu
ntual
lada
0 8 8 0,267 0,267 26,7% 26,7%
1 7 15 0,233 0,500 23,3% 50,0%
2 7 22 0,233 0,733 23,3% 73,3%
3 5 27 0,167 0,900 16,7% 90,0%
4 3 30 0,100 1 10,0% 100%
Total 30 1 100%
Tema 1: Introducción. 22