Universidad Nacional Tecnológica de Lima Sur
Facultad de Ingeniería y Gestión
Escuela de Ingeniería de Sistemas
Estadística General
Mg. Myrna Manco Caycho
mmc1300@yahoo.es
Sílabo
SUMILLA
El curso es de naturaleza teórico práctico. Tiene
como propósito desarrollar los principios básicos de
la estadística descriptiva y las técnicas elementales,
adiestrando en el proceso de convertir datos
numéricos aislados en información para la toma de
decisiones.
COMPETENCIA:
Soluciona problemas a través de la reducción de la
incertidumbre, mediante el uso adecuado de los
métodos estadísticos, demostrando habilidad
analítica y espíritu crítico frente a fenómenos de su
entorno.
Myrna Manco C. 2
Contenido
I UNIDAD:
Presentación, interpretación y
análisis de datos
II UNIDAD:
Correlación. Regresión lineal
simple
III UNIDAD:
Teoría de Probabilidad.
Variable aleatoria.
Myrna Manco C. 3
Evaluación
LA EVALUACIÓN ES PERMANENTE.
Se consolida en cinco notas:
EXAMEN PARCIAL 25%
TRABAJOS ACADÉMICOS 10%
PROMEDIO DE PRÁCTICAS 20%
PROMEDIO DE LABORATORIO 20%
EXAMEN FINAL 25%
MATERIALES:
SOFTWARE EXCEL Y SW ESTADÍSTICO
Diapositivas
Myrna Manco C. 4
Bibliografía
1. Máximo Mitacc. Tópicos de Estadística y Probabilidad
2. Rufino Moya. Estadística Descriptiva
3. Rufino Moya . Probabilidades e Inferencia Estadística
4. Manuel Córdova Zamora. Estadística: Descriptiva e Inferencial.
5. Jay Devore. Probabilidad y Estadística para Ingeniería.
6. Michael Evans y J. Rosenthal. Probabilidad y Estadística para
Ingeniería y Ciencias.
VIRTUAL
1. Ejercicios Resueltos de Estadística: Tema 1:
Descripciones univariantes (60 ej. Res.)
2. Estadística I. La probabilidad. (91 ej res.)
(http://matematicasbachiller.com/libros/)
3. Microdatos del INEI www.inei.gob.pe
4. Repositorio UNTELS http://repositorio.untecs.edu.pe/
5. Biblioteca virtual CONCYTEC http://bvcyt.concytec.gob.pe/
6. Página del Colegio de Ingenieros del Perú http://www.cip.org.pe/
Myrna Manco C. 5
Estadística
Descriptiva
Tema 1: Conceptos básicos
Reflexiones
“Las herramientas estadísticas básicas deben ser
conocidas y utilizadas por todo el mundo en una
empresa, desde la alta gerencia a los operarios
en las líneas” Kaoru Ishikawa
“Llegará un día en que el
razonamiento estadístico será
tan necesario para el ciudadano
como ahora lo es la habilidad de
leer y escribir”
H.G. Wells (1866-1946)
Myrna Manco C. 7
Reflexiones
“Ningún recurso es tan escaso
en las empresas como el
conocimiento estadístico. No
hay conocimiento que pueda
contribuir tanto a mejorar la
calidad, productividad y
competitividad de las
empresas como el de los
métodos estadísticos”
E. Deming
Myrna Manco C. 8
Método estadístico
La investigación estadística se desarrolla
utilizando el ciclo deductivo-inductivo en las
siguientes cuatro etapas:
PLANIFICACIÓN DEL ESTUDIO
RECOLECCIÓN DE LOS DATOS
ORGANIZACIÓN Y CLASIFICACIÓN DE LOS
DATOS RECOGIDOS
ANÁLISIS E INTERPRETACIÓN DE LOS
RESULTADOS
Myrna Manco C. 9
1.PLANIFICACIÓN DEL ESTUDIO
Para quedar enteramente caracterizado debe dar respuesta a las siguientes
interrogantes fundamentales:
¿Qué vamos a estudiar o investigar? – NATURALEZA DEL PROBLEMA
¿Por qué se va a investigar? JUSTIFICACIÓN (pasado)
¿Para qué se va a investigar? – IMPORTANCIA (futuro)
¿Qué pretendemos alcanzar? - OBJETIVOS
¿Sobre quién recae la investigación? ¿Dónde se va a realizar? ¿Cuándo se va a
realizar? - POBLACIÓN
¿Existen estudios ya realizados sobre el tema? ESTADO DEL ARTE
¿Cuál es la respuesta que el investigador propone para el problema? HIPÓTESIS
¿Cómo se va a verificar la hipótesis? – METODOLOGÍA
Sólo cuando se está en condiciones de dar respuesta a todos y cada una de esas
interrogantes se puede redactar el PROYECTO de un trabajo de investigación, que
es el documento básico.
Myrna Manco C. 10
INFLUENCIA DEL FOMENTO A LA SOSTENIBILIDAD
AMBIENTAL SOBRE LAS ACTITUDES DE LOS
HABITANTES DEL DISTRITO DE CHUPACA - JUNIN, 2010
¿Qué influencia ejerce el fomento de la Sostenibilidad Ambiental
PROBLEMA: en las actitudes de los habitantes del distrito de Chupaca - Junín
en el 2010?
Determinar la influencia que ejerce el fomento de la Sostenibilidad
OBJETIVO: Ambiental en las actitudes de los habitantes del distrito de
Chupaca – Junín el año 2010.
El fomento de la Sostenibilidad Ambiental influye en las actitudes
HIPÓTESIS:
de los habitantes del distrito de Chupca – Junín en el año 2010 .
TIPO: Aplicada Instrumento:
METODOLOGÍA NIVEL: Explicativo Cuestionario
METODO: Experimental de Encuesta
RECOLECCIÓN DE LOS DATOS
La recolección correcta de los datos es de
extrema importancia para el investigador, que
tiene que ser realizada o vigilada por él. Esta
etapa consiste en: determinar los métodos de
recolección, preparar los instrumentos de
recolección, prueba del método y de los
instrumentos de recolección seleccionados, y
realizar la recolección de los datos.
Myrna Manco C. 12
ORGANIZACIÓN Y CLASIFICACIÓN DE LOS DATOS
RECOGIDOS
Aquí se debe hacer un análisis de
consistencia y ajuste de los datos. Se
trata de asegurar la validez y confiabilidad
de los datos recopilados. Luego se debe
clasificar y tabular los datos y finalmente
presentarlos en cuadros estadísticos y
gráficas.
Myrna Manco C. 13
ANÁLISIS E INTERPRETACIÓN DE LOS
RESULTADOS
En esta etapa se calculan indicadores y
medidas resumen que describen al
conjunto de datos. También se establece
relaciones entre variables de modelos
estadísticos que nos permitirán aceptar o
rechazar los modelos.
Myrna Manco C. 14
FUENTES DE RECOLECCIÓN DE DATOS
Aquellos que el investigador obtiene directamente de la
Primarias
realidad, recolectándolos con sus propios instrumentos.
Son característicos de los estudios prospectivos y los diseños
experimentales.
Las técnicas para recolectarlos, incluyen la observación,
entrevista, encuesta y la psicometría.
Según su
procedencia
Son registros escritos que proceden también de un contacto con la
práctica, pero que ya han sido recogidos y muchas veces
procesados por otros investigadores. Los datos gozan del suficiente
Secundarias nivel de pertinencia, objetividad, validez y confiabilidad como para
ser usados en la investigación sin tener que repetir los
procedimientos de recolección directa o indirecta.
Técnicas para recolectarlos: Documentación
Ejm. Reporte académico, revisión de Historias clínicas, informes
operatorios, reportes de servicio técnico recibido, archivos del
sistema de salud pública; registro de estadísticas vitales
(nacimientos, defunciones,matrimonios, etc.
Tipos de
instrumentos
16
Lista de
Cotejo
Utilizado para
realizar
observaciones sin
participación
directa de los
evaluados.
Ejm: Para medir
las competencias
de los estudiantes
17
Cuestionario
Utilizado para
obtener registros
individuales de
cada caso.
Estructura de un cuestionario
Sección 1: Identificación del cuestionario
Objeto de la investigación
Garantía de confidencialidad
Sección 2: Cuerpo de preguntas
Preguntas generales
Preguntas propiamente de la investigación
Agradecimiento
• Debe evitarse cuestionarios demasiado extensos.
• Las preguntas deben ser redactadas de manera clara y precisa.
• Las preguntas deben ordenarse coherentemente.
• Deben evitarse preguntas que resulten comprometedoras para el
entrevistado.
• Deben evitarse respuestas que exijan trabajo por parte del entrevistado.
Myrna Manco C. 19
Tipos de preguntas
Podemos encontrar diversas clasificaciones de las preguntas, atendiendo a
criterios como su función, finalidad o tipo de análisis estadísticos. Los tipos
más habituales de preguntas son:.
1. Según el tipo de respuesta que se desea obtener y la
libertad que se concede al entrevistado para expresarse cuando
contesta:
Preguntas abiertas. En estas preguntas no se establece ningún tipo de
respuesta, el entrevistado puede expresarse con sus propias palabras. Se
emplea en preguntas exploratorias o cuando no se puede presumir la
reacción u opinión del entrevistado. También cuando es conveniente
establecer un contacto cálido dejando que el entrevistado se exprese
libremente, o después de una pregunta de opinión,
j
¿Cuál es actualmente, a su juicio, el principal problema de su país?
Elena Romero Montero y Antonio Rueda Clausell - INSTITUTO NACIONAL
Myrna Manco C. DE ESTADÍSTICA 20
Preguntas cerradas. En estas preguntas, por el contrario, el
entrevistado no puede salirse de unas categorías impuestas en el
cuestionario. Proporcionan una serie de ventajas como mayor rapidez y
comodidad a la hora de recoger los datos, y eliminan la ambigüedad de
las preguntas abiertas. Son las más utilizadas para diseñar un
cuestionario.
Existen dos tipos de preguntas cerradas: las preguntas dicotómicas y
preguntas de alternativa múltiple.
Myrna Manco C. 21
Preguntas semicerradas. El
entrevistado además de la lista
cerrada de respuestas, puede añadir
espontáneamente algo que no está
previsto en el cuestionario. Es
preferible probar este tipo de
preguntas antes de implementarlas
y tratar de cerrar las opciones para
que todas las respuestas tengan el
mismo peso y todos los
entrevistados tengan las mismas
posibilidades de responderlas.
Myrna Manco C. 22
2. Según su función dentro del cuestionario:
Preguntas filtro. Su función es la de evitar que se formulen
determinadas preguntas a personas a quienes no van destinadas. Se
realizan previamente a otra pregunta o grupo de preguntas para no
abordar con las siguientes a aquellas entrevistados que no les afecte el
tema. Así, por ejemplo, si se quiere saber a qué lugar ha viajado el
entrevistado, no se debe hacer la pregunta a quien previamente
haya respondido que no ha salido de viaje.
Es importante que en el cuestionario vayan señalizadas de forma clara
para facilitar la labor del entrevistador. Para señalizar los flujos se emplean
flechas, cuadros y notas.
Myrna Manco C. 23
Preguntas control o de identificación. Son un tipo de preguntas que
no pueden faltar en ningún cuestionario. Generalmente se refieren a las
características básicas del entrevistado como sexo, edad, ocupación y se
usan para agrupar a los entrevistados por categorías sociodemográficas
para ayudar en el análisis posterior de los datos.
Preguntas de consistencia. Tienen como finalidad asegurar la veracidad
y fiabilidad de las respuestas. Se trata de preguntas similares, pero
redactadas de forma distinta, que se sitúan distanciadas entre sí para ver si
las respuestas son congruentes.
Otros tipos: preguntas introductorias (para aproximar al entrevistado al
tema de la investigación), de cambio de tema (para pasar de un tema a
otro evitando rupturas que fomenten el desinterés de los entrevistados),
etc.
Myrna Manco C. 24
Myrna Manco C. 25
Myrna Manco C. 26
Definición
La Estadística es la Ciencia de la
• Sistematización, recojo, ordenación y
presentación de los datos referentes a un fenómeno
que presenta variabilidad o incertidumbre para su
estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Myrna Manco C. 27
Estadística Descriptiva
Myrna Manco C. 28
Estadística Inferencial
Myrna Manco C. 29
Población y muestra
Ejemplos de Población
Las edades de todos los estudiantes de la UNTELS en el
semestre 2016-0
La calidad (Extra, primera, segunda) de los tomates de la
primera cosecha del año 2007 de la cooperativa san Juan.
La velocidad de la bobina de las máquinas de soldadura de una
empresa.
Si no se indica el tiempo , considerar que corresponde al
momento actual.
Muestra es un subconjunto suyo al que tenemos acceso y
sobre el que realmente hacemos las observaciones (mediciones
o conteos)
Debería ser “representativo”
Debería tener un tamaño apropiado
Esta formado por miembros “seleccionados” de la población
(individuos, unidades experimentales).
Myrna Manco C. 30
Unidad estadística
Unidad de la cual se obtiene el dato estadístico.
Las unidades de análisis pueden corresponder a las
siguientes categorías o entidades:
Personas
Grupos humanos (familia)
Poblaciones completas (lotes completos de un
producto)
Unidades geográficas determinadas (países)
Eventos o interacciones sociales (accidentes,
reparaciones, casos de infecciones intrahospitalarias,
etc)
Entidades intangibles, susceptibles de medir
(exámenes, días camas)
Myrna Manco C. 31
Parámetro y estadísticos
Parámetros: Media poblacional (), varianza poblacional (2 ) y
proporción poblacional ().
Ejemplo:
La estatura media de todos los estudiantes de la UNTELS.
El ingreso mediano de todos los jubilados del Perú.
Volumen total de exportaciones del Perú en el año 2004 (en millones de
dólares).
La proporción de todos los ingenieros peruanos que usaron tarjeta Visa
en el último mes.
Estadísticos: Media muestral ( ), varianza muestral (S2) y proporción
muestral (p).
Ejemplo:
Los ingresos medios de los jubilados del Perú, con 40 años de
aportaciones.
Volumen total de exportaciones de espárragos del Perú en el año 2004.
La proporción de ejecutivos que usaron tarjeta Visa en el último mes los
días miércoles.
Myrna Manco C. 32
Tipos de variables
Cualitativas o Categóricas
Nominales
Ordinales
Cuantitativas o Numéricas
Discretas
Continuas
Myrna Manco C. 33
Los posibles valores de una variable suelen denominarse modalidades.
Las modalidades pueden agruparse en clases (intervalos)
Edades:
Menos de 20 años, de 20 a 50 años, más de 50 años
Hijos:
Menos de 3 hijos, De 3 a 5, 6 o más hijos
Las modalidades/clases deben formar un sistema exhaustivo y
excluyente
Exhaustivo: No podemos olvidar ningún posible valor de la variable
Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
Bien: ¿Cuál es su grupo sanguíneo? (A,O,B,AB)
Excluyente: Nadie puede presentar dos valores
simultáneos de la variable
Estudio sobre el ocio
Mal: De los siguientes, qué le gusta: (deporte, cine)
Bien: Le gusta el deporte: (Sí, No)
Bien: Le gusta el cine: (Sí, No)
Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
Myrna Manco C. 34
Clasifique las siguientes variables según su tipo:
Nº VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Velocidad de un automóvil en kilómetros por hora.
2 Tiempo de uso diario de una computadora (horas)
3 Uso principal de la computadora personal
4 Número de suscripciones a revistas de computación.
5 Cantidad de dinero gastado en libros (nuevos soles)
6 Número de raciones distribuidas en un programa social
7 Tiempo empleado por un teniente para acceder al aula
virtual
8 Número de libros en un estante de librería
9 El grado académico de un profesional
Myrna Manco C. 35
ESCALAS DE MEDICIÓN
1. Presentación ordenada de datos variable cualitativa
Tabla 1
Distribución de estudiantes según opinión sobre la Racionalización del agua
Forma de Racionalizar el agua FRECUENCIA PORCENTAJE
CORTE DE AGUA EN CIERTAS HORAS 13 16%
MULTAS 21 27%
US DE CAÑOS AHORRADORES 40 51%
OTROS 5 6%
TOTAL 79 100%
Fuente: Elaboración propia
6%
16%
27%
51%
Figura 1 Distribución de estudiantes según
opinión sobre racionalización del agua
Fuente: Tabla 1
1. Otros gráficos para variables cualitativas
Gráfico de Barras Pictograma: Ventas de carne de cerdo el fin de semana
Pictograma
Gráfico de Barras apiladas
¿Sueles alimentarte en …
Gráfico de Barras agrupadas
100
60 Las barras/sectores
51
50 80 25 circulares deben ser
40 mutuamente
30 26 25 60 excluyentes
16
20 11
7 40 11 51
10
0
20 26
OBU
16 CASA
7
CALLE CASA OBU 0 FÍSICA MATEMÁTICA CALLE 38
Elementos de Tabla/Gráfico:
Título y fuente
Perú: Población Universitaria por Estamento, según tipo de universidad. 2010
Nº Alumnos Nº de Docentes Nº Trabajadores
Tipo de
Pre Pos Administrativo y de Total
universidad Universitarios
grado grado Servicios
Pública 309175 24591 21434 19961 375161
Privada 473795 31767 37651 19056 562269
Total 782970 56358 59085 39017 937430
Fuente: INEI
39
2. Distribuciones de frecuencias - variable
cuantitativa discreta (con pocos valores)
Interpretación: El 29% de los clientes compró 1 artículo. El 76% de los clientes
compró a lo más 4 artículos. Sólo el 8% de los clientes compraron de 7 a 17
artículos.
40
Gráficos para variables cuantitativas discretas (pocos
valores) - Frecuencias simples
Dotplot of Artículos
3 6 9 12 15
Artículos
Gráfico de Puntos (Dotplot) Gráfico de Bastones
La distribución de la variable “Número de artículos” es asimétrica a la derecha.
Existe variabilidad en los datos y aparentemente hay valores extremos.
Cincuenta y seis clientes llevan de 1 a 2 artículos.
41
Gráficos para variables cuantitativas discretas –
Frecuencias acumuladas
Gráfico de
“escalera”
42
3. Tabla de frecuencia - Variable cuantitativa discreta con
muchos valores y variable cuantitativa continua
Rango o recorrido (R)
Intervalos :
Nº de intervalos (K) :
K=1+3.3log(n) Método de Sturges
Amplitud del intervalo (Ci) : Ci = R/K
• Marca de clase (Yi) :
• Frecuencia total o número de observaciones (n):
43
Tiempos de traslado
Sean los tiempos 60 15 60
de traslado que
requiere un grupo 40 80 120
de estudiantes 40 70 15
para trasladarse
desde su casa
120 90 120
hasta su centro de 105 80 60
estudios. 50 90 100
Construir la
respectiva tabla de 60 120 15
frecuencias 80 45 90
90 120 90
90 50 50
Myrna Manco C. 44
Frecuencias - Variable cuantitativa discreta con
muchos valores y variable cuantitativa continua
[y’i-1 – y’i> Yi fi Fi Fi↑ Hi Hi↑
y’0 – y’1 Y1 f1 F1 F1↑ H1 H1↑
y’1 – y’2 y2 f2 F2 F2↑ H2 H2↑
...
y’k-1 – y’k yk fk Fk Fk↑ Hk Hk↑
Total n
45
Gráficos para variables cuantitativas discretas con
muchos valores y cuantitativas continuas
46
Gráficos para variables cuantitativas discretas con
muchos valores y cuantitativas continuas
Interpretación: La mayor
frecuencia ocurre en la
primera clase. Los
datos se distribuyen
asimétricamente, se
han realizado muchas
ventas bajas y pocas
ventas altas. Existe
variabilidad en los
datos. Hay indicios de
la presencia de valores
extremos.
47
Algunos tipos de histograma
Tomado de Estadística descriptiva y
probabilidades. Jorge Chue Gallardo y
otros
48
Gráficos para variables cuantitativas discretas con
muchos valores y cuantitativas continuas
POLÍGONO DE FRECUENCIAS: Se origina al unir los puntos medios de los
lados superiores de las barras de un histograma.
Interpretación: Conforme
aumenta el monto de
las ventas netas el
número de ventas
disminuye. Hay un
decrecimiento
dramático a partir de
aprox $66.
49
Gráficos para variables cuantitativas discretas con
muchos valores y cuantitativas continuas
OJIVA: Permite determinar aproximadamente cuántas observaciones se hallan
por arriba o por debajo de los límites superiores de clase.
Interpretación: El punto
máximo ocurre en
aprox $270 o más. El
comportamiento de la
ojiva indica que su
crecimiento es rápido
en las primeras clases
y termina con un
crecimiento más lento
50
Ejercicio
Sea n el número total de observaciones realizadas de la variable X se
pide matematizar las propiedades existentes en una tabla de
frecuencia.
[y’i-1 – y’i> Yi fi hi Fi Fi↑ Hi Hi↑
y’0 – y’1 Y1 f1 h1 F1 F1↑ H1 H1↑
y’1 – y’2 y2 f2 h2 F2 F2↑ H2 H2↑
...
y’k-1 – y’k yk fk hk Fk Fk↑ Hk Hk↑
Total n 1
51
Completar la siguiente tabla
Tomado de Máximo Mitacc Meza – Tópicos de Estadística Descriptiva y
Probabilidad.
Valores fi hi Fi
1 4 0,08
2 4
3 0,16 16
4 7 0,14
5 5 28
6 38
7 7 0,14 45
8
52
,
,
,
,
•De una tabla de distribución de frecuencias de 6 intervalos de amplitud
constante, se tiene la siguiente in formación:
Y2 550, Y5 8 5 0 H1 h6 0.04
H4 0.76
h2 0.14 h5 0.20 H3 h2 0.26
.
Reconstruir la tabla de distribución de frecuencias.
53
Salarios
En una compañía, el sueldo mínimo y máximo de 200 empleados
es de $150 y $300 respectivamente. Tales sueldos se tabulan en
una distribución de frecuencias de 5 intervalos de igual amplitud. Si
se sabe que 20 empleados ganan al menos $150, pero menos de
$180, 60 ganan menos de $210, 110 ganan menos de $240, 180
ganan menos de $270 y el 10% restante de empleados gana a lo
más $300.
A) Reconstruir la distribución.
B) Graficar su histograma
C) Graficar polígono de frecuencias
D) Graficar ojiva menor que
E) Graficar ojiva mayor que
Tomado de: Córdova Zamora
54