1
Paso 4 - Descripción de la
información
Estudiante:
Pablo Andrés Suarez Rocha
Ingeniería en Sistemas
Grupo: 204040_87
Tutor: Jesus Alfredo Morales García
Universidad Nacional Abierta y a Distancia-UNAD
Escuela de Ciencias Básicas, Tecnología e Ingeniería- ECBTI
Estadística
Descriptiva Duitama -
Boyacá mayo de 2022
2
Introducción
En el desarrollo del presente trabajo, estaremos viendo temáticas sobre medidas estadísticas
bivariantes, buscando aplicarlas en el desarrollo de diferentes situaciones a lo largo de la actividad,
reforzamos los conocimientos sobre cálculo e interpretación del software, utilizando herramientas en
Excel y demás para el cálculo en diferentes puntos de la actividad.
3
Justificación
La presente actividad se realiza con el fin de aplicar las medidas estadísticas bivariantes, por medio
del cálculo e interpretación del software estadístico, en función de la problemática objeto de estudio.
Por medio del desarrollo de actividades prácticas para una mejor comprensión de las diferentes
temáticas, incluso reforzando conocimientos de temáticas vistas anteriormente.
4
Objetivos
- Crear un mentefacto conceptual que resuma de manera clara las medidas estadísticas bivariantes de
regresión y correlación.
- Comprender de manera clara los conceptos sobre regresión y correlación.
- Desarrollar ejercicios con el fin de reforzar las temáticas vistas y cada uno de los conceptos básicos
consultados en la unidad 3.
5
1. Mentefacto Conceptual
Resumir mediante un mentefacto conceptual las medidas estadísticas Bivariantes de
regresión y correlación.
2. Definición de Conceptos.
Definir brevemente los conceptos básicos asociados a Regresión y Correlación como:
Diagrama de dispersión.
Se usa comúnmente para mostrar como dos variables se relacionan entre sí. De este modo,
permite estudiar las relaciones que existen entre dos factores, problemas o causa
relacionadas con la calidad, o un problema de calidad y su posible causa.
Correlación lineal simple.
Trata de establecer la relación o dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional, donde se tiene en cuenta la dispersión de
los datos con respecto a la media, lo que se define como covarianza en estadística:
“Técnica estadística usada para medir la cercanía de la relación lineal entre dos o mas
variables en una escala de intervalo”
Coeficiente de determinación R2
El coeficiente de determinación, denominado R2 y pronunciado R cuadrado, es un
estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es
predecir resultados futuros o probar una hipótesis.
Correlación positiva y correlación negativa
6
Dos variables se correlacionan en sentido inverso. A valores altos de una de ellas le
suelen corresponder valores bajos de la otra y viceversa. Cuanto más próximo a -1 el
coeficiente de concordancias más patente será esta covariación extrema. Si r=-1 se
hablara de consecuencia negativa perfecta, lo que supone una determinación absoluta
entre las dos variables. Existe una relación funcional perfecta entre ambas (una relación
lineal de pendiente negativo).
¿Qué nos ayuda a medir le el coeficiente de correlación lineal?
Podemos definir el coeficiente de correlación de Pearson como un índice que puede
utilizarse para medir el grado de relación de dos variables y cuando ambas sean
cuantitativas y continuas.
Regresión lineal simple
Tratamos de explicar la relación que existe entre la variable respuesta Y y una única
variable explicativa X.
Regresión lineal múltiple
Es un modelo estadístico versátil para evaluar las relaciones entre un destino continuo y
los predictores. Los predictores pueden ser campos continuos, categóricos o derivados, de
modo que las relaciones no lineales también estén soportadas. El modelo es lineal porque
consiste en términos de aditivos en los que cada término es un predictor que se multiplica
por un coeficiente estimado. El término de constante (intercepción) también se añade
normalmente al modelo.
3. Ejercicio práctico.
3.2. Procedimiento manual – Procedimiento automático
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman
medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un
antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta
correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se haría uso
habitual del método automático. Los datos obtenidos son los siguientes:
7
a. Realice el diagrama de dispersión y determine el tipo de asociación entre
las variables.
R/ El tipo de asociación entre las dos variables es positivo ya que mientras va aumentando la
variable independiente la cual pertenece al Procedimiento Manual (X), así mismo aumenta la
variable dependiente Procedimiento Automático (Y)
b. Encuentre el coeficiente de determinación y correlación.
8
c. Determine el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
El modelo matemático es:
𝑌 = 𝑚𝑥 + 𝑏
𝑌 = 0,9344 + 25,782
Este modelo de investigación es muy confiable ya que tiene el 96,78%.
d. Determine el grado de relación de las dos variables.
El grado de relación de las dos variables Procedimiento manual – Procedimiento
automático es positivo ya que el coeficiente de relación se acerca al 1.
4. Regresión y correlación Lineal Simple.
A partir de la base de datos suministrada: Anexo 1- Indicadores de violencia intrafamiliar en
Colombia durante el mes de septiembre de 2021 (16-1), cada estudiante, deberá
Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
Las dos variables cuantitativas son:
Número de personas por hogar = Variable dependiente
Cantidad de habitaciones por hogar= Variable Independiente
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
relación entre las variables.
9
Número de personas por hogar y Cantidad de
habitaciones por hogar.
6
Cantidad de habitaciones
5
4
3
2
por
1
0
02468101214 y= 0,2995x 1,3477
Número de personas por hogar (X) +R² = 0,33 96
El tipo de relación entre estas dos variables Número de personas por hogar y cantidad de
habitaciones por hogar, nos indica que No hay ninguna relación ya que el determinante de
R2=0,3396, el cual nos esta indica que se acerca más al 0 que al 1.
Determine al coeficiente de determinación y de correlación de las dos
variables. Interprete los resultados
Encuentre el modelo matemático que permite predecir el efecto de una
variable sobre la otra. ¿Es confiable?
El modelo matemático no es confiable ya que tiene un 3,39% de confiabilidad
Determine el tipo de correlación de las dos variables.
El tipo de correlación de las dos variables es de 0,582752 los cual nos indica que tiene
una correlación mínima, poco confiable.
Relacionar la información obtenida con el problema
En los casos de Número de personas por hogar y Cantidad de habitaciones por hogar
Indicadores del anexo violencia intrafamiliar en Colombia durante el mes de septiembre de
2021, este nos indica que tiene un 3,39% de confiabilidad entre estas dos variables, ósea una
confiabilidad mínima. No hay ninguna relación.
1
0
5. Regresión y correlación múltiple.
A partir de la base de datos suministrada “Anexo 1- Indicadores de violencia intrafamiliar en
Colombia durante el mes de septiembre de 2021 (16-1)”, cada estudiante, deberá:
a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas
independientes del estudio de investigación.
variable cuantitativa dependiente: Edad de la Victima
variables cuantitativas independientes: Estrato Socioeconómico de la víctima y el
Índice de Actividad policial
b. Realizar el diagrama de dispersión de dichas variables.
Edad de la Victima- Estrato Socioeconómico de la
Edad de la Victima- Índice de Actividad policial
1
1
c. Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.
El modelo lineal:
𝒂𝟏𝑿𝟏 + 𝒂𝟐𝑿𝟐 + 𝒃
1,827𝑋1 + 0,370𝑋2 + 23,54
1
2
d. Relacionar la información obtenida con el problema.
De acuerdo a la información obtenida podemos verificar que no existe confiabilidad ya
que obtuvimos un porcentaje de 0,05%, lo cual indica que la variable edad de la
víctima no presenta ninguna correlación con la variable Estrato Socioeconómico de la
víctima y el índice de actividad policial.
1
3
Conclusiones
Se creó un mentefacto conceptual con el cuál pude resumir y comprender de
manera clara las medidas estadísticas bivariantes de regresión y correlación
Desarrollé ejercicios que me ayudaron a reforzar las temáticas vistas de la unidad
3, y con las cuales obtuve una mejor comprensión de los temas.
1
4
Referencias Bibliográficas
- Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.
México City: Cengage Learning. (pp-675–686).
https://link.gale.com/apps/doc/CX4058900232/GVRL?
u=unad&sid=GVRL&xid=a2479593
- Martínez, C. (2013). Capítulo 12. Regresión y correlación. En: Estadística
y muestreo, 13a ed. [Online] Bogotá: Ecoe Ediciones. (pp 570 – 582).
http://www.ebooks7-24.com.bibliotecavirtual.unad.edu.co/?il=739
- Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto
Politécnico Nacional. (pp 21-29).
https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722
- Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:
Paraninfo. (pp 130 – 158). https://link.gale.com/apps/doc/CX4052100011/GVRL?
u=unad&sid=GVRL&xid=696103db
- OVI. Ortegon Pava, M. (27,07,2020). Medidas Bivariantes - Regresión
lineal Múltiple. [Archivo de video]. https://repository.unad.edu.co/handle/10596/35464