[go: up one dir, main page]

0% encontró este documento útil (0 votos)
44 vistas15 páginas

1.1. Estadistica Descriptiva

Cargado por

investigacion
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
44 vistas15 páginas

1.1. Estadistica Descriptiva

Cargado por

investigacion
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 15

1

UNIDAD 1. INTRODUCCIÓN
Objetivo

Plantear un panorama general sobre los métodos estadísticos y sus relaciones con otras disciplinas científicas para a fin de ubicar esta herramienta
en el planteamiento de situaciones problema en agronomía.

Contenido

1. Relación de la estadística con el método científico (0.5 h)


2. Idea popular sobre la estadística (0.5 h).
3. La estadística y el manejo de datos (0.5 h)
4. Estadística e incertidumbre (0.5 h)
5. La estadística y el método científico (0.5 h)

Nota: Los primeros cinco puntos serán abordados por los alumnos mediante la revisión de los artículos siguientes:

Articulo 1. La estadística, instrumento de investigación científica de Antonio Ramírez Ramírez.


Articulo 2. Funciones y aplicaciones de la estadística

1. Definición de estadística (0.5 h)

1.1. Definición

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir
de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro.

La estadística, en general, es la ciencia que trata de la recopilación, organización, presentación, análisis e interpretación de datos numéricos con el
fin de realizar una toma de decisión más efectiva.

1.2. Clasificación de la estadística

La estadística para su mejor estudio se ha dividido en dos grandes ramas:


1|Página
2

1.2.1. Estadística Descriptiva. Se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la
desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.

1.2.2. Estadística Inferencial. Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión
teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la
población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de
características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de
relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos.

1.3. Conceptos generales

1.3.1. Universo. Conjunto de elementos involucrados en un experimento aleatorio

1.3.2. Población. Conjunto total de valores posibles con una característica particular (en común) correspondiente a un universo.

1.3.3. Individuo. Son los componentes de una población o universo. Estos se pueden dividir en:

a) Elementos individuales. Por ejemplo: la población de estudiantes de la UACh.


b) Elementos colectivos. Por ejemplo: la población de universidades en México.

1.3.4. Muestra. Es un subconjunto de la población obtenida de acuerdo a una regla determinada (Se refiere algún tipo de muestreo)

2|Página
3

1.2.5. Variable. Es una característica de la población que se está analizando en un estudio estadístico y se denota por letras latinas
mayúsculas, tal como: X, W, Y, Z, que pueden tomar un valor cualesquiera de un conjunto determinado de ellos llamado dominio de la variable.

A los valores que toma la variable se habitúa denotar con la misma letra en minúscula enumerada con un subíndice.

Por ejemplo, si Y representa a la variable Edad, entonces y3 indica la edad que toma el tercer individuo.

1.2.5.1. Tipos de variables

Pueden ser: Cuantitativas y Cualitativas.

A) Cuantitativas. Si pueden expresarse numéricamente y se clasifican en variables discretas y continuas.

 Variables continuas. Son aquellas variables que pueden asumir cualquier valor en determinado intervalo de valores. Características tales
como altura, peso, longitud, espesor, velocidad, temperatura, etc., quedan dentro de esta categoría

 Datos continuos. Son aquellos datos que se obtienen de variables continuas.

Ejemplo: La cantidad de café que se vende por día, la gasolina que se expende por hora, la velocidad del aire, etc.

 Variable Discreta. Es la que puede asumir sólo ciertos valores, por lo regular, enteros.

 Datos Discretos. Los datos discretos surgen al contar el número de conceptos que posee cierta característica.

3|Página
4

Ejemplos: el número de clientes por día, la cantidad de alumnos en un salón de clase, los defectos de un auto, número de goles en un
partido de fútbol.

B. Cualitativas. Cuando no pueden ser medidas en un sentido numérico.

Ejemplos: Estado civil de las personas, color de ojos, el sexo, etc.

Otra definición de variables cualitativas: Son aquellas comprendidas por variables nominales u ordinales. Éstas no son inherentemente
numéricas, es decir, presenta modalidades no cuantitativas y en caso de utilizar números para representar esas modalidades, estos no tienen
significado en sí mismos. Las variables cualitativas también son conocidas como atributos. Los datos que se obtienen de este tipo de variables se
llaman datos cualitativos.

 Variables Nominales. Se caracterizan porque la única relación que está definida entre los valores que puede tomar la variable es la
igualdad o diferencia.

Ejemplo:

 Sexo (masculino, femenino)


 Color de los ojos (azul, marrón, negro, verde)
 Campo de estudio (medicina, administración, ingeniería, economía), etc.
Los datos asociados a este tipo de variable se conocen como datos nominales.

 Variables Ordinales. Se caracterizan porque entre dos valores de la variable, además de la relación de igualdad o diferencia se pueden dar
las relaciones "mayor que" o "menor que". Es decir, dados dos valores de la variable se puede decir si son iguales o diferentes y además
saber cuál valor está antes que el otro de acuerdo a un orden, es decir se jerarquizan los valores.
Ejemplo:

 Concurso de belleza o cocina


 Jerarquías del ejército, etc.

Los datos ordinales son los valores que toman las variables ordinales.

En la siguiente ilustración se puede observar la clasificación de las variables:

4|Página
5

5|Página
6

UNIDAD 2. MÉTODOS TABULARES Y GRÁFICOS PARA LA


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Objetivo

Analizar las herramientas descriptivas en la presentación de grandes cantidades de datos a fin de emplear las siguientes características:
proporcionar la máxima información en forma rápida y fácil de visualizar, así como generar una sencillez operativa, además de crear un documento
en forma estética.

Contenido

1. Métodos Tabulares (1.75 h)


Tablas de frecuencias para un conjunto de datos (1.5 h)
Tablas de frecuencias para dos conjuntos de datos (30 min)

2. Métodos Gráficos (2.75 h)


Diagramas de puntos (45 min)
Gráficas de Barras y de Pastel (30 min)
Histogramas (1.0 h)
Polígonos de frecuencias acumuladas (45 min)
Representación gráfica de dos conjuntos de datos (30 min)

1. Métodos Tabulares (1.75 h)

De acuerdo con el siguiente diagrama:

6|Página
7

1.1. Tablas de frecuencia. Son tablas estadísticas que agrupan diversos valores de una variable, simplificando los datos.

Las tablas de frecuencias se dividen en: Tablas para uno y dos conjuntos de datos.

1.1.1. Tablas de frecuencia para un conjunto de datos

Consiste en presentar la información organizada en tablas en dos formas o maneras:

1.1.1.1. Tablas de frecuencia para un conjunto de datos para valores de la variable sin agrupar. Se utiliza este tipo de distribución cuando el
número de valores diferentes que toma la variable no es grande, generalmente menos de 15 ó 20 valor es (por ejemplo número de hijos).

A) Definición. Supóngase que se ha medido una variable X (numérica) sobre un conjunto de N individuos. Llame xi al valor que presenta el individuo
i en la variable X, con i = 1,..., N. Si se observa entre ellos k valores distintos, se dirá que X toma valores x1 , x2 , ..., xk y se determinará la frecuencia
asociada a cada uno de ellos.

Para un valor xi , i = 1, ..., k, se definen las siguientes frecuencias:

7|Página
8

 Frecuencia absoluta, ni: Número de individuos que presentan el valor xi (Términos castellanos: Número de veces que aparece un
determinado valor de x).

 Frecuencia relativa, fi: Proporción de individuos que presentan el valor xi (Términos castellanos: Número de veces que aparece un
determinado valor de x respecto al total)

 Frecuencia absoluta acumulada, Ni: Número de individuos que presentan un valor inferior o igual a xi (Términos castellanos: Suma de
la frecuencia absoluta correspondiente más todas l as anteriores)

 Frecuencia relativa acumulada, Fi : Proporción de individuos que presentan un valor inferior o igual a x i (Términos castellanos: Suma de
la frecuencia relativa correspondiente más todas l as anteriores)

8|Página
9

 Distribución. Representa los valores de la variable y la frecuencia con que aparecen dichos valores (xi, ni)

Nota: Obsérvese que el cálculo de las frecuencias acumuladas sólo tiene sentido en variables numéricas.

B) Ejemplos.

Ejemplo 1. Se hizo un examen de estadística en el grupo 4 del departamento de suelos, los resultados fueron los siguientes:
No. de lista Calificación No. de lista Calificación
1 6 21 7
2 7 22 8
3 9 23 7
4 6 24 6
5 8 25 8
6 6 26 7
7 6 27 8
8 6 28 6
9 7 29 8
10 6 30 6
11 7 31 8
12 8 32 6
13 8 33 8
14 6 34 7
15 9 35 6
16 7 36 6
17 9 37 7
18 8 38 6
19 6 39 7
20 8 40 8

A continuación se muestra la tabla de frecuencia:

Xi ni fi Ni Fi
6 15 0.38 15 0.38
7 10 0.25 25 0.63
8 12 0.30 37 0.93
9 3 0.08 40 1.00
N= 40 1.00

9|Página
10

Su distribución empírica es:

Xi Fi
6 0.38
7 0.25
8 0.30
9 0.08

Ejemplo 2. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla se coloca la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera se anota la
frecuencia absoluta.

Nota: Este tipo de tablas de frecuencias se utiliza con variables discretas.

1.1.1.2. Tablas de frecuencia para un conjunto de datos para datos de la variable agrupados. Cuando el número de valores diferentes que
puede tomar la variable es demasiado grande para que resulte fácil presentar la información de manera reducida se utilizan los ‘intervalos’ (por
ejemplo estatura de un grupo de alumnos).

A) Procedimiento

10 | P á g i n a
11

Rango, R. Es la diferencia entre el Valor o Límite Máximo y el Valor o Límite Mínimo de los datos.

𝑹 = 𝑳𝒎á𝒙 − 𝑳𝒎𝒊𝒏

Número de intervalos o clases, K. Este depende del número de datos y de la dispersión de los mismos (si son parecidos o no entre sí), pero en
realidad no hay ninguna regla establecida.

No obstante en la práctica se puede aplicar cualquiera de los métodos siguientes:

𝑙𝑛(𝑁)
1. 𝐾 = , en donde K es el número de clases (intervalos); ln es el logaritmo neperiano y N es el número de datos por agrupar o tamaño de la
𝑙𝑛(2)
muestra.

2. K =1+ 3.322*Log10(N) en donde K es el número de clases (intervalos) y N es el número de datos por agrupar.

3. En la tabla siguiente seleccione K dependiendo del número de observaciones de su muestra.

4. 𝐾 ≅ √𝑁

Amplitud de intervalo, A. Se suele tomar la misma en todos los intervalos. Una forma de obtenerla es:

𝑅
𝐴=
𝐾

Límites de clases. Al límite inferior se le suma la amplitud de intervalo.

Límites Reales de Clase. Estos se obtienen restando y sumando media unidad (0.5) a los límites inferiores y superiores, respectivamente.

Marcas de clase o Puntos Medios de clase, 𝒙̌𝒊 .Es la a suma del límite inferior más el límite superior dividido entre 2.

11 | P á g i n a
12

𝐿𝑚𝑖𝑛 + 𝐿𝑚𝑎𝑥
𝑋𝑗 =
2

Frecuencias Absolutas, ni. La frecuencia absoluta es el número total de veces que se repite cierto dato

Frecuencias Relativas, fi. Las frecuencias relativas (fi) se calculan dividiendo cada una de las frecuencias absolutas (ni) entre el número total de
observaciones (N), pudiéndose expresar en forma de una fracción o de un porcentaje.

Frecuencias Absolutas (Ni).

Frecuencias Relativas Acumuladas (Fi).

B) Ejemplos

Ejemplo 1. Un artículo de la revista Transactions of the Institution of Chemical Engineers presenta datos de un experimento donde se investigó el
efecto de varias variables de un proceso sobre la oxidación en fase de vapor del naftaleno. A continuación se presenta una muestra del porcentaje
de conversión de moles de naftaleno a anhídrido maleico:

Porcentaje de conversión de moles de naftaleno a anhídrido maleico


4.20 4.70 4.70 5.00 3.80 3.60 3.80 3.00 5.10 4.00
3.10 3.80 4.80 4.00 5.20 4.30 2.80 2.00 2.80 5.00

En este caso, la variable X = Porcentaje de conversión de moles de naftaleno a anhídrido maleico es cuantitativa continua. Las variables continuas,
al contener decimales, suelen presentar muchos valores distintos (rara vez tendremos valores con frecuencia mayor que uno o dos), por lo que se
suelen agrupar por intervalos.
Siguiendo el procedimiento anterior se tiene que:

N= 20.00
Lmáx= 5.20
Lmín= 2.00
R= 3.20
K= 4.47 Estimado por el método 4
k= 4.00

12 | P á g i n a
13

A= 0.80

A continuación se muestra la tabla de frecuencias:

Limites Lim. Reales


Xi Ni fi Ni Fi
Li Ls Lri Lrs
2.00 2.80 1.50 2.30 1.90 1 0.05 1 0.05
2.80 3.60 2.30 3.10 2.70 4 0.20 5 0.25
3.60 4.40 3.10 3.90 3.50 8 0.40 13 0.65
4.40 5.20 3.90 4.70 4.30 7 0.35 20 1.00
N= 20 1.00

1.1.2. Tablas de frecuencia para dos conjuntos de datos

Hasta ahora hemos estudiado sobre cada individuo de una población el comportamiento de una variable X. En ocasiones se está interesado en el
estudio simultáneo de dos (o más) variables, X e Y, con el fin de observar una posible relación entre ellas.

1.1.2.1. Definición

Consideremos una población de N individuos sobre los que medimos conjuntamente dos variables, X e Y. Cada individuo vendrá dado entonces por
un par de valores (xi, yi), i = 1, ..., N.

Supongamos que la variable X presenta k valores distintos, x1, ..., xk , y la variable Y presenta p valores distintos, y1, ..., yp. La tabla de doble entrada
se construye de la siguiente forma:

13 | P á g i n a
14

donde nij es la frecuencia absoluta del par (xi, yj), es decir, el número de individuos que presentan el valor xi en X e yj en Y.

La frecuencia relativa correspondiente, fij, se calcula sin más que dividir la frecuencia absoluta por el total de observaciones, N,

Claramente,

1.1.2.2. Ejemplos

A) Ejemplo 1. Se tomó el Peso y la Estatura de los alumnos del 4 año del Departamento de Suelos.

Estatura Estatura
No. Peso (Kgs) No. Peso (Kgs)
(metros) (metros)
1 1.53 50.07 21 1.65 62.32
2 1.60 59.78 22 1.61 44.74
3 1.54 50.66 23 1.57 54.06
4 1.58 56.96 24 1.63 64.00
5 1.61 51.03 25 1.69 74.50
6 1.57 64.27 26 1.54 55.31
7 1.61 68.62 27 1.59 49.31
8 1.52 54.53 28 1.53 49.86
9 1.62 66.96 29 1.54 51.47
10 1.63 66.94 30 1.57 69.89
11 1.55 59.84 31 1.55 55.81
12 1.60 55.46 32 1.52 59.31
13 1.51 57.54 33 1.61 43.31
14 1.59 50.05 34 1.56 47.79
15 1.53 50.25 35 1.58 54.92
16 1.67 64.36 36 1.61 55.84
17 1.56 53.79 37 1.56 44.44
18 1.65 59.07 38 1.59 52.35
19 1.52 45.19 39 1.55 51.77
20 1.61 61.36 40 1.56 51.36

14 | P á g i n a
15

En este caso, la variable X = Estatura y la Y = Peso son variables cuantitativas continuas. Las variables continuas, al contener decimales, suelen
presentar muchos valores distintos (rara vez tendremos valores con frecuencia mayor que uno o dos), por lo que se suelen agrupar por intervalos.

Siguiendo el procedimiento anterior se tiene que:

N= 40.00 40.00
Lmáx= 1.69 74.50
Lmín= 1.51 43.31
R= 0.18 31.19
Estimado por el método
K= 6.32 6.32
4
k= 6.00 6.00
A= 0.03 5.20

A continuación se muestra la tabla de frecuencias:

43.31 48.51 48.51 53.70 53.70 58.90 58.90 64.10 64.10 69.30 69.30 74.50 ni
EST/PESO
1.51 1.54 1 3% 5 13% 3 8% 1 3% 0 0% 0 0% 10 25% 25% 10
1.54 1.57 2 5% 2 5% 3 8% 1 3% 1 3% 1 3% 10 25% 50% 20
1.57 1.60 0 0% 3 8% 3 8% 1 3% 0 0% 0 0% 7 18% 68% 27
1.60 1.63 2 5% 1 3% 1 3% 2 5% 3 8% 0 0% 9 23% 90% 36
1.63 1.66 0 0% 0 0% 0 0% 2 5% 0 0% 0 0% 2 5% 95% 38
1.66 1.69 0 0% 0 0% 0 0% 0 0% 1 3% 1 3% 2 5% 100% 40
nj 5 11 10 7 5 2 40 100%
13% 28% 25% 18% 13% 5% 100%
13% 40% 65% 83% 95% 100%
5 16 26 33 38 40

15 | P á g i n a

También podría gustarte