ACTIVIDAD 6-EVALUATIVA
TALLER MEDIDAS DE DISPERSIÓN Y SIMETRÍA
       Petro Martinez Martha Lia
       Rivera Diaz Diana Marcela
     Orellano Rebolledo Jorge Ivan
Corporación universitaria minuto de dios
      Administración de empresas
              IV semestre
         Estadística descriptiva
        Barranquilla – Atlántico
                             ESTADÍSTICA DESCRIPTIVA TALLER UNIDAD 4
                                         Medidas de Dispersión
1. Las siguientes corresponden a las edades de un grupo de personas que ingresaron a la
   biblioteca:
                55     67     62       88     37     55      67     38     41.
   A.   Determine los valores del rango.
   B.   La varianza.
   C.   La desviación típica o estándar.
   D.   El coeficiente de variación.
      Solución:
   A. Rango: El rango es un valor numérico que indica la diferencia entre el valor máximo y el
      mínimo de una población o muestra estadística. El rango suele ser utilizado para obtener
      la dispersión total de los datos. Un rango pequeño indica que los datos están más o
      menos cercanos y la dispersión es poca. En cambio, un rango mayor es indicativo que los
      datos están más dispersos.
        Para determinar los valores del rango lo primero que debemos hacer es ordenar nuestros
        datos:
                37          38      41     55      55       62      67      67     88
        Luego, para calcular los valores del rango debemos restar al dato mayor el dato menor:
                                            Rango=x máx −x min
        Donde, x máx es el valor máximo de los datos y x min es el valor mínimo.
        Por tanto, Rango=88−37=51
        El rango es de 51 años.
   B. Varianza: La varianza es una medida de dispersión que representa la variabilidad de una
      serie de datos respecto a su media. Debemos tener en cuenta que la fórmula para hallar
      la varianza depende si nuestros datos representan a la población o una muestra de ésta.
        Para la población:
                        N
                       ∑ ( x−x́)2
        Varianza(σ 2)= i=1
                             N
        Para la muestra:
                          n
                       ∑ ( x− x́ )2
   Varianza(s2 )= i=1
                              n−1
   Donde x es la variable, x́ es la media, N y n el número de observaciones que este caso
   sería 9, puesto que tenemos la edad de 9 personas que ingresaron a la biblioteca.
   Pasemos a calcular la media:
         37+38+ 41+ 55+55+62+67+67 +88 510
   x́=                                =    =56,6 ≈ 57
                        9               9
   Luego,
                                      37    57   -20   400
                                      38    57   -19   361
                                      41    57   -16   256
                                      55    57    -2     4
                                      55    57    -2     4
                                      62    57     5    25
                                      67    57    10   100
                                      67    57    10   100
                                      88    57    31   961
                                      Tot
                                       al              2211
   Ahora debemos reemplazar nuestros datos en la fórmula, vamos a tomar nuestros datos
   como una muestra de las edades de las personas que ingresaron a la biblioteca. Luego:
                          n
                       ∑ ( x− x́ )2
   Varianza(s2 )= i=1
                              n−1
               2211 2211
                   2
   Varianza ( s )=  =     =276,375 ≈ 276
                9−1    8
   Entonces la varianza = 276 años 2
C. Desviación estándar: La desviación estándar es un índice numérico de la dispersión de
   un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es
   la dispersión de los datos. La desviación estándar es un promedio de las desviaciones
   individuales de cada observación con respecto a la media de una distribución. Así, la
   desviación estándar mide el grado de dispersión o variabilidad. La desviación estándar es
   la raíz cuadrada de la varianza.
   Para la población:
             N
   σ=
         √   ∑ (x− x́)2
             i=1
   Para la muestra:
                   N
               n
      s=
           √   ∑ (x − x́)2
               i=1
                     n−1
      Luego, como tomamos nuestros datos como una muestra la desviación estándar sería:
      s=
           √   ∑ (x − x́)2
               i=1
             n−1
      s= √276=16,6 ≈ 17 años .
   D. Coeficiente de variación: El coeficiente de variación, es una medida estadística que nos
      informa acerca de la dispersión relativa de un conjunto de datos. Es decir, nos informa al
      igual que otras medidas de dispersión, de si una variable se mueve mucho, poco, más o
      menos que otra. Su cálculo se obtiene de dividir la desviación estándar entre el valor
      absoluto de la media del conjunto de datos y por lo general se expresa en porcentaje para
      su mejor comprensión.
                                       Población       Muestra
                                               σ                s
                                         CV =           CV =
                                              |x́|             |x́|
      Como en nuestro caso, tomamos nuestro conjunto de datos como una muestra,
      procederemos de la siguiente manera:
                s
      CV =
               |x́|
                17
      CV =         =0,298
               |57|
      Si queremos expresarlo en porcentaje,
                17
      CV =            =0,298∗100=29,8 ≈ 30 %
               |57|
2. En la siguiente tabla se refieren las edades de 100 empleados de cierta empresa:
   A. Halle Q1, Q2 y Q3 y construya el diagrama de caja y bigotes.
   B. Determine los valores del rango, la varianza, la desviación típica o estándar y el
      coeficiente de variación.
                                               Clase   Fi
                                                15      2
                                                16     10
                                                17     12
                                                18     20
                                                19     15
                                                20     12
  Solución:
A. Cuartiles, diagrama de caja y bigotes.
  Completemos nuestra tabla:
                                Clase      fi         Fi
                                 15         2         2
                                 16        10        12
                                 17        12        24
                                 18        20        44
                                 19        15        59
                                 20        12        71
                                Total      71        N.A
  Si observamos en nuestra tabla podemos notar que en nuestra frecuencia absoluta (fi) el
  total de datos es de 71, por lo tanto, solo se nos muestran la edad de 71 empleados de la
  empresa no de 100 empleados.
  Ahora procederemos a hallar la posición de nuestros cuartiles utilizando la siguiente
  fórmula:
             Kn
     Qk =
             4
  Entonces,
         1 ( 71 )
  Q 1=            =17,75 ≈ 18
             4
  En nuestra frecuencia acumulada (Fi) no tenemos ese valor (18), entonces, el que le sigue
  en nuestra tabla es 24, por tanto, Q1= 17
         2 (71 )
  Q 2=           =35,5 ≈ 36
            4
  Q2= 18
         3 ( 71 )
  Q 3=            =53,25≈ 53
            4
  Q3= 19.
  Ahora debemos encontrar el límite inferior y el límite superior, la fórmula que vamos a
  utilizar es la siguiente:
     Liímite inferior=Q 1−1.5∗RIQ
  RIQ (Rango intercuartílico) =Q3-Q1
                                 = 19 – 17= 2
         Liímite inferior=17−1.5∗2=14
     Liímite superior=Q 3+1.5∗RIQ
     Liímite superior=19+1.5∗2=22
                                 Diagrama de caja y bigotes
                                      Li            14
                                      Q1            17
                                      Q2            18
                                      Q3            19
                                      Ls            22
B. Varianza, desviación estándar y coeficiente de variación.
  Para calcular la varianza utilizaremos la siguiente fórmula:
                  n
                 ∑ ( x− x́ )2
  Varianza(s2 )= i=1
                       n−1
  Luego, como sabemos que el Q2 coincide con la media ( x́ ), entonces x́=18.
                                Clase ( x )     fi     ( x− x́ )2
                                   15            2        9
                                   16           10        4
                                   17           12        1
                                   18           20        0
                                   19           15        1
                                   20           12        4
                                  Total       n = 71     19
  Pasemos a reemplazar nuestros datos en la fórmula:
                            19
      Varianza ( s 2 )=         =0,27
                           71−1
      Por tanto, la varianza =0,27años 2.
      Desviación estándar:
      s=
           √   ∑ (x − x́)2
               i=1
                     n−1
      s= √0,27=0,52
      Entonces, la desviación estándar es de 0,52 años.
      Coeficiente de variación:
                s
      CV =
               |x́|
               0,52
      CV =          =0,03
               |18|
      Por tanto, el coeficiente de variación es del 3%.
3. Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados
   durante el último año.
   A. Determine los valores del rango, la varianza, la desviación típica o estándar y el
      coeficiente de variación. (Ejercicio para subir a la plataforma)
                                   NUMERO DE DÍAS      CANTIDAD DE
                                                       EMPLEADOS
                                           [0 – 2)         10
                                            [2 –4)          6
                                           [4 – 6)         12
                                           [6 – 8)          9
                                          [8 – 10)          4
                                        [10 – 12)           3
                                         [12 –14)            1
      Solución:
      A. Rango para datos agrupados: Hay dos formas para determinar el rango para datos
         agrupados.
           1) Rango = punto medio de la clase más alta – punto medio de la más baja.
           2) Rango = límite superior de la clase más alta – límite inferior de la más baja.
   En nuestro caso utilizaremos la segunda forma.
   Límite superior de la clase más alta: 14
   Límite superior de la clase más baja: 0
   Rango= 14 – 0 = 14
   Varianza: para calcular la varianza primero debemos conocer la media:
   x́=
         ∑ x. f
           n
    para ello debemos conocer nuestra marca de clase ( x ¿ , la cual se calcula de la
   siguiente manera:
                      Límiteinferior + Límite superior
   Marca de clase=
                                     2
                     Número       Marca de            Cantidad de             xi . fi
                      de días     clase ( xi )       empleados ( fi)
                       [0 – 2)         1                  10                   10
                       [2 –4)          3                   6                   18
                       [4 – 6)         5                  12                   60
                       [6 – 8)         7                   9                   63
                      [8 – 10)         9                   4                   36
                     [10 – 12)        11                   3                   33
                     [12 –14)         13                   1                   13
                        Total        N.A                N= 45                 233
                  233
Entonces, x́=         =5,2
                   45
La fórmula que vamos a utilizar la varianza es la siguiente:
                                              ∑ fi(x− x́ )2
                                         σ 2= i=1
                                                      N
Utilizaremos la fórmula de la varianza poblacional.
Completemos nuestra tabla:
          Número       Marca de        Cantidad de            xi . fi   ( x− x́ )2      fi(x− x́)2
          de días      clase ( xi )   empleados ( fi)
           [0 – 2)            1              10                10       17,64            176,4
           [2 –4)             3               6                18        4,84            29,04
           [4 – 6)            5              12                60        0,04             0,48
           [6 – 8)            7               9                63        3,24            29,16
          [8 – 10)            9               4                36       14,44            57,76
         [10 – 12)           11               3                33       33,64           100,92
               [12 –14)         13           1                    13     60,84   60,84
                 Total          N.A         N=45                 233      N.A    454,6
      Por tanto,
                                                          454,6
                                                σ 2=            =10,10
                                                           45
                                      2
      La varianza es igual a 10,10días .
      Desviación típica o estándar: ya sabemos que la desviación estándar es la raíz
      cuadrada de la varianza.
                                           σ=
                                                √   ∑ fi( x− x́ )2
                                                    i=1
                                                            N
                                           σ =√ 10,10=3,18
      La desviación estándar es de 3,18 días.
      Coeficiente de variación:
              σ 3,18
      CV =       =      =0,61
             |x́| |5,2|
      Es decir, el coeficiente de variación es del 61%.
4. En una competición de tiro al blanco con rifle de aire, se tienen los dos últimos participantes,
   quienes tiraron a un tablero y obtuvieron el siguiente registro después de 15 disparos cada
   uno.
   Halle el promedio del conjunto de datos, la mediana, la moda, la desviación estándar y el
   coeficiente de desviación de los datos y compare los dos conjuntos.
   Realice el diagrama de caja y de bigotes para el puntaje de cada uno de los jugadores. (Nota:
   hacer la tabla de frecuencias para el puntaje de cada jugador).
      Solución:
                                                     Primer Jugador
                          Puntos (       Primer      Frecuencia       xi . fi   ( x− x́ )2
                             xi ¿      jugador ( fi) acumulada
                              1                6               6        6           4
                              2                3               9        6           1
                              3                0               9        0           0
                              4                3               12      12           1
                              5                3               15      15           4
                            Total           n = 15             NA      39          10
Media aritmética o promedio=
                                    ∑ x i . f i = 39 =2,6 ≈3
                                       n       15
      Desviación estándar:
                 10
      s=
            √   15−1
                     =0,71
      La desviación estándar es de 0,71 puntos.
      Coeficiente de variación:
                 s 0,71
      CV =          =    =0,24
                |x́| |3|
      El coeficiente de variación es del 24%.
                          Mediana: busquemos su posición.
                n+1 15+1
      Posición=    =     =8
                 2    2
      Esa posición la debemos encontrar en nuestra frecuencia acumulada (tabla anterior), si no la
      encontramos pasamos al número siguiente, que en nuestro caso es 9, entonces el valor de la
      mediana es 2.
      Moda: dato que más se repite. en nuestra tabla anterior en la frecuencia (fi) el número más
      grande es 6, por lo tanto, la moda es 1.
                                                       Segundo Jugador
       P              Seg              frecu           x
       u              un               encia           i
       nt             do               acum            .
       os             jug              ulada           f
                      ado                              i
                      r
       1              0                0               0
       2              7                7               1
                                                       4
       3              7                14              2
                                                  1
          4              1            15          4
          5              0            15          0
          T              15           N.A         3
          ot                                      9
          al
                        Puntos        Segundo         frecuencia
                                                                       xi∗fi
                                      jugador         acumulada
                          1               0                0            0          4
                          2               7                7           14          1
                          3               7               14           21          0
                          4               1               15            4          1
                          5               0               15            0          4
                        Total            15               N.A          39         10
                                    39
Media aritmética o promedio=           =2,6 ≈ 3
                                    15
                          Mediana: busquemos su posición.
                n+1 15+1
      Posición=    =     =8
                 2    2
      Por tanto, la mediana es 3.
      Moda: 2 y 3 (Bimodal).
      Desviación estándar:
                    10
      s=
               √   15−1
                        =0,71
      La desviación estándar es de 0,71 puntos.
      Coeficiente de variación:
                    s 0,71
      CV =             =    =0,93
                   |x́| |3|
      El coeficiente de variación es del 93%.
      Comparación: el coeficiente de variación del segundo jugador es muy alto (93%), lo cual nos
      indica que la media no representa al conjunto de datos, es decir los datos son heterogéneos, tienen
      mayor dispersión o variabilidad, mientras que el coeficiente de variación del primer jugador es tan
      solo del 24%, por tanto, presenta menor variabilidad que el segundo jugador.
      Diagrama de caja y bigotes:
      Cuartiles:
                                                      Primer jugador
          Kn
   Qk =
          4
                           1 ( 15 )
         Entonces: Q 1=             =3,75≈ 4
                               4
         Por tanto, Q1 en nuestra frecuencia acumulada se encuentra en la posición 3,75, como no tenemos
         esa posición en nuestra tabla, el valor que sigue es 6, por tanto, Q1= 1.
                2 (15 )
         Q 2=           =7,5≈ 8
                   4
         Por tanto, Q2 coincide con la mediana, Q2=3.
                3 ( 15 )
         Q 3=            =11,25 ≈ 11
                   4
         Luego, Q3=4.
                                               Segundo jugador
       1 ( 15 )
Q 1=            =3,75≈ 4
           4
         por tanto, Q1= 2.
                2 (15 )
         Q 2=           =7,5≈ 8
                   4
         Por tanto, Q2 coincide con la mediana, Q2=3.
                3 ( 15 )
         Q 3=            =11,25 ≈ 11
                   4
         Luego, Q3=3.
         Hallemos nuestros límites.
               Primer Jugador:
                    RIQ (Rango intercuartílico) =Q3-Q1
                                     = 4 – 1= 3
                 Liímite inferior=1−1.5∗3=−3,5
             Liímite superior=Q 3+1.5∗RIQ
             Liímite superior=4+1.5∗3=8,5
                  Segundo jugador:
                       RIQ (Rango intercuartílico) =Q3-Q1
                                        = 3 – 2= 1
                 Liímite inferior=2−1.5∗1=0,5
             Liímite superior=Q 3+1.5∗RIQ
             Liímite superior=3+1.5∗3=7,5