Untitled
Untitled
Técnicas
         estadísticas
         multivariantes
Sesión
  4
              Dra. Mónica Ysela Saenz Tolay
TEMARIO
                                                Técnicas
                                                multivariadas
                                  Creación de
                                  nuevas
                 Técnicas         variables
                 dirigidas por
 Métodos         variables /
 multivariados   por individuos
                     2023 - I
Clasificación de países
                    2023 - I
                En la actualidad, los investigadores manejan datos de
                variables múltiples.
               2023 - I
MÉTODOS MULTIVARIADOS – Inicio
 ❑En 1904, Charles Spearman en su intento por medir la
  inteligencia (a través de un conjunto de habilidades y
  conocimientos), en términos de un factor general (factor g) y
  un factor específico (s) propio de cada test, dio lugar a la
  Teoría Factorial de la Inteligencia.
           2023 - I
              Individuo, sujeto
                 u objeto de
                investigación
Son técnicas estadísticas que analizan X1, X2, X3, X4, X5 , … Xp variables
                            en simultáneo
                     2023 - I
   MÉTODOS MULTIVARIADOS
                                  2023 - I
    MÉTODOS MULTIVARIADOS
❑Aplicado también para encontrar relaciones entre:
                                 2023 - I
                                 • Definir el problema de Investigación
                                 • Objetivos; diseño e hipótesis
                       1° fase   • Técnica Multivariante a utilizar.
MULTIVARIANTE
                          2023 - I
                        Análisis Multivariado
                                          Análisis inicial de datos
Es fundamental inspeccionar:
Son aquellos que no constan debido a cualquier acontecimiento, como por ejemplo errores
en la transcripción de los datos o la ausencia de disposición a responder a ciertas
cuestiones de una encuesta.
Los datos pueden faltar de manera aleatoria o no aleatoria.
TRATAMIENTO
                                   2023 - I
                   Métodos de imputación
▪Sustitución por la media.
 Sustituye el valor ausente por la Media de los valores válidos.
 Desventajas:
 ✓ Dificulta la estimación de la Varianza.
 ✓ Distorsiona la verdadera distribución de la variable,
 ✓ Distorsiona la correlación entre variables dado que añade valores constantes.
 Presenta los mismos inconvenientes que la sustitución por la Media, y solo debe ser utilizado si
 hay razones para suponer que es más adecuado que el método de la media.
                                         2023 - I
           Datos perdidos o valores faltantes- Ejemplo
                                  2023 - I
           Datos perdidos o valores faltantes- Ejemplo
                                  2023 - I
           Datos perdidos o valores faltantes- Ejemplo
                                 2023 - I
           Datos perdidos o valores faltantes- Ejemplo
                                                                            Finalmente, es el
                                                                         especialista el que debe
                                                                        decidir el valor estimado
                                                                        que “mejor” reemplace al
                                                                              dato perdido.
                                 2023 - I
Tabla de datos
2023 - I
   ¿Cuáles son los pasos para la aplicación de las
   técnicas multivariantes?
     1          2          3           4         5           6          7   8
1: Elección de la UE
2: Elección de la variables
3: Construcción de una MBD
4: Cálculo de un coeficiente de similitud para cada par posible de UE
5: Construcción de una matriz de similitud
6: Aplicación de una técnica multivariante
7: Identificación de patrones
8: Inferencia acerca de las UE
                                 2023 - I
2023 - I
Variables: Proceso Productivo de miel, azúcar y alcohol
                                                 ¿Podemos identificar algunas Variables?
                          Miel:
                          X1: % de azúcar
                          X2: Densidad
                          X3: Cantidad de minerales
                          X4: Cantidad de antranilato de metilo (Aroma)
                                                         Azúcar:
                                                         X1: % de sacarosa
                                                         X2: % de humedad
                                                         X3: % de azucares volubles
                                                         X4: % de polarización
                                                                                      Alcohol:
                                                                                      X1: % de etanol
                                                                                      X2: % de dióxido de azufre
                                           Vector: (X1, X2, X3, …, Xn)                X3: % de acido acético
                          2023 - I
Técnicas dirigidas por las variables y dirigidas por los individuos.
Análisis de regresión
                                 2023 - I
Creación de nuevas Variables
     2023 - I
                 Técnicas Multivariadas – Panorama General
❖PCA - Análisis de Componentes Principales: Criba los datos de variables múltiples,
 creando nuevas variables “Componentes Principales”. Detecta outliers.
❖FA – Análisis por Factores: Crea nuevas variables que no están correlacionadas entre sí.
 Las variables en un mismo subconjunto con alta correlación, las variables en
 subconjuntos diferentes deben tener baja correlación.
❖CDA – Análisis Discriminante Canónico: se crean nuevas variables para hacer más
 sencillas las reglas de clasificación de los individuos.
                                2023 - I
                   Técnicas Multivariadas – Panorama General
❖CA – Análisis por Agrupación: Clasifica individuos pero sin saber con anterioridad de
 dónde surgen las observaciones (exploratorio).
                                                         2023 - I
Clasificación de técnicas Multivariantes:
                    • Las variables a evaluar están divididas en dos grupos las variables dependiente s
  Métodos de          y las variables independientes.
                    • El objetivo de los métodos de dependencia consiste en determinar si el conjunto
  dependencia         de variables independientes afecta al conjunto de variables dependientes y de
                      qué forma.
     Métodos          • Aquí las variables están divididas en dos grupos el de las variables dependientes y el de
                        las independientes.
                      • El objetivo de estos métodos es analizar, no sólo como las variables independientes
   estructurales        afectan a las variables dependientes, sino también cómo están relacionadas las variables
                        de los dos grupos entre si
                      2023 - I
Clasificación de técnicas Multivariantes:
              2023 - I
                                                   El tipo de relación que está
                                                   siendo examinadas es de:
CLASIFICACIÓN DE LAS
      TÉCNICAS
  MULTIVARIANTES
                           Dependencia                                                       Interdependencia.
                                                                                             La estructura de la
                                                                                              relación es entre:
                                           2023 - I
Evaluación de supuestos multivariantes
                         2023 - I
          Análisis gráficos de datos multivariantes
                           2023 - I
Análisis discriminante
    2023 - I
                  Análisis discriminante
Objetivos:
Variables:
     Variable dependiente: categórica (puede ser dummy)
     Variable Independientes: Cuantitativas (deben cumplir
     normalidad multivariante)
                                                                      33
                        2023 - I
                     Análisis discriminante
                                                                      34
                            2023 - I
                   Análisis discriminante
    Para ello se tratará de elegir unas funciones tales que no sólo clasifiquen
correctamente a los clientes activos sino que garanticen que un cliente potencial,
                          sea adecuadamente clasificado.
                                                                                35
                          2023 - I
                   Análisis discriminante
Lambda de Wilks.
                                                                           36
                        2023 - I
Ruta: Analizar- clasificar- Análisis discriminante
           2023 - I
           La variable dependiente se
           pasa a la casilla variable de
                   agrupación
2023 - I
2023 - I
             Click , para activar los
           estadísticos que queremos
                     reportar
2023 - I
2023 - I
Resultados AD
2023 - I
       Estadística de clasificación
                     2023 - I
Se observa que las probabilidades de
pertenencia al propio grupos son elevadas
excepto en el cliente cumplidor 13, que se
clasifica erróneamente en el grupo de los
fallidos y que por añadidura tiene una
probabilidad muy baja de pertenencia (0,1367)
al grupo de los cumplidores.
2023 - I
             Análisis varianza – manova
                                                                       48
                        2023 - I
      Análisis varianza – manova - mancova
Objetivos:
Variables:
                    2023 - I
                         Calilificación Calificación de
Método     Planta        de fácil uso calidad
Método 1   Planta A                    5              6
Método 1   Planta A                    6              5
Método 1   Planta A                    5              6
Método 1   Planta A                    6              7
Método 1   Planta A                    6              8
Método 1   Planta A                    5              6
Método 1   Planta A                    4              5
Método 1   Planta A                    3              4
Método 1   Planta A                    4              5
Método 1   Planta A                    5              4
Método 1   Planta A                    4              5
Método 1   Planta A                    3              4
Método 2   Planta A                    6              7
Método 2   Planta A                    7              6   Verificar  archivo
Método 2   Planta A                    8              5   completo en Excel
…          …             …               ..
                      2023 - I
                                 SUPUESTOS
Puede cumplir con otros criterios antes o durante la recopilación de datos, como la
independencia de las observaciones (cada participante solo puede participar en el estudio una
vez) y garantizar un tamaño de muestra adecuado en cada celda (a través de un análisis de
poder)
                                                                                                52
                                2023 - I
1. Normalidad
                2023 - I
2. Valores atípicos univariados
 La suposición de valores atípicos univariados se puede probar mediante la inspección de
 diagramas de caja.
Marcar aquí
                                2023 - I
2. Valores atípicos univariados
                             Observamos valores atípicos
                                                             Se debe verificar el
                                                             motivo o descartar
                  2023 - I
3. Valores atípicos multivariados
  Esta suposición se puede probar a través de las distancias de Mahalanobis
                          2023 - I
3. Valores atípicos multivariados
          Aqui se ingresa al contrario em
           independientes colocamos
            Calificación de fácil uso y
              calificación de calidad
                                             Elegimos
                                            Mahalanobis
  3. Valores atípicos multivariados
   Según las Estadísticas de Residuos, El valor
   Máximo de la Distancia de Mahalanobis =
   8.629
                                 2023 - I
5. Linealidad                                                          Pasamos las variables
                                                                       dependientes a cada
     Esta suposición se puede probar usando diagramas de dispersión.           eje
                             2023 - I
  5. Linealidad
                                         2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)
                          2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)
                       2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)
                                  2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)
              2023 - I
Finally… MANOVA
                                   2023 - I
Análisis de correspondencias
                               67
     2023 - I
   ANÁLISIS DE CORRESPONDENCIA
                         2023 - I
              Análisis de correspondencia
Objetivo:
Variables:
                                                                                 69
                          2023 - I
                  Análisis de correspondencia
                                                                                              70
                                 2023 - I
          Ejemplo 1.                                                             Atributos
    Correspondencia simple
                                                                                                                  Facilida
                                                                    Rapidez de   Informaci Trato del   Condicione d de
                                        Empresas Precios   Marcas   entrega      ón        personal    s de pago acceso
En un estudio sobre el mercado                E1    16         6        20           11         28         21       21
     de material eléctrico, se                E2    17        15        20           13         25         21       21
   entrevistó a una muestra de                E3    18        18        23           12         25         20       21
                                              E4    19        17        21           17         22         24       23
clientes de nueve empresas, con               E5    16        27        29           20         30         27       26
      el fin de determinar el                 E6    45        20        20           16         26         22       15
    posicionamiento de dichas                 E7    15         2        18           15         24         18       16
 empresas con respecto a siete                E8    19        14        19           10         22         21       18
                                              E9    18        53        25           44         26         24       21
atributos. Cada cliente tuvo que
 asociar a cada atributo a una o
           más empresas
                                   2023 - I
Desarrollo del ejemplo 1 (Correspondencia simple) en SPSS
                                 Ingresamos el
                                 código y luego
                                  el nombre de
                                   la categoría
      Ingresamos a
         vista de
        variables ,
       para asignar
      sus nombres
                                                            72
                      2023 - I
2023 - I
              Click en
           definir rango.,
           ingresamos 1
            y 9 por ser 9
             empresas
2023 - I
2023 - I
   Resultados AC
2023 - I
                    La proporción de la                    La D2 explica el 27.5% de
                 inercia, es la cantidad de                  la información, las 2
                  información contenida                     primeras dimensiones
                    en cada dimensión                       explican el 91.3% de la
                                                               información total
Es decir, si las variables son muy dependientes, tanto las filas como las columnas
serán distintas entre sí, mientras que si son independientes serán parecidas
                          2023 - I
                                    Refleja el grado en que el atributo ha influido
                                           a la formación de la dimensión.
                                      En este caso la marca es el atributo más
                                     importante para la dimensión 1 y el precio
                                                  para la dimensión 2
Ejemplo
Trato de personal y
condiciones de pago.
Empresa 1 y 7, en este
caso            podría
interpretarse     que
tienen las mismas
fortalezas           y
debilidadades.
Proximidad entre dos
atributos y empresas,
existe   una   fuerte
asociación
Ejemplo
La empresa 9 y el
atributo marca o la
empresa     6    y el
atributo precio.
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF
                                                                  2023 - I
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF
                            2023 - I
Publicaciones en Scopus que se asocien con términos de
ingeniería y multivariado
                     2023 - I
           Artículo: https://www.scielo.org.mx/pdf/tca/v9n5/2007-2422-tca-9-05-33.pdf
           Muestreo utilizado: https://www.ub.edu/fem/docs/protocols/fem_%20prot_cast_2012.pdf
2023 - I
ANÁLISIS FACTORIAL
 ▪ Técnica que consiste en resumir la información contenida en una matriz
   de datos con V variables.
 ▪ En el A. F. se identifican un reducido número de factores F, siendo el
   número de factores menor que el número de variables.
 ▪ Los factores “F” representan a las variables originales, con una pérdida
   mínima de información.
                            2023 - I
2023 - I
                       TIPOS DE ANALISIS FACTORIAL
       EXPLORATORIO                                                             CONFIRMATORIO
                                                                           En el análisis de tipo
Se caracteriza porque no se                                                confirmatorio, los factores
conoce apriori el número de                    Análisis Factorial          están     fijados    a    priori,
factores, y es en la aplicación                                            utilizándose     contrastaciones
empírica donde se determina                                                empíricas         para        su
este número.                                                               corroboración.
                                           A.F.                 A.F.
                                       Exploratorio        Confirmatorio
                                                              A.F. de
                                       A.F. Clásico        Componentes
                                                            Principales
                                  2023 - I
                                                                        Variables           Variables
                                                                        No                  Observables/
                                                                        Observables         originales
                                                                        Factores Latentes
X1 X2 X3 X4 X5 X1 X1 X1 X1 X1
F1 F1 F1
                     2023 - I
                                 APLICACIONES
•   Marketing: Factores asociados de clientes cuando van a comprar un coche
•   Marketing: Características asociadas a las marcas de pastas de dientes
•   Ciencias Sociales:
      Actitudes: Escalas de Likert
      Opiniones: Escala de Likert
      Conductas: Escala de Likert
      Emociones: Escala de Likert
•   Educación: Factores asociados a la resistencia de docentes a innovaciones tecnológicas.
•   Psicología:
      Factores asociados al grado de inteligencia de una persona.
      Factores asociados a la personalidad de una persona?
•   Economía:
      Factores asociados al desarrollo de un país
      Ratios financieros a tener en cuenta a la hora de evaluar la labor desarrolla por una empresa
                                        2023 - I
           APLICACIONES
2023 - I
APLICACIONES
      2023 - I
APLICACIONES
Validación Psicométrica
Validación de constructo
                              2023 - I
PASOS EN EL ANALISIS FACTORIAL
                         2023 - I
1° PASO: Examen de la matriz de correlaciones
          Requisito : Las variables deben estar altamente correlacionadas. Los
                           métodos que pueden utilizarse son:
                                2023 - I
✓ El determinante de la matriz de correlaciones:
• Un determinante muy bajo indicará altas intercorrelaciones entre las variables, pero no debe
  ser cero, pues esto indicaría que algunas de las variables son linealmente dependientes.
                                                                            Donde:
                                                                            n =tamaño muestral.
                                                                            p =número de variables.
       gl = p ( p-1)/2                                                      Ln=logaritmo neperiano.
                                                                            R =matriz de correlaciones.
                                        2023 - I
✓ Indice KMO de Kaiser-Meyer-Olkin:
  Valores bajos del índice KMO desaconsejan la utilización de Análisis Factorial. Como baremo para
  interpretar el índice KMO podría tomarse según Kaiser:
                                        2023 - I
✓ Medida de Adecuación de la muestra (MSA): Valores bajos desaconsejan el uso del
  análisis factorial.
✓ Correlación Múltiple: Deberá ser alto, sobre todo si la técnica a utilizar es un análisis
  factorial.
                                  2023 - I
2023 - I
  ANÁLISIS CLUSTER JERÁRQUICO Y NO JERÁRQUICO
• Método multivariado cuyo propósito es el
  de agrupar objetos o individuos, de tal
  manera que los objetos que se clasifican y
  pertenecen a un grupo o cluster son muy
  similares (homogeneidad dentro del grupo
  o cluster), mientras que son muy disímiles
  aquellos objetos que pertenecen a grupos
  diferentes (heterogeneidad entre grupos o
  cluster).
                           2023 - I
ANÁLISIS CLÚSTER
                                   Las distancias
      Las distancias               son maximizadas
      son minimizadas              Inter-cluster
      Intra-cluster
                        2023 - I
Características del Análisis clúster
     El AC, es un método de interdependencia y como una técnica
     exploratoria
                       2023 - I
Requisitos del Análisis clúster
                          2023 - I
Clasificación de las técnicas Clúster
                             Clustering
                             algorithms
                       2023 - I
... Introducción: Tipos de Distancia
  Variabilidad y distancias
• Distancias de Minkowsky
• Distancia euclídea
• Distancia de Mahalanobis
• Distancia promedio
                        2023 - I
2023 - I
ESCALAMIENTO MULTIDIMENSIONAL
            2023 - I
2023 - I
2023 - I
                     Matrices a ingresar (estímulos)
•   Matriz de similaridad: percepción sobre las similitudes de los objetos.
•   Matriz de distancia: Mediciones de atributos que se toman en la comparación de objetos.
•   Matriz de correlaciones: Cuando se trata de encontrar similitud entre variables
                                2023 - I
2023 - I
Medidas de bondad de ajuste
                        2023 - I
2023 - I
ANÁLISIS DISCRIMINANTE
              2023 - I
Es una técnica que nos permite identificar qué características o variables diferencian a dos
o más grupos, cuantas son necesarias para alcanzar una mejor clasificación y ayudarnos a
generar una función discriminante más eficiente y precisa para clasificar una nueva
observación.
                            2023 - I
2023 - I
Similitudes y diferencias entre el ANOVA, la regresión y el análisis discriminante:
                                                                                    Análisis
                                                   ANOVA           Regresión
                                                                                 Discriminante
SIMILITUDES
DIFERENCIAS
                                       2023 - I
Pruebas preliminares
               2023 - I
Pruebas preliminares
               2023 - I
Pruebas preliminares
               2023 - I
2023 - I
Esquema metodológico del ADL
                 2023 - I
Se consideran los datos recogidos sobre 32 cráneos en el Tibet.
                       2023 - I
                                                                          D1: Plataneros
                                                                          D2:Traileros
                    ASALTOS Y ROBOS EN EEUU
                                                                          D3:Mocheros
Asalto   X1:Participant   X2: Horario      X3: Tiempo   X4: Tipo   Y
                                                                          D4: Raperos
         es
1                                                                  1
2 1 Modelo discriminante
3                                                                  1
                                                                       D1=f(x1,x2,x3,x4)
4                                                                  2   D2=f(x1,x2,x3,x4)
                                                                       D3=f(x1,x2,x3,x4)
5                                                                  2
                                                                       D4=f(x1,x2,x3,x4)
6                                                                  2
7 3
8                                                                  3
                                                                          Nuevo asalto
9                                                                  4
10 4 x1,x2,x3,x4,x5
                                        2023 - I
ANÁLISIS CONJUNTO
  2023 - I
                                Análisis conjunto
Supongamos un escenario, en el que un especialista en marketing de productos evalúa el impacto de las
características individuales en la participación de mercado estimada o los ingresos por ventas.
                                  2023 - I
Objetivos prácticos del análisis conjunto
             2023 - I
                    Análisis conjunto
   Es un método descomposicional que
                                                    El Análisis Conjunto es una técnica
 estima la estructura de las preferencias
                                                 estadística de la dependencia utilizada
     de un consumidor (por ejemplo:
                                                para analizar la relación lineal o no lineal
      mediante utilidades parciales,
                                                    entre una variable dependiente (o
  ponderaciones de importancia, puntos
                                                endógena) generalmente ordinal (aunque
   ideales, etc.), una vez obtenidas sus
                                                   también puede ser métrica) y varias
evaluaciones globales de un conjunto de
                                                variables independientes (o exógenas) no
alternativas preespecificadas en términos
                                                                  métricas.
    de niveles de diferentes atributos.
                      2023 - I
Conceptos fundamentales
    2023 - I
Usos del análisis conjunto
     2023 - I
Áreas de aplicación del análisis conjunto
           2023 - I
Etapas del análisis conjunto
      2023 - I
Creación de estímulos
   2023 - I
Creación de estímulos, y utilidades
          2023 - I
2023 - I
2023 - I
2023 - I
Resultados en R
2023 - I
Resultados en R
2023 - I
Análisis canónico
    El análisis de correlación canónica puede verse como una extensión lógica de un análisis de regresión múltiple. Recordemos que el
    análisis de regresión múltiple implica una única variable de pendiente métrica y varias variables métricas independientes.
         Mientras que la regresión múltiple implica una única variable dependiente, la correlación canónica implica múltiples
         variables dependientes.
         El principio subyacente es desarrollar una combinación lineal de cada conjunto de variables (tanto independientes como
         dependientes) para maximizar la correlación entre los dos conjuntos.
    El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que
    proporcione la correlación única máxima entre el conjunto de variables dependientes y el conjunto de variables independientes.
                                     2023 - I
 Ejemplo:
• 1°relacionadas con el ejercicio y la salud.
    • Por un lado, se tienen variables asociadas al ejercicio, observaciones como la velocidad de subida en un
       escalador, la rapidez con la que se puede correr una determinada distancia, la cantidad de peso levantado
       en el press de banca, el número de flexiones por minuto, etc. Por otro lado, hay variables que intentan
       medir la salud general, como la presión arterial, los niveles de colesterol, los niveles de glucosa, el índice
       de masa corporal, etc. Se miden dos tipos de variables y las relaciones entre las variables de ejercicio y las
       variables de salud son de interés.
• 2° Considere las variables que se miden sobre la salud ambiental y las toxinas ambientales.
     • Se pueden medir una serie de variables de salud ambiental como las frecuencias de las especies sensibles,
       la diversidad de las especies, la biomasa total, la productividad del medio ambiente, etc. y se mide un
       segundo conjunto de variables sobre las toxinas ambientales, como las concentraciones de metales
       pesados, pesticidas, dioxinas, etc.
• 3°Considere un grupo de representantes de ventas,
    • sobre los que hemos registrado varias variables de rendimiento de ventas junto con varias medidas de
      aptitud intelectual y creativa. Es posible que queramos explorar las relaciones entre las variables de
      rendimiento de ventas y las variables de aptitud.
                                         2023 - I
2023 - I
2023 - I
Simuladores para Ingeniería y Arquitectura
  https://www.ucv.edu.pe/noticias/ucv-adquiere-simuladores-para-estudiantes-de-ingenieria-y-arquitectura/
  https://www.youtube.com/watch?v=YJK3ndNSwo8&t=48s
                                          2023 - I
Muchas gracias
 2023 - I