[go: up one dir, main page]

0% encontró este documento útil (0 votos)
21 vistas4 páginas

AED (Exp-Práctica)

Practicas experimentales de psicologia

Cargado por

gabriela
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
21 vistas4 páginas

AED (Exp-Práctica)

Practicas experimentales de psicologia

Cargado por

gabriela
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 4

Psicología Experimental - Análisis Exploratorio de Datos / Inferencia – Tukey

Sirve para:

 Detectar errores y datos faltantes;


 Mapeo de la estructura subyacente de los datos;
 Identificación de las variables más importantes;
 Listado de anomalías y valores atípicos;
 Probar una hipótesis / verificar suposiciones relacionadas con un modelo específico;
 Establecimiento de un modelo parsimonioso (uno que puede usarse para explicar relaciones entre los
datos utilizando un número mínimo de variables predictores).

Tiene como objetivos principales:

- Sugerir hipótesis acerca de las causas de los fenómenos observados. Cumple un papel similar al
contraste de hipótesis, en el cual se trata de plantear posibles explicaciones a los fenómenos que
estamos observando. Surgir posibles hipótesis explicativas.
- Comprobar las asunciones o los principios sobre las cuales se basan los estadísticos inferenciales. Si
los supuestos se cumplen o no.
- Apoyar la selección de las herramientas y técnicas estadísticas apropiadas. La decisión acerca de un
estadístico puede provenir de la forma de la distribución (P o NP). La decisión depende de si se
cumplen principios, para usar la herramienta y técnica adecuadamente.
- Proveer las bases para la futura recolección de datos. Valor heurístico, de poder ahondar más y tener
futuras consideraciones de aspectos.

¿Cuál es la diferencia de Análisis de Datos y Análisis Exploratorio de Datos? El AD es un proceso mucho más
amplio, aquí nos interesa desde cómo se obtuvieron los datos, como se procesaron, características de los
datos y que conclusiones se puede llevar a partir de esos datos. Es un proceso general, de forma global. En el
AED tenemos muchos objetivos relacionados con estadística descriptiva, nos interesan los aspectos gráficos,
los resúmenes estadísticos, saber si hay datos atípicos, si se cumplen los supuestos que se pueden usar en
otras técnicas (estadística inferencial). Es un conjunto de pasos que nos permite discernir cual es la mejor
forma de analizar los datos posteriormente. Su característica principal es poder comprender la estructura de
los datos con los que estamos trabajando, extraer algunas conclusiones, y proponer formas más adecuadas o
más apropiadas de analizar esos datos en el futuro. Es decir, en futuras técnicas, para saber si inclinarnos en
un tipo de análisis u otro. Nos interesa la representación de esos datos, comprobar los supuestos, y
recomendaciones en el futuro.

Pregunta 1: ¿Por qué se recomienda presentar los valores “p” con sus puntajes exactos, en lugar de
aproximados como p<0,05 como una solución al problema del contraste de hipótesis?

¿Qué es la significancia (valor p)? Asumiendo que la H0 es cierta, si rechazamos en la investigación nos
podemos estar equivocando en un % de los casos, eso es el valor p. Entonces, si tenemos un valor p elevado,
significa que, si nuestra H0 es cierta y nosotros la rechazamos, tenemos un % de probabilidad de estarnos
equivocando. Es decir, los resultados que nosotros obtuvimos podrían deberse a factores aleatorios y no a
que hay una diferencia sistemática en tanto % de los casos. Si ese valor es pequeño (si el % de error que
estamos asumiendo es de 5%) podemos decir que lo más probable es que estemos en lo correcto cuando
rechacemos esa hipótesis, porque decimos que nuestra probabilidad de equivocarnos o de haber obtenido
esos datos por factores aleatorios y no sistemáticos sería menor al 5%, 1% o 10%. Es un salto que no
necesariamente va con la realidad. Los valores de probabilidad se suelen asociar como que reflejan la
magnitud de la relación o que tan importante es el efecto o que tan verdadero son los resultados, ninguna de
esas interpretaciones es correcta. La significancia o el valor p es la probabilidad de que, asumiendo que la H0
es cierta, nosotros hayamos obtenido los estadísticos con lo que estamos trabajando; si esos estadísticos son
muy dispares entre si y la probabilidad de equivocarnos es pequeña, nosotros decimos que el término de error
es lo suficientemente pequeño para ir mas allá de la duda razonable, y por tanto yo asumo que la H0 es falsa.
¿Tiene alguna importancia el tamaño de la muestra con la significancia? Si el tamaño muestral es muy
pequeño conlleva a problemas, las diferencias tienen que ser abismales para que puedan ser significativas.
Pero, cuando se tiene un tamaño muestral muy grande, cualquier diferencia (por muy pequeña que sea) pasa
a ser una diferencia significativa. Entonces, cuando es muy pequeño el tamaño muestral: es muy difícil que
una diferencia sea significativa; y cuando es muy grande el tamaño muestral: es muy fácil que cualquiera
diferencia sea significativa. Cuando estamos trabajando con un tamaño muestral grande es más fácil de
cometer el error tipo I (rechazar una H0 cuando en realidad ésta es cierta); la diferencia era muy pequeña
(irrelevante), pero como su N es muy grande se concluye que es significativa. En el caso contrario, si el
tamaño de la muestra es muy pequeño es más fácil cometer el error tipo II (aceptar una H0 que en realidad es
falsa). Por lo tanto, es importante el tamaño muestral ya que puede cambiar de manera importante el
resultado, la conclusión va a ir por un camino distinto. El hecho de que nosotros basemos nuestras
conclusiones solo en el valor de significancia, se considera un procedimiento limitado o que este atado a
ciertas limitaciones importantes (en este caso, que una muestra pequeña este asociado al error tipo II y tener
una muestra grande que este asociado al error tipo II). La solución es trabajar con muestras no tan pequeñas
ni tan grandes.

¿Y la potencia qué? La potencia de la prueba es una probabilidad. Es la probabilidad de rechazar la H0


suponiendo que esta es falsa, estamos suponiendo que hay una diferencia, un efecto, y tomamos una
conclusión acorde a esa realidad. Detectar las verdaderas diferencias o poner en evidencia los efectos reales.
Cuando estamos analizando algo, nos interesa cumplir los supuestos, identificar las condiciones de
prerrequisitos que necesitamos que se cumplan. Si no se cumplen, tenemos que tomar medidas y éstas
tienen que ser beneficiosas para la potencia de la prueba y para el nivel de confianza. La idea es hacer el AN
más preciso y adecuado con los datos con los que estamos trabajando, para llegar a los resultados más
correctos con las condiciones que tenemos. Así podremos sacar conclusiones más válidas y que se puedan
tener en otras circunstancias.

En conclusión a la pregunta: Las puntuaciones p se deberían tener en valores exactos, porque no es lo


mismo de 0,049 (que está muy cercano al límite) a tener un resultado de 0,007. Ambos calzarían en la misma
categoría. Cuando se quiere hacer un análisis en donde se quieren replicar los resultados, no les va a servir
mucho que solo le digan 0,05. El hecho de precisar el valor de probabilidad le quita el estigma de que es una
decisión dicotómica de significativo y no significativo, sino cual es el resultado especifico que usted obtuvo.
Ejercicios:

1. Se presentan los datos de masculinidad para hombres y mujeres. Analice y


concluya.
Identificación: tipo de gráfico, variables que incluye.
Preparación: datos que podemos calcular.
Calcular: procedimientos que nos aportarían más información.
Conclusión: información que podemos sacar de los resultados.

Identificación: se presenta la variable masculinidad (VD: variable cuantitativa, intervalo) en función del sexo
(VI: variable categórica, nominal), mediante un gráfico de ojiva de frecuencias acumuladas. Se utiliza la
frecuencia acumulada absoluta.

En primer lugar, se tiene que los grupos presentan tamaños dispares. Al observar las frecuencias
acumuladas, se observa que las Mujeres tienen aprox. n=200 y los Hombres aprox. n=50. La mayor cantidad
de hombres tiene una masculinidad alrededor de 25 a 27 puntos y 30 a 31 puntos (Md alrededor de 30
puntos); y las mujeres entre 27 y 31 a 37 (Md alrededor de 30 puntos). Los hombres, más bien hacia puntajes
medios bajos y mujeres medios altos de masculinidad.

La solución más conveniente es convertir los datos a percentiles y construir un gráfico de caja y bigote, donde
es más fácil ver los puntajes extremos y cuerpo de la distribución.

2. ¿Por qué se recomienda presentar los valores “p” con sus puntajes exactos, en
lugar de aproximados como p<0,05 como una solución al problema del contraste
de hipótesis?

La significancia es la probabilidad de concluir que existe una relación, efecto o diferencia entre parámetros
cuando en realidad no la hay” o “es la probabilidad de rechazar la hipótesis nula (H0) cuando esta es
realmente cierta”. Al indicar solo p<0,05 no se puede conocer el valor exacto de p dentro del rango de valores
que puede adoptar cuando se reporta de forma resumida y se debe conocerse exactamente el nivel de error
asociado al estadístico calculado, para no perder información relevante al reportar los valores p solo en
función del criterio de aceptación/rechazo. Al no contar con el valor exacto de la significancia, los cálculos de
la potencia se podrían realizar solo de forma aproximada.

3. A continuación se presentan los datos correspondientes al sueldo y al cargo.

Identificación: se presenta la variable sueldo o salario actual en dólares (VD: variable


cuantitativa, razón), en función del cargo o categoría laboral –administrativo, seguridad y
directivo (VI: variable categórica, nominal), mediante un gráfico de caja y bigote.

Se observa una distribución de sueldos diferente para cada cargo. En seguridad el sueldo
es homogéneo y leptocúrtico, todos los sujetos ganan alrededor de $30000 con 5 casos
extremos 3 superiores a $30000, pero que no llegan $50000 y dos inferiores cercanos a
$20000.

En los directivos la mediana es mayor alrededor de 60000 dólares, con una distrución
asimétrica positiva, con algunas personas con sueltos altos mayores a $100000, una
persona con un valor altamente extremo mayor a $125000 . Entre estos dos grupos se
tienen diferencias claras, independientemente de los puntajes extremos.

En el grupo de administrativos se encuentra la mediana más baja alrededor de $25000


con personas que ganan alrededor de $12000. Este grupo es el que presenta mayores
puntajes extremos hacia sueldos superiores,con personas que llegan a ganar más de
50000 dólares. En este grupo medidas de tendencia central como la media se verían
afectadas por estos puntajes siendo mayor que la mediana y llevaría a presentar
diferencias con el grupo de seguridad, pero a favor del administrativo, por lo que aquí la
eliminación o consideración de los puntajes extremos es de suma importancia.

4.

Identificación: se presenta la variable presión arterial sistólica (VD: variable cuantitativa, razón), ante dos
técnicas anestésicasT1 y T2 (VI: variable categórica, nominal), mediante un diagrama de tallo y hoja de
espalda con espalda. El tallo vale 10, y se supone que cada hoja 1 (no indican la N de cada grupo).
En el grupo T1 hay 19 personas y en el T2 hay 19, siendo proporcionales en cuanto a la n.
En T1 el grupo va desde una PAS de 74 a una de 164; en el T2 de 54 a 117. En el grupo T1, el 164 de PAS
es un puntaje extremo, aunque no identificado como tal en el diagrama, que indica una PAS alta, fuera de lo
normal. Al eliminar este paciente, la mayor PAS del grupo es 132, ligeramente mayor a lo normal (120 mmHg).
En ambos grupos los niveles son bajos, siendo más bajos en el grupo T2 (Md=89) que en T1(Md=106).

También podría gustarte