martes, 15 de marzo de 2011

Cómo interpretar un diagrama de dispersión


Posibles tipos de relaciones entre variables

El diagrama de dispersión se puede utilizar para estudiar:

  • Relaciones causa – efecto

Este es el caso más común en su utilización para la mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto observado y de su posible causa.
Ejemplo: Comprobar la relación entre el número de errores y la hora en que se cometen.
  • Relaciones entre dos efectos

Sirve para contrastar la teoría de que ambos provienen de una causa común desconocida o difícil de medir.
Ejemplo: Analizar la relación entre el número de quejas que llegan y el aumento/disminución de las ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.
  • Posibilidad de utilizar un efecto como sustituto de otro

Se puede utilizar para controlar efectos difíciles o costosos de medir, a través de otros con medición más simple.
Ejemplo: Estudiar la relación existente entre reducción de costes y satisfacción del cliente para utilizar el parámetro de más fácil medición en la evaluación de las actividades de planificación.
  • Relaciones entre dos posibles causas

Sirve para actuar sobre efectos de forma más simple o adecuada y para analizar procesos complejos.
Ejemplo: analizar la relación entre el porcentaje idóneo de contenido en potasio de un fertilizante y la cantidad media de lluvia recogida en la zona de cultivo, puesto que ambos elementos influyen en la calidad del vino y el régimen de lluvias no pueden ser modificado.

Proceso de interpretación

El diagrama de dispersión expresa el grado de relación entre dos variables, y dicha relación no necesariamente significa que una de ellas es la causa de la otra.
El análisis de un diagrama de dispersión es un proceso de cuatro pasos:

Primero: Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos variables.
Segundo: Recoger datos y construir el diagrama.
Tercero: Identificar y clasificar la pauta de correlación.
Cuarto: Discutir la teoría original y considerar otras explicaciones.

La construcción y clasificación del diagrama de dispersión es la parte central del proceso. No es ni el principio ni el final.

Pautas típicas de correlación

Correlación Fuerte
Los puntos se agrupan claramente alrededor de una línea imaginaria que pasa por el centro de la masa de los mismos. Estos casos sugieren que el control de una de las variables lleva al control de la otra.
Los datos parecen confirmar la teoría estudiada, pero hay que analizar la existencia de otras posibles explicaciones admisibles y relevantes para dicha relación.
Correlación fuerte positiva:
El valor de la variable “Y” (eje vertical) aumenta claramente con el valor de la variable “X” (eje horizontal).


            Correlación fuerte negativa:
            El valor de “Y” disminuye claramente cuando “X” aumenta.


Correlación Débil
Los puntos no están suficientemente agrupados, como para asegurar que existe la relación. El control de una de las variables no necesariamente nos llevará al control de la otra.
Si lo que busca es determinar las causas de un problema, se deben buscar otras variables con una relación mayor o más relevante sobre el efecto.
                Correlación débil positiva:
El valor de la variable “Y” (eje vertical) tiende a aumentar cuando aumenta el valor de la variable “X” (eje horizontal).

                Correlación débil negativa:
                El valor de “Y” tiende a disminuir cuando aumenta el valor de “X”.

Correlación compleja
El valor de la variable “Y” parece estar relacionado con el de la variable “X”, pero esta relación no es simple o lineal.


Sin correlación
Para cualquier valor de la variable “X”, “Y” puede tener cualquier valor. No aparece ninguna relación especial entre ambas variables.


Posibles problemas y deficiencias de interpretación

        a)     Correlación sin soporte lógico
Los diagramas de dispersión muestran solamente relaciones, no prueban relaciones casuales. Ha de haber una explicación lógica y admisible para establecer una relación causa – efecto.
        b)     Recorrido de los datos
En el análisis del diagrama se limitará su interpretación al recorrido de las observaciones. Generalizar las pautas de correlación para valores fuera de los límites del gráfico, pueden llevar a conclusiones completamente erróneas. Si se necesita conocer la relación entre dos variables para un rango de valores determinado, hay que obtener datos alrededor de ese rango.

Ejemplo:

El examen de los datos relativos al campo “A” (Correlación positiva) no nos permite extraer conclusiones sobre el comportamiento de las variables para otros valores, por ejemplo en el campo “D” (Correlación negativa)
 c)     Efecto de la escala
Las escalas de los dos ejes influyen notablemente sobre la interpretación del diagrama de dispersión.
Escalas deficientes en alguno de los ejes puede enmascarar una relación o hacer ver relaciones inexistentes.

d)     Factores de confusión
Con el diagrama de dispersión tratamos de estudiar una relación entre dos variables. Debemos asegurarnos de que la correlación que observamos no sea debida a una variable distinta de la que estamos registrado.
La forma ideal para tratar los factores de confusión es antes de la recogida de datos. Identificar posibles factores de confusión y disponer la toma de datos de forma que se mantengan razonablemente constantes.
Los factores de confusión se medirán en la toma de datos, y si no ha sido posible mantenerlos constantes, se construirá un diagrama de dispersión estratificado según las condiciones de dichos factores.

e)      Problemas con los datos
Si los datos son deficientes, la interpretación del diagrama de dispersión tiene, por fuerza, que ser deficiente.

No hay comentarios:

Publicar un comentario