martes, 15 de marzo de 2011

Ejemplo de como usar un diagrama de dispersión


Errores en las Facturas

Situación

Un equipo se encargó de analizar las causas de los frecuentes errores en las facturas.
El número de datos a rellenar variaba según el tipo de factura.  Un miembro del equipo propuso concentrarse en simplificar las facturas más complicadas, seguramente causa de la mayoría de los errores.
El equipo decidió investigar en primer lugar la teoría, aparentemente obvia, según la cual el número de errores en una factura dependía de la cantidad de datos a incluir en la misma.
El equipo recogió los datos relativos a los últimos meses y los representó en un Diagrama de Dispersión.



El Diagrama de Dispersión no parecía confirmar la teoría de una relación entre el número de datos a incluir en la factura y la cantidad de errores en la misma.
Una estratificación de los datos por empleada (una tenía muchas más experiencia que la otra) mostró que efectivamente no existía la correlación buscada pero sí una clara diferencia en el número de errores entre las dos.



El proporcionar más formación a la empleada con menor experiencia llevó a una sensible reducción de los errores en las facturas.



Comparativa de software disponible para diseñar diagramas de dispersión

Para qué sirve un diagrama de dispersión (Utilidades)


El diagrama de dispersión es una herramienta útil para comprobar (aceptar o rechazar) teorías respecto a la supuesta existencia de una relación entre dos variables.

Utilización en las fases de un proceso de solución de problemas

Hay tres puntos de dicho proceso en los que el diagrama de dispersión puede ser una herramienta útil:
·             Durante la fase de diagnóstico, para ensayar teorías sobre las causas e identificar las causas raíz.
·             Durante la fase de corrección, en el diseño de soluciones.
·             Para el diseño de un sistema de control que mantenga los resultados de una acción de mejora de la calidad.

La herramienta es muy útil para:
La herramienta es útil para:
·             Determinación de causas
·             Diseño de soluciones y controles

·             Priorización de causas

La herramienta está fuertemente relacionada con:
La herramienta esta débilmente relacionada con:
·             Diagrama matricial
·             Hojas de comprobación y recogida de datos
·             Diseño de experimentos

Cómo interpretar un diagrama de dispersión


Posibles tipos de relaciones entre variables

El diagrama de dispersión se puede utilizar para estudiar:

  • Relaciones causa – efecto

Este es el caso más común en su utilización para la mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto observado y de su posible causa.
Ejemplo: Comprobar la relación entre el número de errores y la hora en que se cometen.
  • Relaciones entre dos efectos

Sirve para contrastar la teoría de que ambos provienen de una causa común desconocida o difícil de medir.
Ejemplo: Analizar la relación entre el número de quejas que llegan y el aumento/disminución de las ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.
  • Posibilidad de utilizar un efecto como sustituto de otro

Se puede utilizar para controlar efectos difíciles o costosos de medir, a través de otros con medición más simple.
Ejemplo: Estudiar la relación existente entre reducción de costes y satisfacción del cliente para utilizar el parámetro de más fácil medición en la evaluación de las actividades de planificación.
  • Relaciones entre dos posibles causas

Sirve para actuar sobre efectos de forma más simple o adecuada y para analizar procesos complejos.
Ejemplo: analizar la relación entre el porcentaje idóneo de contenido en potasio de un fertilizante y la cantidad media de lluvia recogida en la zona de cultivo, puesto que ambos elementos influyen en la calidad del vino y el régimen de lluvias no pueden ser modificado.

Proceso de interpretación

El diagrama de dispersión expresa el grado de relación entre dos variables, y dicha relación no necesariamente significa que una de ellas es la causa de la otra.
El análisis de un diagrama de dispersión es un proceso de cuatro pasos:

Primero: Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos variables.
Segundo: Recoger datos y construir el diagrama.
Tercero: Identificar y clasificar la pauta de correlación.
Cuarto: Discutir la teoría original y considerar otras explicaciones.

La construcción y clasificación del diagrama de dispersión es la parte central del proceso. No es ni el principio ni el final.

Pautas típicas de correlación

Correlación Fuerte
Los puntos se agrupan claramente alrededor de una línea imaginaria que pasa por el centro de la masa de los mismos. Estos casos sugieren que el control de una de las variables lleva al control de la otra.
Los datos parecen confirmar la teoría estudiada, pero hay que analizar la existencia de otras posibles explicaciones admisibles y relevantes para dicha relación.
Correlación fuerte positiva:
El valor de la variable “Y” (eje vertical) aumenta claramente con el valor de la variable “X” (eje horizontal).


            Correlación fuerte negativa:
            El valor de “Y” disminuye claramente cuando “X” aumenta.


Correlación Débil
Los puntos no están suficientemente agrupados, como para asegurar que existe la relación. El control de una de las variables no necesariamente nos llevará al control de la otra.
Si lo que busca es determinar las causas de un problema, se deben buscar otras variables con una relación mayor o más relevante sobre el efecto.
                Correlación débil positiva:
El valor de la variable “Y” (eje vertical) tiende a aumentar cuando aumenta el valor de la variable “X” (eje horizontal).

                Correlación débil negativa:
                El valor de “Y” tiende a disminuir cuando aumenta el valor de “X”.

Correlación compleja
El valor de la variable “Y” parece estar relacionado con el de la variable “X”, pero esta relación no es simple o lineal.


Sin correlación
Para cualquier valor de la variable “X”, “Y” puede tener cualquier valor. No aparece ninguna relación especial entre ambas variables.


Posibles problemas y deficiencias de interpretación

        a)     Correlación sin soporte lógico
Los diagramas de dispersión muestran solamente relaciones, no prueban relaciones casuales. Ha de haber una explicación lógica y admisible para establecer una relación causa – efecto.
        b)     Recorrido de los datos
En el análisis del diagrama se limitará su interpretación al recorrido de las observaciones. Generalizar las pautas de correlación para valores fuera de los límites del gráfico, pueden llevar a conclusiones completamente erróneas. Si se necesita conocer la relación entre dos variables para un rango de valores determinado, hay que obtener datos alrededor de ese rango.

Ejemplo:

El examen de los datos relativos al campo “A” (Correlación positiva) no nos permite extraer conclusiones sobre el comportamiento de las variables para otros valores, por ejemplo en el campo “D” (Correlación negativa)
 c)     Efecto de la escala
Las escalas de los dos ejes influyen notablemente sobre la interpretación del diagrama de dispersión.
Escalas deficientes en alguno de los ejes puede enmascarar una relación o hacer ver relaciones inexistentes.

d)     Factores de confusión
Con el diagrama de dispersión tratamos de estudiar una relación entre dos variables. Debemos asegurarnos de que la correlación que observamos no sea debida a una variable distinta de la que estamos registrado.
La forma ideal para tratar los factores de confusión es antes de la recogida de datos. Identificar posibles factores de confusión y disponer la toma de datos de forma que se mantengan razonablemente constantes.
Los factores de confusión se medirán en la toma de datos, y si no ha sido posible mantenerlos constantes, se construirá un diagrama de dispersión estratificado según las condiciones de dichos factores.

e)      Problemas con los datos
Si los datos son deficientes, la interpretación del diagrama de dispersión tiene, por fuerza, que ser deficiente.

Construcción de un diagrama de dispersión


Pasos previos a la construcción de un diagrama de dispersión

Paso 1: Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos variables

Este paso previo es de gran importancia, puesto que el análisis de un diagrama de dispersión permite obtener conclusiones sobre la existencia de una relación entre dos variables, no sobre la naturaleza de dicha relación.

Paso 2: Obtener los pares de datos correspondientes a las dos variables

Al igual que en cualquier otra herramienta de análisis de datos, éstos son la base de las conclusiones obtenidas, por lo tanto cumplirán las siguientes condiciones:
  • En cantidad suficiente: Se consideran necesarios al menos 40 pares de datos para construir un diagrama de dispersión.
  • Datos correctamente emparejados: Se estudiará la relación entre ambos.
  • Datos exactos: Las inexactitudes afectan a su situación en el diagrama desvirtuando su apariencia visual.
  • Datos representativos: Asegúrese de que cubren todas las condiciones operativas del proceso.
  • Información completa: Anotar las condiciones en que han sido obtenidos los datos.

Pasos en la construcción de un diagrama de dispersión

Paso 3: Determinar los valores máximo y mínimo para cada una de las variables

Ejemplo: Tabla de los datos recogidos

Teoría: La fatiga es causa de los errores de tecleo
Número de errores de tecleo según la hora del día
Hora Error Hora Error Hora Error Hora Error
11:00 25 13:30 38 09:30 15 12:45 33
14:15 45 12:15 14 15:45 72 10:45 17
10:00 7 16:30 56 10:30 35 11:45 8
13:45 26 14:45 60 11:30 18 15:30 30
09:15 22 12:30 11 16:15 63 09:45 22
16:00 50 13:30 55 15:30 62 12:45 41
12:30 60 15:15 40 09:45 31 09:15 22
13:45 19 14:45 25 14:30 32 15:15 80
14:30 78 10:45 10 14:45 56 12:00 30
13:00 22 13:45 19 12:15 45 10:15 22

Paso 4: Decidir sobre qué eje se representará a cada una de las variables

Si se está estudiando una posible relación causa – efecto, el eje horizontal representará la supuesta causa.

Paso 5: Trazar y rotular los ejes horizontal y vertical

La construcción de los ejes afecta el aspecto y la consiguiente interpretación del diagrama.
  1. Los ejes han de ser aproximadamente de la misma longitud, determinando un área cuadrada.
  2. La numeración de los ejes ha de ir desde un valor ligeramente menor que el valor mínimo de cada variable hasta un valor ligeramente superior al valor máximo de las mismas. Esto permite que los puntos abarquen toda el área de registro de los datos.
  3. Numerar los ejes a intervalos iguales y con incrementos de la variable constantes.
  4. Los valores crecientes han de ir de abajo hacia arriba y de izquierda a derecha en los ejes vertical y horizontal respectivamente.
  5. Rotular cada eje con la descripción de la variable correspondiente y con su unidad de medida.
Ejemplo:

Paso 6: Marcar sobre el diagrama los pares de datos

  1. Para cada par de datos localizar la intersección de las lecturas de los ejes correspondientes y señalarlo con un punto o símbolo.
Ejemplo:
 
  1. Cuando coinciden muchos pares de puntos, el diagrama de dispersión puede hacerse confuso. En este caso es recomendable utilizar una “Tabla de Correlación” para representar la correlación.
Ejemplo:
 
  1. En el caso en que se construye un diagrama de dispersión separando los pares de datos (por ejemplo, según el turno de trabajo, lote de materia prima, etc.), deben escogerse símbolos que pongan de manifiesto los diferentes grupos de puntos de forma clara.

Paso 7: Rotular el gráfico

Se rotula el título del gráfico y toda aquella información necesaria para su correcta comprensión.

En general, es conveniente incluir una descripción adicional del objeto de las medidas y de las condiciones en que se han realizado, ya que esta información puede ayudar en la interpretación del diagrama.


Proceso para la construcción de un diagrama de dispersión

Diagrama de dispersión (Definiciones y conceptos básicos)


Correlación

Definición

Se entiende por correlación al grado de relación existente entre dos variables.

Concepto

Cuando ente dos variables existe una correlación toral, se cumple que cada valor de una, le corresponde un único valor de la otra (función matemática).
Es frecuente que dos variables estén relacionadas de forma que a cada valor de una de ellas le correspondan varios valores de la otra.

Diagrama de dispersión

Definición

Representación gráfica del grado de relación entre dos variables cuantitativas.

Características principales

A continuación se comentan una serie de características que ayudan a comprender la naturaleza de la herramienta.

Impacto Visual

Un diagrama de dispersión muestra la posibilidad de la existencia de correlación entre dos variables de un vistazo.

Comunicación

Simplifica el análisis de situaciones numéricas complejas.

Guía en la investigación

El análisis de datos mediante esta herramienta proporciona mayor información que el simple análisis matemático de correlación, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjurar datos y procesos en su utilización.