Para el análisis de un conjunto de datos la clave es conocer su tendencia central y su dispersión. En el post de hoy, vamos a ver que el histograma y la tabla de frecuencias permiten visualizar estos dos aspectos de un conjunto de datos, y además muestran la forma en que los datos se distribuyen dentro de su rango de variación.
De manera específica, vamos a definir el histograma como:
El histograma es una representación gráfica, en forma de barras, de la distribución de un conjunto de datos o una variable, donde los datos se clasifican por su magnitud en cierto número de grupos o clases, y cada clase es representada por una barra, cuya longitud es proporcional a la frecuencia de los valores representados. Por lo general, el eje horizontal está formado por una escala numérica para mostrar la magnitud de los datos; mientras que en el eje vertical se representan las frecuencias.Comúnmente el histograma se obtiene a partir de la tabla de frecuencias. Para obtener ésta, primero se divide el rango de variación de los datos en cierta cantidad de intervalos que cubren todo el rango, y después se determina cuántos datos caen en cada intervalo. Se recomienda que el número de intervalos o clases sea de 5 a 15. Otro criterio, conocido como la regla de Sturges, señala que el número de clases es igual a 1 + 3.3 x log10 (número de datos).
La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla práctica acerca del número de clases que deben considerar al elaborarse un histograma. Este número viene dado por la siguiente expresión:
c = 1 + log2 (M)
donde M es el tamaño de la muestra. Que puede escribirse a partir de logaritmos base 10 de la siguiente forma:
$$c=1+\frac { log(M) }{ log(2) }$$
donde M es el tamaño de la muestra. El valor de c (número de clases) es común redondearlo al entero más cercano.
Ejemplo.
En un proceso de inyección de plástico una característica de calidad del producto (disco) es su grosor, que debe ser de 1.20 mm con una tolerancia de ±0.10 mm. Así, para considerar que el proceso de inyección fue satisfactorio, el grosor del disco debe estar entre la especificación inferior, EI = 1.10 y la superior, ES = 1.30.
En un estudio de capacidad para este proceso es necesario contestar las siguientes interrogantes: ¿qué tipo de discos en cuanto a grosor se están produciendo? ¿El grosor medio es adecuado? ¿La variabilidad del grosor es mucha o poca? Para contestar estas preguntas, durante una semana se obtuvieron de una línea de producción los 125 datos de la tabla 2.1. El muestreo fue sistemático: cada determinado tiempo se tomaban cinco productos y se medían y al final de la semana se tuvieron los datos referidos.
1.15 1.20 1.17 1.16 1.16 1.15 1.17 1.20 1.16 1.19 1.17 1.13 1.15 1.20 1.18 1.17 1.16
1.20 1.17 1.17 1.20 1.14 1.19 1.13 1.19 1.16 1.18 1.16 1.17 1.15 1.21 1.15 1.20 1.18
1.17 1.17 1.13 1.16 1.16 1.17 1.20 1.18 1.15 1.13 1.20 1.17 1.19 1.23 1.20 1.24 1.17
1.17 1.17 1.17 1.18 1.24 1.16 1.18 1.16 1.22 1.23 1.22 1.19 1.13 1.15 1.15 1.22 1.19
1.18 1.19 1.17 1.16 1.17 1.18 1.19 1.23 1.19 1.16 1.19 1.20 1.17 1.13 1.22 1.19 1.21
1.20 1.19 1.17 1.19 1.22 1.19 1.18 1.11 1.19 1.19 1.17 1.19 1.17 1.20 1.16 1.19 1.20
1.20 1.17 1.25 1.16 1.16 1.20 1.20 1.16 1.18 1.21 1.20 1.22 1.19 1.14 1.19 1.17 1.20
1.16 1.15 1.20 1.12 1.11 1.18
De dicho muestreo sacamos una tabla de frecuencias que es la que tenemos a continuación:
Clase | Grosor de discos | Frecuencia | Frecuencia porcentual |
1 | 1.10 < X ≤ 1.12 | 3 | 2.4 |
2 | 1.12 < X ≤ 1.14 | 8 | 6.4 |
3 | 1.14 < X ≤ 1.16 | 26 | 20.8 |
4 | 1.16 < X ≤ 1.18 | 34 | 27.2 |
5 | 1.18 < X ≤ 1.20 | 39 | 31.2 |
6 | 1.20 < X ≤ 1.22 | 9 | 7.2 |
7 | 1.22 < X ≤ 1.24 | 5 | 4.0 |
8 | 1.24 < X ≤ 1.26 | 1 | 0.8 |
Interpretación del histograma.
Cuando un histograma se construye de manera correcta, es resultado de un número suficiente de datos (de preferencia más de 100), y éstos son representativos del estado del proceso durante el periodo de interés; entonces, se recomienda considerar los siguientes puntos en la interpretación del histograma.
Figura 1. Histograma para grosor de discos.
- Observar la tendencia central de los datos. Localizar en el eje horizontal o escala de medición las barras con mayores frecuencias. En el histograma de la figura 1, una parte sustancial de las mediciones se localiza entre 1.14 y 1.20 mm.
- Estudiar el centrado del proceso. Para ello, es necesario apoyarse en el punto anterior y observar la posición central del cuerpo del histograma con respecto a la calidad óptima y a las especificaciones. Por ejemplo, en la figura 1 incisos a) y c) se muestran procesos centrados, el primero presenta poca variabilidad, pero en el segundo ocurre lo contrario. Mientras que en los incisos b) y d ) se observan procesos descentrados, el primero con poca variabilidad y el segundo con mucha. Aun cuando se cumplan las especificaciones, si el proceso no está centrado, la calidad que se produce no es adecuada, ya que entre más se aleje del óptimo más mala calidad se tendrá. Por ello, en caso de tener un proceso descentrado se procede a realizar los ajustes o cambios necesarios para centrar el proceso.
- Examinar la variabilidad del proceso. Consiste en comparar la amplitud de las especificaciones con el ancho del histograma. Para considerar que la dispersión no es demasiada, el ancho del histograma debe caber de forma holgada en las especificaciones. En la figura 2.2 incisos a) y b) hay poca variación, mientras que en los incisos c) y d) ocurre lo contrario.
- Analizar la forma del histograma. Al observar un histograma considerar que la forma de distribución de campana es la que más se da en salidas de proceso y tiene características similares a la distribución normal (campana de Gauss). Es frecuente que cuando la distribución no es de este tipo sea la señal de un hecho importante que está ocurriendo en el proceso y que tiene un efecto negativo en la calidad. Por ello, es necesario revisar si la forma del histograma es muy diferente a la de campana.
Distribución sesgada Forma asimétrica de la distribución de unos datos o una variable, donde la cola de un lado de la distribución es más larga que la del otro lado.
Para acabar con el tema de hoy, vamos a ver un vídeo explicativo de cómo hacer un histograma con la herramienta Microsoft Excel.
Espero que este post haya sido de vuestro interés. Me encantaría, más que nunca, ver vuestras valoraciones y leer vuestros comentarios a través de las herramientas que este blog pone a vuestra disposición.
#rincondelsueko en Twitter, Facebook, Flipboard y Google+
No hay comentarios:
Publicar un comentario