En la práctica, el promedio móvil proporcionará una buena estimación de la media de la serie temporal si la media es constante o cambia lentamente. En el caso de una media constante, el mayor valor de m dará las mejores estimaciones de la media subyacente. Un período de observación más largo promediará los efectos de la variabilidad. El propósito de proporcionar un m más pequeño es permitir que el pronóstico responda a un cambio en el proceso subyacente. Para ilustrar, proponemos un conjunto de datos que incorpora cambios en la media subyacente de la serie temporal. La figura muestra las series temporales utilizadas para la ilustración junto con la demanda media a partir de la cual se generó la serie. La media comienza como una constante en 10. Comenzando en el tiempo 21, aumenta en una unidad en cada período hasta que alcanza el valor de 20 en el tiempo 30. Entonces se vuelve constante otra vez. Los datos se simulan sumando a la media un ruido aleatorio de una distribución Normal con media cero y desviación estándar 3. Los resultados de la simulación se redondean al entero más próximo. La tabla muestra las observaciones simuladas utilizadas para el ejemplo. Cuando usamos la tabla, debemos recordar que en cualquier momento dado, sólo se conocen los datos pasados. Las estimaciones del parámetro del modelo, para tres valores diferentes de m se muestran junto con la media de las series temporales de la siguiente figura. La figura muestra la media móvil de la estimación de la media en cada momento y no la previsión. Los pronósticos cambiarían las curvas de media móvil a la derecha por períodos. Una conclusión es inmediatamente aparente de la figura. Para las tres estimaciones, la media móvil se queda por detrás de la tendencia lineal, con el rezago aumentando con m. El retraso es la distancia entre el modelo y la estimación en la dimensión temporal. Debido al desfase, el promedio móvil subestima las observaciones a medida que la media aumenta. El sesgo del estimador es la diferencia en un tiempo específico en el valor medio del modelo y el valor medio predicho por el promedio móvil. El sesgo cuando la media está aumentando es negativo. Para una media decreciente, el sesgo es positivo. El retraso en el tiempo y el sesgo introducido en la estimación son funciones de m. Cuanto mayor sea el valor de m. Mayor es la magnitud del retraso y sesgo. Para una serie cada vez mayor con tendencia a. Los valores de retraso y sesgo del estimador de la media se dan en las ecuaciones siguientes. Las curvas de ejemplo no coinciden con estas ecuaciones porque el modelo de ejemplo no está aumentando continuamente, sino que comienza como una constante, cambia a una tendencia y luego vuelve a ser constante de nuevo. También las curvas de ejemplo se ven afectadas por el ruido. El pronóstico de media móvil de los períodos en el futuro se representa desplazando las curvas hacia la derecha. El desfase y sesgo aumentan proporcionalmente. Las ecuaciones a continuación indican el retraso y sesgo de los períodos de previsión en el futuro en comparación con los parámetros del modelo. Nuevamente, estas fórmulas son para una serie de tiempo con una tendencia lineal constante. No debemos sorprendernos de este resultado. El estimador del promedio móvil se basa en el supuesto de una media constante, y el ejemplo tiene una tendencia lineal en la media durante una parte del período de estudio. Dado que las series de tiempo real rara vez obedecerán exactamente las suposiciones de cualquier modelo, debemos estar preparados para tales resultados. También podemos concluir de la figura que la variabilidad del ruido tiene el efecto más grande para m más pequeño. La estimación es mucho más volátil para el promedio móvil de 5 que el promedio móvil de 20. Tenemos los deseos en conflicto de aumentar m para reducir el efecto de la variabilidad debido al ruido y disminuir m para hacer el pronóstico más sensible a los cambios En promedio El error es la diferencia entre los datos reales y el valor previsto. Si la serie temporal es verdaderamente un valor constante, el valor esperado del error es cero y la varianza del error está compuesta por un término que es una función de y un segundo término que es la varianza del ruido. El primer término es la varianza de la media estimada con una muestra de m observaciones, suponiendo que los datos provienen de una población con una media constante. Este término se minimiza haciendo m tan grande como sea posible. Un m grande hace que el pronóstico no responda a un cambio en la serie temporal subyacente. Para hacer que el pronóstico responda a los cambios, queremos que m sea lo más pequeño posible (1), pero esto aumenta la varianza del error. El pronóstico práctico requiere un valor intermedio. Previsión con Excel El complemento de previsión implementa las fórmulas de promedio móvil. El siguiente ejemplo muestra el análisis proporcionado por el complemento para los datos de muestra en la columna B. Las primeras 10 observaciones se indexan -9 a 0. En comparación con la tabla anterior, los índices de período se desplazan en -10. Las primeras diez observaciones proporcionan los valores iniciales para la estimación y se utilizan para calcular la media móvil para el período 0. La columna MA (10) (C) muestra las medias móviles calculadas. El parámetro de la media móvil m está en la celda C3. La columna Fore (1) (D) muestra un pronóstico para un período en el futuro. El intervalo de pronóstico está en la celda D3. Cuando el intervalo de pronóstico se cambia a un número mayor, los números de la columna Fore se desplazan hacia abajo. La columna Err (1) (E) muestra la diferencia entre la observación y el pronóstico. Por ejemplo, la observación en el tiempo 1 es 6. El valor pronosticado a partir de la media móvil en el tiempo 0 es 11.1. El error entonces es -5.1. La desviación estándar y la media media de la desviación (MAD) se calculan en las células E6 y E7, respectivamente. El científico y los ingenieros Guía de procesamiento de señales digitales Por Steven W. Smith, Ph. D. Capítulo 2: Estadística, Probabilidad y Ruido La Distribución Normal Las señales formadas a partir de procesos aleatorios usualmente tienen un formato en forma de campana. Esto se llama una distribución normal, una distribución de Gauss, o un Gaussiano, después del gran matemático alemán, Karl Friedrich Gauss (1777-1855). La razón por la que esta curva ocurre tan frecuentemente en la naturaleza se discutirá en breve en conjunción con la generación de ruido digital. La forma básica de la curva se genera a partir de un exponente cuadrado negativo: Esta curva bruta se puede convertir en el Gaussian completo mediante la adición de una media ajustable. Y desviación estándar, sigma. Además, la ecuación debe normalizarse de manera que el área total bajo la curva sea igual a uno, requisito de todas las funciones de distribución de probabilidad. Esto da como resultado la forma general de la distribución normal, una de las relaciones más importantes en estadística y probabilidad: La figura 2-8 muestra varios ejemplos de curvas gaussianas con varios medios y desviaciones estándar. La media centra la curva sobre un valor particular, mientras que la desviación estándar controla el ancho de la forma de campana. Una característica interesante del gaussiano es que las colas caen hacia cero muy rápidamente, mucho más rápido que con otras funciones comunes tales como decadentes exponenciales o 1 / x. Por ejemplo, a dos, cuatro y seis desviaciones estándar de la media, el valor de la curva gaussiana ha descendido a 1/19, 1/7563 y 1 / 166.666.666, respectivamente. Esta es la razón por la cual las señales normalmente distribuidas, como se ilustra en la Fig. 2-6c, parecen tener un valor pico-a-pico aproximado. En principio, señales de este tipo pueden experimentar excursiones de amplitud ilimitada. En la práctica, la fuerte caída del pdf gaussiano dicta que estos extremos casi nunca ocurren. Esto da como resultado que la forma de onda tenga un aspecto relativamente delimitado con una aparente amplitud de cresta de pico de aproximadamente 6-8sigma. Como se ha mostrado anteriormente, la integral del pdf se usa para encontrar la probabilidad de que una señal esté dentro de un cierto rango de valores. Esto hace que la integral del pdf sea lo suficientemente importante como para que se dé su propio nombre, la función de distribución acumulativa (cdf). Un problema especialmente desagradable con el gaussiano es que no puede ser integrado usando métodos elementales. Para superar esto, la integral del Gaussiano se puede calcular por integración numérica. Esto implica el muestreo de la curva continua Gaussian muy finamente, por ejemplo, unos pocos millones de puntos entre -10sigma y 10sigma. Las muestras en esta señal discreta se agregan entonces para simular la integración. La curva discreta resultante de esta integración simulada se almacena entonces en una tabla para su uso en el cálculo de probabilidades. La cdf de la distribución normal se muestra en la Fig. 2-9, con sus valores numéricos listados en la Tabla 2-5. Dado que esta curva se utiliza con tanta frecuencia en probabilidad, se le da su propio símbolo: Phi (x) (phi griego en mayúsculas). Por ejemplo, Phi (-2) tiene un valor de 0,0228. Esto indica que hay una probabilidad de 2.28 de que el valor de la señal estará entre - infin y dos desviaciones estándar por debajo de la media, en cualquier momento elegido al azar. Del mismo modo, el valor: Phi (1) 0.8413, significa que existe una probabilidad 84.13 de que el valor de la señal, en un instante seleccionado al azar, esté entre - infin y una desviación estándar por encima de la media. Para calcular la probabilidad de que la señal será entre dos valores, es necesario restar los números apropiados que se encuentran en la tabla Phi (x). Por ejemplo, la probabilidad de que el valor de la señal, en algún momento elegido al azar, esté entre dos desviaciones estándar por debajo de la media y una desviación estándar por encima de la media, está dada por: Phi (1) - Phi (-2) 0.8185 O 81.85 Usando este método, las muestras tomadas de una señal normalmente distribuida estarán dentro de 1sigma de la media aproximadamente 68 del tiempo. Estarán dentro de 2sigma aproximadamente 95 del tiempo, y dentro de 3sigma aproximadamente 99.75 del tiempo. La probabilidad de que la señal sea más de 10 desviaciones estándar respecto a la media es tan minúscula, se esperaría que ocurriera sólo unos pocos microsegundos desde el comienzo del universo, unos 10 mil millones de años. La ecuación 2-8 también puede usarse para expresar La función de masa de probabilidad de las señales discretas distribuidas normalmente. En este caso, x está restringido a ser uno de los niveles cuantificados que puede soportar la señal, tal como uno de los 4096 valores binarios que salen de un convertidor analógico a digital de 12 bits. Ignore el término sigma 1 / radic 2pi, solo se usa para hacer que el área total bajo la curva pdf sea igual a uno. En su lugar, debe incluir cualquier término que sea necesario para hacer que la suma de todos los valores en el pmf sea igual a uno. En la mayoría de los casos, esto se hace generando la curva sin preocuparse por la normalización, sumando todos los valores no normalizados y luego dividiendo todos los valores por la suma. , CQE CQA Las distribuciones no normales en el mundo real artículo de Tom Pyzdek proporciona muchos ejemplos y razonamientos sólidos para la existencia de datos no normales. Tom explaya sobre las implicaciones de la no-normalidad, particularmente en lo que se refiere a los cálculos de capacidad. Como sugiere Tom, cuando los procesos son suficientemente no normales, tendremos que estimar la forma de la distribución para calcular la capacidad del proceso o los límites de control para los datos individuales. La mayoría de los productos de SPC, incluyendo SPC-PC IV, SPC IV Excel y SPC Explorer de Quality America. Permiten a los usuarios ajustar las curvas a los datos usando la familia de distribuciones de Johnson. Un requisito clave para definir distribuciones es que los datos sean de un proceso controlado. Esto tiene sentido, ya que la falta de control estadístico indica la presencia de múltiples distr i buciones. Cuando pueden formarse subgrupos racionales de tamaño mayor que uno, se puede usar un gráfico de X-Bar para evaluar el control del proceso. Cuando los subgrupos racionales se limitan a observaciones únicas, las gráficas Individual-X parecerían la elección natural para evaluar el control del proceso. Sin embargo, necesitamos definir la distribución para calcular los límites de control adecuados para estos valores de datos individuales. Esto es un problema, ya que no podemos definir la distribución d a menos que el proceso esté en control. Parece que estamos en un escenario Catch 22. Afortunadamente, hay otros gráficos para los datos individuales. El gráfico de EWMA y el gráfico de Media móvil son opciones populares para esta situación. Dado que la estadística gráfica es un promedio (un promedio ponderado exponencial o una media móvil, respectivamente), la distribución Normal se utiliza para definir límites de control. Podemos establecer el control utilizando el E WMA o MA gráfico, a continuación, definir la distribución mediante los métodos de Johnson. Esta curva ajustada se puede utilizar para calcular la capacidad del proceso y los límites de control para el gráfico de individuos. Desde 1982: La ciencia del arte para mejorar su línea de fondo Quality America ofrece software de control estadístico de procesos, así como materiales de capacitación para Lean Six Sigma, gestión de la calidad y SPC. Adoptamos un enfoque orientado al cliente y lideramos muchas innovaciones de software, buscando continuamente formas de ofrecer a nuestros clientes las mejores y más asequibles soluciones. Líderes en su campo, Quality America ha proporcionado software y productos de formación y servicios a decenas de miles de empresas en más de 25 países. Copia de copyright 2013 Quality America Inc.
No comments:
Post a Comment