Sunday, November 27, 2016

Moving Average Box Jenkins

El modelo ARMA de Box-Jenkins es una combinación de los modelos AR y MA (descritos en la página anterior): begin Xt delta phi1 X phi2 X cdots phip X At - theta1 A - theta2 A - cdots - thetaq A. Donde los términos de la ecuación tienen el mismo significado dado para el modelo AR y MA. Comentarios sobre el modelo Box-Jenkins Un par de notas sobre este modelo. El modelo Box-Jenkins asume que la serie temporal es estacionaria. Box y Jenkins recomiendan diferenciar las series no estacionarias una o más veces para lograr la estacionariedad. De este modo se produce un modelo ARIMA, con el I para Integrated. Algunas formulaciones transforman la serie restando la media de la serie de cada punto de datos. Esto produce una serie con una media de cero. Si usted necesita hacer esto o no es dependiente en el software que usted utiliza para estimar el modelo. Los modelos de la Caja-Jenkins se pueden ampliar para incluir términos estacionales de la media móvil autorregresiva y estacional. A pesar de que esto complica la notación y las matemáticas del modelo, los conceptos subyacentes para los términos estacionarios de temporada automovilísticos y estacionales son similares a los términos no estacionales auto-regresivos y de media móvil. El modelo más general de Box-Jenkins incluye operadores de diferencia, términos autorregresivos, Términos promedio, operadores de diferencias estacionales, términos autorregresivos estacionales y términos medios móviles estacionales. Sin embargo, al igual que con el modelado en general, sólo deben incluirse en el modelo los términos necesarios. Los interesados ​​en los detalles matemáticos pueden consultar Box, Jenkins y Reisel (1994). Chatfield (1996). O Brockwell y Davis (2002). Etapas en el modelado de Box-Jenkins Se deben observar las siguientes observaciones con respecto a los modelos de Box-Jenkins. Los modelos de Box-Jenkins son bastante flexibles debido a la inclusión de términos tanto autorregresivos como móviles. Basado en la descomposición de Wold (no discutido en el Manual), un proceso estacionario puede ser aproximado por un modelo ARMA. En la práctica, encontrar que la aproximación puede no ser fácil. Chatfield (1996) recomienda los métodos de descomposición para las series en las que la tendencia y los componentes estacionales son dominantes. Building buenos modelos ARIMA generalmente requiere más experiencia que los métodos estadísticos utilizados comúnmente como la regresión. Suficientemente Larga Serie Requerido Normalmente, el ajuste efectivo de los modelos de Box-Jenkins requiere por lo menos una serie moderadamente larga. Chatfield (1996) recomienda al menos 50 observaciones. Muchos otros recomendarían por lo menos 100 observaciones. El primer paso en el desarrollo de un modelo de Box-Jenkins es determinar si la serie es estacionaria y si hay cualquier estacionalidad significativa que necesita ser modelada. La estacionariedad puede evaluarse a partir de un diagrama de secuencia de ejecución. El diagrama de secuencia de ejecución debe mostrar la ubicación y la escala constantes. También se puede detectar a partir de un gráfico de autocorrelación. Específicamente, la no estacionariedad se indica a menudo mediante un gráfico de autocorrelación con una desintegración muy lenta. Diferencia para lograr la estacionariedad Box y Jenkins recomiendan el enfoque de diferenciación para lograr la estacionariedad. Sin embargo, el ajuste de una curva y la sustracción de los valores ajustados de los datos originales también se pueden utilizar en el contexto de los modelos de Box-Jenkins. En la etapa de identificación del modelo, nuestro objetivo es detectar la estacionalidad, si existe, e identificar el orden de los términos estacionales de media móvil autorregresiva y estacional. Para muchas series, el período es conocido y un solo término de la estacionalidad es suficiente. Por ejemplo, para los datos mensuales típicamente incluiríamos un término estacional AR 12 o un término estacional MA 12. Para los modelos de Box-Jenkins, no eliminamos explícitamente la estacionalidad antes de montar el modelo. En cambio, incluimos el orden de los términos estacionales en la especificación del modelo al software de estimación ARIMA. Sin embargo, puede ser útil aplicar una diferencia estacional a los datos y regenerar las gráficas de autocorrelación y autocorrelación parcial. Esto puede ayudar en la identificación del modelo del componente no estacional del modelo. En algunos casos, la diferenciación estacional puede eliminar la mayoría o todo el efecto estacional. Identificar p y q Una vez que se ha abordado la estacionariedad y la estacionalidad, el siguiente paso es identificar el orden (es decir, el (p) y (q)) de los términos de media autorregresiva y móvil. Autocorrelación y parcelas de autocorrelación parcial Las herramientas principales para hacer esto son el gráfico de autocorrelación y el gráfico de autocorrelación parcial. El diagrama de autocorrelación de la muestra y el gráfico de autocorrelación parcial de la muestra se comparan con el comportamiento teórico de estas parcelas cuando se conoce el orden. Orden del proceso autorregresivo (p)) Específicamente, para un proceso AR (1), la función de autocorrelación de la muestra debería tener un aspecto exponencialmente decreciente. Sin embargo, los procesos AR de orden superior suelen ser una mezcla de componentes sinusoidales decrecientes y amortiguados exponencialmente. Para los procesos autorregresivos de orden superior, la autocorrelación de la muestra necesita ser complementada con una gráfica de autocorrelación parcial. La autocorrelación parcial de un proceso AR ((p)) se convierte en cero a lag (p 1) y mayor, por lo que examinamos la función de autocorrelación parcial de la muestra para ver si hay evidencia de una salida de cero. Esto generalmente se determina colocando un intervalo de confianza de 95 en el gráfico de autocorrelación parcial de la muestra (la mayoría de los programas de software que generan gráficas de autocorrelación de muestras también representarán este intervalo de confianza). Si el programa de software no genera la banda de confianza, es aproximadamente (pm 2 / sqrt), con (N) denotando el tamaño de la muestra. La función de autocorrelación de un proceso MA ((q)) se convierte en cero a lag (q 1) y mayor, por lo que examinamos la función de autocorrelación de la muestra para ver dónde se convierte esencialmente en cero. Hacemos esto colocando el intervalo de confianza 95 para la función de autocorrelación de la muestra en la gráfica de autocorrelación de la muestra. La mayoría del software que puede generar el gráfico de autocorrelación también puede generar este intervalo de confianza. La función de autocorrelación parcial de la muestra generalmente no es útil para identificar el orden del proceso de media móvil. Forma de la Función de Autocorrelación La tabla siguiente resume cómo usamos la función de autocorrelación de muestra para la identificación del modelo. Previsión 101: Box-Jenkins Forecasting Box-Jenkins (ARIMA) es un método de pronóstico importante que puede producir pronósticos altamente precisos para ciertos tipos de datos. En esta sección de Pronóstico 101, examine los pros y los contras del modelado de Box-Jenkins, proporcione una visión conceptual de cómo funciona la técnica y discuta la mejor forma de aplicarla a los datos empresariales. Un poco de historia En 1970 George Box y Gwilym Jenkins popularizaron los modelos ARIMA (Autoregressive Integrated Moving Average) en su libro de texto seminal, Time Series Analysis: Forecasting and Control 1. Técnicamente, la técnica de pronóstico descrita en el texto es un modelo ARIMA, Los pronosticadores (incluido el autor) utilizan las frases ARIMA modelos y Box-Jenkins modelos de forma intercambiable. Los modelos de ARIMA generaron inicialmente mucha emoción en la comunidad académica, debido principalmente a sus fundamentos teóricos que demostraron que si se cumplían ciertos supuestos, los modelos producirían pronósticos óptimos. Temprano, la técnica no gozó del uso extenso entre la comunidad de negocio. Esto se debió principalmente al procedimiento difícil, lento y sumamente subjetivo descrito por Box y Jenkins para identificar la forma apropiada del modelo para un conjunto de datos dado. Para empeorar las cosas, los estudios empíricos demostraron que a pesar de la superioridad teórica de los modelos de ARIMA sobre otros métodos de pronóstico, en la práctica los modelos NO rutinariamente superan a otros métodos de series de tiempo. Un estudio empírico particularmente importante encontró que los modelos de suavizado exponencial superaron a Box-Jenkins 55 del tiempo en una muestra de 1.001 conjuntos de datos 2. Esto sigue siendo una buena muestra para Box-Jenkins (superó el suavizado exponencial 45 veces), por lo que el Lección aquí, es que idealmente se cambiaría entre diferentes enfoques según sea apropiado en lugar de adoptar un enfoque único. El desafío para un pronosticador corporativo es determinar qué conjuntos de datos son los más adecuados para Box-Jenkins y luego identificar la forma adecuada del modelo. La captura de pantalla anterior muestra el pronóstico generado a partir de un modelo ARIMA junto con la lógica de selección de expertos y los detalles del modelo. Hoy en día, paquetes de software como Forecast Pro utilizan algoritmos automáticos para decidir cuándo usar los modelos de Box-Jenkins e identificar automáticamente la forma adecuada del modelo. Se ha demostrado que estos enfoques automáticos superan los procedimientos de identificación manual y han hecho que los modelos de Box-Jenkins sean accesibles y útiles para la comunidad de pronósticos empresariales. 3. Aunque existen formas multivariantes de modelos ARIMA, la mayoría del uso comercial del método es una . (Los métodos de series temporales son técnicas de pronóstico que basan el pronóstico únicamente en el historial del elemento que está pronosticando.) Como una técnica de series de tiempo, los modelos ARIMA son apropiados cuando se puede asumir una cantidad razonable de continuidad entre el pasado y el futuro. Los modelos se adaptan mejor a los pronósticos a corto plazo 8212say 18 meses o menos8212due a su supuesto de que los patrones y tendencias futuros se parecen a los patrones y tendencias actuales. Esta es una suposición razonable en el corto plazo, pero se vuelve más tenue cuanto más lejos se pronostica. Los modelos Box-Jenkins son similares a los modelos de suavizado exponencial en que son adaptativos, pueden modelar tendencias y patrones estacionales, y pueden ser automatizados. Difieren en que se basan en autocorrelaciones (patrones en el tiempo) en lugar de una visión estructural de nivel, tendencia y estacionalidad. Box-Jenkins tiende a tener éxito mejor que el suavizado exponencial para conjuntos de datos más largos y estables y no tan bien para datos más ruidosos y volátiles. Los modelos Box-Jenkins son matemáticamente complejos. En este artículo, proporcionaremos una visión general básica de cómo funciona un modelo ARIMA e introducimos una notación asociada con el modelo. Si estás interesado en aprender más sobre los modelos de Box-Jenkins, se cubren en detalle en el Manual de Referencia Estadística de Forecast Pro y en prácticamente todos los libros de texto académicos sobre predicción de series de tiempo. Un modelo ARIMA tiene 3 componentes, cada uno de los cuales ayuda a modelar diferentes tipos de patrones. El AR significa autoregresivo. El I significa integrado. El MA significa media móvil. Cada componente tiene un orden de modelo asociado que indica cuán grande es el componente. En general, un modelo no-estacional de Box-Jenkins se simboliza como ARIMA (p, d, q) donde p indica el número de términos AR, d indica el orden de diferenciación yq indica el número de términos MA. Un modelo estacional de Box-Jenkins se simboliza como ARIMA (p, d, q) (P, D, Q), donde p, d, q indica los órdenes del modelo para los componentes a corto plazo del modelo y P, D, Q indica las órdenes del modelo para los componentes estacionales del modelo. Identificar los modelos adecuados de Box-Jenkins requiere determinar los pedidos del modelo. Teóricamente, las órdenes del modelo podrían asumir cualquier valor entero en la práctica, normalmente son 0, 1, 2 o 3. Esto todavía produce centenares de modelos diferentes para considerar una de las razones por las cuales identificar manualmente los modelos es tan difícil. Box-Jenkins es un método de pronóstico importante que puede generar pronósticos más precisos que otros métodos de series de tiempo para ciertos tipos de datos. Tal como se formuló originalmente, la identificación del modelo se basaba en un procedimiento difícil, lento y sumamente subjetivo. Hoy en día, paquetes de software como Forecast Pro utilizan algoritmos automáticos para decidir cuándo usar los modelos de Box-Jenkins e identificar automáticamente la forma adecuada del modelo. Estos enfoques automáticos han hecho que los modelos de Box-Jenkins sean accesibles y útiles para la comunidad de pronósticos de pronóstico de negocios. 1 G. E. P. Box y G. M. Jenkins 1976 Análisis de series de tiempo: pronóstico y control. Edición Revisada, San Francisco: Día de Holden. 2 S. Makridakis et al. 1984 La predicción de la exactitud de los principales métodos de series de tiempo. Chichister: Wiley. 3 Un estudio realizado por Spyros Makridakis y uno por el Estadístico Estadounidense, ambos mostraron que el pronóstico de Pros automático Box-Jenkins procedimiento para superar la identificación manual por expertos humanos. Refiérase a la referencia anterior de Makridakis ya: Keith Ord y Sam Lowe 1996 Pronóstico Automático, The American Statistician. 94. Acerca del autor: Eric Stellwagen es el cofundador de Business Forecast Systems, Inc y co-autor de la línea de productos de software Forecast Pro. Ha consultado ampliamente en el área de pronósticos prácticos de negocios y pasa de 20 a 30 días al año presentando talleres sobre el tema. Ha trabajado con muchas empresas líderes como Coca-Cola, Procter Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning y Verizon. Ha presentado seminarios y talleres bajo la égida de muchos grupos, incluyendo el Instituto de Educación Profesional, la Sociedad Americana de Producción y Control de Inventarios, la Universidad de Wisconsin, el Instituto para la Previsión Empresarial, el Grupo Mundial de Investigación, el Instituto Internacional de Investigación, El Instituto de Investigación de Energía Eléctrica, la Asociación Internacional de Predicción de las Comunicaciones y el Instituto Internacional de Previsores. Actualmente se desempeña en el consejo de directores del Instituto Internacional de Previsores y en el consejo asesor de Foresight: The International Journal of Applied Forecasting. RIMA significa Autoregressive Integrated Moving Average. Univariante (vector único) ARIMA es una técnica de previsión que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su aplicación principal es en el área de pronósticos a corto plazo que requieren al menos 40 puntos de datos históricos. Funciona mejor cuando los datos muestran un patrón estable o consistente en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de los autores originales), ARIMA suele ser superior a las técnicas de suavización exponencial cuando los datos son razonablemente largos y la correlación entre las observaciones pasadas es estable. Si los datos son cortos o muy volátiles, entonces algún método de suavizado puede funcionar mejor. Si usted no tiene por lo menos 38 puntos de datos, debe considerar algún otro método que ARIMA. El primer paso para aplicar la metodología ARIMA es verificar la estacionariedad. La estacionariedad implica que la serie permanece a un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, sus datos NO son estacionarios. Los datos también deben mostrar una variación constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y que crece a un ritmo más rápido. En tal caso, los altibajos en la estacionalidad se harán más dramáticos con el tiempo. Si no se cumplen estas condiciones de estacionariedad, no se pueden calcular muchos de los cálculos asociados con el proceso. Si un gráfico gráfico de los datos indica nonstationarity, entonces usted debe diferenciar la serie. La diferenciación es una excelente forma de transformar una serie no estacionaria en una serie estacionaria. Esto se hace restando la observación en el período actual a la anterior. Si esta transformación se realiza sólo una vez en una serie, se dice que los datos se han diferenciado primero. Este proceso esencialmente elimina la tendencia si su serie está creciendo a una tasa bastante constante. Si está creciendo a un ritmo creciente, puede aplicar el mismo procedimiento y diferenciar los datos de nuevo. Sus datos entonces serían segundos diferenciados. Las autocorrelaciones son valores numéricos que indican cómo una serie de datos se relaciona a sí misma con el tiempo. Más precisamente, mide cuán fuertemente están correlacionados los valores de datos en un número específico de períodos separados entre sí a lo largo del tiempo. El número de períodos separados se llama generalmente el retraso. Por ejemplo, una autocorrelación en el retardo 1 mide cómo los valores 1 período aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso 2 mide cómo los datos dos períodos aparte están correlacionados a lo largo de la serie. Las autocorrelaciones pueden variar de 1 a -1. Un valor próximo a 1 indica una alta correlación positiva, mientras que un valor cercano a -1 implica una correlación negativa alta. Estas medidas se evalúan con mayor frecuencia a través de tramas gráficas llamadas correlagramas. Un correlagrama traza los valores de autocorrelación para una serie dada con diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. La metodología ARIMA intenta describir los movimientos en una serie temporal estacionaria como una función de lo que se llaman parámetros de media móvil y autorregresiva. Estos parámetros se denominan parámetros AR (autoregessivos) y MA (medias móviles). Un modelo de AR con un solo parámetro se puede escribir como. X (t) A (1) X (t-1) E (t) donde X (t) serie temporal bajo investigación A (1) el parámetro autorregresivo de orden 1 X (t-1) (T) el término de error del modelo Esto simplemente significa que cualquier valor dado X (t) puede explicarse por alguna función de su valor anterior, X (t-1), más algún error aleatorio inexplicable, E (t). Si el valor estimado de A (1) fue de 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionada con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), más algún error aleatorio E (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Modelos de media móvil: Un segundo tipo de modelo de Box-Jenkins se denomina modelo de media móvil. Aunque estos modelos parecen muy similares al modelo de AR, el concepto detrás de ellos es muy diferente. Los parámetros de la media móvil relacionan lo que sucede en el período t sólo con los errores aleatorios que ocurrieron en períodos de tiempo pasados, es decir, E (t-1), E (t-2), etc., en lugar de X (t-1), X T-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA puede escribirse como sigue. El término B (1) se denomina un MA de orden 1. El signo negativo delante del parámetro se utiliza para la convención solamente y se imprime generalmente La mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente al error aleatorio en el período anterior, E (t-1), y al término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil pueden extenderse a estructuras de orden superior que abarcan diferentes combinaciones y longitudes móviles. La metodología ARIMA también permite la construcción de modelos que incorporen parámetros tanto de autorregresión como de media móvil. Estos modelos se refieren a menudo como modelos mixtos. Aunque esto hace que sea una herramienta de pronóstico más complicada, la estructura puede simular mejor la serie y producir un pronóstico más preciso. Los modelos puros implican que la estructura consiste solamente en los parámetros AR o MA - no ambos. Los modelos desarrollados por este enfoque usualmente se llaman modelos ARIMA porque usan una combinación de autoregresión (AR), integración (I), que se refiere al proceso inverso de diferenciación para producir las operaciones de predicción y de media móvil (MA). Un modelo de ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (p), el número de operadores de diferenciación (d) y el orden más alto del término medio móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo autorregresivo de segundo orden con un componente de media móvil de primer orden cuya serie se ha diferenciado una vez para inducir la estacionariedad. Elegir la especificación correcta: El principal problema en el clásico Box-Jenkins es tratar de decidir qué especificación ARIMA utilizar-i. e. Cuántos AR y / o MA parámetros para incluir. Esto es lo que gran parte de Box-Jenkings 1976 se dedicó al proceso de identificación. Dependía de la eva - luación gráfica y numérica de las funciones de autocorrelación de la muestra y de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, sus datos representan sólo una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, errores de medición, etc.) pueden distorsionar el proceso teórico de identificación. Por eso el modelado ARIMA tradicional es un arte más que una ciencia. Metodología de Jenkins La metodología de Box-Jenkins utilizada en análisis y pronóstico es ampliamente considerada como la técnica de pronóstico más eficiente y se usa ampliamente, especialmente para series de tiempo univariadas. La estrategia de tres pasos de identificación, estimación y control de diagnóstico. Requiere que la persona a cargo de producir pronósticos tenga experiencia y conocimiento. En contraste con otras técnicas, Box-Jenkins es un procedimiento que utiliza un comportamiento pasado de las variables para seleccionar el mejor modelo de la predicción de una clase general de modelos. Supone que cualquier patrón de serie temporal puede ser representado por una de tres categorías de modelos. Estas categorías incluyen: 8226 Modelos autorregresivos: pronósticos de una variable basada en la función lineal de sus valores pasados ​​8226 Modelos de media móvil: pronósticos basados ​​en la combinación lineal de errores pasados ​​8226 Modelos de media móvil auto-regresiva: combinación de las dos categorías anteriores Las preguntas clave son cuántos valores pasados ​​(la variable focal y / o sus errores) deben ser incluidos en el modelo. Hay esencialmente tres etapas en un procedimiento Box-Jenkins: 1. Identificar el modelo tentativo. Cuál de las tres categorías enumeradas anteriormente se identifica como la categoría apropiada se determina haciendo primero los datos estacionarios (usualmente diferenciando los datos) y luego analizando las autocorrelaciones y autocorrelaciones parciales de los datos estacionarios. Obsérvese que hay autocorrelaciones teóricas y perfiles de autocorrelación parcial para cada uno de los modelos posibles. Por lo tanto, la determinación del tipo de modelo apropiado para una situación específica es principalmente una cuestión de adecuar las correlaciones observadas a las correlaciones teóricas. 2. Determinación de los parámetros del modelo. Esto es similar a la estimación de los parámetros en el análisis de regresión. 3. Aplicación del modelo. Ventajas: Los enfoques de Box-Jenkins para la predicción proporcionan algunas de las previsiones a corto plazo más precisas. Limitaciones: Sin embargo, requiere una gran cantidad de datos.


No comments:

Post a Comment