Saturday, 7 October 2017

Moving Average Covariance Stationary


Historia y antecedentes Quién primero vino con los promedios móviles Los analistas técnicos han estado utilizando medias móviles ahora por varias décadas. Son tan omnipresentes en nuestro trabajo que la mayoría de nosotros no sabemos de dónde vinieron. Los estadísticos categorizan los promedios móviles como parte de una familia de herramientas para ldquoTime Series Analysisrdquo. Otros de esa familia son: ANOVA, Media Aritmética, Coeficiente de Correlación, Covarianza, Tabla de Diferencias, Ajuste de Mínimos Cuadrados, Máxima Verosimilitud, Media Móvil, Periodograma, Teoría de Predicción, Variable Aleatoria, Random Walk, Residual, Variance. Puedes leer más sobre cada una de estas y sus definiciones en Wolfram. El desarrollo del ldquomoving averagerdquo se remonta a 1901, aunque el nombre se le aplicó posteriormente. Del historiador de matemáticas Jeff Miller: MOVIENDO LA MEDIA. Esta técnica para suavizar los puntos de datos se utilizó durante décadas antes de que este, o cualquier término general, entró en uso. En 1909 GU Yule (Diario de la Sociedad Real de Estadística, 72, 721-730) describió los promedios quoinstantaneous promedio de RH Hooker calculados en 1901 como ldquomoving-average. Yule no adoptó el término en su libro de texto, pero entró en circulación a través de WI Kingrsquos Elementos del Método Estadístico (1912). LdquoMoving averagerdquo, que se refiere a un tipo de proceso estocástico, es una abreviatura de H. Woldrsquos ldquoprocess of moving averagerdquo (Estudio sobre el análisis de series temporales estacionarias (1938)). Wold describió cómo los casos especiales del proceso habían sido estudiados en la década de 1920 por Yule (en relación con las propiedades del método de correlación de diferencias variables) y Slutsky John Aldrich. De StatSoft Inc. viene esta descripción de Exponential Smoothing. Que es una de varias técnicas para ponderar datos pasados ​​de manera diferente: ldquo El suavizado exponencial se ha vuelto muy popular como un método de pronóstico para una amplia variedad de datos de series temporales. Históricamente, el método fue desarrollado independientemente por Robert Goodell Brown y Charles Holt. Brown trabajó para la Marina de los EE. UU. durante la Segunda Guerra Mundial, donde su misión era diseñar un sistema de seguimiento de la información de control de incendios para calcular la ubicación de los submarinos. Más tarde, aplicó esta técnica a la predicción de la demanda de piezas de repuesto (un problema de control de inventario). Describió esas ideas en su libro de 1959 sobre el control de inventario. La investigación de Holtrsquos fue patrocinada por la Oficina de Investigación Naval de forma independiente, desarrolló modelos de suavización exponencial para procesos constantes, procesos con tendencias lineales y para datos estacionales. El Holtrsquos paper, ldquoForecasting Seasonals and Trends por Moyos Mínimos ponderados exponencialmente fue publicado en 1957 en O. N.R. Memorándum de investigación 52, Carnegie Institute of Technology. No existe en línea de forma gratuita, pero puede ser accesible por aquellos con acceso a recursos académicos de papel. Hasta donde sabemos, P. N. (Pete) Haurlan fue el primero en utilizar el suavizado exponencial para el seguimiento de los precios de las acciones. Haurlan era un científico de cohetes real que trabajó para JPL en los años 60 tempranos, y así él tenía acceso a una computadora. No los llamó promedios móviles exponenciales (EMAs), o los medios matemáticos de moda matemáticamente ponderados exponencialmente (EWMAs) rdquo. En su lugar, los llamó ldquoTrend Valuesrdquo, y se refirió a ellos por sus constantes de suavizado. Por lo tanto, lo que hoy en día se conoce comúnmente como EMA de 19 días, llamó a Trendrdquo ldquo10. Dado que su terminología era el original para tal uso en el seguimiento de precios de las acciones, por eso seguimos usando esa terminología en nuestro trabajo. Haurlan había empleado EMAs en el diseño de los sistemas de seguimiento de cohetes, que podría por ejemplo necesidad de interceptar un objeto en movimiento como un satélite, un planeta, etc Si el camino hacia el objetivo estaba apagado, entonces algún tipo de entrada tendría que ser aplicada Para el mecanismo de dirección, pero no querían exagerar o underdo esa entrada y se vuelven inestables o no se convierten. Por lo tanto, el tipo correcto de suavizado de datos de entrada fue útil. Haurlan llamó a esto Controldquo proporcional, lo que significa que el mecanismo de dirección no intentaría ajustar todo el error de seguimiento de una vez. Los EMAs eran más fáciles de codificar en circuitos analógicos tempranos que otros tipos de filtros porque sólo necesitan dos piezas de datos variables: el valor de entrada actual (por ejemplo, precio, posición, ángulo, etc.) y el valor EMA anterior. La constante de suavizado sería cableada en el circuito, por lo que el ldquomemoryrdquo sólo tendría que hacer un seguimiento de esas dos variables. Una media móvil simple, por otro lado, requiere mantener un registro de todos los valores dentro del período de retroceso. Así que un 50-SMA significaría mantener un seguimiento de 50 puntos de datos, a continuación, el promedio de ellos. Se ata mucho más poder de procesamiento. Vea más acerca de EMAs versus Simple Moving Averages (SMA) en Exponential Versus Simple. Haurlan fundó el boletín Trade Levels en los años 60, dejando a JPL para ese trabajo más lucrativo. Su boletín fue patrocinador del programa de TV Charting The Market en KWHY-TV en Los Ángeles, el primer programa de televisión de TA, organizado por Gene Morgan. El trabajo de Haurlan y Morgan fue una gran parte de la inspiración detrás del desarrollo de Sherman y Marian McClellanrsquos del Oscilador McClellan y Summation Index, que implican el suavizado exponencial de los datos Advance-Decline. Puede leer un folleto de 1968 titulado Measuring Trend Values ​​publicado por Haurlan a partir de la página 8 del folleto del premio MTA. Que preparamos para los asistentes a la conferencia de la MTA de 2004 donde Sherman y Marian recibieron el premio MTArsquos Lifetime Achievement Award. Haurlan no menciona el origen de esa técnica matemática, pero señala que había estado en uso en la ingeniería aeroespacial durante muchos años.4.2 Modelos estacionarios lineales para las series temporales, donde la variable aleatoria se llama innovación porque representa la parte de la variable observada Que es impredecible dados los valores pasados. El modelo general (4.4) supone que es la salida de un filtro lineal que transforma las innovaciones pasadas, es decir, es un proceso lineal. Esta hipótesis de linealidad se basa en el teorema de la descomposición de Wolds (Wold 1938) que dice que cualquier proceso discreto de covarianza estacionaria puede expresarse como la suma de dos procesos no correlacionados, donde es puramente determinista y es un proceso puramente indeterminista que puede ser escrito como lineal Suma del proceso de innovación: donde está una secuencia de variables aleatorias seriadas no correlacionadas con media cero y varianza común. La condición es necesaria para la estacionariedad. La formulación (4.4) es una reparametrización finita de la representación infinita (4.5) - (4.6) con constante. Por lo general se escribe en términos del operador de retardo definido por, que da una expresión más corta: donde los polinomios del operador de lag y se llaman el polinomio y el polinomio, respectivamente. Para evitar la redundancia de parámetros, se supone que no hay factores comunes entre el y los componentes. A continuación, estudiaremos la trama de algunas series temporales generadas por modelos estacionarios con el objetivo de determinar los patrones principales de su evolución temporal. La figura 4.2 incluye dos series generadas a partir de los siguientes procesos estacionarios calculados por medio del cuantitativo genarma: Figura 4.2: Series temporales generadas por modelos Como era de esperar, ambas series temporales se mueven alrededor de un nivel constante sin cambios en la varianza debido a la propiedad estacionaria. Además, este nivel está próximo a la media teórica del proceso, y la distancia de cada punto a este valor está muy raramente fuera de los límites. Además, la evolución de la serie muestra desviaciones locales de la media del proceso, que se conoce como el comportamiento de reversión media que caracteriza las series temporales estacionarias. Estudiemos con detalle las propiedades de los diferentes procesos, en particular, la función de autocovariancia que capta las propiedades dinámicas de un proceso estacionario estocástico. Esta función depende de las unidades de medida, por lo que la medida habitual del grado de linealidad entre las variables es el coeficiente de correlación. En el caso de procesos estacionarios, el coeficiente de autocorrelación a lag, denotado por, se define como la correlación entre y: Por lo tanto, la función de autocorrelación (ACF) es la función de autocovarianza normalizada por la varianza. Las propiedades de la ACF son: Dada la propiedad de simetría (4.10), la ACF suele estar representada por medio de un gráfico de barras en los retornos no negativos que se denomina correlograma simple. Otra herramienta útil para describir la dinámica de un proceso estacionario es la función de autocorrelación parcial (PACF). El coeficiente de autocorrelación parcial al retraso mide la asociación lineal entre y ajustado para los efectos de los valores intermedios. Por lo tanto, es sólo el coeficiente en el modelo de regresión lineal: Las propiedades de la PACF son equivalentes a las de la ACF (4.8) - (4.10) y es fácil demostrar que (Box y Jenkins 1976). Al igual que la ACF, la función de autocorrelación parcial no depende de las unidades de medida y se representa mediante un gráfico de barras en los retornos no negativos que se denomina correlograma parcial. Las propiedades dinámicas de cada modelo estacionario determinan una forma particular de los correlogramas. Además, se puede demostrar que, para cualquier proceso estacionario, ambas funciones, ACF y PACF, se acercan a cero, ya que el retraso tiende al infinito. Los modelos no son siempre procesos estacionarios, por lo que es necesario determinar primero las condiciones de estacionariedad. Hay subclases de modelos que tienen propiedades especiales por lo que los estudiaremos por separado. Así, cuando y, es un proceso de ruido blanco. Cuando, se trata de un proceso de orden de movimiento móvil puro. , Y cuando es un proceso autorregresivo puro de orden. . 4.2.1 Proceso de ruido blanco El modelo más simple es un proceso de ruido blanco, donde está una secuencia de variables de media cero no correlacionadas con varianza constante. Se denomina por. Este proceso es estacionario si su varianza es finita, dado que: verifica las condiciones (4.1) - (4.3). Por otra parte, no está correlacionada con el tiempo, por lo que su función de autocovariancia es: La Figura 4.7 muestra dos series temporales simuladas generadas a partir de procesos con media y parámetros cero y -0,7, respectivamente. El parámetro autorregresivo mide la persistencia de eventos pasados ​​en los valores actuales. Por ejemplo, si un choque positivo (o negativo) afecta positivamente (o negativamente) durante un período de tiempo que es más largo cuanto mayor sea el valor de. Cuando, la serie se mueve más aproximadamente alrededor de la media debido a la alternancia en la dirección del efecto de, es decir, un choque que afecta positivamente en el momento, tiene efectos negativos sobre, positivo en. El proceso es siempre invertible y está parado cuando el parámetro del modelo está limitado a estar en la región. Para probar la condición estacionaria, primero escribimos la forma media móvil mediante la sustitución recursiva de (4.14): Figura 4.8: Correlaciones de la población para los procesos Es decir, es una suma ponderada de las innovaciones pasadas. Los pesos dependen del valor del parámetro: cuando, (o), la influencia de una innovación dada aumenta (o disminuye) a través del tiempo. Tomando las expectativas de (4.15) para calcular la media del proceso, obtenemos: Dado que, el resultado es una suma de términos infinitos que converge para todo el valor de sólo si, en cuyo caso. Un problema similar aparece cuando calculamos el segundo momento. La prueba puede ser simplificada suponiendo que, es decir,. Entonces, la varianza es: Una vez más, la varianza va al infinito excepto para, en cuyo caso. Es fácil verificar que tanto la media como la varianza explotan cuando esa condición no se mantiene. Por tanto, la función de autocorrelación para el modelo estacionario es: Es decir, el correlograma muestra un decaimiento exponencial con valores positivos siempre si es positivo y con oscilaciones positivas negativas si es negativo (véase la figura 4.8). Además, la tasa de decaimiento disminuye a medida que aumenta, por lo que cuanto mayor sea el valor de la más fuerte la correlación dinámica en el proceso. Finalmente, hay un corte en la función de autocorrelación parcial en el primer retardo. Se puede demostrar que el proceso general (Box y Jenkins 1976): Es estacionario sólo si las raíces de la ecuación característica del polinomio están fuera del círculo unitario. La media de un modelo estacionario es. Es siempre invertible para cualquier valor de los parámetros. Su ACF va a cero exponencialmente cuando las raíces de son reales o con fluctuaciones de onda seno-coseno cuando son complejas. Su PACF tiene un corte en el retraso, es decir. Algunos ejemplos de Correlogramas para modelos más complejos, como el, se puede ver en la figura 4.9. Son muy similares a los patrones cuando los procesos tienen raíces reales, pero toman una forma muy diferente cuando las raíces son complejas (ver el primer par de gráficos de la figura 4.9). 4.2.4 Modelo de media móvil autorregresiva El modelo de orden móvil autorregresivo general (orden finito) de órdenes, es: La Ciencia de la Sociedad: Investigación, Enseñanza y Servicio en el Interés Público. UC San Diego División de Ciencias Sociales es una colección diversa de destacados departamentos, programas y unidades de investigación que se centran en algunas de las cuestiones más acuciantes e importantes de nuestro tiempo. La división hace el trabajo que importa, ahora y para el futuro. En un reciente podcast de Voice of San Diego, 160Shana Cohen160 de Estudios de Educación habla de cómo los niños de diferentes orígenes a veces reciben niveles variados De servicios para discapacidades del desarrollo. Save the Date 28 de octubre: Foro de Robótica Contextual 2017 con Andrea Chiba, Virginia de Sa y Alan Saygin160 de Ciencia Cognitiva. Ciencias Sociales Dean160Carol Padden160 dará comentarios. Landmark National Study of Adolescent Brain ahora en marcha El Adolescente Brain Cognitive Development estudio seguirá 10.000 niños durante 10 años, en la edad adulta temprana. Iniciativa interdisciplinaria de la UC San Diego160 La universidad está lanzando una iniciativa en todo el campus para contratar a los profesores titulares o titulares que realicen investigaciones con el objetivo amplio de comprender el conocimiento humano, el aprendizaje y la creatividad. La Universidad Pública No. 1 UC San Diego se clasifica como la universidad pública número uno en la nación por servir al interés público, por Washington Monthly. Preparación de Datos - Estacionariedad En este número, el segundo tutorial en nuestra serie de preparación de datos, tocaremos La segunda suposición más importante en el análisis de series de tiempo: Estacionariedad, o la suposición de que una muestra de serie temporal se extrae de un proceso estacionario. Comience bien definiendo el proceso estacionario y estableciendo los requisitos mínimos estacionarios para nuestro análisis de series de tiempo. Luego demostraremos cómo examinar los datos de la muestra, dibujar algunas observaciones y resaltar las intuiciones detrás de ellas. Antecedentes En un sentido matemático, un proceso estacionario es un proceso estocástico cuya distribución de probabilidad conjunta no cambia cuando se desplaza en el tiempo o el espacio. En consecuencia, parámetros tales como la media y la varianza, si existen, tampoco cambian como resultado de un cambio de tiempo o posición. Esto se refiere a menudo como la forma estricta del proceso estacionario. Un ejemplo simplificado sería un proceso gaussiano de ruido blanco. Donde cada observación es idénticamente distribuida e independiente de todas las observaciones en una muestra dada. En consecuencia, la distribución de probabilidad conjunta de los datos de la muestra se expresa de la siguiente manera: Periodic Covariance Estacionariedad de los procesos periódicos multivariados Autoregressive Moving Average quotesNota que si s 1, entonces el modelo (1) se reduce a un modelo AR clásico. La ecuación (1) puede escribirse en forma vectorial, como un caso especial del modelo AR multi-variable (Ula, 1990, Franses y Paap, 2004). Las condiciones de estacionariedad para un AR multi-variable son bien conocidas (véase Brockwell y Davis, 1991), por lo tanto, también están disponibles para un modelo PAR. QuotNote que si s 1, entonces el modelo (1) se reduce a un modelo AR clásico. La ecuación (1) puede escribirse en forma vectorial, como un caso especial del modelo AR multi-variable (Ula, 1990, Franses y Paap, 2004). Las condiciones de estacionariedad para un AR multi-variable son bien conocidas (véase Brockwell y Davis, 1991), por lo tanto, también están disponibles para un modelo PAR. RESUMEN: Los modelos autorregresivos periódicos (PAR) amplían los modelos autorregresivos clásicos permitiendo que los parámetros varíen con las estaciones. La selección de los modelos de series de tiempo PAR puede ser computacionalmente costosa y los resultados no siempre son satisfactorios. En este artículo, proponemos un nuevo procedimiento automático para el problema de selección de modelos mediante el uso del algoritmo genético. El criterio de información bayesiano se utiliza como una herramienta para identificar el orden del modelo PAR. El éxito del procedimiento propuesto se ilustra en un pequeño estudio de simulación, y se presenta una aplicación con datos mensuales. Estos modelos son extensiones de los modelos habituales ARMA donde los coeficientes y las varianzas del proceso de ruido blanco se permite depender de la temporada. Las generalizaciones multivariadas de estos modelos han sido investigadas por Ula (1990 Ula (1993), Franses y Paap (2004) y Ltkepohl (2005), pero la investigación básica todavía tiene que ser hecha. : Modelización de datos de series temporales estacionales, los procesos periódicos (no) estacionarios se han vuelto muy populares en los últimos años y es bien sabido que estos modelos pueden estar representados Como modelos estacionarios de mayor dimensión. En este artículo, se muestra que la matriz de densidad espectral de este proceso de mayor dimensión muestra una estructura determinada si y sólo si el proceso observado es la covarianza estacionaria. Al aprovechar esta relación, un nuevo tipo de L2 Se propone una estadística de prueba para probar si un proceso lineal estacionario periódicamente multivariante es incluso covarianza estacionaria. Además, se demuestra que esta prueba también puede usarse para probar la estacionariedad periódica. Se obtiene la distribución asintótica normal de la estadística de prueba bajo el nulo y se muestra que la prueba tiene una propiedad omnibus. El artículo concluye con un estudio de simulación, en el que se mejora el rendimiento de la muestra pequeña del procedimiento de prueba utilizando un esquema de arranque adecuado. Artículo Mar 2012 Carsten Jentsch

No comments:

Post a Comment