Saturday, 7 October 2017

Moving Average Order Q


Por Michael Halls-Moore el 24 de agosto de 2017 En la Parte 1 se consideró el modelo autorregresivo de orden p, también conocido como el modelo AR (p). Lo presentamos como una extensión del modelo de caminata aleatoria en un intento de explicar la correlación serial adicional en series de tiempo financiero. En última instancia, nos dimos cuenta de que no era lo suficientemente flexible para capturar verdaderamente toda la autocorrelación en los precios de cierre de Amazon Inc. (AMZN) y el SampP500 US Equity Index. La razón principal de esto es que ambos de estos activos son condicionalmente heteroskedastic. Lo que significa que son no estacionarias y tienen períodos de variación variable o agrupación de volatilidad, lo que no es tenido en cuenta por el modelo AR (p). En los futuros artículos, finalmente, construiremos los modelos ARREM, así como los modelos condicionalmente heteroscédticos de las familias ARCH y GARCH. Estos modelos nos proporcionarán nuestros primeros intentos realistas de pronosticar los precios de los activos. En este artículo, sin embargo, vamos a introducir el promedio móvil de orden q modelo, conocido como MA (q). Este es un componente del modelo ARMA más general y, como tal, necesitamos entenderlo antes de seguir avanzando. Le recomiendo que lea los artículos anteriores en la colección de Análisis de series de tiempo si no lo ha hecho. Todos se pueden encontrar aquí. Motivación media (MA) Modelos de orden q Justificación Un modelo de media móvil es similar a un modelo autorregresivo, excepto que en lugar de ser una combinación lineal de valores de series temporales pasadas, es una combinación lineal de los últimos términos de ruido blanco. Intuitivamente, esto significa que el modelo MA ve tales choques de ruido blanco aleatorios directamente en cada valor actual del modelo. Esto es en contraste con un modelo de AR (p), donde los choques de ruido blanco sólo se ven indirectamente. Vía regresión a términos previos de la serie. Una diferencia clave es que el modelo MA sólo verá los últimos q choques para cualquier modelo MA (q) particular, mientras que el modelo AR (p) tomará en cuenta todos los shocks anteriores, aunque de una manera decreciente y débil. Definición Matemáticamente, el MA (q) es un modelo de regresión lineal y está estructurado de forma similar a AR (p): Modelo de orden móvil de orden q Un modelo de serie temporal, es un modelo de media móvil de orden q. MA (q), si: begin xt wt beta1 w ldots betaq w ¿Dónde está el ruido blanco con E (wt) 0 y variance sigma2. Si consideramos al operador de cambio hacia atrás. (Ver un artículo anterior), entonces podemos reescribir lo anterior como una función phi de: begin xt (1 beta1 beta2 2 ldots betaq q) wt phiq () wt end Hacemos uso de la función phi en artículos posteriores. Propiedades de segundo orden Como con AR (p), la media de un proceso MA (q) es cero. Esto es fácil de ver, ya que la media es simplemente una suma de medios de términos de ruido blanco, que son todos ellos mismos cero. Comienza el texto enspace mux E (xt) suma E (wi) 0 fin comienza el texto enspace sigma2w (1 beta21 ldots beta2q) final texto enspace rhok izquierda 1 texto enspace k 0 suma betai beta / sumq beta2i texto enspace k 1, ldots, q 0 Texto enspace k gt q final derecho. Donde beta0 1. Ahora vamos a generar algunos datos simulados y utilizarlo para crear correlogramas. Esto hará que la fórmula anterior sea algo más concreta. Simulaciones y Correlogramas MA (1) Comencemos con un proceso MA (1). Si establecemos beta1 0.6 obtenemos el siguiente modelo: Como con los modelos AR (p) del artículo anterior, podemos usar R para simular tal serie y luego trazar el correlograma. Dado que hemos tenido mucha práctica en la serie anterior de series de análisis de series de series de realizar parcelas, escribiré el código R en su totalidad, en lugar de dividirlo: La salida es la siguiente: Como vimos anteriormente en la fórmula para rhok , Para k gt q, todas las autocorrelaciones deben ser cero. Puesto que q 1, deberíamos ver un pico significativo en k1 y luego picos insignificantes posteriores a eso. Sin embargo, debido al sesgo de muestreo debemos esperar ver 5 (marginalmente) picos significativos en un gráfico de autocorrelación de la muestra. Esto es precisamente lo que nos muestra el correlograma en este caso. Tenemos un pico significativo en k1 y luego picos insignificantes para k gt 1, excepto en k4 donde tenemos un pico marginalmente significativo. De hecho, esta es una forma útil de ver si un modelo de MA (q) es apropiado. Tomando una mirada en el correlogram de una serie particular podemos ver cuántos retrasos secuenciales no diferentes existen. Si q tales retrasos existen entonces podemos intentar legítimamente ajustar un modelo de MA (q) a una serie particular. Dado que tenemos pruebas de nuestros datos simulados de un proceso de MA (1), ahora vamos a tratar de ajustar un modelo MA (1) a nuestros datos simulados. Desafortunadamente, no hay un comando ma equivalente al comando ar de modelo autorregresivo en R. En su lugar, debemos usar el comando arima más general y establecer los componentes autoregresivos e integrados a cero. Hacemos esto creando un 3-vector y poniendo a cero los dos primeros componentes (los parámetros autogrados e integrados, respectivamente): Recibimos un resultado útil del comando arima. En primer lugar, podemos ver que el parámetro ha sido estimado como hat 0.602, que está muy cerca del verdadero valor de beta1 0.6. En segundo lugar, los errores estándar ya están calculados para nosotros, por lo que es sencillo calcular los intervalos de confianza. En tercer lugar, recibimos una varianza estimada, log-verosimilitud y criterio de información Akaike (necesario para la comparación de modelos). La principal diferencia entre arima y ar es que arima estima un término de intercepción porque no resta el valor medio de la serie. Por lo tanto, debemos tener cuidado al realizar predicciones usando el comando arima. Bueno volver a este punto más tarde. Como una comprobación rápida se va a calcular los intervalos de confianza para hat: Podemos ver que el intervalo de confianza 95 contiene el verdadero valor de parámetro de beta1 0,6 y por lo que podemos juzgar el modelo un buen ajuste. Obviamente esto debería esperarse ya que simulamos los datos en el primer lugar ¿Cómo cambian las cosas si modificamos el signo de beta1 a -0.6 Lets realizar el mismo análisis: La salida es la siguiente: Podemos ver que en k1 tenemos un significado Pico en el correlograma, excepto que muestra correlación negativa, como se espera de un modelo MA (1) con primer coeficiente negativo. Una vez más todos los picos más allá de k1 son insignificantes. Permite ajustar un modelo MA (1) y estimar el parámetro: hat -0.730, que es una pequeña subestimación de beta1 -0.6. Finalmente, podemos calcular el intervalo de confianza: Podemos ver que el verdadero valor de parámetro de beta1-0.6 está contenido dentro del intervalo de confianza de 95, proporcionando evidencia de un buen ajuste de modelo. MA (3) Permite ejecutar el mismo procedimiento para un proceso MA (3). Esta vez debemos esperar picos significativos en k en, y picos insignificantes para k gt 3. Vamos a utilizar los siguientes coeficientes: beta1 0,6, beta2 0,4 y beta 3 0,2. Permite simular un proceso MA (3) a partir de este modelo. Ive aumentó el número de muestras al azar a 1000 en esta simulación, lo que hace más fácil ver la verdadera estructura de autocorrelación, a expensas de hacer la serie original más difícil de interpretar: La salida es la siguiente: Como era de esperar los primeros tres picos son significativos . Sin embargo, también lo es la cuarta. Pero podemos sugerir legítimamente que esto puede deberse a un sesgo de muestreo, ya que esperamos ver 5 de los picos que son significativos más allá de kq. Permite ahora ajustar un modelo MA (3) a los datos para intentar y estimar parámetros: Las estimaciones hat 0.544, hat 0.345 y hat 0.298 están cerca de los valores verdaderos de beta10.6, beta20.4 y beta30.3, respectivamente. También podemos producir intervalos de confianza usando los respectivos errores estándar: En cada caso los 95 intervalos de confianza contienen el verdadero valor del parámetro y podemos concluir que tenemos un buen ajuste con nuestro modelo MA (3), como es de esperar. Datos Financieros En la Parte 1 consideramos a Amazon Inc. (AMZN) y el SampP500 US Equity Index. Se ajustó el modelo AR (p) a ambos y se encontró que el modelo no era capaz de capturar efectivamente la complejidad de la correlación serial, especialmente en el elenco de la SampP500, donde los efectos de memoria larga parecen estar presentes. No trazaré las cartas otra vez para los precios y la autocorrelación, en vez de enfermo referiré usted al poste anterior. Amazon Inc. (AMZN) Comencemos por intentar ajustar una selección de modelos MA (q) a AMZN, a saber, con q in. Como en la Parte 1, use bien cuánmod para descargar los precios diarios de AMZN y luego convertirlos en un registro devuelve la corriente de los precios de cierre: Ahora que tenemos el flujo de devoluciones de log podemos usar el comando arima para ajustar MA (1), MA (2) y MA (3) modelos y luego estimar los parámetros de cada uno. Para MA (1) tenemos: Podemos representar gráficamente los residuos de los retornos diarios del registro y del modelo ajustado: Obsérvese que tenemos picos significativos en los retrasos k2, k11, k16 y k18, indicando que el modelo MA (1) es Poco probable que sea un buen ajuste para el comportamiento de las devoluciones de registro AMZN, ya que esto no parece una realización de ruido blanco. Vamos a intentar un modelo MA (2): Ambas estimaciones de los coeficientes beta son negativas. Vamos a trazar los residuos una vez más: Podemos ver que hay casi autocorrelación cero en los primeros retrasos. Sin embargo, tenemos cinco picos marginalmente significativos en los retrasos k12, k16, k19, k25 y k27. Esto es sugerente que el modelo MA (2) está capturando una gran parte de la autocorrelación, pero no todos los efectos de memoria larga. ¿Qué tal un modelo MA (3) Una vez más, podemos trazar los residuos: El gráfico de los residuos MA (3) parece casi idéntico al del modelo MA (2). Esto no es sorprendente, al igual que la adición de un nuevo parámetro a un modelo que ha explicado aparentemente gran parte de las correlaciones en los retrasos más cortos, pero que no tendrá mucho efecto en los retrasos a más largo plazo. Toda esta evidencia es sugestiva del hecho de que un modelo de MA (q) es poco probable que sea útil para explicar toda la correlación serial en forma aislada. Al menos para AMZN. SampP500 Si usted recuerda, en la Parte 1 vimos que el primer orden diferenciado diaria log devuelve estructura de la SampP500 poseía muchos picos significativos en varios rezagos, tanto corto como largo. Esto proporcionó evidencia tanto de heterocedasticidad condicional (es decir, agrupación de volatilidad) como de efectos de memoria larga. Esto nos lleva a concluir que el modelo AR (p) fue insuficiente para capturar toda la autocorrelación presente. Como vimos arriba el modelo de MA (q) fue insuficiente para capturar la correlación serial adicional en los residuos del modelo ajustado a la serie de precios diarios diferenciados de primer orden. Ahora intentaremos ajustar el modelo MA (q) al SampP500. Uno podría preguntar por qué estamos haciendo esto es si sabemos que es poco probable que sea un buen ajuste. Esta es una buena pregunta. La respuesta es que necesitamos ver exactamente cómo no es un buen ajuste, porque este es el proceso final que seguiremos cuando encontremos modelos mucho más sofisticados, que son potencialmente más difíciles de interpretar. Comencemos por la obtención de los datos y la conversión a una serie de primer orden diferenciado de los precios de cierre diario logarítmicamente transformados como en el artículo anterior: Ahora vamos a ajustar un modelo MA (1), MA (2) y MA (3) a La serie, como lo hicimos anteriormente para AMZN. Comencemos con MA (1): Vamos a hacer una gráfica de los residuos de este modelo ajustado: El primer pico significativo se produce en k2, pero hay muchos más en k en. Esto claramente no es una realización de ruido blanco y por lo tanto debemos rechazar el modelo MA (1) como un buen ajuste potencial para el SampP500. (2) Una vez más, vamos a hacer una gráfica de los residuos de este modelo ajustado MA (2): Mientras que el pico en k2 ha desaparecido (como esperamos), todavía nos quedan con los picos significativos en Muchos retrasos más largos en los residuos. Una vez más, encontramos que el modelo MA (2) no es un buen ajuste. Debemos esperar, para el modelo MA (3), ver menos correlación serial en k3 que para la MA (2), pero una vez más también debemos esperar ninguna reducción en los retrasos adicionales. Por último, vamos a hacer un gráfico de los residuos de este modelo instalado MA (3): Esto es precisamente lo que vemos en el correlograma de los residuos. Por lo tanto el MA (3), al igual que con los otros modelos anteriores, no es un buen ajuste para el SampP500. Próximos Pasos Hemos examinado ahora dos modelos de series temporales importantes en detalle, a saber, el modelo Autogressivo de orden p, AR (p) y luego Promedio Móvil de orden q, MA (q). Hemos visto que ambos son capaces de explicar algunos de la autocorrelación en los residuos de primer orden diferenciado diario de los precios de registro de las acciones y los índices, pero la volatilidad de agrupación y de larga memoria efectos persisten. Es finalmente el momento de dirigir nuestra atención a la combinación de estos dos modelos, a saber, el promedio móvil auto-regresivo de orden p, q, ARMA (p, q) para ver si mejorará la situación. Sin embargo, tendremos que esperar hasta el siguiente artículo para una discusión completa Michael Halls-Moore Mike es el fundador de QuantStart y ha estado involucrado en la industria financiera cuantitativa durante los últimos cinco años, principalmente como un desarrollador cuán y más tarde como un quant (Modelos MA) Los modelos de series temporales conocidos como modelos ARIMA pueden incluir términos autorregresivos y / o términos de media móvil. En la semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor retrasado de x t. Por ejemplo, un término autorregresivo de retardo 1 es x t-1 (multiplicado por un coeficiente). Esta lección define los términos del promedio móvil. Un término medio móvil en un modelo de serie temporal es un error pasado (multiplicado por un coeficiente). Dejamos (wt desbordamiento N (0, sigma2w)), lo que significa que los w t son idéntica, independientemente distribuidos, cada uno con una distribución normal que tiene la media 0 y la misma varianza. El modelo de media móvil de primer orden, denotado por MA (1) es (xt mu wt theta1w) El modelo de media móvil de segundo orden, denotado por MA (2) es (xt mu wt theta1w theta2w) , Denotado por MA (q) es (xt mu wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque sí cambia los signos algebraicos de los valores estimados de los coeficientes y los términos (no cuadrados) en las fórmulas para las ACF y las varianzas. Usted necesita comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza signos positivos en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie temporal con un modelo MA (1) Tenga en cuenta que el único valor distinto de cero en el ACF teórico es para el retardo 1. Todas las demás autocorrelaciones son 0. Por lo tanto, una ACF de muestra con una autocorrelación significativa sólo con el retardo 1 es un indicador de un posible modelo MA (1). Para los estudiantes interesados, las pruebas de estas propiedades son un apéndice a este folleto. Ejemplo 1 Supongamos que un modelo MA (1) es x t 10 w t .7 w t-1. Donde (wt overset N (0,1)). Así, el coeficiente 1 0,7. El ACF teórico se da por un diagrama de esta ACF sigue. La gráfica que se muestra es la ACF teórica para un MA (1) con 1 0,7. En la práctica, una muestra no suele proporcionar un patrón tan claro. Utilizando R, simulamos n 100 valores de muestra utilizando el modelo x t 10 w t .7 w t-1 donde w t iid N (0,1). Para esta simulación, sigue un diagrama de series de tiempo de los datos de la muestra. No podemos decir mucho de esta trama. A continuación se muestra el ACF de muestra para los datos simulados. Observamos un pico en el retraso 1 seguido por valores generalmente no significativos para los retrasos de 1. Obsérvese que la muestra ACF no coincide con el patrón teórico del MA subyacente (1), que es que todas las autocorrelaciones para los retrasos de 1 serán 0.Una muestra diferente tendría una ACF de muestra ligeramente diferente mostrada abajo, pero probablemente tendría las mismas características amplias. Propiedades Terapéuticas de una Serie de Tiempo con un Modelo MA (2) Para el modelo MA (2), las propiedades teóricas son las siguientes: Obsérvese que los únicos valores distintos de cero en la ACF teórica son para los retornos 1 y 2. Las autocorrelaciones para retardos mayores son 0 . Por lo tanto, una muestra de ACF con autocorrelaciones significativas en los intervalos 1 y 2, pero autocorrelaciones no significativas para retardos mayores, indica un posible modelo MA (2). Iid N (0,1). Los coeficientes son 1 0,5 y 2 0,3. Dado que se trata de una MA (2), la ACF teórica tendrá valores distintos de cero sólo en los retornos 1 y 2. Los valores de las dos autocorrelaciones distintas de cero son: Un gráfico del ACF teórico sigue. Como casi siempre es el caso, los datos de la muestra no se comportarán tan perfectamente como la teoría. Se simularon 150 valores de muestra para el modelo x t 10 w t .5 w t-1 .3 w t-2. Donde w t iid N (0,1). A continuación se muestra el gráfico de la serie de tiempo de los datos. Al igual que con el gráfico de la serie de tiempo para los datos de la muestra MA (1), no se puede decir mucho de ella. A continuación se muestra el ACF de muestra para los datos simulados. El patrón es típico para situaciones donde un modelo MA (2) puede ser útil. Hay dos picos estadísticamente significativos en los intervalos 1 y 2, seguidos de valores no significativos para otros desfases. Tenga en cuenta que debido al error de muestreo, la muestra ACF no coincide exactamente con el patrón teórico. ACF para modelos MA (q) Una propiedad de los modelos MA (q) en general es que hay autocorrelaciones no nulas para los primeros q retrasos y autocorrelaciones 0 para todos los retrasos gt q. No unicidad de la conexión entre los valores de 1 y (rho1) en MA (1) Modelo. En el modelo MA (1), para cualquier valor de 1. El 1/1 recíproco da el mismo valor para. Por ejemplo, use 0.5 para 1. Y luego utilice 1 / (0,5) 2 para 1. Youll get (rho1) 0.4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. Limitamos los modelos MA (1) a tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 será un valor de parámetro permisible, mientras que 1 1 / 0,5 2 no. Invertibilidad de los modelos MA Se dice que un modelo MA es invertible si es algebraicamente equivalente a un modelo de orden infinito convergente. Al converger, queremos decir que los coeficientes de AR disminuyen a 0 a medida que retrocedemos en el tiempo. Invertibilidad es una restricción programada en el software de la serie de tiempo usado para estimar los coeficientes de modelos con términos de MA. No es algo que buscamos en el análisis de datos. En el apéndice se proporciona información adicional sobre la restricción de la invertibilidad para los modelos MA (1). Nota de Teoría Avanzada. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para la invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - q y q 0 tiene soluciones para y que caen fuera del círculo unitario. Código R para los Ejemplos En el Ejemplo 1, se representó la ACF teórica del modelo x $ _ {t} $ w $ _ {t} $. 7w t - 1. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R usados ​​para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0.7), lag. max10) 10 retardos de ACF para MA (1) con theta1 0.7 lags0: 10 crea una variable llamada lags que va de 0 a 10. plot Abline (h0) añade un eje horizontal al diagrama El primer comando determina el ACF y lo almacena en un objeto (a0) Llamado acfma1 (nuestra elección de nombre). El comando plot (el 3er comando) traza retrasos en comparación con los valores ACF para los retornos 1 a 10. El parámetro ylab etiqueta el eje y y el parámetro principal coloca un título en la gráfica. Para ver los valores numéricos de la ACF simplemente utilice el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. Xcarzim. sim (n150, lista (mac (0.7))) Simula n 150 valores de MA (1) xxc10 agrega 10 para hacer la media 10. La simulación predeterminada significa 0. plot (x, typeb, mainSimulated MA (1) data) (X, xlimc (1,10), mainACF para datos de muestra simulados) En el Ejemplo 2, se representó el ACF teórico del modelo xt 10 wt. 5 w t-1 .3 w t-2. Y luego se simularon 150 valores de este modelo y se representaron las series de tiempo de muestra y la muestra ACF para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 trama (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal para MA (2) con theta1 0,5, (X, typeb, principal serie MA simulado) acf (x, xlimc (1,10), x2) (1) Para los estudiantes interesados, aquí hay pruebas de las propiedades teóricas del modelo MA (1). Cuando x 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 (x) La razón es que, por definición de independencia del peso. E (w k w j) 0 para cualquier k j. Además, debido a que w t tiene una media 0, E (w j w j) E (w j 2) w 2. Para una serie de tiempo, aplique este resultado para obtener la ACF indicada anteriormente. Un modelo inversible MA es uno que puede ser escrito como un modelo de orden infinito AR que converge para que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el modelo MA (1). A continuación, sustituimos la relación (2) por wt-1 en la ecuación (1) (3) (zt wt theta1 (z-theta1w) wt theta1z - theta2w) En el momento t-2. La ecuación (2) es entonces sustituimos la relación (4) por w t-2 en la ecuación (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si continuáramos Sin embargo, si 1 1, los coeficientes que multiplican los retrasos de z aumentarán (infinitamente) en tamaño a medida que retrocedemos hacia atrás hora. Para evitar esto, necesitamos 1 lt1. Esta es la condición para un modelo de MA (1) invertible. Infinite Order MA model En la semana 3, veamos bien que un modelo AR (1) puede convertirse en un modelo de orden infinito MA: (xt - mu wt phi1w phi21w puntos phik1 w dots sum phij1w) Esta suma de términos de ruido blanco pasado es conocida Como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos remontándose en el tiempo. Esto se llama un orden infinito MA o MA (). Una orden finita MA es un orden infinito AR y cualquier orden finito AR es un orden infinito MA. Recordemos en la semana 1, observamos que un requisito para un AR estacionario (1) es que 1 lt1. Vamos a calcular el Var (x t) utilizando la representación causal. Este último paso utiliza un hecho básico sobre series geométricas que requiere (phi1lt1) de lo contrario la serie diverge. Por: Michael Halls-Moore el 7 de septiembre de 2017 Este es el tercer y último post de la mini-serie sobre modelos de media móvil autoregresiva (ARMA) para series de tiempo análisis. Hemos introducido modelos autorregresivos y modelos de media móvil en los dos artículos anteriores. Ahora es el momento de combinarlos para producir un modelo más sofisticado. En última instancia, esto nos llevará a los modelos ARIMA y GARCH que nos permitirán predecir los rendimientos de los activos y predecir la volatilidad. Estos modelos constituirán la base para las señales comerciales y las técnicas de gestión de riesgos. Si has leído la Parte 1 y la Parte 2 habrás visto que tendemos a seguir un patrón para nuestro análisis de un modelo de series de tiempo. Ill repetirlo brevemente aquí: Fundamento - ¿Por qué estamos interesados ​​en este modelo en particular Definición - Una definición matemática para reducir la ambigüedad. Correlograma - Trazado de un correlograma muestral para visualizar el comportamiento de un modelo. Simulación y ajuste - Ajuste del modelo a simulaciones, para asegurar que hemos entendido correctamente el modelo. Datos financieros reales - Aplicar el modelo a los precios reales de los activos históricos. Predicción - Predecir los valores posteriores para generar señales comerciales o filtros. Con el fin de seguir este artículo es aconsejable echar un vistazo a los artículos anteriores sobre el análisis de series de tiempo. Todos se pueden encontrar aquí. Criterio Bayesiano de Información En la Parte 1 de esta serie de artículos vimos el Criterio de Información de Akaike (AIC) como un medio para ayudarnos a elegir entre los mejores modelos de series temporales. Una herramienta estrechamente relacionada es el Criterio de Información Bayesiano (BIC). Esencialmente, tiene un comportamiento similar al AIC, ya que penaliza los modelos por tener demasiados parámetros. Esto puede conducir a un ajuste excesivo. La diferencia entre el BIC y el AIC es que el BIC es más estricto con su penalización de parámetros adicionales. Criterio Bayesiano de Información Si tomamos la función de verosimilitud para un modelo estadístico, que tiene k parámetros, y L maximiza la probabilidad. Entonces el Criterio de Información Bayesiano viene dado por: Donde n es el número de puntos de datos en la serie temporal. Usaremos el AIC y el BIC a continuación al elegir los modelos ARMA (p, q) apropiados. Prueba de Ljung-Box En la parte 1 de esta serie de artículos Rajan mencionó en los comentarios de Disqus que la prueba de Ljung-Box era más apropiada que usar el Criterio de Información Akaike del Criterio de Información Bayesiano para decidir si un modelo de ARMA era un buen ajuste a un tiempo serie. La prueba de Ljung-Box es una prueba de hipótesis clásica que está diseñada para probar si un conjunto de autocorrelaciones de un modelo de series temporales ajustadas difieren significativamente de cero. La prueba no prueba cada retraso individual por aleatoriedad, sino que prueba la aleatoriedad sobre un grupo de retrasos. Ljung-Box Test Definimos la hipótesis nula como: Los datos de series de tiempo en cada lag son i. i.d .. es decir, las correlaciones entre los valores de la serie de población son cero. Definimos la hipótesis alternativa como: Los datos de la serie temporal no son i. i.d. Y poseen correlación serial. Calculamos la siguiente estadística de prueba. Q: Donde n es la longitud de la muestra de la serie temporal, el sombrero k es la autocorrelación de la muestra en el retraso kyh es el número de retardos bajo el ensayo. La regla de decisión sobre si rechazar la hipótesis nula es verificar si Q gt chi2, para una distribución de chi cuadrado con h grados de libertad en el percentil 100 (1-alfa). Aunque los detalles de la prueba pueden parecer un poco complejos, de hecho podemos usar R para calcular la prueba para nosotros, simplificando un poco el procedimiento. Ahora que hemos discutido el BIC y la prueba de Ljung-Box, estábamos listos para discutir nuestro primer modelo mixto, es decir, el promedio móvil auto-regresivo de orden p, q, o ARMA (p, Q). Justificación Hasta la fecha hemos considerado procesos autorregresivos y procesos de media móvil. El modelo anterior considera su propio comportamiento pasado como insumos para el modelo y, como tal, intenta captar los efectos de los participantes en el mercado, tales como el impulso y la reversión media en el comercio de valores. Este último modelo se utiliza para caracterizar la información de choque en una serie, como un anuncio sorpresivo de ganancias o un evento inesperado (como el derrame de petróleo BP Deepwater Horizon). Por lo tanto, un modelo de ARMA intenta capturar ambos aspectos al modelar series de tiempo financieras. Obsérvese que un modelo ARMA no tiene en cuenta el agrupamiento de volatilidad, un fenómeno empírico clave de muchas series de tiempo financieras. No es un modelo condicionalmente heteroscedásico. Para eso tendremos que esperar a los modelos ARCH y GARCH. Definición El modelo ARMA (p, q) es una combinación lineal de dos modelos lineales y por lo tanto sigue siendo lineal: Modelo de orden temporal p, q Un modelo de serie temporal,, es un modelo de media móvil autorregresiva de orden p, q . ARMA (p, q), si: begin xt alpha1 x alfa2 x ldots wt beta1 w beta2 w ldots betaq w ¿Dónde está el ruido blanco con E (wt) 0 y variance sigma2. Si consideramos al operador de cambio hacia atrás. (Ver un artículo anterior), entonces podemos reescribir lo anterior como una función theta y phi de: Podemos ver directamente que mediante el establecimiento de p neq 0 y q0 recuperamos el modelo AR (p). Similarmente si ponemos p 0 y q neq 0 recuperamos el modelo MA (q). Una de las características clave del modelo ARMA es que es parsimonioso y redundante en sus parámetros. Es decir, un modelo ARMA a menudo requerirá menos parámetros que un modelo AR (p) o MA (q) solo. Además, si reescribimos la ecuación en términos del BSO, entonces los polinomios theta y phi pueden a veces compartir un factor común, lo que conduce a un modelo más simple. Simulaciones y Correlogramas Al igual que con los modelos de media autorregresiva y móvil, ahora simularemos varias series ARMA y luego intentaremos ajustar modelos ARMA a estas realizaciones. Llevamos a cabo esto porque queremos asegurarnos de que entendemos el procedimiento de ajuste, incluyendo cómo calcular los intervalos de confianza para los modelos, así como asegurar que el procedimiento realmente recupera estimaciones razonables para los parámetros ARMA originales. En la Parte 1 y la Parte 2 construimos manualmente las series AR y MA dibujando N muestras de una distribución normal y luego elaborando el modelo de series temporales específicas utilizando rezagos de estas muestras. Sin embargo, hay una manera más directa de simular AR, MA, ARMA e incluso ARIMA datos, simplemente utilizando el método arima. sim en R. Vamos a empezar con el más simple posible no triviales ARMA modelo, a saber, el ARMA (1,1 ). Es decir, un modelo autorregresivo de orden combinado con un modelo de media móvil de orden uno. Tal modelo tiene sólo dos coeficientes, alfa y beta, que representan los primeros rezagos de la serie de tiempo en sí y los términos de ruido blanco de choque. Este modelo está dado por: Necesitamos especificar los coeficientes antes de la simulación. Vamos a tomar alfa 0,5 y beta -0,5: La salida es la siguiente: Lets también trazar el correlograma: Podemos ver que no hay autocorrelación significativa, lo que es de esperar de un modelo ARMA (1,1). Por último, vamos a tratar de determinar los coeficientes y sus errores estándar utilizando la función arima: Podemos calcular los intervalos de confianza para cada parámetro utilizando los errores estándar: Los intervalos de confianza sí contienen los valores de los parámetros reales para ambos casos, sin embargo, 95 intervalos de confianza son muy amplios (una consecuencia de los errores estándar razonablemente grandes). Ahora vamos a probar un modelo ARMA (2,2). Es decir, un modelo AR (2) combinado con un modelo MA (2). Necesitamos especificar cuatro parámetros para este modelo: alpha1, alpha2, beta1 y beta2. Vamos a tomar alpha1 0.5, alpha2-0.25 beta10.5 y beta2-0.3: La salida de nuestro modelo ARMA (2,2) es la siguiente: Y la autocorelación correspondiente: Ahora podemos intentar ajustar un modelo ARMA (2,2) a Los datos: También podemos calcular los intervalos de confianza para cada parámetro: Obsérvese que los intervalos de confianza para los coeficientes para el componente de media móvil (beta1 y beta2) no contienen realmente el valor del parámetro original. Sin embargo, con fines de negociación sólo necesitamos tener un poder predictivo que supere el azar y produzca un beneficio suficiente por encima de los costos de transacción, para ser rentable en los costos de transacción. El largo plazo. Ahora que hemos visto algunos ejemplos de modelos ARMA simulados necesitamos un mecanismo para elegir los valores de p y q cuando se ajusta a los modelos a datos financieros reales. Para determinar qué orden p, q del modelo ARMA es apropiado para una serie, necesitamos usar el AIC (o BIC) a través de un subconjunto de valores para p, q, y A continuación, aplicar la prueba de Ljung-Box para determinar si se ha logrado un buen ajuste, para valores particulares de p, q. Para mostrar este método vamos a simular en primer lugar un determinado ARMA (p, q) proceso. A continuación, analizaremos todos los valores pairwise de p in y q in y calcularemos el AIC. Seleccionaremos el modelo con el AIC más bajo y luego ejecutaremos una prueba de Ljung-Box sobre los residuos para determinar si hemos logrado un buen ajuste. Comencemos simulando una serie ARMA (3,2): Ahora crearemos un objeto final para almacenar el mejor ajuste de modelo y el valor AIC más bajo. Hacemos un bucle sobre las diversas combinaciones p, q y usamos el objeto actual para almacenar el ajuste de un modelo ARMA (i, j), para las variables de bucle i y j. Si el AIC actual es menor que cualquier AIC previamente calculado, ajustamos el AIC final a este valor actual y seleccionamos ese orden. A la terminación del bucle tenemos el orden del modelo ARMA almacenado en final. order y el ARIMA (p, d, q) se ajusta a sí mismo (con el componente d integrado a 0) almacenado como final. arma: Deja salir el AIC , Orden y coeficientes de ARIMA: Podemos ver que se recuperó el orden original del modelo ARMA simulado, es decir, con p3 y q2. Podemos trazar el corelograma de los residuos del modelo para ver si parecen una realización de ruido blanco discreto (DWN): El corelograma realmente parece una realización de DWN. Por último, realizamos la prueba de Ljung-Box para 20 retrasos para confirmar esto: Obsérvese que el valor p es mayor que 0,05, lo que indica que los residuos son independientes en el nivel 95 y por lo tanto un modelo ARMA (3,2) Buen ajuste del modelo. Sin embargo, este es precisamente el procedimiento que usaremos cuando lleguemos a ajustar modelos ARMA (p, q) al índice SampP500 en la siguiente sección. Datos financieros Ahora que hemos esbozado el procedimiento para elegir el modelo de serie temporal óptimo para una serie simulada, es bastante sencillo aplicarla a los datos financieros. Para este ejemplo vamos a elegir nuevamente el SampP500 US Equity Index. Permite descargar los precios de cierre diarios usando quantmod y luego crear el flujo de devoluciones de registros: Debe realizar el mismo procedimiento de ajuste que para la serie ARMA (3,2) simulada en la serie de devoluciones de registros del SampP500 usando el AIC: El mejor modelo de ajuste Tiene orden ARMA (3,3): Permite trazar los residuos del modelo ajustado a la corriente de devoluciones diarias de log SampP500: Observe que hay algunos picos significativos, especialmente a retrasos mayores. Esto es indicativo de un ajuste pobre. Vamos a realizar una prueba de Ljung-Box para ver si tenemos evidencia estadística de esto: Como sospechábamos, el valor p es menor que 0,05 y como tal no podemos decir que los residuos son una realización de ruido blanco discreto. Por lo tanto, hay autocorrelación adicional en los residuos que no se explica por el modelo ARMA (3,3). Próximos Pasos Como hemos discutido a lo largo de esta serie de artículos, hemos visto evidencias de heterocedasticidad condicional (agrupación de volatilidad) en la serie SampP500, especialmente en los periodos alrededor de 2007-2008. Cuando usamos un modelo GARCH más adelante en la serie de artículos veremos cómo eliminar estas autocorrelaciones. En la práctica, los modelos de ARMA nunca son generalmente buenos ajustes para los logs de las ganancias del registro. Tenemos que tener en cuenta la heterocedasticidad condicional y utilizar una combinación de ARIMA y GARCH. El siguiente artículo considerará ARIMA y mostrará cómo el componente integrado difiere del modelo ARMA que hemos estado considerando en este artículo. Michael Halls-Moore Mike es el fundador de QuantStart y ha estado involucrado en la industria de finanzas cuantitativas durante los últimos cinco años, principalmente como desarrollador de Quant y más tarde como consultor de comerciante de Quant para los fondos de cobertura. Medio de movilización de artículos relacionados Un término de análisis técnico que significa el precio medio de un título durante un período de tiempo determinado (el más común es 20, 30, 50, 100 y 200 días), utilizado para detectar las tendencias de precios al aplanar grandes fluctuaciones. Esta es quizás la variable más comúnmente utilizada en el análisis técnico. Moviendo los datos promedio se utiliza para crear gráficos que muestran si un precio de las acciones está tendencia hacia arriba o hacia abajo. Pueden usarse para rastrear patrones diarios, semanales o mensuales. Cada nuevo día (o semanas o meses) los números se agregan a la media y los números más viejos se caen así, el promedio se mueve con el tiempo. En general. Cuanto más corto sea el período de tiempo utilizado, más volátiles los precios aparecerán, por lo que, por ejemplo, las líneas de 20 días de media móvil tienden a moverse hacia arriba y hacia abajo más de 200 líneas de media móvil de día. Promedio de índice de canal de mercancías índice de fuerza real exponencial osciladores de precio promedio móvil (PPO) promedio móvil doble exponencial (DEMA) forex EA MACD STARC bandas línea de activación Copyright copy 2017 WebFinance, Inc. Todos los derechos reservados. Prohibiciones no autorizadas, en su totalidad o en parte, están estrictamente prohibidas. Promedios de movimiento: ¿Cuáles son? Entre los indicadores técnicos más populares, los promedios móviles se utilizan para medir la dirección de la tendencia actual. Cada tipo de media móvil (comúnmente escrito en este tutorial como MA) es un resultado matemático que se calcula promediando un número de puntos de datos pasados. Una vez determinado, el promedio resultante se traza en un gráfico para permitir a los operadores ver los datos suavizados en lugar de centrarse en las fluctuaciones de precios cotidianas que son inherentes a todos los mercados financieros. La forma más simple de una media móvil, apropiadamente conocida como media móvil simple (SMA), se calcula tomando la media aritmética de un conjunto dado de valores. Por ejemplo, para calcular una media móvil básica de 10 días, sumaría los precios de cierre de los últimos 10 días y luego dividiría el resultado en 10. En la figura 1, la suma de los precios de los últimos 10 días (110) es Dividido por el número de días (10) para llegar al promedio de 10 días. Si un comerciante desea ver un promedio de 50 días en lugar, el mismo tipo de cálculo se haría, pero incluiría los precios en los últimos 50 días. El promedio resultante a continuación (11) tiene en cuenta los últimos 10 puntos de datos con el fin de dar a los comerciantes una idea de cómo un activo tiene un precio en relación con los últimos 10 días. Quizás usted se está preguntando porqué los comerciantes técnicos llaman a esta herramienta una media móvil y no apenas una media regular. La respuesta es que cuando los nuevos valores estén disponibles, los puntos de datos más antiguos deben ser eliminados del conjunto y los nuevos puntos de datos deben entrar para reemplazarlos. Por lo tanto, el conjunto de datos se mueve constantemente para tener en cuenta los nuevos datos a medida que estén disponibles. Este método de cálculo garantiza que sólo se contabilice la información actual. En la Figura 2, una vez que se agrega el nuevo valor de 5 al conjunto, el cuadro rojo (que representa los últimos 10 puntos de datos) se desplaza hacia la derecha y el último valor de 15 se deja caer del cálculo. Debido a que el valor relativamente pequeño de 5 reemplaza el valor alto de 15, se esperaría ver el promedio de la disminución de conjunto de datos, lo que hace, en este caso de 11 a 10. ¿Qué aspecto tienen los promedios móviles Una vez que los valores de la MA se han calculado, se representan en un gráfico y luego se conectan para crear una línea de media móvil. Estas líneas curvas son comunes en las cartas de los comerciantes técnicos, pero la forma en que se utilizan puede variar drásticamente (más sobre esto más adelante). Como se puede ver en la Figura 3, es posible agregar más de un promedio móvil a cualquier gráfico ajustando el número de períodos de tiempo utilizados en el cálculo. Estas líneas curvas pueden parecer distracción o confusión al principio, pero youll acostumbrarse a ellos a medida que pasa el tiempo. La línea roja es simplemente el precio medio en los últimos 50 días, mientras que la línea azul es el precio promedio en los últimos 100 días. Ahora que usted entiende lo que es un promedio móvil y lo que parece, bien introducir un tipo diferente de media móvil y examinar cómo se diferencia de la mencionada media móvil simple. La media móvil simple es muy popular entre los comerciantes, pero como todos los indicadores técnicos, tiene sus críticos. Muchas personas argumentan que la utilidad de la SMA es limitada porque cada punto en la serie de datos se pondera de la misma, independientemente de dónde se produce en la secuencia. Los críticos sostienen que los datos más recientes son más significativos que los datos anteriores y deberían tener una mayor influencia en el resultado final. En respuesta a esta crítica, los comerciantes comenzaron a dar más peso a los datos recientes, que desde entonces ha llevado a la invención de varios tipos de nuevos promedios, el más popular de los cuales es el promedio móvil exponencial (EMA). Promedio móvil exponencial El promedio móvil exponencial es un tipo de media móvil que da más peso a los precios recientes en un intento de hacerla más receptiva A nueva información. Aprender la ecuación algo complicada para calcular un EMA puede ser innecesario para muchos comerciantes, ya que casi todos los paquetes de gráficos hacen los cálculos para usted. Sin embargo, para los geeks de matemáticas que hay, aquí es la ecuación EMA: Cuando se utiliza la fórmula para calcular el primer punto de la EMA, puede observar que no hay ningún valor disponible para utilizar como la EMA anterior. Este pequeño problema se puede resolver iniciando el cálculo con una media móvil simple y continuando con la fórmula anterior desde allí. Le hemos proporcionado una hoja de cálculo de ejemplo que incluye ejemplos reales de cómo calcular una media móvil simple y una media móvil exponencial. La diferencia entre la EMA y la SMA Ahora que tiene una mejor comprensión de cómo se calculan la SMA y la EMA, echemos un vistazo a cómo estos promedios difieren. Al mirar el cálculo de la EMA, notará que se hace más hincapié en los puntos de datos recientes, lo que lo convierte en un tipo de promedio ponderado. En la Figura 5, el número de periodos de tiempo utilizados en cada promedio es idéntico (15), pero la EMA responde más rápidamente a los precios cambiantes. Observe cómo el EMA tiene un valor más alto cuando el precio está subiendo, y cae más rápidamente que el SMA cuando el precio está disminuyendo. Esta capacidad de respuesta es la razón principal por la que muchos comerciantes prefieren utilizar la EMA sobre la SMA. ¿Qué significan los diferentes días? Las medias móviles son un indicador totalmente personalizable, lo que significa que el usuario puede elegir libremente el tiempo que desee al crear el promedio. Los períodos de tiempo más comunes utilizados en las medias móviles son 15, 20, 30, 50, 100 y 200 días. Cuanto más corto sea el lapso de tiempo utilizado para crear el promedio, más sensible será a los cambios de precios. Cuanto más largo sea el lapso de tiempo, menos sensible o más suavizado será el promedio. No hay un marco de tiempo adecuado para usar al configurar sus promedios móviles. La mejor manera de averiguar cuál funciona mejor para usted es experimentar con una serie de diferentes períodos de tiempo hasta encontrar uno que se adapte a su estrategia. Medios móviles: cómo utilizarlos Suscríbete a las noticias para usar para obtener las últimas ideas y análisis Gracias por registrarte en Investopedia Insights - Noticias para usar.

No comments:

Post a Comment