Saturday, February 4, 2017

Variance Du Modèle Moyen Mobile

Exploration de la moyenne mobile exponentiellement pondérée La volatilité est la mesure la plus courante de risque, mais il est disponible en plusieurs saveurs. Dans un article précédent, nous avons montré comment calculer la volatilité historique simple. Nous avons utilisé les données réelles sur les actions de Googles afin de calculer la volatilité quotidienne basée sur 30 jours de données sur les actions. Dans cet article, nous améliorerons la volatilité simple et discuterons de la moyenne mobile exponentiellement pondérée (EWMA). Historique vs. Volatilité implicite Tout d'abord, mettons cette métrique dans un peu de perspective. Il existe deux grandes approches: la volatilité historique et implicite (ou implicite). L'approche historique suppose que le passé est prologue, nous mesurons l'histoire dans l'espoir qu'elle est prédictive. La volatilité implicite, d'autre part, ignore l'histoire qu'elle résout pour la volatilité impliquée par les prix du marché. Elle espère que le marché le sait mieux et que le prix du marché contient, même implicitement, une estimation de la volatilité. Si l'on se concentre uniquement sur les trois approches historiques (à gauche ci-dessus), elles ont deux étapes en commun: Calculer la série de retours périodiques Appliquer un schéma de pondération D'abord, nous Calculer le rendement périodique. C'est généralement une série de rendements quotidiens où chaque retour est exprimé en termes continuellement composés. Pour chaque jour, nous prenons le log naturel du ratio des prix des actions (c'est-à-dire le prix aujourd'hui divisé par le prix d'hier, et ainsi de suite). Cela produit une série de rendements quotidiens, de u i à u i-m. Selon le nombre de jours (m jours) que nous mesurons. Cela nous amène à la deuxième étape: c'est là que les trois approches diffèrent. Dans l'article précédent (Utilisation de la volatilité pour mesurer le risque futur), nous avons montré que, sous quelques simplifications acceptables, la variance simple est la moyenne des rendements au carré: Notez que cela résume chacun des rendements périodiques, puis divise ce total par Nombre de jours ou observations (m). Donc, c'est vraiment juste une moyenne des rendements périodiques au carré. Autrement dit, chaque retour au carré reçoit un poids égal. Ainsi, si l'alpha (a) est un facteur de pondération (spécifiquement, un 1m), alors une variance simple ressemble à ceci: L'EWMA améliore la variance simple La faiblesse de cette approche est que tous les retours gagnent le même poids. Le retour hier (très récent) n'a plus d'influence sur la variance que le rendement des derniers mois. Ce problème est résolu en utilisant la moyenne mobile exponentiellement pondérée (EWMA), dans laquelle les rendements plus récents ont un poids plus important sur la variance. La moyenne mobile exponentiellement pondérée (EWMA) introduit lambda. Qui est appelé le paramètre de lissage. Lambda doit être inférieur à un. Sous cette condition, au lieu de pondérations égales, chaque rendement au carré est pondéré par un multiplicateur comme suit: Par exemple, RiskMetrics TM, une société de gestion des risques financiers, a tendance à utiliser un lambda de 0,94 ou 94. Dans ce cas, le premier La plus récente) le rendement périodique au carré est pondéré par (1-0.94) (. 94) 0 6. Le prochain rendement au carré est simplement un multiple lambda du poids antérieur dans ce cas 6 multiplié par 94 5.64. Et le troisième jour antérieur, le poids est égal à (1-0,94) (0,94) 2 5,30. C'est le sens de l'exponentielle dans EWMA: chaque poids est un multiplicateur constant (c'est-à-dire lambda, qui doit être inférieur à un) du poids des jours précédents. Cela garantit une variance pondérée ou biaisée vers des données plus récentes. (Pour en savoir plus, consultez la feuille de calcul Excel pour la volatilité de Googles.) La différence entre la volatilité et l'EWMA pour Google est illustrée ci-dessous. La volatilité simple pèse efficacement chaque rendement périodique de 0.196 comme indiqué dans la colonne O (nous avions deux années de données quotidiennes sur les cours des actions, soit 509 déclarations journalières et 1509 0.196). Mais notez que la colonne P attribue un poids de 6, puis 5.64, puis 5.3 et ainsi de suite. C'est la seule différence entre la variance simple et EWMA. Rappelez-vous: Après avoir additionné toute la série (dans la colonne Q), nous avons la variance, qui est le carré de l'écart-type. Si nous voulons la volatilité, nous devons nous rappeler de prendre la racine carrée de cette variance. Quelle est la différence entre la volatilité quotidienne entre la variance et l'EWMA dans l'affaire Googles? Sa significative: La variance simple nous a donné une volatilité quotidienne de 2,4 mais l'EWMA a donné une volatilité quotidienne de seulement 1,4 (voir la feuille de calcul pour plus de détails). Apparemment, la volatilité de Googles s'est installée plus récemment donc, une simple variance pourrait être artificiellement élevée. La variation d'aujourd'hui est une fonction de la variation des jours Pior Vous remarquerez que nous devions calculer une longue série de poids exponentiellement en déclin. Nous ne ferons pas les calculs ici, mais l'une des meilleures caractéristiques de l'EWMA est que la série entière se réduit commodément à une formule récursive: Recursive signifie que les références de variance d'aujourd'hui (c'est-à-dire une fonction de la variance des jours précédents). La variance d'aujourd'hui (sous EWMA) équivaut à la variance d'hier (pondérée par lambda) plus le rendement au carré d'hier (pesé par un lambda négatif). Remarquez comment nous ajoutons simplement deux termes ensemble: la variance pondérée d'hier et la pondération pondérée hier, au carré. Même si, lambda est notre paramètre de lissage. Un lambda plus élevé (par exemple, comme RiskMetrics 94) indique une diminution plus lente dans la série - en termes relatifs, nous allons avoir plus de points de données dans la série et ils vont tomber plus lentement. En revanche, si l'on réduit le lambda, on indique une décroissance plus élevée: les poids diminuent plus rapidement et, en résultat direct de la décroissance rapide, on utilise moins de points de données. (Dans la feuille de calcul, lambda est une entrée, donc vous pouvez expérimenter avec sa sensibilité). Résumé La volatilité est l'écart-type instantané d'un stock et la métrique de risque la plus courante. C'est aussi la racine carrée de la variance. Nous pouvons mesurer la variance historiquement ou implicitement (volatilité implicite). Lors de la mesure historique, la méthode la plus simple est la variance simple. Mais la faiblesse avec la variance simple est tous les retours obtenir le même poids. Nous sommes donc confrontés à un compromis classique: nous voulons toujours plus de données, mais plus nous avons de données, plus notre calcul est dilué par des données distantes (moins pertinentes). La moyenne mobile pondérée exponentiellement (EWMA) améliore la variance simple en attribuant des pondérations aux rendements périodiques. En faisant cela, nous pouvons utiliser une grande taille d'échantillon mais aussi donner plus de poids à des retours plus récents. 2.1 Modèles de moyenne mobile (modèles MA) Les modèles de séries chronologiques connus sous le nom de modèles ARIMA peuvent inclure des termes autorégressifs ou des termes de moyenne mobile. Dans la semaine 1, nous avons appris un terme autorégressif dans un modèle de série chronologique pour la variable x t est une valeur décalée de x t. Par exemple, un terme autorégressif de retard 1 est x t-1 (multiplié par un coefficient). Cette leçon définit les termes moyens mobiles. Un terme moyen mobile dans un modèle de séries chronologiques est une erreur passée (multipliée par un coefficient). Soit (wt overet N (0, sigma2w)), ce qui signifie que les w t sont identiquement, indépendamment distribués, chacun avec une distribution normale ayant une moyenne 0 et la même variance. Le modèle de moyenne mobile du 1er ordre, noté MA (1) est (xt mu wt theta1w) Le modèle de moyenne mobile du 2 e ordre, noté MA (2) est (xt mu wt theta1w theta2w) , Notée MA (q) est (xt mu wt theta1w theta2w points thetaqw) Note. De nombreux manuels et programmes logiciels définissent le modèle avec des signes négatifs avant les termes. Cela ne modifie pas les propriétés théoriques générales du modèle, bien qu'il renverse les signes algébriques des valeurs des coefficients estimés et des termes (non carrés) dans les formules pour les ACF et les variances. Vous devez vérifier votre logiciel pour vérifier si des signes négatifs ou positifs ont été utilisés pour écrire correctement le modèle estimé. R utilise des signes positifs dans son modèle sous-jacent, comme nous le faisons ici. Propriétés théoriques d'une série temporelle avec un modèle MA (1) Notez que la seule valeur non nulle dans l'ACF théorique est pour le lag 1. Toutes les autres autocorrélations sont 0. Ainsi, un échantillon ACF avec une autocorrélation significative seulement au décalage 1 est un indicateur d'un modèle MA (1) possible. Pour les étudiants intéressés, les preuves de ces propriétés sont une annexe à ce document. Exemple 1 Supposons qu'un modèle MA (1) soit x t 10 w t .7 w t-1. Où (wt dépasse N (0,1)). Ainsi, le coefficient 1 0,7. L'ACF théorique est donné par un tracé de cette ACF. Le graphique qui vient d'être montré est l'ACF théorique pour un MA (1) avec 1 0,7. En pratique, un échantillon ne fournira habituellement qu'un tel motif clair. En utilisant R, nous avons simulé n 100 échantillons en utilisant le modèle x t 10 w t .7 w t-1 où w t iid N (0,1). Pour cette simulation, un schéma chronologique des données de l'échantillon suit. Nous ne pouvons pas dire beaucoup de cette intrigue. L'échantillon ACF pour les données simulées suit. Nous observons un pic au décalage 1 suivi par des valeurs généralement non significatives pour les décalages au-delà de 1. Notez que l'échantillon ACF ne correspond pas au modèle théorique du MA (1) sous-jacent, c'est-à-dire que toutes les autocorrélations Un échantillon différent aurait un ACF d'échantillon légèrement différent indiqué ci-dessous, mais aurait probablement les mêmes caractéristiques générales. Propriétés théoriques d'une série temporelle avec un modèle MA (2) Pour le modèle MA (2), les propriétés théoriques sont les suivantes: Noter que les seules valeurs non nulles dans l'ACF théorique sont pour les lags 1 et 2. Les autocorrélations pour les décalages supérieurs sont 0 . Ainsi, un échantillon ACF avec des autocorrélations significatives aux décalages 1 et 2, mais des autocorrélations non significatives pour des décalages plus élevés indique un modèle MA (2) possible. Iid N (0,1). Les coefficients sont 1 0,5 et 2 0,3. Parce qu'il s'agit d'une MA (2), l'ACF théorique aura des valeurs non nulles uniquement aux lags 1 et 2. Les valeurs des deux autocorrélations non nulles sont: Un tracé de la théorie ACF suit. Comme presque toujours le cas, les données d'échantillon ne se comporteront pas aussi parfaitement que la théorie. Nous avons simulé n 150 échantillons pour le modèle x t 10 w t .5 w t-1 .3 w t-2. Où w t iid N (0,1). Le tracé de la série chronologique des données suit. Comme avec le graphique de la série temporelle pour les données d'échantillon MA (1), vous ne pouvez pas en dire beaucoup. L'échantillon ACF pour les données simulées suit. Le modèle est typique pour les situations où un modèle MA (2) peut être utile. Il y a deux pointes statistiquement significatives aux écarts 1 et 2, suivies des valeurs non significatives pour les autres retards. Notez qu'en raison de l'erreur d'échantillonnage, l'ACF de l'échantillon ne correspondait pas exactement au modèle théorique. ACF pour les modèles General MA (q) Une propriété des modèles MA (q) en général est qu'il existe des autocorrélations non nulles pour les q premiers lags et autocorrélations 0 pour tous les retards gt q. Non-unicité de la connexion entre les valeurs de 1 et (rho1) dans MA (1) Modèle. Dans le modèle MA (1), pour toute valeur de 1. La valeur réciproque 1 1 donne la même valeur pour. Par exemple, utilisez 0,5 pour 1. Puis utilisez 1 (0,5) 2 pour 1. Vous obtiendrez (rho1) 0,4 dans les deux cas. Pour satisfaire une restriction théorique appelée invertibilité. Nous limitons les modèles MA (1) à des valeurs dont la valeur absolue est inférieure à 1. Dans l'exemple donné, 1 0,5 sera une valeur de paramètre admissible, alors que 1 10,5 2 ne le sera pas. Invertibilité des modèles MA Un modèle MA est dit inversible s'il est algébriquement équivalent à un modèle d'ordre infini convergent. En convergeant, nous voulons dire que les coefficients AR décroissent à 0 lorsque nous retournons dans le temps. Invertibilité est une restriction programmée dans le logiciel de séries temporelles utilisé pour estimer les coefficients de modèles avec des termes MA. Ce n'est pas quelque chose que nous vérifions dans l'analyse des données. Des informations supplémentaires sur la restriction d'inversibilité pour les modèles MA (1) sont données en annexe. Théorie avancée. Pour un modèle MA (q) avec un ACF spécifié, il n'existe qu'un seul modèle inversible. La condition nécessaire à l'inversibilité est que les coefficients ont des valeurs telles que l'équation 1- 1 y-. - q y q 0 a des solutions pour y qui tombent en dehors du cercle unitaire. Code R pour les exemples Dans l'exemple 1, nous avons représenté l'ACF théorique du modèle x t 10 w t. 7w t-1. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les r commandes utilisées pour tracer l'ACF théorique sont: acfma1ARMAacf (mac (0.7), lag. max10) 10 lags de ACF pour MA (1) avec theta1 0.7 lags0: 10 crée une variable nommée lags qui va de 0 à 10. plot Abline (h0) ajoute un axe horizontal à la trame La première commande détermine l'ACF et la stocke dans un objet (a0) Nommé acfma1 (notre choix de nom). La commande plot (la 3ème commande) trace des retards par rapport aux valeurs ACF pour les lags 1 à 10. Le paramètre ylab étiquette l'axe y et le paramètre principal place un titre sur la trame. Pour voir les valeurs numériques de l'ACF, utilisez simplement la commande acfma1. La simulation et les parcelles ont été effectuées avec les commandes suivantes. (X, typeb, mainSimulated MA (1) data) xcarima. sim (n150, list (mac (0.7))) Simule n 150 valeurs de MA (1) xxc10 ajoute 10 pour faire la moyenne 10. La simulation (X, xlimc (1,10), mainACF pour des données d'échantillon simulées) Dans l'exemple 2, nous avons représenté l'ACF théorique du modèle xt 10 wt5 w t-1 .3 w t-2. Puis a simulé n 150 valeurs à partir de ce modèle et a représenté graphiquement la série chronologique de l'échantillon et l'échantillon ACF pour les données simulées. Les ordres R utilisés étaient: ACFma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 tracé (lags, acfma2, xlimc (1,10), ylabr, typeh, ACF principal pour MA (2) avec theta1 0,5, (X, typeb, principale série MA (2) simulée) acf (x, xlimc (1,10), x2) (1) Pour les étudiants intéressés, voici des preuves des propriétés théoriques du modèle MA (1). Lorsque x 1, l'expression précédente 1 w 2. Pour tout h 2, l'expression précédente 0 (x), x, x, x, x, x, La raison en est que, par définition de l'indépendance du wt. E (w k w j) 0 pour tout k j. En outre, parce que w t ont une moyenne 0, E (w j w j) E (w j 2) w 2. Pour une série chronologique, appliquer ce résultat pour obtenir l'ACF ci-dessus. Un modèle inversible MA est celui qui peut être écrit comme un modèle AR d'ordre infini qui converge de sorte que les coefficients AR convergent vers 0 alors que nous avançons infiniment dans le temps. Bien démontrer l'inversibilité pour le modèle MA (1). On substitue alors la relation (2) pour w t-1 dans l'équation (1) (3) (zt wt theta1 (z - theta1w) wt theta1z - theta2w) Au temps t-2. L'équation (2) devient Nous substituons alors la relation (4) pour w t-2 dans l'équation (3) (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Si nous devions continuer On notera cependant que si 1 1, les coefficients multipliant les décalages de z augmentent (infiniment) de la taille à mesure que l'on se déplace vers l'arrière temps. Pour éviter cela, nous avons besoin de 1 lt1. C'est la condition pour un modèle inversible MA (1). Infinite Order MA model Dans la semaine 3, voyez bien qu'un modèle AR (1) peut être converti en un modèle d'ordre infini MA: (xt - mu wt phi1w phi21w points phik1 w dots sum phij1w) Cette sommation des termes de bruit blanc passé est connue Comme la représentation causale d'un AR (1). En d'autres termes, x t est un type spécial de MA avec un nombre infini de termes revenant dans le temps. C'est ce qu'on appelle un ordre infini MA ou MA (). Un ordre fini MA est un ordre infini AR et tout ordre fini AR est un ordre infini MA. Rappelons à la semaine 1, nous avons noté qu'une exigence pour un AR stationnaire (1) est que 1 lt1. Calculons le Var (x t) en utilisant la représentation causale. Cette dernière étape utilise un fait de base sur les séries géométriques qui nécessite (phi1lt1) sinon la série diverge. Navigation8.4 Modèles de moyenne mobile Au lieu d'utiliser les valeurs passées de la variable de prévision dans une régression, un modèle de moyenne mobile utilise les erreurs de prévision passées dans un modèle de type régression. Y c et theta e theta e dots theta e, où et est le bruit blanc. Nous appelons cela un modèle MA (q). Bien sûr, nous n'observons pas les valeurs de et, donc ce n'est pas vraiment une régression au sens usuel. Notez que chaque valeur de yt peut être considérée comme une moyenne mobile pondérée des dernières erreurs de prévision. Toutefois, les modèles de moyenne mobile ne doivent pas être confondus avec le lissage moyen mobile décrit au chapitre 6. Un modèle de moyenne mobile est utilisé pour prévoir les valeurs futures, tandis que le lissage moyen mobile est utilisé pour estimer le cycle tendanciel des valeurs passées. Figure 8.6: Deux exemples de données provenant de modèles de moyenne mobile avec des paramètres différents. A gauche: MA (1) avec y t 20e t 0.8e t-1. A droite: MA (2) avec y t e t - e t-1 0.8e t-2. Dans les deux cas, e t est le bruit blanc normalement distribué avec zéro moyen et variance un. La figure 8.6 présente certaines données d'un modèle MA (1) et d'un modèle MA (2). Modification des paramètres theta1, points, thetaq résultats dans différents modèles de séries chronologiques. Comme pour les modèles autorégressifs, la variance du terme d'erreur et ne changera que l'échelle de la série, et non pas les motifs. Il est possible d'écrire un modèle AR (p) stationnaire comme modèle MA (infty). Par exemple, en utilisant une substitution répétée, nous pouvons le démontrer pour un modèle AR (1): begin php phi1y ph php phi1y phi1y phi1y phi1y 1, la valeur de phi1k diminue à mesure que k devient plus grand. Ainsi, nous obtenons finalement un processus de MA (infty) et yt et phi1 e phi12 e phi13 e cdots. Le résultat inverse se vérifie si l'on impose certaines contraintes aux paramètres MA. Ensuite, le modèle MA est appelé inversible. C'est-à-dire que nous pouvons écrire tout processus inverse MA (q) comme un processus AR (infty). Les modèles Invertible ne sont pas simplement pour nous permettre de convertir des modèles MA en modèles AR. Ils ont également des propriétés mathématiques qui les rendent plus faciles à utiliser dans la pratique. Les contraintes d'inversibilité sont semblables aux contraintes de stationnarité. Pour un modèle MA (1): -1lttheta1lt1. Pour un modèle MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Des conditions plus compliquées tiennent pour qge3. De nouveau, R se chargera de ces contraintes lors de l'estimation des modèles.


No comments:

Post a Comment