Covariance vs corrélation - Top 5 des différences (avec infographie)

Différence entre covariance et corrélation

La covariance et la corrélation sont deux termes qui sont exactement opposés l'un à l'autre, ils sont tous deux utilisés dans les statistiques et l'analyse de régression, la covariance nous montre comment les deux variables varient l'une de l'autre tandis que la corrélation nous montre la relation entre les deux variables et comment sont-elles liées .

La corrélation et la covariance sont deux concepts statistiques utilisés pour déterminer la relation entre deux variables aléatoires. La corrélation définit l'impact d'un changement dans une variable sur l'autre, tandis que la covariance définit comment deux éléments varient ensemble. Déroutant? Allons plus loin pour comprendre la différence entre ces termes étroitement liés.

Qu'est-ce que la covariance?

La covariance mesure la façon dont les deux variables se déplacent l'une par rapport à l'autre et est une extension du concept de variance (qui indique comment une seule variable varie). Il peut prendre n'importe quelle valeur de -∞ à + ∞.

  • Plus cette valeur est élevée, plus la relation est dépendante. Un nombre positif signifie une covariance positive et indique qu'il existe une relation directe. En fait, cela signifie qu'une augmentation d'une variable entraînerait également une augmentation correspondante de l'autre variable à condition que les autres conditions restent constantes.
  • En revanche, un nombre négatif signifie une covariance négative, qui dénote une relation inverse entre les deux variables. Bien que la covariance soit parfaite pour définir le type de relation, elle est mauvaise pour interpréter son ampleur.

Quelle est la corrélation?

La corrélation est une longueur d'avance sur la covariance car elle quantifie la relation entre deux variables aléatoires. En termes simples, il s'agit d'une mesure unitaire de la façon dont ces variables changent les unes par rapport aux autres (valeur de covariance normalisée).

  • Contrairement à la covariance, la corrélation a un plafond supérieur et inférieur sur une plage. Il ne peut prendre que des valeurs comprises entre +1 et -1. Une corrélation de +1 indique que les variables aléatoires ont une relation directe et forte.
  • D'autre part, la corrélation de -1 indique qu'il existe une forte relation inverse, et une augmentation d'une variable entraînera une diminution égale et opposée de l'autre variable. 0 signifie que les deux nombres sont indépendants.

Formule de covariance et de corrélation

Exprimons ces deux concepts, mathématiquement. Pour deux variables aléatoires A et B avec des valeurs moyennes comme Ua et Ub et un écart type comme Sa et Sb respectivement:

En effet, la relation entre les deux peut être définie comme:

Les corrélations et la covariance trouvent une application dans les domaines de l'analyse statistique et financière. Étant donné que la corrélation normalise la relation, elle est utile pour comparer deux variables quelconques. Cela aide l'analyste à proposer des stratégies telles que le commerce de paires et la couverture non seulement pour des rendements efficaces sur le portefeuille, mais également pour protéger ces rendements en termes de mouvements défavorables sur le marché boursier.

Corrélation vs infographie de covariance

Voyons la principale différence entre la corrélation et la covariance.

Différences clés

  • La covariance est un indicateur du degré auquel deux variables aléatoires changent l'une par rapport à l'autre. La corrélation, en revanche, mesure la force de cette relation. La valeur de corrélation est liée à la partie supérieure par +1 et à la partie inférieure à -1. Il s'agit donc d'une plage définie. Cependant, la plage de covariance est indéfinie. Il peut prendre n'importe quelle valeur positive ou n'importe quelle valeur négative (théoriquement, la plage est de -∞ à + ∞). Vous pouvez être assuré qu'une corrélation de 0,5 est supérieure à 0,3 et que le premier ensemble de nombres (avec une corrélation égale à 0,5) dépend davantage l'un de l'autre que le second ensemble (avec une corrélation égale à 0,3). L'interprétation d'un tel résultat serait difficile à partir des calculs de covariance.
  • Le changement d'échelle affecte la covariance. Par exemple, si la valeur de deux variables est multipliée par des constantes similaires ou différentes, cela affecte la covariance calculée de ces deux nombres. Cependant, en appliquant le même mécanisme de corrélation, la multiplication par des constantes ne change pas le résultat précédent. En effet, un changement d'échelle n'affecte pas la corrélation.
  • Contrairement à la covariance, la corrélation est une mesure sans unité de l'interdépendance de deux variables. Cela facilite la comparaison des valeurs de corrélation calculées entre deux variables quelconques, indépendamment de leurs unités et dimensions.
  • La covariance ne peut être calculée que pour deux variables. La corrélation, en revanche, peut être calculée pour plusieurs ensembles de nombres. Un autre facteur qui rend la corrélation souhaitable pour les analystes par rapport à la covariance.

Tableau comparatif de la covariance et de la corrélation

Base Covariance Corrélation
Sens La covariance est un indicateur de la mesure dans laquelle 2 variables aléatoires dépendent l'une de l'autre. Un nombre plus élevé indique une dépendance plus élevée. La corrélation est un indicateur du degré de corrélation entre ces 2 variables, à condition que les autres conditions soient constantes. La valeur maximale est +1, indiquant une relation dépendante parfaite.
Relation La corrélation peut être déduite d'une covariance. La corrélation fournit une mesure de la covariance sur une échelle standard. Il est déduit en divisant la covariance calculée par l'écart type.
Valeurs La valeur de la covariance se situe dans la plage de -∞ et + ∞. La corrélation est limitée aux valeurs comprises entre -1 et +1.
Évolutivité Affecte la covariance La corrélation n'est pas affectée par un changement d'échelle ou par une multiplication par une constante.
Unités La covariance a une unité définie telle qu'elle est déduite par la multiplication de deux nombres et de leurs unités. La corrélation est un nombre absolu sans unité compris entre -1 et +1, y compris les valeurs décimales.

Conclusion

La corrélation et la covariance sont très étroitement liées l'une à l'autre, et pourtant elles diffèrent beaucoup. La covariance définit le type d'interaction, mais la corrélation définit non seulement le type mais aussi la force de cette relation. Pour cette raison, la corrélation est souvent qualifiée de cas particulier de covariance. Cependant, si l'on doit choisir entre les deux, la plupart des analystes préfèrent la corrélation car elle n'est pas affectée par les changements de dimensions, d'emplacements et d'échelle. De plus, comme il est limité à une plage de -1 à +1, il est utile de faire des comparaisons entre les variables à travers les domaines. Cependant, une limitation importante est que ces deux concepts mesurent la seule relation linéaire.

Articles intéressants...