Formule pour calculer la corrélation
La corrélation est une mesure statistique entre deux variables et est définie comme le changement de quantité dans une variable correspondant au changement dans une autre et elle est calculée par sommation du produit de la somme de la première variable moins la moyenne de la première variable en somme de la deuxième variable moins la moyenne de la deuxième variable divisée par le tout sous la racine du produit du carré de la première variable moins la moyenne de la première variable en somme du carré de la deuxième variable moins la moyenne de la deuxième variable.
La valeur de corrélation est limitée entre -1 et +1 et peut être interprétée comme suit:
- -1: Si c'est -1, alors les variables sont connues comme étant parfaitement corrélées négativement. Cela signifie que si une variable se déplace dans une direction, une autre se déplace dans la direction opposée.
- 0: Cela signifie que la variable n'a aucune corrélation.
- +1: Si c'est +1, alors les variables sont dites parfaitement corrélées positivement. Les deux variables évoluent dans des directions positives.
Si nous avons 2 variables x et y, alors le coefficient de corrélation entre 2 variables peut être trouvé comme suit:
Coefficient de corrélation = ∑ (x (i) - moyenne (x)) * (y (i) -moyenne (y)) / √ (∑ (x (i) -moyenne (x)) 2 * ∑ (y (i) -moyen (y)) 2 )
Où,
- x (i) = valeur de x dans l'échantillon
- Moyenne (x) = moyenne de toutes les valeurs de x
- y (i) = valeur de y dans l'échantillon
- Moyenne (y) = moyenne de toutes les valeurs de y
Exemples
Il est facile de calculer la corrélation dans Excel. La syntaxe de la fonction utilisée est la suivante:
Coefficient de corrélation = CORREL (tableau1, tableau2)
Exemple 1
Prenons le même exemple que nous avons pris ci-dessus pour calculer la corrélation à l'aide d'Excel.
Solution:
Voici les valeurs de x et y:

Le calcul est le suivant.

Formule Excel de base = CORREL (tableau (x), tableau (y))

Coefficient = +0,95
Puisque ce coefficient est proche de +1, donc x et y sont fortement corrélés positivement.
Exemple # 2
La corrélation est principalement utile pour analyser le cours des actions des entreprises et créer un portefeuille d'actions sur cette base.
Découvrons la corrélation de l'action Apple avec l'indice Nasdaq sur la base de la dernière performance boursière sur un an. Apple est une société multinationale basée aux États-Unis, spécialisée dans les produits informatiques tels que iPod, iPad, Mac, etc.
Solution:
Vous trouverez ci-dessous le rendement mensuel des actions Apple et Nasdaq pour la dernière année:

Entrons maintenant les valeurs -
Coefficient de corrélation = ∑ (x (i) - moyenne (x)). (Y (i) -moyenne (y)) / √ ∑ (x (i) -moyenne (x)) 2 ∑ (y (i) - moyenne (y)) 2

Corrélation entre Apple et Nasdaq = 0,039 / (√0,0039)

Coefficient = 0,62
Puisque la corrélation entre Apple et Nasdaq est positive, Apple est donc positivement corrélée avec le Nasdaq.
Exemple # 3
Examinons maintenant la corrélation entre l'indice Walmart et Nasdaq sur la base de la dernière performance boursière sur un an. Walmart est une société basée aux États-Unis qui possède une chaîne de supermarchés au détail.
Solution:
Vous trouverez ci-dessous la performance mensuelle entre Walmart et Nasdaq pour la dernière année.

Entrons maintenant les valeurs dans la formule -
Coefficient de corrélation = ∑ (x (i) - moyenne (x)). (Y (i) -moyenne (y)) / √ ∑ (x (i) -moyenne (x)) 2 ∑ (y (i) - moyenne (y)) 2
Par conséquent, le calcul est le suivant,

Corrélation entre Walmart et Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Coefficient = 0,12
Nous pouvons voir que Walmart et Nasdaq sont également corrélés positivement mais pas autant par rapport à la corrélation Apple avec le Nasdaq.
Pertinence et utilisation
Un coefficient de corrélation est utile pour établir la relation linéaire entre deux variables. Il mesure comment une variable se déplacera par rapport au mouvement d'une autre variable. L'utilisation pratique de ce coefficient est de découvrir la relation entre le mouvement du prix des actions et le mouvement global du marché. La base de cette analyse, un analyste boursier, inclura la proportion d'actions pour créer un portefeuille optimal avec un risque minimum. En outre, il est utile en science des données de découvrir la relation entre 2 variables.
De plus, le coefficient de corrélation est très utilisé pour étudier la validité de construit des données en analyse factorielle. Il est très utilisé dans l'analyse de régression pour prédire les valeurs des variables dépendantes en fonction de la relation entre les variables dépendantes et indépendantes. Cette équation est très utile en analyse quantitative pour connaître la nature de la relation entre diverses variables. À la base de cette relation, si une variable n'est pas liée à d'autres variables, elle peut être éliminée de la liste.