Régression (signification, types) - Qu'est-ce que l'analyse de régression?

Table des matières

Qu'est-ce que la régression?

L'analyse de régression est une mesure basée sur les statistiques utilisée dans la finance, l'investissement, etc., qui vise à établir une relation entre une variable dépendante et d'autres séries de variables indépendantes, et l'objectif principal est de déterminer la force de la relation ci-dessus.

Explications

  • Pour expliquer l'analyse de régression en termes simples, supposons qu'un responsable des ventes d'une entreprise s'efforce de prévoir les ventes du mois suivant. De nombreux facteurs sont impliqués qui stimulent les ventes du produit, à commencer par la météo jusqu'à la nouvelle stratégie du concurrent, le festival et le changement du mode de vie des consommateurs.
  • Il s'agit d'une méthode d'alignement sur les différents facteurs qui affectent la vente, qui sont ceux qui ont le plus d'impact. Cela peut aider à répondre à de nombreuses questions telles que quels sont les facteurs les plus importants, quels sont les facteurs les moins importants, quelle est la relation entre ces facteurs et, surtout, quelle est la garantie de ces facteurs.
  • Ces facteurs sont appelés variables. Le principal facteur que nous essayons de prévoir est appelé la variable dépendante, et les autres facteurs qui ont un impact sur la variable dépendante sont appelés les variables indépendantes.

Formule

Une analyse de régression linéaire simple dans Excel peut être exprimée sous la forme de la formule ci-dessous et elle mesure la relation entre une variable dépendante et une variable indépendante.

Y = a + bX + ϵ

Ici:

  • Y - Variable dépendante
  • X - Variable indépendante (explicative)
  • a - Intercepter
  • b - Pente
  • ϵ - Résiduel (erreur)

Comment interpréter l'analyse de régression?

Cela peut être interprété en supposant un scénario simple. Nous prenons ici le rapport entre les prix de la collection d'antiquités aux enchères et la durée de son âge. Plus une antiquité vieillit, plus elle en coûte. En supposant que nous ayons défini des données pour les 50 derniers articles mis aux enchères, nous pouvons prédire quels seront les futurs prix des enchères en fonction de l'âge de l'article. En utilisant ces données, nous pouvons construire une équation de régression.

La formule de régression qui peut établir une relation entre l'âge et le prix est la suivante:

y = β0 + β1 x + erreur
  • Ici, le facteur dépendant est Y. Y représente le prix de chaque article à vendre aux enchères, tandis que le facteur indépendant est X, qui détermine l'âge.
  • Les paramètres β0 et β1 sont des paramètres qui ne sont pas connus et seront estimés par l'équation.
  • β0 est une constante qui est utilisée pour définir la ligne de tendance linéaire intercepte l'axe Y.
  • β1 est une constante qui démontre l'ampleur du changement de la valeur de la variable dépendante en fonction du changement implicite des variables indépendantes.
  • C'est ce qu'on appelle fondamentalement la pente de l'équation. Lorsque la pente est une ligne, cela signifie qu'il existe une relation proportionnelle entre l'âge et le prix, et lorsque la pente est inverse, cela signifie que la relation est indirectement proportionnelle.
  • L' erreur peut être définie comme le bruit ou la variation de la variable cible et est de nature aléatoire.

Exemples réels d'analyse de régression

Supposons que nous devions établir une relation entre les ventes réalisées et le montant dépensé en publicité liée à un produit.

On observe généralement une relation positive entre le volume des ventes et le montant dépensé en publicité. En alliant une équation de régression linéaire simple, nous avons:

Y = a + bX

Supposons que nous obtenions la valeur comme

Y = 500 + 30X

Interprétation des résultats:

La pente prévue de 30 nous aide à conclure que les ventes moyennes augmentent de 30 $ par an à mesure que les dépenses publicitaires augmentent.

Types d'analyse de régression

# 1 - Linéaire

Cela peut être exprimé sous la forme de la formule ci-dessous et il mesure la relation entre une variable dépendante et une variable indépendante.

# 2 - Polynôme

Dans cette méthode, l'analyse est utilisée pour mesurer la relation entre des facteurs dépendants uniques et plusieurs variables indépendantes.

# 3 - Logistique

Ici, le facteur ou la variable dépendante est de nature binaire. Les variables indépendantes peuvent être continues ou binaires. Dans la régression logistique multinomiale, nous pouvons nous permettre d'avoir plus de deux catégories en choisissant notre variable indépendante.

# 4 - Quantile

Il s'agit d'un concept additif de régression linéaire et est principalement utilisé lorsque des valeurs aberrantes et asymétriques sont présentes dans les données.

# 5 - Filet élastique

Ceci est utile lorsque l'on manipule des variables indépendantes très corrélées.

# 6 - Régression en composantes principales (PCR)

C'est une technique qui est applicable lorsqu'il y a trop de variables indépendantes ou de multicolinéarité dans les données

# 7 - Moindres carrés partiels (PLS)

Il s'agit d'une méthode opposée à la composante principale où nous avons des variables indépendantes fortement corrélées. Il est également applicable lorsqu'il existe de nombreuses variables indépendantes.

# 8 - Vecteur de soutien

Cela peut fournir une solution aux modèles linéaires et non linéaires. Il utilise des fonctions de noyau non linéaires pour trouver la solution optimale pour les modèles non linéaires.

# 9 - Ordinal

Il s'applique à la prédiction de valeurs classées. Fondamentalement, il convient lorsque la variable dépendante est de nature ordinale

# 10 - Poisson

Cela s'applique lorsque la variable dépendante a des données de comptage.

# 11 - Binôme négatif

Il est également applicable pour gérer les données de dénombrement uniquement que la régression binomiale négative ne suppose pas une distribution du dénombrement ayant une variance égale à sa moyenne, alors que la régression de Poisson suppose que la variance est égale à sa moyenne.

# 12 - Quasi Poisson

C'est un substitut à la régression binomiale négative. Elle s'applique également aux données de comptage dispersées. La variance d'un modèle quasi-Poisson est une fonction linéaire de la moyenne, tandis que la variance d'un modèle binomial négatif est une fonction quadratique de la moyenne.

# 13 - Cox

Il est plus utilisé pour analyser les données de temps avant événement.

Différence entre régression et corrélation

  • La régression établit la relation entre une variance indépendante et une variable dépendante où les deux variables sont différentes, tandis que la corrélation détermine l'association ou la dépendance de deux variables lorsqu'il n'y a pas de différence entre les deux variables.
  • Le principal objectif de la régression est de créer une ligne de meilleur ajustement et l'estimation d'une variable se fait sur la base d'autres, alors qu'en corrélation démontre la relation linéaire entre deux variables.
  • En cela, nous estimons l'ampleur d'un certain changement de la variable reconnue (X) sur la variable estimée (Y), alors qu'en corrélation, le coefficient est utilisé pour mesurer dans quelle mesure les deux variables se déplacent ensemble.
  • Il s'agit d'un processus d'estimation de l'ampleur des variables aléatoires indépendantes en fonction de l'ampleur d'une variable dépendante statique, tandis que la corrélation nous aide à décider d'une valeur particulière pour exprimer l'interdépendance entre les deux variables.

Conclusion

  • L'analyse de régression utilise principalement des données pour établir une relation entre deux ou plusieurs variables. Ici, on suppose que les relations existant dans le passé se refléteront également dans le présent ou le futur. Peu de gens considèrent cela comme un décalage entre le passé et le présent / futur.
  • Cependant, il s'agit d'une technique de prévision et d'estimation largement utilisée. Bien qu'elle implique des mathématiques, que de nombreux utilisateurs peuvent trouver difficiles, la technique est relativement facile à utiliser, en particulier lorsqu'un modèle est disponible.

Articles intéressants...