Prises de régression linéaires multiples, méthode et utilisations
Le régression linéaire multiple est un outil de calcul qui étudie les relations de cause à effet des objets d'étude et teste des hypothèses complexes.
Il est utilisé en mathématiques et en statistique. Ce type de régression linéaire nécessite des variables dépendantes (en d’autres termes, les résultats) et des variables indépendantes (les causes) qui suivent un ordre hiérarchique, en plus des autres facteurs inhérents aux différents domaines d’étude.
Habituellement, la régression linéaire est celle qui est représentée par une fonction linéaire calculée à partir de deux variables dépendantes. Ceci a comme cas le plus important celui dans lequel le phénomène étudié a une ligne droite de régression.
Dans un ensemble donné de données (x1, y1) (xn, yn) et de valeurs correspondant à une paire de variables aléatoires en corrélation directe, la droite de régression peut prendre pour commencer la forme d'une équation, comme y = a · x + b.
Les prémisses théoriques du calcul dans la régression linéaire multiple
Tout calcul utilisant la régression linéaire multiple dépendra beaucoup de l'objet étudié et du domaine d'étude, comme l'économie, puisque les variables rendent les formules utilisées plus ou moins complexes selon les cas.
Cela signifie que plus la question est complexe, plus il faut prendre en compte de facteurs, plus il faut recueillir de données et donc plus le volume d’éléments à inclure dans le calcul, ce qui rendra la formule plus grande.
Cependant, le point commun à toutes ces formules est qu'il existe un axe vertical (celui des ordonnées ou axe des ordonnées) et un axe horizontal (celui des abscisses ou axe des X) qui, après avoir été calculés, sont représentés graphiquement au moyen d'un système cartésien.
À partir de là, les interprétations des données sont effectuées (voir la section suivante) et des conclusions ou des prédictions sont faites. En toute circonstance, des prémisses pré-statistiques peuvent être utilisées pour peser les variables, telles que:
1- Faible exogénéité
Cela signifie que la variable devrait être supposée avec une valeur fixe qui peut difficilement se prêter à des changements dans son modèle en raison de causes externes à elle-même.
2- Caractère linéaire
Cela implique que les valeurs des variables, ainsi que celles d'autres paramètres et coefficients de prédiction, doivent être représentées par une combinaison linéaire d'éléments pouvant être représentés dans le graphique, dans le système cartésien.
3- Homocédasticité
Cela doit être constant. Cela signifie que, indistinctement des variables prédictives, il doit y avoir la même variance des erreurs pour chaque variable de réponse différente.
4- Indépendance
Cela s'applique uniquement aux erreurs des variables de réponse, qui doivent être affichées isolément et non en tant que groupe d'erreurs représentant un modèle défini.
5- Absence de multicolinéarité
Il est utilisé pour les variables indépendantes. Cela se produit lorsque vous essayez d'étudier quelque chose mais que très peu d'informations sont disponibles, il peut donc y avoir beaucoup de réponses et donc les valeurs peuvent avoir de nombreuses interprétations, ce qui en fin de compte ne résout pas le problème.
Il y a d'autres prémisses qui sont prises en compte, mais celles présentées ci-dessus montrent clairement que la régression linéaire multiple requiert beaucoup d'informations, non seulement pour avoir une étude plus rigoureuse, complète et sans biais, mais pour que la solution à la question la proposition est concrète.
C’est-à-dire qu’elle doit aller jusqu’au bout avec quelque chose de très spécifique, de spécifique, qui ne se prête pas au flou et qui, dans la mesure du possible, conduit à des erreurs.
Notez que la régression linéaire multiple n'est pas infaillible et peut entraîner des erreurs de calcul et des inexactitudes. Ce n'est pas tant dû à la personne qui effectue l'étude, mais parce qu'un phénomène particulier de la nature n'est pas complètement prévisible et n'est pas nécessairement le produit d'une cause particulière.
Il arrive souvent que n'importe quel objet puisse changer soudainement ou qu'un événement résulte de l'action (ou de l'inaction) de nombreux éléments qui interagissent les uns avec les autres.
Interprétations des graphiques
Une fois les données calculées selon les modèles conçus lors des phases précédentes de l’étude, les formules donneront des valeurs pouvant être représentées dans un graphique.
Dans cet ordre d'idées, le système cartésien affichera quelques points qui correspondront aux variables calculées. Certains seront plus dans l'axe des ordonnées, d'autres seront plus dans l'axe des abscisses. Certains seront plus groupés, tandis que d'autres seront plus isolés.
Afin d’observer la complexité de l’interprétation des données des graphiques, on peut observer, par exemple, le Quatuor Ascombe. Dans ce quatuor, quatre ensembles de données différents sont traités et chacun d’entre eux se trouve dans un graphique distinct qui, par conséquent, mérite une analyse distincte.
La linéarité demeure, mais les points du système cartésien doivent être examinés très attentivement avant de savoir comment les pièces du puzzle se rejoignent. Ensuite, les conclusions pertinentes peuvent être établies.
Bien entendu, il existe plusieurs moyens d'assembler ces pièces, bien que suivant différentes méthodes décrites dans des manuels de calcul spécialisés.
La régression linéaire multiple, comme déjà mentionné, dépend de nombreuses variables telles que l'objet d'étude et le domaine dans lequel il est appliqué, de sorte que les procédures en économie ne sont pas les mêmes que dans la médecine ou de la science informatique. Au total, oui, une estimation est faite, une hypothèse qui est ensuite vérifiée à la fin.
Extensions de régression linéaire multiple
Il existe plusieurs types de régression linéaire, comme les simples et générales, mais plusieurs aspects de régression multiple qui répondent à différents objets d'étude et donc les besoins de la science sont également observées.
Celles-ci traitent généralement un grand nombre de variables, vous pouvez donc souvent voir des modèles tels que multivariés ou multiniveaux. Chacun utilise des postulats et des formules de complexité variée, de sorte que l’interprétation de leurs résultats tend à être plus importante.
Méthodes d'estimation
Il existe un large éventail de procédures pour estimer les données obtenues par régression linéaire multiple.
Encore une fois, tout dépend ici de la robustesse du modèle utilisé, les formules de calcul, le nombre de variables, les postulats théoriques qui ont été prises en compte, la zone d'étude, les algorithmes qui sont programmés dans les programmes informatiques spécialisés par excellence, la complexité de l'objet, du phénomène ou de l'événement analysé.
Chaque méthode d'estimation utilise des formules complètement différentes. Aucun n'est parfait, mais il possède des vertus uniques qui doivent être utilisées conformément à l'étude statistique réalisée.
Il y a toutes sortes: variables instrumentales moindres carrés généralisés, régression linéaire bayésienne, modèles mixtes, régularisation de Tikhonov, estimateur de régression quantile-Sen et Theil une longue liste d'outils avec lesquels vous pouvez étudier les données avec plus de précision.
Utilisations pratiques
La régression linéaire multiple est utilisée dans divers domaines d’étude et, dans de nombreux cas, l’aide de programmes informatiques est nécessaire pour obtenir des données plus précises.
Ainsi, la marge d'erreur résultant de calculs manuels (compte tenu de la présence de nombreuses variables indépendantes et dépendantes, il est pas surprenant que ce type de régression linéaire est prévu pour des erreurs sont réduites, parce que beaucoup de données et les facteurs traité).
Dans l'analyse des tendances du marché, par exemple, nous examinons si des données telles que les prix d'un produit ont augmenté et diminué, mais surtout quand et pourquoi.
Le moment est analysé au moment où il existe des variations importantes dans les nombres sur une période donnée, surtout si les changements sont inattendus. Pourquoi recherchez-vous les facteurs précis ou probables par lesquels ce produit a augmenté, diminué ou maintenu son prix de détail?
De même, les sciences de la santé (médecine, bioanalyse, pharmacie, épidémiologie, etc.) bénéficient à l'étude de régression linéaire multiple dans laquelle les indicateurs de santé tels que la mortalité, la morbidité et la naissance.
Dans ces cas, nous pouvons commencer par une étude qui commence par l'observation, bien qu'un modèle soit ensuite utilisé pour déterminer si la variation de certains de ces indicateurs est due à une cause spécifique, quand et pourquoi.
Les finances utilisent également une régression linéaire multiple pour étudier les avantages et les inconvénients de certains investissements. Ici, il est toujours nécessaire de savoir quand les transactions financières sont effectuées, avec qui et quels sont les avantages attendus.
Les niveaux de risque seront plus ou moins élevés en fonction des différents facteurs pris en compte dans l’évaluation de la qualité de ces investissements, compte tenu également du volume des échanges monétaires.
Cependant, c'est dans l'économie où cet outil de calcul est le plus utilisé. Par conséquent, dans cette science, une régression linéaire multiple est utilisée dans le but de prédire les dépenses de consommation, les dépenses d'investissement, les achats, les exportations, les importations, les actifs, la demande de main-d'œuvre et de nombreux autres éléments.
Toutes sont liées à la macroéconomie et à la microéconomie, étant la première où les variables d’analyse des données sont plus nombreuses parce qu’elles sont situées à l’échelle mondiale.
Références
- Baldor, Aurelio (1967). Géométrie plane et spatiale, avec une introduction à la trigonométrie. Caracas: Editorial Cultura Venezolana, S.A.
- Hôpital universitaire Ramón y Cajal (2017). Modèle de régression linéaire multiple. Madrid, Espagne: HRC, Communauté de Madrid. Récupéré de www.hrc.es.
- Pedhazur, Elazar J. (1982). Régression multiple dans la recherche comportementale: explication et prédiction, 2e édition. New York: Holt, Rinehart et Winston.
- Rojo Abuín, J.M. (2007). Régression linéaire multiple Madrid, Espagne: Centre des sciences humaines et sociales. Récupéré depuis humanidades.cchs.csic.es.
- Université autonome de Madrid (2008).Régression linéaire multiple Madrid, Espagne: UAM. Récupéré de web.uam.es.
- Université de La Corogne (2017). Modèle de régression linéaire multiple; Corrélation La Corogne, Espagne: UDC, Département de mathématiques. Récupéré de dm.udc.es.
- Uriel, E. (2017). Régression linéaire multiple: estimation et propriétés. Valence, Espagne: Université de Valence. Récupéré de www.uv.es.
- Barrio Castro, Tomás del; Clar López, Miquel et Suriñach Caral, Jordi (2002). Modèle de régression linéaire multiple: spécification, estimation et contraste. Catalogne: Éditorial UOC.