Dans une analyse de régression, on utilise l’association entre deux variables afin de prédire la valeur d’une variable à partir de l’autre variable. Par exemple, dans une maternité, on étudie les facteurs qui influencent le poids de l’enfant à la naissance. On observe une relation entre le poids à la naissance et la taille de la mère. Dans l’analyse de régression, cette relation est décrite par l’équation y = a + bx (où y représente le poids à la naissance de l’enfant et x la taille de la mère). Dans la régression linéaire, la relation entre ces deux variables continues est représentée par une ligne droite. En mesurant d’autres variables, comme l’âge de la mère, la parité et le revenu du ménage, on observe une association entre par exemple l’âge de la mère et le revenu du ménage. Pour estimer la relation entre ces deux variables continues et le poids à la naissance, leur interaction doit être prise en compte dans une analyse de régression multiple. La régression multiple peut (en théorie) inclure un nombre illimité de variables continues. Toutefois, plus le nombre de variables en interaction est important, plus le risque d’association entre variables indépendantes est élevé («multicolinéarité»). De ce fait les résultats de l’analyse peuvent être peu fiables. L’analyse de régression logistique est utilisée pour étudier l’effet de plusieurs variables (facteurs) sur un critère dichotomique, comme par exemple «décédé» ou «non décédé».
régression linéaire, rgression multiple
régression logistique