Bij een regressieanalyse gebruikt men het verband dat er tussen twee variabelen bestaat om de waarde van één van de variabelen te voorspellen uit de andere variabele. Bijvoorbeeld, men doet in een kraamkliniek een onderzoek naar factoren die van invloed zijn op het geboortegewicht van het kind. Men constateert dat het geboortegewicht gerelateerd is aan de lengte van de moeder. Door middel van regressieanalyse kan men het verband tussen de lengte van de moeder en het geboortegewicht van het kind beschrijven in de vergelijking y = a + bx (waarbij y het geboortegewicht is en x de lengte van de moeder). Lineaire regressie beschrijft de relatie tussen deze twee continue variabelen als een rechte lijn. Bijvoorbeeld, men meet ook andere variabelen zoals leeftijd van de moeder, pariteit, gezinsinkomen, en stelt vast dat er een relatie bestaat tussen leeftijd van de moeder en gezinsinkomen. Om nu de relatie tussen deze twee continue variabelen en het geboortegewicht te bepalen moet men de interactie tussen de twee in rekening nemen. Dit doet men aan de hand van multipele regressieanalyse. Multipele regressie kan men toepassen met een (theoretisch) onbeperkt aantal continue variabelen. Echter, hoe groter het aantal variabelen dat interactie vertoont, des te groter wordt de kans dat de onafhankelijke variabelen samenhangen (‘multicolineariteit’). Hierdoor kunnen de resultaten van de analyse onbetrouwbaar worden. Logistische regressieanalyse wordt toegepast wanneer men de invloed van verschillende variabelen (factoren) op een dichotome uitkomst zoals bijvoorbeeld ‘dood’ of ‘niet-dood’ wil analyseren.
lineaire regressieanalyse, multipele regressieanalyse
logistische regressieanalyse