Welke is de responsvariabele?
Met regressie kun je de waarden van een responsvariabele voorspellen op basis van bekende waarden van verklarende variabelen. Welke variabele je als responsvariabele gebruikt, hangt af van de vraag die je wilt beantwoorden, maar in veel gegevenssets is er een voor de hand liggende keuze voor variabelen die interessant zijn om te voorspellen. In de komende oefeningen verken je een Taiwanese vastgoedgegevensset met vier variabelen.
| Variable | Meaning |
|---|---|
dist_to_mrt_station_m |
Afstand tot het dichtstbijzijnde MRT-metrostation, in meters. |
n_convenience |
Aantal gemakswinkels op loopafstand. |
house_age_years |
De leeftijd van het huis, in jaren, in drie groepen. |
price_twd_msq |
Huisprijs per eenheid oppervlakte, in New Taiwan dollar per m². |
Print taiwan_real_estate in de console om de gegevensset te bekijken, en bepaal welke variabele een goede responsvariabele zou zijn.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen