Huisprijzen voorspellen
Misschien wel de meest nuttige eigenschap van statistische modellen zoals lineaire regressie is dat je voorspellingen kunt doen. Je specificeert waarden voor elke verklarende variabele, geeft die aan het model, en krijgt een voorspelling voor de bijbehorende responsvariabele. De code ziet er als volgt uit.
explanatory_data = pd.DataFrame({"explanatory_var": list_of_values})
predictions = model.predict(explanatory_data)
prediction_data = explanatory_data.assign(response_var=predictions)
Hier ga je voorspellingen maken voor de huisprijzen in de Taiwan real-estate-gegevensset.
taiwan_real_estate is beschikbaar. Het gefitte lineaire regressiemodel van huisprijs versus aantal buurtwinkels is beschikbaar als mdl_price_vs_conv. In volgende oefeningen geldt: als een model beschikbaar is, is het ook al gefit.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import numpy with alias np
____
# Create the explanatory_data
explanatory_data = pd.____({'____': np.____(____)})
# Print it
____