Visualiser trois variables numériques
Il existe aussi des alternatives « plates » aux graphiques 3D, plus faciles à interpréter, même si elles demandent un peu de réflexion. Une bonne approche consiste à tracer les deux variables explicatives numériques sur les axes x et y d’un nuage de points, et à colorer les points en fonction de la variable de réponse.
taiwan_real_estate est disponible.
Cet exercice fait partie du cours
Régression intermédiaire avec statsmodels en Python
Instructions
- Calculez la racine carrée de la distance à la station de MRT la plus proche et stockez-la dans
sqrt_dist_to_mrt_m. - Avec le jeu de données
taiwan_real_estate, tracez un nuage de points desqrt_dist_to_mrt_men fonction du nombre de supérettes à proximité, coloré par le prix des maisons.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform dist_to_mrt_m to sqrt_dist_to_mrt_m
taiwan_real_estate["sqrt_dist_to_mrt_m"] = ____
# Draw a scatter plot of sqrt_dist_to_mrt_m vs. n_convenience colored by price_twd_msq
____
# Show the plot
plt.show()