Visualisation de deux variables
Avant de pouvoir exécuter des modèles statistiques, il est généralement recommandé de visualiser votre ensemble de données. Nous examinerons ici la relation entre le prix de l'immobilier par zone et le nombre de magasins de proximité à proximité, en utilisant l'ensemble de données immobilières de Taïwan.
L'un des défis liés à cet ensemble de données réside dans le fait que le nombre de magasins de proximité contient des données entières, ce qui entraîne un chevauchement des points. Pour résoudre ce problème, vous devrez rendre les points transparents.
taiwan_real_estate est disponible, ggplot2 est chargé et son thème noir et blanc a été défini.
Cet exercice fait partie du cours
Introduction à la régression dans R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Draw a scatter plot of n_convenience vs. price_twd_msq
___