Memvisualisasikan banyak variabel
Saat Anda mulai mempertimbangkan lebih banyak variabel, memplot semuanya sekaligus menjadi semakin sulit. Selain menggunakan skala x dan y untuk dua variabel numerik, Anda dapat menggunakan warna untuk variabel numerik ketiga, dan Anda dapat menggunakan faceting untuk variabel kategorikal. Dan itu kurang lebih batasnya sebelum plot menjadi terlalu sulit untuk diinterpretasikan. Ada beberapa jenis plot khusus seperti peta panas korelasi dan plot koordinat paralel yang dapat menangani lebih banyak variabel, tetapi jenis plot tersebut memberikan jauh lebih sedikit informasi tentang setiap variabel, dan tidak ideal untuk memvisualisasikan prediksi model.
Di sini Anda akan mendorong batasan scatter plot dengan menampilkan harga rumah, jarak ke stasiun MRT, jumlah minimarket terdekat, dan usia rumah, semuanya dalam satu plot.
taiwan_real_estate tersedia; ggplot2 sudah dimuat.
Latihan ini adalah bagian dari kursus
Regresi Tingkat Menengah di R
Petunjuk latihan
- Dengan himpunan data
taiwan_real_estate, buat scatter plotn_convenienceterhadap akar kuadratdist_to_mrt_m, diwarnai berdasarkanprice_twd_msq. - Gunakan skala warna viridis plasma kontinu.
- Facet plot, dibungkus berdasarkan
house_age_years.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Using taiwan_real_estate, no. of conv. stores vs. sqrt of dist. to MRT, colored by plot house price
___ +
# Make it a scatter plot
___ +
# Use the continuous viridis plasma color scale
___ +
# Facet, wrapped by house age
___