MulaiMulai sekarang secara gratis

Memvisualisasikan banyak variabel

Saat Anda mulai mempertimbangkan lebih banyak variabel, memplot semuanya sekaligus menjadi semakin sulit. Selain menggunakan skala x dan y untuk dua variabel numerik, Anda dapat menggunakan warna untuk variabel numerik ketiga, dan Anda dapat menggunakan faceting untuk variabel kategorikal. Dan itu kurang lebih batasnya sebelum plot menjadi terlalu sulit untuk diinterpretasikan. Ada beberapa jenis plot khusus seperti peta panas korelasi dan plot koordinat paralel yang dapat menangani lebih banyak variabel, tetapi jenis plot tersebut memberikan jauh lebih sedikit informasi tentang setiap variabel, dan tidak ideal untuk memvisualisasikan prediksi model.

Di sini Anda akan mendorong batasan scatter plot dengan menampilkan harga rumah, jarak ke stasiun MRT, jumlah minimarket terdekat, dan usia rumah, semuanya dalam satu plot.

taiwan_real_estate tersedia; ggplot2 sudah dimuat.

Latihan ini adalah bagian dari kursus

Regresi Tingkat Menengah di R

Lihat Kursus

Petunjuk latihan

  • Dengan himpunan data taiwan_real_estate, buat scatter plot n_convenience terhadap akar kuadrat dist_to_mrt_m, diwarnai berdasarkan price_twd_msq.
  • Gunakan skala warna viridis plasma kontinu.
  • Facet plot, dibungkus berdasarkan house_age_years.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Using taiwan_real_estate, no. of conv. stores vs. sqrt of dist. to MRT, colored by plot house price
___ +
  # Make it a scatter plot
  ___ +
  # Use the continuous viridis plasma color scale
  ___ +
  # Facet, wrapped by house age
  ___
Edit dan Jalankan Kode