MulaiMulai sekarang secara gratis

Apa yang sedang kita prediksi?

Manakah dari field (atau kolom) berikut yang merupakan nilai yang ingin kita prediksi?

  • TAXES
  • SALESCLOSEPRICE
  • DAYSONMARKET
  • LISTPRICE

Latihan ini adalah bagian dari kursus

Rekayasa Fitur dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Dari kolom yang tercantum di atas, tentukan mana yang akan kita gunakan sebagai variabel dependen $Y$.
  • Dengan himpunan data df yang sudah dimuat, saring menjadi hanya variabel dependen kita menggunakan select(). Simpan dataframe ini dalam variabel Y_df.
  • Tampilkan statistik ringkasan untuk variabel dependen dengan menggunakan describe() pada Y_df dan memanggil show() untuk menampilkannya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Select our dependent variable
Y_df = df.____([____])

# Display summary statistics
Y_df.____().____()
Edit dan Jalankan Kode