MulaiMulai sekarang secara gratis

Bagi data menjadi pelatihan dan pengujian

Langkah terakhir sebelum kita membangun model regresi! Di sini, Anda akan mengikuti langkah-langkah untuk mengidentifikasi nama variabel target dan kolom fitur, mengekstrak data, serta membaginya menjadi pelatihan dan pengujian.

Pustaka pandas dan numpy telah dimuat masing-masing sebagai pd dan np. Fitur masukan diimpor sebagai himpunan data features, dan variabel target yang Anda bangun pada latihan sebelumnya telah diimpor untuk Anda sebagai Y.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Petunjuk latihan

  • Simpan nama kolom pengenal pelanggan sebagai sebuah daftar.
  • Pilih nama kolom fitur dengan mengecualikan pengenal pelanggan.
  • Ekstrak fitur sebagai X.
  • Bagi data menjadi pelatihan dan pengujian menggunakan fungsi train_test_split().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Store customer identifier column name as a list
custid = ['___']

# Select feature column names excluding customer identifier
cols = [col for col in features.___ if col not in ___]

# Extract the features as `X`
X = features[___]

# Split data to training and testing
___, test_X, train_Y, ___ = ___(X, Y, test_size=0.25, random_state=99)
Edit dan Jalankan Kode