Bagi data menjadi pelatihan dan pengujian
Langkah terakhir sebelum kita membangun model regresi! Di sini, Anda akan mengikuti langkah-langkah untuk mengidentifikasi nama variabel target dan kolom fitur, mengekstrak data, serta membaginya menjadi pelatihan dan pengujian.
Pustaka pandas dan numpy telah dimuat masing-masing sebagai pd dan np. Fitur masukan diimpor sebagai himpunan data features, dan variabel target yang Anda bangun pada latihan sebelumnya telah diimpor untuk Anda sebagai Y.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Simpan nama kolom pengenal pelanggan sebagai sebuah daftar.
- Pilih nama kolom fitur dengan mengecualikan pengenal pelanggan.
- Ekstrak fitur sebagai
X. - Bagi data menjadi pelatihan dan pengujian menggunakan fungsi
train_test_split().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Store customer identifier column name as a list
custid = ['___']
# Select feature column names excluding customer identifier
cols = [col for col in features.___ if col not in ___]
# Extract the features as `X`
X = features[___]
# Split data to training and testing
___, test_X, train_Y, ___ = ___(X, Y, test_size=0.25, random_state=99)