Pengodean variabel kategorikal - biner
Lihatlah himpunan data hiking. Ada beberapa kolom yang perlu dikodekan sebelum dapat dimodelkan, salah satunya adalah kolom Accessible. Accessible adalah fitur biner, sehingga memiliki dua nilai, Y atau N, yang perlu dikodekan menjadi 1 dan 0. Gunakan metode LabelEncoder dari scikit-learn untuk melakukan transformasi ini.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Simpan
LabelEncoder()dalam variabel bernamaenc. - Dengan menggunakan metode
.fit_transform()milik encoder, kodekan kolom"Accessible"dari himpunan datahiking. Beri nama kolom baruAccessible_enc. - Bandingkan kedua kolom tersebut berdampingan untuk melihat hasil pengodeannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())