Mengodekan variabel kategorikal
Pada latihan sebelumnya Anda berlatih membuat matriks model untuk variabel kontinu dan menerapkan transformasi variabel. Pada latihan ini Anda akan berlatih cara mengodekan variabel kategorikal.
Data kategorikal memungkinkan Anda menganalisis dan membandingkan hubungan berdasarkan kelompok atau faktor yang berbeda. Karena itu, memilih kelompok acuan (reference group) menjadi penting dan sering kali, bergantung pada studi yang dilakukan, Anda mungkin ingin mengubah kelompok acuan dari yang baku. Salah satu alasan yang sering digunakan untuk mengubah kelompok acuan adalah agar interpretasi estimasi koefisien menjadi lebih relevan dan menarik sesuai konteks studi.
Untuk latihan ini Anda akan meninjau kembali himpunan data crab di mana color dan spine adalah variabel kategorikal.
Himpunan data crab telah dimuat sebelumnya di workspace.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())