Mengodekan variabel kategorikal
Pada latihan sebelumnya Anda berlatih membuat matriks model untuk variabel kontinu dan menerapkan transformasi variabel. Pada latihan ini Anda akan berlatih cara mengodekan variabel kategorikal.
Data kategorikal memungkinkan Anda menganalisis dan membandingkan hubungan berdasarkan kelompok atau faktor yang berbeda. Karena itu, memilih kelompok acuan (reference group) menjadi penting dan sering kali, bergantung pada studi yang dilakukan, Anda mungkin ingin mengubah kelompok acuan dari yang baku. Salah satu alasan yang sering digunakan untuk mengubah kelompok acuan adalah agar interpretasi estimasi koefisien menjadi lebih relevan dan menarik sesuai konteks studi.
Untuk latihan ini Anda akan meninjau kembali himpunan data crab di mana color dan spine adalah variabel kategorikal.
Himpunan data crab telah dimuat sebelumnya di workspace.
Latihan ini merupakan bagian dari kursus
Generalized Linear Models di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())