Codifica delle variabili categoriche
Negli esercizi precedenti hai fatto pratica nel creare matrici del modello per variabili continue e nell’applicare trasformazioni alle variabili. In questo esercizio ti eserciterai nei modi di codificare una variabile categorica.
I dati categorici permettono di analizzare e confrontare relazioni in presenza di gruppi o fattori diversi. Per questo motivo, scegliere un gruppo di riferimento è importante e, a seconda dello studio, potresti voler cambiare il gruppo di riferimento rispetto a quello predefinito. Un motivo frequente per cambiare il gruppo di riferimento è rendere l’interpretazione delle stime dei coefficienti più pertinente e interessante per lo studio.
Per questo esercizio tornerai al dataset crab, in cui color e spine sono variabili categoriche.
Il dataset crab è precaricato nell’ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import function dmatrix
from ____ import ____
# Construct and print model matrix for color as categorical variable
print(____('____', data = ____,
return_type = 'dataframe').head())