Modellare con una variabile categorica
Negli esercizi precedenti hai adattato un modello di regressione logistica con color come variabile esplicativa insieme a width, trattando però color come variabile quantitativa. In questo esercizio tratterai color come variabile categorica che, quando costruisci la matrice del modello, verrà codificata in 3 variabili con codifica 0/1.
Ricorda che la codifica predefinita in dmatrix() usa il primo gruppo come gruppo di riferimento. Per visualizzare la matrice del modello come dataframe, un argomento aggiuntivo di dmatrix(), cioè return_type, va impostato su 'dataframe'.
La variabile color ha un ordinamento naturale come segue:
1: medium light
2: medium
3: medium dark
4: dark
Il dataset crab è già caricato nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Construct model matrix
model_matrix = ____('C(____, ____(____))' , data = ____,
return_type = 'dataframe')
# Print first 5 rows of model matrix dataframe
print(____.____)
# Fit and print the results of a glm model with the above model matrix configuration
model = ____('____ ~ ____(____, ____(____))', data = ____,
family = ____).____
print(____.____)