IniziaInizia gratis

Modellare con una variabile categorica

Negli esercizi precedenti hai adattato un modello di regressione logistica con color come variabile esplicativa insieme a width, trattando però color come variabile quantitativa. In questo esercizio tratterai color come variabile categorica che, quando costruisci la matrice del modello, verrà codificata in 3 variabili con codifica 0/1.

Ricorda che la codifica predefinita in dmatrix() usa il primo gruppo come gruppo di riferimento. Per visualizzare la matrice del modello come dataframe, un argomento aggiuntivo di dmatrix(), cioè return_type, va impostato su 'dataframe'.

La variabile color ha un ordinamento naturale come segue:
1: medium light
2: medium
3: medium dark
4: dark

Il dataset crab è già caricato nell'ambiente di lavoro.

Questo esercizio fa parte del corso

Modelli lineari generalizzati in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Construct model matrix
model_matrix = ____('C(____, ____(____))' , data = ____, 
                       return_type = 'dataframe')

# Print first 5 rows of model matrix dataframe
print(____.____)

# Fit and print the results of a glm model with the above model matrix configuration
model = ____('____ ~ ____(____, ____(____))', data = ____, 
            family = ____).____

print(____.____)
Modifica ed esegui il codice