Importanza delle feature
Anche se alcuni attributi delle caramelle, come il cioccolato, possono essere molto popolari, non significa che saranno importanti per la predizione del modello. Dopo aver addestrato un modello di random forest, puoi consultare l’attributo del modello .feature_importances_ per vedere quali variabili hanno avuto l’impatto maggiore. Puoi verificare quanto è stata importante ciascuna variabile nel modello iterando sull’array delle feature importances usando enumerate().
Se non conosci la funzione enumerate() di Python, ti permette di scorrere una lista creando anche un contatore automatico.
Questo esercizio fa parte del corso
Validazione dei modelli in Python
Istruzioni dell'esercizio
- Itera sull’output delle importanze delle feature di
rfr. - Stampa i nomi delle colonne di
X_traine il punteggio di importanza per ciascuna colonna.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit the model using X and y
rfr.fit(X_train, y_train)
# Print how important each column is to the model
for i, item in enumerate(rfr.____):
# Use i and item to print out the feature importance of each column
print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))