Visualizzare l'importanza delle feature
In questo esercizio determinerai quali feature sono state le più predittive secondo il random forests regressor rf che hai addestrato in un esercizio precedente.
A questo scopo, disegnerai un grafico a barre orizzontali delle importanze delle feature così come valutate da rf. Per fortuna, si può fare facilmente grazie alle funzionalità di plotting di pandas.
Abbiamo creato un oggetto pandas.Series chiamato importances che contiene i nomi delle feature come index e le rispettive importanze come valori. Inoltre, matplotlib.pyplot è disponibile come plt e pandas come pd.
Questo esercizio fa parte del corso
Machine Learning con modelli ad alberi in Python
Istruzioni dell'esercizio
Chiama il metodo
.sort_values()suimportancese assegna il risultato aimportances_sorted.Chiama il metodo
.plot()suimportances_sortede imposta gli argomenti:kinda'barh'colora'lightgreen'
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()