IniziaInizia gratis

Visualizzare l'importanza delle feature

In questo esercizio determinerai quali feature sono state le più predittive secondo il random forests regressor rf che hai addestrato in un esercizio precedente.

A questo scopo, disegnerai un grafico a barre orizzontali delle importanze delle feature così come valutate da rf. Per fortuna, si può fare facilmente grazie alle funzionalità di plotting di pandas.

Abbiamo creato un oggetto pandas.Series chiamato importances che contiene i nomi delle feature come index e le rispettive importanze come valori. Inoltre, matplotlib.pyplot è disponibile come plt e pandas come pd.

Questo esercizio fa parte del corso

Machine Learning con modelli ad alberi in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Chiama il metodo .sort_values() su importances e assegna il risultato a importances_sorted.

  • Chiama il metodo .plot() su importances_sorted e imposta gli argomenti:

    • kind a 'barh'
    • color a 'lightgreen'

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Modifica ed esegui il codice