Visualizar la importancia de las características

En este ejercicio, determinarás qué características eran las más predictivas según el regresor de bosques aleatorios rf que entrenaste en un ejercicio anterior.

Para ello, dibujarás un diagrama de barras horizontales de la importancia del rasgo evaluada por rf. Afortunadamente, esto puede hacerse fácilmente gracias a las capacidades de trazado de pandas.

Hemos creado un objeto pandas.Series llamado importances que contiene los nombres de las características como index y sus importancias como valores. Además, matplotlib.pyplot está disponible como plt y pandas como pd.

Este ejercicio forma parte del curso

Machine learning con modelos basados en árboles en Python

Ver curso

Instrucciones de ejercicio

  • Llama al método .sort_values() en importances y asigna el resultado a importances_sorted.

  • Llama al método .plot() en importances_sorted y establece los argumentos:

    • kind a 'barh'

    • color a 'lightgreen'

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()