Visualizar la importancia de las características
En este ejercicio, determinarás qué características eran las más predictivas según el regresor de bosques aleatorios rf
que entrenaste en un ejercicio anterior.
Para ello, dibujarás un diagrama de barras horizontales de la importancia del rasgo evaluada por rf
. Afortunadamente, esto puede hacerse fácilmente gracias a las capacidades de trazado de pandas
.
Hemos creado un objeto pandas.Series
llamado importances
que contiene los nombres de las características como index
y sus importancias como valores. Además, matplotlib.pyplot
está disponible como plt
y pandas
como pd
.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones de ejercicio
Llama al método
.sort_values()
enimportances
y asigna el resultado aimportances_sorted
.Llama al método
.plot()
enimportances_sorted
y establece los argumentos:kind
a'barh'
color
a'lightgreen'
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()