Visualizar la importancia de las características
En este ejercicio, determinarás qué características eran las más predictivas según el regresor de bosques aleatorios rf que entrenaste en un ejercicio anterior.
Para ello, dibujarás un diagrama de barras horizontales de la importancia del rasgo evaluada por rf. Afortunadamente, esto puede hacerse fácilmente gracias a las capacidades de trazado de pandas.
Hemos creado un objeto pandas.Series llamado importances que contiene los nombres de las características como index y sus importancias como valores. Además, matplotlib.pyplot está disponible como plt y pandas como pd.
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Instrucciones del ejercicio
Llama al método
.sort_values()enimportancesy asigna el resultado aimportances_sorted.Llama al método
.plot()enimportances_sortedy establece los argumentos:kinda'barh'colora'lightgreen'
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()