Importância das variáveis
Embora alguns atributos de doces, como chocolate, possam ser extremamente populares, isso não significa que serão importantes para a previsão do modelo. Depois que um modelo de random forest for ajustado, você pode revisar o atributo do modelo, .feature_importances_, para ver quais variáveis tiveram maior impacto. Você pode verificar o quão importante cada variável foi no modelo percorrendo o array de importâncias com enumerate().
Se você não estiver familiarizado com a função enumerate() do Python, ela permite percorrer uma lista enquanto cria um contador automático.
Este exercício faz parte do curso
Validação de Modelos em Python
Instruções do exercício
- Faça um loop pelo resultado de importância de variáveis de
rfr. - Imprima os nomes das colunas de
X_traine a pontuação de importância para cada coluna.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the model using X and y
rfr.fit(X_train, y_train)
# Print how important each column is to the model
for i, item in enumerate(rfr.____):
# Use i and item to print out the feature importance of each column
print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))