Seleção de atributos
Ao preparar seus dados para modelagem, é importante garantir um conjunto de atributos úteis para o modelo basear suas previsões (ou diagnósticos). Para serem úteis, os atributos precisam capturar características essenciais do conjunto de dados de doença cardíaca de forma ortogonal; mais dados nem sempre é melhor!
Você pode usar o módulo sklearn.feature_selection.SelectFromModel para selecionar atributos relevantes. O SelectFromModel implementa um método de força bruta que usa um modelo RandomForestClassifier para encontrar os atributos mais salientes para a tarefa de diagnóstico de doença cardíaca.
RandomForestClassifier já foi importado e os atributos e o alvo dos dados de doença cardíaca foram importados como X_train e y_train, respectivamente.
Este exercício faz parte do curso
Machine Learning de ponta a ponta
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.feature_selection import SelectFromModel
# Define the random forest model and fit to the training data
rf = ____(____=____, ____=____, ____=____)
rf.____(____, ____)