ComenzarEmpieza gratis

Selección de características

Al preparar tus datos para el modelado, es importante asegurarte de que cuentas con un conjunto de características útiles en el que el modelo pueda basar sus predicciones (o diagnóstico). Para ser útiles, las características deben capturar los rasgos esenciales del conjunto de datos de enfermedades cardiacas de forma ortogonal; ¡más datos no siempre es mejor!

Puedes usar el módulo sklearn.feature_selection.SelectFromModel para seleccionar características útiles. SelectFromModel implementa un método de fuerza bruta que utiliza un modelo RandomForestClassifier para encontrar las características más relevantes para la tarea de diagnóstico de enfermedad cardiaca.

RandomForestClassifier ya se ha importado y las características y el objetivo del conjunto de datos de enfermedad cardiaca se han importado como X_train y y_train, respectivamente.

Este ejercicio forma parte del curso

Machine Learning de extremo a extremo

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

from sklearn.feature_selection import SelectFromModel

# Define the random forest model and fit to the training data
rf = ____(____=____, ____=____, ____=____)
rf.____(____, ____)
Editar y ejecutar código