Aan de slagGa gratis aan de slag

Featureselectie

Bij het voorbereiden van je data voor modellering is het belangrijk dat je een set bruikbare features hebt waarop het model zijn voorspellingen (of diagnose) kan baseren. Om nuttig te zijn, moeten features de essentiële kenmerken van de hartziekte-gegevensset op een orthogonale manier vastleggen; meer data is niet altijd beter!

Je kunt de module sklearn.feature_selection.SelectFromModel gebruiken om nuttige features te selecteren. SelectFromModel implementeert een brute-force methode die een RandomForestClassifier-model gebruikt om de meest opvallende features te vinden voor de taak van hartziektediagnose.

RandomForestClassifier is geïmporteerd en de features en target van de hartziektedata zijn respectievelijk geïmporteerd als X_train en y_train.

Deze oefening maakt deel uit van de cursus

End-to-End Machine Learning

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

from sklearn.feature_selection import SelectFromModel

# Define the random forest model and fit to the training data
rf = ____(____=____, ____=____, ____=____)
rf.____(____, ____)
Code bewerken en uitvoeren