Specifieke datatypes selecteren
Vaak bevat een gegevensset kolommen met verschillende datatypes (zoals de set waar je nu mee werkt). De meeste Machine Learning-modellen vereisen dat je consistente datatypes over je features heen gebruikt. Ook zijn de meeste feature engineering-technieken maar op één type data tegelijk toepasbaar. Daarom wil je in een DataFrame vaak alleen de kolommen van bepaalde typen kunnen selecteren.
De DataFrame (so_survey_df) uit de vorige oefening is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Feature engineering voor Machine Learning in Python
Oefeninstructies
- Maak een subset van
so_survey_dfdie alleen de numerieke (intenfloat) kolommen bevat. - Print de kolomnamen in
so_survey_df_num.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create subset of only the numeric columns
so_numeric_df = so_survey_df.____(____=[____])
# Print the column names contained in so_survey_df_num
print(so_numeric_df.____)