Che aspetto hanno i tuoi dati? (I)
Finora ti sei concentrato sulla creazione di nuove feature e sulla gestione dei problemi nei tuoi dati. Il feature engineering può anche aiutarti a sfruttare al meglio i dati che hai già e a usarli in modo più efficace quando crei modelli di machine learning.
Molti algoritmi possono assumere che i tuoi dati seguano una distribuzione normale, o almeno che tutte le colonne siano sulla stessa scala. Spesso non è così: ad esempio, una feature può essere misurata in migliaia di dollari, mentre un'altra in numero di anni. In questo esercizio creerai grafici per esaminare le distribuzioni di alcune colonne numeriche nel DataFrame so_survey_df, memorizzate in so_numeric_df.
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a histogram
____
plt.show()