Pulizia del tuo insieme di dati
Gli insiemi di dati reali, come quello sulle malattie cardiache, sono spesso disordinati e contengono valori duplicati o mancanti. In questo esercizio metterai in pratica le competenze apprese nel capitolo per pulire l’insieme di dati sulle malattie cardiache. L’insieme di dati è già stato caricato per te. Il tuo compito è identificare ed eseguire operazioni di pulizia generali in base ai risultati dell’EDA: rimuovere le colonne vuote, eliminare le righe duplicate ed effettuare l’imputazione sulla colonna restecg, relativa a una misura di elettrocardiogramma. Pandas è stato importato come pd e l’insieme di dati sulle malattie cardiache è memorizzato come DataFrame di pandas chiamato heart_disease_df.
Questo esercizio fa parte del corso
Machine Learning end-to-end
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)