IniziaInizia gratis

Pulizia del tuo insieme di dati

Gli insiemi di dati reali, come quello sulle malattie cardiache, sono spesso disordinati e contengono valori duplicati o mancanti. In questo esercizio metterai in pratica le competenze apprese nel capitolo per pulire l’insieme di dati sulle malattie cardiache. L’insieme di dati è già stato caricato per te. Il tuo compito è identificare ed eseguire operazioni di pulizia generali in base ai risultati dell’EDA: rimuovere le colonne vuote, eliminare le righe duplicate ed effettuare l’imputazione sulla colonna restecg, relativa a una misura di elettrocardiogramma. Pandas è stato importato come pd e l’insieme di dati sulle malattie cardiache è memorizzato come DataFrame di pandas chiamato heart_disease_df.

Questo esercizio fa parte del corso

Machine Learning end-to-end

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)
Modifica ed esegui il codice