Limpando seu conjunto de dados

Conjuntos de dados do mundo real, como o de doença cardíaca, costumam ser bagunçados, com valores duplicados ou ausentes. Neste exercício, você vai aplicar as habilidades aprendidas neste capítulo para fazer a limpeza de dados no conjunto de dados de doença cardíaca. O conjunto de dados já foi carregado para você. Sua tarefa é identificar e executar operações gerais de limpeza com base nos resultados da EDA: remover colunas vazias, excluir linhas duplicadas e fazer imputação na coluna restecg, que se refere a uma medida de eletrocardiograma. O Pandas já foi importado como pd, e o conjunto de dados está armazenado em um DataFrame do pandas chamado heart_disease_df.

Este exercício faz parte do curso

Machine Learning de ponta a ponta

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)

Editar e executar o código