Limpando seu conjunto de dados
Conjuntos de dados do mundo real, como o de doença cardíaca, costumam ser bagunçados, com valores duplicados ou ausentes. Neste exercício, você vai aplicar as habilidades aprendidas neste capítulo para fazer a limpeza de dados no conjunto de dados de doença cardíaca. O conjunto de dados já foi carregado para você. Sua tarefa é identificar e executar operações gerais de limpeza com base nos resultados da EDA: remover colunas vazias, excluir linhas duplicadas e fazer imputação na coluna restecg, que se refere a uma medida de eletrocardiograma. O Pandas já foi importado como pd, e o conjunto de dados está armazenado em um DataFrame do pandas chamado heart_disease_df.
Este exercício faz parte do curso
Machine Learning de ponta a ponta
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)