Eliminação de dados ausentes
Agora que você já explorou o conjunto de dados volunteer
e entendeu sua estrutura e conteúdo, é hora de começar a eliminar os valores ausentes.
Neste exercício, você soltará colunas e linhas para criar um subconjunto do conjunto de dados volunteer
.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Elimine as colunas
Latitude
eLongitude
devolunteer
, armazenando-as comovolunteer_cols
. - Faça um subconjunto de
volunteer_cols
eliminando as linhas que contêm valores ausentes emcategory_desc
e armazene em uma nova variável chamadavolunteer_subset
. - Dê uma olhada no atributo
.shape
devolunteer_subset
, para verificar se ele funcionou corretamente.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____
# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____
# Print out the shape of the subset
print(____.____)