Como criar subconjuntos de linhas
Muito do trabalho na ciência de dados consiste em descobrir quais partes de um conjunto de dados são interessantes. Uma das técnicas mais simples para isso é encontrar um subconjunto de linhas que atenda a alguns critérios. Isso às vezes é conhecido como filtragem de linhas ou seleção de linhas.
Há muitas maneiras de criar um subconjunto em um DataFrame. Talvez a mais comum seja usar operadores relacionais para retornar True
ou False
para cada linha e, em seguida, passar isso entre colchetes.
dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]
Você pode filtrar várias condições de uma só vez usando o operador bit a bit “E”, &
.
dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]
homelessness
já está disponível e pandas
foi carregado como pd
.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____
# See the result
print(ind_gt_10k)