Classificação de linhas
Costuma ser mais fácil encontrar dados interessantes em um DataFrame alterando a ordem das linhas. Podemos classificar as linhas passando um nome de coluna com .sort_values()
.
Nos casos em que as linhas têm o mesmo valor (isso é comum ao fazer a classificação de uma variável categórica), pode ser conveniente desempatá-las classificando com base outra coluna. Podemos classificar várias colunas dessa forma, passando uma lista de nomes de colunas.
Classificar por… | Sintaxe |
---|---|
uma coluna | df.sort_values("breed") |
várias colunas | df.sort_values(["breed", "weight_kg"]) |
Ao combinar .sort_values()
e .head()
, podemos responder a perguntas do tipo "Quais são os principais casos em que…?".
homelessness
já está disponível e pandas
foi carregado como pd
.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Sort homelessness by individuals
homelessness_ind = ____
# Print the top few rows
print(____)