Classificação de linhas
Costuma ser mais fácil encontrar dados interessantes em um DataFrame alterando a ordem das linhas. Podemos classificar as linhas passando um nome de coluna com .sort_values().
Nos casos em que as linhas têm o mesmo valor (isso é comum ao fazer a classificação de uma variável categórica), pode ser conveniente desempatá-las classificando com base outra coluna. Podemos classificar várias colunas dessa forma, passando uma lista de nomes de colunas.
| Classificar por… | Sintaxe |
|---|---|
| uma coluna | df.sort_values("breed") |
| várias colunas | df.sort_values(["breed", "weight_kg"]) |
Ao combinar .sort_values() e .head(), podemos responder a perguntas do tipo "Quais são os principais casos em que…?".
homelessness já está disponível e pandas foi carregado como pd.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Sort homelessness by individuals
homelessness_ind = ____
# Print the top few rows
print(____)