Ataque combinado!
Você já viu os quatro tipos mais comuns de manipulação de dados: classificação de linhas, criação de subconjuntos de colunas, criação de subconjuntos de linhas e adição de novas colunas. Em uma análise de dados da vida real, é possível misturar e combinar essas quatro manipulações para responder a uma série de perguntas.
Neste exercício, você responderá à pergunta: "Qual estado tem o maior número de pessoas sem-teto por 10.000 habitantes?" Combine suas novas habilidades de pandas
para descobrir.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções de exercício
- Adicione uma coluna a
homelessness
,indiv_per_10k
, contendo o número de pessoas sem-teto por dez mil pessoas em cada estado, usandostate_pop
para a população do estado. - Crie um subconjunto de linhas em que
indiv_per_10k
é maior que20
, atribuindo ahigh_homelessness
. - Classifique
high_homelessness
em ordem decrescenteindiv_per_10k
, atribuindo ahigh_homelessness_srt
. - Selecione apenas as colunas
state
eindiv_per_10k
dehigh_homelessness_srt
e salve comoresult
. Dê uma olhada no resultado (result
).
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)