Adição de novas colunas
Você não fica preso apenas aos dados que lhe são fornecidos. Existe a possibilidade de adicionar novas colunas a um DataFrame. Isso tem muitos nomes, como transformação, mutação e engenharia de features.
Você pode criar novas colunas do zero, mas também é comum derivá-las de outras colunas, por exemplo, adicionando colunas ou alterando suas unidades.
homelessness
é um DataFrame que contém estimativas da falta de moradia em cada estado dos EUA em 2018. A coluna individual
é o número de indivíduos sem-teto que não fazem parte de uma família com filhos. A coluna family_members
é o número de indivíduos sem-teto que fazem parte de uma família com filhos. A coluna state_pop
é a população total do estado.
homelessness
já está disponível e pandas
foi carregado como pd
.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Adicione uma nova coluna a
homelessness
, denominadatotal
, contendo a soma das colunasindividuals
efamily_members
. - Adicione outra coluna a
homelessness
, denominadap_homeless
, contendo a proporção dototal
da população sem-teto em relação à população total de cada estado,state_pop
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)