Cálculos com uma tabela dinâmica
As tabelas dinâmicas estão repletas de estatísticas de resumo, mas são apenas a primeira etapa para encontrar algo interessante. Muitas vezes, é preciso realizar mais cálculos com elas. Uma ação comum é encontrar as linhas ou colunas em que ocorre o valor mais alto ou mais baixo.
Lembre-se de que, no Capítulo 1, vimos que é possível facilmente criar um subconjunto de uma série ou DataFrame para encontrar linhas de interesse usando uma condição lógica entre colchetes. Por exemplo: series[series > value]
.
pandas
foi carregado como pd
, e o DataFrame temp_by_country_city_vs_year
já está disponível.
O .head()
desse DataFrame é mostrado abaixo, com apenas algumas das colunas de ano exibidas:
country | city | 2000 | 2001 | 2002 | … | 2013 |
---|---|---|---|---|---|---|
Afghanistan | Kabul | 15.823 | 15.848 | 15.715 | … | 16.206 |
Angola | Luanda | 24.410 | 24.427 | 24.791 | … | 24.554 |
Australia | Melbourne | 14.320 | 14.180 | 14.076 | … | 14.742 |
Sydney | 17.567 | 17.854 | 17.734 | … | 18.090 | |
Bangladesh | Dhaka | 25.905 | 25.931 | 26.095 | … | 26.587 |
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Calcule a temperatura média de cada ano, atribuindo a
mean_temp_by_year
. - Filtre
mean_temp_by_year
para obter o ano que apresentou a temperatura média mais elevada. - Calcule a temperatura média de cada cidade (nas colunas), atribuindo a
mean_temp_by_city
. - Filtre
mean_temp_by_city
para obter a cidade que teve a temperatura média mais baixa.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the worldwide mean temp by year
mean_temp_by_year = temp_by_country_city_vs_year.____
# Filter for the year that had the highest mean temp
print(mean_temp_by_year[____])
# Get the mean temp by city
mean_temp_by_city = temp_by_country_city_vs_year.____
# Filter for the city that had the lowest mean temp
print(mean_temp_by_city[____])