Cálculos com uma tabela dinâmica
As tabelas dinâmicas estão repletas de estatísticas de resumo, mas são apenas a primeira etapa para encontrar algo interessante. Muitas vezes, é preciso realizar mais cálculos com elas. Uma ação comum é encontrar as linhas ou colunas em que ocorre o valor mais alto ou mais baixo.
Lembre-se de que, no Capítulo 1, vimos que é possível facilmente criar um subconjunto de uma série ou DataFrame para encontrar linhas de interesse usando uma condição lógica entre colchetes. Por exemplo: series[series > value].
pandas foi carregado como pd, e o DataFrame temp_by_country_city_vs_year já está disponível.
O .head() desse DataFrame é mostrado abaixo, com apenas algumas das colunas de ano exibidas:
| country | city | 2000 | 2001 | 2002 | … | 2013 |
|---|---|---|---|---|---|---|
| Afghanistan | Kabul | 15.823 | 15.848 | 15.715 | … | 16.206 |
| Angola | Luanda | 24.410 | 24.427 | 24.791 | … | 24.554 |
| Australia | Melbourne | 14.320 | 14.180 | 14.076 | … | 14.742 |
| Sydney | 17.567 | 17.854 | 17.734 | … | 18.090 | |
| Bangladesh | Dhaka | 25.905 | 25.931 | 26.095 | … | 26.587 |
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Calcule a temperatura média de cada ano, atribuindo a
mean_temp_by_year. - Filtre
mean_temp_by_yearpara obter o ano que apresentou a temperatura média mais elevada. - Calcule a temperatura média de cada cidade (nas colunas), atribuindo a
mean_temp_by_city. - Filtre
mean_temp_by_citypara obter a cidade que teve a temperatura média mais baixa.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the worldwide mean temp by year
mean_temp_by_year = temp_by_country_city_vs_year.____
# Filter for the year that had the highest mean temp
print(mean_temp_by_year[____])
# Get the mean temp by city
mean_temp_by_city = temp_by_country_city_vs_year.____
# Filter for the city that had the lowest mean temp
print(mean_temp_by_city[____])