ComeçarComece de graça

Cálculos com uma tabela dinâmica

As tabelas dinâmicas estão repletas de estatísticas de resumo, mas são apenas a primeira etapa para encontrar algo interessante. Muitas vezes, é preciso realizar mais cálculos com elas. Uma ação comum é encontrar as linhas ou colunas em que ocorre o valor mais alto ou mais baixo.

Lembre-se de que, no Capítulo 1, vimos que é possível facilmente criar um subconjunto de uma série ou DataFrame para encontrar linhas de interesse usando uma condição lógica entre colchetes. Por exemplo: series[series > value].

pandas foi carregado como pd, e o DataFrame temp_by_country_city_vs_year já está disponível. O .head() desse DataFrame é mostrado abaixo, com apenas algumas das colunas de ano exibidas:

country city 2000 2001 2002 2013
Afghanistan Kabul 15.823 15.848 15.715 16.206
Angola Luanda 24.410 24.427 24.791 24.554
Australia Melbourne 14.320 14.180 14.076 14.742
Sydney 17.567 17.854 17.734 18.090
Bangladesh Dhaka 25.905 25.931 26.095 26.587

Este exercício faz parte do curso

Manipulação de dados com o pandas

Ver curso

Instruções do exercício

  • Calcule a temperatura média de cada ano, atribuindo a mean_temp_by_year.
  • Filtre mean_temp_by_year para obter o ano que apresentou a temperatura média mais elevada.
  • Calcule a temperatura média de cada cidade (nas colunas), atribuindo a mean_temp_by_city.
  • Filtre mean_temp_by_city para obter a cidade que teve a temperatura média mais baixa.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Get the worldwide mean temp by year
mean_temp_by_year = temp_by_country_city_vs_year.____

# Filter for the year that had the highest mean temp
print(mean_temp_by_year[____])

# Get the mean temp by city
mean_temp_by_city = temp_by_country_city_vs_year.____

# Filter for the city that had the lowest mean temp
print(mean_temp_by_city[____])
Editar e executar o código