Calcul sur un tableau croisé dynamique
Les tableaux croisés dynamiques sont remplis de statistiques récapitulatives, mais ils ne constituent qu'une première étape pour trouver quelque chose d'intéressant. Souvent, vous devrez effectuer d'autres calculs sur ces données. Il est courant de trouver les lignes ou les colonnes où se trouve la valeur la plus élevée ou la plus basse.
Rappelez-vous que vous avez appris au chapitre 1 que vous pouvez facilement créer des sous-ensembles d’une série ou d’un DataFrame pour trouver des lignes intéressantes à l'aide d'une condition logique entre crochets. Par exemple :
pandas
est chargé en tant que pd
et le DataFrame temp_by_country_city_vs_year
est disponible.
L’en-tête .head()
pour ce DataFrame est illustré ci-dessous, avec seulement quelques colonnes de l'année affichées :
country | city | 2000 | 2001 | 2002 | … | 2013 |
---|---|---|---|---|---|---|
Afghanistan | Kabul | 15,823 | 15,848 | 15,715 | … | 16,206 |
Angola | Luanda | 24,410 | 24,427 | 24,791 | … | 24,554 |
Australia | Melbourne | 14,320 | 14,180 | 14,076 | … | 14,742 |
Sydney | 17,567 | 17,854 | 17,734 | … | 18,090 | |
Bangladesh | Dhaka | 25,905 | 25,931 | 26,095 | … | 26,587 |
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Calculez la température moyenne pour chaque année, en l'affectant à
mean_temp_by_year
. - Filtrez
mean_temp_by_year
pour l'année où la température moyenne a été la plus élevée. - Calculez la température moyenne pour chaque ville (en colonnes), en l'affectant à
mean_temp_by_city
. - Filtrez
mean_temp_by_city
pour la ville dont la température moyenne est la plus basse.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get the worldwide mean temp by year
mean_temp_by_year = temp_by_country_city_vs_year.____
# Filter for the year that had the highest mean temp
print(mean_temp_by_year[____])
# Get the mean temp by city
mean_temp_by_city = temp_by_country_city_vs_year.____
# Filter for the city that had the lowest mean temp
print(mean_temp_by_city[____])