Calcular en una tabla dinámica
Las tablas dinámicas están llenas de estadísticas resumidas, pero solo son un primer paso para encontrar algo revelador. A menudo necesitarás realizar más cálculos sobre ellos. Algo habitual es encontrar las filas o columnas donde se produce el valor más alto o más bajo.
Recuerda del Capítulo 1 que puedes subconjuntar fácilmente una Serie o un DataFrame para encontrar filas de interés utilizando una condición lógica entre corchetes. Por ejemplo: series[series > value].
pandas se carga como pd y el DataFrame temp_by_country_city_vs_year está disponible.
El .head() de este DataFrame se muestra a continuación, con solo algunas de las columnas del año mostradas:
| country | city | 2000 | 2001 | 2002 | … | 2013 |
|---|---|---|---|---|---|---|
| Afghanistan | Kabul | 15.823 | 15.848 | 15.715 | … | 16.206 |
| Angola | Luanda | 24.410 | 24.427 | 24.791 | … | 24.554 |
| Australia | Melbourne | 14.320 | 14.180 | 14.076 | … | 14.742 |
| Sydney | 17.567 | 17.854 | 17.734 | … | 18.090 | |
| Bangladesh | Dhaka | 25.905 | 25.931 | 26.095 | … | 26.587 |
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones del ejercicio
- Calcula la temperatura media de cada año, asignándola a
mean_temp_by_year. - Filtra
mean_temp_by_yearpara el año que tuvo la temperatura media más alta. - Calcula la temperatura media de cada ciudad (a través de las columnas), asignándola a
mean_temp_by_city. - Filtra
mean_temp_by_citypara la ciudad que tuvo la temperatura media más baja.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get the worldwide mean temp by year
mean_temp_by_year = temp_by_country_city_vs_year.____
# Filter for the year that had the highest mean temp
print(mean_temp_by_year[____])
# Get the mean temp by city
mean_temp_by_city = temp_by_country_city_vs_year.____
# Filter for the city that had the lowest mean temp
print(mean_temp_by_city[____])