1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Manipulace s daty v pandas

Connected

Cvičení

Výpočty nad kontingenční tabulkou

Kontingenční tabulky jsou plné souhrnných statistik, ale to je teprve začátek – pro skutečně zajímavé závěry bývá potřeba provést další výpočty. Častým úkolem je najít řádky nebo sloupce, kde se vyskytuje nejvyšší nebo nejnižší hodnota.

Vzpomeň si z kapitoly 1, že pomocí logické podmínky v hranatých závorkách snadno vyfiltrujeme řádky zájmu ze série nebo DataFramu. Například: series[series > value].

pandas je načtený jako pd a DataFrame temp_by_country_city_vs_year je dostupný. Níže je zobrazeno .head() tohoto DataFramu (jen několik sloupců s roky):

country city 2000 2001 2002 … 2013
Afghanistan Kabul 15.823 15.848 15.715 … 16.206
Angola Luanda 24.410 24.427 24.791 … 24.554
Australia Melbourne 14.320 14.180 14.076 … 14.742
Sydney 17.567 17.854 17.734 … 18.090
Bangladesh span translate="no">Dhaka 25.905 25.931 26.095 … 26.587

Pokyny

100 XP
  • Vypočítej průměrnou teplotu pro každý rok a výsledek ulož do mean_temp_by_year.
  • Vyfiltruj z mean_temp_by_year rok s nejvyšší průměrnou teplotou.
  • Vypočítej průměrnou teplotu pro každé město (přes sloupce) a výsledek ulož do mean_temp_by_city.
  • Vyfiltruj z mean_temp_by_city město s nejnižší průměrnou teplotou.