1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Python Toolbox

Connected

Cvičení

Psaní iterátoru pro načítání dat po částech (5)

Tohle je poslední krok. Hodně ses naučil/a o zpracování velkého datasetu po částech. V tomto závěrečném cvičení zabalíš veškerý kód pro zpracování dat do jediné funkce, abys ho mohl/a snadno použít znovu, aniž bys musel/a vše přepisovat od začátku.

Definuješ funkci plot_pop(), která přijímá dva argumenty: název souboru, který má být zpracován, a kód země, jejíž řádky chceš z datasetu zpracovat.

Protože veškerý kód z předchozích cvičení bude součástí funkce plot_pop(), její zavolání automaticky zajistí:

  • načtení souboru po částech,
  • vytvoření nového sloupce s hodnotami městského obyvatelstva a
  • vykreslení grafu s daty o městském obyvatelstvu.

Je toho hodně, ale díky této funkci teď můžeš celý postup snadno opakovat pro libovolný soubor a kód země!

Budeš pracovat s daty ze souboru 'ind_pop_data.csv', který je dostupný v tvém aktuálním adresáři. Balíčky pandas a matplotlib.pyplot jsou již naimportovány jako pd a plt.

Až budeš hotov/a, věnuj chvíli pohledu na grafy a zamysli se nad tím, co nového ses naučil/a. Cesta tím ale nekončí! Pokud tě práce s těmito daty bavila, můžeš v jejich prozkoumávání pokračovat pomocí předzpracované verze dostupné na Kaggle.

Pokyny

100 XP
  • Definuj funkci plot_pop() se dvěma argumenty: filename pro soubor ke zpracování a country_code pro kód země, jejíž data chceš zpracovat.
  • Zavolej plot_pop() pro zpracování dat země s kódem 'CEB' ze souboru 'ind_pop_data.csv'.
  • Zavolej plot_pop() pro zpracování dat země s kódem 'ARB' ze souboru 'ind_pop_data.csv'.