1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Python Toolbox

Connected

Cvičení

Vytvoření iterátoru pro načítání dat po částech (1)

Další způsob, jak pracovat s daty, která se nevejdou do paměti, je načítat soubor po částech jako DataFrames o určité délce – například po 100 řádcích. S balíčkem pandas (importovaným jako pd) to zvládneš pomocí pd.read_csv(filename, chunksize=100). Tím vznikne iterovatelný objekt reader, na který můžeš volat next().

V tomto cvičení budeš načítat soubor po malých částech jako DataFrames pomocí read_csv(). Použiješ přitom data World Bank Indicators uložená v souboru 'ind_pop.csv', který máš k dispozici v aktuálním adresáři – zaměříš se na ukazatel městského obyvatelstva pro různé země a roky.

Pokyny

100 XP
  • Pomocí pd.read_csv() načti soubor 'ind_pop.csv' po částech o velikosti 10 řádků. Výsledek ulož do proměnné df_reader.
  • Vypiš první dvě části z df_reader.