1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do importu dat v Pythonu

Connected

Cvičení

Importování plochých souborů jako DataFrames pomocí pandas (2)

V předchozím cvičení jsi importoval/a ploché soubory do DataFrame knihovny pandas. Jako bonus je pak snadné získat odpovídající pole numpy pomocí metody .to_numpy(). Teď si to vyzkoušíš na datasetu MNIST, který je k dispozici jako digits.csv.

Funkce pd.read_csv() nabízí několik argumentů, které se ti v tomto cvičení budou hodit:

  • nrows umožňuje určit, kolik řádků ze souboru se načte. Například nrows=10 importuje pouze prvních 10 řádků.
  • header přijímá čísla řádků, která se použijí jako popisky sloupců, a označuje začátek dat. Pokud soubor řádek záhlaví neobsahuje, nastav header=None a pandas automaticky přiřadí celočíselné popisky sloupců začínající od 0 (např. 0, 1, 2, …).

Pokyny

100 XP
  • Importuj prvních 5 řádků souboru do DataFrame pomocí funkce pd.read_csv() a výsledek přiřaď do proměnné data. Budeš potřebovat argumenty nrows a header. Pamatuj, že tento soubor neobsahuje řádek záhlaví.
  • Z výsledného DataFrame uloženého v data vytvoř pole numpy a přiřaď ho do proměnné data_array.
  • Spusť print(type(data_array)) pro výpis datového typu proměnné data_array.