1. Nauka
  2. /
  3. Kursy
  4. /
  5. ETL i ELT w Pythonie

Connected

ćwiczenie

Wyodrębnianie danych z plików parquet

Jednym z najczęstszych sposobów pobierania danych ze źródłowego systemu jest odczyt danych z pliku, na przykład pliku CSV. Wraz ze wzrostem ilości danych pojawiła się potrzeba lepszych formatów plików – stąd powstały kolumnowe typy plików, takie jak pliki parquet.

W tym ćwiczeniu przećwiczysz wyodrębnianie danych z pliku parquet.

Instrukcje

100 XP
  • Wczytaj plik parquet znajdujący się pod ścieżką "sales_data.parquet" do DataFrame biblioteki pandas.
  • Sprawdź typy danych w DataFrame, wyświetlając je za pomocą print().
  • Wyświetl kształt DataFrame oraz jego pierwsze wiersze.