1. Nauka
  2. /
  3. Kursy
  4. /
  5. Sprawne importowanie danych z pandas

Connected

ćwiczenie

Obsługa głęboko zagnieżdżonych danych

W poprzednim ćwiczeniu spłaszczasz dane zagnieżdżone o jeden poziom. Tym razem rozpakujesz dane zagnieżdżone głębiej.

Atrybut categories w odpowiedzi API Yelp zawiera listy obiektów. Aby spłaszczyć te dane, użyjesz argumentów json_normalize() do wskazania ścieżki do categories oraz wybrania innych atrybutów, które mają znaleźć się w ramce danych. Warto też zmienić separator, aby ułatwić wybieranie kolumn, oraz dodać przedrostek do pozostałych atrybutów, żeby uniknąć konfliktów nazw kolumn. Przejdziemy przez to krok po kroku.

pandas (jako pd) oraz json_normalize() są już zaimportowane. Dane Yelp w formacie JSON dotyczące kawiarni w Nowym Jorku są przechowywane w zmiennej data.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Użyj json_normalize(), aby spłaszczyć rekordy spod klucza businesses w data, ustawiając podkreślenie (_) jako separator.