1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Práce s hluboce zanořenými daty

V předchozím cvičení jsi zploštil/a data zanořená o jednu úroveň. Tady rozbalíš data zanořená hlouběji.

Atribut categories v odpovědi Yelp API obsahuje seznamy objektů. K zploštění těchto dat využiješ argumenty funkce json_normalize(), které umožňují určit cestu k categories a vybrat další atributy pro zahrnutí do datového rámce. Nezapomeň také změnit oddělovač, aby bylo snazší vybírat sloupce, a přidat prefix k ostatním atributům, aby nedocházelo ke kolizím názvů sloupců. Projdeme to krok za krokem.

pandas (jako pd) a json_normalize() jsou již naimportovány. Data z Yelpu o kavárnách v New Yorku ve formátu JSON jsou uložena v proměnné data.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Pomocí json_normalize() zplošti záznamy pod klíčem businesses v proměnné data a nastav jako oddělovač podtržítko (_).