1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przekształcanie danych z pandas

Connected

ćwiczenie

Zagnieżdżone dane o filmach

Masz na komputerze zbiór danych movies, który zawiera informacje o różnych filmach i chcesz się mu bliżej przyjrzeć. Chcesz przeanalizować te dane, ale okazuje się, że są w zagnieżdżonym formacie JSON.

Aby wczytać je do DataFrame, musisz użyć poznanej właśnie funkcji. Następnie przekształcisz wynikowy DataFrame, żeby łatwiej było z nim pracować.

Półustrukturyzowany JSON o nazwie movies jest już dostępny. Koniecznie sprawdź jego zawartość w konsoli!

Instrukcje

100 XP
  • Zaimportuj funkcję json_normalize() z biblioteki pandas.
  • Znormalizuj JSON zawarty w movies. Nazwy generowane z zagnieżdżonych rekordów oddziel znakiem podkreślenia.
  • Przekształć wynikowy DataFrame movies_norm z formatu szerokiego do długiego, używając kolumn director i producer jako unikalnych indeksów. Nowej zmiennej utworzonej z kolumn nadaj nazwę movies, zaczynając od features, oddzielonej znakiem podkreślenia, z sufiksem zawierającym słowa.