1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas でデータを整形する

Connected

演習

入れ子の movies

しばらく前からパソコンに保存していた、さまざまな映画に関するデータを含む movies データセットが気になっています。データを分析したいのですが、入れ子の JSON 形式になっていることに気づきました。

これを DataFrame に読み込むには、先ほど学んだ関数を使う必要があります。その後、扱いやすくするために得られた DataFrame を整形します。

準構造化 JSON の movies が用意されています。コンソールで中身を確認しておいてください!

指示

100 XP
  • pandas から json_normalize() 関数をインポートします。
  • movies に含まれる JSON を正規化します。入れ子のレコードから生成される名前はアンダースコアで区切ります。
  • 得られた movies_norm DataFrame をワイド形式からロング形式に変形します。director と producer 列をユニークなインデックスとして使用します。movies 列から作成される新しい変数の名前は、features で始め、アンダースコアで区切り、単語を含む接尾辞を持たせます。