1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ中級正規表現

Connected

演習

高度な正規表現で抽出する

この演習では、前の演習を踏まえて、より高度な正規表現を作成し、screens_per_movie データフレームの各行から映画タイトル、配給会社名、スクリーン数を抽出します。

screens_per_movie の各行には、これら3つの情報が含まれています。extract を使ってこの3つを取り出し、ちょうど欲しい情報だけを表形式で構造化された3つの新しい列として得ます。非構造化データを理解し、後で分析や可視化ができる形に整えるうえで、このステップはとても重要です。

指示1 / 3

undefined XP
    1
    2
    3
  • まず、screens_per_movie の先頭3行を確認し、データの構造を把握しましょう。