1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ Spark SQL 入門

Connected

演習

テキスト列を split と explode で展開する

100 行のデータフレーム clauses_df が用意されています。clause 列と行IDを持ちます。各 clause は、スペースで区切られた1語以上の文字列です。

指示

100 XP
  • clause 列を分割して、個々の単語の配列を含む words 列を作成します。
  • words 列を explode して、word 列を作成します。
  • 最終的な行数を数えます。