1. Învăţa
  2. /
  3. Courses
  4. /
  5. PySpark でデータをクレンジングする

Connected

exercise

when() の例

when() 句を使うと、内容に基づいて DataFrame を条件付きで変更できます。ここでは、役職が "Councilmember" の有権者に対して、ランダムな数値を追加するように voter_df DataFrame を変更します。

voter_df DataFrame はすでに定義されており、利用できます。pyspark.sql.functions ライブラリは F. として利用可能です。ランダム値の生成には F.rand() を使えます。

Instrucţiuni

100 XP
  • 役職が Councilmember の有権者に対して、F.rand() の結果を格納する列 random_val を voter_df に追加します。
  • .when() 句が期待どおりに動作したかを確認するため、DataFrame の一部の行を表示します。