1. Learn
  2. /
  3. คอร์ส
  4. /
  5. PySparkで学ぶBig Data入門

Connected

แบบฝึกหัด

Map と Collect

PySpark でデータを操作する主な方法は map() の使用です。map() 変換は関数を受け取り、RDD の各要素に適用します。コレクション内の各 URL に関連するウェブサイトを取得することから、単に数値を二乗することまで、さまざまな処理に使えます。このシンプルな演習では、先ほど作成した RDD numbRDD の各数値を立方にするために map() 変換を使います。次に、すべての要素を変数に保存し、最後に出力を表示します。

SparkContext の sc と numbRDD はすでにワークスペースに用意されています。

คำแนะนำ

100 XP
  • numbRDD 内のすべての数値を立方にする map() 変換を作成します。
  • 結果を numbers_all 変数に収集します。
  • numbers_all 変数の出力を表示します。