1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶBig Data入門

Connected

演習

SortByKey と Collect

キーに基づいてペア RDD を並び替える(この章の後半で登場する word count など)ことはよくあります。この演習では、前の演習で作成したペア RDD Rdd_Reduced をキーで降順にソートし、最終的な出力を表示します。

なお、作業スペースには SparkContext sc と Rdd_Reduced がすでに用意されています。

指示

100 XP
  • Rdd_Reduced をキーで降順にソートします。
  • 中身を collect して、反復処理で出力を表示します。