学ぶ

/

コース

/

PySparkで学ぶBig Data入門

Connected

演習

PySpark シェルでのデータ読み込み

PySpark では、クラスター全体で自動的に並列化される分散コレクションに対する操作として計算を表現します。前の演習では、リストを並列化コレクションとして読み込む例を見ました。この演習では、PySpark シェルでローカルファイルからデータを読み込みます。

作業環境には、すでに SparkContext の sc と、README.md へのパスである file_path 変数が用意されています。

指示

100 XP

ローカルのテキストファイル README.md を PySpark シェルで読み込みます。