1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

SparkSession を作成する

この演習では、すでに spark という名前の SparkSession を用意しています。ただし、既存のセッションがあるか確信が持てない場合はどうすればよいでしょうか? 複数の SparkSession や SparkContext を作成すると問題の原因になるため、SparkSession.builder.getOrCreate() メソッドを使うのがベストプラクティスです。これは、環境に既存の SparkSession があればそれを返し、なければ新しく作成します。

指示

100 XP
  • pyspark.sql から SparkSession をインポートします。
  • SparkSession.builder.getOrCreate() を使って、my_spark という新しい SparkSession を作成します。
  • my_spark をコンソールに出力し、SparkSession であることを確認します。