MulaiMulai sekarang secara gratis

Membuat SparkSession

Dalam latihan ini, Anda akan menyalakan klaster Spark lokal dengan menggunakan semua core yang tersedia. Klaster tersebut akan dapat diakses melalui objek SparkSession.

Kelas SparkSession memiliki atribut builder, yang merupakan instance dari kelas Builder. Kelas Builder menyediakan tiga metode penting yang memungkinkan Anda untuk:

  • menentukan lokasi node master;
  • memberi nama aplikasi (opsional); dan
  • mengambil SparkSession yang sudah ada atau, jika belum ada, membuat yang baru.

Kelas SparkSession memiliki atribut version yang memberikan versi Spark. Catatan: Versi juga dapat diakses melalui atribut __version__ pada modul pyspark.

Pelajari lebih lanjut tentang SparkSession di sini.

Setelah selesai menggunakan klaster, sebaiknya matikan klaster tersebut agar sumber dayanya dibebaskan dan tersedia untuk proses lain.

Catatan:

  1. Anda mungkin perlu meninjau kembali slide dari pelajaran pada panel Slide di sebelah IPython Shell.
  2. Versi Spark pada latihan tidak sama dengan versi pada pelajaran. Platform latihan telah diperbarui ke versi Spark yang lebih baru.

Latihan ini adalah bagian dari kursus

Machine Learning dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Impor kelas SparkSession dari pyspark.sql.
  • Buat objek SparkSession yang terhubung ke klaster lokal. Gunakan semua core yang tersedia. Beri nama aplikasi 'test'.
  • Gunakan atribut version pada objek SparkSession untuk mengambil versi Spark yang berjalan pada klaster. Catatan: Versinya mungkin berbeda dari yang digunakan dalam presentasi (diperbarui dari waktu ke waktu).
  • Matikan klaster.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the SparkSession class
from ____ import ____

# Create SparkSession object
spark = SparkSession.builder \
                    .master(____) \
                    .____(____) \
                    .____()

# What version of Spark?
print(spark.____)

# Terminate the cluster
spark.____()
Edit dan Jalankan Kode