SparkSession 생성하기

이 연습 문제에서는 사용 가능한 모든 코어를 활용해 로컬 Spark 클러스터를 실행해 보세요. 클러스터에는 SparkSession 객체를 통해 접근할 수 있어요.

SparkSession 클래스에는 builder 속성이 있으며, 이는 Builder 클래스의 인스턴스예요. Builder 클래스는 다음을 할 수 있는 세 가지 중요한 메서드를 제공해요.

SparkSession 클래스에는 Spark의 버전을 알려주는 version 속성이 있어요. 참고: 버전은 pyspark 모듈의 __version__ 속성으로도 확인할 수 있어요.

SparkSession에 대해 더 알아보려면 여기를 참고하세요.

작업을 마치면 클러스터를 종료하는 것이 좋아요. 이렇게 하면 자원을 해제하여 다른 프로세스가 사용할 수 있게 돼요.

참고 사항:

pyspark.sql에서 SparkSession 클래스를 임포트하세요.
로컬 클러스터에 연결된 SparkSession 객체를 생성하세요. 사용 가능한 모든 코어를 사용하고, 애플리케이션 이름은 'test'로 지정하세요.
클러스터에서 실행 중인 Spark의 버전을 확인하려면 SparkSession 객체의 version 속성을 사용하세요. 참고: 프레젠테이션에서 사용된 버전과 다를 수 있어요(수시로 업데이트됩니다).
클러스터를 종료하세요.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제