파트 1: CSV 파일에서 DataFrame 생성

4년마다 전 세계 축구 팬들은 “Fifa World Cup”이라는 축제를 맞이하고, 많은 나라에서 그에 따라 모든 것이 달라지기도 해요. 이 3단계 연습 문제에서는 PySpark SQL을 사용해 "FIFA 2018 World Cup Player" 데이터셋으로 탐색적 데이터 분석(EDA)을 수행할 거예요. 여기에는 DataFrame 연산, SQL 쿼리, 시각화가 포함돼요.

첫 번째 파트에서는 CSV 형식의 FIFA 2018 World Cup Players 데이터셋(Fifa2018_dataset.csv)을 PySpark DataFrame으로 로드하고, 기본적인 DataFrame 연산으로 데이터를 살펴보세요.

워크스페이스에는 이미 SparkSession spark와 변수 file_path가 준비되어 있다는 점을 기억하세요.