1. Learn
  2. /
  3. Courses
  4. /
  5. PySpark로 배우는 빅데이터 기초

Connected

Exercise

PySpark DataFrame 시각화

데이터를 이해하고 해석하려면 그래픽 표현, 즉 시각화가 매우 중요해요. 이번 간단한 데이터 시각화 연습에서는 먼저 앞에서 생성한 names_df DataFrame의 컬럼 이름을 출력하고, 이어서 names_df를 Pandas DataFrame으로 변환한 뒤, 사람의 이름을 x축, 나이를 y축으로 하는 가로 막대 그래프를 그려 보겠습니다.

워크스페이스에는 이미 SparkSession spark와 DataFrame names_df가 준비되어 있다는 점을 기억하세요.

Instructions

100 XP
  • names_df DataFrame의 컬럼 이름을 출력하세요.
  • names_df DataFrame을 Pandas DataFrame df_pandas로 변환하세요.
  • matplotlib의 plot() 메서드를 사용해 x축에는 'Name', y축에는 'Age'가 오도록 가로 막대 그래프를 그리세요.