1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 배우는 빅데이터 기초

Connected

연습 문제

PySpark DataFrame에서 데이터 살펴보기

그래프 작성, 모델링, 학습 등 분석을 수행하기 전에 데이터를 살펴보는 일은 매우 중요해요. 이 간단한 연습 문제에서는 기본적인 DataFrame 연산자를 사용해 이전 연습에서 만든 people_df DataFrame의 데이터를 살펴보겠습니다.

워크스페이스에는 이미 SparkSession spark와 DataFrame people_df가 준비되어 있어요.

지침

100 XP
  • people_df DataFrame에서 처음 10개의 관측값을 출력하세요.
  • people_df DataFrame의 행 개수를 세세요.
  • people_df DataFrame에는 몇 개의 열이 있으며, 그 열 이름은 무엇인가요?