1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Spark SQL 입문

Connected

연습 문제

집계, 단계별로 살펴보기

점 표기법을 쓸지 SQL을 쓸지는 개인의 선호에 달려 있어요. 하지만 영상 연습에서 보셨듯이, SQL이 더 간단한 경우가 있습니다. 또한 영상 강의에서 시연한 것처럼, 점 표기법은 같은 열에 대해 두 번째 집계를 수행하면 이전 집계를 덮어써서 직관에 반하는 결과가 나올 수도 있어요. 영상에서 언급했듯이, pyspark의 agg 기본 문법은 한 번에 각 열에 대해 단일 집계만 수행할 수 있습니다.

다음 연습에서는 각 노선별 첫 출발 시각을 계산합니다.

첫 두 개의 쿼리는 일치합니다. 하지만 다음 두 개는 일치하지 않아요. 왜 그런지 설명할 수 있나요?

지침

100 XP
  • 빈칸을 채워서 첫 번째 명령어 쌍이 동일한 결과를 보여주도록 하세요.
  • 네 번째 결과인 result는 이전 줄을 순진하게 복제하려는 시도지만, 직관과 다르게 결과가 나옵니다. 어떻게 다른가요? 빈칸을 채워 result의 두 번째 열 이름을 출력하세요.