1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 데이터 정제하기

Connected

연습 문제

When / Otherwise

이번 과제는 이전과 비슷하지만, 이제는 유권자의 직위에 따라 여러 값을 추가하려고 합니다. Councilmember로 정의된 투표 구성원에게 무작위 숫자를 더하도록 voter_df DataFrame을 수정하세요. Mayor는 2를 사용하고, 다른 모든 직위는 0을 사용하세요.

voter_df DataFrame은 이미 정의되어 있으며 사용할 수 있습니다. pyspark.sql.functions 라이브러리는 F.로 제공됩니다. 난수는 F.rand()로 생성할 수 있어요.

지침

100 XP
  • 직함이 Councilmember인 모든 유권자에 대해 F.rand() 메서드의 결과로 random_val이라는 열을 voter_df에 추가하세요. Mayor의 경우 random_val을 2로 설정하세요. 그 외 다른 직함은 0으로 설정하세요.
  • 해당 절이 제대로 동작했는지 확인할 수 있도록 일부 DataFrame 행을 출력하세요.
  • .filter 절을 사용해 random_val에서 0을 찾으세요.