1. Учиться
  2. /
  3. Courses
  4. /
  5. PySpark로 데이터 정제하기

Connected

Exercise

when() 예시

when() 절을 사용하면 DataFrame의 내용에 따라 조건부로 값을 수정할 수 있어요. 여기서는 "Councilmember"로 지정된 유권자에게 임의의 숫자를 추가하도록 voter_df DataFrame을 수정해 보겠습니다.

voter_df DataFrame은 이미 정의되어 있고 사용할 수 있어요. pyspark.sql.functions 라이브러리는 F.로 제공되며, 무작위 값을 생성하려면 F.rand()를 사용할 수 있어요.

Инструкции

100 XP
  • 직함이 Councilmember인 유권자에 대해 F.rand() 결과를 담은 random_val 열을 voter_df에 추가하세요.
  • .when() 절이 제대로 동작했는지 확인할 수 있도록 DataFrame의 일부 행을 출력하세요.