ComeçarComece de graça

Exemplo de when()

A cláusula when() permite que você modifique condicionalmente um Data Frame com base em seu conteúdo. Você deverá modificar nosso DataFrame voter_df para adicionar um número aleatório a qualquer membro votante definido como "Councilmember".

O DataFrame voter_df está definido e disponível para você. A biblioteca pyspark.sql.functions está disponível como F.. Você pode usar F.rand() para gerar o valor aleatório.

Este exercício faz parte do curso

Limpeza de dados com o PySpark

Ver curso

Instruções do exercício

  • Adicione uma coluna a voter_df chamada random_val com os resultados do método F.rand() para qualquer eleitor com o título Councilmember.
  • Mostre algumas das linhas do DataFrame, observando se a cláusula .when() funcionou.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Editar e executar o código