Exemplo de when()
A cláusula when()
permite que você modifique condicionalmente um Data Frame com base em seu conteúdo. Você deverá modificar nosso DataFrame voter_df
para adicionar um número aleatório a qualquer membro votante definido como "Councilmember".
O DataFrame voter_df
está definido e disponível para você. A biblioteca pyspark.sql.functions
está disponível como F.
. Você pode usar F.rand()
para gerar o valor aleatório.
Este exercício faz parte do curso
Limpeza de dados com o PySpark
Instruções do exercício
- Adicione uma coluna a
voter_df
chamadarandom_val
com os resultados do métodoF.rand()
para qualquer eleitor com o título Councilmember. - Mostre algumas das linhas do DataFrame, observando se a cláusula
.when()
funcionou.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____