exemple when()
La clause when()
vous permet de modifier conditionnellement un cadre de données en fonction de son contenu. Vous devrez modifier notre DataFrame voter_df
pour ajouter un nombre aléatoire à tout membre votant défini comme "membre du conseil".
Le DataFrame voter_df
est défini et mis à votre disposition. La bibliothèque pyspark.sql.functions
est disponible sous la forme de F.
. Vous pouvez utiliser F.rand()
pour générer une valeur aléatoire.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Ajoutez une colonne à
voter_df
nomméerandom_val
avec les résultats de la méthodeF.rand()
pour tout électeur ayant le titre de membre du conseil. - Affichez quelques lignes du DataFrame, en notant si la clause
.when()
a fonctionné.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____