Exemple de when()
La clause when() vous permet de modifier un DataFrame de manière conditionnelle en fonction de son contenu. Vous allez modifier notre DataFrame voter_df pour ajouter un nombre aléatoire à tout électeur dont la fonction est "Councilmember".
Le DataFrame voter_df est défini et disponible. La bibliothèque pyspark.sql.functions est importée sous le nom F. Vous pouvez utiliser F.rand() pour générer une valeur aléatoire.
Cet exercice fait partie du cours
<cours>Nettoyer des données avec PySpark</cours>Instructions de l’exercice
- Ajoutez une colonne à
voter_dfnomméerandom_valcontenant le résultat de la méthodeF.rand()pour tout électeur ayant le titre Councilmember. - Affichez quelques lignes du DataFrame pour vérifier que la clause
.when()a fonctionné.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____