Exemple de when()
La clause when() vous permet de modifier un DataFrame de manière conditionnelle en fonction de son contenu. Vous allez modifier notre DataFrame voter_df pour ajouter un nombre aléatoire à tout électeur dont la fonction est "Councilmember".
Le DataFrame voter_df est défini et disponible. La bibliothèque pyspark.sql.functions est importée sous le nom F. Vous pouvez utiliser F.rand() pour générer une valeur aléatoire.
Cet exercice fait partie du cours
Nettoyer des données avec PySpark
Instructions
- Ajoutez une colonne à
voter_dfnomméerandom_valcontenant le résultat de la méthodeF.rand()pour tout électeur ayant le titre Councilmember. - Affichez quelques lignes du DataFrame pour vérifier que la clause
.when()a fonctionné.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____