CommencerCommencer gratuitement

Exemple de when()

La clause when() vous permet de modifier un DataFrame de manière conditionnelle en fonction de son contenu. Vous allez modifier notre DataFrame voter_df pour ajouter un nombre aléatoire à tout électeur dont la fonction est "Councilmember".

Le DataFrame voter_df est défini et disponible. La bibliothèque pyspark.sql.functions est importée sous le nom F. Vous pouvez utiliser F.rand() pour générer une valeur aléatoire.

Cet exercice fait partie du cours

Nettoyer des données avec PySpark

Afficher le cours

Instructions

  • Ajoutez une colonne à voter_df nommée random_val contenant le résultat de la méthode F.rand() pour tout électeur ayant le titre Councilmember.
  • Affichez quelques lignes du DataFrame pour vérifier que la clause .when() a fonctionné.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Modifier et exécuter le code