CommencerCommencer gratuitement

exemple when()

La clause when() vous permet de modifier conditionnellement un cadre de données en fonction de son contenu. Vous devrez modifier notre DataFrame voter_df pour ajouter un nombre aléatoire à tout membre votant défini comme "membre du conseil".

Le DataFrame voter_df est défini et mis à votre disposition. La bibliothèque pyspark.sql.functions est disponible sous la forme de F.. Vous pouvez utiliser F.rand() pour générer une valeur aléatoire.

Cet exercice fait partie du cours

Nettoyer des données avec PySpark

Afficher le cours

Instructions

  • Ajoutez une colonne à voter_df nommée random_val avec les résultats de la méthode F.rand() pour tout électeur ayant le titre de membre du conseil.
  • Affichez quelques lignes du DataFrame, en notant si la clause .when() a fonctionné.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Modifier et exécuter le code