Opérations sur les colonnes : création et renommage de colonnes
Le jeu de données census n’affiche pas encore tout ce que vous souhaitez. Créons une nouvelle colonne synthétique en ajoutant une colonne basée sur des colonnes existantes, puis renommons-la pour plus de clarté.
Rappelez-vous : une SparkSession appelée spark est déjà disponible dans votre environnement de travail !
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
- Créez une nouvelle colonne,
"weekly_salary", en divisant la colonne"income"par 52. - Renommez la colonne
"age"en"years". - Affichez le DataFrame résultant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____