CommencerCommencer gratuitement

Opérations sur les colonnes : création et renommage de colonnes

Le jeu de données census n’affiche pas encore tout ce que vous souhaitez. Créons une nouvelle colonne synthétique en ajoutant une colonne basée sur des colonnes existantes, puis renommons-la pour plus de clarté.

Rappelez-vous : une SparkSession appelée spark est déjà disponible dans votre environnement de travail !

Cet exercice fait partie du cours

Introduction à PySpark

Afficher le cours

Instructions

  • Créez une nouvelle colonne, "weekly_salary", en divisant la colonne "income" par 52.
  • Renommez la colonne "age" en "years".
  • Affichez le DataFrame résultant.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)

# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)

# Show the result
census_df_weekly.____
Modifier et exécuter le code