Operazioni sulle colonne - creazione e rinomina delle colonne
Il dataset census non mostra ancora proprio tutto quello che ti serve. Creiamo una nuova colonna sintetica aggiungendo una colonna basata su quelle esistenti e rinominiamola per maggiore chiarezza.
Ricorda: nel tuo workspace è già disponibile una SparkSession chiamata spark!
Questo esercizio fa parte del corso
Introduzione a PySpark
Istruzioni dell'esercizio
- Crea una nuova colonna,
"weekly_salary", dividendo la colonna"income"per 52. - Rinomina la colonna
"age"in"years". - Mostra il DataFrame risultante.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____