Spaltenoperationen – Spalten erstellen und umbenennen
Der Datensatz census zeigt noch nicht alles, was du sehen möchtest. Lass uns eine neue synthetische Spalte erstellen, indem wir auf Basis vorhandener Spalten eine neue hinzufügen, und benennen sie zur besseren Verständlichkeit um.
Denke daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Erstelle die neue Spalte
"weekly_salary", indem du die Spalte"income"durch 52 teilst. - Benenne die Spalte
"age"in"years"um. - Zeige den resultierenden DataFrame an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____