Spaltenoperationen – Spalten erstellen und umbenennen
Der Datensatz census zeigt noch nicht alles so, wie du es brauchst. Lass uns eine neue synthetische Spalte erstellen, indem wir eine neue Spalte aus vorhandenen Spalten ableiten, und sie zur besseren Verständlichkeit umbenennen.
Denk daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Erstelle eine neue Spalte
"weekly_salary", indem du die Spalte"income"durch 52 teilst. - Benenne die Spalte
"age"in"years"um. - Zeige das resultierende DataFrame an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____