Aan de slagGa gratis aan de slag

Kolombewerkingen - kolommen maken en hernoemen

De census-gegevensset laat nog niet helemaal zien wat je wilt. Laten we een nieuwe synthetische kolom maken door een kolom toe te voegen op basis van bestaande kolommen, en geef die een duidelijke naam.

Vergeet niet: er is al een SparkSession met de naam spark in je werkruimte!

Deze oefening maakt deel uit van de cursus

Introductie tot PySpark

Cursus bekijken

Oefeninstructies

  • Maak een nieuwe kolom, "weekly_salary", door de kolom "income" te delen door 52.
  • Hernoem de kolom "age" naar "years".
  • Laat de resulterende DataFrame zien.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)

# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)

# Show the result
census_df_weekly.____
Code bewerken en uitvoeren