Maak een nieuwe kolom
In de vorige oefening heb je de kolom plane_year omgezet naar een integer. Deze kolom bevat het jaar waarin elk vliegtuig is gebouwd. Je model gebruikt echter de leeftijd van de vliegtuigen, en dat is net iets anders dan het bouwjaar!
Deze oefening maakt deel uit van de cursus
Basis van PySpark
Oefeninstructies
- Maak de kolom
plane_agemet de methode.withColumn()en trek daarbij het bouwjaar (kolomplane_year) af van het jaar (kolomyear) van de vlucht.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the column plane_age
model_data = model_data.withColumn("plane_age", ____.____ - ____.____)