Créer une nouvelle colonne
Dans le dernier exercice, vous avez converti la colonne plane_year
en un nombre entier. Cette colonne indique l'année de fabrication de chaque avion. Cependant, votre modèle utilisera l' âge de l'avion, qui est légèrement différent de l'année de fabrication !
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
- Créez la colonne
plane_age
en utilisant la méthode.withColumn()
et en soustrayant l'année de fabrication (colonneplane_year
) de l'année (colonneyear
) du vol.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the column plane_age
model_data = model_data.withColumn("plane_age", ____.____ - ____.____)