Créer une nouvelle colonne
Dans le dernier exercice, vous avez converti la colonne plane_year en un nombre entier. Cette colonne indique l'année de fabrication de chaque avion. Cependant, votre modèle utilisera l' âge de l'avion, qui est légèrement différent de l'année de fabrication !
Cet exercice fait partie du cours
<cours>Introduction à PySpark</cours>Instructions de l’exercice
- Créez la colonne
plane_ageen utilisant la méthode.withColumn()et en soustrayant l'année de fabrication (colonneplane_year) de l'année (colonneyear) du vol.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create the column plane_age
model_data = model_data.withColumn("plane_age", ____.____ - ____.____)