CommencerCommencez gratuitement

Créer une nouvelle colonne

Dans le dernier exercice, vous avez converti la colonne plane_year en un nombre entier. Cette colonne indique l'année de fabrication de chaque avion. Cependant, votre modèle utilisera l' âge de l'avion, qui est légèrement différent de l'année de fabrication !

Cet exercice fait partie du cours

<cours>Introduction à PySpark</cours>
Voir le cours

Instructions de l’exercice

  • Créez la colonne plane_age en utilisant la méthode .withColumn() et en soustrayant l'année de fabrication (colonne plane_year) de l'année (colonne year) du vol.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create the column plane_age
model_data = model_data.withColumn("plane_age", ____.____ - ____.____)
Modifier et exécuter le code