Chaîne vers entier
Vous allez maintenant utiliser la méthode .cast()
que vous avez apprise dans l'exercice précédent pour convertir toutes les colonnes appropriées de votre DataFrame model_data
en nombres entiers !
Pour convertir le type d'une colonne à l'aide de la méthode .cast()
, vous pouvez écrire le code suivant :
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
Utilisez la méthode
.withColumn()
pour.cast()
les colonnes suivantes pour taper"integer"
. Accédez aux colonnes en utilisant la notationdf.col
:model_data.arr_delay
model_data.air_time
model_data.month
model_data.plane_year
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)