Chaîne vers entier
Vous allez maintenant utiliser la méthode .cast() que vous avez apprise dans l'exercice précédent pour convertir toutes les colonnes appropriées de votre DataFrame model_data en nombres entiers !
Pour convertir le type d'une colonne à l'aide de la méthode .cast(), vous pouvez écrire le code suivant :
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
Utilisez la méthode
.withColumn()pour.cast()les colonnes suivantes pour taper"integer". Accédez aux colonnes en utilisant la notationdf.col:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)