Da stringa a intero
Ora userai il metodo .cast() che hai visto nell'esercizio precedente per convertire in interi tutte le colonne appropriate del tuo DataFrame model_data!
Per convertire il tipo di una colonna usando il metodo .cast(), puoi scrivere un codice come questo:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Usa il metodo
.withColumn()per.cast()le seguenti colonne al tipo"integer". Accedi alle colonne usando la notazionedf.col:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)