De cadena a entero
Ahora utilizarás el método .cast() que aprendiste en el ejercicio anterior para convertir todas las columnas apropiadas de tu DataFrame model_data en enteros.
Para convertir el tipo de una columna utilizando el método .cast(), puedes escribir un código como el siguiente:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
Utiliza el método
.withColumn()para.cast()las siguientes columnas para escribir"integer". Accede a las columnas utilizando la notacióndf.col:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)