De cadena a entero
Ahora utilizarás el método .cast()
que aprendiste en el ejercicio anterior para convertir todas las columnas apropiadas de tu DataFrame model_data
en enteros.
Para convertir el tipo de una columna utilizando el método .cast()
, puedes escribir un código como el siguiente:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
Utiliza el método
.withColumn()
para.cast()
las siguientes columnas para escribir"integer"
. Accede a las columnas utilizando la notacióndf.col
:model_data.arr_delay
model_data.air_time
model_data.month
model_data.plane_year
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)