ComenzarEmpieza gratis

De cadena a entero

Ahora utilizarás el método .cast() que aprendiste en el ejercicio anterior para convertir todas las columnas apropiadas de tu DataFrame model_data en enteros.

Para convertir el tipo de una columna utilizando el método .cast(), puedes escribir un código como el siguiente:

dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Utiliza el método .withColumn() para .cast() las siguientes columnas para escribir "integer". Accede a las columnas utilizando la notación df.col:

    • model_data.arr_delay

    • model_data.air_time

    • model_data.month

    • model_data.plane_year

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)
Editar y ejecutar código