ComeçarComece de graça

De string para inteiro

Agora você vai usar o método .cast() que aprendeu no exercício anterior para converter todas as colunas aplicáveis do seu DataFrame model_data em inteiros!

Para converter o tipo de uma coluna usando o método .cast(), você pode escrever um código como este:

dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))

Este exercício faz parte do curso

Introdução ao PySpark

Ver curso

Instruções do exercício

  • Use o método .withColumn() e .cast() para converter as seguintes colunas no tipo "integer". Acesse as colunas usando a notação df.col:

    • model_data.arr_delay

    • model_data.air_time

    • model_data.month

    • model_data.plane_year

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)
Editar e executar o código