De string para inteiro
Agora você vai usar o método .cast() que aprendeu no exercício anterior para converter todas as colunas aplicáveis do seu DataFrame model_data em inteiros!
Para converter o tipo de uma coluna usando o método .cast(), você pode escrever um código como este:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
Use o método
.withColumn()e.cast()para converter as seguintes colunas no tipo"integer". Acesse as colunas usando a notaçãodf.col:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)