De string para inteiro
Agora você vai usar o método .cast()
que aprendeu no exercício anterior para converter todas as colunas aplicáveis do seu DataFrame model_data
em inteiros!
Para converter o tipo de uma coluna usando o método .cast()
, você pode escrever um código como este:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
Use o método
.withColumn()
e.cast()
para converter as seguintes colunas no tipo"integer"
. Acesse as colunas usando a notaçãodf.col
:model_data.arr_delay
model_data.air_time
model_data.month
model_data.plane_year
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)