String naar integer
Nu ga je de methode .cast() gebruiken die je in de vorige oefening hebt geleerd om alle relevante kolommen in je DataFrame model_data naar integers te converteren!
Om het type van een kolom te converteren met de methode .cast(), kun je code schrijven zoals:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Deze oefening maakt deel uit van de cursus
Basis van PySpark
Oefeninstructies
- Gebruik de methode
.withColumn()om de volgende kolommen met.cast()om te zetten naar type"integer". Benader de kolommen met de notatiedf.col:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)