Aan de slagGa gratis aan de slag

String naar integer

Nu ga je de methode .cast() gebruiken die je in de vorige oefening hebt geleerd om alle relevante kolommen in je DataFrame model_data naar integers te converteren!

Om het type van een kolom te converteren met de methode .cast(), kun je code schrijven zoals:

dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))

Deze oefening maakt deel uit van de cursus

Basis van PySpark

Cursus bekijken

Oefeninstructies

  • Gebruik de methode .withColumn() om de volgende kolommen met .cast() om te zetten naar type "integer". Benader de kolommen met de notatie df.col:
    • model_data.arr_delay
    • model_data.air_time
    • model_data.month
    • model_data.plane_year

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)
Code bewerken en uitvoeren