String zu Ganzzahl
Jetzt wendest du die Methode .cast() an, die du in der vorherigen Aufgabe gelernt hast, um alle entsprechenden Spalten deines DataFrame model_data in Ganzzahlen umzuwandeln!
Um den Typ einer Spalte mit der Methode .cast() zu konvertieren, kannst du folgenden Code schreiben:
dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))
Diese Übung ist Teil des Kurses
<Kurs>Einführung in PySpark</Kurs>Übungsanweisungen
Verwende die Methode
.withColumn(), um mit.cast()die folgenden Spalten in"integer"zu konvertieren. Greife auf die Spalten mit der Notationdf.colzu:model_data.arr_delaymodel_data.air_timemodel_data.monthmodel_data.plane_year
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Cast the columns to integers
model_data = model_data.withColumn("arr_delay", ____)
model_data = model_data.withColumn("air_time", ____)
model_data = model_data.withColumn("month", ____)
model_data = model_data.withColumn("plane_year", ____)