1. Nauka
  2. /
  3. Kursy
  4. /
  5. Podstawy PySpark

Connected

ćwiczenie

Łańcuch znaków na liczbę całkowitą

Teraz użyjesz metody .cast(), której nauczyłeś się w poprzednim ćwiczeniu, aby przekonwertować odpowiednie kolumny w ramce danych model_data na liczby całkowite!

Aby zmienić typ kolumny za pomocą metody .cast(), możesz napisać kod podobny do poniższego:

dataframe = dataframe.withColumn("col", dataframe.col.cast("new_type"))

Instrukcje

100 XP
  • Użyj metody .withColumn(), aby wywołać .cast() na następujących kolumnach i przekonwertować je na typ "integer". Do kolumn odwołuj się za pomocą notacji df.col:
    • model_data.arr_delay
    • model_data.air_time
    • model_data.month
    • model_data.plane_year