LoslegenKostenlos loslegen

Fluggesellschaft

In dieser Aufgabe erstellst du einen StringIndexer und einen OneHotEncoder, um die Spalte carrier zu kodieren. Dazu rufst du die Klassenkonstruktoren mit den Argumenten inputCol und outputCol auf.

inputCol ist der Name der Spalte, die du indizieren oder kodieren willst, und outputCol ist der Name der neuen Spalte, die der Transformer erstellen soll.

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen StringIndexer namens carr_indexer, indem du StringIndexer() mit inputCol="carrier" und outputCol="carrier_index" aufrufst.
  • Erstelle einen OneHotEncoder namens carr_encoder, indem du OneHotEncoder() mit inputCol="carrier_index" und outputCol="carrier_fact" aufrufst.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Code bearbeiten und ausführen