LoslegenKostenlos starten

Fluggesellschaft

In dieser Aufgabe erstellst du einen StringIndexer und einen OneHotEncoder, um die Spalte carrier zu kodieren. Dazu rufst du die Klassenkonstruktoren mit den Argumenten inputCol und outputCol auf.

inputCol ist der Name der Spalte, die du indizieren oder kodieren willst, und outputCol ist der Name der neuen Spalte, die der Transformer erstellen soll.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle einen StringIndexer namens carr_indexer, indem du StringIndexer() mit inputCol="carrier" und outputCol="carrier_index" aufrufst.
  • Erstelle einen OneHotEncoder namens carr_encoder, indem du OneHotEncoder() mit inputCol="carrier_index" und outputCol="carrier_fact" aufrufst.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Code bearbeiten und ausführen