Fluggesellschaft
In dieser Aufgabe erstellst du einen StringIndexer
und einen OneHotEncoder
, um die Spalte carrier
zu kodieren. Dazu rufst du die Klassenkonstruktoren mit den Argumenten inputCol
und outputCol
auf.
inputCol
ist der Name der Spalte, die du indizieren oder kodieren willst, und outputCol
ist der Name der neuen Spalte, die der Transformer
erstellen soll.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Erstelle einen
StringIndexer
namenscarr_indexer
, indem duStringIndexer()
mitinputCol="carrier"
undoutputCol="carrier_index"
aufrufst. - Erstelle einen
OneHotEncoder
namenscarr_encoder
, indem duOneHotEncoder()
mitinputCol="carrier_index"
undoutputCol="carrier_fact"
aufrufst.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)