Fluggesellschaft
In dieser Aufgabe erstellst du einen StringIndexer und einen OneHotEncoder, um die Spalte carrier zu kodieren. Dazu rufst du die Klassenkonstruktoren mit den Argumenten inputCol und outputCol auf.
inputCol ist der Name der Spalte, die du indizieren oder kodieren willst, und outputCol ist der Name der neuen Spalte, die der Transformer erstellen soll.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in PySpark</Kurs>Übungsanweisungen
- Erstelle einen
StringIndexernamenscarr_indexer, indem duStringIndexer()mitinputCol="carrier"undoutputCol="carrier_index"aufrufst. - Erstelle einen
OneHotEncodernamenscarr_encoder, indem duOneHotEncoder()mitinputCol="carrier_index"undoutputCol="carrier_fact"aufrufst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)