Carrier
In deze oefening maak je een StringIndexer en een OneHotEncoder om de kolom carrier te coderen. Hiervoor roep je de klassestructors aan met de argumenten inputCol en outputCol.
De inputCol is de naam van de kolom die je wilt indexeren of encoderen, en de outputCol is de naam van de nieuwe kolom die de Transformer moet aanmaken.
Deze oefening maakt deel uit van de cursus
Basis van PySpark
Oefeninstructies
- Maak een
StringIndexermet de naamcarr_indexerdoorStringIndexer()aan te roepen metinputCol="carrier"enoutputCol="carrier_index". - Maak een
OneHotEncodermet de naamcarr_encoderdoorOneHotEncoder()aan te roepen metinputCol="carrier_index"enoutputCol="carrier_fact".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)