Aan de slagGa gratis aan de slag

Carrier

In deze oefening maak je een StringIndexer en een OneHotEncoder om de kolom carrier te coderen. Hiervoor roep je de klassestructors aan met de argumenten inputCol en outputCol.

De inputCol is de naam van de kolom die je wilt indexeren of encoderen, en de outputCol is de naam van de nieuwe kolom die de Transformer moet aanmaken.

Deze oefening maakt deel uit van de cursus

Basis van PySpark

Cursus bekijken

Oefeninstructies

  • Maak een StringIndexer met de naam carr_indexer door StringIndexer() aan te roepen met inputCol="carrier" en outputCol="carrier_index".
  • Maak een OneHotEncoder met de naam carr_encoder door OneHotEncoder() aan te roepen met inputCol="carrier_index" en outputCol="carrier_fact".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Code bewerken en uitvoeren