1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Dopravce

V tomto cvičení vytvoříš StringIndexer a OneHotEncoder pro zakódování sloupce carrier. K tomu zavoláš konstruktory těchto tříd s argumenty inputCol a outputCol.

inputCol je název sloupce, který chceš indexovat nebo zakódovat, a outputCol je název nového sloupce, který má Transformer vytvořit.

Pokyny

100 XP
  • Vytvoř StringIndexer s názvem carr_indexer voláním StringIndexer() s argumenty inputCol="carrier" a outputCol="carrier_index".
  • Vytvoř OneHotEncoder s názvem carr_encoder voláním OneHotEncoder() s argumenty inputCol="carrier_index" a outputCol="carrier_fact".