1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Podstawy PySpark

Connected

Exercise

Przewoźnik

W tym ćwiczeniu stworzysz StringIndexer oraz OneHotEncoder, aby zakodować kolumnę carrier. W tym celu wywołaj konstruktory klas z argumentami inputCol i outputCol.

inputCol to nazwa kolumny, którą chcesz zaindeksować lub zakodować, natomiast outputCol to nazwa nowej kolumny, którą powinien utworzyć Transformer.

Instrukcje

100 XP
  • Utwórz StringIndexer o nazwie carr_indexer, wywołując StringIndexer() z argumentami inputCol="carrier" i outputCol="carrier_index".
  • Utwórz OneHotEncoder o nazwie carr_encoder, wywołując OneHotEncoder() z argumentami inputCol="carrier_index" i outputCol="carrier_fact".