1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Uczenie maszynowe z PySpark

Connected

แบบฝึกหัด

Model czasu lotu: etapy potoku

Stworzysz etapy potoku dla modelu czasu trwania lotów. Użyjesz ich w następnym ćwiczeniu, aby zbudować potok i wytrenować model regresji.

Klasy StringIndexer, OneHotEncoder, VectorAssembler oraz LinearRegression są już zaimportowane.

คำแนะนำ

100 XP
  • Utwórz indekser, który przekształci kolumnę 'org' na indeksowaną kolumnę o nazwie 'org_idx'.
  • Utwórz enkoder one-hot, który przekształci kolumny 'org_idx' i 'dow' na kolumny ze zmiennymi zero-jedynkowymi o nazwach 'org_dummy' i 'dow_dummy'.
  • Utwórz assembler, który połączy kolumnę 'km' z dwoma kolumnami zmiennych zero-jedynkowych. Kolumna wyjściowa powinna nazywać się 'features'.
  • Utwórz obiekt regresji liniowej do przewidywania czasu lotu.

Warto zajrzeć do slajdów z lekcji w panelu Slajdy obok IPython Shell.