1. Обучение
  2. /
  3. Курса
  4. /
  5. Uczenie maszynowe z PySpark

Connected

упражнение

Model czasu lotu: model potokowy

Czas połączyć te etapy w jeden potok.

Zbudujesz potok, a następnie wytrenujesz go na danych treningowych. Każdy etap potoku zostanie zastosowany do danych treningowych po kolei. Żaden etap nie będzie miał dostępu do danych testowych – nie dojdzie do żadnego wycieku danych!

Po wytrenowaniu całego potoku użyjesz go do generowania predykcji na danych testowych.

Dane są dostępne jako flights – zbiór losowo podzielony na flights_train i flights_test.

Инструкции

100 XP
  • Zaimportuj klasę służącą do tworzenia potoku.
  • Utwórz obiekt potoku i podaj etapy indexer, onehot, assembler oraz regression w tej kolejności.
  • Wytrenuj potok na danych treningowych.
  • Wygeneruj predykcje na danych testowych.