1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Vytvoření booleovského sloupce

Představ si, že modeluješ otázku ano/ne: mělo letadlo zpoždění? Tvoje data ale obsahují zpoždění příletů v minutách. Budeš proto muset vytvořit booleovský sloupec, který označí, zda měl daný let zpoždění, nebo ne.

Pokyny

100 XP
  • Pomocí metody .withColumn() vytvoř sloupec is_late. Tento sloupec se rovná výrazu model_data.arr_delay > 0.
  • Převeď tento sloupec na celé číslo, abys ho mohl/a použít v modelu, a pojmenuj ho label (to je výchozí název pro cílovou proměnnou ve Sparku pro strojové učení).
  • Odfiltruj chybějící hodnoty (tato část je již hotová).