1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

Cvičení

Datumové příznaky

Základní příznaky z numerických proměnných máš za sebou. Teď je čas vytvořit příznaky z data a času. Procvičíš si to na vzorku dat ze soutěže Taxi Fare Prediction na Kaggle. Data zachycují informace o jízdách taxíkem a cílem je předpovědět cenu každé jízdy.

Tvým úkolem je vygenerovat datumové příznaky z údaje o čase nástupu do taxíku. Pamatuj, že nové příznaky je lepší vytvářet zároveň pro trénovací i testovací data. Po vytvoření příznaků data opět rozdělíš zpět na DataFrame train a test – k tomu slouží metoda isin() z knihovny pandas.

DataFrames train a test jsou v tvém pracovním prostředí již k dispozici.

Pokyny

100 XP
  • Spoj DataFrames train a test do jednoho DataFrame taxi.
  • Převeď sloupec "pickup_datetime" na objekt typu datetime.
  • Z sloupce "pickup_datetime" vytvoř příznaky pro den v týdnu (pomocí atributu .dayofweek) a hodinu (pomocí atributu .hour).