1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Tworzenie cech dzień tygodnia

Możemy tworzyć cechy datetime, aby dostarczyć jeszcze więcej informacji naszym modelom nieliniowym. Większość danych finansowych zawiera znaczniki czasu, które niosą ze sobą wiele informacji – rok, miesiąc, dzień, a czasem godzinę, minutę i sekundę. Możemy też wyodrębnić dzień tygodnia, kwartał roku czy czas, jaki upłynął od jakiegoś zdarzenia (np. publikacji wyników finansowych).

W tym ćwiczeniu wyodrębnimy tylko dzień tygodnia, ponieważ nasz zbiór danych nie obejmuje zbyt długiego okresu. Właściwość dayofweek z indeksu datetime biblioteki pandas pozwoli nam uzyskać dzień tygodnia. Następnie zastosujemy kodowanie zero-jedynkowe za pomocą funkcji get_dummies() z biblioteki pandas. Tworzy ona osobną kolumnę dla każdego dnia tygodnia z wartościami binarnymi (0 lub 1). Pierwszą kolumnę pomijamy, ponieważ można ją wywnioskować z pozostałych.

Instrukcje

100 XP
  • Użyj właściwości dayofweek z indeksu lng_df, aby uzyskać dni tygodnia.
  • Zastosuj funkcję get_dummies na zmiennej zawierającej dni tygodnia, ustawiając prefiks 'weekday'.
  • Ustaw indeks zmiennej days_of_week taki sam jak indeks lng_df, aby móc połączyć oba DataFrame'y.
  • Połącz DataFrame'y lng_df i days_of_week w jeden DataFrame za pomocą funkcji concat.