1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

cvičení

Jednotné formáty dat

Poté, co jsi sjednotil/a měny u různých výší účtů, chceš přidat do analýzy i časový rozměr a podívat se, jak zákazníci investovali své prostředky v závislosti na velikosti účtu v jednotlivých letech. Sloupec account_opened obsahuje informaci o tom, kdy zákazníci otevřeli své účty, a hodí se jako základ pro segmentaci aktivity zákazníků a jejich investic v čase.

Protože však tato data pocházejí z více zdrojů, je potřeba zajistit, aby všechna data byla ve stejném formátu. Uděláš to tak, že tento sloupec převedeš na objekt datetime — formát se přitom odvodí automaticky a případně chybné záznamy se nastaví jako chybějící hodnoty. DataFrame banking je dostupný v prostředí a pandas byl importován jako pd.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vypiš záhlaví sloupce account_opened z DataFramu banking a prohlédni si různé výsledky.