1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Importing Data in R

Connected

cvičení

Import dat ve formátu STATA pomocí haven

Teď se podíváme na datové soubory ve formátu STATA – k jejich načtení slouží funkce read_dta().

Pokud si prohlédneš výsledek volání read_dta(), všimneš si, že jeden sloupec bude načten jako vektor typu labelled – jde o ekvivalent datové struktury běžné v jiných statistických prostředích. Aby bylo možné s daty v R efektivně pracovat, je nejlepší tento typ převést na standardní třídu R. Pro převod proměnné třídy labelled na faktor použiješ funkci as_factor() z balíčku haven.

V tomto cvičení budeš pracovat s daty o ročních hodnotách dovozu a vývozu cukru – jak v USD, tak i v hmotnosti. Data najdeš na adrese: https://assets.datacamp.com/production/course_1478/datasets/trade.dta

Pokyny

100 XP
  • Načti datový soubor přímo z URL pomocí read_dta() a ulož ho jako sugar.
  • Vypište strukturu datasetu sugar. Sloupec Date má třídu labelled.
  • Převeď hodnoty ve sloupci Date datasetu sugar na datumový formát pomocí as.Date(as_factor(___)).
  • Vypiš strukturu sugar ještě jednou. Vypadá to teď lépe?