1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Streamlined Data Ingestion with pandas

Connected

cvičení

Načtení části tabulky

Tabulky určené ke čtení lidmi často obsahují více datových sad – například malá firma může mít v jednom listu sešitu zásoby rozdělené do tabulek podle typu produktu. I strukturovaná data mohou mít záhlaví s metadaty, jako je tomu u dat z průzkumu New Developer Survey. Metadata jsou sice užitečná, ale do dataframu je nechceme. Pomocí parametru skiprows funkce read_excel() načteš pouze samotná data. Zároveň vytvoříš řetězec, který předáš parametru usecols, a získáš jen sloupce AD a AW až BA – ty obsahují informace o pracovních cílech do budoucna.

pandas je naimportován jako pd.

Pokyny

100 XP
  • Vytvoř řetězec col_string, který říká pandas, aby načetl sloupec AD a rozsah AW až BA.
  • Načti soubor fcc_survey_headers.xlsx – nastav skiprows a usecols tak, aby se přeskočily první dva řádky s metadaty a načetly se pouze sloupce uvedené v col_string.
  • Zobraz názvy vybraných sloupců ve výsledném dataframu.