1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Data Processing in Shell

Connected

cvičení

Zpracování dat s csvkit

Jakmile máme dataset sestavený, je potřeba data před pokročilejšími analýzami, jako je prediktivní modelování, ještě zpracovat a vyčistit. V tomto závěrečném cvičení využijeme různé příkazy z csvkit pro běžné operace zpracování a čištění dat.

Soubor Spotify_201809_201810.xlsx obsahuje dva listy (záložky) s názvy Spotify201809 a Spotify201810. Nejprve rozdělíme Excel soubor na jednotlivé listy, prohlédneme si souhrnné statistiky, odebereme některé sloupce a pak oba listy opět spojíme do jednoho souboru csv, připraveného k další analýze.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Převeď list Spotify201809 do vlastního csv souboru s názvem Spotify201809.csv.