1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie danych w wierszu poleceń

Connected

ćwiczenie

Przetwarzanie danych za pomocą csvkit

Po zebraniu zbioru danych trzeba jeszcze przetworzyć i oczyścić dane przed przystąpieniem do zaawansowanych analiz, takich jak modelowanie predykcyjne. W tym ćwiczeniu podsumowującym wykorzystasz różne polecenia csvkit do typowych operacji przetwarzania i czyszczenia danych.

Plik Excel Spotify_201809_201810.xlsx zawiera dwa arkusze (zakładki) o nazwach Spotify201809 i Spotify201810. Najpierw podzielisz plik Excel na osobne arkusze, podejrzysz statystyki podsumowujące, usuniesz niektóre kolumny, a następnie połączysz oba arkusze z powrotem w jeden plik CSV gotowy do dalszej analizy.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Przekonwertuj arkusz Spotify201809 do osobnego pliku CSV o nazwie Spotify201809.csv.