1. Learn
  2. /
  3. Courses
  4. /
  5. Wprowadzenie do importowania danych w Pythonie

Connected

Exercise

Importowanie plików płaskich jako DataFrame z użyciem pandas (2)

W poprzednim ćwiczeniu udało ci się zaimportować pliki płaskie do DataFrame biblioteki pandas. Dodatkową zaletą jest to, że można wtedy w prosty sposób uzyskać odpowiadającą tablicę numpy – wystarczy skorzystać z metody .to_numpy(). Teraz masz szansę to wypróbować na zbiorze danych MNIST, dostępnym jako digits.csv.

Funkcja pd.read_csv() przyjmuje kilka argumentów, które przydadzą ci się w tym ćwiczeniu:

  • nrows pozwala określić, ile wierszy wczytać z pliku. Na przykład nrows=10 zaimportuje tylko pierwsze 10 wierszy.
  • header przyjmuje numery wierszy, które mają być użyte jako etykiety kolumn, i wyznacza początek danych. Jeśli plik nie zawiera wiersza nagłówkowego, możesz ustawić header=None – wtedy pandas automatycznie przypisze kolumnom etykiety całkowitoliczbowe zaczynające się od 0 (np. 0, 1, 2, …).

Instructions

100 XP
  • Zaimportuj pierwsze 5 wierszy pliku do DataFrame za pomocą funkcji pd.read_csv() i przypisz wynik do zmiennej data. Skorzystaj z argumentów nrows i header. Pamiętaj, że plik nie zawiera wiersza nagłówkowego.
  • Utwórz tablicę numpy na podstawie DataFrame przechowywanego w data i przypisz ją do zmiennej data_array.
  • Wykonaj print(type(data_array)), aby wyświetlić typ danych zmiennej data_array.