1. Nauka
  2. /
  3. Kursy
  4. /
  5. Python średnio zaawansowany

Connected

ćwiczenie

CSV do DataFrame (1)

Tworzenie słownika i budowanie na jego podstawie DataFrame'u działa, ale nie jest zbyt wydajne. Co zrobić, gdy masz do czynienia z milionami obserwacji? W takich przypadkach dane są zazwyczaj dostępne w plikach o regularnej strukturze. Jednym z takich formatów jest plik CSV, czyli plik z wartościami oddzielonymi przecinkami (ang. comma-separated values).

Aby zaimportować dane z pliku CSV do Pythona jako DataFrame biblioteki Pandas, możesz użyć funkcji read_csv().

Przećwiczmy tę funkcję na tych samych danych o samochodach, co w poprzednich ćwiczeniach. Tym razem dane są jednak dostępne w pliku CSV o nazwie cars.csv. Plik znajduje się w bieżącym katalogu roboczym, więc ścieżka do niego to po prostu 'cars.csv'.

Instrukcje

100 XP
  • Aby zaimportować pliki CSV, nadal potrzebujesz pakietu pandas – zaimportuj go jako pd.
  • Użyj pd.read_csv(), aby zaimportować dane z pliku cars.csv jako DataFrame. Zapisz ten DataFrame jako cars.
  • Wyświetl cars. Czy wszystko wygląda poprawnie?