1. 学ぶ
  2. /
  3. コース
  4. /
  5. Zestaw narzędzi Pythona

Connected

演習

Pisanie iteratora do wczytywania danych fragmentami (5)

To ostatni etap. Wiesz już sporo o przetwarzaniu dużego zbioru danych fragment po fragmencie. W tym ostatnim ćwiczeniu umieścisz cały kod przetwarzający dane w jednej funkcji – dzięki temu będzie można go łatwo wielokrotnie używać bez przepisywania od nowa.

Zdefiniujesz funkcję plot_pop(), która przyjmuje dwa argumenty: nazwę pliku do przetworzenia oraz kod kraju identyfikujący wiersze, które chcesz przetworzyć w zbiorze danych.

Ponieważ cały kod napisany w poprzednich ćwiczeniach zostanie zawarty w plot_pop(), wywołanie tej funkcji automatycznie wykonuje następujące kroki:

  • Wczytywanie pliku fragment po fragmencie,
  • Tworzenie nowej kolumny z wartościami populacji miejskiej,
  • Rysowanie wykresu danych dotyczących populacji miejskiej.

To całkiem sporo pracy – ale teraz funkcja sprawia, że cały ten proces można łatwo powtórzyć dla dowolnego pliku i kodu kraju!

Do pracy wykorzystasz dane z pliku 'ind_pop_data.csv', dostępnego w bieżącym katalogu. Pakiety pandas i matplotlib.pyplot zostały zaimportowane odpowiednio jako pd i plt.

Po zakończeniu ćwiczenia zatrzymaj się chwilę, przyjrzyj się wykresom i zastanów nad nowymi umiejętnościami, które udało ci się zdobyć. To jeszcze nie koniec! Jeśli praca z tymi danymi sprawiła ci przyjemność, możesz kontynuować ich eksplorację, korzystając ze wstępnie przetworzonej wersji dostępnej na Kaggle.

指示

100 XP
  • Zdefiniuj funkcję plot_pop() przyjmującą dwa argumenty: filename – nazwa pliku do przetworzenia, oraz country_code – kod kraju, dla którego mają zostać przetworzone dane.
  • Wywołaj plot_pop(), aby przetworzyć dane dla kodu kraju 'CEB' z pliku 'ind_pop_data.csv'.
  • Wywołaj plot_pop(), aby przetworzyć dane dla kodu kraju 'ARB' z pliku 'ind_pop_data.csv'.