1. Learn
  2. /
  3. Курси
  4. /
  5. Набір інструментів Python

Connected

вправа

Створення ітератора для завантаження даних частинами (5)

Фінішна пряма. Ви опанували чимало прийомів обробки великих наборів даних частинами. У цій заключній вправі ви зберете весь код для обробки даних у одній функції, щоб надалі перевикористовувати його без повторного написання.

Ви визначите функцію plot_pop(), яка приймає два аргументи: назву файла для обробки та код країни для рядків, які слід опрацювати в наборі даних.

Оскільки весь попередній код з попередніх вправ буде зібрано в plot_pop(), виклик цієї функції вже виконує таке:

  • Завантажує файл частинами,
  • Створює новий стовпець із значеннями міського населення, та
  • Будує графік даних про міське населення.

Це чималий обсяг роботи, проте тепер функцію зручно застосовувати щоразу, коли потрібно обробити та візуалізувати будь-який файл і код країни!

Ви використаєте дані з 'ind_pop_data.csv', доступного у вашому поточному каталозі. Пакети pandas і matplotlib.pyplot вже імпортовано як pd і plt відповідно.

Після завершення погляньте на графіки та оцініть нові навички, які ви здобули. На цьому все не закінчується! Якщо вам сподобалося працювати з цими даними, продовжуйте дослідження за допомогою попередньо обробленої версії на Kaggle.

Інструкції

100 XP
  • Визначте функцію plot_pop() з двома аргументами: перший — filename (файл для обробки), другий — country_code (код країни, який оброблятиметься в наборі даних).
  • Викличте plot_pop() для обробки даних з кодом країни 'CEB' у файлі 'ind_pop_data.csv'.
  • Викличте plot_pop() для обробки даних з кодом країни 'ARB' у файлі 'ind_pop_data.csv'.