1. Learn
  2. /
  3. Курси
  4. /
  5. Набір інструментів Python

Connected

вправа

Написання ітератора для завантаження даних частинами (2)

У попередній вправі ви використовували read_csv(), щоб зчитувати фрагменти DataFrame з великого набору даних. У цій вправі ви зчитуватимете файл із більшим розміром фрагмента DataFrame, а потім опрацюєте дані з першого фрагмента.

Щоб опрацювати дані, ви створите інший DataFrame, що міститиме лише рядки для певної країни. Потім ви об'єднаєте за допомогою zip дві колонки з нового DataFrame — 'Total Population' та 'Urban population (% of total)'. Нарешті, ви створите список кортежів із zip-об'єкта, де кожен кортеж складається зі значення з кожної з двох згаданих колонок.

Ви використовуватимете дані з 'ind_pop_data.csv', доступного у вашому поточному каталозі. pandas імпортовано як pd.

Інструкції

100 XP
  • Використайте pd.read_csv(), щоб зчитати файл 'ind_pop_data.csv' частинами розміру 1000. Присвойте результат змінній urb_pop_reader.
  • Отримайте перший фрагмент DataFrame з ітерабельного об'єкта urb_pop_reader і присвойте його до df_urb_pop.
  • Виберіть лише ті рядки df_urb_pop, у яких 'CountryCode' дорівнює 'CEB'. Для цього порівняйте, чи df_urb_pop['CountryCode'] дорівнює 'CEB' у квадратних дужках у df_urb_pop[____].
  • Використовуючи zip(), об'єднайте колонки 'Total Population' та 'Urban population (% of total)' з df_pop_ceb. Присвойте отриманий zip-об'єкт змінній pops.