1. 학습
  2. /
  3. 강의
  4. /
  5. Python ツールボックス

Connected

연습 문제

イテレータを書いてデータをチャンク読み込みする (3)

これまでに、データをチャンク単位で読み込んで処理することに慣れてきたと思います。ここでは、DataFrame に列を追加して、もう一歩スキルを伸ばしましょう。

前の演習のコードから始めて、先に作成したタプルのリストを使い、新しい列 'Total Urban Population' の値をリスト内包表記で作成します。前の演習を思い出すと、各タプルの第1要素と第2要素は、それぞれ列 'Total Population' と 'Urban population (% of total)' の値でした。したがって、新しい列 'Total Urban Population' の値は、各タプルの第1要素と第2要素の積になります。さらに、第2要素はパーセント値なので、結果全体を 100 で割るか、0.01 を掛ける必要があります。

また、この新しい列のデータを使って、都市人口データの可視化を作成します。

パッケージ pandas と matplotlib.pyplot は、それぞれ pd と plt としてインポート済みです。

지침

100 XP
  • リスト内包表記を使って、pops_list から新しい列 'Total Urban Population' 用の値のリストを生成してください。出力式 は、pops_list の各タプルにおける第1要素と第2要素の積にしてください。第2要素はパーセント値なので、結果に 0.01 を掛けるか、100 で割る必要があります。さらに、列 'Total Urban Population' は整数のみを取るようにします。そのため、出力式 を int() で整数にキャストしてください。
  • x軸に 'Year' 列、y軸に 'Total Urban Population' 列の値を用いた scatter プロットを作成してください。