1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでデータ可視化を磨く

Connected

演習

信頼区間に注釈を付ける

大気汚染データでの皆さんのデータサイエンスの成果は伝説的で、今やオハイオ州シンシナティとインディアナ州インディアナポリスの2都市からオファーを検討しています。両都市の SO2 濃度に有意な差があるか、さらに言えばどちらの都市のほうが低いのかを確認したいと考えています。そこで、複数年にわたる両都市の SO2 値の差(インディアナポリス − シンシナティ、diffs_by_year で提供)を調べることにしました。

都市間に有意差があることを示す p 値だけを表示するのではなく、差の 95% 信頼区間(lower 列と upper 列)を見ることにします。これにより、年ごとの傾向とともに差の大きさも確認できます。

指示

100 XP
  • 信頼区間の開始・終了の限界(lower 列と upper 列)を plt.hlines() に渡してください。
  • 区間の太さを 5 に設定します。
  • 差が 0 を表す垂直線を plt.axvline() で描画します。
  • 帰無線(null line)を目立たせるため、色は 'orangered' にします。