1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonでデータ可視化を磨く

Connected

演習

最もマーケットに優しい州はどこ?

ファーマーズマーケットのデータを探索していると、州レベルに集計したらどんなパターンが見えるのか気になりました。州によってマーケットに優しいところとそうでないところがあるのでしょうか。これを調べるため、データを州ごとにグループ化し、マーケット数(log_markets)と州の人口(log_pop)を対数変換した値を計算します。

markets_and_pop = (markets
    .groupby('state', as_index = False)
    .agg({
       'name': lambda d: log(len(d)),
       'state_pop': lambda d: log(d.iloc[0]) })
    .rename(columns = {
        'name': 'log_markets', 
        'state_pop': 'log_pop' }))

可視化には、マーケット数と人口数の「通常の」関係性を把握するために回帰プロットを使い、興味深い外れ値を素早く見つけるためにテキスト付きの散布図を組み合わせることにしました。

指示

100 XP
  • markets_and_pop DataFrame の各行を反復処理してください。
  • 散布図の各点のそばにアノテーションを配置してください。
  • アノテーションの文字サイズを 10 pt に下げてください。