1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Pythonでの金融データのインポートと管理

Connected

अभ्यास

セクター別の時価総額の中央値

集計データ(Aggregate data)は、複数の観測値をまとめたデータのことです。動画で学んだように、.groupby() 関数は特定のカテゴリでデータを集計するのに便利です。

これまでに、時価総額データには大きな外れ値があることを確認しました。各セクターの企業価値をより頑健に要約するために、セクター別の時価総額の中央値を計算します。pandas は pd、matplotlib.pyplot は plt としてインポート済みで、NYSE(ニューヨーク証券取引所)の上場銘柄は DataFrame nyse としてワークスペースに用意されています。

निर्देश

100 XP
  • .info() を使って nyse を確認します。
  • ブロードキャストと .div() を用いて、時価総額を百万USD単位にした新しい列 market_cap_m を作成します。
  • .drop() で列 'Market Capitalization' を除外します。
  • .groupby() を nyse に適用し、'Sector' をグループ化の列として指定します。
  • market_cap_m 列の中央値を計算し、median_mcap_by_sector として保存します。
  • 結果を横向きの棒グラフで描画し、タイトルを 'NYSE - Median Market Capitalization' にします。plt.xlabel() に 'USD mn' を指定してラベルを追加します。
  • 結果を表示します。