1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

カスタムの真偽値を設定する

ブール型の列では、pandas は自動的に、"TRUE" や 1 を True、"FALSE" や 0 を False として認識します。一方で、アンケートなどのデータセットでは、"Yes" や "No" のように既定では認識されない値が使われることがあります。

練習として、New Developer Survey の一部のブール列はこの方式で符号化されています。ここでは、true_values と false_values 引数を使って、正しく解釈されるように設定します。

pandas は pd として読み込まれています。対象の列には欠損値がないと仮定してかまいません。

指示

100 XP
  • Excel ファイルを読み込み、真の値として "Yes"、偽の値として "No" を指定してください。