1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. pandasで効率よくデータを取り込む

Connected

Bài tập

SQL で列を選択する

データセットには、分析に不要な列が含まれていることがあります。data.db の weather テーブルもその一例です。標高のように、すべての観測が同じ場所で行われたため冗長なものもあれば、関心のない変数を含むものもあります。データベースエンジンを作成したら、日付と気温の列だけを SELECT するクエリを書き、両方を read_sql() に渡して、最高気温と最低気温の読み取り値からデータフレームを作成します。

pandas は pd として読み込まれており、create_engine() は sqlalchemy からインポート済みです。

Note: SQL チェッカーは列の位置にとても厳密で、指定された順序でフィールドが選択されることを期待します。

Hướng dẫn

100 XP
  • data.db 用のデータベースエンジンを作成します。
  • weather テーブルから date、tmax、tmin 列を SELECT する SQL クエリを書きます。
  • クエリとエンジンを read_sql() に渡してデータフレームを作成し、結果のデータフレームを temperatures に代入します。