1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Chọn cột với SQL

Các tập dữ liệu có thể chứa những cột không cần thiết cho phân tích, như bảng weather trong data.db. Một số cột, chẳng hạn như độ cao (elevation), là dư thừa vì mọi quan sát đều diễn ra tại cùng một địa điểm; số khác thì chứa biến mà chúng ta không quan tâm. Sau khi tạo một database engine, bạn sẽ viết truy vấn để SELECT chỉ các cột ngày và nhiệt độ, rồi truyền cả hai cho read_sql() để tạo một dataframe gồm các giá trị nhiệt độ cao và thấp.

pandas đã được nạp với tên pd, và create_engine() đã được import từ sqlalchemy.

Lưu ý: Bộ kiểm tra SQL khá khắt khe về vị trí cột và mong đợi các trường được chọn theo đúng thứ tự chỉ định.

Hướng dẫn

100 XP
  • Tạo một database engine cho data.db.
  • Viết một truy vấn SQL SELECT các cột date, tmax và tmin từ bảng weather.
  • Tạo một dataframe bằng cách truyền truy vấn và engine vào read_sql() và gán dataframe thu được cho temperatures.