1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Tải một phần của bảng tính

Các bảng tính dành cho người đọc thường có nhiều bảng; ví dụ, một doanh nghiệp nhỏ có thể giữ một workbook kiểm kê với các bảng cho từng loại sản phẩm trên cùng một sheet. Ngay cả dữ liệu dạng bảng cũng có thể có các hàng tiêu đề chứa siêu dữ liệu, như dữ liệu Khảo sát Nhà phát triển Mới ở đây. Dù siêu dữ liệu hữu ích, chúng ta không muốn đưa nó vào dataframe. Bạn sẽ dùng từ khóa skiprows của read_excel() để chỉ lấy phần dữ liệu. Bạn cũng sẽ tạo một chuỗi để truyền vào usecols nhằm chỉ lấy cột AD và dải từ AW đến BA, liên quan đến mục tiêu công việc trong tương lai.

pandas đã được import là pd.

Hướng dẫn

100 XP
  • Tạo một chuỗi duy nhất, col_string, chỉ định rằng pandas sẽ tải cột AD và dải từ AW đến BA.
  • Tải fcc_survey_headers.xlsx', đặt skiprows và usecols để bỏ qua hai hàng siêu dữ liệu đầu tiên và chỉ lấy các cột trong col_string.
  • Xem tên các cột đã chọn trong dataframe kết quả.