1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê bằng Python

Connected

Bài tập

Trung bình hay trung vị

Là nhà khoa học dữ liệu, chúng ta thường muốn mô tả dữ liệu một cách ngắn gọn nhất có thể. Điều này dẫn đến hai thước đo trung tâm phổ biến nhất: trung bình và trung vị. Trong bài tập này, bạn sẽ xem qua vài kịch bản khác nhau và quyết định chỉ số nào là tối ưu để mô tả dữ liệu một cách hiệu quả.

Cụ thể hơn, bạn sẽ khám phá dữ liệu thời tiết Australia với các đặc trưng liên quan đến nhiệt độ và tốc độ gió. Bộ dữ liệu này đã được nạp sẵn thành weather và cả hai gói matplotlib và pandas cũng đã được import lần lượt là plt và pd để bạn sử dụng cho phần còn lại của chương.

Hướng dẫn 1/3

undefined XP
  • 1

    Vẽ phân phối của cột Temp3pm bằng hàm hist(); dữ liệu có bị lệch (skew) không?

  • 2

    Gán và in ra giá trị trung bình và trung vị cho cột Temp3pm; theo bạn, chỉ số nào đại diện tốt hơn cho dữ liệu?

  • 3

    Điều chỉnh mã để khám phá một cột khác; xem kết quả cho Temp9am trông như thế nào.