1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

In 5-number summary

Một trong những cách nhanh nhất để nắm sơ bộ dữ liệu mới là tóm tắt 5 số. Nó in ra 5 thước đo của một phân phối — giá trị nhỏ nhất, phân vị 25%, trung vị, phân vị 75% và giá trị lớn nhất — cùng với giá trị trung bình và độ lệch chuẩn. Bằng cách nhìn vào tóm tắt 5 số và sự khác biệt giữa trung bình với các giá trị nhỏ nhất/lớn nhất, bạn có thể ước lượng sơ bộ xem phân phối có xuất hiện ngoại lệ hay không.

Trong các bài tập của chương này, bạn sẽ dùng các phương pháp đã thảo luận trong video để phát hiện mức giá đắt nhất (hoặc rẻ nhất) của các mục cho thuê Airbnb tại Mỹ. Bộ dữ liệu đã được nạp vào airbnb_df dưới dạng pandas DataFrame.

Hướng dẫn

100 XP
  • Trích cột price thành prices từ dữ liệu US Airbnb Listings.
  • In tóm tắt 5 số của phân phối prices.