1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Phân tích dữ liệu Điều tra Dân số Hoa Kỳ bằng Python

Connected

Bài tập

Xác định giá trị cực trị

Bây giờ bạn đã tạo được một DataFrame với tỷ lệ tự nhận dạng là người Hispanic theo bang, hãy khám phá sâu hơn, bắt đầu bằng việc tạo một boxplot bằng seaborn.

Bạn cũng sẽ tìm các bang có tỷ lệ người Hispanic tự nhận là các chủng tộc cụ thể cao nhất hoặc thấp nhất. Để làm điều đó, bạn sẽ dùng phương thức squeeze(). Phương thức này chuyển một DataFrame chỉ có một hàng thành một series (không ảnh hưởng đến DataFrame có nhiều hơn một hàng).

pandas đã được nhập. DataFrame states_hr đã được nạp, chứa phần trăm tự nhận dạng chủng tộc cho 7 nhóm chủng tộc khác nhau.

Hướng dẫn

100 XP
  • Tạo một boxplot bằng cách đặt tham số data là tên của DataFrame. (orient = "h" sẽ vẽ boxplot theo phương ngang — horizontal.)
  • Dùng squeeze để hiển thị bang có giá trị lớn nhất ở cột hispanic_white.
  • Dùng squeeze để hiển thị bang có giá trị nhỏ nhất ở cột hispanic_other.
  • Lưu ý rằng rất ít người Hispanic tự nhận là Asian, nhưng có một bang là ngoại lệ cao. Dùng squeeze để hiển thị bang có giá trị lớn nhất ở cột hispanic_asian.