1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

EDA cho dữ liệu biết chữ/sinh suất

Trong vài bài tập tiếp theo, chúng ta sẽ xem xét mối tương quan giữa tỷ lệ biết chữ của nữ giới và sinh suất (được định nghĩa là số con trung bình trên mỗi phụ nữ) trên toàn thế giới. Để dễ phân tích và diễn giải, chúng ta sẽ làm việc với tỷ lệ mù chữ.

Luôn là ý hay khi thực hiện EDA trước khi phân tích. Vì vậy, hãy vẽ biểu đồ sinh suất theo mù chữ và tính hệ số tương quan Pearson. Mảng NumPy illiteracy chứa tỷ lệ mù chữ ở nữ giới cho phần lớn các quốc gia trên thế giới. Mảng fertility chứa dữ liệu sinh suất tương ứng.

Ở đây, bạn có thể tham khảo lại hàm bạn đã viết ở khóa trước để tính hệ số tương quan Pearson.

Hướng dẫn

100 XP
  • Vẽ biểu đồ phân tán fertility (trục y) theo illiteracy (trục x).
  • Đặt lề 2%.
  • Tính và in ra hệ số tương quan Pearson giữa illiteracy và fertility.