1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nâng cấp trực quan hóa dữ liệu của bạn với Python

Connected

Bài tập

Bang nào thân thiện với chợ nhất?

Khi khám phá dữ liệu farmer's market, bạn tự hỏi liệu có những mẫu hình nào xuất hiện nếu gộp theo cấp bang. Có bang nào thân thiện với chợ hơn các bang khác không? Để kiểm tra, bạn nhóm dữ liệu theo bang và lấy số lượng chợ đã log-transform (log_markets) và dân số bang (log_pop).

markets_and_pop = (markets
    .groupby('state', as_index = False)
    .agg({
       'name': lambda d: log(len(d)),
       'state_pop': lambda d: log(d.iloc[0]) })
    .rename(columns = {
        'name': 'log_markets', 
        'state_pop': 'log_pop' }))

Để trực quan hóa, bạn quyết định dùng biểu đồ hồi quy để hình dung mối quan hệ “bình thường” giữa số chợ và dân số, và scatter kèm nhãn văn bản để nhanh chóng nhận diện các ngoại lệ thú vị.

Hướng dẫn

100 XP
  • Lặp qua từng hàng của DataFrame markets_and_pop.
  • Đặt chú thích cạnh các điểm trên biểu đồ scatter.
  • Giảm cỡ chữ chú thích xuống 10 point.