1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Nghiên cứu tình huống: Khám phá dữ liệu với R

Connected

Bài tập

Lọc các quốc gia có ý nghĩa thống kê

Không phải mọi hệ số dốc đều có ý nghĩa thống kê, và bạn có thể dùng p-value để đoán cái nào có, cái nào không.

Tuy nhiên, khi bạn có rất nhiều p-value, như một p-value cho mỗi quốc gia, bạn sẽ gặp vấn đề kiểm định nhiều giả thuyết, khi đó cần đặt ngưỡng nghiêm ngặt hơn. Hàm p.adjust() là một cách đơn giản để hiệu chỉnh điều này: p.adjust(p.value) trên một vector p-value sẽ trả về một tập giá trị mà bạn có thể tin cậy.

Tại đây, bạn sẽ thêm hai bước để xử lý dữ liệu slope_terms: dùng mutate để tạo cột p-value đã hiệu chỉnh mới, và dùng filter để lọc các giá trị nhỏ hơn ngưỡng 0,05.

Hướng dẫn

100 XP

Dùng hàm p.adjust() để hiệu chỉnh cột p.value, lưu kết quả vào cột mới p.adjusted. Sau đó, lọc những trường hợp mà p.adjusted nhỏ hơn 0,05.