1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Nhập dữ liệu STATA với foreign (2)

Dữ liệu có thể rất đa dạng, từ vector ký tự đến biến phân loại, ngày tháng và nhiều hơn nữa. Trong những trường hợp này, các đối số bổ sung của read.dta() sẽ rất hữu ích.

Những đối số bạn sẽ dùng thường xuyên nhất là convert.dates, convert.factors, missing.type và convert.underscore. Ý nghĩa của chúng khá trực quan, như Filip đã giải thích trong video. Mục tiêu là chuyển đổi dữ liệu STATA sang các cấu trúc dữ liệu chuẩn của R một cách chính xác. Gõ ?read.dta để xem các giá trị mặc định.

Bộ dữ liệu cho bài tập này chứa các thước đo kinh tế - xã hội và khả năng tiếp cận giáo dục của các cá nhân khác nhau (Nguồn: World Bank). Dữ liệu có sẵn dưới dạng edequality.dta, nằm trong thư mục worldbank tại thư mục làm việc của bạn.

Hướng dẫn

100 XP
  • Xác định đường dẫn đến tệp bằng file.path(). Gọi là path. Nhớ rằng tệp "edequality.dta" nằm trong thư mục "worldbank".
  • Dùng biến path để nhập tệp dữ liệu theo ba cách khác nhau; mỗi lần hãy hiển thị cấu trúc với str():
  • edu_equal_1: Chỉ truyền path của tệp vào read.dta().
  • edu_equal_2: Truyền path của tệp và đặt convert.factors thành FALSE.
  • edu_equal_3: Truyền path của tệp và đặt convert.underscore thành TRUE.