1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Query tweater (1)

Trong công việc của một data scientist, bạn sẽ thường xuyên làm việc với các cơ sở dữ liệu khổng lồ chứa những bảng có hàng triệu dòng. Khi phân tích, có thể bạn chỉ cần một phần nhỏ dữ liệu. Lúc này, nên gửi truy vấn SQL đến cơ sở dữ liệu và chỉ nhập vào R đúng phần dữ liệu bạn thực sự cần.

dbGetQuery() là hàm bạn cần. Như thường lệ, bạn truyền đối tượng kết nối vào đối số đầu tiên. Đối số thứ hai là một truy vấn SQL dưới dạng chuỗi ký tự. Ví dụ sau chọn biến age từ bộ dữ liệu people nơi gender bằng "male":

dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")

Kết nối tới cơ sở dữ liệu tweater đã được tạo sẵn cho bạn.

Hướng dẫn

100 XP
  • Dùng dbGetQuery() để tạo một data frame, elisabeth, chọn cột tweat_id từ bảng comments nơi người bình luận là elisabeth, user_id của cô ấy là 1
  • In elisabeth ra để kiểm tra bạn đã truy vấn cơ sở dữ liệu đúng chưa.