Ajustando a query (1)
Na sua vida como cientista de dados, você vai trabalhar com bancos de dados enormes que contêm tabelas com milhões de linhas. Se quiser analisar esses dados, é provável que você precise apenas de uma fração deles. Nesses casos, vale a pena enviar consultas SQL ao banco e importar para o R somente o que realmente precisa.
dbGetQuery() é o que você precisa. Como de costume, primeiro você passa o objeto de conexão. O segundo argumento é uma consulta SQL em forma de string. Este exemplo seleciona a variável age do conjunto de dados people onde gender é igual a "male":
dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")
Uma conexão com o banco de dados tweater já foi criada para você.
Este exercício faz parte do curso
Importação de dados intermediária em R
Instruções do exercício
- Use
dbGetQuery()para criar um data frame,elisabeth, que seleciona a colunatweat_idda tabelacommentsonde a comentarista é a elisabeth, ouser_iddela é 1 - Imprima
elisabethpara verificar se você consultou o banco corretamente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Connect to the database
library(DBI)
con <- dbConnect(RMySQL::MySQL(),
dbname = "tweater",
host = "courses.csrrinzqubik.us-east-1.rds.amazonaws.com",
port = 3306,
user = "student",
password = "datacamp")
# Import tweat_id column of comments where user_id is 1: elisabeth
# Print elisabeth