ComeçarComece de graça

Ajustando a query (1)

Na sua vida como cientista de dados, você vai trabalhar com bancos de dados enormes que contêm tabelas com milhões de linhas. Se quiser analisar esses dados, é provável que você precise apenas de uma fração deles. Nesses casos, vale a pena enviar consultas SQL ao banco e importar para o R somente o que realmente precisa.

dbGetQuery() é o que você precisa. Como de costume, primeiro você passa o objeto de conexão. O segundo argumento é uma consulta SQL em forma de string. Este exemplo seleciona a variável age do conjunto de dados people onde gender é igual a "male":

dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")

Uma conexão com o banco de dados tweater já foi criada para você.

Este exercício faz parte do curso

Importação de dados intermediária em R

Ver curso

Instruções do exercício

  • Use dbGetQuery() para criar um data frame, elisabeth, que seleciona a coluna tweat_id da tabela comments onde a comentarista é a elisabeth, o user_id dela é 1
  • Imprima elisabeth para verificar se você consultou o banco corretamente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Connect to the database
library(DBI)
con <- dbConnect(RMySQL::MySQL(),
                 dbname = "tweater",
                 host = "courses.csrrinzqubik.us-east-1.rds.amazonaws.com",
                 port = 3306,
                 user = "student",
                 password = "datacamp")

# Import tweat_id column of comments where user_id is 1: elisabeth


# Print elisabeth
Editar e executar o código