Query tweater (1)
Als Data Scientist arbeitest du oft mit riesigen Datenbanken, die Tabellen mit Millionen von Zeilen enthalten. Für deine Analysen brauchst du davon möglicherweise nur einen kleinen Teil. In diesem Fall ist es sinnvoll, SQL-Abfragen an die Datenbank zu senden und nur die Daten nach R zu importieren, die du tatsächlich benötigst.
dbGetQuery() ist genau das richtige Werkzeug. Wie üblich übergibst du zuerst das Verbindungsobjekt. Das zweite Argument ist eine SQL-Abfrage als Zeichenkette. Dieses Beispiel wählt die Variable age aus dem Datensatz people aus, bei der gender gleich "male" ist:
dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")
Eine Verbindung zur Datenbank tweater wurde bereits für dich hergestellt.
Diese Übung ist Teil des Kurses
Fortgeschrittenes Importieren von Daten in R
Anleitung zur Übung
- Verwende
dbGetQuery(), um einen Data Frameelisabethzu erstellen, der die Spaltetweat_idaus der Tabellecommentsauswählt, wobei elisabeth die Kommentatorin ist, ihreuser_idist 1. - Gib
elisabethaus, um zu prüfen, ob du die Datenbank korrekt abgefragt hast.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Connect to the database
library(DBI)
con <- dbConnect(RMySQL::MySQL(),
dbname = "tweater",
host = "courses.csrrinzqubik.us-east-1.rds.amazonaws.com",
port = 3306,
user = "student",
password = "datacamp")
# Import tweat_id column of comments where user_id is 1: elisabeth
# Print elisabeth