Query tweater (1)
Als Data Scientist arbeitest du oft mit riesigen Datenbanken, die Tabellen mit Millionen von Zeilen enthalten. Für deine Analysen brauchst du davon möglicherweise nur einen kleinen Teil. In diesem Fall ist es sinnvoll, SQL-Abfragen an die Datenbank zu senden und nur die Daten nach R zu importieren, die du tatsächlich benötigst.
dbGetQuery() ist genau das richtige Werkzeug. Wie üblich übergibst du zuerst das Verbindungsobjekt. Das zweite Argument ist eine SQL-Abfrage als Zeichenkette. Dieses Beispiel wählt die Variable age aus dem Datensatz people aus, bei der gender gleich "male" ist:
dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")
Eine Verbindung zur Datenbank tweater wurde bereits für dich hergestellt.
Diese Übung ist Teil des Kurses
<Kurs>Fortgeschrittenes Importieren von Daten in R</Kurs>Übungsanweisungen
- Verwende
dbGetQuery(), um einen Data Frameelisabethzu erstellen, der die Spaltetweat_idaus der Tabellecommentsauswählt, wobei elisabeth die Kommentatorin ist, ihreuser_idist 1. - Gib
elisabethaus, um zu prüfen, ob du die Datenbank korrekt abgefragt hast.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Connect to the database
library(DBI)
con <- dbConnect(RMySQL::MySQL(),
dbname = "tweater",
host = "courses.csrrinzqubik.us-east-1.rds.amazonaws.com",
port = 3306,
user = "student",
password = "datacamp")
# Import tweat_id column of comments where user_id is 1: elisabeth
# Print elisabeth