LoslegenKostenlos loslegen

Query tweater (1)

Als Data Scientist arbeitest du oft mit riesigen Datenbanken, die Tabellen mit Millionen von Zeilen enthalten. Für deine Analysen brauchst du davon möglicherweise nur einen kleinen Teil. In diesem Fall ist es sinnvoll, SQL-Abfragen an die Datenbank zu senden und nur die Daten nach R zu importieren, die du tatsächlich benötigst.

dbGetQuery() ist genau das richtige Werkzeug. Wie üblich übergibst du zuerst das Verbindungsobjekt. Das zweite Argument ist eine SQL-Abfrage als Zeichenkette. Dieses Beispiel wählt die Variable age aus dem Datensatz people aus, bei der gender gleich "male" ist:

dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")

Eine Verbindung zur Datenbank tweater wurde bereits für dich hergestellt.

Diese Übung ist Teil des Kurses

Fortgeschrittenes Importieren von Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende dbGetQuery(), um einen Data Frame elisabeth zu erstellen, der die Spalte tweat_id aus der Tabelle comments auswählt, wobei elisabeth die Kommentatorin ist, ihre user_id ist 1.
  • Gib elisabeth aus, um zu prüfen, ob du die Datenbank korrekt abgefragt hast.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Connect to the database
library(DBI)
con <- dbConnect(RMySQL::MySQL(),
                 dbname = "tweater",
                 host = "courses.csrrinzqubik.us-east-1.rds.amazonaws.com",
                 port = 3306,
                 user = "student",
                 password = "datacamp")

# Import tweat_id column of comments where user_id is 1: elisabeth


# Print elisabeth
Code bearbeiten und ausführen