1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Importing Data in R

Connected

cvičení

Dotazy na tweater (1)

V práci datového vědce/vědkyně se budeš často setkávat s obrovskými databázemi obsahujícími tabulky s miliony řádků. Pokud chceš taková data analyzovat, většinou potřebuješ jen jejich zlomek. V takovém případě je nejlepší posílat do databáze SQL dotazy a do R importovat pouze data, která skutečně potřebuješ.

K tomu slouží dbGetQuery(). Jako obvykle nejprve předáš objekt připojení. Druhý argument je SQL dotaz ve formě textového řetězce. Tento příklad vybere proměnnou age z datasetu people tam, kde je gender rovno "male":

dbGetQuery(con, "SELECT age FROM people WHERE gender = 'male'")

Připojení k databázi tweater už máš v kódu připravené.

Pokyny

100 XP
  • Pomocí dbGetQuery() vytvoř datový rámec elisabeth, který vybere sloupec tweat_id z tabulky comments tam, kde je autorkou komentáře elisabeth — její user_id je 1.
  • Vypiš elisabeth, abys ověřil/a, zda byl dotaz do databáze správný.