1. Learn
  2. /
  3. Cursuri
  4. /
  5. Programare funcțională intermediară cu purrr

Connected

exercițiu

Analiza URL-urilor

Continuăm explorarea setului de date #RStudioConf. În acest exercițiu, ne vom concentra pe analiza URL-urilor din tweet-uri.

URL-urile se găsesc într-un element numit "url_urls". Aceste elemente "url_urls" conțin fie NULL, dacă tweet-ul nu includea niciun URL, fie o listă cu unul sau mai multe URL-uri.

Vom începe prin a extrage toate elementele "url_urls" din setul de date, după care vom combina purrr și stringr pentru a număra câte tweet-uri conțin un link către un URL legat de GitHub. Deoarece GitHub este un site popular în rândul dezvoltatorilor, o prezență ridicată a acestuia în datele noastre va indica o comunitate puternică de dezvoltatori.

purrr și stringr sunt deja încărcate, iar setul de date rstudioconf este disponibil în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Extrage toate elementele "urls_url" și transmite rezultatul în flatten() pentru a elimina un nivel de ierarhie.

  • Elimină valorile NULL din rezultate.

  • Creează un mapper numit has_github, care detectează dacă un șir de caractere conține "github".

  • Folosește varianta map_*() pentru valori logice împreună cu has_github și transmite rezultatul în sum() pentru a număra câte link-uri conțin "github".