1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate R

Connected

cvičení

grepl & grep (2)

Stříška ^ a znak dolaru $ slouží k zachycení obsahu na začátku a konci řetězce. To nás přibližuje ke správnému vzoru pro vyhledání pouze e-mailových adres s příponou ".edu" z našeho seznamu. Vzor ale můžeme ještě zpřesnit:

  • @, protože platná e-mailová adresa musí obsahovat zavináč.
  • .*, které odpovídá libovolnému znaku (.) opakovanému nulakrát nebo vícekrát (*). Tečka i hvězdička jsou metaznaky. Pomůžou ti zachytit libovolné znaky mezi zavináčem a částí ".edu" v e-mailové adrese.
  • \\.edu$, pro zachycení části ".edu" na konci řetězce. Část \\ escapuje tečku: říká R, že chceš . použít jako obyčejný znak.

Pokyny

100 XP
  • Použij grepl() s pokročilejším regulárním výrazem a získej logický vektor. Výsledek jednoduše vypiš.
  • Totéž proveď pomocí grep() a vytvoř vektor indexů. Výsledek ulož do proměnné hits.
  • Znovu použij emails[hits] pro vytvoření podmnožiny vektoru emails.