MulaiMulai sekarang secara gratis

grepl & grep (2)

Anda dapat menggunakan tanda sisipan, ^, dan tanda dolar, $, untuk mencocokkan konten yang berada masing-masing di awal dan akhir sebuah string. Ini dapat membawa kita selangkah lebih dekat ke pola yang benar untuk mencocokkan hanya alamat email ".edu" dari daftar email kita. Namun, masih ada yang bisa ditambahkan agar polanya lebih andal:

  • @, karena email yang valid harus mengandung tanda at.
  • .*, yang mencocokkan karakter apa pun (.) sebanyak nol kali atau lebih (*). Titik dan bintang adalah metakarakter. Anda dapat menggunakannya untuk mencocokkan karakter apa pun di antara tanda at dan bagian ".edu" dari alamat email.
  • \\.edu$, untuk mencocokkan bagian ".edu" dari email yang berada di akhir string. Bagian \\ berfungsi untuk meng-escape titik: ini memberi tahu R bahwa Anda ingin menggunakan . sebagai karakter sebenarnya.

Latihan ini adalah bagian dari kursus

R Tingkat Menengah

Lihat Kursus

Petunjuk latihan

  • Gunakan grepl() dengan ekspresi reguler yang lebih lanjut untuk mengembalikan sebuah vektor logika. Cukup cetak hasilnya.
  • Lakukan hal serupa dengan grep() untuk membuat vektor indeks. Simpan hasilnya dalam variabel hits.
  • Gunakan kembali emails[hits] untuk melakukan subset pada vektor emails.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# The emails vector has already been defined for you
emails <- c("[email protected]", "[email protected]", "[email protected]",
            "invalid.edu", "[email protected]", "[email protected]")

# Use grepl() to match for .edu addresses more robustly


# Use grep() to match for .edu addresses more robustly, save result to hits


# Subset emails using hits
Edit dan Jalankan Kode