MulaiMulai sekarang secara gratis

Operator string lanjutan dan Twitter

Dalam latihan ini, Anda akan menerapkan berbagai operator string pada tiga string yang dipilih dari himpunan data tweets. Sebuah tweets_list telah dibuat untuk Anda.

Anda perlu menyusun tiga daftar baru dengan menerapkan operator string yang berbeda:

  • daftar yang hanya mempertahankan huruf
  • daftar yang hanya mempertahankan karakter
  • daftar yang hanya mempertahankan digit

Fungsi yang diperlukan telah diimpor untuk Anda dari nltk.

Latihan ini adalah bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat daftar token dari tweets_list.
  • Dalam daftar letters, hapus semua digit dan karakter lainnya, yaitu hanya pertahankan huruf.
  • Pertahankan karakter alfanumerik tetapi hapus semua karakter lainnya di let_digits.
  • Buat digits dengan menghapus huruf dan karakter serta hanya mempertahankan angka.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Edit dan Jalankan Kode