Operator string lanjutan dan Twitter
Dalam latihan ini, Anda akan menerapkan berbagai operator string pada tiga string yang dipilih dari himpunan data tweets. Sebuah tweets_list telah dibuat untuk Anda.
Anda perlu menyusun tiga daftar baru dengan menerapkan operator string yang berbeda:
- daftar yang hanya mempertahankan huruf
- daftar yang hanya mempertahankan karakter
- daftar yang hanya mempertahankan digit
Fungsi yang diperlukan telah diimpor untuk Anda dari nltk.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Buat daftar token dari
tweets_list. - Dalam daftar
letters, hapus semua digit dan karakter lainnya, yaitu hanya pertahankan huruf. - Pertahankan karakter alfanumerik tetapi hapus semua karakter lainnya di
let_digits. - Buat
digitsdengan menghapus huruf dan karakter serta hanya mempertahankan angka.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])