Menggunakan fungsionalitas kelas Anda
Anda kini telah menambahkan fungsionalitas tambahan ke metode __init__ kelas Document yang secara otomatis memproses teks untuk para pengguna Anda. Pada latihan ini, Anda akan berperan sebagai salah satu pengguna tersebut untuk melihat manfaat dari kerja keras Anda.
Kelas Document (disalin di bawah) telah dimuat ke dalam lingkungan Anda (lengkap dengan pembaruan baru Anda).
class Document:
def __init__(self, text):
self.text = text
# pre tokenize the document with non-public tokenize method
self.tokens = self._tokenize()
# pre tokenize the document with non-public count_words
self.word_counts = self._count_words()
def _tokenize(self):
return tokenize(self.text)
# non-public method to tally document's word counts with Counter
def _count_words(self):
return Counter(self.tokens)
Latihan ini adalah bagian dari kursus
Prinsip Rekayasa Perangkat Lunak di Python
Petunjuk latihan
- Buat instance
Documentbaru dari himpunan datadatacamp_tweetsyang telah dimuat ke lingkungan Anda. Objekdatacamp_tweetsadalah satu string yang berisi ratusan tweet yang ditulis oleh DataCamp dan pengguna DataCamp. - Cetak 5
tokenspertama daridatacamp_doc. - Cetak 5 kata paling umum teratas yang dihitung secara otomatis oleh metode non-publik
_count_words()di dalam metodeDocument.__init__.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)
# print the first 5 tokens from datacamp_doc
print(____.____[:5])
# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))