MulaiMulai sekarang secara gratis

Menggunakan fungsionalitas kelas Anda

Anda kini telah menambahkan fungsionalitas tambahan ke metode __init__ kelas Document yang secara otomatis memproses teks untuk para pengguna Anda. Pada latihan ini, Anda akan berperan sebagai salah satu pengguna tersebut untuk melihat manfaat dari kerja keras Anda.

Kelas Document (disalin di bawah) telah dimuat ke dalam lingkungan Anda (lengkap dengan pembaruan baru Anda).

class Document:
  def __init__(self, text):
    self.text = text
    # pre tokenize the document with non-public tokenize method
    self.tokens = self._tokenize()
    # pre tokenize the document with non-public count_words
    self.word_counts = self._count_words()

  def _tokenize(self):
    return tokenize(self.text)

  # non-public method to tally document's word counts with Counter
  def _count_words(self):
    return Counter(self.tokens)

Latihan ini adalah bagian dari kursus

Prinsip Rekayasa Perangkat Lunak di Python

Lihat Kursus

Petunjuk latihan

  • Buat instance Document baru dari himpunan data datacamp_tweets yang telah dimuat ke lingkungan Anda. Objek datacamp_tweets adalah satu string yang berisi ratusan tweet yang ditulis oleh DataCamp dan pengguna DataCamp.
  • Cetak 5 tokens pertama dari datacamp_doc.
  • Cetak 5 kata paling umum teratas yang dihitung secara otomatis oleh metode non-publik _count_words() di dalam metode Document.__init__.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# create a new document instance from datacamp_tweets
datacamp_doc = ____(____)

# print the first 5 tokens from datacamp_doc
print(____.____[:5])

# print the top 5 most used words in datacamp_doc
print(____.____.most_common(5))
Edit dan Jalankan Kode