MulaiMulai sekarang secara gratis

Menggabungkan semuanya (1)

Ingatlah latihan Bringing it all together pada bab sebelumnya ketika Anda melakukan analisis Twitter sederhana dengan mengembangkan fungsi yang menghitung berapa banyak tweet dalam bahasa tertentu. Keluaran fungsi Anda adalah sebuah dictionary yang memiliki bahasa sebagai keys dan jumlah tweet dalam bahasa tersebut sebagai value.

Dalam latihan ini, kita akan menggeneralisasi analisis bahasa Twitter yang Anda lakukan di bab sebelumnya. Anda akan melakukannya dengan menyertakan argumen baku yang menerima nama kolom.

Agar lebih mudah, pandas telah diimpor sebagai pd dan berkas 'tweets.csv' telah diimpor ke dalam DataFrame tweets_df. Bagian kode dari pekerjaan Anda sebelumnya juga disediakan.

Latihan ini adalah bagian dari kursus

Pengantar Fungsi di Python

Lihat Kursus

Petunjuk latihan

  • Lengkapi header fungsi dengan menambahkan parameter untuk DataFrame df dan parameter col_name dengan nilai baku 'lang' untuk nama kolom DataFrame.
  • Panggil count_entries() dengan meneruskan DataFrame tweets_df dan nama kolom 'lang'. Tetapkan hasilnya ke result1. Perhatikan bahwa karena 'lang' adalah nilai baku dari parameter col_name, Anda tidak perlu menentukannya di sini.
  • Panggil count_entries() dengan meneruskan DataFrame tweets_df dan nama kolom 'source'. Tetapkan hasilnya ke result2.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define count_entries()
def count_entries(____, ____):
    """Return a dictionary with counts of
    occurrences as value for each key."""

    # Initialize an empty dictionary: cols_count
    cols_count = {}

    # Extract column from DataFrame: col
    col = df[col_name]
    
    # Iterate over the column in DataFrame
    for entry in col:

        # If entry is in cols_count, add 1
        if entry in cols_count.keys():
            cols_count[entry] += 1

        # Else add the entry to cols_count, set the value to 1
        else:
            cols_count[entry] = 1

    # Return the cols_count dictionary
    return cols_count

# Call count_entries(): result1
result1 = ____

# Call count_entries(): result2
result2 = ____

# Print result1 and result2
print(result1)
print(result2)
Edit dan Jalankan Kode