MulaiMulai sekarang secara gratis

Mengintegrasikan semuanya (1)

Anda telah mulai menulis fungsi Anda sendiri pada latihan sebelumnya. Anda telah mempelajari cara menambahkan parameter ke definisi fungsi Anda, mengembalikan satu atau beberapa nilai dengan tuple, serta cara memanggil fungsi yang telah Anda definisikan.

Dalam latihan ini dan berikutnya, Anda akan menggabungkan semua konsep tersebut dan menerapkannya pada masalah data science yang sederhana. Anda akan memuat sebuah himpunan data dan mengembangkan fungsionalitas untuk mengekstrak wawasan sederhana dari data.

Pada latihan ini, tujuan Anda adalah mengingat kembali cara memuat himpunan data ke dalam sebuah DataFrame. Himpunan data ini berisi data Twitter dan Anda akan melakukan iterasi pada entri dalam sebuah kolom untuk membangun sebuah dictionary yang key-nya adalah nama bahasa dan value-nya adalah jumlah tweet dalam bahasa tersebut. Berkas tweets.csv tersedia di direktori Anda saat ini.

Harap diketahui bahwa ini adalah data asli dari Twitter dan karena itu selalu ada kemungkinan mengandung kata-kata kasar atau konten lain yang menyinggung (dalam latihan ini, dan latihan berikutnya yang juga menggunakan data Twitter asli).

Latihan ini adalah bagian dari kursus

Pengantar Fungsi di Python

Lihat Kursus

Petunjuk latihan

  • Impor paket pandas dengan alias pd.
  • Impor berkas 'tweets.csv' menggunakan fungsi pandas read_csv(). Tetapkan DataFrame hasilnya ke df.
  • Lengkapi perulangan for dengan melakukan iterasi pada col, yaitu kolom 'lang' dalam DataFrame df.
  • Lengkapi isi pernyataan if-else di dalam perulangan: jika key ada dalam dictionary langs_count, tambahkan 1 pada nilai yang sesuai dengan key tersebut di dictionary, jika tidak tambahkan key ke langs_count dan tetapkan nilainya menjadi 1. Gunakan variabel perulangan entry dalam kode Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import pandas


# Import Twitter data as DataFrame: df
df = ____

# Initialize an empty dictionary: langs_count
langs_count = {}

# Extract column from DataFrame: col
col = df['lang']

# Iterate over lang column in DataFrame
for entry in ____:

    # If the language is in langs_count, add 1 
    if entry in langs_count.keys():
        ____
    # Else add the language to langs_count, set the value to 1
    else:
        ____

# Print the populated dictionary
print(langs_count)
Edit dan Jalankan Kode