MulaiMulai sekarang secara gratis

Menghubungkannya bersama!

Pada pelajaran terakhir, Anda telah menyelesaikan sebagian besar pekerjaan dalam upaya menghubungkan restaurants dan restaurants_new. Anda telah menghasilkan berbagai pasangan baris yang berpotensi cocok, mencari kecocokan tepat antara kolom cuisine_type dan city, serta membandingkan kemiripan string pada kolom rest_name. Anda menyimpan DataFrame yang berisi skor di potential_matches.

Sekarang akhirnya saatnya untuk menghubungkan kedua DataFrame. Anda akan melakukannya dengan terlebih dahulu mengekstrak semua indeks baris dari restaurants_new yang cocok pada kolom-kolom yang disebutkan di atas dari potential_matches. Lalu Anda akan mengambil subset restaurants_new berdasarkan indeks-indeks tersebut, dan terakhir menggabungkan nilai yang tidak duplikat dengan restaurants. Semua DataFrame sudah tersedia di lingkungan Anda, dengan pandas diimpor sebagai pd.

Latihan ini adalah bagian dari kursus

Membersihkan Data di Python

Lihat Kursus

Petunjuk latihan

  • Isolasi instance potential_matches dengan jumlah baris di atas atau sama dengan 3 menggunakan metode .sum().
  • Ekstrak indeks kolom kedua dari matches, yang merepresentasikan indeks baris dari rekaman yang cocok di restaurants_new, dengan menggunakan metode .get_level_values().
  • Ambil subset restaurants_new untuk baris yang tidak ada di matching_indices.
  • Gabungkan restaurants dan non_dup.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Isolate potential matches with row sum >=3
matches = ____[____.___(____) >= ____]

# Get values of second column index of matches
matching_indices = matches.____.____(____)

# Subset restaurants_new based on non-duplicate values
non_dup = ____[~restaurants_new.index.____(____)]

# Concatenate restaurants and non_dup
full_restaurants = pd.____([____, ____])
print(full_restaurants)
Edit dan Jalankan Kode