1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Unsupervised Learning ใน Python

Connected

แบบฝึกหัด

ฟีเจอร์ NMF ของบทความ Wikipedia

ในแบบฝึกหัดนี้ จะได้สำรวจฟีเจอร์ NMF ที่สร้างไว้ในแบบฝึกหัดก่อนหน้า โดยโค้ดเฉลยของแบบฝึกหัดนั้นถูกโหลดไว้แล้ว ทำให้อาร์เรย์ nmf_features พร้อมใช้งาน นอกจากนี้ยังมีลิสต์ titles ที่เก็บชื่อบทความ Wikipedia แต่ละบทความด้วย

เมื่อตรวจสอบฟีเจอร์เหล่านี้ จะสังเกตได้ว่าสำหรับนักแสดงทั้งสองคน ฟีเจอร์ NMF ที่ 3 มีค่าสูงกว่าฟีเจอร์อื่นอย่างเห็นได้ชัด ซึ่งหมายความว่าทั้งสองบทความถูกสร้างขึ้นใหม่โดยใช้ NMF component ที่ 3 เป็นหลัก ในวิดีโอถัดไปจะได้เห็นว่าเพราะเหตุใด: NMF component แต่ละตัวแทน topic หนึ่ง (เช่น การแสดง!)

คำแนะนำ

100 XP
  • Import pandas โดยใช้ชื่อแทนว่า pd
  • สร้าง DataFrame ชื่อ df จาก nmf_features โดยใช้ pd.DataFrame() แล้วกำหนด index เป็น titles ด้วย index=titles
  • ใช้ .loc[] ของ df เพื่อเลือกแถวที่มีชื่อว่า 'Anne Hathaway' จากนั้นพิมพ์ผลลัพธ์ออกมา ซึ่งนี่คือฟีเจอร์ NMF ของบทความเกี่ยวกับนักแสดง Anne Hathaway
  • ทำซ้ำขั้นตอนเดิมสำหรับ 'Denzel Washington' (นักแสดงอีกคน)