Biểu đồ mật độ kernel

Giờ bạn đã biết về biểu đồ mật độ kernel, hãy tự tạo một biểu đồ! Hãy nhớ: nó giống histogram được làm trơn nhưng không bị ảnh hưởng bởi độ rộng bin. Bài tập này sẽ giúp bạn dựng một biểu đồ mật độ kernel từ các giá trị cảm xúc (sentiment).

Trong bài này, bạn sẽ vẽ 2 đường mật độ kernel: một cho Agamemnon và một cho The Wizard of Oz. Với cả hai, bạn sẽ thực hiện inner_join() với từ điển "afinn". Nhắc lại, từ điển "afinn" chấm điểm các từ từ -5 đến 5. Sau khi đưa về dạng tidy, cả hai cuốn sẽ giữ lại các từ và điểm tương ứng theo từ điển.

Sau đó, bạn cần nối các kết quả theo hàng vào một data frame lớn hơn bằng bind_rows() và tạo biểu đồ với ggplot2.

Từ hình trực quan, bạn sẽ thấy cuốn sách nào dùng ngôn ngữ tích cực hoặc tiêu cực nhiều hơn. Rõ ràng có phần chồng lấp vì Dorothy cũng gặp chuyện không hay, nhưng bạn có thể suy ra mật độ kernel cho thấy xác suất ngôn ngữ tích cực cao hơn trong The Wizard of Oz so với Agamemnon.

Chúng tôi đã nạp ag và oz là các phiên bản tidy của Agamemnon và The Wizard of Oz tương ứng, và tạo afinn là một tập con của từ điển "afinn" trong tidytext.

Inner join ag với từ điển afinn, gán vào ag_afinn.
Làm tương tự cho The Wizard of Oz. Vẫn là đoạn mã đó nhưng bắt đầu với bộ dữ liệu oz và gán vào oz_afinn.
Dùng bind_rows() để gộp ag_afinn với oz_afinn. Đặt đối số .id thành "book" để tạo một cột mới chứa tên từng cuốn sách.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn 1/2

Bài tập