1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong Python

Connected

Bài tập

Đưa dữ liệu Twitter vào DataFrame

Hiện bạn đã có dữ liệu Twitter trong một list các dictionary, tweets_data, trong đó mỗi dictionary tương ứng với một tweet. Tiếp theo, bạn sẽ trích xuất phần văn bản và ngôn ngữ của từng tweet. Văn bản trong một tweet, t1, được lưu dưới dạng giá trị t1['text']; tương tự, ngôn ngữ được lưu trong t1['lang']. Nhiệm vụ của bạn là xây dựng một DataFrame trong đó mỗi hàng là một tweet và các cột là 'text' và 'lang'.

Hướng dẫn

100 XP
  • Dùng pd.DataFrame() để tạo một DataFrame gồm văn bản và ngôn ngữ của các tweet; để làm điều này, đối số thứ nhất phải là tweets_data, một list các dictionary. Đối số thứ hai của pd.DataFrame() là một list các khóa bạn muốn dùng làm cột. Gán kết quả của lệnh gọi pd.DataFrame() cho df.
  • In phần đầu của DataFrame bằng head().