1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Xử lý Ngôn ngữ Nói bằng Python

Connected

अभ्यास

Nhận dạng thực thể có tên trong spaCy

Thực thể có tên là các đối tượng trong thế giới thực có tên riêng, như thành phố, con người, ngày tháng hoặc thời gian. Chúng ta có thể dùng spaCy để tìm các thực thể có tên trong văn bản đã được phiên âm.

Trong bài này, bạn sẽ phiên âm call_4_channel_2.wav (file) bằng transcribe_audio() rồi dùng mô hình ngôn ngữ en_core_web_sm của spaCy để chuyển văn bản đã phiên âm thành một doc của spaCy.

Chuyển văn bản thành doc của spaCy cho phép bạn tận dụng các tính năng dựng sẵn để phân tích văn bản, ví dụ .text cho token (từng từ), .sents cho câu và .ents cho thực thể có tên.

निर्देश 1/4

undefined XP
  • 1
    • Tạo một doc của spaCy bằng cách truyền văn bản call 4 channel 2 đã phiên âm vào nlp() rồi kiểm tra kiểu của nó.
  • 2
    • Tạo một doc của spaCy với call_4_channel_2_text, sau đó in toàn bộ văn bản của các token trong đó bằng thuộc tính .text.
  • 3
    • Nạp mô hình ngôn ngữ "en_core_web_sm" rồi in các câu trong doc bằng thuộc tính .sents.
  • 4
    • Truy cập các thực thể trong doc bằng .ents rồi in văn bản của từng thực thể.