Microsoft Research đang nghiên cứu một công nghệ để nhận dạng các lệnh thoại im lặng

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Microsoft đã và đang làm việc trên một giao diện nhập liệu bằng giọng nói mới cho phép người dùng nói và ghi âm mà không bị rò rỉ giọng nói. Nghiên cứu đang được thực hiện bởi Microsoft Research và đã được trình bày tại UIST 2018.

Được gọi là SilentVoice, mô-đun sẽ thu nhận không khí từ miệng và ghi lại giọng nói mà không làm phiền những người xung quanh. Hơn nữa, mô-đun cũng sẽ lọc giọng nói xung quanh để người dùng có thể ghi lại giọng nói rõ ràng ngay cả trong mà không có sự can thiệp từ bên ngoài.

SilentVoice là một thiết bị giao diện nhập liệu bằng giọng nói mới thâm nhập vào giao diện người dùng tự nhiên dựa trên giọng nói (NUI) trong cuộc sống hàng ngày. Phương pháp “giọng nói ấn tượng” được đề xuất cho phép đặt micrô rất gần phía trước miệng mà không bị nhiễu hạt, ghi lại âm thanh giọng nói rất nhẹ nhàng với tỷ lệ S / N tốt. Nó nhận ra sự rò rỉ giọng nói siêu nhỏ (dưới 39dB (A)), cho phép chúng tôi sử dụng đầu vào bằng giọng nói mà không làm phiền những người xung quanh trong các tình huống công cộng và di động cũng như văn phòng và nhà riêng. Bằng cách đo hướng luồng không khí, có thể dễ dàng tách SilentVoice khỏi những lời nói bình thường với độ chính xác 98.8%; không cần từ kích hoạt. Nó có thể được sử dụng cho các hệ thống kích hoạt bằng giọng nói với bộ nhận dạng giọng nói được đào tạo đặc biệt; kết quả đánh giá mang lại tỷ lệ lỗi từ (WERs) là 1.8% (điều kiện phụ thuộc vào người nói) và 7.0% (điều kiện không phụ thuộc vào người nói) với một từ điển giới hạn 85 câu lệnh. Giọng nói tự nhiên giống như thì thầm cũng có thể được sử dụng để giao tiếp bằng giọng nói trong thời gian thực.

- Microsoft

Bạn có thể xem video dưới đây để xem nó hoạt động như thế nào.

Công nghệ này vẫn đang trong giai đoạn nghiên cứu nhưng chắc chắn sẽ giúp mọi người ghi lại giọng nói và cũng có thể hoạt động mà không làm phiền những người xung quanh họ.

nguồn: microsoft; Thông qua: WalkingCat

Thông tin thêm về các chủ đề: microsoft, nghiên cứu microsoft

Bình luận

Chúng tôi sẽ không công khai email của bạn. Các ô đánh dấu * là bắt buộc *