Microsoft sẽ mang tính năng khử nhiễu dựa trên AI cho Microsoft Teams trên nền tảng Mac và di động

Biểu tượng thời gian đọc 3 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Nhóm của Microsoft

Nhóm của Microsoft

Tháng trước, Microsoft công bố triển khai tính năng khử nhiễu dựa trên AI trong nền theo thời gian thực cho người dùng máy tính để bàn Microsoft Teams Windows. Tính năng này có thể ngăn chặn những tiếng ồn không cần thiết như xáo trộn giấy tờ, đóng sầm cửa và tiếng chó sủa trong cuộc gọi Nhóm. Tính năng khử tiếng ồn dựa trên AI hoạt động bằng cách phân tích nguồn cấp dữ liệu âm thanh của một cá nhân và sử dụng mạng thần kinh sâu được đào tạo đặc biệt để lọc tiếng ồn và chỉ giữ lại tín hiệu giọng nói. Microsoft hôm nay đã thông báo rằng họ đang làm việc để đưa tính năng chống ồn dựa trên AI vào Microsoft Teams trên nền tảng Mac và di động.

Microsoft hôm nay cũng giải thích cách họ phát triển tính năng này mà không sử dụng dữ liệu khách hàng thực tế. Microsoft đã tối ưu hóa mô hình học sâu theo cách mà nó có thể chạy hiệu quả trên máy khách Teams trên máy tính để bàn trong thời gian thực mà không tốn nhiều chi phí.

Để đạt được sự đa dạng của tập dữ liệu này, chúng tôi đã tạo một tập dữ liệu lớn với khoảng 760 giờ dữ liệu giọng nói sạch và 180 giờ dữ liệu nhiễu. Để tuân thủ các tiêu chuẩn nghiêm ngặt về quyền riêng tư của Microsoft, chúng tôi đảm bảo rằng không có dữ liệu khách hàng nào được thu thập cho tập dữ liệu này. Thay vào đó, chúng tôi sử dụng dữ liệu có sẵn công khai hoặc nguồn lực cộng đồng để thu thập các tình huống cụ thể. Để có lời nói rõ ràng, chúng tôi đảm bảo rằng chúng tôi có sự cân bằng giữa giọng nói của phụ nữ và nam giới và chúng tôi thu thập dữ liệu từ hơn 10 ngôn ngữ cũng bao gồm các ngôn ngữ có âm sắc để đảm bảo rằng mô hình của chúng tôi sẽ không thay đổi ý nghĩa của một câu bằng cách làm sai lệch âm điệu của từ đó. Đối với dữ liệu tiếng ồn, chúng tôi đã bao gồm 150 loại tiếng ồn để đảm bảo chúng tôi đề cập đến các tình huống khác nhau mà khách hàng của chúng tôi có thể gặp phải từ gõ bàn phím đến dội nhà vệ sinh hoặc ngáy. Một khía cạnh quan trọng khác là đưa cảm xúc vào lời nói sạch sẽ của chúng ta để những biểu hiện như cười hoặc khóc không bị kìm nén. Đặc điểm của môi trường mà khách hàng của chúng tôi đang tham gia các cuộc họp Nhóm trực tuyến của họ cũng có tác động mạnh đến tín hiệu lời nói. Để nắm bắt được sự đa dạng đó, chúng tôi đã đào tạo mô hình của mình với dữ liệu từ hơn 3,000 môi trường phòng thực và hơn 115,000 phòng được tạo tổng hợp.

Vì chúng tôi sử dụng học sâu nên điều quan trọng là phải có một cơ sở hạ tầng đào tạo mô hình mạnh mẽ. Chúng tôi sử dụng Microsoft Azure để cho phép nhóm của chúng tôi phát triển các phiên bản cải tiến của mô hình ML của chúng tôi. Một thách thức khác là việc tách lời nói sạch gốc khỏi tiếng ồn cần phải được thực hiện theo cách mà tai người cảm nhận là tự nhiên và dễ chịu. Vì không có số liệu khách quan nào có liên quan nhiều đến nhận thức của con người, chúng tôi đã phát triển một khuôn khổ cho phép chúng tôi gửi các mẫu âm thanh đã xử lý tới các nhà cung cấp dịch vụ cộng đồng nơi người nghe đánh giá chất lượng âm thanh của họ trên thang điểm từ một đến năm sao để đưa ra điểm số ý kiến ​​trung bình (MOS). Với những xếp hạng con người này, chúng tôi có thể phát triển một số liệu cảm nhận mới cùng với những xếp hạng chủ quan của con người cho phép chúng tôi đạt được tiến bộ nhanh chóng trong việc cải thiện chất lượng của các mô hình học sâu của chúng tôi.

Dưới đây là cách bạn có thể bật tính năng khử nhiễu trong Nhóm:

  1. Chọn ảnh hồ sơ của bạn ở trên cùng bên phải của Nhóm và sau đó chọn Cài đặt.
  2. Chọn Thiết bị (Devices) ở bên trái và sau đó, bên dưới Cách âm, chọn một tùy chọn.

  3. Từ cửa sổ Cuộc họp:
    1. Chọn Lựa chọn khác  trong các điều khiển cuộc họp của bạn và sau đó chọn Cài đặt thiết bị.
    2. Theo Cách âm, chọn một tùy chọn.

nguồn: microsoft

Thông tin thêm về các chủ đề: microsoft, Nhóm của Microsoft, Đội