Tai nghe AI mới lọc tiếng ồn đám đông và tăng cường độ rõ ràng của giọng nói

Nguồn: interestingengineering
Tác giả: @IntEngineering
Ngày đăng: 10/12/2025
Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.
Đọc bài viết gốcCác nhà nghiên cứu tại Đại học Washington đã phát triển tai nghe "cô lập cuộc trò chuyện" sử dụng trí tuệ nhân tạo, giúp cải thiện đáng kể độ rõ ràng của giọng nói trong môi trường ồn ào bằng cách tự động nhận diện và khuếch đại giọng nói của người đối thoại trong khi giảm thiểu tiếng ồn nền. Khác với các thiết bị hiện có yêu cầu nhập liệu thủ công hoặc cấy ghép não xâm lấn, hệ thống này sử dụng các mô hình AI để phát hiện nhịp điệu tự nhiên của việc chuyển đổi lời nói và lọc bỏ các âm thanh không liên quan chỉ trong vòng hai đến bốn giây. Công nghệ này đã được trình bày tại Hội nghị về Phương pháp Thực nghiệm trong Xử lý Ngôn ngữ Tự nhiên và được công khai mã nguồn, với các ứng dụng tiềm năng trong máy trợ thính, tai nghe nhét tai và kính thông minh.
Trong các thử nghiệm thực tế với 11 người tham gia, tai nghe đã tăng hơn gấp đôi điểm rõ ràng và hiểu nội dung so với âm thanh chưa được lọc. Hệ thống hỗ trợ các cuộc trò chuyện có tối đa năm người nói mà không có độ trễ đáng kể và hoạt động một cách chủ động bằng cách suy đoán ý định người dùng một cách không xâm lấn. Mặc dù vẫn còn những thách thức—chẳng hạn như xử lý tình trạng nói chồng chéo hoặc bị gián đoạn—các mô hình AI đã được huấn luyện trên tiếng Anh, tiếng Quan Thoại và tiếng Nhật, với kế hoạch mở rộng sang các ngôn ngữ khác. Nguyên mẫu hiện tại sử dụng tai nghe chụp tai thương mại, nhưng nhóm nghiên cứu...
Thẻ
IoTAIsmart-headphonesspeech-recognitionnoise-cancellationhearing-aid-technologyaudio-processing