소음 측정기 - 소음 억제에 대한 더 깊은 이해를 얻으세요.
소음 억제(원격 청취자가 명확하게 들을 수 있도록 스피커 환경 소음을 억제)와 능동 소음 감소(청취자 자신의 환경 소음 상쇄) 간의 기본적인 차이점을 이해한 후 소음 억제를 달성하는 방법에 중점을 두겠습니다.
한 가지 방법은 여러 개의 마이크를 사용하여 데이터를 억제하는 것입니다. 여러 위치에서 데이터를 수집하면 장치가 유사한(그러나 여전히 차별화된) 신호를 수신하게 됩니다. 말하는 사람 근처의 마이크가 수신하는 음성 신호는 보조 마이크의 음성 신호보다 훨씬 더 강력합니다. 두 개의 마이크는 비슷한 신호 강도로 비음성 배경음을 수신합니다. 강한 음성 마이크와 보조 마이크에서 수집한 소리 정보를 빼고 나머지 대부분이 음성 정보입니다. 마이크 사이의 거리가 멀수록 가깝고 먼 마이크 사이의 신호 차이가 커지므로 이 간단한 알고리즘을 사용하여 소음을 억제하는 것이 더 쉬워집니다. 그러나 말을 하지 않거나 시간이 지남에 따라 음성 데이터가 변경될 것으로 예상되는 경우(예: 걷거나 뛸 때 휴대전화가 계속 흔들리는 경우)에는 이 방법의 효율성이 떨어집니다. 다중 마이크 소음 억제는 확실히 신뢰할 수 있지만 추가 하드웨어 및 처리에는 단점이 있습니다.
그렇다면 마이크가 하나만 있다면 어떨까요? 검증/비교를 위해 추가 음원을 사용하지 않는 경우 단일 마이크 솔루션은 수신된 소음 특성을 이해하고 이를 필터링하는 데 의존합니다. 이는 앞서 언급한 정상 상태 및 비정상 소음의 정의와 관련이 있습니다. 정상 상태 잡음은 DSP 알고리즘을 통해 효과적으로 필터링할 수 있지만, 비정상 잡음은 문제를 야기하지만 심층 신경망(DNN)은 문제 해결에 도움이 될 수 있습니다.
이 방법을 사용하려면 네트워크 훈련을 위한 데이터 세트가 필요합니다. 이 데이터 세트는 다양한(정상 상태 및 비정상) 소음과 명확한 음성으로 구성되어 합성된 시끄러운 음성 패턴을 생성합니다. 데이터 세트를 DNN에 대한 입력으로 공급하고 명확한 음성으로 출력합니다. 이렇게 하면 잡음을 제거하고 명확한 음성만 출력하는 신경망 모델이 생성됩니다.
훈련된 DNN을 사용하더라도 고려해야 할 몇 가지 과제와 지표가 여전히 있습니다. 짧은 대기 시간으로 실시간으로 실행하려면 강력한 처리 능력이나 더 작은 DNN이 필요합니다. DNN의 매개변수가 많을수록 실행 속도가 느려집니다. 오디오 샘플링 속도는 소리 억제에 비슷한 영향을 미칩니다. 샘플링 속도가 높을수록 DNN은 더 많은 매개변수를 처리해야 하지만 결과적으로 더 높은 품질의 출력을 달성하게 됩니다. 협대역 음성 통신은 실시간 소음 억제를 위한 이상적인 선택입니다.
이러한 유형의 처리는 모두 집약적인 작업이며 클라우드 컴퓨팅은 이러한 작업을 완료하는 데 매우 능숙하지만 이 방법은 대기 시간을 크게 늘립니다. 인간이 약 108밀리초 이상의 지연을 확실하게 구분할 수 있다는 점을 고려하면, 클라우드 컴퓨팅 처리로 인해 발생하는 추가 지연은 분명히 이상적인 결과가 아닙니다. 그러나 엣지에서 DNN을 실행하려면 몇 가지 영리한 조정이 필요합니다. CEVA는 항상 음성 및 음성 처리 기능을 개선하기 위해 최선을 다하고 있습니다. 여기에는 검증된 음성 선명도 및 명령 인식 알고리즘이 포함됩니다. 이러한 알고리즘은 가장자리에서도 명확한 통신 및 음성 제어를 제공합니다. 저희에게 연락하셔서 직접 들어보시는 것을 환영합니다.