December 22, 2020 – TensorMSA

음성인식에서 가장 중요한 부분은 음향모델의 입력값 잡음제거에 있다. 잡음제거를 하기 위해선 음원의 위치를 추정해야 하는데 이를 통해 잡음까지 증폭되는 것을 방지하고 순수하게 인식의 대상인 사용자의 목소리를 정확히 인지할 수가 있다. 하지만 여기서 끝은 아니다. 사람의 음성은 시계열 패턴이다. 시계열 패턴이라는 것은 선후 관계가 있다는 말인데 음성은 그렇기 때문에 20ms의 구간별 분리를 진행하여 다음에 진행될 패턴을 […]

Day: December 22, 2020

음향모델과 언어모델 그 이후에 디코더