신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
출원인
한국전자통신연구원, 연세대학교 산학협력단
출원일
2021.04.15
공개일
2022.10.24
게시글 내용
신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기가 개시된다. 본 발명의 일실시예에 따른 신경망 모델을 이용한 오디오 신호의 부호화 방법은 입력 신호를 식별하는 단계; 상기 입력 신호를 부호화하는 신경망 모델에 상기 입력 신호를 입력함으로써 양자화된 잠재 벡터들을 생성하는 단계; 및 상기 양자화된 잠재 벡터에 대응하는 비트스트림을 생성하는 단계를 포함하고, 상기 신경망 모델은, i) 상기 입력 신호의 특징을 추출하여 잠재 벡터를 생성하는 특징 추출 계층, ii) 상기 잠재 벡터를 다운 샘플링하는 복수의 다운 샘플링 블록, iii) 다운 샘플링된 잠재 벡터의 양자화를 수행하는 복수의 양자화 블록을 포함할 수 있다.