본 발명의 일 실시예에 따른 본 발명의 일 실시예에 따른 오디오 신호 처리 방법은, 부호화 전의 입력 신호와 양자화 및 복호화를 거친 출력 신호를 획득하는 단계; 입력 신호와 출력 신호의 프레임에 대한 지각적 전역 손실(perceptual global loss)을 계산하는 단계; 입력 신호와 출력 신호에 윈도윙 함수(windowing function)를 적용하여 입력 신호와 출력 신호의 복수 개의 서브 프레임(subframe)을 획득하는 단계; 입력 신호와 출력 신호의 복수 개의 서브 프레임에 대한 지각적 지역 손실(perceptual local loss)을 계산하는 단계; 및 상기 지각적 전역 손실과 상기 지각적 지역 손실에 기반하여, 다중 시간 스케일 지각적 손실을 획득하는 단계를 포함한다.