개시된 실시예는 비디오를 인가받아 다수의 인스턴스로 구분하고, 구분된 다수의 인스턴스 각각에 대해 인공 신경망으로 신경망 연산하여 다수의 시간적 특징을 추출하며, 추출된 다수의 시간적 특징에 대해 인공 신경망으로 신경망 연산하여 각 인스턴스에 대한 다수의 모션 특징과 다수의 객체 특징을 추출하고, 추출된 다수의 모션 특징과 다수의 객체 특징 사이의 관계를 추정하여 다수의 관계 특징을 획득하며, 다수의 시간적 특징과 다수의 관계 특징 각각으로부터 다수의 시간적 이상 점수와 다수의 관계 이상 점수를 획득하고, 각 시간적 이상 점수에 대응하는 관계 이상 점수를 가중하여 각 인스턴스에 이상 행동이 포함되어 있는지를 판별하기 위한 다수의 이상 점수를 획득하여, 시간적 연속성뿐만 아니라 주변 환경과의 관계를 고려하여 이상 상황을 판별함으로써, 이상 상황을 정확하게 판정할 수 있을 뿐만 아니라 정상 비디오에서 획득된 모든 인스턴스를 학습에 활용하여 높은 효율성으로 학습될 수 있는 비디오 이상 상황 감지 장치 및 방법을 제공한다.