개시된 실시예는 서버가 매우 적은 양의 임베딩 동기용 학습 데이터를 기반으로 얕은 수준에서 우선 학습되고, 학습에 의해 획득된 모델 파라미터를 다수의 로컬 디바이스로 1회 브로드캐스팅하여 동기화를 수행하며, 다수의 로컬 디바이스 각각은 개별적으로 수집한 로컬 학습 데이터를 기반으로 로컬 학습을 수행하면서 로컬 학습 데이터에서 추출된 임베딩 벡터를 업로드함으로써, 업링크 트래픽과 지연 시간을 크게 저감시킬 수 있는 원샷 분산 특징 학습 장치 및 방법을 제공한다.