형태 변형에 대응하는 강화학습방법 및 추론 방법은 모델 구축 장치가 경험 경로들을 샘플링하는 단계 및 상기 모델 구축 장치가 서로 다른 형태(morphology)를 갖는 다수의 에이전트들을 학습 대상으로 삼는 강화학습모델을 학습하는 단계를 포함한다. 상기 모델 구축 장치가 상기 학습 과정에서 상기 다수의 에이전트들에 대한 보행 경로에 대한 태스크 스킬 및 상기 에이전트들 각각의 행동을 액터 스킬로 임베딩한다. 나아가 추론 장치가 형태 변경에 대응하여 제로 샷 추론을 하거나, 필요한 경우 애드-온 학습을 수행하여 추론한다.