건물 온도조절 방법은 온도조절장치가 건물의 환경정보 및 재실자 정보를 획득하는 단계; 상기 온도조절장치가 상기 건물 환경정보 및 재실자 정보를 제1 분석모델에 입력하는 단계: 상기 온도조절장치가 상기 제1 분석모델이 출력하는 값을 기초로 상기 건물 내 장치를 제어하여 상기 건물의 온도를 조절하는 단계;를 포함하되 상기 제1 분석모델은 강화학습으로 학습된 딥러닝 모델이고 상기 강화학습은 상기 제1 분석모델이 상기 건물을 제어하는데 필요한 행동값을 출력하게 한 뒤, 상기 계산된 행동값에 따른 패널티을 계산하고, 상기 패널티를 최소화 할 수 있도록 상기 제1 분석모델의 파라미터를 조절하는 것을 포함하고 상기 행동값에 따른 패널티 계산하는 것은 상기 행동값에 기초하여 상기 건물 내 장치를 제어한 결과로 획득한 상기 건물의 제1 온도와 상기 건물 내 장치를 수동제어 한 결과 및 재실자의 온도 만족도를 기초로 분석된 제2온도를 비교하여, 상기 제1온도가 상기 제2온도의 미리 설정된 범위내에 속하였는지를 판단하여, 범위내 속하면 보상을 주도록 계산하고, 범위내 속하지 아니하면 패널티를 주도록 계산하는 것을 포함하고 상기 제2온도는 상기 건물의 에너지 소비량이 최소가 되는 온도와 상기 재실자가 퀘적함을 느끼는 온도와의 균형을 취한 온도를 포함하며 상기 재실자가 퀘적함을 느끼는 온도는 재실자가 만족하는 예상 평균 온열감(Predicted Mean Vote , PMV)을 기초로 계산된 온도를 포함할 수 있다.