-
公开(公告)号:WO2022163985A1
公开(公告)日:2022-08-04
申请号:PCT/KR2021/017320
申请日:2021-11-23
Applicant: 주식회사 노타
Abstract: 인공지능 모델 경량화 방법 및 시스템을 개시한다. 일실시예에 따른 경량화 방법은, 경량화를 위한 추론모델을 입력받는 단계, 타겟 디바이스 풀에서 타겟 디바이스를 선택하는 단계, 압축 메서드 풀에서 압축 메서드의 조합을 선택하는 단계, 추론모델을 선택된 압축 메서드의 조합을 이용하여 압축하는 단계, 선택된 타겟 디바이스를 이용하여 압축된 추론모델의 성능을 측정하는 단계 및 측정된 성능에 기반하여 최종 경량화 추론모델을 결정하는 단계를 포함할 수 있다.