发明公开
- 专利标题: 一种模型剪枝方法及相关装置
-
申请号: CN202211249989.0申请日: 2022-10-12
-
公开(公告)号: CN117933312A公开(公告)日: 2024-04-26
- 发明人: 于献智 , 谭懿峻 , 赵亢 , 胡婷 , 姚骏 , 韩凯 , 王云鹤 , 舒晗
- 申请人: 华为技术有限公司
- 申请人地址: 广东省深圳市龙岗区坂田华为总部办公楼
- 专利权人: 华为技术有限公司
- 当前专利权人: 华为技术有限公司
- 当前专利权人地址: 广东省深圳市龙岗区坂田华为总部办公楼
- 代理机构: 深圳市深佳知识产权代理事务所
- 代理商 邱青云
- 主分类号: G06N3/0464
- IPC分类号: G06N3/0464 ; G06N3/082
摘要:
一种模型剪枝方法,应用于人工智能技术领域。在该方法中,通过采用聚类方法将由模型中的权重所构成的权重矩阵进行行重新排序,使得权重矩阵中具有相似分布特征的行(例如权重的值较小的行)被重新排序在一起,然后沿着列的方向对重新排序后的权重矩阵中的元素进行剪枝,能够使得权重矩阵中值较小的元素(即对模型影响较小的权重)被有规律地去除,进而使得在保证模型准确率的同时,有效地降低剪枝得到的模型的推理时延。