一种模型剪枝方法及相关装置
摘要:
一种模型剪枝方法,应用于人工智能技术领域。在该方法中,通过采用聚类方法将由模型中的权重所构成的权重矩阵进行行重新排序,使得权重矩阵中具有相似分布特征的行(例如权重的值较小的行)被重新排序在一起,然后沿着列的方向对重新排序后的权重矩阵中的元素进行剪枝,能够使得权重矩阵中值较小的元素(即对模型影响较小的权重)被有规律地去除,进而使得在保证模型准确率的同时,有效地降低剪枝得到的模型的推理时延。
0/0