基于梯度的Transformer模块化分解方法

    公开(公告)号:CN118586440A

    公开(公告)日:2024-09-03

    申请号:CN202410649049.3

    申请日:2024-05-23

    摘要: 本发明公开了基于梯度的Transformer模块化分解方法,涉及图像处理和计算机视觉技术领域,该基于梯度的Transformer模块化分解方法,包括以下步骤:步骤一:目标点识别,如算法1描述了基于梯度技术识别单个注意力头中的非目标节点;步骤二;存储不属于目标类模块的节点位置;步骤三:添加非目标类;步骤四:目标类模块化,将事先训练好的Transformer模型分解为一组更小且可重用的模块,通过这一独特的分解过程,生成的模块能够被灵活地重用,以构建全新的、甚至更加精准的Transformer模型,而无需从头开始进行昂贵的训练。这种模块化分解方法不仅提高了模型的灵活性和可重用性,同时降低了模型开发的成本和时间,为深度学习模型的定制和优化提供了一种高效而创新的途径。