一种自注意力机制的动态调整方法及系统
摘要:
本发明提供的一种自注意力机制的动态调整方法及系统,所述动态调整方法包括:设计动态调整窗口函数,用于采用注意力机制计算;动态调整自注意力机制在Transformer架构中的实现方式,控制离查询值距离不同的注意力权重。通过窗口调整函数,注意力机制计算时不必计算全局的变量,只需要计算合适范围内的值。在对模型性能损失较小的前提下降低模型的复杂度,使得模型能够处理更长的文本输入。
0/0