一种Transformer模型及其位置编码方法
Abstract:
本发明涉及人工智能技术领域,具体涉及一种Transformer模型及其位置编码方法,方法包括:获取待处理特征点的位置坐标;生成多个映射向量,多个映射向量的方向的数量大于待处理特征点位置坐标的维度;根据位置坐标和映射向量进行三角函数运算得到位置编码结果。通过实施本发明,生成多个映射向量,多个映射向量的方向的数量大于待处理特征点位置坐标的维度,从而增加了进行位置编码时的方向,在不影响模型训练与推理速度的同时,提升了模型的性能。
Patent Agency Ranking
0/0