专利检索 ap:("腾讯科技(深圳)有限公司") AND inv:"刘烁" 第 1 页

1.

发明公开
一种检索模型的训练方法和相关装置审中-实审

公开(公告)号：CN115221388A

公开(公告)日：2022-10-21

申请号：CN202210886903.9

申请日：2022-07-26

申请人： 腾讯科技(深圳)有限公司

发明人： 全卫泽 , 刘烁 , 陈思宏 , 陈宸 , 严冬明

IPC分类号： G06F16/953 , G06K9/62 , G06N20/00

摘要： 本申请实施例公开了一种检索模型的训练方法和相关装置，可应用于车载场景。获取样本对中第一内容的第一向量以及第二内容的第二向量。第一向量和第二向量包括多个通道特征，各个通道特征表示的信息不同，将第一向量和第二向量输入至初始检索模型中，通过初始检索模型根据各个第一通道特征分别与至少两个第二通道特征间的关联性，得到第一向量与第二向量间的多个待定相似度，提高了不同向量包括的多个通道特征间的交互次数，加强了第一向量和第二向量间的信息交流。将多个待定相似度中最大的待定相似度作为第一向量与第二向量间的相似度，从而通过更为准确的相似度和样本标签训练初始模型的参数，得到的检索模型的准确性更高。

2.

发明公开
视频文本匹配模型训练、视频文本匹配方法和装置审中-实审

公开(公告)号：CN115204301A

公开(公告)日：2022-10-18

申请号：CN202210868349.1

申请日：2022-07-22

申请人： 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所

发明人： 刘烁 , 全卫泽 , 陈思宏 , 陈宸 , 周明 , 严冬明

IPC分类号： G06K9/62 , G06N3/08

摘要： 本申请涉及一种视频文本匹配模型训练、视频文本匹配方法、装置、计算机设备、存储介质和计算机程序产品。本申请涉及人工智能技术。所述方法包括：将训练样本对集合中训练视频对应的视频特征、参考特征和训练文本对应的训练文本特征输入初始视频文本匹配模型；参考特征包括音频特征和动作特征中的至少一种；基于同一训练视频对应的参考特征对相应的视频特征进行特征增强，得到训练视频对应的参考增强视频特征；将训练文本对应的训练文本特征，分别和训练视频对应的视频特征、参考增强视频特征进行相似度计算；基于各个训练样本对所对应的相似度集合训练初始视频文本匹配模型，得到目标视频文本匹配模型。采用本方法能够提高模型预测准确性。