特征提取模型训练、媒体数据检索方法和装置

    公开(公告)号:CN114329053B

    公开(公告)日:2024-09-10

    申请号:CN202210016222.7

    申请日:2022-01-07

    摘要: 本申请涉及一种特征提取模型训练、媒体数据检索方法、装置、计算机设备、存储介质和计算机程序产品,本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:通过初始文本特征提取模型提取问题文本、目标答案和候选答案的特征得到问题文本特征、目标答案特征和候选答案特征,通过初始媒体特征提取模型提取训练媒体数据对应的特征得到训练媒体特征,通过初始媒体文本交互模型对问题文本特征和训练媒体特征进行特征交互得到预测答案特征;基于预测答案特征分别和目标答案特征、候选答案特征的相似度调整各个模型的模型参数,直至满足收敛条件,得到用于提高检索准确性的目标文本特征提取模型和目标媒体特征提取模型。

    三维模型的重建方法、装置、设备及存储介质

    公开(公告)号:CN117218278A

    公开(公告)日:2023-12-12

    申请号:CN202310315796.9

    申请日:2023-03-16

    摘要: 本申请实施例公开了一种三维模型的重建方法、装置、设备及存储介质,属于三维重建技术领域。该方法包括:获取彩色图像序列,所述彩色图像序列中包含至少两张彩色图像,所述至少两张彩色图像为不同视角下对目标场景进行拍摄得到;基于所述彩色图像序列,确定所述目标场景对应的符号距离场,以及所述目标场景中各个空间点对应的几何特征;基于所述符号距离场以及所述几何特征,确定各个视角下所述彩色图像对应的渲染图像;基于所述彩色图像与所述渲染图像之间的颜色差异,对所述符号距离场进行细节优化,得到优化后的符号距离场;基于所述优化后的符号距离场进行三维重建,得到所述目标场景对应的三维模型;提高了三维模型重建的准确性。

    一种视频检测方法、系统及存储介质和服务器

    公开(公告)号:CN114581821A

    公开(公告)日:2022-06-03

    申请号:CN202210166453.6

    申请日:2022-02-23

    摘要: 本发明实施例公开了一种视频检测方法、系统及存储介质和服务器,应用于基于人工智能的信息处理技术领域。视频检测系统会将目标视频分为多个模态的目标检测数据,分别获取到对应的单模态注意特征,再将这些单模态注意特征进行融合得到目标视频的全局特征,然后获取到全局特征与特定检测信息之间的相似性特征信息,并基于相似性特征信息确定与特定检测信息相关的视频片段。这样通过对各个模态的目标检测数据的单独处理,可以较精确地获取目标视频中包含的所有类型的信息,进而将各个单模态注意特征融合得到的全局特征能更真实地反映目标视频,最终确定的视频片段也更准确。

    特征提取模型训练、媒体数据检索方法和装置

    公开(公告)号:CN114329053A

    公开(公告)日:2022-04-12

    申请号:CN202210016222.7

    申请日:2022-01-07

    摘要: 本申请涉及一种特征提取模型训练、媒体数据检索方法、装置、计算机设备、存储介质和计算机程序产品,本发明实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:通过初始文本特征提取模型提取问题文本、目标答案和候选答案的特征得到问题文本特征、目标答案特征和候选答案特征,通过初始媒体特征提取模型提取训练媒体数据对应的特征得到训练媒体特征,通过初始媒体文本交互模型对问题文本特征和训练媒体特征进行特征交互得到预测答案特征;基于预测答案特征分别和目标答案特征、候选答案特征的相似度调整各个模型的模型参数,直至满足收敛条件,得到用于提高检索准确性的目标文本特征提取模型和目标媒体特征提取模型。