描述文本生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN115221331A

    公开(公告)日:2022-10-21

    申请号:CN202110421112.4

    申请日:2021-04-19

    摘要: 本申请是关于一种描述文本生成方法、装置、计算机设备及存储介质。涉及互联网技术领域。该方法包括:构建目标对象对应的对象知识图谱,对象知识图谱用于表征目标对象对应属性实体词和属性特征词之间的关系;将对象知识图谱输入属性预测模型中,得到属性预测模型输出的属性序列,属性预测模型用于预测与生成目标对象对应对象描述文本相关的对象属性,属性序列中包含至少一个对象属性;将对象知识图谱和属性序列输入文本生成模型,得到文本生成模型输出的对象描述文本,文本生成模型用于根据对象知识图谱生成各个对象属性对应的描述语句,并基于描述语句组成对象描述文本。实现了自动化的对象描述文本生成过程,有利于提高对象描述文本的生成效率。

    远程监督命名实体识别数据的降噪方法及装置

    公开(公告)号:CN114757190A

    公开(公告)日:2022-07-15

    申请号:CN202011564259.0

    申请日:2020-12-25

    IPC分类号: G06F40/295 G06K9/62 G06N3/08

    摘要: 本申请实施例提供一种远程监督命名实体识别数据的降噪方法及装置,涉及自然语言处理领域,能够提升降噪性能。该方法包括:获取多个标注语料集以及该多个标注语料集各自的总体噪声率,一个标注语料集包含多个标注语料,该多个标注语料是对多个语料进行命名实体标注得到的结果;然后将该多个标注语料集作为训练集,基于该多个标注语料集各自的总体噪声率,训练得到目标神经网络模型;并基于目标神经网络模型,确定第一标注语料集包含的多个标注语料的置信度;以及根据第一标注语料集包含的多个标注语料的置信度以及第一标注语料集的总体噪声率,确定第一标注语料集中的噪声语料,并且删除第一标注语料集中的噪声语料。

    视频时刻检索模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN115481279A

    公开(公告)日:2022-12-16

    申请号:CN202110594901.8

    申请日:2021-05-28

    摘要: 本申请公开了一种视频时刻检索模型的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法通过第一视频时刻检索模型得到样本数据的预测置信信息和预测视频帧边界后,获取该样本数据的平滑标签,该平滑标签能够模糊参考视频帧边界,减少噪声对模型训练的影响,通过样本数据的平滑标签、预测置信信息、预测视频帧边界和对应的参考视频帧边界,获取该样本视频的第一损失,并基于第一损失符合条件的样本视频,训练第二视频时刻检索模型,避免在训练过程中出现同一个模型的误差累积现象,进一步提升模型训练效果,因此,本申请提出的方法能够减少噪声对模型训练的不利影响,同时提升模型训练效果,从而有效提高视频时刻检索模型的准确率。

    一种视频问题生成方法及装置
    4.
    发明公开

    公开(公告)号:CN114764456A

    公开(公告)日:2022-07-19

    申请号:CN202011599960.6

    申请日:2020-12-30

    摘要: 本申请提供了一种视频问题生成方法及装置,涉及人工智能AI领域,该方法在执行时,可先获取视频信息以及与视频信息相关的N条历史对话记录信息;其中,N大于或等于1;利用第一神经网络模型从视频信息中提取视觉特征信息,以及利用第二神经网络模型从每条历史对话记录信息中提取对话特征信息;针对每条历史对话记录信息,基于多注意力机制的融合模型对视觉特征信息以及对话特征信息进行特征融合,确定对话特征信息对视觉特征信息的第一表征,以及视觉特征信息对对话特征信息的第二表征;针对每条历史对话记录信息,通过问题生成模型对第一表征以及第二表征进行特征提取,生成与视频信息对应的视频备选问题。通过方式获取的视频问题更加可靠。