模型训练方法和装置、图像问答方法和装置

    公开(公告)号:CN113360699B

    公开(公告)日:2023-09-26

    申请号:CN202110735615.9

    申请日:2021-06-30

    发明人: 贾巍 戴岱 肖欣延

    摘要: 本公开提供了一种模型训练方法和装置,涉及计算机视觉、自然语言处理、深度学习等技术领域。具体实现方案为:获取已训练完成的问答模型,问答模型用于根据输入的问题和文本,输出文本中与问题对应的答案;获取已训练完成的图文转换模型,图文转换模型用于根据输入的图像文档,输出与图像文档对应的文本和文本特征信息;将图文转换模型输出端接入问答识别模型的输入端,并且将文本特征信息拼接入问答识别模型的嵌入层,得到图像问答网络;对图像问答网络进行训练,得到训练完成的图像问答模型,图像问答模型用于根据输入的问题和图像文档,输出图像文档中与问题对应的答案。该实施方式提高了模型训练的准确性。

    文本生成模型的训练方法、装置及电子设备

    公开(公告)号:CN111709248B

    公开(公告)日:2023-07-11

    申请号:CN202010470844.8

    申请日:2020-05-28

    摘要: 本申请公开了一种文本生成模型的训练方法、装置及电子设备,涉及自然语言处理技术领域。具体实现方案为:获取第一样本数据集,其中,第一样本数据集中包括多个第一样本数据;对多个第一样本数据分别进行结构化信息提取,以生成多个第一样本数据分别对应的目标结构化信息;将多个第一样本数据输入至初始文本生成模型,以生成多个第一样本数据分别对应的预测结构化信息;根据多个第一样本数据对应的预测结构化信息与对应的目标结构化信息的差异,生成第一损失值;根据第一损失值对初始文本生成模型进行短语生成能力训练,以生成文本生成模型。由此,通过这种文本生成模型的训练方法,解决了局部语义偏移的问题,提升了文本生成的准确度。

    视频脚本生成方法、装置、电子设备及介质

    公开(公告)号:CN114860995A

    公开(公告)日:2022-08-05

    申请号:CN202210781581.1

    申请日:2022-07-05

    摘要: 本公开提供了一种视频脚本生成方法、装置、电子设备及介质,涉及计算机视觉、自然语言处理、深度学习等人工智能技术领域,尤其涉及人机交互、智能创作等场景。实现方案为:响应于确定至少一个原始文本,从至少一个原始文本中提取多个文本单元,其中,每个文本单元中的文本内容均具有连贯的语义;基于多个文本单元之间的逻辑关系,确定视频脚本的结构框架,其中,结构框架包括具有时序关系的多个结构单元,每个结构单元对应于至少一个文本单元;以及基于结构框架,生成视频脚本。

    视频生成方法及其装置、神经网络的训练方法及其装置

    公开(公告)号:CN114254158B

    公开(公告)日:2022-06-10

    申请号:CN202210174087.9

    申请日:2022-02-25

    摘要: 本公开提供了一种视频生成方法及其装置、神经网络的训练方法及其装置,涉及人工智能领域,具体涉及自然语言处理技术、深度学习技术、和图像处理技术等。视频生成方法包括:获取文本的全局语义信息和局部语义信息,局部语义信息与文本中的文本片段对应;基于全局语义信息在数据库中进行检索,以得到对应于全局语义信息的至少一个第一数据;基于局部语义信息在数据库中进行检索,以得到与局部语义信息对应的至少一个第二数据;基于至少一个第一数据和至少一个第二数据,得到候选数据集;基于至少一个文本片段各自和候选数据集中的每一个候选数据的相关度,为至少一个文本片段匹配目标数据;以及基于至少一个文本片段各自匹配的目标数据生成视频。

    基于语义标签的文档推荐方法和装置

    公开(公告)号:CN109376309B

    公开(公告)日:2022-05-17

    申请号:CN201811621674.8

    申请日:2018-12-28

    IPC分类号: G06F16/9535

    摘要: 本申请提出一种基于语义标签的文档推荐方法和装置,其中,方法包括:通过获取每一个文档对应的第一候选标签集合,对每一个文档对应的第一候选标签集合中的每个第一候选标签进行处理得到每一个文档对应的第二候选标签集合,接着对每一个文档对应的第二候选标签集合中的每个第二候选标签进行归一处理得到每一个文档对应的第三候选标签集合,并对每一个文档对应的第三候选标签集合中的每个第三候选标签进行扩展处理得到每一个文档对应的第四候选标签集合,形成具有语义标签的文档库,根据历史语义标签在具有语义标签的文档库中获取目标文档推荐给用户。由此,本实施例中的语义标签都是无重复无歧义的,从而使文档推荐更加精准,提高用户使用体验。

    兴趣点确定方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN110297967B

    公开(公告)日:2022-04-12

    申请号:CN201910398136.5

    申请日:2019-05-14

    IPC分类号: G06F16/9535

    摘要: 本公开提供一种兴趣点确定方法、装置、设备及计算机可读存储介质,包括:通过预先训练的挖掘分类器,对网络资源进行挖掘,获取兴趣点;根据获取的兴趣点确定兴趣点间的关联关系;根据兴趣点间的关联关系确定用户的目标兴趣点。本公开提供的方法、装置、设备及计算机可读存储介质能够根据网络资源及时提取兴趣点,并构建兴趣点之间的关联,从而能够根据已知的用户信息,以及兴趣点之间的关联关系确定用户的目标兴趣点,从而再互联网资讯迭代速度较快的情况下,较快的确定用户有可能感兴趣的内容。

    用户关注点挖掘方法、装置、设备及计算机可读介质

    公开(公告)号:CN108959550B

    公开(公告)日:2022-03-25

    申请号:CN201810712526.0

    申请日:2018-06-29

    摘要: 本发明提出一种用户关注点挖掘方法,包括:获取用户检索行为数据;如果在所述用户检索行为数据中既挖掘出主题类关注点,又挖掘出实体类关注点,则对所述实体类关注点进行扩大处理,得到所述实体类关注点的关联关注点。本发明实施例通过挖掘主题类关注点,可以得到用户长期、泛化的关注点;通过挖掘实体类关注点,可以挖掘用户短期、具体的关注点;对用户的实体关注点进行扩大处理,有利于挖掘到的实体关注点更全面。因此,挖掘出的关注点更加符合用户的真实兴趣且更加全面,有利于为用户提供合适的推荐内容。