信息搜索方法、装置、电子设备和存储介质

    公开(公告)号:CN113868519A

    公开(公告)日:2021-12-31

    申请号:CN202111101827.8

    申请日:2021-09-18

    摘要: 本公开提供了信息搜索方法、装置、电子设备和存储介质,涉及人工智能技术领域中的深度学习、自然语言处理和知识图谱领域。具体实现方案为:获取至少包括待搜索问题的搜索词,并获取搜索词的初始文本向量表示,获取搜索词对应的视频,并获取视频的多模态向量表示,从初始文本向量表示开始,根据多模态向量表示和当前轮次的搜索词的文本向量表示,对视频和搜索词进行N轮交互,以生成目标融合向量表示,基于目标融合向量表示,对视频进行标注,以获取与待搜索问题匹配的目标视频帧。通过视频和搜索词的N轮交互实现对待搜索问题和待搜索问题对应的视频的多层迭代理解,增强信息搜索的效果。

    模型预训练方法、装置、电子设备和存储介质

    公开(公告)号:CN113641830A

    公开(公告)日:2021-11-12

    申请号:CN202110815302.4

    申请日:2021-07-19

    摘要: 本公开提供了一种模型预训练方法、装置、电子设备和存储介质,涉及自然语言处理、深度学习、知识图谱等领域。具体实现方案为:根据输入信息,从知识图谱中查询以确定与输入信息匹配的第一知识子图,采用预训练模型中的编码器对输入信息进行编码,以得到输入信息的语义表示,并采用预训练模型中的解码器对语义表示进行解码,以生成语义表示对应的第二知识子图,根据第一知识子图和第二知识子图之间的差异,对编码器和解码器进行修正,以使差异最小化。由此,可以使得模型在预训练的过程中,学习到知识图谱中蕴含的丰富和复杂的知识,从而提升模型的预测效果。

    结构化问答模型的获取方法、问答方法及对应装置

    公开(公告)号:CN113641805A

    公开(公告)日:2021-11-12

    申请号:CN202110814649.7

    申请日:2021-07-19

    摘要: 本公开公开了一种结构化问答模型的获取方法、问答方法及对应装置,涉及人工智能技术领域下的知识图谱、深度学习等技术。具体实现方案为:获取N个结构化问答数据库类型对应的训练样本,各训练样本包括问题样本、结构化问答数据库类型信息和该问题样本查询该类型的结构化问答数据库采用的查询指令样本,所述N为大于1的整数;利用所述训练样本训练文本生成模型得到所述结构化问答模型,其中,将问题样本和结构化问答数据库类型信息作为所述文本生成模型的输入,将所述查询指令样本作为所述文本生成模型的目标输出。本公开所提供的技术方案能够提升问答效果。

    用于生成神经网络的方法和装置

    公开(公告)号:CN109902186B

    公开(公告)日:2021-05-11

    申请号:CN201910184509.9

    申请日:2019-03-12

    IPC分类号: G06F16/36 G06N3/04 G06N3/08

    摘要: 本公开的实施例公开了用于生成神经网络的方法和装置。该方法的一具体实施方式包括:获取目标神经网络,其中,目标神经网络对应预设关联关系,用于将目标知识图谱中的两个实体所对应的两个实体向量作为输入,以确定所输入的两个实体向量所对应的两个实体的关联关系是否为预设关联关系,目标神经网络包括针对预设关联关系预先确定的关系张量;将目标神经网络中的关系张量转化为目标数量个关系矩阵的积,生成包括转化成的目标数量个关系矩阵的候选神经网络;利用候选神经网络,生成结果神经网络。该实施方式可以减小神经网络的复杂程度,有助于在利用神经网络进行信息处理时,减小CPU的消耗,提高信息处理的效率。

    基于人工智能的地域性信息确定方法和装置

    公开(公告)号:CN107193974B

    公开(公告)日:2020-11-10

    申请号:CN201710379623.8

    申请日:2017-05-25

    IPC分类号: G06F16/35 G06F16/33 G06F16/29

    摘要: 本申请公开了基于人工智能的地域性信息确定方法和装置。该方法的一具体实施方式包括:获取待确定信息,并提取待确定信息的关键词集合;将待确定信息的关键词集合输入至预先训练的主题分类模型进行分类,得到待确定信息的主题类别,其中,主题分类模型用于表征信息的关键词集合和信息的主题类别的对应关系;从预先存储的地名词汇集合中选取出与待确定信息的主题类别相对应的地名词汇作为目标地名词汇集合;将目标地名词汇集合在待确定信息中进行匹配;根据匹配结果,确定待确定信息是否属于地域性信息。该实施方式提高了地域性信息的确定准确率,从而有助于实现富于针对性的信息推送。

    基于人工智能的生成文章的方法和装置

    公开(公告)号:CN107193792B

    公开(公告)日:2020-10-02

    申请号:CN201710352222.3

    申请日:2017-05-18

    发明人: 刘凯 刘昊 吕雅娟

    摘要: 本申请公开了基于人工智能的生成文章的方法和装置。该方法的一具体实施方式包括:获取用于生成文章的预定结构数据;将上述预定结构数据通过句子生成模型生成候选句子;按照包含预设信息点的句子出现的概率选择候选句子拼接形成篇章,其中,每选择一个候选句子,根据预设剔除规则剔除与已选择的候选句子相关的候选句子;响应于没有可用的候选句子,基于拼接所形成的篇章生成文章。该实施方式可以提高生成文章的有效性。

    基于人工智能的信息处理方法和装置

    公开(公告)号:CN107273508B

    公开(公告)日:2020-07-10

    申请号:CN201710470407.4

    申请日:2017-06-20

    IPC分类号: G06F16/9535 G06N5/00

    摘要: 本申请公开了基于人工智能的信息处理方法和装置。该方法的一具体实施方式包括:获取在预定时间段内记录的搜索点击信息,其中,该搜索点击信息包括在该预定时间段所包含的每个单位时间段内被搜索的词条和各词条在该单位时间段内的点击量;从该搜索点击信息中选取在预设单位时间段内点击量超出点击量阈值的词条生成候选词条集合;对于该候选词条集合中的每个候选词条,将该候选词条在该预定时间段内所对应的各个点击量按照时间先后顺序形成点击量序列;基于各点击量序列,确定与各点击量序列分别对应的候选词条的类别;将类别为预设类别的候选词条作为兴趣点并生成兴趣点集合。该实施方式实现了富于针对性的信息处理。

    检索处理方法和装置
    18.
    发明授权

    公开(公告)号:CN105912631B

    公开(公告)日:2019-07-05

    申请号:CN201610214481.5

    申请日:2016-04-07

    IPC分类号: G06F16/9535

    摘要: 本发明公开了一种检索处理方法和装置,其中,方法包括:对网页信息进行主题切分,确定各主题范围;根据各主题范围的内容确定各主题的主旨信息以及主题摘要;根据各主题的主旨信息以及主题摘要建立与网页信息对应的索引,以便根据索引进行检索。本发明通过将索引粒度设置为主题,提高了检索结果和用户需求的相关度,提升了用户的满足度。

    基于语义标签的文档推荐方法和装置

    公开(公告)号:CN109376309A

    公开(公告)日:2019-02-22

    申请号:CN201811621674.8

    申请日:2018-12-28

    IPC分类号: G06F16/9535

    摘要: 本申请提出一种基于语义标签的文档推荐方法和装置,其中,方法包括:通过获取每一个文档对应的第一候选标签集合,对每一个文档对应的第一候选标签集合中的每个第一候选标签进行处理得到每一个文档对应的第二候选标签集合,接着对每一个文档对应的第二候选标签集合中的每个第二候选标签进行归一处理得到每一个文档对应的第三候选标签集合,并对每一个文档对应的第三候选标签集合中的每个第三候选标签进行扩展处理得到每一个文档对应的第四候选标签集合,形成具有语义标签的文档库,根据历史语义标签在具有语义标签的文档库中获取目标文档推荐给用户。由此,本实施例中的语义标签都是无重复无歧义的,从而使文档推荐更加精准,提高用户使用体验。

    时间跟踪方法、装置、设备及计算机可读介质

    公开(公告)号:CN108921096A

    公开(公告)日:2018-11-30

    申请号:CN201810714499.0

    申请日:2018-06-29

    IPC分类号: G06K9/00 G06K9/62 G10L15/26

    摘要: 本发明提出一种时间跟踪方法、装置、设备及计算机可读介质,时间跟踪方法包括:获取终端设备在预设时间范围内采集的图像和语音;对所述图像进行图像识别,对所述语音进行语音识别,并根据所述图像识别和所述语音识别的结果,确定所述终端设备所处的场景类别;根据所述预设时间范围,确定所述终端设备所处的场景类别关联的时间信息。上述技术方案可扩大时间跟踪的范围,帮助用户掌握更精准的时间消耗分布。