-
公开(公告)号:CN107273503B
公开(公告)日:2020-07-10
申请号:CN201710464118.3
申请日:2017-06-19
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F40/289 , G06F40/247 , G06N3/08
摘要: 本申请公开了用于生成同语言平行文本的方法和装置。该方法的一具体实施方式包括:获取源切分词序列和预先训练的词向量表;根据词向量表,确定与源切分词序列对应的源词向量序列;将源词向量序列导入预先训练的第一循环神经网络模型,生成用于表征源切分词序列的语义的预设维数的中间向量;将中间向量导入预先训练的第二循环神经网络模型,生成与中间向量对应的目标词向量序列;根据词向量表,确定与目标词向量序列对应的目标切分词序列,并将目标切分词序列确定为与源切分词序列对应的同语言平行文本。该实施方式降低了生成同语言平行文本的算法复杂性,减少了所需存储空间。
-
公开(公告)号:CN107133209A
公开(公告)日:2017-09-05
申请号:CN201710196125.X
申请日:2017-03-29
申请人: 北京百度网讯科技有限公司
摘要: 本发明提供一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。本发明的技术方案,能够自动生成评论语句,能够有效地节省人力成本,提高评论生成的效率。
-
公开(公告)号:CN106407332A
公开(公告)日:2017-02-15
申请号:CN201610801209.7
申请日:2016-09-05
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/30
摘要: 本发明提出一种基于人工智能的搜索方法和装置,其中,该基于人工智能的搜索方法,包括以下步骤:接收用户输入的搜索词;根据所述搜索词确定所述用户的语言需求类型;以及根据所述用户的语言需求类型获取所述搜索词对应的搜索结果,并提供给所述用户。本发明的实施例,通过对用户的特定语言类型的搜索需求的识别,对用户的搜索词从语言需求的维度进行划分,从而满足用户对不同语言类型的搜索需求,提升搜索的准确率和效率,节省用户的搜索时间。
-
公开(公告)号:CN107133209B
公开(公告)日:2020-11-03
申请号:CN201710196125.X
申请日:2017-03-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/289 , G06F16/2458
摘要: 本发明提供一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。本发明的技术方案,能够自动生成评论语句,能够有效地节省人力成本,提高评论生成的效率。
-
公开(公告)号:CN106407332B
公开(公告)日:2020-01-07
申请号:CN201610801209.7
申请日:2016-09-05
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/953
摘要: 本发明提出一种基于人工智能的搜索方法和装置,其中,该基于人工智能的搜索方法,包括以下步骤:接收用户输入的搜索词;根据所述搜索词确定所述用户的语言需求类型;以及根据所述用户的语言需求类型获取所述搜索词对应的搜索结果,并提供给所述用户。本发明的实施例,通过对用户的特定语言类型的搜索需求的识别,对用户的搜索词从语言需求的维度进行划分,从而满足用户对不同语言类型的搜索需求,提升搜索的准确率和效率,节省用户的搜索时间。
-
公开(公告)号:CN107273503A
公开(公告)日:2017-10-20
申请号:CN201710464118.3
申请日:2017-06-19
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了用于生成同语言平行文本的方法和装置。该方法的一具体实施方式包括:获取源切分词序列和预先训练的词向量表;根据词向量表,确定与源切分词序列对应的源词向量序列;将源词向量序列导入预先训练的第一循环神经网络模型,生成用于表征源切分词序列的语义的预设维数的中间向量;将中间向量导入预先训练的第二循环神经网络模型,生成与中间向量对应的目标词向量序列;根据词向量表,确定与目标词向量序列对应的目标切分词序列,并将目标切分词序列确定为与源切分词序列对应的同语言平行文本。该实施方式降低了生成同语言平行文本的算法复杂性,减少了所需存储空间。
-
-
-
-
-