-
公开(公告)号:CN107273503B
公开(公告)日:2020-07-10
申请号:CN201710464118.3
申请日:2017-06-19
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F40/289 , G06F40/247 , G06N3/08
摘要: 本申请公开了用于生成同语言平行文本的方法和装置。该方法的一具体实施方式包括:获取源切分词序列和预先训练的词向量表;根据词向量表,确定与源切分词序列对应的源词向量序列;将源词向量序列导入预先训练的第一循环神经网络模型,生成用于表征源切分词序列的语义的预设维数的中间向量;将中间向量导入预先训练的第二循环神经网络模型,生成与中间向量对应的目标词向量序列;根据词向量表,确定与目标词向量序列对应的目标切分词序列,并将目标切分词序列确定为与源切分词序列对应的同语言平行文本。该实施方式降低了生成同语言平行文本的算法复杂性,减少了所需存储空间。
-
公开(公告)号:CN106528845B
公开(公告)日:2019-09-03
申请号:CN201611048764.3
申请日:2016-11-22
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/953 , G06F17/27
摘要: 本申请提出一种基于人工智能的检索纠错方法及装置,其中,该方法包括:接收用户输入的第一查询语句,根据预设的纠错策略判断所述第一查询语句是否满足纠错条件;若所述第一查询语句满足纠错条件,则确定所述第一查询语句中待纠错的第一分词;根据预设的候选召回策略,获取与所述第一分词对应的各第一候选结果;根据所述各第一候选结果的质量特征值,确定与所述第一分词对应的纠错结果;利用所述纠错结果,对所述第一查询语句进行纠错,生成第二查询语句。实现了利用历史数据,准确判断查询是否需要纠错,并对纠错候选结果进行准确筛选,确定纠错结果,提高了搜索引擎的纠错效率和准确率节省用户的查询时间,改善了用户体验。
-
公开(公告)号:CN107273503A
公开(公告)日:2017-10-20
申请号:CN201710464118.3
申请日:2017-06-19
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了用于生成同语言平行文本的方法和装置。该方法的一具体实施方式包括:获取源切分词序列和预先训练的词向量表;根据词向量表,确定与源切分词序列对应的源词向量序列;将源词向量序列导入预先训练的第一循环神经网络模型,生成用于表征源切分词序列的语义的预设维数的中间向量;将中间向量导入预先训练的第二循环神经网络模型,生成与中间向量对应的目标词向量序列;根据词向量表,确定与目标词向量序列对应的目标切分词序列,并将目标切分词序列确定为与源切分词序列对应的同语言平行文本。该实施方式降低了生成同语言平行文本的算法复杂性,减少了所需存储空间。
-
公开(公告)号:CN107133209A
公开(公告)日:2017-09-05
申请号:CN201710196125.X
申请日:2017-03-29
申请人: 北京百度网讯科技有限公司
摘要: 本发明提供一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。本发明的技术方案,能够自动生成评论语句,能够有效地节省人力成本,提高评论生成的效率。
-
公开(公告)号:CN106528845A
公开(公告)日:2017-03-22
申请号:CN201611048764.3
申请日:2016-11-22
申请人: 北京百度网讯科技有限公司
摘要: 本申请提出一种基于人工智能的检索纠错方法及装置,其中,该方法包括:接收用户输入的第一查询语句,根据预设的纠错策略判断所述第一查询语句是否满足纠错条件;若所述第一查询语句满足纠错条件,则确定所述第一查询语句中待纠错的第一分词;根据预设的候选召回策略,获取与所述第一分词对应的各第一候选结果;根据所述各第一候选结果的质量特征值,确定与所述第一分词对应的纠错结果;利用所述纠错结果,对所述第一查询语句进行纠错,生成第二查询语句。实现了利用历史数据,准确判断查询是否需要纠错,并对纠错候选结果进行准确筛选,确定纠错结果,提高了搜索引擎的纠错效率和准确率节省用户的查询时间,改善了用户体验。
-
公开(公告)号:CN107133209B
公开(公告)日:2020-11-03
申请号:CN201710196125.X
申请日:2017-03-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/289 , G06F16/2458
摘要: 本发明提供一种基于人工智能的评论生成方法及装置、设备与可读介质。其所述方法包括:从预设的分词语料库中挖掘与主题扣题的评论语句中的目标分词对齐的候选分词;分别获取目标分词的候选分词对应的对齐特征、语言特征以及上下文特征;根据目标分词的候选分词对应的对齐特征、语言特征以及上下文特征以及预先训练的可行性打分模型,预测评论语句中候选分词能够替换对应的目标分词的可行性分值;若可行性分值大于或者等于预设的可行性分数阈值,将评论语句中的目标分词替换为候选分词,生成主题对应的评论语句。本发明的技术方案,能够自动生成评论语句,能够有效地节省人力成本,提高评论生成的效率。
-
-
-
-
-