-
公开(公告)号:CN108052658B
公开(公告)日:2021-12-21
申请号:CN201711461409.3
申请日:2017-12-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06F40/232
摘要: 本发明公开了一种基于人工智能的查询信息纠错构架生成方法和装置,其中,基于人工智能的查询信息纠错构架生成方法包括:获取应用场景信息;根据应用场景信息确定纠错需求信息;根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。本发明实施例的基于人工智能的查询信息纠错构架生成方法和装置,通过获取应用场景信息,并根据应用场景信息确定纠错需求信息,以及根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架,能够针对不同应用场景,灵活地生成与其相对应的纠错框架,更加符合需求。
-
公开(公告)号:CN107918605B
公开(公告)日:2021-08-20
申请号:CN201711176381.9
申请日:2017-11-22
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/289
摘要: 本发明提出一种分词处理方法、装置、移动终端及计算机可读存储介质,其中,该方法包括:分别获取待分词语句中各单字对应的第一特征向量、两字对应的第二特征向量,及待分词语句中专有名词对应的第三特征向量;根据第一特征向量、第二特征向量及第三特征向量,确定各单字当前的第四特征向量;根据预设的汉字标签转移矩阵及各单字当前的第四特征向量,将待分词语句进行分词处理,确定待分词语句对应的第一分词结果;根据预设的专有名词词典及切分规则,对第一分词结果进行修正,确定待分词语句对应的第二分词结果。由此,实现了对待分词语句的分词处理,有效避免了由于专有名词导致的分词准确率下降的问题,提高了分词结果的准确性和可靠性,改善了用户体验。
-
公开(公告)号:CN112580324A
公开(公告)日:2021-03-30
申请号:CN202011548334.4
申请日:2020-12-24
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/194
摘要: 本公开公开了文本纠错方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及深度学习、自然语言处理等人工智能技术领域。具体实现方案为:获取待处理的文本,以及所述文本所属的目标场景;获取所述目标场景下的词语替换表,并结合所述目标场景下的词语替换表,获取所述文本中的各个错误词语,以及每个错误词语对应的候选词语列表;从所述各个错误词语对应的候选词语列表中,选择所述各个错误词语对应的待替换词语;结合所述各个错误词语对应的待替换词语,对所述文本进行纠错处理,得到纠错后文本。由此,实现了基于目标场景下的词语替换表,对目标场景下的文本进行纠错,提高了目标场景下的文本纠错准确率。
-
公开(公告)号:CN107621892B
公开(公告)日:2021-03-09
申请号:CN201710970949.8
申请日:2017-10-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F3/023
摘要: 本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括:接收查询信息,上述查询信息包括拼音查询信息和/或语义查询信息,其中,上述拼音查询信息用于查询与拼音查询信息对应的词条,上述语义查询信息用于通过词向量相似度来查询与语义查询信息对应的词条,上述词向量相似度通过词条在向量空间上的距离来表征;从词条库中查询对应上述查询信息的候选词条;对候选词条进行排序并显示。该实施方式能够获取到同时满足拼音查询信息和语义查询信息要求的候选词条,提高了用户获取词条的准确性。
-
公开(公告)号:CN110232129B
公开(公告)日:2020-09-29
申请号:CN201910502574.1
申请日:2019-06-11
申请人: 北京百度网讯科技有限公司
摘要: 本发明实施例提出一种场景纠错方法、装置、设备和存储介质。该方法包括:利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;挖掘所述场景知识的关联知识;利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。本发明实施例充分利用场景知识对训练样本进行语义理解,能够得到更精细的语义特征,提升纠错模型效果;并且,充分利用场景知识,挖掘关联知识,辅助纠错模型进行决策。
-
公开(公告)号:CN110232129A
公开(公告)日:2019-09-13
申请号:CN201910502574.1
申请日:2019-06-11
申请人: 北京百度网讯科技有限公司
摘要: 本发明实施例提出一种场景纠错方法、装置、设备和存储介质。该方法包括:利用目标场景的场景知识对训练样本进行语义理解,得到语义特征;挖掘所述场景知识的关联知识;利用所述语义特征、所述场景知识和所述关联知识训练得到场景纠错模型,所述场景纠错模型用于对输入文本进行场景纠错。本发明实施例充分利用场景知识对训练样本进行语义理解,能够得到更精细的语义特征,提升纠错模型效果;并且,充分利用场景知识,挖掘关联知识,辅助纠错模型进行决策。
-
公开(公告)号:CN108052658A
公开(公告)日:2018-05-18
申请号:CN201711461409.3
申请日:2017-12-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种基于人工智能的查询信息纠错构架生成方法和装置,其中,基于人工智能的查询信息纠错构架生成方法包括:获取应用场景信息;根据应用场景信息确定纠错需求信息;根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。本发明实施例的基于人工智能的查询信息纠错构架生成方法和装置,通过获取应用场景信息,并根据应用场景信息确定纠错需求信息,以及根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架,能够针对不同应用场景,灵活地生成与其相对应的纠错框架,更加符合需求。
-
公开(公告)号:CN107918605A
公开(公告)日:2018-04-17
申请号:CN201711176381.9
申请日:2017-11-22
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/2775
摘要: 本发明提出一种分词处理方法、装置、移动终端及计算机可读存储介质,其中,该方法包括:分别获取待分词语句中各单字对应的第一特征向量、两字对应的第二特征向量,及待分词语句中专有名词对应的第三特征向量;根据第一特征向量、第二特征向量及第三特征向量,确定各单字当前的第四特征向量;根据预设的汉字标签转移矩阵及各单字当前的第四特征向量,将待分词语句进行分词处理,确定待分词语句对应的第一分词结果;根据预设的专有名词词典及切分规则,对第一分词结果进行修正,确定待分词语句对应的第二分词结果。由此,实现了对待分词语句的分词处理,有效避免了由于专有名词导致的分词准确率下降的问题,提高了分词结果的准确性和可靠性,改善了用户体验。
-
公开(公告)号:CN107621892A
公开(公告)日:2018-01-23
申请号:CN201710970949.8
申请日:2017-10-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F3/023
摘要: 本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括:接收查询信息,上述查询信息包括拼音查询信息和/或语义查询信息,其中,上述拼音查询信息用于查询与拼音查询信息对应的词条,上述语义查询信息用于通过词向量相似度来查询与语义查询信息对应的词条,上述词向量相似度通过词条在向量空间上的距离来表征;从词条库中查询对应上述查询信息的候选词条;对候选词条进行排序并显示。该实施方式能够获取到同时满足拼音查询信息和语义查询信息要求的候选词条,提高了用户获取词条的准确性。
-
公开(公告)号:CN112001169B
公开(公告)日:2022-03-25
申请号:CN202010692628.8
申请日:2020-07-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/232 , G06F40/30
摘要: 本申请公开了一种文本纠错的方法、装置、电子设备和可读存储介质,涉及深度学习、自然语言处理技术领域。本申请在进行文本纠错时所采用的实现方案为:获取待处理文本,并从所述待处理文本中提取语义向量;将所述语义向量输入至文本纠错模型,得到所述文本纠错模型输出的文本纠错信息,所述文本纠错信息包含所述待处理文本中每个字的检错信息以及候选字信息;根据所述检错信息,确定所述待处理文本中出现错误的字作为目标字;根据所述目标字对应的候选字信息,从预设字表中选取相应的候选字替换所述目标字,得到所述待处理文本的纠错结果。本申请能够提升文本纠错的准确性以及效率。
-
-
-
-
-
-
-
-
-