-
公开(公告)号:CN110069612A
公开(公告)日:2019-07-30
申请号:CN201910350366.4
申请日:2019-04-28
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/33
摘要: 本申请公开了一种回复生成方法及装置,该方法包括:在获取到提问者提出的目标问题后,可以先根据目标问题,生成提问者的人物画像信息,然后,利用该人物画像信息和目标问题,再生成目标问题的至少一个待选回复。可见,本申请在生成目标问题的待选回复时,考虑了提出目标问题的提问者的人物画像信息,使得生成的待选回复的内容与提问者本身的个性特点更加相关,从而可以满足提问者的对话需求,提高了回复生成结果的合理性。
-
公开(公告)号:CN110008327A
公开(公告)日:2019-07-12
申请号:CN201910257194.6
申请日:2019-04-01
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F17/27 , G06Q50/18
摘要: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN114417785A
公开(公告)日:2022-04-29
申请号:CN202111614301.X
申请日:2021-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/117 , G06F40/30 , G06F16/35
摘要: 本申请实施例提供了一种知识点标注方法、模型的训练方法、计算机设备及存储介质,标注方法包括:获取目标文本;将目标文本输入预设的深层语言模型,得到目标文本对应的文本内容表征;获取预设的知识点标签集合对应的知识点表征,知识点表征是基于深层语言模型对知识点标签集合中的知识点标签进行处理得到的;对文本内容表征和知识点表征进行匹配处理,得到目标文本对应的知识点标签。基于深层语言模型可以对目标文本进行更深层的语义建模,得到的文本内容表征也可以更好地适应多标签分类任务;知识点表征包含了知识点体系的信息,与文本内容表征结合,可以提升知识点的识别效果。
-
公开(公告)号:CN114298032A
公开(公告)日:2022-04-08
申请号:CN202111547437.3
申请日:2021-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/194 , G06K9/62
摘要: 本申请涉及语言处理技术领域,并公开了一种文本标点检测方法、计算机设备及存储介质,所述方法包括:获取待识别文本,将所述待识别文本输入预训练的目标语言模型,其中,所述目标语言模型为基于目标训练样本对预设语言模型进行训练后,得到的融合了用于分析文本中字符的上下文信息和词性的网络层,所述目标训练样本为基于回译数据增强策略对文本数据进行标点修正后,得到的文本数据;基于所述目标语言模型分析所述待识别文本中字符的上下文信息和词性,得到所述待识别文本的标点标签序列;基于所述标点标签序列对所述待识别文本进行标点检测。旨在提高对文本标点检测的准确性。
-
公开(公告)号:CN112560476A
公开(公告)日:2021-03-26
申请号:CN202011452078.9
申请日:2020-12-09
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本;其中,待补全文本包括至少一个缺失位置;确定待补全文本所缺失内容的来源情况;其中,来源情况包括以下任意一者:来源未知、源自第一文本库、源自涉及预设知识领域的第二文本库;采用与来源情况匹配的文本预测方式对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112528109A
公开(公告)日:2021-03-19
申请号:CN202011389567.4
申请日:2020-12-01
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本申请提供了一种数据分类方法、装置、设备及存储介质,其中,方法包括:获取待分类数据;将待分类数据输入预先建立的第一分类模型,得到分类结果,其中,第一分类模型采用训练集中的训练数据训练得到,第一分类模型的训练目标为,使其针对训练数据预测的分类结果趋于预先建立的多个第二分类模型分别针对训练数据预测的分类结果的融合结果;根据第一分类模型针对待分类数据预测的分类结果,确定待分类数据所属的类别。本申请提供的数据分类方法通过一个第一分类模型即可实现对待分类数据的准确分类,实现数据分类所消耗的计算资源和时间资源较少。
-
公开(公告)号:CN111914545A
公开(公告)日:2020-11-10
申请号:CN202010833405.9
申请日:2020-08-18
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/279
摘要: 本申请提供了一种拟人句识别方法、装置、设备及存储介质,方法包括:获取目标句子;基于目标句子和外部知识库,确定目标句子中每个字对应的目标特征向量,其中,外部知识库中包括多个词和多个词分别对应的类别,一个字对应的目标特征向量能够表征该字的上下文信息以及该字的相关外部知识信息,一个字的相关外部知识信息包括外部知识库中包含该字的词所对应的类别的信息;以目标句子中每个字对应的目标特征向量为依据,确定目标句子是否为拟人句。本申请提供的拟人句识别方法可实现拟人句的识别,且能够获得较高的识别准确度。
-
公开(公告)号:CN111460120A
公开(公告)日:2020-07-28
申请号:CN202010247124.5
申请日:2020-03-31
申请人: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/36
摘要: 本申请提供了一种对话管理方法、装置、设备及存储介质,其中,对话管理方法包括:在获得用户的对话内容后,根据用户的对话内容确定本轮对话是否由用户主导;若本轮对话由用户主导,则根据用户的对话内容,获取符合用户意图的目标话题和该目标话题的话题类型;若本轮对话不由用户主导,则根据用户的对话内容中所包含的实体,确定目标话题和该目标话题的话题类型;根据目标话题和该目标话题的话题类型,生成针对用户的对话内容的回应信息,其中,回应信息为介绍目标话题的信息,或者,由目标话题向另一话题转移的信息。本申请提供的对话管理方法能够提高用户的聊天兴趣,从而提升用户的聊天体验。
-
公开(公告)号:CN110597968A
公开(公告)日:2019-12-20
申请号:CN201910350310.9
申请日:2019-04-28
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332
摘要: 本申请公开了一种回复选择方法及装置,该方法包括:在获取到提问者提出的目标问题后,可以先根据目标问题,生成提问者的人物画像信息,然后,再获取目标问题的各个待选回复,接着,可以根据目标问题和人物画像信息,从获取到的各个待选回复中选择一个回复,作为目标问题的最终回复。可见,本申请在从各个待选回复中选择目标问题的最终回复时,考虑了提出目标问题的提问者的人物画像信息,使得选择出的最终回复的内容与提问者本身的个性特点更加相关,进而可以满足提问者的对话需求,提高了回复选择结果的合理性。
-
公开(公告)号:CN110688832B
公开(公告)日:2023-06-09
申请号:CN201910959216.3
申请日:2019-10-10
申请人: 河北省讯飞人工智能研究院
IPC分类号: G06F40/186 , G06N3/0442 , G06N3/0455 , G06Q30/0282
摘要: 本申请提供了一种评论生成方法、装置、设备及存储介质,其中,方法包括:获取目标对象的上下文信息,其中,目标对象的上下文信息包括目标对象的标识、购买目标对象的用户的标识和购买目标对象的用户对目标对象的评分;利用预先建立的评论生成模型以及目标对象的上下文信息,生成针对目标对象的目标评论文本。本申请提供的评论生成方法利用评论生成模型能够自动生成对目标对象进行准确和全面评价的评论文本。
-
-
-
-
-
-
-
-
-