-
公开(公告)号:CN111400489B
公开(公告)日:2022-12-02
申请号:CN202010269479.4
申请日:2020-04-08
申请人: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC分类号: G06F16/34
摘要: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN111400489A
公开(公告)日:2020-07-10
申请号:CN202010269479.4
申请日:2020-04-08
申请人: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC分类号: G06F16/34
摘要: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
公开(公告)号:CN118690749A
公开(公告)日:2024-09-24
申请号:CN202310493104.X
申请日:2023-04-28
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/30
摘要: 本申请实施例公开了一种文本处理方法、装置、设备及存储介质,对第一文本进行纠错,得到纠错后文本;基于第一文本的作者的历史写作水平,对纠错后文本进行处理,得到第二文本;输出第二文本;其中,第二文本与纠错后文本的语义相同或近似;在利用同一评价方式分别对纠错后文本和第二文本进行评价,得到纠错后文本对应的第一写作水平和第二文本对应的第二写作水平的情况下,第二写作水平优于第一写作水平。基于本申请生成的第二文本更切合第一文本的作者的写作思路,为第一文本的作者提供了个性化的辅助信息,能更好的辅助第一文本的作者提高写作水平。
-
公开(公告)号:CN118626622A
公开(公告)日:2024-09-10
申请号:CN202410849940.1
申请日:2024-06-27
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/338 , G06F16/35 , G06N3/045 , G06N5/04
摘要: 本发明提供一种任务规划方法、装置、系统、电子设备和存储介质,其中方法包括:基于用户问题进行工具调用分类,得到分类结果;在分类结果指示解决用户问题需要调用工具的情况下,基于任务规划模型,对用户问题进行意图理解,并基于用户意图确定解决需要调用的目标工具以及各目标工具的调用顺序,基于调用顺序依次调用各目标工具处理用户问题,得到用户问题的问题答案;任务规划模型是在大型语言模型的基础上构建的,实现了复杂任务的合理规划,保证任务处理的科学高效,避免了目前依赖于弱分类器和专家规则的方案在复杂性、合理性、效率上的局限性,通过优化内置工具的召回率,以及流程规划的合理性,显著提升了大模型处理复杂任务的能力和效率。
-
公开(公告)号:CN118626621A
公开(公告)日:2024-09-10
申请号:CN202410848521.6
申请日:2024-06-27
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06N3/045 , G06N5/04
摘要: 本发明提供一种表格问答方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,该方法通过将目标表格加载为目标键值对字典,可以更加直观且简洁地表示目标表格的数据。通过对问题信息进行意图识别,确定问题信息的各求解步骤,并通过调用代码的方式依次求解各步骤,可以降低问题求解需要的时间并提升回复的答案的正确率。利用大型语言模型的强大代码生成能力,生成各求解步骤对应的代码片段,并通过执行代码片段的方式对数值计算、数值比较、关系分析、可视化操作等求解步骤进行求解,可以基于大语言模型已有的代码能力迅速提升表格问答任务的效果,提高表格问答的准确性。
-
公开(公告)号:CN118538221A
公开(公告)日:2024-08-23
申请号:CN202410507743.1
申请日:2024-04-25
申请人: 科大讯飞股份有限公司
IPC分类号: G10L15/26 , G06F40/232
摘要: 本申请提供了语音识别方法、装置、设备、存储介质及程序产品,该方法包括:在第i个语音段的识别结果中将置信度小于置信度阈值的实体关键词进行标注,得到对应的第一待纠错文本,并将第一待纠错文本添加至待纠错文本集合;将第i+k个语音段的语音编码和待纠错文本集合输入大语言模型,以使大语言模型对第i+k个语音段的语音编码进行解码,以及对待纠错文本集合进行纠错;在第一待纠错文本对应的纠错结果中的实体关键词的置信度均不小于置信度阈值的情况下,将第一待纠错文本对应的纠错结果确定为第i个语音段的更新后识别结果,并将第一待纠错文本移出待纠错文本集合。根据本申请的技术方案,能够有效提升长语音中的实体关键词识别的准确性。
-
公开(公告)号:CN111881694B
公开(公告)日:2024-08-23
申请号:CN202010776952.8
申请日:2020-08-05
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/194 , G06F16/335
摘要: 本申请公开了一种篇章要点检测方法、装置、设备及存储介质,本申请在对待测篇章进行要点检测时,考虑了待测篇章对应的题干信息以及题干对应的答题库,其中题干明确了篇章应该表达的要点,而答题库可以提供丰富的辅助信息,基于此,本申请获取题干的语义表示以及待测篇章中每个文本单元的语义表示,进而基于题干的语义表示,在答题库中选取满足题干规定的答题要点的范文,获取范文的语义表示,并基于待测篇章中每个文本单元与范文的语义表示间的相似度,确定属于篇章要点的文本单元。本申请既考虑了待测篇章自身的信息,进一步考虑了题干信息,基于题干筛选出范文,参考范文确定属于篇章要点的文本单元,使得要点检测结果更加准确。
-
公开(公告)号:CN118522287A
公开(公告)日:2024-08-20
申请号:CN202410576858.6
申请日:2024-05-10
申请人: 科大讯飞股份有限公司
摘要: 本申请提供了一种语音识别方法、装置、设备、存储介质及产品,本申请提供的语音识别方法,在根据待识别语音的各个语音段的声学特征对各个语音段分别进行语音识别,得到各个语音段各自对应的第一识别文本后,根据第一语音段对应的声学特征和与第一语音段相关的至少一个第二语音段对应的第一识别文本的文本特征,对第一语音段再次进行语音识别,使得与第一语音段相关的第二语音段提供的上下文信息能够充分参与到对第一语音段进行语音识别的过程中,从而得到对第一语音段更准确的语音识别结果,进而提高待识别语音的语音识别准确性。
-
公开(公告)号:CN118445390A
公开(公告)日:2024-08-06
申请号:CN202410560725.X
申请日:2024-05-08
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F18/22 , G06F18/214 , G06N3/092 , G06N3/09
摘要: 本申请公开了一种题目作答评价生成方法、模型训练方法、装置及相关设备,在得到题目作答评价生成模型针对输入的训练样本数据所生成的作答评价后,获取修改后用户作答,该修改后用户作答为以用户角度,参考生成的作答评价及题目信息,对原始用户作答进行修改后的作答信息。确定原始用户作答和修改后用户作答各自的得分,计算修改前后的分差,该分差可以衡量作答评价对用户进行作答内容修正的指导效果,基于分差确定总奖励得分,按照总奖励得分对模型进行强化学习训练。该总奖励得分与用户的偏好对齐,采用本申请训练的题目作答评价生成模型所生成的作答评价,更加贴近用户的偏好,能够更好的指导用户进行作答内容的修正。
-
公开(公告)号:CN118428476A
公开(公告)日:2024-08-02
申请号:CN202410515280.3
申请日:2024-04-26
申请人: 科大讯飞股份有限公司
IPC分类号: G06N5/04 , G06F18/22 , G06F3/0481 , G06F3/04845
摘要: 本申请公开了一种意图反馈方法、系统和相关装置,该方法包括:获取用户输入的初始内容对应的当前意图信息,确定所述当前意图信息匹配的至少一个待使用技能;其中,所述待使用技能设有用于实现相应技能的参数槽;基于所述当前意图信息和所述参数槽,生成用于提示用户对所述参数槽进行完善的参考信息;获取用户基于所述参考信息输入的输入内容,基于所述输入内容、所述当前意图信息和所有所述待使用技能,得到所述当前意图信息的反馈信息。通过上述方式,本申请能够提高反馈信息与用户意图的契合度。
-
-
-
-
-
-
-
-
-