-
公开(公告)号:CN118246412A
公开(公告)日:2024-06-25
申请号:CN202410349084.3
申请日:2024-03-26
申请人: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/166 , G06F40/232 , G06F40/284 , G06N20/00
摘要: 本申请公开了一种文本润色训练数据筛选方法、装置、相关设备及计算机程序产品,本申请在获取到文本润色任务数据集后,调用人工智能大模型,通过第一提示指令prompt指示大模型结合给定的评测标准对每条润色任务进行评测,给出评测结果,借助大模型的能力可以更加准确的得到每条润色任务的质量评测结果,与人类专家给出的评测结果更加接近,可以节省大量人力并避免由于主观偏见造成的评测结果波动。在此基础上,可以筛选出满足设定评测结果要求的润色任务作为最终的润色训练数据,得到高质量的润色训练数据。以筛选得到的高质量的润色训练数据训练处理文本润色任务的模型时,可以提升模型的训练效果。
-
公开(公告)号:CN112580365B
公开(公告)日:2024-06-11
申请号:CN202011225699.3
申请日:2020-11-05
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/35 , G06F40/284 , G06F40/289
摘要: 本申请公开了一种篇章解析方法及电子设备、存储装置,其中,篇章解析方法包括:获取篇章和问题两者中词语的语义表示;利用语义表示,得到篇章中词语对回答问题的重要度;利用篇章中词语的重要度,更新对应词语的语义表示;基于更新后的语义表示和篇章中词语的重要度,得到问题的相关文本;其中,相关文本用于以下任一者:在得到问题的答案的情况下解释问题的答案,在未得到问题的答案的情况下提示问题的答案。上述方案,能够提高篇章解析精度。
-
公开(公告)号:CN112685548B
公开(公告)日:2023-09-08
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN116187336A
公开(公告)日:2023-05-30
申请号:CN202211679309.9
申请日:2022-12-26
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/268 , G06F40/289 , G06F18/214 , G06F18/24
摘要: 本发明提供一种意图脉络分析方法、装置、电子设备和存储介质,其中方法包括:确定待分析的文本,以及文本的摘要信息;对文本进行片段分割得到若干片段,并识别得到若干片段中每一个片段的语义表示;根据摘要信息和每一个片段的语义表示,得到每一个片段在文本中的角色表示;根据每一个片段的语义表示和角色表示,得到片段之间的承接关系,以及得到每一个片段的意图表示;根据若干片段、角色表示、承接关系和意图表示,得到文本的脉络分析结果。提高了对篇章级文章的意图脉络信息的提取和分析的准确性,为文章评价提供更准确的依据。
-
公开(公告)号:CN116029303A
公开(公告)日:2023-04-28
申请号:CN202211691073.0
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/25
摘要: 本发明涉及人工智能技术领域,提供一种语言表达方式识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本;提取所述待识别文本中各分句的句子内语义特征和上下文语义特征,并基于所述各分句的句子内语义特征和上下文语义特征,对所述各分句进行语言表达方式识别。本发明提供的语言表达方式识别方法、装置、电子设备和存储介质,通过提取待识别文本中各分句的句子内语义特征和上下文语义特征,并基于各分句的句子内语义特征和上下文语义特征,对各分句进行语言表达方式识别,由此能够实现同时兼容依赖上下文信息和仅依赖单句内信息的多种语言表达方式的识别,从而可以节省资源,提高识别效率。
-
公开(公告)号:CN115859974A
公开(公告)日:2023-03-28
申请号:CN202211714389.7
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06F18/213
摘要: 本发明涉及人工智能技术领域,提供一种成语润色方法、装置、电子设备和存储介质,其中方法包括:确定待润色文本;基于成语润色模型,应用所述待润色文本中各字符的语义特征,对所述待润色文本进行成语润色边界检测,得到文本边界,并基于所述文本边界对应文本片段的语义特征生成润色文本;所述成语润色模型是基于样本文本对、成语标签和文本边界标签训练得到的。本发明提供的成语润色方法、装置、电子设备和存储介质,通过成语润色模型,能够实现自动生成成语润色后的文本,从而可以帮助更快地构建成语使用体系。
-
公开(公告)号:CN112686020B
公开(公告)日:2024-06-04
申请号:CN202011588731.4
申请日:2020-12-29
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/30 , G06F18/214 , G06F18/25
摘要: 本发明提供一种作文评分方法、装置、电子设备及存储介质,由于引入分差预测模型,可以预测出待评分作文与作文参考样本之间的分差,只需要通过该分差并结合作文参考样本的分数即可实现对待评分作文的评分结果的准确确定,既可以保证同场考试的评分尺度相同,也可以使用不同场考试的大规模数据进行训练。对于无定标的小规模考试/作业评分场景的应用,可以通过调整作文参考样本来拟合阅卷老师的评分尺度,从而使用分差预测模型对待评分作文进行评分。不仅可以提高大规模考试评分场景下评分结果的稳定性,还可以避免小规模考试/作业评分场景下因评分尺度不同导致的评分人机一致性不高的问题出现,使得评分结果更准确,且适用性更广泛。
-
公开(公告)号:CN112560477B
公开(公告)日:2024-04-16
申请号:CN202011452090.X
申请日:2020-12-09
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中,文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置,且文本库涉及预设知识领域;利用与预设知识领域对应的知识图谱和文本库,对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN111310457B
公开(公告)日:2024-02-02
申请号:CN202010125461.7
申请日:2020-02-27
申请人: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/284 , G06F40/289 , G06F40/216 , G06F40/211
摘要: 本发明实施例提供一种词语搭配不当识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本中的存在搭配关系的两个待识别词;将待识别文本中的任一待识别词替换为遮盖标记,得到任一待识别词对应的输入文本;将任一待识别词对应的输入文本输入至词语预测模型,得到词语预测模型输出的任一待识别词的预测结果;其中,词语预测模型是基于样本文本训练得到的;基于两个待识别词的预测结果,确定词语搭配不当识别结果。本发明实施例提供的词语搭配不当识别方法、装置、电子设备和存储介质,能够基于待识别文本的语境,识别出语义层面上搭配不当的词语,提高了词语搭配不当识别的准确率。
-
公开(公告)号:CN117435708A
公开(公告)日:2024-01-23
申请号:CN202311385924.3
申请日:2023-10-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06V30/10 , G09B7/02
摘要: 本发明涉及智能教学技术领域,提供一种答题方法、装置、电子设备及存储介质,该答题方法首先获取题目图像,然后识别题目图像中的题目信息,对题目图像中的题目信息进行语义识别和意图识别,得到语义特征和意图特征,并将意图特征与各知识库插件的知识库技能进行匹配,得到匹配结果,基于语义特征和匹配结果,对题目信息进行作答。该答题方法引入各知识库插件,可以利用各知识库插件的专业解答能力,实现准确、高效的题目解答过程,为用户提供更好的学习体验和服务。而且,通过题目信息的意图特征与各知识库插件的知识库技能进行匹配,可以实现对各知识库插件的快速应用,进一步提升题目解答效率。
-
-
-
-
-
-
-
-
-