-
公开(公告)号:CN114357985A
公开(公告)日:2022-04-15
申请号:CN202111647750.4
申请日:2021-12-29
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/253 , G06F40/289 , G06F40/30 , G06K9/62
摘要: 本申请实施例提供了一种文本数据生成方法、计算机设备及存储介质,文本数据生成方法包括:获取无语法缺陷的第三文本;将所述第三文本输入生成模型,生成所述第三文本对应的第一生成文本,和用于指示所述第一生成文本存在语法缺陷的目标概率,所述生成模型是基于无语法缺陷的第一文本和有语法缺陷的第二文本训练得到的;根据所述第一生成文本对应的目标概率,确定所述第一生成文本为目标文本。生成模型学习到第二文本对应的语法错误规律,训练后的生成模型能够发挥生成结果多样的优异特性,可以自动构建出大量包含语法缺陷的文本。
-
公开(公告)号:CN114357964A
公开(公告)日:2022-04-15
申请号:CN202111632605.9
申请日:2021-12-28
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/194 , G06F40/30 , G06Q50/20
摘要: 本申请实施例提供了一种主观题评分方法、模型的训练方法、计算机设备及存储介质,评分方法包括:获取标准答案中的若干要点文本和每个要点文本的要点满分分值;获取考生作答文本;对要点文本和考生作答文本进行匹配处理,得到考生作答文本与要点文本的匹配程度;根据每个要点文本的要点满分分值,及考生作答文本与每个要点文本的匹配程度,确定考生作答文本对应的作答分值。对要点文本和考生作答文本进行匹配处理,确定考生作答文本与要点文本的匹配程度,根据匹配程度确定考生作答文本对应的作答分值;可以在评分过程中利用标准答案中每个要点所占分值之间的分值关系这一有效信息,因此评分的准确性较高,可以降低与人工评分之间的误差。
-
公开(公告)号:CN114417785A
公开(公告)日:2022-04-29
申请号:CN202111614301.X
申请日:2021-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/117 , G06F40/30 , G06F16/35
摘要: 本申请实施例提供了一种知识点标注方法、模型的训练方法、计算机设备及存储介质,标注方法包括:获取目标文本;将目标文本输入预设的深层语言模型,得到目标文本对应的文本内容表征;获取预设的知识点标签集合对应的知识点表征,知识点表征是基于深层语言模型对知识点标签集合中的知识点标签进行处理得到的;对文本内容表征和知识点表征进行匹配处理,得到目标文本对应的知识点标签。基于深层语言模型可以对目标文本进行更深层的语义建模,得到的文本内容表征也可以更好地适应多标签分类任务;知识点表征包含了知识点体系的信息,与文本内容表征结合,可以提升知识点的识别效果。
-
公开(公告)号:CN114298032A
公开(公告)日:2022-04-08
申请号:CN202111547437.3
申请日:2021-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/194 , G06K9/62
摘要: 本申请涉及语言处理技术领域,并公开了一种文本标点检测方法、计算机设备及存储介质,所述方法包括:获取待识别文本,将所述待识别文本输入预训练的目标语言模型,其中,所述目标语言模型为基于目标训练样本对预设语言模型进行训练后,得到的融合了用于分析文本中字符的上下文信息和词性的网络层,所述目标训练样本为基于回译数据增强策略对文本数据进行标点修正后,得到的文本数据;基于所述目标语言模型分析所述待识别文本中字符的上下文信息和词性,得到所述待识别文本的标点标签序列;基于所述标点标签序列对所述待识别文本进行标点检测。旨在提高对文本标点检测的准确性。
-
公开(公告)号:CN114298031A
公开(公告)日:2022-04-08
申请号:CN202111544933.3
申请日:2021-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F40/289 , G06F40/247 , G06K9/62 , G06F40/166
摘要: 本申请涉及人工智能技术领域,并公开了一种文本处理方法、计算机设备及存储介质,所述方法包括:获取待处理文本,所述待处理文本包括至少一条自然语言语句;将所述待处理文本输入预训练的文本润色模型,对所述自然语言语句、所述自然语言语句中的修饰词,和/或所述自然语言语句中的待优化词汇进行润色处理,得到目标文本。能够对文本从语句、语句的修饰词和/或语句的词汇层级进行润色处理,可以高效准确地提高文本内容的质量。
-
公开(公告)号:CN116245087A
公开(公告)日:2023-06-09
申请号:CN202211628016.8
申请日:2022-12-16
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/205 , G06F40/226 , G06F40/253 , G06F40/30
摘要: 本发明提供一种句子评分方法、装置、电子设备和存储介质,其中方法包括:确定待评分的句子;对句子进行语义特征提取得到语义特征,以及进行多个维度的语言学特征提取得到语言学特征,并基于语义特征和语言学特征确定句子的评分结果;其中,多个维度包括语句正确性、词语使用和写作技巧中的至少两种。实现在进行评分时,通过提取句子更多的特征作为评分依据,突出句子在语句正确性等的基础要求、词语使用方式和写作技巧三个维度特征,提高了句子评分的准确性。
-
公开(公告)号:CN116187336A
公开(公告)日:2023-05-30
申请号:CN202211679309.9
申请日:2022-12-26
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/268 , G06F40/289 , G06F18/214 , G06F18/24
摘要: 本发明提供一种意图脉络分析方法、装置、电子设备和存储介质,其中方法包括:确定待分析的文本,以及文本的摘要信息;对文本进行片段分割得到若干片段,并识别得到若干片段中每一个片段的语义表示;根据摘要信息和每一个片段的语义表示,得到每一个片段在文本中的角色表示;根据每一个片段的语义表示和角色表示,得到片段之间的承接关系,以及得到每一个片段的意图表示;根据若干片段、角色表示、承接关系和意图表示,得到文本的脉络分析结果。提高了对篇章级文章的意图脉络信息的提取和分析的准确性,为文章评价提供更准确的依据。
-
公开(公告)号:CN116029303A
公开(公告)日:2023-04-28
申请号:CN202211691073.0
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/25
摘要: 本发明涉及人工智能技术领域,提供一种语言表达方式识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本;提取所述待识别文本中各分句的句子内语义特征和上下文语义特征,并基于所述各分句的句子内语义特征和上下文语义特征,对所述各分句进行语言表达方式识别。本发明提供的语言表达方式识别方法、装置、电子设备和存储介质,通过提取待识别文本中各分句的句子内语义特征和上下文语义特征,并基于各分句的句子内语义特征和上下文语义特征,对各分句进行语言表达方式识别,由此能够实现同时兼容依赖上下文信息和仅依赖单句内信息的多种语言表达方式的识别,从而可以节省资源,提高识别效率。
-
公开(公告)号:CN115859974A
公开(公告)日:2023-03-28
申请号:CN202211714389.7
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06F18/213
摘要: 本发明涉及人工智能技术领域,提供一种成语润色方法、装置、电子设备和存储介质,其中方法包括:确定待润色文本;基于成语润色模型,应用所述待润色文本中各字符的语义特征,对所述待润色文本进行成语润色边界检测,得到文本边界,并基于所述文本边界对应文本片段的语义特征生成润色文本;所述成语润色模型是基于样本文本对、成语标签和文本边界标签训练得到的。本发明提供的成语润色方法、装置、电子设备和存储介质,通过成语润色模型,能够实现自动生成成语润色后的文本,从而可以帮助更快地构建成语使用体系。
-
公开(公告)号:CN117435708A
公开(公告)日:2024-01-23
申请号:CN202311385924.3
申请日:2023-10-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06V30/10 , G09B7/02
摘要: 本发明涉及智能教学技术领域,提供一种答题方法、装置、电子设备及存储介质,该答题方法首先获取题目图像,然后识别题目图像中的题目信息,对题目图像中的题目信息进行语义识别和意图识别,得到语义特征和意图特征,并将意图特征与各知识库插件的知识库技能进行匹配,得到匹配结果,基于语义特征和匹配结果,对题目信息进行作答。该答题方法引入各知识库插件,可以利用各知识库插件的专业解答能力,实现准确、高效的题目解答过程,为用户提供更好的学习体验和服务。而且,通过题目信息的意图特征与各知识库插件的知识库技能进行匹配,可以实现对各知识库插件的快速应用,进一步提升题目解答效率。
-
-
-
-
-
-
-
-
-