-
公开(公告)号:CN107506359A
公开(公告)日:2017-12-22
申请号:CN201610425977.7
申请日:2016-06-14
申请人: 科大讯飞股份有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种试题高阶属性挖掘方法及系统,该方法包括:获取试题的低阶属性及学生历史答题信息,所述低阶属性包括试题的知识点或技能;对不同低阶属性进行组合,形成预估高阶属性;基于所述低阶属性及学生历史答题信息,确定学生能力;根据所述学生能力和学生历史答题信息,确定各预估高阶属性上的学生能力在每个试题中的权重;统计权重大于设定阈值的学生能力对应的各预估高阶属性的个数;如果所述个数大于设定值,则将对应的预估高阶属性作为试题的高阶属性。利用本发明,可以高效、准确地确定试题的高阶属性。
-
公开(公告)号:CN106296503A
公开(公告)日:2017-01-04
申请号:CN201510386080.3
申请日:2015-06-29
申请人: 科大讯飞股份有限公司
IPC分类号: G06Q50/20
摘要: 本发明公开了一种教师评价方法及系统,该方法包括:获取各科目试题及对应所述试题的各班级学生考试成绩;对各科目试题进行难度分析,得到各科目试题难度得分;基于各科目试题难度得分及对应所述试题的各班级学生考试成绩确定各班级的非教师影响因素;对于每个班级的每个科目教师,根据该班级的非教师影响因素确定该科目教师的教学能力。利用本发明,可以实现对教师更准确的评价。
-
公开(公告)号:CN105589843A
公开(公告)日:2016-05-18
申请号:CN201410577735.0
申请日:2014-10-24
申请人: 科大讯飞股份有限公司
IPC分类号: G06F17/27
摘要: 本发明公开了一种文本字串匹配方法及系统,该方法包括:获得由待匹配的第一文本字串和第二文本字串形成的第一历史路径累积矩阵;判断第一历史路径累积矩阵中待匹配的第一字符与第二字符是否相同;如果否,则获取第一字符的第一音串序列和第二字符的第二音串序列;计算第一音串序列与第二音串序列的音层面匹配代价;更新第一历史路径累积矩阵;将第一文本字串中的另一字符作为第一字符,将第二文本字串中的另一字符作为第二字符,重复执行判断第一历史路径累积矩阵中的第一字符与第二字符是否相同,直至第一历史路径累积矩阵更新完成,获得最终匹配代价。本发明能够提高文本字串匹配结果的有效性,满足用户不同应用需求。
-
公开(公告)号:CN114281996B
公开(公告)日:2024-10-29
申请号:CN202111619122.5
申请日:2021-12-27
申请人: 科大讯飞股份有限公司
摘要: 本申请实施例提供一种长文本分类方法、装置、设备及存储介质,该方法包括:将获取的目标长文本划分成N个序列后输入目标模型中,分别得到N个序列的文本表示,N为正整数;对N个序列的文本表示进行融合,得到目标长文本的篇章表示;根据目标长文本的篇章表示,得到目标长文本的分类结果。也就是说,本申请将目标长文本的N个序列的文本表示进行融合,得到整个目标长文本的篇章表示,基于整个目标长文本的篇章表示进行分类,即在分类过程中考虑了整个文本的语义信息和上下文信息,进而提高了目标长文本的分类准确性。
-
公开(公告)号:CN112700769B
公开(公告)日:2024-07-05
申请号:CN202011569220.8
申请日:2020-12-26
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
IPC分类号: G10L15/18 , G10L15/183 , G10L15/26
摘要: 本申请公开了一种语义理解方法、装置、设备以及计算机可读存储介质,该方法包括:在获取到当前语音段之后,先对该当前语音段进行语音识别,得到当前文本段;再根据该当前文本段和该当前文本段对应的未识别文本段,生成待识别文本段,以便在确定该待识别文本段包括完整性语句之后,对该待识别文本段进行语义理解。其中,因当前语音段是指在当前时刻下实时采集的用户语音,使得本申请提供的语义理解方法能够针对实时采集的用户语音进行实时地语义理解,从而能够实现边采集用户语音边进行语义理解的目的,如此能够提高语义理解的实时性,从而能够提高人机交互设备的反馈实时性。
-
公开(公告)号:CN112633007B
公开(公告)日:2024-04-30
申请号:CN202011519649.6
申请日:2020-12-21
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/42 , G06F40/211 , G06F40/205 , G06N3/0442 , G06N3/0455 , G06N3/08
摘要: 本申请公开了一种语义理解模型构建方法及装置、语义理解方法及装置,该语义理解模型构建方法包括:在获取到多语语料之后,先根据该多语语料生成训练样本、该训练样本的实际语种和该训练样本的实际语义信息,并将该训练样本输入多语种理解模型,得到该多语种理解模型输出的该训练样本的预测语种和该训练样本的预测语义信息;再根据该训练样本的预测语种、实际语种、预测语义信息及其实际语义信息,更新该多语种理解模型,并继续执行上述将该训练样本输入多语种理解模型的步骤,直至在达到预设停止条件时,根据该多语种理解模型构建语义理解模型,以使该语义理解模型能够对该至少两个语种下的语句进行语义理解。
-
公开(公告)号:CN112700768B
公开(公告)日:2024-04-26
申请号:CN202011487548.5
申请日:2020-12-16
申请人: 科大讯飞股份有限公司 , 吉林科讯信息科技有限公司
摘要: 本申请公开了一种语音识别方法以及电子设备、存储装置,其中,语音识别方法包括:识别用户的语音指令,得到一个第一候选文本和至少一个第二候选文本;其中,第二候选文本的识别置信度与第一候选文本的识别置信度符合预设关系;响应于第一候选文本的第一语义理解结果不满足预设结果条件,更新第二候选文本的识别置信度;基于识别置信度,获取第二候选文本的第二语义理解结果,并利用第二语义理解结果,得到语音指令的识别结果。上述方案,能够提高语音识别的准确性和鲁棒性。
-
公开(公告)号:CN117669759A
公开(公告)日:2024-03-08
申请号:CN202211028230.X
申请日:2022-08-25
申请人: 科大讯飞股份有限公司
IPC分类号: G06N20/00
摘要: 本发明提供一种数据处理方法、装置、电子设备和存储介质,其中方法包括:S11,获取第一数据;S12,对所述第一数据进行预处理,得到第二数据;S13,将所述第二数据发送到标注端,并接收所述标注端返回的第三数据,所述第三数据携带有标注结果;S14,对所述第三数据进行抽样处理,得到第四数据;S15,将所述第四数据发送到检验端,并接收所述检验端返回的标注检验结果;S16,在所述标注检验结果为标注合格的情况下,对所述第三数据进行数据过滤、数据增强和标注修改中的至少一种,得到目标数据;在所述标注检验结果为标注不合格的情况下,重复执行S13‑S15。本发明提高了数据处理的有效性,保障了数据质量。
-
公开(公告)号:CN112560497B
公开(公告)日:2024-02-13
申请号:CN202011455490.6
申请日:2020-12-10
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/211 , G06N3/0455
摘要: 本发明实施例提供一种语义理解方法、装置、电子设备和存储介质,该方法包括:确定待理解的文本;将所述文本及其句法结构输入至语义理解模型,得到所述语义理解模型输出的语义理解结果;其中,所述语义理解模型基于所述文本中各个字之间的关系和所述文本的句法结构,确定所述文本中各个分词之间的关系,并基于各个分词之间的关系对所述文本进行语义理解;所述语义理解模型是基于样本文本及其样本句法结构和样本语义理解结构训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,能够从词层面上提取文本中包含的语义信息,避免了传统的语义理解模型以字为单元进行建模导致语义信息遗漏的问题,提高了语义理解的准确性。
-
公开(公告)号:CN111104803B
公开(公告)日:2024-02-13
申请号:CN201911415186.6
申请日:2019-12-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289
摘要: 本发明实施例提供一种语义理解处理方法、装置、设备及可读存储介质,对待分析语句进行分词处理,为分词结果设置对应的标签;所述标签包括用于表征通用词性的词性标签和用于表征专用词性的词典标签;将所述标签代入所述待分析语句得到更新后的待分析语句,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果;其中,所述匹配规则包括意图和规则,所述规则至少包括通过分隔符标记连接分词形成的N元组;所述规则中的关键词用其对应的所述词典标签表示,所述规则中的非关键词用其本身表示。本发明实施例中的规则支持多种匹配方式,能够满足语义理解规则的泛化需求。
-
-
-
-
-
-
-
-
-