-
公开(公告)号:CN118170904A
公开(公告)日:2024-06-11
申请号:CN202311868908.X
申请日:2023-12-28
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了一种角色消歧方法、系统和相关装置,该方法包括:获取待处理图;其中,所述待处理图的节点是基于多个待处理角色名得到的,所述待处理图的边是基于任意两个所述待处理角色名对应的待处理段落得到的,所述待处理段落中的两个所述待处理角色名间隔的字符的数量小于第一阈值;将所述待处理图输入图神经网络,得到每条边所连接的两个节点对应的待处理角色名之间的分类结果;其中,所述图神经网络用于对所述待处理图中的边所连接的节点之间的关联关系进行分类,所述分类结果包括同属于一个角色和分属于两个角色中的一者。通过上述方式,本申请能够提高角色消歧的准确性。
-
公开(公告)号:CN117316158B
公开(公告)日:2024-04-12
申请号:CN202311599003.7
申请日:2023-11-28
申请人: 科大讯飞股份有限公司
摘要: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。
-
公开(公告)号:CN117690144A
公开(公告)日:2024-03-12
申请号:CN202311580044.1
申请日:2023-11-21
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了一种文本问答方法、视觉语言模型的训练方法及其相关装置,该方法包括:获取目标文本图像以及关于目标文本图像的目标问题;利用视觉语言模型中的视觉编码器对目标文本图像进行视觉编码,得到第一目标特征;以及,利用视觉语言模型中的文本编码网络对目标文本图像进行文本编码,得到第二目标特征;利用视觉语言模型基于第一目标特征、第二目标特征和目标问题,得到目标问题的目标答案。通过上述方式,本申请能够提高问答准确率。
-
公开(公告)号:CN112417896B
公开(公告)日:2024-02-02
申请号:CN202011210710.9
申请日:2020-11-03
申请人: 中国科学技术大学 , 科大讯飞股份有限公司
摘要: 本申请提供了一种领域数据获取方法、机器翻译方法及相关设备,领域数据获取方法可确定出通用领域的训练语料集中训练语料对应的第一目标值,由于第一目标值能够表征对应的训练语料与指定领域的匹配程度,因此,基于通用领域的训练语料集中训练语料对应的第一目标值,能够从通用领域的训练语料集中筛选出指定领域的训练语料。在此基础上,本申请还提供了一种机器翻译方法,该方法可利用预先建立的领域翻译模型实现指定领域文本的翻译,由于领域翻译模型采用大量指定领域的训练语料对通用翻译模型进行微调得到,因此,其为能够适应于指定领域的翻译模型,利用该翻译模型对指定领域的文本进行翻译,能够获得比较准确的翻译结果。
-
公开(公告)号:CN110210043B
公开(公告)日:2024-01-26
申请号:CN201910514220.9
申请日:2019-06-14
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/58 , G06F40/289
摘要: 本申请提供一种文本翻译方法、装置、电子设备及可读存储介质,方法包括:接收待翻译的源语言文本;将所述源语言文本输入到翻译模型中,由所述翻译模型根据多个双语短语对的信息,对所述源语言文本进行编码和解码,得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留,从而极大提升翻译效果。
-
公开(公告)号:CN114742514A
公开(公告)日:2022-07-12
申请号:CN202210199273.8
申请日:2022-03-02
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了同传延迟检测方法及相关装置、电子设备、存储介质,其中,同传延迟检测方法包括:检测同传过程中各个语句对的语句同传延迟;其中,语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;基于所述语句同传延迟,统计得到篇章同传延迟。上述方案,能够自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
-
公开(公告)号:CN114358579A
公开(公告)日:2022-04-15
申请号:CN202111665520.0
申请日:2021-12-31
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了评阅方法、评阅装置、电子设备以及计算机可读存储介质。该评阅方法包括:获取到待评分的数学文本;其中,数学文本包括标准答案以及用户作答内容,数学文本包括数学式子和文字信息;其中,数学文本为经过分词处理后的文本;将数学文本输入到评分预测模型中,利用评分预测模型对数学文本中的文字信息以及数学式子进行识别;其中,评分预测模型是利用不完整的数学文本进行训练得到的;其中,不完整的数学文本包括被掩盖的数学式子以及被掩盖的文字信息;基于识别结果对用户作答内容进行评分并输出得分率。本申请能够较好地根据用户作答内容进行预测,从而满足解答题自动评阅的需求。
-
公开(公告)号:CN112802444A
公开(公告)日:2021-05-14
申请号:CN202011607966.3
申请日:2020-12-30
申请人: 科大讯飞股份有限公司
摘要: 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请在对待合成的原始文本进行语音合成的过程中,参考了与原始文本存在相匹配的文本片段的匹配文本对应的辅助合成特征,该辅助合成特征为基于匹配文本对应的发音音频所确定的用于辅助语音合成的特征,本申请通过参考匹配文本对应的辅助合成特征,可以利用匹配文本对应的发音音频中发音信息辅助对原始文本进行语音合成,丰富了原始文本语音合成时所参考的信息,进而提高了原始文本的语音合成质量。本申请方案可以适用于带前端预处理和不带前端预处理两种类型的语音合成系统,辅助合成特征可以作为前端文本分析结果也可以直接辅助语音合成系统进行语音合成,均能够提高合成语音的质量。
-
公开(公告)号:CN110210043A
公开(公告)日:2019-09-06
申请号:CN201910514220.9
申请日:2019-06-14
申请人: 科大讯飞股份有限公司
摘要: 本申请提供一种文本翻译方法、装置、电子设备及可读存储介质,方法包括:接收待翻译的源语言文本;将所述源语言文本输入到翻译模型中,由所述翻译模型根据多个双语短语对的信息,对所述源语言文本进行编码和解码,得到所述源语言文本对应的目标语言文本。该方法使得在翻译过程中源语言文本的语义信息得以保留,从而极大提升翻译效果。
-
公开(公告)号:CN110148413A
公开(公告)日:2019-08-20
申请号:CN201910422699.3
申请日:2019-05-21
申请人: 科大讯飞股份有限公司
摘要: 本申请实施例公开了一种语音评测方法及相关装置,方法包括:获取第一测评模式下作为评测标准的第一语音,以及获取待评测的第二语音;处理第一语音得到第一文本,以及处理第二语音得到第二文本;获取第一测评模式对应的第一文本检测策略;按照第一文本检测策略处理第一文本和第二文本,得到针对第二语音的检测结果。本申请有利于提高设备进行语音评测的灵活性和全面性。
-
-
-
-
-
-
-
-
-