-
公开(公告)号:CN111131616A
公开(公告)日:2020-05-08
申请号:CN201911383922.4
申请日:2019-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种基于智能终端的音频共享方法及相关装置,所述方法包括:获取预设场景的声源位置;依据所述声源位置与智能终端之间的位置关系,依据所述位置关系获取所述声源位置与智能终端之间的距离,依据所述位置关系和/或所述距离从所述预设场景的智能终端内选择共享智能终端;获取所述共享智能终端采集的音频数据,将所述音频数据确定为所述预设场景的共享音频。本申请提供的技术方案具有提高音频数量的优点。
-
公开(公告)号:CN108154096A
公开(公告)日:2018-06-12
申请号:CN201711376546.7
申请日:2017-12-19
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种审讯资料的审查方法及装置,能够自动根据审讯录像判断审讯人员是否对犯罪嫌疑人存在暴力行为,还能够自动根据审讯录音判断审讯人员是否对所述犯罪嫌疑人存在负面情绪和/或使用不当用语,并且可以生成相应的审查结果。从该审查结果可以直接判断审讯人员对犯罪嫌疑人的审讯过程是否合法合规,而无需审查人员通过对大量的审讯录音录像进行回放来判断审讯过程是否合法合规,不但能保证了审查结果的准确性,还提升了审查效率。
-
公开(公告)号:CN113850071B
公开(公告)日:2025-03-28
申请号:CN202111136464.1
申请日:2021-09-27
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/205 , G06F40/30
Abstract: 本申请提供了一种文本规整方法、装置、设备及存储介质,其中,方法包括:获取待规整文本;利用预先构建的文本规整模型对待规整文本进行规整,以得到待规整文本对应的规整后文本;其中,文本规整模型采用训练样本训练得到,训练样本包括语义相同、表达不同且标注有相同规整后文本的多个训练文本,在采用训练样本训练文本规整模型时,对训练样本包含的多个训练文本的语义一致性进行约束。本申请提供的文本规整方法不但可将口语化的待规整文本规整为书面化的文本,还能保证规整后的文本语义不变。
-
公开(公告)号:CN119559962A
公开(公告)日:2025-03-04
申请号:CN202411486466.7
申请日:2024-10-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种同传翻译方法、电子设备和计算机可读存储介质,该方法包括:获取待译音频;利用目标分割模型确定待译音频对应的待译文本的文本分割位置;其中,文本分割位置包括第一文本分割位置和第二文本分割位置,第一文本分割位置为待译文本中的第一子待译文本和第二子待译文本之间的位置,第二子待译文本对第一子待译文本的翻译影响度低于第一影响度阈值,第二文本分割位置为待译文本中的目标标点所在位置;按照文本分割位置,对待译音频进行分段翻译。通过上述方式,本申请能够提高同传翻译的时效性,降低同传翻译的时延。
-
公开(公告)号:CN119397342A
公开(公告)日:2025-02-07
申请号:CN202411202546.5
申请日:2024-08-29
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F18/2433 , G06N3/0464
Abstract: 本申请公开了一种故障预测方法及相关装置、设备和存储介质,其中,故障预测方法包括:获取待测设备在运行过程中关于若干种模态的采集数据;基于若干种模态采集数据各自的跳变检测结果,调整若干种模态各自的注意力参数;基于若干种模态各自的注意力参数,得到待测设备的目标数据特征;基于目标数据特征进行预测,得到待测设备的故障预测结果;其中,故障预测结果至少包括待测设备分别存在若干种预设故障类型的可能性。上述方案,能够提高设备故障预测的实时性和精确性。
-
公开(公告)号:CN114254637B
公开(公告)日:2025-01-07
申请号:CN202111574800.0
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06F40/211 , G06F16/34
Abstract: 本申请提供了一种纪要生成方法、装置、设备及存储介质,其中,方法包括:获取待生成纪要的文本,作为目标文本;获取目标文本的词级信息、句级信息和话题级信息,其中,词级信息包括目标文本中词的上下文信息和目标文本的关键词信息,句级信息包括目标文本中句子的上下文信息和目标文本的重点句信息,话题级信息包括目标文本的话题分割信息;根据目标文本的词级信息、句级信息和话题级信息,生成目标文本对应的纪要。本申请提供的纪要生成方法可自动生成目标文本对应的纪要。
-
公开(公告)号:CN118538221A
公开(公告)日:2024-08-23
申请号:CN202410507743.1
申请日:2024-04-25
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G06F40/232
Abstract: 本申请提供了语音识别方法、装置、设备、存储介质及程序产品,该方法包括:在第i个语音段的识别结果中将置信度小于置信度阈值的实体关键词进行标注,得到对应的第一待纠错文本,并将第一待纠错文本添加至待纠错文本集合;将第i+k个语音段的语音编码和待纠错文本集合输入大语言模型,以使大语言模型对第i+k个语音段的语音编码进行解码,以及对待纠错文本集合进行纠错;在第一待纠错文本对应的纠错结果中的实体关键词的置信度均不小于置信度阈值的情况下,将第一待纠错文本对应的纠错结果确定为第i个语音段的更新后识别结果,并将第一待纠错文本移出待纠错文本集合。根据本申请的技术方案,能够有效提升长语音中的实体关键词识别的准确性。
-
公开(公告)号:CN117935846A
公开(公告)日:2024-04-26
申请号:CN202311697703.X
申请日:2023-12-11
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音分析方法、系统以及相关装置,该方法包括:获取语音数据;将所述语音数据输入至训练后的语音分析模型,得到对应的分析结果;其中,所述语音分析模型是利用多个维度分别对应的第一训练样本进行训练得到的,所述语音分析模型中包含与每个维度对应的目标隐层,所述目标隐层基于属于对应维度的至少部分参考样本的参考脑电信息确定,所述参考脑电信息基于所述参考样本进行转换得到。通过上述方式,本申请能够提高语音分析的准确性和效率。
-
公开(公告)号:CN111199150B
公开(公告)日:2024-04-16
申请号:CN201911398383.1
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种文本分割方法、相关设备及可读存储介质,在获取待分割文本之后,获取待分割文本中每个文本单元的分割特征,并根据每个文本单元的分割特征,确定待分割文本的分割边界,最后基于所述待分割文本的分割边界,对所述待分割文本进行分割。基于上述方案,能够实现对待分割文本的分割。
-
公开(公告)号:CN117636845A
公开(公告)日:2024-03-01
申请号:CN202311595931.6
申请日:2023-11-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种语音识别方法、装置、设备及存储介质,具体实现方案为:基于第i帧音频的标签状态确定跳帧数;其中,i为正整数;利用所述跳帧数对所述第i帧音频进行跳帧解码处理,得到目标音频帧对应的非空白标签特征;其中,所述目标音频帧表示第i+1帧音频之前的标签状态为非空白标签的音频帧;基于所述第i+1帧音频和所述目标音频帧对应的非空白标签特征,预测所述第i+1帧音频的标签状态;根据所述第i+1帧音频的标签状态确定所述第i+1帧音频的语音识别结果。根据本申请的技术方案,能够显著提升推理速度,从而提高语音识别的效率。
-
-
-
-
-
-
-
-
-