-
公开(公告)号:CN111199150A
公开(公告)日:2020-05-26
申请号:CN201911398383.1
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/30
Abstract: 本申请公开了一种文本分割方法、相关设备及可读存储介质,在获取待分割文本之后,获取待分割文本中每个文本单元的分割特征,并根据每个文本单元的分割特征,确定待分割文本的分割边界,最后基于所述待分割文本的分割边界,对所述待分割文本进行分割。基于上述方案,能够实现对待分割文本的分割。
-
公开(公告)号:CN115497460B
公开(公告)日:2025-05-09
申请号:CN202211096150.8
申请日:2022-09-08
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/02 , G10L15/08 , G10L13/08 , G06N20/00 , G06N7/01 , G06N3/047 , G06F40/279 , G06F16/334
Abstract: 本申请提供了音频识别方法、模型的训练方法、装置、设备及存储介质,具体实现方案为:在第一音频数据集中确定低频三音素;基于低频三音素,从预设语料库中确定包含低频三音素的低频文本;基于低频文本训练音频识别模型。根据本申请的技术方案,能够有效提升训练数据中的低频数据内容的多样性和准确性。
-
公开(公告)号:CN119741501A
公开(公告)日:2025-04-01
申请号:CN202411940447.7
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06V10/40 , G06V10/764 , G06N3/0455 , G06V30/18 , G06V30/19
Abstract: 本发明提供一种模型训练、图文识别方法、装置、电子设备和存储介质,其中方法包括:基于初始识别模型的视觉分支和语义分支,分别提取样本图像的视觉特征和语义特征;基于字符一致但排序不同的多个样本图像的视觉特征之间的差异,确定视觉约束损失;基于语义一致的多个样本图像的语义特征之间的差异,和/或,语义相近的多个样本图像的语义特征之间的差异,确定语义约束损失;基于视觉约束损失,对视觉分支进行参数迭代,以及,基于语义约束损失,对语义分支进行参数迭代,基于参数迭代完成后的初始识别模型,确定训练完成的图文识别模型。本发明提供的方法、装置、电子设备和存储介质,保证了复杂场景下图文识别的语义合理性和识别准确性。
-
公开(公告)号:CN119721071A
公开(公告)日:2025-03-28
申请号:CN202510224089.8
申请日:2025-02-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音翻译方法、系统和相关装置,该方法包括:基于目标对象的待翻译音频,确定所述待翻译音频对应的音频特征、文本转换特征和所述目标对象匹配的声学特征;获取与翻译任务匹配的链路信息,基于所述链路信息、所述音频特征、所述文本转换特征和所述声学特征,编码得到与所述待翻译音频匹配的目标转换特征;对所述目标转换特征进行解码,得到所述待翻译音频对应的翻译音频。通过上述方式,本申请能够提高语音翻译的准确性。
-
公开(公告)号:CN119611498A
公开(公告)日:2025-03-14
申请号:CN202411787967.9
申请日:2024-12-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种电动液压助力转向系统及车辆,涉及汽车电子设备技术领域,包括:信号采集处理系统、液压系统、转向系统和远程监控系统;信号采集处理系统包括数字信号处理器、压力传感器、角度传感器和无线通信模块;数字信号处理器分别与压力传感器、角度传感器以及无线通信模块连接。通过设置压力传感器和角度传感器,可以使数字信号处理器实现对液压系统和转向系统的准确操控,并可以掌握实时的系统状态。而且,采用了无线通信模块,可以与远程监控系统实现无线通信连接,实现对液压系统和转向系统的远程实时监控,相比于有线通信,可以提高用户的远程监控体验。
-
公开(公告)号:CN119517006A
公开(公告)日:2025-02-25
申请号:CN202411486618.3
申请日:2024-10-23
Applicant: 科大讯飞股份有限公司
IPC: G10L15/00 , G10L15/18 , G10L25/51 , G10L15/06 , G06F16/334
Abstract: 本申请提出一种方言识别方法、装置、设备及程序产品,该方法包括:将方言语音输入方言语音识别模型,得到方言识别结果;其中,所述方言语音识别模型是基于方言语音样本进行方言语音识别训练以及基于方言文本发音样本进行方言文本预测训练得到的,所述方言文本发音样本包括方言文本对应的普通话发音。上述方案基于新的模型训练方案训练方言语音识别模型并将其用于方言语音识别,能够提高方言语音识别效果。
-
公开(公告)号:CN114254595B
公开(公告)日:2025-01-07
申请号:CN202111527269.1
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06F40/211 , G06F40/216 , G06F40/242 , G06F16/332 , G06F40/16
Abstract: 本申请提供了一种文本生成方法、装置、设备及存储介质,其中,方法包括:获取指定领域的目标文本;利用预先建立的文本生成模型,生成目标文本中每个句子的辅助阅读句子,其中,文本生成模型采用指定领域中标注有真实辅助阅读句子的训练句子训练得到;根据目标文本中每个句子的辅助阅读句子,生成目标文本的篇章级辅助阅读文本。通过本申请提供的文本生成方法可针对指定领域的目标文本生成辅助阅读文本,生成的辅助阅读文本能够辅助阅读者进行阅读,从而能够大大降低阅读者对于目标文本的阅读难度,用户体验较好。
-
公开(公告)号:CN118711591A
公开(公告)日:2024-09-27
申请号:CN202410507643.9
申请日:2024-04-25
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L15/183 , G10L15/28
Abstract: 本申请提出一种语音识别方法、装置、电子设备、存储介质及产品,该方法包括:对历史语音的识别结果进行编码处理,得到历史语音的识别结果的编码信息,以及,对待识别语音进行编码处理,得到待识别语音的编码信息;将历史语音的识别结果的编码信息,与待识别语音的编码信息进行融合,得到待识别语音的语音编码信息;对语音编码信息进行解码处理,得到待识别语音的识别结果。本方案将历史语音的识别结果的编码信息,与待识别语音的编码信息进行融合,实现了在对待识别语音进行编码的过程中,结合历史语音的识别结果,能够使得在待识别语音的编码过程中便结合上文信息,提高待识别语音的语音编码信息的准确度,进而提高语音识别的准确度。
-
公开(公告)号:CN118571224A
公开(公告)日:2024-08-30
申请号:CN202410739670.9
申请日:2024-06-07
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法以及相关装置,该方法包括:获取目标对象的待识别音频;基于所述待识别音频,获取用户从多个候选条件中选定的目标条件以及从多个候选风格中选定的目标风格;其中,所述目标条件与所述目标对象和所述目标对象所在的目标场景中的至少一者相关,所述目标风格与预设的识别格式相关;基于所述目标条件和所述目标风格,获取所述待识别音频对应的目标识别文本。通过上述方式,本申请能够提高语音识别得到的目标识别文本与用户需求的契合度。
-
公开(公告)号:CN117474807B
公开(公告)日:2024-05-31
申请号:CN202311819869.4
申请日:2023-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06T5/77 , G06V10/44 , G06V10/774 , G06V10/86
Abstract: 本发明提供了一种图像修复方法、装置、设备及存储介质,图像修复方法包括:获取待修复图像以及与待修复图像相关的音频;获取能够表征音频的整个音频信息的音频特征,作为目标音频特征;利用目标音频特征,对待修复图像进行修复,得到待修复图像对应的修复后图像。本发明提供的图像修复方法可利用与待修复图像相关的音频的信息对待修复图像中受损的图像信息进行补偿,从而实现真正意义上的受损补偿,本发明提供的图像修复方法具有较好的修复效果。
-
-
-
-
-
-
-
-
-