模型训练、图文识别方法、装置、电子设备和存储介质

    公开(公告)号:CN119741501A

    公开(公告)日:2025-04-01

    申请号:CN202411940447.7

    申请日:2024-12-26

    Abstract: 本发明提供一种模型训练、图文识别方法、装置、电子设备和存储介质,其中方法包括:基于初始识别模型的视觉分支和语义分支,分别提取样本图像的视觉特征和语义特征;基于字符一致但排序不同的多个样本图像的视觉特征之间的差异,确定视觉约束损失;基于语义一致的多个样本图像的语义特征之间的差异,和/或,语义相近的多个样本图像的语义特征之间的差异,确定语义约束损失;基于视觉约束损失,对视觉分支进行参数迭代,以及,基于语义约束损失,对语义分支进行参数迭代,基于参数迭代完成后的初始识别模型,确定训练完成的图文识别模型。本发明提供的方法、装置、电子设备和存储介质,保证了复杂场景下图文识别的语义合理性和识别准确性。

    电动液压助力转向系统及车辆
    95.
    发明公开

    公开(公告)号:CN119611498A

    公开(公告)日:2025-03-14

    申请号:CN202411787967.9

    申请日:2024-12-06

    Abstract: 本发明提供一种电动液压助力转向系统及车辆,涉及汽车电子设备技术领域,包括:信号采集处理系统、液压系统、转向系统和远程监控系统;信号采集处理系统包括数字信号处理器、压力传感器、角度传感器和无线通信模块;数字信号处理器分别与压力传感器、角度传感器以及无线通信模块连接。通过设置压力传感器和角度传感器,可以使数字信号处理器实现对液压系统和转向系统的准确操控,并可以掌握实时的系统状态。而且,采用了无线通信模块,可以与远程监控系统实现无线通信连接,实现对液压系统和转向系统的远程实时监控,相比于有线通信,可以提高用户的远程监控体验。

    一种文本生成方法、装置、设备及存储介质

    公开(公告)号:CN114254595B

    公开(公告)日:2025-01-07

    申请号:CN202111527269.1

    申请日:2021-12-14

    Abstract: 本申请提供了一种文本生成方法、装置、设备及存储介质,其中,方法包括:获取指定领域的目标文本;利用预先建立的文本生成模型,生成目标文本中每个句子的辅助阅读句子,其中,文本生成模型采用指定领域中标注有真实辅助阅读句子的训练句子训练得到;根据目标文本中每个句子的辅助阅读句子,生成目标文本的篇章级辅助阅读文本。通过本申请提供的文本生成方法可针对指定领域的目标文本生成辅助阅读文本,生成的辅助阅读文本能够辅助阅读者进行阅读,从而能够大大降低阅读者对于目标文本的阅读难度,用户体验较好。

    语音识别方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN118711591A

    公开(公告)日:2024-09-27

    申请号:CN202410507643.9

    申请日:2024-04-25

    Abstract: 本申请提出一种语音识别方法、装置、电子设备、存储介质及产品,该方法包括:对历史语音的识别结果进行编码处理,得到历史语音的识别结果的编码信息,以及,对待识别语音进行编码处理,得到待识别语音的编码信息;将历史语音的识别结果的编码信息,与待识别语音的编码信息进行融合,得到待识别语音的语音编码信息;对语音编码信息进行解码处理,得到待识别语音的识别结果。本方案将历史语音的识别结果的编码信息,与待识别语音的编码信息进行融合,实现了在对待识别语音进行编码的过程中,结合历史语音的识别结果,能够使得在待识别语音的编码过程中便结合上文信息,提高待识别语音的语音编码信息的准确度,进而提高语音识别的准确度。

    一种语音识别方法以及相关装置
    99.
    发明公开

    公开(公告)号:CN118571224A

    公开(公告)日:2024-08-30

    申请号:CN202410739670.9

    申请日:2024-06-07

    Abstract: 本申请公开了一种语音识别方法以及相关装置,该方法包括:获取目标对象的待识别音频;基于所述待识别音频,获取用户从多个候选条件中选定的目标条件以及从多个候选风格中选定的目标风格;其中,所述目标条件与所述目标对象和所述目标对象所在的目标场景中的至少一者相关,所述目标风格与预设的识别格式相关;基于所述目标条件和所述目标风格,获取所述待识别音频对应的目标识别文本。通过上述方式,本申请能够提高语音识别得到的目标识别文本与用户需求的契合度。

    一种图像修复方法、装置、设备及存储介质

    公开(公告)号:CN117474807B

    公开(公告)日:2024-05-31

    申请号:CN202311819869.4

    申请日:2023-12-27

    Abstract: 本发明提供了一种图像修复方法、装置、设备及存储介质,图像修复方法包括:获取待修复图像以及与待修复图像相关的音频;获取能够表征音频的整个音频信息的音频特征,作为目标音频特征;利用目标音频特征,对待修复图像进行修复,得到待修复图像对应的修复后图像。本发明提供的图像修复方法可利用与待修复图像相关的音频的信息对待修复图像中受损的图像信息进行补偿,从而实现真正意义上的受损补偿,本发明提供的图像修复方法具有较好的修复效果。

Patent Agency Ranking