-
公开(公告)号:CN119580749A
公开(公告)日:2025-03-07
申请号:CN202411734940.3
申请日:2024-11-27
Applicant: 平安科技(深圳)有限公司
IPC: G10L19/02 , G10L21/0316 , G10L21/04 , G10L25/03 , G10L25/30
Abstract: 本发明实施例提供一种语音信号的重构方法、装置、设备及存储介质。方法包括:获取初始语音信号,并对所述初始语音信号进行傅里叶变换计算得到频谱信息;基于所述频谱信息确定对应的初始梅尔谱,并通过目标声码器中的特征提取网络对所述初始梅尔谱进行特征提取操作,得到初始特征向量;通过所述目标声码器中的频谱生成网络对所述初始特征向量进行分析,得到目标幅度谱和目标相位谱;对所述目标幅度谱和所述目标相位谱进行逆傅里叶变换,得到重构后的目标语音信号。本申请实施例旨在较为精准的重构语音信号,使得生成的语音信号的自然度和清晰度较高。
-
公开(公告)号:CN119580701A
公开(公告)日:2025-03-07
申请号:CN202411786642.9
申请日:2024-12-05
Applicant: 平安科技(深圳)有限公司
Abstract: 本申请实施例属于音频处理技术领域,涉及一种语音合成方法、装置、计算机设备及存储介质,该方法包括:调用配置好的文本转语音模型,并在文本转语音模型的查找表中获取与合成对象标识数据相对应的第一嵌入数据,其中,配置好的文本转语音模型嵌入有适配器;对新对象语音数据进行特征提取操作,得到第二嵌入数据;对第一嵌入数据以及第二嵌入数据进行拼接操作,得到综合嵌入数据;根据综合嵌入数据对适配器进行参数调整操作,得到微调后的文本转语音模型;将综合嵌入数据以及合成文本数据输入至微调后的文本转语音模型进行语音合成操作,得到合成音频数据;向用户终端输出合成音频数据。本申请大幅降低了计算资源的需求。
-
公开(公告)号:CN119580692A
公开(公告)日:2025-03-07
申请号:CN202411764915.X
申请日:2024-12-03
Applicant: 平安科技(深圳)有限公司
Abstract: 本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域。该方法包括:获取多模态参考数据;从多模态参考数据中提取得到视觉参考嵌入特征、音频参考嵌入特征、文本参考嵌入特征、情感描述嵌入特征;基于多模态投影矩阵对视觉参考嵌入特征、音频参考嵌入特征和文本参考嵌入特征进行特征投影,得到多模态隐式情感嵌入特征;基于多模态投影矩阵对情感描述嵌入特征进行特征投影得到情感提示投影嵌入特征;基于多模态隐式情感嵌入特征和情感提示投影嵌入特征进行特征计算得到情感参考嵌入特征;基于情感参考嵌入特征和语音合成文本嵌入特征进行语音合成。本申请实施例能够提高语音合成的自然度。
-
公开(公告)号:CN119580070A
公开(公告)日:2025-03-07
申请号:CN202411752955.2
申请日:2024-11-28
Applicant: 平安科技(深圳)有限公司
Abstract: 本申请涉及人工智能技术领域,用于提供一种基于人工智能的乳腺影像处理方法、系统、设备以及介质。方法部分包括:基于乳腺医学样本影像以及相应的诊断文字样本报告,对多模态对比学习网络进行无监督学习预训练;基于用户样本问题及其相应的医学样本数据,对视觉问答模型VQA进行有监督学习训练,得到训练后的视觉问答模型VQA,视觉问答模型VQA包括预训练后的多模态对比学习网络、分类网络以及大语言网络模型,预训练后的多模态对比学习网络通过分类网络与大语言网络模型相连,医学样本数据包括乳腺医学样本影像以及相应的诊断文字样本报告,将医学数据以及用户问题,输入预先训练后的视觉问答模型VQA中,使视觉问答模型VQA输出用户问题相应的问题答案。
-
公开(公告)号:CN119579720A
公开(公告)日:2025-03-07
申请号:CN202411646807.2
申请日:2024-11-18
Applicant: 平安科技(深圳)有限公司
Abstract: 本发明涉及图像处理及金融科技技术领域,公开了一种图像中人脸皮肤颜色重建修复方法、装置、设备及介质,包括:获取预选模特的人脸视频,提取所述人脸视频中的人脸图片,得到人脸图像集合,识别所述人脸图像集合中每一个图像的人脸关键点,根据所述人脸关键点将所述人脸图像集合中的图像进行人脸对齐,得到预处理人脸图像,利用预先训练的人脸重建模型对所述预处理人脸图像进行人脸重建,得到重建人脸图像,对所述预处理人脸图像以及所述重建人脸图像进行颜色空间转换,得到转换人脸图像以及转换重建图像,基于颜色通道对所述转换人脸图像以及所述转化重建图像进行颜色加权均值融合,得到目标人脸皮肤颜色。
-
公开(公告)号:CN119578972A
公开(公告)日:2025-03-07
申请号:CN202411624576.5
申请日:2024-11-14
Applicant: 平安科技(深圳)有限公司
IPC: G06Q10/0639 , G06F18/24 , G06F18/23213 , G06F18/22 , G06F40/289 , G06F40/284 , G06F16/9535 , G06N3/0455 , G06N3/08
Abstract: 本申请公开一种智能职业能力评估方法、装置、设备及存储介质,属于人工智能技术领域。本申请通过获取待评估用户的用户基本信息,并基于用户基本信息生成用户基本信息标签;基于预训练的职业兴趣测评模型和职场性格测评模型,获取职业适配类型标签、职场性格类型标签和心理状态类型标签;将用户基本信息标签、职业适配类型标签、职场性格类型标签和心理状态类型标签导入职业适配度模型,得到职业能力适配度标签和心理状态适配度标签;将职业能力适配度标签和心理状态适配度标签导入职业推荐度模型,得到待评估用户的职业推荐结果。本申请还涉及区块链技术领域,用户信息存储在区块链网络上。本申请能够动态生成个性化的测评标签和推荐结果。
-
公开(公告)号:CN119577756A
公开(公告)日:2025-03-07
申请号:CN202411618328.X
申请日:2024-11-12
Applicant: 平安科技(深圳)有限公司
Abstract: 本发明属于人工智能技术领域,公开了一种越权漏洞的自动化测试方法、装置、设备及存储介质,所述方法包括:获取正常功能用例的API请求信息以及对应的初始响应信息,并对不同权限的用户配置相应的登录信息;根据配置好的不同权限的用户的登录信息进行自动登录,并在自动登录成功后获取不同权限的用户的认证信息;将获取的正常功能用例的API请求信息中原始认证信息替换为自动登录成功后获取的认证信息并重新发送API请求信息;预设判断正常功能用例的API是否存在越权漏洞的规则,并对初始响应信息以及重新发送API请求后得到的响应信息进行分析,判断正常功能用例的API是否存在越权漏洞。本发明有效的提高了越权漏洞的测试效率。
-
公开(公告)号:CN119577062A
公开(公告)日:2025-03-07
申请号:CN202411773529.7
申请日:2024-12-04
Applicant: 平安科技(深圳)有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/289 , G06F40/284 , G06F16/35 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及文本搜索技术领域,公开了一种通过句子片段优化文本搜索质量方法、装置、设备及介质,包括:获取语料库中连接词的句子片段,并将所述句子片段作为文档的抽取式摘要要素;将所述句子片段训练并存入向量数据库中;在向量数据库中,将句子片段作为检索索引搜索与获取相关文件。充分利用了分布式表示的优势,通过向量化的方式来处理搜索内容,从而实现了更准确、更高效、更多样性的文档搜索。通过结合word2vec词向量模型与BERT预训练模型的向量处理,能够在不同层次上进行语义搜索,为自然语言处理与信息检索任务提供更全面且优越的解决方案,使用句子片段参与搜索的方法能够提供更全面、准确与多样性的搜索结果。
-
公开(公告)号:CN112581978B
公开(公告)日:2025-03-07
申请号:CN202011446660.4
申请日:2020-12-11
Applicant: 平安科技(深圳)有限公司
IPC: G10L25/51 , G10L25/30 , G10L19/02 , G01S5/18 , G06F17/15 , G06F17/16 , G06N3/0442 , G06N3/0464 , G06N3/044 , G06N3/08
Abstract: 本申请提供一种声音事件检测与定位方法、装置、设备及可读存储介质,该方法包括:获取麦克风阵列采集到的多个音频信号;确定多个音频信号中的每两个音频信号之间的互相关函数矩阵;将每个互相关函数矩阵输入至预设声音事件分类模型,得到声音事件的类别矩阵,预设声音事件分类模型为预先训练好的的神经网络模型;对每个音频信号进行傅里叶变换,得到每个音频信号的频谱图,并根据每个音频信号的频谱数据,确定声音事件的声源方位矩阵;将类别矩阵和声源方位矩阵输入至预设匹配网络进行匹配,得到音频信号中的每个声音事件的类别以及与所述类别匹配的声源方位。本申请准确且快速的实现声音事件的检测和定位。
-
公开(公告)号:CN119562158A
公开(公告)日:2025-03-04
申请号:CN202411745499.9
申请日:2024-11-28
Applicant: 平安科技(深圳)有限公司
Abstract: 本公开关于一种图像拍摄方法、装置、图像定损方法、移动设备及存储介质,涉及图像处理技术领域,以至少解决相关技术中拍摄图像不清晰的问题。该方法包括:确定移动设备的当前位置信息、当前速度信息以及当前抖动偏移量;按照位置信息和速度信息与抖动偏移阈值之间的映射关系,确定当前位置信息和当前速度信息对应的目标抖动偏移阈值;在当前抖动偏移量小于目标抖动偏移阈值时,控制移动设备进行图像拍摄和图像采集,得到目标图像。
-
-
-
-
-
-
-
-
-