基于声纹的目标人物识别方法、系统、装置及存储介质

    公开(公告)号:CN113948092B

    公开(公告)日:2024-08-02

    申请号:CN202111022991.X

    申请日:2021-09-01

    摘要: 本发明公开了基于声纹的目标人物识别方法、系统、装置及存储介质,其中所述方法包括:获取包含目标人物说话的待比对音频,并获取到对应的第一声纹特征,在声纹特征库中查找相似的声纹特征,确定若干条相似音频,并根据相似音频的加密文件名在声纹信息库中进行查找,确定相似音频对应的音频信息,该音频信息包括相似音频中说话人的手机号码。通过本申请实施例的基于声纹的目标人物识别方法,侦查部门可以根据目标人物的音频确定可能是目标人物的人的手机号码,从而达到缩小侦查侦查范围或者是对目标人群进行重点监测的效果。

    文本纠错方法、系统、设备及存储介质

    公开(公告)号:CN114495910B

    公开(公告)日:2022-08-02

    申请号:CN202210360845.6

    申请日:2022-04-07

    IPC分类号: G10L15/02 G10L15/06 G10L15/26

    摘要: 本发明提供文本纠错方法、系统、设备及存储介质,包括:将经过自动语音识别的文本切分为短句;将短句输入已训练的纠错模型,包括音素提取器、音素特征编码器、语言特征编码器、特征合并模块和解码器,在训练时同步更新参数;音素提取器获取音素信息,音素特征编码器将其转化为音素特征;语言特征编码器得到语言特征;特征合并模块合并音素特征和语言特征得到合并特征,解码器对其解码以对其纠错;确定同一短句的第一困惑度和第二困惑度;通过比较两者确定短句的正确文本;将所有短句的正确文本按顺序合并为正确文本。将对文本的各层级处理集成在纠错模型中,使各层级的参数在训练时同步更新,上层结构的误差在下游训练中得到修正,避免误差积累。

    一种情绪识别方法及系统
    3.
    发明公开

    公开(公告)号:CN116935899A

    公开(公告)日:2023-10-24

    申请号:CN202310981296.9

    申请日:2023-08-04

    摘要: 本发明提供一种情绪识别方法及系统,包括获取语音音频文件,包括一类数据和二类数据;利用XGBoost算法对一类数据进行分析处理,得到预测向量;对二类数据进行频谱转换和文本转换,得到音频特征向量和文本特征向量;利用融合网络对预测向量、音频特征向量和文本特征向量进行融合处理,得到情绪识别结果。通过对语音音频文件进行不同处理得到预测向量、音频特征向量和文本特征向量,并对三者进行融合处理,不仅提高了语音文本识别的准确度,还考虑了语音中情绪语气不同导致的声音波动,进而提高了情绪识别的准确度,此外由于各部分处理是单独同时进行的,因此保证了情绪识别的效率,解决了如何实现高准确度和高识别效率的语音情绪识别的问题。

    通信场景电显名片的客户线下分群及线上分析方法

    公开(公告)号:CN116304774A

    公开(公告)日:2023-06-23

    申请号:CN202310222016.6

    申请日:2023-03-08

    发明人: 周丽萍 金健 杜量

    IPC分类号: G06F18/23213 H04W8/18

    摘要: 本发明提供通信场景电显名片的客户线下分群及线上分析方法,包括:抽取样本通信话单数据和产品应用日志数据并进行特征处理,获得标准化数据;将标准化数据进行最大最小化处理,构建对应的标准RANS向量;选取N个标准RANS向量并采用符合数据分布的kmeans++算法进行聚类,得到k个聚类质心;确定k个客户分群标签;建立k个聚类质心与k个客户分群标签的映射关系。线下聚类分群阶段提出了业务解释性强的特征选取方法和标签处理方法,确定k个聚类质心及其对应的簇,对应客户分群标签,在建立映射关系后,可通过客户分群标签确定客户类型,利于后续基于客户分群标签反馈相应的产品策略,提高呼叫接通率并降低电显名片的使用成本。

    编码器模型的训练方法及存储介质、相似度预测方法及系统

    公开(公告)号:CN114490950B

    公开(公告)日:2022-07-12

    申请号:CN202210360834.8

    申请日:2022-04-07

    摘要: 本发明提供编码器模型的训练方法及存储介质、相似度预测方法及系统,包括:将两个文本序列输入嵌入层得到文本序列向量;将两个文本序列向量输入孪生神经网络编码器模型,以使其基于相同的神经网络参数确定隐状态;根据神经网络参数构造自监督损失函数;将隐状态输入池化层以使其根据隐状态进行池化处理,根据池化处理后的文本序列向量确定两个文本序列的相似度,并以其构造有监督损失函数;根据自监督和有监督损失函数确定损失函数,以更新神经网络参数;继续将新的文本序列输入直至损失函数的数值为最小值。该方法大幅提高了模型在计算文本序列相似度时的推理带宽,且基于已训练的神经网络编码器模型能够实现两个文本序列相似度的精准计算。

    编码器模型的训练方法及存储介质、相似度预测方法及系统

    公开(公告)号:CN114490950A

    公开(公告)日:2022-05-13

    申请号:CN202210360834.8

    申请日:2022-04-07

    摘要: 本发明提供编码器模型的训练方法及存储介质、相似度预测方法及系统,包括:将两个文本序列输入嵌入层得到文本序列向量;将两个文本序列向量输入孪生神经网络编码器模型,以使其基于相同的神经网络参数确定隐状态;根据神经网络参数构造自监督损失函数;将隐状态输入池化层以使其根据隐状态进行池化处理,根据池化处理后的文本序列向量确定两个文本序列的相似度,并以其构造有监督损失函数;根据自监督和有监督损失函数确定损失函数,以更新神经网络参数;继续将新的文本序列输入直至损失函数的数值为最小值。该方法大幅提高了模型在计算文本序列相似度时的推理带宽,且基于已训练的神经网络编码器模型能够实现两个文本序列相似度的精准计算。

    用于语音文本的特征实体识别方法及系统

    公开(公告)号:CN117037777A

    公开(公告)日:2023-11-10

    申请号:CN202310981149.1

    申请日:2023-08-04

    摘要: 本发明提供一种用于语音文本的特征实体识别方法及系统,包括:获取语音文本;对所述语音文本进行先验知识处理,以得到文本向量;利用神经网络对所述文本向量进行激活处理,以得到特征实体。通过对语音文本进行先验知识处理,能够提高样本的特征实体识别的精准度;通过神经网络对文本向量进行激活处理,能够提高神经网络的收敛速度,从而提高了特征实体识别的效率。解决了如何对语音文本的特征实体进行高效、高准确性的识别的问题。

    基于Hadoop集群的冷数据存储和回热分析方法及系统

    公开(公告)号:CN117008839A

    公开(公告)日:2023-11-07

    申请号:CN202311015579.4

    申请日:2023-08-11

    摘要: 本发明提供一种基于Hadoop集群的冷数据存储和回热分析方法及系统,包括:获取Hadoop集群中的原始业务数据;对所述原始业务数据进行筛选,以挑选出冷数据;获取所述冷数据的配置信息;利用所述配置信息存储所述冷数据;对所述冷数据进行回热,以调用所述冷数据。通过对原始业务数据进行筛选,使得冷数据的选择方式不仅仅考虑存储时间或调取次数,避免重要冷数据的误删除;通过根据配置信息存储冷数据,使得不同配置信息的冷数据被分类保存,从而在后续回热时能够降低运营成本,解决了现有冷数据处理方式运维成本高且易造成重要业务数据丢失的问题。

    文本纠错方法、系统、设备及存储介质

    公开(公告)号:CN114495910A

    公开(公告)日:2022-05-13

    申请号:CN202210360845.6

    申请日:2022-04-07

    IPC分类号: G10L15/02 G10L15/06 G10L15/26

    摘要: 本发明提供文本纠错方法、系统、设备及存储介质,包括:将经过自动语音识别的文本切分为短句;将短句输入已训练的纠错模型,包括音素提取器、音素特征编码器、语言特征编码器、特征合并模块和解码器,在训练时同步更新参数;音素提取器获取音素信息,音素特征编码器将其转化为音素特征;语言特征编码器得到语言特征;特征合并模块合并音素特征和语言特征得到合并特征,解码器对其解码以对其纠错;确定同一短句的第一困惑度和第二困惑度;通过比较两者确定短句的正确文本;将所有短句的正确文本按顺序合并为正确文本。将对文本的各层级处理集成在纠错模型中,使各层级的参数在训练时同步更新,上层结构的误差在下游训练中得到修正,避免误差积累。

    基于声纹的目标人物识别方法、系统、装置及存储介质

    公开(公告)号:CN113948092A

    公开(公告)日:2022-01-18

    申请号:CN202111022991.X

    申请日:2021-09-01

    摘要: 本发明公开了基于声纹的目标人物识别方法、系统、装置及存储介质,其中所述方法包括:获取包含目标人物说话的待比对音频,并获取到对应的第一声纹特征,在声纹特征库中查找相似的声纹特征,确定若干条相似音频,并根据相似音频的加密文件名在声纹信息库中进行查找,确定相似音频对应的音频信息,该音频信息包括相似音频中说话人的手机号码。通过本申请实施例的基于声纹的目标人物识别方法,侦查部门可以根据目标人物的音频确定可能是目标人物的人的手机号码,从而达到缩小侦查侦查范围或者是对目标人群进行重点监测的效果。