信号处理方法和信息处理设备

    公开(公告)号:CN111524536B

    公开(公告)日:2023-09-08

    申请号:CN201910104232.4

    申请日:2019-02-01

    Abstract: 本公开提供了信号处理方法和信息处理设备。信息处理设备包括处理器,所述处理器被配置为:对根据声音信号获得的时频域信号按照频率方向上的多个子带进行划分,以获得与各个子带对应的子带信号;将所获得的子带信号输入到预先训练好的分类模型中;以及利用分类模型确定声音信号中所包括的声音事件的类别,其中,分类模型包括分别与各个子带相对应的多个子带模型,每个子带模型根据通过训练获得的、相对应的子带对声音事件分类的影响而对所输入的子带信号施加权重,并根据被施加权重后的子带信号输出关于声音事件的初步分类结果,以及其中,分类模型根据多个子带模型的初步分类结果输出关于声音事件的最终分类结果。

    信息处理装置和信息处理方法

    公开(公告)号:CN112132169B

    公开(公告)日:2023-08-04

    申请号:CN201910555707.1

    申请日:2019-06-25

    Inventor: 沈伟 刘汝杰

    Abstract: 公开了一种信息处理装置和信息处理方法。信息处理装置包括:分类损失计算单元,将训练集中的每个样本图像输入到至少两个特征提取部件从而获得样本图像的至少两个特征,并使分类部件基于至少两个特征来计算样本图像的分类损失;样本对抽取单元,从至少两个特征中的至少一对特征中的每对特征,抽取用于计算每对特征之间的互信息的多个样本对;信息损失计算单元,将多个样本对输入到与每对特征对应的机器学习架构,计算每对特征之间的信息损失;以及联合训练单元,以使训练集中的所有样本图像的分类损失和信息损失之和最小的方式来联合调节至少两个特征提取部件、分类部件和机器学习架构的参数,从而获得经训练的至少两个特征提取部件和分类部件。

    语音分离装置、方法及介质

    公开(公告)号:CN111696572B

    公开(公告)日:2023-07-18

    申请号:CN201910188493.9

    申请日:2019-03-13

    Abstract: 公开了一种语音分离装置、方法及介质,所述语音分离装置包括:预处理单元,其对包含预定数目的语音信号混合而成的混合语音信号进行预处理以得到混合表达;多分支网络,其具有多个分支,每个分支使用不同的感受野处理所述混合表达以获取不同时间尺度的信息;分支权重网络,其基于所述混合语音信号为所述多分支网络中的每个分支的结果分配权重,其中,所述多分支网络基于获取的不同时间尺度的信息和为每个分支的结果分配的权重得到估计特征;掩模生成单元,其基于所述估计特征针对所述预定数目的语音中的每一个生成掩模;以及分离单元,其基于所述掩模和所述混合表达生成分离的语音信号。

    图像处理装置和图像处理方法

    公开(公告)号:CN109684901B

    公开(公告)日:2023-06-06

    申请号:CN201710976964.3

    申请日:2017-10-19

    Inventor: 沈伟 刘汝杰

    Abstract: 本发明涉及图像处理装置和图像处理方法。根据本发明的图像处理装置包括:自编码单元,用于对输入图像进行自编码以生成多个特征图;参数生成单元,用于根据所述多个特征图生成用于卷积神经网络的多个卷积核;以及输出单元,用于利用所述卷积神经网络,根据所述输入图像和所述多个卷积核生成所述输入图像的输出结果。使用根据本发明的图像处理装置和图像处理方法,可以提高CNN网络对图像进行处理的准确性。

    文本相关的说话人确认方法和设备

    公开(公告)号:CN110188338B

    公开(公告)日:2023-02-21

    申请号:CN201810155360.7

    申请日:2018-02-23

    Abstract: 本发明公开了一种文本相关的说话人确认方法和设备。该方法包括:利用识别模型,根据输入音频数据,得到表明说话人和文本都正确的第一概率和表明说话人和文本中的至少一个不正确的第二概率;当第一概率与第二概率的差异大于预定阈值时,确认说话人身份,否则拒识说话人;其中,识别模型基于至少包括说话人视角和文本视角的多视角向量,所述多视角向量包括如下分量:多视角向量的总体均值μ、说话人视角的分量u、文本视角的分量v、以及噪声∈。

    信息处理方法和装置以及信息检测方法

    公开(公告)号:CN109685087B9

    公开(公告)日:2023-02-03

    申请号:CN201710970935.6

    申请日:2017-10-18

    Inventor: 沈伟 刘汝杰

    Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从训练集中抽取对应于相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布;以及对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。根据本公开的实施例,可以提取具有区分度的面部语义特征。

    信息处理方法和装置以及信息检测方法

    公开(公告)号:CN109685087B

    公开(公告)日:2022-11-01

    申请号:CN201710970935.6

    申请日:2017-10-18

    Inventor: 沈伟 刘汝杰

    Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从训练集中抽取对应于相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布;以及对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。根据本公开的实施例,可以提取具有区分度的面部语义特征。

    面部识别模型的训练方法和训练设备

    公开(公告)号:CN109753850B

    公开(公告)日:2022-10-25

    申请号:CN201711070481.3

    申请日:2017-11-03

    Inventor: 张梦 刘汝杰 孙俊

    Abstract: 本发明公开了一种面部识别模型的训练方法和训练设备。该方法包括:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计第二实际场景数据中戴眼镜的比例;将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及基于第四训练数据,训练面部识别模型。

    识别面部动作的方法和装置以及存储介质

    公开(公告)号:CN115082979A

    公开(公告)日:2022-09-20

    申请号:CN202110276297.4

    申请日:2021-03-15

    Abstract: 公开了识别面部动作的方法和装置以及存储介质。该方法包括:由第一编码器针对第一面部图像提取第一特征;由第一分类器基于第一特征针对预定的多个运动单元生成第一预测结果,该第一预测结果指示该多个运动单元中的每一个是否存在于面部中;由第二分类器基于第一特征针对第一图像中除了运动单元之外的其它因素生成第二预测结果;通过以下方式训练第一编码器、第一分类器和第二分类器:第一编码器和第一分类器相互协作以增加第一预测结果的准确性,并且第一编码器和第二分类器相互对抗以降低第二预测结果的准确性;利用经训练的第一编码器和第一分类器,针对待识别的面部图像执行运动单元的识别。

Patent Agency Ranking