-
公开(公告)号:CN103578480B
公开(公告)日:2016-04-27
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN103578480A
公开(公告)日:2014-02-12
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN103578481B
公开(公告)日:2016-04-27
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN103578481A
公开(公告)日:2014-02-12
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN113553886B
公开(公告)日:2024-08-02
申请号:CN202010338080.7
申请日:2020-04-26
Applicant: 富士通株式会社
Abstract: 本公开内容涉及用于监视洗手过程的装置、方法以及存储介质。根据本公开内容的一个实施例,该用于监视洗手过程的装置包括:存储有指令的存储器;以及处理器,处理器能够执行从存储器获取的指令,使得以并行运行多个模块的方式实现监视洗手过程;其中,多个模块包括:分类模块,用于基于基准洗手动作集确定基于洗手过程生成的双手图像序列中的选中双手图像的动作类型属性;以及计数模块,用于基于选中基准洗手动作、双手图像序列及双手图像序列中的双手图像的已确定的动作类型属性,确定选中基准洗手动作的已执行次数。本公开内容的方法、装置和存储介质的有益效果至少包括:全面准确评估洗手人员的洗手过程的执行质量。
-
公开(公告)号:CN118053012A
公开(公告)日:2024-05-17
申请号:CN202211460259.5
申请日:2022-11-17
Applicant: 富士通株式会社
IPC: G06V10/764 , G06V10/774
Abstract: 本申请公开一种信息处理装置、信息处理方法和计算机可读记录介质。该信息处理装置包括:模型建立单元,被配置成对基于级联分离网络的第一模型添加对象部分解码器,以建立包括对象部分解码器的第一模型作为第二模型;以及模型训练单元,被配置成基于损失函数,利用训练图像集对第二模型进行训练,以获得用于对待预测图像进行预测的经训练的第二模型。对象部分解码器用于预测预定对象的预定部分的位置。损失函数包括针对预定对象的预定部分的位置的第一损失函数。第二模型中的交互解码器的输入查询向量是基于第二模型中的对象对解码器的输出向量和对象部分解码器的输出向量两者的。
-
公开(公告)号:CN111128222B
公开(公告)日:2023-09-08
申请号:CN201811276692.7
申请日:2018-10-30
Applicant: 富士通株式会社
IPC: G10L21/0272 , G10L25/30
Abstract: 本发明涉及一种语音分离方法,包括:使用基于核的至少一个卷积滤波器对语音数据进行第一卷积运算;对经第一卷积运算的数据执行降采样;使用激活函数处理经降采样后的数据;对经激活函数处理后的数据进行第二卷积运算;通过应用至少一个深度神经网络模型识别经第二卷积运算后的数据与讲话人间的对应关系;根据对应关系提取与讲话人对应的数据;使用全连接层处理所提取的数据;对经全连接层处理的数据分别进行第二卷积运算的逆运算和第一卷积运算的逆运算以生成对应于讲话人的语音数据。
-
公开(公告)号:CN116362313A
公开(公告)日:2023-06-30
申请号:CN202111581419.7
申请日:2021-12-22
Applicant: 富士通株式会社
IPC: G06N3/08 , G06N3/0464 , G06V40/16
Abstract: 公开了一种训练神经网络的方法和设备以及图像识别方法。神经网络包括第一模型和第二模型。该训练神经网络的方法包括:从第一图像中获得第二图像,第二图像的质量低于第一图像;将第一图像输入神经网络的第一模型,并且将第二图像输入神经网络的第二模型;计算第一模型和第二模型各自的注意力图和梯度图;基于第一模型的梯度图和注意力图的点积的矩阵以及第二模型的梯度图和注意力图的点积的矩阵来构建损失函数;和通过使损失函数最小来训练神经网络。
-
公开(公告)号:CN116129511A
公开(公告)日:2023-05-16
申请号:CN202111333848.2
申请日:2021-11-11
Applicant: 富士通株式会社
IPC: G06V40/20 , G06V20/40 , G06T7/11 , G06Q20/18 , G06V10/774
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:识别单元,其基于与图像中的手有关的第一信息来识别手部动作是否为预定动作;确定单元,其在识别出的手部动作是预定动作的情况下,确定可能存在与预定动作相关的人物交互的候选区域,候选区域用于判定候选区域中是否存在物体;以及判定单元,其判定候选区域中是否存在物体。该图像处理装置可以有效地检测视频帧的图像中的人手与物体的交互。
-
公开(公告)号:CN110633604B
公开(公告)日:2023-04-25
申请号:CN201810662632.2
申请日:2018-06-25
Applicant: 富士通株式会社
IPC: G06V40/16 , G06V10/774 , G06V10/764
Abstract: 本公开涉及信息处理方法和信息处理装置。根据本公开的信息处理方法使用多个训练样本对分类模型进行训练,并且包括如下步骤:基于多个训练样本中的典型样本来调整多个训练样本的特征向量在特征空间中的分布;以及使用经调整的多个训练样本的特征向量对分类模型进行训练。通过根据本公开的技术,可以通过在训练之前对训练样本进行预先调整,使得能够在训练过程中减小属于同一类别的训练样本之间的区分性并且增加属于不同类别的训练样本之间的区分性。经过这样训练的分类模型能够对在极端条件下取得的样本进行准确的分类。
-
-
-
-
-
-
-
-
-