-
公开(公告)号:CN114745299B
公开(公告)日:2023-06-13
申请号:CN202210259630.5
申请日:2022-03-16
Applicant: 南京工程学院
IPC: H04L43/08 , H04L43/04 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了基于序列延时重构CSP卷积神经网络的非侵入式负荷监测方法,首先利用阵列信号处理的特性对数据集中的2xL长度时序序列通过序列延时重构为LxLx2维度的矩阵M,再针对矩阵M的特点利用CSP网络特性针对性的构建卷积神经网络,接着使用重构的矩阵M数据及CSP卷积神经网络进行训练并得到最优的网络参数,再在监测端布置网络并加载相应参数,再对输入数据进行分解,得到负荷电器的工作状态;本发明实现了在监测时考虑数据中的时序关系及状态变化,且在提升监测的精度的同时也保障了监测的效率,能够针对性的指导用户或企业合理和安全用电,并辅助电力供应部门完善电力调度工作,具有方法科学合理、适用性强和效果佳等优点。
-
公开(公告)号:CN111583948B
公开(公告)日:2022-09-27
申请号:CN202010385976.0
申请日:2020-05-09
Applicant: 南京工程学院
IPC: G10L21/02 , G10L21/0232
Abstract: 本发明公开了一种改进的多通道语音增强系统和方法,将采集的多麦信号输入训练的自适应波束形成网络生成单通道信号;将生成的单通道信号通过共享网络进行信息转换;将转换后的信号输入多目标学习网络的主任务网络得到增强后的语音信号;将转换后的信号输入多目标学习网络的子任务网络得到表征语音信息的特征。本发明避免了声源定位算法,并可以有效的抑制非平稳噪声。本发明在神经网络中加入了LSTM层,能够在一定程度上缓解梯度消失和梯度爆炸问题,减少训练结果不收敛的情况,从而改善语音增强的效果。同时,由于引入多任务学习策略,增加了算法的鲁棒性,提升了算法性能,具有良好的应用前景。
-
公开(公告)号:CN111968666B
公开(公告)日:2022-02-01
申请号:CN202010847510.8
申请日:2020-08-20
Applicant: 南京工程学院
IPC: G10L21/0216 , G10L21/0232 , G10L25/03 , G10L25/30 , G06N3/04 , G06N3/08 , H04R25/00
Abstract: 本发明公开了一种基于深度域自适应网络的助听器语音增强方法,包括:分别从带噪语音和干净语音中提取帧级对数功率谱特征;构建基于编码器‑解码器结构的深度学习模型作为基线语音增强模型;在基线语音增强模型的基础上,构建基于深度域自适应网络的迁移学习语音增强模型;迁移学习语音增强模型在特征编码器和重建解码器之间引入域适配层和相对鉴别器;利用域对抗性损失训练迁移学习语音增强模型;在增强阶段,根据训练后的深度域自适应迁移学习语音增强模型,输入目标域带噪语音的帧级LPS特征,重建增强语音波形。本发明通过域对抗性训练来激励特征编码器生成域不变性特征,从而提高语音增强模型对未见噪声的适应性。
-
公开(公告)号:CN113902104A
公开(公告)日:2022-01-07
申请号:CN202111282747.7
申请日:2021-11-01
Applicant: 南京工程学院
Abstract: 本发明公开了联合无监督域自适应策略和注意力机制的非侵入式负荷监测方法,包括利用低频功率采样电表采集时间信息和功率信息样本作为总体样本,并将总体样本分为源域样本和目标域样本;对源域样本和目标域样本中样本集中的数据进行预处理,并得到模型的输入数据;联合无监督域自适应策略和注意力机制构建负荷监测网络模型;计算负荷监测网络模型损失;使用预处理后的数据对负荷监测模型进行训练和测试,并评估负荷分解性能。本发明可以有效的减小非侵入式负荷源域和目标域间特征空间和标签空间的分布差异,实现无监督的非侵入式负荷监测,具有良好的应用前景。
-
公开(公告)号:CN113053418A
公开(公告)日:2021-06-29
申请号:CN202110485958.4
申请日:2021-04-30
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于长短时记忆网络快速识别语音情感类别的方法,包括如下步骤:从原始语音数据样本中提取具有时序信息的帧级语音特征;通过软注意力模型创建基于注意力机制的改进型LSTM模型;用已知的原始语音数据样本及其语音情感类别对改进型LSTM模型进行训练得到情感类别识别模型;对情感类别识别模型进行情感识别测试验证;将未知的原始语音数据样本输入情感类别识别模型进行识别,输出对应的语音情感类别;本发明通过注意力机制优化常规型LSTM模型得到改进型LSTM模型,在保证性能的前提下,有效减少了矩阵计算量,提高语音情感类别识别的性能,具有良好的应用前景。
-
公开(公告)号:CN111933173A
公开(公告)日:2020-11-13
申请号:CN202010767816.2
申请日:2020-08-03
Applicant: 南京工程学院
IPC: G10L21/04 , G10L21/0316
Abstract: 本发明公开了一种增益平稳调节的动态范围控制算法及系统,涉及音频信号处理技术领域,根据实际动态范围控制程度的需要,给定增益曲线相关参数,参数包括过渡段的起始点、过渡段的带宽及压缩段的斜率,通过求出过渡段曲线方程的未知参数,进而得出整个增益曲线;根据输入语音信号的幅度大小及增益曲线确定实时增益,通过期望增益和实际增益的平稳调节,确保参与运算的增益平稳变化。本发明的方法通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确,与经典DRC算法相较,本发明所用方法的突出优势在于能够较小失真地对原始音频信号进行缩放处理,不会对后续功能模块造成影响。
-
公开(公告)号:CN109151692B
公开(公告)日:2020-09-01
申请号:CN201810767514.8
申请日:2018-07-13
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于深度学习网络的助听器自验配方法,通过构建患者综合信息库,通过对患者和验配过程的深入分析,发现验配过程中有效的策略,从而构建新的智能助听器自验配模型,提高验配效率;引入深度学习网络,通过大量的数据训练,使网络具有人工智能,能根据患者的基本信息快速生成符合患者听损特性的语音信息,同时还能根据患者的评价反馈,自动调节输入增益,大大缩短验配时间,改善用户满意度。
-
公开(公告)号:CN111402929A
公开(公告)日:2020-07-10
申请号:CN202010185119.6
申请日:2020-03-16
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于域不变的小样本语音情感识别方法,包括如下步骤:从数据库提取具有时序信息的语音特征;建立LSTM模型,确定待训练的参数及初值;通过多任务学习同时进行情感识别与数据库分类,采用交叉熵结合加权系数,建立损失函数;在数据库分类任务的梯度更新中采取梯度取反的对抗学习方法;在梯度反向传播过程中,按各数据库样本比例对共享层进行梯度加权,得到最终的梯度公式;得到训练好的网络参数值;用预训练好的共享层参数来初始化新的模型,并在未知数据集上重训练,然后用重训练的模型对小样本测试集进行测试验证。本发明利用已知的情感数据集为未知小样本数据提供预训练,提高未知小样本数据库的情感识别性能。
-
公开(公告)号:CN109199412A
公开(公告)日:2019-01-15
申请号:CN201811135081.0
申请日:2018-09-28
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于眼动数据分析的异常情绪识别方法,包括以下步骤,拍摄多个受测者的眼动视频样本,并提取各受测者对应的眼动视频样本内的32维眼动特征;对多个受测者的32维眼动特征的数据进行异常分析,并将异常的样本数据归为异常情绪类别,将非异常的样本数据归为非异常特征样本;基于非异常特征样本,从32维眼动特征中提取6维有效眼动特征;基于提取的6维有效眼动特征,输入训练好的支撑向量机模型,从而识别具有异常情绪的样本。本发明基于眼动数据分析引入的异常数据处理机制,大大提高了算法效率;并采用特征选择方法,降低了特征维度,在改善训练时间的同时,有效提高类似犯罪知情者的异常情绪识别。
-
公开(公告)号:CN109199411A
公开(公告)日:2019-01-15
申请号:CN201811135018.7
申请日:2018-09-28
Applicant: 南京工程学院
Abstract: 本发明公开了一种基于模型融合的案件知情者识别方法,包括以下步骤,提取各个被测试者在观看单一图片时的32维眼动特征;基于32维眼动特征训练支撑向量机模型A,来识别每个被测试者在单一图片时的言语置信度,并输出每个被测试者在单一图片时的概率f1(xi)和f2(xi);提取各个被测试者在观看组合图片时的110维眼动特征;基于110维眼动特征训练支撑向量机模型B,来识别每个被测试者在组合图片时的言语置信度,并输出每个被测试者在组合图片时的概率g1(xi)和g2(xi);运用乘法规则,融合支撑向量机模型A和B的分类器概率,得到联合概率,取各个被测试者的概率最大的类别为最后的决策结果。本发明可以有效抑制反测谎手段,提高了算法效率。
-
-
-
-
-
-
-
-
-