-
公开(公告)号:CN115101085B
公开(公告)日:2024-08-30
申请号:CN202210647059.4
申请日:2022-06-09
申请人: 重庆理工大学
IPC分类号: G10L21/0272 , G10L21/0308 , G10L25/30
摘要: 本发明涉及语音处理技术领域,尤其涉及一种卷积增强外部注意力的多说话人时域语音分离方法。方法包括:S1.通过编码器将多说话人混合语音,进行卷积运算,转换为其潜在特征表示;通过基于卷积增强外部注意力模块的分离器学习得到语音掩码;语音掩码与编码器输出的潜在特征表示相乘,再通过解码器的反卷积运算重建波形得到分离后的语音。本发明能够满足语音分离较小模型、高时效性的需求,并且以其序列建模的优势来达到更好的分离效果;增强了外部注意力机制学习到更多的特征和相关性,且保持了其分离速度快的优势;在双路结构中的应用可以较好地平衡时效性、模型大小和分离效果。
-
公开(公告)号:CN113724193B
公开(公告)日:2024-01-12
申请号:CN202110623572.5
申请日:2021-06-04
申请人: 重庆理工大学
IPC分类号: G06T7/00 , G06T7/12 , G06T7/13 , G06T7/136 , G06T7/60 , G06F17/12 , G06F17/16 , G01B11/02 , G01B11/14
摘要: 本发明公开了一种PCBA零部件尺寸及间隙高精度视觉测量方法,包括以下步骤:S1、进行系统标定得到坐标系的精准映射;S2、使用Canny算子对PCBA电路板的零部件进行像素级边缘粗提取;S3、对完成边缘粗提取的PCBA零部件使用改进Zernike矩方法,得到高精度的PCBA电路板零部件亚像素边缘图像。本发明先用Canny算子对PCBA电路板的零部件进行像素级边缘粗提取,再使用改进的Zernike矩方法对像素级边缘粗提取之后PCBA零部件进行亚像素级边缘检测,同时建立标定坐标系,计算出矩形元件和圆形元件的尺寸和间隙,测量精度突破现有技术达到的0.1mm,整体的检测精度基本控制在0.02mm左右,提高了PCBA零部件尺寸和间隙的视觉测量精度。
-
公开(公告)号:CN113724193A
公开(公告)日:2021-11-30
申请号:CN202110623572.5
申请日:2021-06-04
申请人: 重庆理工大学
IPC分类号: G06T7/00 , G06T7/12 , G06T7/13 , G06T7/136 , G06T7/60 , G06F17/12 , G06F17/16 , G01B11/02 , G01B11/14
摘要: 本发明公开了一种PCBA零部件尺寸及间隙高精度视觉测量方法,包括以下步骤:S1、进行系统标定得到坐标系的精准映射;S2、使用Canny算子对PCBA电路板的零部件进行像素级边缘粗提取;S3、对完成边缘粗提取的PCBA零部件使用改进Zernike矩方法,得到高精度的PCBA电路板零部件亚像素边缘图像。本发明先用Canny算子对PCBA电路板的零部件进行像素级边缘粗提取,再使用改进的Zernike矩方法对像素级边缘粗提取之后PCBA零部件进行亚像素级边缘检测,同时建立标定坐标系,计算出矩形元件和圆形元件的尺寸和间隙,测量精度突破现有技术达到的0.1mm,整体的检测精度基本控制在0.02mm左右,提高了PCBA零部件尺寸和间隙的视觉测量精度。
-
公开(公告)号:CN110349588A
公开(公告)日:2019-10-18
申请号:CN201910642258.4
申请日:2019-07-16
申请人: 重庆理工大学
摘要: 本发明公开了一种基于词嵌入的LSTM网络声纹识别方法,包括以下步骤:S1、获取待识别语音片段;S2、通过快速傅里叶变换将待识别语音片段的时间刻度、频率和振幅转化,生成待识别语音片段的语谱图;S3、将待识别语音片段的语谱图通过词嵌入处理进行降维后输入训练后的LSTM网络,得到待识别语音片段的身份分类信息。本发明基于词嵌入降维的语谱图特征提取方法,来提高语谱图在网络训练中的有效性,同时利用LSTM网络具有很好的时序特征捕捉能力的特点,采用LSTM网络对词嵌入降维后的语谱图进行分类,实现了高准确率的声纹识别。
-
公开(公告)号:CN105783785B
公开(公告)日:2018-05-15
申请号:CN201610222327.2
申请日:2016-04-11
申请人: 重庆理工大学
IPC分类号: G01B11/25
摘要: 本发明属于物体三维信息重构、数字图像处理等技术领域,具体涉及小波变换轮廓术三维重建技术中一种小波脊相位提取方法,该提取方法包括以下步骤:(1)、设计黑白相间的余弦光栅条纹图像,并将光栅投影到待测物体表面;(2)、通过CCD采集投影后变形的条纹图像;(3)、提取变形条纹的一行,对其进行连续小波变换;(4)、选取小波脊的候选脊点;(5)、通过代价函数方法选取小波脊,并确定瞬时相位;(6)、重复上述步骤(3)到步骤(5),直到变形条纹的最后一行。本发明的提取方法在低噪声环境下,大大减少了提取的相位误差率,更适用于低噪声环境的小波脊相位提取。
-
公开(公告)号:CN107886529A
公开(公告)日:2018-04-06
申请号:CN201711278238.0
申请日:2017-12-06
申请人: 重庆理工大学
IPC分类号: G06T7/33
摘要: 本发明公开了一种用于三维重建的点云配准方法包括:S101、获得多视角三维点云,取两视角三维点云分别作为源点集和目标点集;S102、构建KD-tree;S103、求取源点集中各点的法向量;S104、计算法向量夹角平均值;S105、将源点集中的点分级并设置最大分辨率,初始时分辨率为1;S106、计算当前分辨率下源点集中每一级的采样比例并提取采样点;S107、基于本发明中的匹配度求采样点在目标点集的匹配点;S108、使用四元数法计算旋转矩阵和平移矩阵;S109、对源点集变换,得到新的源点集;S110、重复步骤S107到S109直到目标函数最小;S111、若满足预设条件,则结束,否则将当前分辨率加1,并返回步骤S106。本发明利用低分辨率匹配点对迅速完成配准,高分辨率匹配点对提高精度,并利用匹配度查找匹配点,大大提高了大规模点云的配准速度及精度。
-
公开(公告)号:CN116310799A
公开(公告)日:2023-06-23
申请号:CN202310115772.9
申请日:2023-02-14
申请人: 重庆理工大学
IPC分类号: G06V20/10 , G06V20/70 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明涉及于图像处理技术领域,尤其涉及语义信息与几何约束相结合的动态特征点剔除方法,步骤包括:在ORB‑SLAM2系统框架中创建目标检测线程,设计了YOLOv5目标检测网络;提取图像ORB特征点,使用了对极几何约束的运动一致性检测算法判断特征点动态性;提出语义信息与几何约束相结合的动态特征点剔除模块,最终确定目标检测边界框中的动态物体,实现了动态特征点的有效剔除。本发明方法可以快速识别场景中的物体类别,通过验证证明,本发明方法在TUM数据集上其绝对轨迹误差、平移和旋转相对位姿误差的RMSE值与ORB‑SLAM2相比分别降低了97.71%、95.10%和91.97%。
-
公开(公告)号:CN108197209A
公开(公告)日:2018-06-22
申请号:CN201711460139.4
申请日:2017-12-28
申请人: 重庆理工大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种基于加权协同过滤算法的电影推荐方法,方法包括获取历史评分数据集,基于历史评分数据集生成第一历史评分矩阵RCF及第二历史评分矩阵RSL其中,对第一历史评分矩阵RCF进行协同过滤生成第一评分矩阵R’CF,合并第一评分矩阵R’CF及第二历史评分矩阵RSL生成第二评分矩阵Rmn,对第二评分矩阵进行加权协同过滤计算出所有电影的第一预测评分,将所有电影按照其第一预测评分的大小以预设规律进行排序并进行推荐。本发明通过预设阈值对用户进行分层,使协同过滤时矩阵更稠密,减少由于评分矩阵规模增长带来的计算耗时增加,使得计算时间在不同规模的数据集上差异不会太大。
-
公开(公告)号:CN105783785A
公开(公告)日:2016-07-20
申请号:CN201610222327.2
申请日:2016-04-11
申请人: 重庆理工大学
IPC分类号: G01B11/25
CPC分类号: G01B11/25
摘要: 本发明属于物体三维信息重构、数字图像处理等技术领域,具体涉及小波变换轮廓术三维重建技术中一种小波脊相位提取方法,该提取方法包括以下步骤:(1)、设计黑白相间的余弦光栅条纹图像,并将光栅投影到待测物体表面;(2)、通过CCD采集投影后变形的条纹图像;(3)、提取变形条纹的一行,对其进行连续小波变换;(4)、选取小波脊的候选脊点;(5)、通过代价函数方法选取小波脊,并确定瞬时相位;(6)、重复上述步骤(3)到步骤(5),直到变形条纹的最后一行。本发明的提取方法在低噪声环境下,大大减少了提取的相位误差率,更适用于低噪声环境的小波脊相位提取。
-
公开(公告)号:CN105261037A
公开(公告)日:2016-01-20
申请号:CN201510645189.4
申请日:2015-10-08
申请人: 重庆理工大学
摘要: 本发明公开了一种自适应复杂场景的运动目标检测方法,1)对视频图像进行光照补偿;2)利用混合高斯背景建模方法得到每帧视频图像的背景图像;3)利用背景差分法原理获取每帧的绝对差分图像;4)采用最大熵分割原理获取每个绝对差分图像的灰度概率模型最优分割阈值;5)利用最优分割阈值对绝对差分图像进行二值化处理以获得前景图像;6)采用不同结构体的模块进行形态学处理;7)利用连通域标定算法对前景图像进行区域标定,利用矩形框锁定已标定的运动目标。本方法在全局光照剧烈变化、背景干扰、相对运动等不同复杂场景下具有较好的运动目标自适应检测准确性和鲁棒性,能够提高目标检测的性能。
-
-
-
-
-
-
-
-
-