-
公开(公告)号:CN111191729B
公开(公告)日:2022-04-01
申请号:CN201911425234.X
申请日:2019-12-31
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种基于多模态特征融合的三维对象融合特征表示方法。本发明将三种模态的三维模型特征表示,都做了一个非常细致的实现和复现:三维模型的多视图特征表示、点云特征表示以及网格特征表示。对多模态三维数据进行了处理、增强和融合,并基于此提取出了三维对象的融合特征表示。本发明能实现非常优秀的多模态信息融合,实现更加鲁棒的三维模型特征表示,供给其他三维对象任务使用。
-
公开(公告)号:CN110517301B
公开(公告)日:2022-04-01
申请号:CN201910660500.0
申请日:2019-07-22
Applicant: 杭州电子科技大学
IPC: G06T7/33
Abstract: 本发明公开了一种快速相机运动下有效匹配特征的方法。本发明步骤如下:步骤1.收缩膨胀效应和特征区块的变形;步骤2.设计一种一元化的变形方法来处理SE效应;步骤3.在特征跟踪过程中,每个受收缩膨胀效应影响的特征区块都会被对应的投影区块所替代。随后我们利用光度误差与几何误差来匹配投影区块与当前帧图像。本发明将颜色和深度信息结合起来,令二维的区块反投影至三维空间中,并通过初始相机运动将其重新投影到下一帧的观测相机上。投影过程使原始区块变形从而获取区块在连续帧之间的外观变化情况,同时通过这些变形的区块能准确简单地实现特征跟踪。
-
公开(公告)号:CN110674676B
公开(公告)日:2022-03-29
申请号:CN201910711591.6
申请日:2019-08-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语义分割的道路置信估计模糊帧方法。本发明包括如下步骤:步骤1、搭建SegNet语义网络,用于输入检测道路的图像;步骤2、获取检测道路的图像数据集;步骤3、对数据集中的基础图像进行训练;步骤4、道路帧模糊性判断。本发明实现了一种基于语义分割的道路置信估计模糊帧,对智能驾驶中检测模糊图像有较大意义。本发明中的方法利用图片的语义特性将,道路驾驶的图像经过语义分割处理输出图像特征图,并通过时间差分法实现对图像进行置信估计,找出模糊、不稳定帧。排除这些干扰图像对智能图像识别的成功具有较高的提升。
-
公开(公告)号:CN111121969B
公开(公告)日:2021-12-10
申请号:CN201911414668.X
申请日:2019-12-31
Applicant: 杭州电子科技大学
Abstract: 本发明是一种基于孔径扫描的多光谱叠层成像方法。本发明用孔径扫描替代LED矩阵,采用单束光照射,从样本出射的光波经过孔径,通过孔径循环扫描以及高光谱处理获得来自样本的不同位置的低分辨率图像,通过在傅里叶域内进行处理,最终获得样本的高分辨率图像。在实现叠层成像的前提上,克服了LED矩阵的缺点。还对瞳孔函数和样本光谱进行迭代更新,通过收敛瞳孔函数,使得获得的成像图片的分辨率更高。引入高光谱成像,通过高光谱成像进一步了解样本本质,从而构建出更加清晰的图像,能够对样本分析的更加透彻,为分析样本也提供了条件。
-
公开(公告)号:CN110849367B
公开(公告)日:2021-12-10
申请号:CN201910949680.4
申请日:2019-10-08
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于融合UWB的视觉SLAM的室内定位与导航的方法。本发明包括通过传感器获取环境的图片,构建点云地图,根据相邻两帧图片中ORB特征点匹配获取相邻图片的位姿,同时利用UWB实现定位,记录传感器的位置信息,随后按照一定的路线移动传感器获取位姿,构建地图,并记录每次切换位置后的坐标,通过计算TOF算法获取的当前位置与之前位置是否重复辅助图片相似度检测进行回环检测,并且计算偏移量,将TOF算法的位置关系对于偏移量进行校正,调整机器人位姿,修正点云地图。本发明不仅在正常环境中具备良好的导航定位功能,还可在复杂的室内环境中进行精确定位,并且以较高的准确度为环境建立三维模型。
-
公开(公告)号:CN111182312B
公开(公告)日:2021-10-29
申请号:CN202010006753.9
申请日:2020-01-03
Applicant: 杭州电子科技大学
IPC: H04N19/597 , H04N19/42 , H04N21/2343 , H04N21/4402
Abstract: 本发明提供一种分级残差光场视频编码方法。本发明在分级编码中心视点视频和残差视频的基础上,对中心视点视频进行分级编码,一级中心视点视频首先被编码,后经解码与二级中心视点视频作差得到二级中心视点残差视频,接着二级中心视点残差视频被编码,最后被编码的中心视点视频经解码后与对应的相邻视点视频作差得到残差视频进行编码。本发明通过对中心视点视频进行分级,减少了直接编码的子视频数量,增加了残差子视频数量,所以可有效减小总码流,提高编码效率。
-
公开(公告)号:CN110236483B
公开(公告)日:2021-09-28
申请号:CN201910520291.X
申请日:2019-06-17
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度残差网络的糖尿病性视网膜病变检测的方法。本发明步骤如下:步骤1:数据集的筛选;步骤2:眼底图像的预处理,步骤3:数据集扩充,将部分样本较少的类中的图像做图像扩充处理,具体操作包括将图像镜像和旋转;步骤4:数据集标签的制作;步骤5:训练集和测试集的构建;步骤6:卷积神经网络的搭建;步骤7:网络训练;步骤8:网络测试。本发明能够获得更高的检测病变的准确性,同时进行检测的时间也可以大大缩短。
-
公开(公告)号:CN113159048A
公开(公告)日:2021-07-23
申请号:CN202110441665.6
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度学习的弱监督语义分割方法;首先利用已有的数据集在预训练的Resnet50上进行微调,然后利用训练好的Resnet50得到相应的类激活图,利用设定的阈值得到分割的伪标签,并采用全连接的条件随机场Dense conditional random fields,Dense CRF)对标签进行优化。最后,利用优化后的伪标签训练分割网络。本发明所述的方法只需使用图像级别的标签就可以完成目标的分类以及语义分割任务,极大了减少了人工标注所耗费的大量的人力物力。相比于现有的弱监督方法,本方法效率更高,定位结果更加准确。
-
公开(公告)号:CN113159034A
公开(公告)日:2021-07-23
申请号:CN202110442856.4
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种短视频自动生成字幕的方法及系统。通过3D卷积网络进行视频的特征提取,获得视频特征序列,使用DAPs模型对接收到的视频特征序列进行事件检测,得到预测的事件片段并且对每个片段打分。单独处理获得的每个事件片段,首先对事件片段进行视觉嵌入操作,然后将进行视觉嵌入操作后的事件片段输入Transformer模型中,通过获得预测的文本。本发明通过融合跨模态技术,前期处理包含事件检测,缩小了后续文本生成工作的范围,增加了生成的文本与事件的匹配度。文本生成部分发挥Transformer在特征编码、解码方面的出色表现。
-
公开(公告)号:CN113158866A
公开(公告)日:2021-07-23
申请号:CN202110401376.3
申请日:2021-04-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于注意力机制与数据不平衡的跨年龄人脸识别方法。首先从跨年龄人脸识别数据集中抽取同一个人不同年龄的面部照片组成人脸时间序列,通过自注意力机制进行处理得到处理后的特征序列;然后将自注意力机制处理后的特征序列进行线性融合;将将融合后的面部特征分解为身份特征与年龄特征;采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督,并采用相关性损失约束年龄特征与身份特征之间的相似性。本发明方法通过融合同一个身份不同年龄的面部照片以及自注意力机制,学习了年龄对面部的影响,提取了更加鲁棒的身份特征;通过重加权年龄损失,缓解了年龄数据分布不平衡导致的准确率下降。
-
-
-
-
-
-
-
-
-