-
公开(公告)号:CN110674676A
公开(公告)日:2020-01-10
申请号:CN201910711591.6
申请日:2019-08-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语义分割的道路置信估计模糊帧方法。本发明包括如下步骤:步骤1、搭建SegNet语义网络,用于输入检测道路的图像;步骤2、获取检测道路的图像数据集;步骤3、对数据集中的基础图像进行训练;步骤4、道路帧模糊性判断。本发明实现了一种基于语义分割的道路置信估计模糊帧,对智能驾驶中检测模糊图像有较大意义。本发明中的方法利用图片的语义特性将,道路驾驶的图像经过语义分割处理输出图像特征图,并通过时间差分法实现对图像进行置信估计,找出模糊、不稳定帧。排除这些干扰图像对智能图像识别的成功具有较高的提升。
-
公开(公告)号:CN110674675A
公开(公告)日:2020-01-10
申请号:CN201910711588.4
申请日:2019-08-02
Applicant: 杭州电子科技大学
IPC: G06K9/00
Abstract: 本发明公开了一种行人面部反欺诈方法。本发明步骤如下:步骤1:获取原始的视频图像序列;步骤2:将获取的视频图像序列作为输入,进行人脸检测;步骤3:利用mask rcnn网络对视频图像序列进行实例分割,提取出人脸视频图像序列,输入数据为获取的图像;步骤4:对步骤3中提取出的人脸视频图像序列进行欧拉视频放大,提取出的时间域信息;步骤5:根据步骤4提取出的时间域信息基于阈值判别出真实人脸和伪造人脸。本发明解决了人工识别人脸信息的不准确性和低效性,解放了部分人工生产力,并采用了欧拉视频微小运动放大技术来提取时间域中人脸肤色的规律性变化信息,所提取的信息人工难以伪造,提高了安全性。
-
公开(公告)号:CN110659664A
公开(公告)日:2020-01-07
申请号:CN201910711563.4
申请日:2019-08-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于SSD的高精度识别小物体的方法。本发明改进的网络结构如下:(1)基于原始SSD网络,保留与SSD网络一样的瀑布递减式结构,然后将Conv7后边的Conv8_2与Conv9_2换成了RFB模块,形成网络Ⅰ;(2)再将网络Ⅰ进行改进,改进成类似于FPN的特征金字塔结构网络Ⅱ,通过特征金字塔结构网络Ⅱ能够将高层特征通过上采样和低层特征做融合,获得融合后的特征图,从而通过特征图来使用各层网络的特征;(3)对于融合后的特征图,使用新的NMS算法定位目标;引入了一种新的PrROI pooling来将ROI映射到其中来修正边框。本发明利用FPN网络可以充分利用各层网络特征信息和RFB可以模拟人类视觉皮质中离心率的效果来提高感受野的优点。
-
公开(公告)号:CN110647905A
公开(公告)日:2020-01-03
申请号:CN201910711601.6
申请日:2019-08-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于伪脑网络模型下的涉恐场景识别方法。本发明包括如下步骤:步骤1、通过CNN图像分类器,得到涉恐场景图片概率值;步骤2、通过伪脑网络图像分类器,得到涉恐场景图片概率值;步骤3、将CNN图像分类器分类结果和伪脑网络图像分类器分类结果输入给神经网络融合模型,输出场景事件分类结果,涉恐场景=1,非涉恐场景=0。本发明将深度学习算法与等效伪脑网络模型相结合。深度学习网络用于机器视觉图像分类,伪脑网络模型替代人脑对视听觉信息高级特征进行融合,实现环境物体感知和环境认知。
-
公开(公告)号:CN110610650A
公开(公告)日:2019-12-24
申请号:CN201910796731.4
申请日:2019-08-27
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度学习和深度相机的点云语义地图的构建方法。本发明步骤:1、构建神经网络的必须模块;2、搭建神经网络;3、训练神经网络模型;采用semantic3D为训练集,使用反向传播和随机梯度下降,训练神经网络,最小化损失函数,从而不断优化网络权重连接;4、进行相机标定,得到相机的内参,首先利用深度相机采集点云数据,通过相机的内参矩阵将采集到的深度图转换成点云;5、将点云输入到训练好的神经网络当中,使用含有语义信息的点云进行语义地图的构建,从而可以得到语义标签的点云语义地图。本发明能够更加实用的为机器人室内导航和定位提供语义这样的高级特征,便于精准的确定机器人的位置,以及更为精准的回环检测。
-
公开(公告)号:CN110598537A
公开(公告)日:2019-12-20
申请号:CN201910710059.2
申请日:2019-08-02
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度卷积网络的视频显著性检测方法。本发明步骤:1:以视频的当前帧及其对应的光流图像作为特征提取网络的输入;2:将当前帧和对应的光流图像串接后得到的张量作为深度卷积网络输入提取特征;3:设计特征集成网络用于融合特征图,并得到对视频显著性检测的粗略估计;同时为了获得蕴含在特征图中卷积信息的补充性信息,特征集成网络引入原始信息,包括当前帧和对应的光流图像;4:模型中引入轮廓提取网络进行空域细化,轮廓提取网络采用线下训练方式,并用于检测物体的边缘轮廓。本发明为特征集成提供了丰富的辅助信息。进一步提升显著性图质量,使生成的显著性图能够以明晰的边界完整地凸显视频序列中的显著性区域。
-
公开(公告)号:CN110501071A
公开(公告)日:2019-11-26
申请号:CN201910712003.0
申请日:2019-08-02
Applicant: 杭州电子科技大学
IPC: G01J3/28
Abstract: 本发明公开了一种基于模糊编码的压缩高光谱掩膜优化方法。本发明通过控制掩膜与聚焦平面之间的距离来控制掩膜编码的模糊程度,并将模糊程度进行量化,从而使用模糊导致灰度值变化之后的掩膜编码代替理论上的原始掩膜编码,使得重建时所用的编码更加接近实际编码。本发明只需通过系统的数值孔径、物镜焦距、光源波长、物镜放大倍数等信息来估算系统点扩散函数分布情况,并且计算出不同离焦位置处的实际模糊编码分布情况,使得投影矩阵最接近于实际数值,以实现投影矩阵的准确掌握,利于重建。仿真实验结果表明,相比于通常使用的二值化掩膜,优化后的掩膜编码更加接近于实际情况,重建图像的信噪比与光谱准确度也明显得到提高。
-
公开(公告)号:CN110415207A
公开(公告)日:2019-11-05
申请号:CN201910364614.0
申请日:2019-04-30
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于图像失真类型的图像质量评估的方法。本发明用DCT方法把高维度图像的信息量在低维度图像上表示出来,提取出失真特征;然后利用支持向量机的方法,建立标签为1,2,3,4,…,n的SVM分类器中,将失真类型分为n种;将图像的失真特征输入,通过决策函数对所选图像进行分类;在判断出图像失真类型后,再按评估模型计算得出图像质量的评价指标IQA。本发明针对每一种失真类型建立一套评价模型,从而提高图像质量的客观评价效率。
-
公开(公告)号:CN110378938A
公开(公告)日:2019-10-25
申请号:CN201910548289.3
申请日:2019-06-24
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于残差回归网络的单目标跟踪方法。本发明包括如下步骤:步骤1、对原始训练数据进行预处理;步骤2、将预处理后的数据输入残差回归网络模型,进行参数训练,并确定好网络参数;步骤3、确定好网络参数后,将待跟踪视频序列按照与步骤1相同的方式进行预处理;步骤4、将待跟踪视频序列的预处理结果输入到残差回归网络模型中,得到跟踪结果。本发明提高了速度,并允许实时跟踪对象。并与残差网络相结合,有效解决梯度弥散和网络精度问题,同时对于精度下降的问题有效的进行了遏制,降低了深度网络的训练难度,极大的提高了单目标跟踪的精度,为之后的单目标跟踪领域提供了一个新的解决问题的方向和思路。
-
公开(公告)号:CN110377710A
公开(公告)日:2019-10-25
申请号:CN201910520138.7
申请日:2019-06-17
Applicant: 杭州电子科技大学
IPC: G06F16/332 , G06K9/62
Abstract: 本发明公开了一种基于多模态融合的视觉问答融合增强方法。本发明步骤如下:1、利用GRU结构构建时序模型,获得问题的特征表示学习、利用从Faster R-CNN抽取的基于自底向上的注意力模型的输出作为图像的特征表示;2、基于注意力模型Transformer进行多模态推理,引入注意力模型对图片-问题-答案这个三元组进行多模态融合,建立推理关系;3、针对不同的隐含关系有不同的推理过程和结果输出,再根据这些结果输出来进行标签分布回归学习,来确定答案。本发明基于特定的图片和问题得到答案直接应用于服务于盲人的应用中,能够帮助盲人或者视觉障碍者更好地感知周围环境,也应用于图片检索系统,提高图片检索的准确性和多样性。
-
-
-
-
-
-
-
-
-