-
公开(公告)号:CN118865392A
公开(公告)日:2024-10-29
申请号:CN202411339837.9
申请日:2024-09-25
申请人: 杭州电子科技大学丽水研究院
摘要: 本发明公开了基于强化学习的场景布局估计方法,涉及场景布局估计技术领域,包括如下步骤:将场景的稠密点云映射到平面上,利用形态学侵蚀进行分割,并进行合并处理,得到房间点云;再将房间点云投影到二维平面上,提取房间点云中的边缘点云,并进行分割处理,得到独立区域的壁面点云;然后基于Q‑learning算法,确定强化学习中的状态、动作和奖励;再基于独立区域的壁面点云采用Q‑learning算法拟合线段,得到独立区域的壁面线段数据;最后基于独立区域的壁面线段数据,生成场景布局模型;本发明用于解决现有技术中无法在消除了独立区域之间的干扰和遮挡物的影响的同时减少计算量,场景布局估计效率和准确性较低的问题。
-
公开(公告)号:CN117793538B
公开(公告)日:2024-06-25
申请号:CN202410200816.2
申请日:2024-02-23
申请人: 北京理工大学 , 杭州电子科技大学丽水研究院 , 杭州电子科技大学
摘要: 本申请提出了一种图像自动曝光矫正与增强方法及装置,该方法包括:根据正常曝光Raw图像数据中的线性关系,构造有监督的异常曝光图像数据集;构建全局亮度调整网络与频率增强重建网络,将异常曝光图像数据集输入全局亮度调整网络,得到亮度矫正图像,将亮度矫正图像输入频率增强重建网络,得到矫正增强图像;基于矫正增强图像与正常曝光Raw图像数据,计算损失值,并基于损失值对其网络模型参数进行优化,得到优化模型;将其他图像输入优化模型得到优化图像,根据图像质量评价指标评价优化图像,得到客观评估指标。基于本申请提出的方案,能够对原始Raw图像数据达到自动曝光矫正与增强的效果,从而应对复杂环境下成像质量低的问题。
-
公开(公告)号:CN117029858A
公开(公告)日:2023-11-10
申请号:CN202311052725.0
申请日:2023-08-21
申请人: 杭州电子科技大学丽水研究院
IPC分类号: G01C21/34
摘要: 本发明公开了一种基于改进式蚁群算法的外卖员路径规划系统及方法。本发明系统包括订单信息授权模块、外卖员当前位置获取模块、商家及配送位置获取模块、路况匹配模块、外卖员配送路径规划模块和外卖员配送路径导航模块。相比于外卖员自行寻找配送路径,本发明专利提出的外卖员路径规划系统通过小程序获取外卖员订单信息,系统将外卖员位置以及商家位置和订单配送位置与地图上的路况信息进行对应,并且通过改进式遗传算法对外卖员配送路径进行规划。同时系统及时更新订单信息,及时对路径进行重新规划,提高了外卖员配送的效率。
-
公开(公告)号:CN116193122A
公开(公告)日:2023-05-30
申请号:CN202310189604.4
申请日:2023-03-02
申请人: 杭州电子科技大学 , 杭州电子科技大学丽水研究院
IPC分类号: H04N19/147 , H04N19/124 , H04N19/91 , H04N19/172 , H04N19/30 , H04N19/50
摘要: 本发明公开了一种多层级多模块协同视频感知编码优化方法及装置,通过原始视频进行编码失真预测、帧级编码失真预测及帧级量化参数的推导;对原始视频的图像进行帧内/帧间预测,并将得到的预测图像与原始图像进行差计算,得到残差图像,通过预测的编码失真,对残差图像进行残差滤波,滤波后的残差图像基于残差块变换后,再根据预测的帧级编码失真和帧级量化参数,进行感知量化;基于感知量化参数进行率失真优化,优化帧内/帧间预测;构建感知质量增强网络,用于优化帧内/帧间预测;基于优化的帧内/帧间预测,对原始视频的图像进行预测、差计算、残差滤波、变换、感知量化后,进行熵编码。
-
公开(公告)号:CN116071606A
公开(公告)日:2023-05-05
申请号:CN202310210827.4
申请日:2023-03-07
申请人: 杭州电子科技大学丽水研究院
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/40 , G06N3/047 , G06N3/08 , G06N3/0464
摘要: 本发明公开了基于多尺度多注意力实例学习的sMRI图像分类方法,首先获取数据集,构建多尺度多注意力实例学习模型,通过空间金字塔池化模块将不同大小脑区转化为相同尺度;通过patch‑net处理模块获取相应的局部特征增强;通过注意力多实例学习模块来增强全局特征;通过分类器得到分类结果;最后通过训练多尺度多注意力实例学习模型。本发明是采取了区域块的分析方法,能获取对大脑病变影响更大的位置,引入了双注意机制,能增强到局部和全局的特征;本发明采用了将分割数据和脑区数据结合的多模态数据,加强分类效果。
-
公开(公告)号:CN118431702A
公开(公告)日:2024-08-02
申请号:CN202410689167.7
申请日:2024-05-30
申请人: 杭州电子科技大学 , 杭州电子科技大学丽水研究院
IPC分类号: H01P1/203
摘要: 本发明涉及一种吸收式广义切比雪夫响应带通滤波器,为双端口器件,包括依次层叠的底层金属层、中间介质层和顶层金属层,底层金属层与顶层金属层连接;所述顶层金属层基于互补双工器架构设计,包括并联的滤波电路和匹配电路;在滤波器的通带内,信号通过滤波电路传输;在滤波器的阻带内,信号被匹配电路吸收;所述底层金属层为金属地。本发明与现有的微带结构吸收式滤波器相比,显著提高了滤波器的矩形系数,同时能完全通过解析公式计算得到电路参数,实现预设的响应和性能指标。
-
公开(公告)号:CN118412009A
公开(公告)日:2024-07-30
申请号:CN202410673253.9
申请日:2024-05-28
申请人: 杭州电子科技大学丽水研究院
摘要: 本发明公开了一种基于人声分离的音高定位识别方法,首先需要根据待识别的演唱视频选择对应的真实的对比文件并进行预处理;然后采用端到端人声分离技术对处理后的数据进行人声分离,得到人声文件;再构建音高定位识别网络,网络由输入层、关系层和输出层组成;最后人声分离得到人声文件输入构建的音高定位识别网络实现音高定位识别。在本发明方法中,通过构建音高定位识别网络,将音高和标准线进行可视化,能够直观地看到人声和经过修音合成的声音的曲线对比,维护观众粉丝的权益,同时相对现有技术提高了泛用性以及准确性。
-
公开(公告)号:CN118155290A
公开(公告)日:2024-06-07
申请号:CN202410442762.0
申请日:2024-04-12
申请人: 杭州电子科技大学丽水研究院
IPC分类号: G06V40/20 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82
摘要: 本发明公开了一种多模态深度感知的高精度集成动态手势识别方法。首先获取动态手势数据集,应用2D和3D数据增强方法增加样本数量;然后将增强后的数据进行灰度变换,并分别输入3D‑CNN子网络、ConvLSTM子网络和TCN子网络分别提取手势序列特征;将手势序列特征直接或融合输入相应分类器;最后将分类器结果集成,输出最终的概率分布。本发明额外对数据进行了数据增强和灰度变换,在数据原有的多模态之外,增加了灰度2D和灰度3D模态,使得本方法能识别分辨率更低的输入图像;并且本发明使用了一种优化加权集成,能够更有效地优化的综合多模态的分类结果。
-
公开(公告)号:CN117793538A
公开(公告)日:2024-03-29
申请号:CN202410200816.2
申请日:2024-02-23
申请人: 北京理工大学 , 杭州电子科技大学丽水研究院 , 杭州电子科技大学
摘要: 本申请提出了一种图像自动曝光矫正与增强方法及装置,该方法包括:根据正常曝光Raw图像数据中的线性关系,构造有监督的异常曝光图像数据集;构建全局亮度调整网络与频率增强重建网络,将异常曝光图像数据集输入全局亮度调整网络,得到亮度矫正图像,将亮度矫正图像输入频率增强重建网络,得到矫正增强图像;基于矫正增强图像与正常曝光Raw图像数据,计算损失值,并基于损失值对其网络模型参数进行优化,得到优化模型;将其他图像输入优化模型得到优化图像,根据图像质量评价指标评价优化图像,得到客观评估指标。基于本申请提出的方案,能够对原始Raw图像数据达到自动曝光矫正与增强的效果,从而应对复杂环境下成像质量低的问题。
-
公开(公告)号:CN116310695A
公开(公告)日:2023-06-23
申请号:CN202310393116.5
申请日:2023-04-13
申请人: 杭州电子科技大学丽水研究院
IPC分类号: G06V10/80 , G06V10/82 , G06V20/40 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于门控融合网络的视频显著性预测方法,首先构建门控融合网络;通过编码器提取视频片段包含的时空特征,用桥接模块增强顶层编码特征,再使用门控融合模块融合编解码特征,最后对门控融合特征进行解码处理,预测最终的显著图。本发明提出了一个门控融合模块用于将编码器的多级特征有效地融入到解码器中。该模块沿着时间、空间和通道维度加权编码特征,从而更加精准地定位显著对象的位置,并过滤掉特征中冗余的时空信息。
-
-
-
-
-
-
-
-
-