-
公开(公告)号:CN116246196A
公开(公告)日:2023-06-09
申请号:CN202211602297.X
申请日:2022-12-14
IPC分类号: G06V20/40 , G06T7/11 , G06V10/764 , G06V10/82 , G06N3/08 , G06N3/0464
摘要: 本发明属于计算机视觉技术领域,具体为一种利用像素级时空特征记忆库的视频目标跟踪方法。本发明方法包括:剪裁动态目标图像和搜索区域图像、提取图像特征、像素级在线预测、像素级更新策略“融合‑替换”、特征增强与像素级匹配和头部网络结构实现目标跟踪等步骤。本发明在输入目标在初始帧的初始框后,通过高效地利用记忆库,节约存储资源和计算资源,能有效应对目标在视频中的外观变化等场景,具备很高的自适应性和鲁棒性。同时,本方法对于现阶段流行的卷积神经网络模型和Transformer模型均可实现快速部署。本方法适用于在计算机辅助视频分析场景下,自动生成任意目标在视频中的包围框并跟踪,可用于安防监控分析、自动驾驶、人机交互等。
-
公开(公告)号:CN115861181A
公开(公告)日:2023-03-28
申请号:CN202211398539.8
申请日:2022-11-09
摘要: 本发明涉及一种面向CT影像的肿瘤分割方法及其系统,该方法包括:获取CT肿瘤图像数据集;采用基于多尺度卷积的边缘检测网络模型,从2D数据中提取图像边缘;通过提取的边缘、检测框的位置,基于自适应泛洪填充和自适应梯度选取,获得弱监督标签;采用CNN和Transformer的混合模型,并使用近似边缘解码器,首先利用弱监督标签进行第一轮训练,经过联合损失函数进行修正结果;之后将修正结果作为第二轮训练的标签,训练得到最终的分割模型;将实际待分割的CT肿瘤图像预处理后输入分割模型,输出得到相应的分割结果。与现有技术相比,本发明能够高效准确生成标签后进行模型训练,从而解决全监督标注所产生的费时费力问题,提高分割任务的效率及准确性。
-
公开(公告)号:CN115705616A
公开(公告)日:2023-02-17
申请号:CN202110899802.0
申请日:2021-08-06
申请人: 复旦大学
IPC分类号: G06T3/00 , G06T3/40 , G06N3/0464 , G06N3/084
摘要: 本发明涉及一种基于结构一致性统计映射框架的真实图像风格迁移方法,步骤包括:数据集的构建与预处理、网络模型的构建、网络模型的训练优化、网络模型的测试、对图片进行风格迁移等步骤;其中网络模型基于结构一致性统计映射的框架,分为多个连续映射的子网络,每个子网络为结构相同的多尺度的编码解码网络;使用色域均值损失等损失函数对网络进行训练,能充分保持内容结构,并利用全局色彩分布信息,使网络取得更好的生成效果。与现有技术相比,本发明提出的方法能够在保持内容图片内容细节和色彩层次的前提下,实现实时的真实图像风格的迁移,并得到优于其他主流方法的整体效果。
-
公开(公告)号:CN112243201A
公开(公告)日:2021-01-19
申请号:CN202011494771.2
申请日:2020-12-17
申请人: 上海大汉三通通信股份有限公司 , 复旦大学
IPC分类号: H04W4/12
摘要: 本发明公开了5G RCS消息发送中的通道分配方法、装置及系统,该方法包括:预先设置每条通道所支持的各运营商的运营商占比;接收用户提交的5G RCS消息,并确定出对应的业务类型及目标运营商;依据5G RCS消息从业务类型的各条通道中筛选出与目标运营商对应的各条第一通道;依据预设规则从每条第一通道中确定出目标通道,并通过目标通道发送5G RCS消息;预设规则依据运营商占比设定;本发明在使用过程中能够有效避免大量通道处于闲置状态,提高资源利用率,有利于降低整体成本。
-
公开(公告)号:CN111369623A
公开(公告)日:2020-07-03
申请号:CN202010124994.3
申请日:2020-02-27
申请人: 复旦大学
发明人: 张文强
IPC分类号: G06T7/73 , G06T7/62 , G06T7/187 , G06T7/11 , G06T7/00 , G06T5/00 , G06T3/40 , G06N3/04 , G06K9/62 , G06K9/00
摘要: 本发明涉及一种基于深度学习3D目标检测的肺部CT图像识别方法,包括以下步骤:S1:CT图像预处理;S2:生成图像样本,构建设定尺寸数据块的训练集;S3:构建3D目标检测模型;S4:训练3D目标检测模型;S5:利用训练好的3D目标检测模型,检测得到待识别物的坐标和尺寸,与现有技术相比,本发明具有假阳性率低、对数据噪音容忍性好且模型鲁棒性强等优点。
-
公开(公告)号:CN111144406A
公开(公告)日:2020-05-12
申请号:CN201911332440.6
申请日:2019-12-22
申请人: 复旦大学
摘要: 本发明属于机器视觉图像处理技术领域,具体为一种太阳能面板清洁机器人自适应ROI目标定位方法。本发明利用目标在两帧图像中位置变化有限的特点,将上一帧的检测结果融合传感器运动信息补偿目标位置变化,估计出目标在当前图像中可能出现的感兴趣区域,缩小了检测范围,避免了全图扫描目标的大计算量和无用背景区域引入的干扰,专注于有效区域,能够实时高效精准地检测目标。本发明解决了清洁机器人在太阳能面板上由于检测范围广、背景复杂、运动变化导致的运算量大、实时性差、干扰多、容易丢失目标等问题,极大地提升了其检测效率和稳定性,使得清洁机器人快速、高效、精准地完成太阳能面板全自动清洁工作。
-
公开(公告)号:CN109191436A
公开(公告)日:2019-01-11
申请号:CN201810926369.3
申请日:2018-08-15
申请人: 复旦大学
摘要: 本发明属于医疗图像处理领域,具体为一种基于视觉显著性谱残差方法的低剂量CT肺结节检测算法。该算法的流程如下:(1)肺实质分割;(2)候选区提取:通过谱残差方法对肺实质部分进行显著性检测,提取具有视觉显著性的肺结节候选区;(3)特征计算;(4)候选区分类:使用C-SVM分类器对提取的肺结节候选区分类,去除假阳性样本。本发明采用谱残差方法提取候选结节可以有效地提取具有空洞,毛刺等复杂结构的结节区域,具有高检测敏感性和低假阳性,算法流程具有高可解释性,以满足实际医疗辅助系统的需要。
-
公开(公告)号:CN104766316B
公开(公告)日:2017-11-17
申请号:CN201510146443.6
申请日:2015-03-31
申请人: 复旦大学
IPC分类号: G06T7/11
摘要: 本发明属于计算机数字图像处理技术领域,具体为一种中医望诊中新型嘴唇分割算法。其步骤为:通过对含人脸的图像采用Haar分类器进行人脸检测,获取人脸图像的上半部分皮肤作为训练数据建立脸部肤色混合高斯模型;根据脸部肤色混合高斯模型求出下半脸的肤色概率图,对肤色概率图采用迭代的方法去除非嘴唇像素,获得粗嘴唇;粗嘴唇优化处理,包括对粗嘴唇图像中的嘴唇和非嘴唇区域分别建立混合高斯模型,求出其背景概率图,对背景概率图采用Otsu进行二值化处理,采用区域增长法,中值滤波和”k‑points”方法进行细化,获得最终嘴唇轮廓。本发明提出了一种基于概率模型的方法,能够自适应地处理多样的、含复杂背景的嘴唇图像,可极大的提高嘴唇分割的准确度。
-
公开(公告)号:CN103735394A
公开(公告)日:2014-04-23
申请号:CN201410011174.8
申请日:2014-01-10
申请人: 复旦大学
IPC分类号: A61H3/06
摘要: 本发明属于盲人用工具技术领域,具体为一种盲人用立体视觉指示器。该系统首先通过感受器模块,使用手机上内置的两个或多个照相机构成的立体照相机获得场景图像;然后利用特征提取模块,使用相应图像处理的算法,分析图像数据,提取图像特征;再利用效应器模块,得到图像中距离、形状的信息;最后利用转化输出模块,将距离和形状的信息转化成盲人可以接受的音频,并通过耳机输出给盲人以供识别。本发明将最新的立体视觉处理算法应用于低成本的稳定的立体视觉移动手机,有助于盲人的出行等日常生活。
-
公开(公告)号:CN101858977A
公开(公告)日:2010-10-13
申请号:CN201010197999.5
申请日:2010-06-10
申请人: 复旦大学
摘要: 本发明属于空间定位技术领域,具体为一种基于双红外系统的室内空间定位方法与系统。本发明的定位方法包括反射式定位和透射式定位两种。假设地面与天花板平行,信号源与接收端共同位于地面上,其基本原理是通过测量由信号源发射到天花板、再进一步反射到接收端的两束不同频率红外信号之间的相位差,得到两束信号的距离差信息,再通过公式计算,即得到接收点的坐标。本发明的定位系统分为二维平面定位系统和三维平面定位系统。与传统GPS等室外定位技术相比,本发明具有成本低、精度高、不需移动即可定位等优点,有广阔的应用前景。如在智能机器人、物联网等领域都可获应用。
-
-
-
-
-
-
-
-
-