-
公开(公告)号:CN117576399A
公开(公告)日:2024-02-20
申请号:CN202311605083.2
申请日:2023-11-29
Applicant: 北京航空航天大学 , 北京航空航天大学杭州创新研究院
IPC: G06V10/26 , G06F40/205 , G06F40/279 , G06F40/126 , G06V10/80 , G06V10/764
Abstract: 本发明属于图像分割技术领域,具体涉及一种可泛化的指代表达式图像分割方法,包括对于给定的文本表达式,用统一的形式为其加入直接且关键的提示;将引用表达式送入文本编码器,提取文本特征;将图像输入视觉编码器,结合跨模态注意力对齐机制联合编码视觉特征和文本特征;随后在多模态融合模块,采用多模态特征聚合模块并引入来自预训练视觉模型的引导以利用视觉空间关联;将跨模态融合特征输入解码器,在层级解码过程中引入预训练视觉模型的引导;最后输入分类头,得到图像分割结果。本方法大幅提升了模型对多变的自由文本描述的泛化性,且有效改善了模型对未见视觉目标的泛化性。
-
公开(公告)号:CN114782290A
公开(公告)日:2022-07-22
申请号:CN202210715254.6
申请日:2022-06-23
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了视差图修正方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取双目图像中的左图像和右图像;将左图像和右图像重复输入多分支的立体匹配网络,得到各个分支对应的各个分支概率分布信息集合;根据各个分支概率分布信息集合,生成分支目标概率分布信息集合和预测分支置信度信息集合;根据分支目标概率分布信息集合和预测分支置信度信息集合,生成预测视差图的置信度信息;根据置信度信息,修正预测视差图,得到修正视差图。该实施方式可以在训练过程中无需提供置信度信息标签,即可在半监督、全监督、无监督等任务中生成视差图的置信度信息,从而可以用于修正视差图。
-
公开(公告)号:CN114332637A
公开(公告)日:2022-04-12
申请号:CN202210260622.2
申请日:2022-03-17
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请实施例提供了一种遥感影像水体提取方法、遥感影像水体提取的交互方法,其中,遥感影像水体提取方法包括:获取多个第一遥感图像样本,并根据第一遥感图像样本的光谱信息生成第一遥感图像样本对应的第一水体图像;至少根据第一遥感图像样本与对应的第一水体图像对预设的神经网络模型进行训练,以确定神经网络模型的损失函数;其中,损失函数根据全局损失与局部损失确定,局部损失函数由像素级的交叉熵损失以及像素块的对比损失构成;通过神经网络模型对目标遥感图像进行识别,以生成遥感图像对应的目标水体图像;通过本申请实施例,可以解决相关技术中无法针对大区域遥感影像进行准确且高效的水体识别与分割的技术问题。
-
公开(公告)号:CN112258420A
公开(公告)日:2021-01-22
申请号:CN202011205932.1
申请日:2020-11-02
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请涉及基于DQN的图像增强处理方法及装置,其方法包括,步骤1、获取待处理的图像,初始化评价总分;步骤2、基于预先构建的操作选择网络对待处理图像的每一像素点进行数值操作,得到待评价图像,其中操作选择网络基于DQN算法构建及更新;步骤3、采用预设评价方式对待评价图像进行评分,根据得到的奖励分数对评价总分进行累加更新;步骤4、将评价总分与预定阈值进行比较,当其小于等于第一阈值时,将其清零,跳转执行步骤2,当其大于第一阈值且小于第二阈值时,以待评价图像作为新的待处理图像,跳转执行步骤2,当其大于等于第二阈值时,以待评价图像作为图像增强处理后的图像。本申请消除了图像增强处理对成对数据集的依赖,大幅降低了数据搜集难度。
-
公开(公告)号:CN114743153A
公开(公告)日:2022-07-12
申请号:CN202210649671.5
申请日:2022-06-10
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本发明涉及基于视频理解的无感取菜模型建立、取菜方法及装置,包括:通过训练好的无感取菜模型识别用餐人的取菜动作,根据取菜动作将用餐人的菜品与用餐人餐盘进行匹配,通过计算每种菜品的重量,对用餐人做个体统计,通过无感取菜模型识别取菜动作,相比于现有技术,不需要用餐人拿取每种菜品前将餐盘放置于指定的感应区域,提高了用餐人的取菜效率,用餐人在取菜过程中,只需要正常取菜就行,不需要做额外的动作,提高了用餐人的配合度。
-
公开(公告)号:CN113450401A
公开(公告)日:2021-09-28
申请号:CN202110813020.0
申请日:2021-07-19
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本发明涉及一种垃圾桶满溢度确定方法、装置、设备及垃圾桶,属于垃圾处理技术领域,该方法、装置、设备及垃圾桶通过获取目标垃圾桶桶内的可见光图像;根据可见光图像和预设深度学习网络模型,得到多维融合可见光图像;确定多维融合可见光图像中的垃圾区域,并计算垃圾区域面积;根据垃圾区域面积与垃圾桶满时的前景区域面积,计算目标垃圾桶的垃圾满溢度,以使调度车辆根据垃圾满溢度对目标垃圾桶进行垃圾处理。本发放通过可见光设备相机来实现垃圾图像的获取,方便、快捷,节约了成本;通过实时获取垃圾满溢度,可以使得调度车辆根据需求及时对垃圾进行处理。
-
公开(公告)号:CN116229562A
公开(公告)日:2023-06-06
申请号:CN202211532200.2
申请日:2022-12-01
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了垃圾桶更换方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标区域的实时视频;对实时视频进行检测处理;响应于确定目标区域中检测到人员信息,对人员信息进行人员动作识别,得到识别结果;响应于确定识别结果为表征投放垃圾动作的结果,且识别到人员将垃圾投放到垃圾桶内的信息,获取目标区域的图像,作为待分割图像;对待分割图像进行垃圾桶图像分割处理,得到分割子图像集;对于分割子图像集中的每个分割子图像,执行以下更换步骤:确定分割子图像对应的垃圾桶的满溢度;响应于确定满溢度大于预设满溢度,控制垃圾桶更换设备以对垃圾桶进行更换。该实施方式可以减少工作量和提高工作的处理速。
-
公开(公告)号:CN114782290B
公开(公告)日:2022-11-08
申请号:CN202210715254.6
申请日:2022-06-23
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了视差图修正方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取双目图像中的左图像和右图像;将左图像和右图像重复输入多分支的立体匹配网络,得到各个分支对应的各个分支概率分布信息集合;根据各个分支概率分布信息集合,生成分支目标概率分布信息集合和预测分支置信度信息集合;根据分支目标概率分布信息集合和预测分支置信度信息集合,生成预测视差图的置信度信息;根据置信度信息,修正预测视差图,得到修正视差图。该实施方式可以在训练过程中无需提供置信度信息标签,即可在半监督、全监督、无监督等任务中生成视差图的置信度信息,从而可以用于修正视差图。
-
公开(公告)号:CN114743153B
公开(公告)日:2022-09-30
申请号:CN202210649671.5
申请日:2022-06-10
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本发明涉及基于视频理解的无感取菜模型建立、取菜方法及装置,包括:通过训练好的无感取菜模型识别用餐人的取菜动作,根据取菜动作将用餐人的菜品与用餐人餐盘进行匹配,通过计算每种菜品的重量,对用餐人做个体统计,通过无感取菜模型识别取菜动作,相比于现有技术,不需要用餐人拿取每种菜品前将餐盘放置于指定的感应区域,提高了用餐人的取菜效率,用餐人在取菜过程中,只需要正常取菜就行,不需要做额外的动作,提高了用餐人的配合度。
-
公开(公告)号:CN114332637B
公开(公告)日:2022-08-30
申请号:CN202210260622.2
申请日:2022-03-17
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本申请实施例提供了一种遥感影像水体提取方法、遥感影像水体提取的交互方法,其中,遥感影像水体提取方法包括:获取多个第一遥感图像样本,并根据第一遥感图像样本的光谱信息生成第一遥感图像样本对应的第一水体图像;至少根据第一遥感图像样本与对应的第一水体图像对预设的神经网络模型进行训练,以确定神经网络模型的损失函数;其中,损失函数根据全局损失与局部损失确定,局部损失函数由像素级的交叉熵损失以及像素块的对比损失构成;通过神经网络模型对目标遥感图像进行识别,以生成遥感图像对应的目标水体图像;通过本申请实施例,可以解决相关技术中无法针对大区域遥感影像进行准确且高效的水体识别与分割的技术问题。
-
-
-
-
-
-
-
-
-