-
公开(公告)号:CN114693940A
公开(公告)日:2022-07-01
申请号:CN202210304675.X
申请日:2022-03-22
Applicant: 电子科技大学
Abstract: 本发明提出一种基于深度学习的特征混合可分解性增强的图像描述方法,旨在直接变换图片内各个目标的深层视觉特征,来为视觉特征赋予混合可分解性,通过混合模块来生成混合特征,通过特征提取器提取初始特征,利用混合模块读取一个主特征一个副特征来生成混合特征,再通过分解模块来重构主特征。进一步的,根据特征提取器提取的特征的分类损失、混合模块的混合损失和分解模块重构出的特征的分类损失,利用反向传播和梯度下降算法来更新模型参数,以增强特征提取器提取的特征的混合可分解性。本发明提取的特征具有更强的可分解性,能广泛地应用于视觉问答和图片标注等一系列下游任务,来提升下游任务模型的表现。
-
公开(公告)号:CN109976747A
公开(公告)日:2019-07-05
申请号:CN201910104818.0
申请日:2019-02-01
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种模块级代码结构的可视化开发实现系统。本发明系统包括:文本代码层、可视化层和所采用编程语言的编译器。其中,文本代码层包括数据集结构、代码模块接口、代码模块适配器或缓存器、模块拼接域;可视化层包括文本代码层中数据集结构、代码模块接口、代码模块适配器或缓存器和模块拼接域四大结构的可视化元素,可视化元素为二维图形或三维模型。本发明使得程序编写和软件开发的代码结构清晰,提高代码复用率,实现模块级的软件或程序的可视化开发,让非计算机专业人士能够使用已开发好的代码模块通过简单的操作完成开发,降低软件开发门槛。
-
公开(公告)号:CN114693967B
公开(公告)日:2023-10-31
申请号:CN202210274049.0
申请日:2022-03-20
Applicant: 电子科技大学
IPC: G06V10/764 , G06V10/26
Abstract: 本发明提供一种基于二分类张量增强的多分类语义分割方法,包括步骤:将需要将分类的图片输入至原始分割网络中;由原始分割网络的特征提取部分进行特征提取,将提取的特征并行输入至N个二分类头以及中转部分;N个二分类头对输入的特征分别进行二分类处理输出N个二分类张量,中转部分输出待分类特征;将N个二分类前景分数图与待分类特征进行级联,级联张量最后送入多分类头,多分类头对输入的级联张量进行N分类处理并输出N分类张量作为最终的多分类结果。本发明可以简单地加入到多数分割网络结构中,仅带来少量的网络参数量增加。相较于直接用CE损失优化多分类头结果的方法,本发明方法能在增加少量参数消耗的情况下提升分割网络的分类性能。
-
公开(公告)号:CN114693967A
公开(公告)日:2022-07-01
申请号:CN202210274049.0
申请日:2022-03-20
Applicant: 电子科技大学
IPC: G06V10/764 , G06V10/26 , G06K9/62
Abstract: 本发明提供一种基于二分类张量增强的多分类语义分割方法,包括步骤:将需要将分类的图片输入至原始分割网络中;由原始分割网络的特征提取部分进行特征提取,将提取的特征并行输入至N个二分类头以及中转部分;N个二分类头对输入的特征分别进行二分类处理输出N个二分类张量,中转部分输出待分类特征;将N个二分类前景分数图与待分类特征进行级联,级联张量最后送入多分类头,多分类头对输入的级联张量进行N分类处理并输出N分类张量作为最终的多分类结果。本发明可以简单地加入到多数分割网络结构中,仅带来少量的网络参数量增加。相较于直接用CE损失优化多分类头结果的方法,本发明方法能在增加少量参数消耗的情况下提升分割网络的分类性能。
-
公开(公告)号:CN109976747B
公开(公告)日:2022-05-13
申请号:CN201910104818.0
申请日:2019-02-01
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种模块级代码结构的可视化开发实现系统。本发明系统包括:文本代码层、可视化层和所采用编程语言的编译器。其中,文本代码层包括数据集结构、代码模块接口、代码模块适配器或缓存器、模块拼接域;可视化层包括文本代码层中数据集结构、代码模块接口、代码模块适配器或缓存器和模块拼接域四大结构的可视化元素,可视化元素为二维图形或三维模型。本发明使得程序编写和软件开发的代码结构清晰,提高代码复用率,实现模块级的软件或程序的可视化开发,让非计算机专业人士能够使用已开发好的代码模块通过简单的操作完成开发,降低软件开发门槛。
-
公开(公告)号:CN114693940B
公开(公告)日:2023-04-28
申请号:CN202210304675.X
申请日:2022-03-22
Applicant: 电子科技大学
Abstract: 本发明提出一种基于深度学习的特征混合可分解性增强的图像描述方法,旨在直接变换图片内各个目标的深层视觉特征,来为视觉特征赋予混合可分解性,通过混合模块来生成混合特征,通过特征提取器提取初始特征,利用混合模块读取一个主特征一个副特征来生成混合特征,再通过分解模块来重构主特征。进一步的,根据特征提取器提取的特征的分类损失、混合模块的混合损失和分解模块重构出的特征的分类损失,利用反向传播和梯度下降算法来更新模型参数,以增强特征提取器提取的特征的混合可分解性。本发明提取的特征具有更强的可分解性,能广泛地应用于视觉问答和图片标注等一系列下游任务,来提升下游任务模型的表现。
-
-
-
-
-