发明授权
- 专利标题: 一种基于ViT的航空图像识别方法
-
申请号: CN202210541111.8申请日: 2022-05-17
-
公开(公告)号: CN114842343B公开(公告)日: 2024-11-01
- 发明人: 熊盛武 , 赵怡晨 , 陈亚雄 , 路雄博
- 申请人: 武汉理工大学
- 申请人地址: 湖北省武汉市洪山区珞狮路122号
- 专利权人: 武汉理工大学
- 当前专利权人: 武汉理工大学
- 当前专利权人地址: 湖北省武汉市洪山区珞狮路122号
- 代理机构: 武汉开元知识产权代理有限公司
- 代理商 刘琳
- 主分类号: G06V20/10
- IPC分类号: G06V20/10 ; G06V10/42 ; G06V10/764 ; G06V10/774 ; G06V10/776 ; G06V10/82 ; G06N3/0455 ; G06N3/084 ; G06N3/048
摘要:
本发明公开了一种基于ViT的航空图像识别方法,包括步骤:S1、采集航空图像数据集,构造训练集,验证集和测试集;S2、扩充训练集的数据量;S3、构建基于ViT的航空图像识别模型;S4、将扩充后的训练集输入到识别模型中,对图像相对应的标签进行区分性标签平滑,同时采用交叉熵损失函数和区分性对比损失函数对模型进行训练,通过反向传播算法更新识别模型,遴选最优的航空图像识别模型;S5、通过测试集测试模型的识别性能。本发明通过将图像对应的标签进行区分性标签平滑处理,同时采用交叉熵损失函数和区分性对比损失函数监督模型的训练过程,得到具有更强特征学习能力的基于ViT的航空图像识别模型,具有识别率高,可拓展性强等优点。
公开/授权文献
- CN114842343A 一种基于ViT的航空图像识别方法 公开/授权日:2022-08-02