发明公开
- 专利标题: 一种视觉理解模型的建立方法和图像分割预测方法
-
申请号: CN202310173572.9申请日: 2023-02-28
-
公开(公告)号: CN116030258A公开(公告)日: 2023-04-28
- 发明人: 高常鑫 , 吴东岳 , 桑农
- 申请人: 华中科技大学
- 申请人地址: 湖北省武汉市洪山区珞喻路1037号
- 专利权人: 华中科技大学
- 当前专利权人: 华中科技大学
- 当前专利权人地址: 湖北省武汉市洪山区珞喻路1037号
- 代理机构: 华中科技大学专利中心
- 代理商 尹丽媛
- 主分类号: G06V10/26
- IPC分类号: G06V10/26 ; G06V10/764 ; G06V10/774 ; G06V10/74 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种视觉理解模型的建立方法和图像分割预测方法,属于视觉理解技术领域,建立方法包括:建立条件边缘损失函数;训练初始视觉理解模型过程通过条件边缘损失函数调整模型参数得到目标视觉理解模型。条件边缘损失函数通过采样各个锚点所对应的正样本与负样本,利用正样本产生锚点所对应的条件局部类中心,通过监督条件局部类中心特征使其含有丰富的本类判别性特征,通过提升锚点特征与其对应的条件局部类中心特征之间的相似性,通过基于类别的锚点到样本间相似性监督将锚点周围的局部类别特征信息编码到锚点特征中。本发明能够使处于类别边缘的像素在学习到精确的类别相关信息,提高视觉理解任务中对于边缘像素分类的准确度。