- 专利标题: 一种基于视觉概念词关联结构化建模的图像描述方法
-
申请号: CN202310475627.1申请日: 2023-04-28
-
公开(公告)号: CN116204674B公开(公告)日: 2023-07-18
- 发明人: 张勇东 , 毛震东 , 张驰 , 王朋喆 , 陈伟东 , 宋彦 , 王婷
- 申请人: 中国科学技术大学
- 申请人地址: 安徽省合肥市包河区金寨路96号
- 专利权人: 中国科学技术大学
- 当前专利权人: 中国科学技术大学
- 当前专利权人地址: 安徽省合肥市包河区金寨路96号
- 代理机构: 合肥天明专利事务所
- 代理商 金凯; 谢中用
- 主分类号: G06F16/583
- IPC分类号: G06F16/583 ; G06F16/58 ; G06F40/30 ; G06N3/0464 ; G06N3/0455 ; G06N3/08
摘要:
本发明涉及计算机视觉和自然语言处理领域。本发明提出了一种基于视觉概念词关联结构化建模的图像描述方法,通过图像描述模型对输入的图像,生成所述图像的描述语句。图像描述模型的训练过程包括:将训练数据输入视觉特征提取和编码模块,得到视觉特征;将视觉特征输入视觉概念预测模块,得到对应的视觉概念词,将视觉概念词输入视觉概念关联结构化建模模块,得到结构化视觉语义概念词特征;将视觉特征和结构化视觉语义概念词特征输入描述生成模块,得到描述语句。基于总体损失函数训练模型。本发明提供的方法对单词在文本模态中的语言学先验的提取做了有效的约束。
公开/授权文献
- CN116204674A 一种基于视觉概念词关联结构化建模的图像描述方法 公开/授权日:2023-06-02