基于多层级注意力机制的场景图生成方法

    公开(公告)号:CN116912579A

    公开(公告)日:2023-10-20

    申请号:CN202310872315.4

    申请日:2023-07-17

    发明人: 耿瑞 林恺 杨韬 张强

    摘要: 本发明属于人工智能计算机视觉领域,具体涉及一种基于多层级注意力机制的场景图生成方法。首先使用预训练的目标检测网络获取图像中的对象信息,并从图像信息中获取的动态化层级先验知识,在此基础上通过多层级注意力结构对已有对象及对象对特征进行编码,最终分类得到对象类别及关系类别并获得场景图。本发明构建了一种更清晰的方式来表达物体的层次关系,并有效的利用层级注意力,使得结果的生成更依赖于对其影响更大的子区域,提高了结果的精确度。