-
公开(公告)号:CN115965660A
公开(公告)日:2023-04-14
申请号:CN202211424815.3
申请日:2022-11-14
申请人: 三星(中国)半导体有限公司 , 三星电子株式会社 , 深圳大学
摘要: 提供了一种光流估计方法和装置。所述方法包括:对于两个图像中的每个图像,将加入了第一行矢量的每个图像的源图像特征图输入每个图像对应的第一多头注意力模块获取融合了每个图像的行关系信息的第一水平轴向分离融合注意力特征图;基于第一水平轴向分离融合注意力特征图和所述源图像特征图获取每个图像的第一注意力特征图;将加入了第一列矢量的第一注意力特征图输入每个图像对应的第二多头注意力模块,获取融合了每个图像的行关系信息和列关系信息的第一垂直轴向分离融合注意力特征图;基于第一垂直轴向分离融合注意力特征图和第一注意力特征图获取每个图像的第二注意力特征图;基于所述图像的第二注意力特征图,获取所述图像的光流估计。
-
公开(公告)号:CN116030387A
公开(公告)日:2023-04-28
申请号:CN202211721668.6
申请日:2022-12-30
申请人: 三星(中国)半导体有限公司 , 三星电子株式会社 , 西安交通大学
摘要: 提供了一种从视频中识别对象的方法和装置,其中,所述方法包括:从视频中提取多个图像帧;利用视觉变换Transformer提取所述多个图像帧中的每个图像帧的初始特征图;利用级联的至少一层注意力特征融合网络,对所述每个图像帧的初始特征图进行融合以获得所述多个图像帧的融合特征图,其中,每层注意力特征融合网络包括至少一个注意力特征融合模块,其中,每个注意力特征融合模块至少包括级联的多头自注意力模块和交叉注意力模块,其中,最后一层注意力特征融合网络仅包括一个注意力特征融合模块;基于所述多个图像帧的融合特征图,识别所述视频中的对象。
-