-
公开(公告)号:CN113657170B
公开(公告)日:2024-02-06
申请号:CN202110816869.3
申请日:2021-07-20
申请人: 西安理工大学
IPC分类号: G06V10/86 , G06V10/25 , G06V10/82 , G06F40/205 , G06F40/30 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种增加图像文本描述多样性方法,步骤包括:步骤1、表达待描述图像的目标重要性;步骤2、构建原始彩色图像Image中目标的相邻关系结构图,表达关联关系重要性;步骤3、对检测到的目标进行筛选,得到文本描述网络需要的特征;步骤4、将随机删除非重要目标后的β组目标检测框特征,输入图像文本描述网络,生成多条描述语句。本发明的方法,在进入图像的文本描述网络前对图像中的目标进行重要性表达,将图像中出现的目标分为重要目标和非重要目标,通过随机删除非重要且不影响图像语义的目标,使得图像文本描述网络能够生成不同的描述语句,丰富描述语句的多样性。
-
公开(公告)号:CN113806587A
公开(公告)日:2021-12-17
申请号:CN202110975443.2
申请日:2021-08-24
申请人: 西安理工大学
IPC分类号: G06F16/783 , G06F40/242 , G06F40/253 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种多模态特征融合的视频描述文本生成方法,步骤包括:1)建立数据集、验证集及语义词典;2)构建多模态特征融合网络,获得聚合特征;3)利用语法感知视频动作的编码器获得描述语句的主语、谓语和宾语;4)利用动作指导解码器,生成视频的描述文本;5)训练视频文本生成网络模型;6)生成视频的文本描述语句,经过步骤1至步骤5完成网络训练之后,获得视频文本生成网络模型的所有参数,这时,将待描述视频作为输入视频,进行步骤2至步骤4之后,获得待描述视频的文本描述。本发明方法,具有更高的准确性。
-
公开(公告)号:CN113657170A
公开(公告)日:2021-11-16
申请号:CN202110816869.3
申请日:2021-07-20
申请人: 西安理工大学
摘要: 本发明公开了一种增加图像文本描述多样性方法,步骤包括:步骤1、表达待描述图像的目标重要性;步骤2、构建原始彩色图像Image中目标的相邻关系结构图,表达关联关系重要性;步骤3、对检测到的目标进行筛选,得到文本描述网络需要的特征;步骤4、将随机删除非重要目标后的β组目标检测框特征,输入图像文本描述网络,生成多条描述语句。本发明的方法,在进入图像的文本描述网络前对图像中的目标进行重要性表达,将图像中出现的目标分为重要目标和非重要目标,通过随机删除非重要且不影响图像语义的目标,使得图像文本描述网络能够生成不同的描述语句,丰富描述语句的多样性。
-
公开(公告)号:CN105046731B
公开(公告)日:2018-07-03
申请号:CN201510359863.2
申请日:2015-06-25
申请人: 西安理工大学
摘要: 本发明公开了一种事故现场虚拟多关注视角转换的三维动态再现方法,步骤包括:步骤1、构建三维模型库;步骤2、收集事故现场相关数据;步骤3、构建场景;步骤4、增强事故场景的现实效果;步骤5、再现事故现场;步骤6、多视角转换,利用不同视角重现事故现场,即成。本发明的方法,实现了对车祸现场的再现还原,并在三维场景中进行全方位视角分析,使得用户能够客观公正的分析事故原因,认定事故责任,对提高交通安全意识具有积极的意义。
-
公开(公告)号:CN112733866A
公开(公告)日:2021-04-30
申请号:CN202110110377.2
申请日:2021-01-27
申请人: 西安理工大学
摘要: 本发明公开了一种提高可控图像文本描述正确性的网络构建方法,步骤包括:步骤1、构建模型数据集;步骤2、提取数据集特征;步骤3、构建提取重点特征的编码器;步骤4、增强图像编码特征之间关系的编码网络;步骤5、将编码后特征输入解码网络输出语句;步骤6、按照以上步骤构建训练网络,通过上述步骤1‑步骤5,将构建好的编码网络和解码网络进行训练,用编码网络获得带有可控条件的图像特征,输入至解码网络,完成图像文本的描述。本发明的方法,这种可控的图像文本描述具有更高的正确性。
-
公开(公告)号:CN118010572A
公开(公告)日:2024-05-10
申请号:CN202410230727.2
申请日:2024-02-29
申请人: 西安理工大学
IPC分类号: G01N15/0205 , G01N15/075 , G01N21/53 , G01N21/33 , G01N21/3504 , G01N21/359 , G01N21/01
摘要: 本发明公开了一种大气颗粒物前向散射测量分析方法及装置,属于大气环境测量技术领域。首先发射包含紫外光束和短波近红外光束的准直光束,经大气中的颗粒物散射后,分别接收侧向散射光和若干角度的前向散射光的光信号;然后将得到的光信号转换为电信号,利用所述紫外光束和所述短波近红外光束,结合侧向散射光和若干角度的前向散射光的散射信息和消光信息,以三参数伽马分布函数为基本模型,利用反演算法描述各类型的粒子谱分布。相较于现有技术,本发明的反演算法具有以下优点:首先,通过利用伽马分布中有效半径的定义与其他参数的关系,大大减少了所需求解的参数数量,简化了反演过程;其次,采用目标方程组的求解方法,使得算法更加直观、高效,降低了算法复杂性。
-
公开(公告)号:CN105046731A
公开(公告)日:2015-11-11
申请号:CN201510359863.2
申请日:2015-06-25
申请人: 西安理工大学
摘要: 本发明公开了一种事故现场虚拟多关注视角转换的三维动态再现方法,步骤包括:步骤1、构建三维模型库;步骤2、收集事故现场相关数据;步骤3、构建场景;步骤4、增强事故场景的现实效果;步骤5、再现事故现场;步骤6、多视角转换,利用不同视角重现事故现场,即成。本发明的方法,实现了对车祸现场的再现还原,并在三维场景中进行全方位视角分析,使得用户能够客观公正的分析事故原因,认定事故责任,对提高交通安全意识具有积极的意义。
-
-
-
-
-
-