-
公开(公告)号:CN118411653B
公开(公告)日:2024-09-06
申请号:CN202410869090.1
申请日:2024-07-01
Applicant: 西安电子科技大学广州研究院 , 西安电子科技大学
Abstract: 本发明公开了一种基于单目标跟踪的半自动化视频图像标注方法及系统,该方法包括:构建视频帧图像数据集;通过ARTrack单目标跟踪算法对视频帧图像数据集进行跟踪处理,得到视频帧图像跟踪结果;根据预设误差范围,对视频帧图像跟踪结果进行修改标注处理,得到视频帧图像标注结果。通过使用本发明,能够实时对视频帧图像跟踪结果进行修正跟踪偏移,确保视频帧图像标注的连续性,提高了视频帧图像的标注效率以及准确率。本发明作为一种基于单目标跟踪的半自动化视频图像标注方法及系统,可广泛应用于视频图像标注技术领域。
-
公开(公告)号:CN118429390A
公开(公告)日:2024-08-02
申请号:CN202410886045.7
申请日:2024-07-03
Applicant: 西安电子科技大学广州研究院 , 西安电子科技大学
IPC: G06T7/246 , G06N3/0499 , G06N3/088 , G06N3/094 , G06T7/269 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/40
Abstract: 本发明公开了基于图像合成和域对抗学习的自监督目标跟踪方法及系统,该方法包括:获取目标对象的图像并进行图像预处理,构建目标对象合成视频帧;基于目标对象合成视频帧对视觉目标跟踪器进行训练,得到训练后的视觉目标跟踪器;基于训练后的视觉目标跟踪器,对目标对象进行跟踪,得到目标对象跟踪结果。通过使用本发明,能够实现跟踪器在任何无标注视频上进行训练,进而减少图像跟踪过程中的干扰因素从而提高跟踪精度。本发明作为基于图像合成和域对抗学习的自监督目标跟踪方法及系统,可广泛应用于视觉目标跟踪技术领域。
-
公开(公告)号:CN105513048A
公开(公告)日:2016-04-20
申请号:CN201510830283.7
申请日:2015-11-24
Applicant: 西安电子科技大学昆山创新研究院 , 西安电子科技大学
IPC: G06T7/00
CPC classification number: G06T7/0002 , G06T2207/30168
Abstract: 本发明公开了一种基于子带信息熵度量的图像质量评价方法,主要解决计算机对噪声图像的评价与人眼感知不符的问题。其实现步骤是:1.对待测试图像作分块离散余弦变换;2.合并各子块变换系数的相似频带系数;3.重组合并后的系数,将相同频带系数构成重组集合;4.计算每个重组集合系数的信息熵;5.对待测试图像对应的参考图像进行上述步骤1-4的操作,得到参考图像的信息熵;6.计算待测试图像和参考图像在各频带上信息量的差;7.计算所有频带信息量差的加权和,得到待测试图像的质量值;8.根据质量值得出待测试图像的质量评价。本发明的评价结果与人眼感知一致,可用于鉴别互联网上图像传输、图像检索和衡量图像处理指标的质量。
-
公开(公告)号:CN105389822A
公开(公告)日:2016-03-09
申请号:CN201510830282.2
申请日:2015-11-24
Applicant: 西安电子科技大学昆山创新研究院 , 西安电子科技大学
IPC: G06T7/00
CPC classification number: G06T7/0002 , G06T2207/30168
Abstract: 本发明公开了一种基于方位选择特性的部分参考图像质量评价方法,主要解决现有不能利用有限的实验数据准确的评价噪声图像质量的问题。其实现步骤是:1.依据视神经的方位选择原理模拟图像像素点的空间结构分布特性;2.通过像素点间的方位角差值与设定阈值确定像素点的空间结构分布;3.将所有像素点的空间结构分布,归纳为基于方向选择特性模式,统计图像中属于某种方位选择特性模式的空间结构分布数量并映射为基于方位选择特性的直方图;4.利用参考图像和噪声图像的直方图,评价待处理图像的质量。本发明通过模拟人类视神经对方位的敏感性,能准确评价噪声图像的质量,可用于互联网上图像传输,图像检索,图像压缩和图像质量的鉴别。
-
公开(公告)号:CN118429390B
公开(公告)日:2024-09-13
申请号:CN202410886045.7
申请日:2024-07-03
Applicant: 西安电子科技大学广州研究院 , 西安电子科技大学
IPC: G06T7/246 , G06N3/0499 , G06N3/088 , G06N3/094 , G06T7/269 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/40
Abstract: 本发明公开了基于图像合成和域对抗学习的自监督目标跟踪方法及系统,该方法包括:获取目标对象的图像并进行图像预处理,构建目标对象合成视频帧;基于目标对象合成视频帧对视觉目标跟踪器进行训练,得到训练后的视觉目标跟踪器;基于训练后的视觉目标跟踪器,对目标对象进行跟踪,得到目标对象跟踪结果。通过使用本发明,能够实现跟踪器在任何无标注视频上进行训练,进而减少图像跟踪过程中的干扰因素从而提高跟踪精度。本发明作为基于图像合成和域对抗学习的自监督目标跟踪方法及系统,可广泛应用于视觉目标跟踪技术领域。
-
公开(公告)号:CN118411653A
公开(公告)日:2024-07-30
申请号:CN202410869090.1
申请日:2024-07-01
Applicant: 西安电子科技大学广州研究院 , 西安电子科技大学
Abstract: 本发明公开了一种基于单目标跟踪的半自动化视频图像标注方法及系统,该方法包括:构建视频帧图像数据集;通过ARTrack单目标跟踪算法对视频帧图像数据集进行跟踪处理,得到视频帧图像跟踪结果;根据预设误差范围,对视频帧图像跟踪结果进行修改标注处理,得到视频帧图像标注结果。通过使用本发明,能够实时对视频帧图像跟踪结果进行修正跟踪偏移,确保视频帧图像标注的连续性,提高了视频帧图像的标注效率以及准确率。本发明作为一种基于单目标跟踪的半自动化视频图像标注方法及系统,可广泛应用于视频图像标注技术领域。
-
公开(公告)号:CN117440163A
公开(公告)日:2024-01-23
申请号:CN202311154946.9
申请日:2023-09-07
Applicant: 西安电子科技大学 , 西安电子科技大学广州研究院
IPC: H04N19/20
Abstract: 本发明公开了一种面向机器的多模态协同编码装置及其运用方法,所述装置包括特征抓取模块,用于从各模态的原生特征中抓取对应的专属嵌入特征;特征编解码模块,用于对所述专属嵌入特征进行编码压缩,通过信道传输在解码端进行特征解码获得重构特征;模态想象模块,用于通过已有模态信息想象出丢弃模态信息,获得前向丢弃模态特征以及联合多模态特征;分类器模块,用于以所述联合多模态特征为输入,获得概率分布结果,以进行多模态任务情感识别。因此,本发明实施例能够舍弃数据级别的保真而采用了语义级别的保真,对中间特征进行压缩、传输来降低带宽负载。
-
公开(公告)号:CN119848277A
公开(公告)日:2025-04-18
申请号:CN202411861774.3
申请日:2024-12-17
Applicant: 西安电子科技大学广州研究院
IPC: G06F16/535 , G06F16/538 , G06F16/583 , G06F40/30 , G10L15/26
Abstract: 本申请涉及视觉定位技术领域,公开了一种基于意图识别的结构化视觉定位方法、系统及设备,包括:获取待定位图像和用户的当前语音指令;将所述当前语音指令输入预先训练好的意图识别模型进行语义结构化处理,以构建语义拓扑图;其中,所述语义拓扑图用于描述所述当前语音指令对应的目标结构化数据;基于所述语义拓扑图进行推理,得到所述当前语音指令对应的语义指代;对所述语义指代和所述待定位图像进行特征对齐,以在所述待定位图像中定位与所述语义指代匹配的目标对象。本申请通过对语音指令的语义结构化处理,能够对含有口语化语言指令的语义进行精准推理,从而大大提高了视觉定位系统的鲁棒性,有利于提高日常对话场景中的视觉定位效果。
-
公开(公告)号:CN119835415A
公开(公告)日:2025-04-15
申请号:CN202411930424.8
申请日:2024-12-26
Applicant: 西安电子科技大学
IPC: H04N19/117 , H04N19/82 , H04N19/124 , G06T5/70 , G06T5/60 , G06T5/50 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于动态卷积神经网络的视频编码环路滤波方法,包括以下步骤;步骤1:从输入的重建图像和预测图像提取多维度的浅层特征;步骤2:将所述浅层特征与量化参数相结合,并通过下采样减小特征图的大小;步骤3:网络的主干部分对融合减小后的特征图提取深层特征,根据输入数据的特点动态调整参数,得到处理后的特征图;步骤4:对处理后的特征图进行整合,并通过上采样操作恢复到原始输入的分辨率,进而得到残差图,将残差图与原始的重建图像相加得到滤波后的图像。本发明能够根据图像内容,动态的调整卷积核参数,来应对不同图像的压缩伪影。此外,将量化参数与动态卷积相结合,更好的利用量化参数的先验信息。
-
公开(公告)号:CN118821718A
公开(公告)日:2024-10-22
申请号:CN202410650825.1
申请日:2024-05-24
Applicant: 西安电子科技大学广州研究院
IPC: G06F40/126 , G10L15/26 , G06N5/022 , G06N5/02 , G06F18/25 , G06V10/40 , G06V10/25 , G06V40/10 , G06V40/20 , G06V20/70 , G06F40/30 , G06F16/35 , G06N3/042 , G06N3/0464
Abstract: 本发明公开了一种基于知识图谱的语义通信方法、系统、设备及介质,所述方法包括:获取多模态信源信息,并对多模态信源信息进行初步特征提取,得到对应的语义信息;根据语义信息,更新上一次通信时的第一知识图谱,得到更新后的第二知识图谱;其中知识图谱具有多个层级;将第二知识图谱输入图编码器进行语义特征提取,获得第二知识图谱中更新的子图所对应的语义特征;将语义特征传输至信宿端,以使信宿端对语义特征进行解码,更新信宿端中的知识图谱,并根据更新后的知识图谱进行语义重构,得到目标信息。本发明将多模态信源信息融合成知识图谱,只传输发生变化的子图信息,减少了大量的传输带宽,提高了传输效率,也提高了信息传输的安全性。
-
-
-
-
-
-
-
-
-