一种提取行人特征的方法和装置
    1.
    发明公开

    公开(公告)号:CN118799917A

    公开(公告)日:2024-10-18

    申请号:CN202410928443.0

    申请日:2024-07-11

    摘要: 本发明涉及行人重识别技术领域,提供了一种提取行人特征的方法和装置。将无标签行人图像输入初始预训练模型,将其转换为原始图片块序列;使用初始预训练模型的教师网络提取原始图片块序列中的行人特征,得到教师目标向量;对原始图片块序列中的原始词元进行随机遮掩,得到掩码图片块序列;使用初始预训练模型的学生网络提取其中的行人特征,得到学生目标向量;根据教师目标向量和学生目标向量优化所述初始预训练模型的网络参数,迭代训练最终得到目标预训练模型,以使用目标预训练模型提取行人特征。本发明解决了现有技术中由于有标注的训练数据不足,导致难以有效提取行人图像的局部细节特征、精度受限的问题。

    引入早期检测器的Transformer目标检测方法与装置

    公开(公告)号:CN115830300A

    公开(公告)日:2023-03-21

    申请号:CN202211481710.1

    申请日:2022-11-24

    摘要: 本发明公开了一种引入早期检测器的Transformer目标检测方法,包括:将图像输入到视觉Transformer,提取出语义丰富的特征图;在该特征图上使用早期检测器,输出粗略的估计目标;取出置信度前N个估计目标,将该目标的检测框的四个坐标作为检测Transformer中解码器的参考点,并将预测出这些选定的估计目标的特征图上的特征点选定作为检测Transformer中解码器的目标标识符;所述N为预设值;检测Transformer的解码器利用步骤三提供的参考点和目标标识符,利用交叉注意力机制与步骤一提取出的特征图进行交互,从而不断精炼目标标识符和参考点的坐标,最终输出准确的目标检测框和目标类别。本发明还提供了相应的引入早期检测器的Transformer目标检测装置。

    对象检测模型训练方法、目标对象检测方法

    公开(公告)号:CN109697460B

    公开(公告)日:2021-06-29

    申请号:CN201811479732.8

    申请日:2018-12-05

    摘要: 本申请涉及一种目标对象检测方法、装置、计算机可读存储介质和计算机设备,该方法包括:获取待检测图像;将待检测图像输入至目标对象检测模型,目标对象检测模型是通过训练损失值对初始对象检测模型进行参数调整得到的,其中,训练损失值是根据第一区域和第二区域确定的目标像素点计算得到的,第一区域和所述第二区域是根据训练样本图像中目标类型对象的样本质心的位置确定得到的;目标对象检测模型生成待检测图像对应的预测图,预测图描述待检测图像的各个像素点属于目标检测对象的关系度;对预测图进行区域分割得到目标检测对象区域。此外,还提供了一种对象检测模型训练方法、装置、计算机可读存储介质和计算机设备。

    一种基于多维度注意力融合网络的多模态情绪分析方法

    公开(公告)号:CN111680541A

    公开(公告)日:2020-09-18

    申请号:CN202010292014.0

    申请日:2020-04-14

    摘要: 本发明公开了一种基于多维度注意力融合网络的多模态情绪分析方法,包括:针对包含语音、视频、文本等多个模态的样本数据提取语音预处理特征、视频预处理特征、文本预处理特征;然后对每个模态构建所述的多维度注意力融合网络,利用网络内部的自相关特征提取模块提取一级自相关特征和二级自相关特征,然后将三种模态的自相关信息进行组合,利用网络内部的跨模态融合模块得到三种模态的跨模态融合特征;再利用所述的二级自相关特征和跨模态融合特征合并得到模态多维度特征;最后将所述的模态多维度特征进行拼接,确定情绪分数,进行情绪分析;该方法能够有效的在非对齐多模态数据场景下进行特征融合,充分利用多模态的关联信息,进行情绪分析。

    一种基于边界点检测的场景文本端到端识别方法

    公开(公告)号:CN110837835A

    公开(公告)日:2020-02-25

    申请号:CN201911038568.1

    申请日:2019-10-29

    IPC分类号: G06K9/34 G06K9/46 G06K9/62

    摘要: 本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。

    一种基于众包指纹的室内指纹地图构建方法

    公开(公告)号:CN106792465B

    公开(公告)日:2019-08-30

    申请号:CN201611219485.9

    申请日:2016-12-26

    IPC分类号: H04W4/00 H04W4/02 G06F16/29

    摘要: 一种基于众包指纹的室内指纹地图构建方法,属于基于指纹的室内定位技术,解决现有基于众包指纹构建室内指纹地图所存在的众包指纹位置标注不准确、维度不同和分布不均导致的定位准确度不高和计算量大的问题,用于通信与无线网络技术领域。本发明包括栅格划分步骤、获得众包指纹步骤、众包指纹拆分步骤、众包指纹数量判断步骤、AP筛选步骤、直接构造栅格指纹步骤和指纹曲面拟合步骤。本发明减少了指纹采集工作量,有利于提高定位准确度,同时减少指纹对比工作量。

    基于离散曲线演化的骨架剪枝方法

    公开(公告)号:CN101140660B

    公开(公告)日:2010-05-19

    申请号:CN200710053534.0

    申请日:2007-10-11

    IPC分类号: G06T5/00

    摘要: 本发明公开了一种基于离散曲线演化的骨架剪枝方法,属于图像处理技术领域。二值图像骨架化方法得到的骨架都受制于对边界噪声的敏感性,限制了骨架在图像处理领域中的应用。本发明利用离散曲线演化求出图像的轮廓分割,删除生成点在同一轮廓分割上的骨架点,达到删除由边缘噪声引起的冗余骨架分支而保持视觉上重要骨架分枝的目的。本发明综合考虑了物体的全局信息,剪枝后的骨架非常稳定;能保持骨架的拓扑不变性;可以彻底删除不必要的骨架分枝,而避免重要的骨架分枝被缩短;本发明时间复杂度低,且可实现对骨架的多尺度剪枝。本发明在医学图像分析、物体识别、零件检测、三维建模、计算机辅助设计等方向有着潜在的应用。

    一种图像数据水印信息的嵌入、检测方法及系统

    公开(公告)号:CN100586181C

    公开(公告)日:2010-01-27

    申请号:CN200610033171.X

    申请日:2006-01-18

    IPC分类号: H04N7/26 G06T1/00

    摘要: 本发明适用于图像处理领域,提供了一种图像数据水印信息的嵌入、检测方法及系统,所述方法包括下述步骤:A.利用离散余弦变换的低频系数在原始图像数据帧中提取多个特征块;B.在所述特征块的离散余弦变换域中频部分嵌入水印信息;C.根据所述多个特征块确定同步块的位置;D.在所述同步块中嵌入同步标记。本发明在DCT域中选取特征块作为水印信息嵌入点,并利用特征块的统计特性进行水印信息检测时的几何校准,能够有效地抵御几何攻击。在检测时,计算特征块的统计特性确定同步块的位置,估计图像数据帧的几何失真并对几何失真进行恢复,完成水印信息的检测,实现复杂度较低,能满足实时应用的需求。

    视频编码比特率的控制方法

    公开(公告)号:CN100574427C

    公开(公告)日:2009-12-23

    申请号:CN200510019352.2

    申请日:2005-08-26

    IPC分类号: H04N7/24

    摘要: 视频编码比特率的控制方法,属于视频信息传输与处理领域,克服现有码率控制方法的不足,在低码率下准确有效地控制输出码率。本发明步骤为:(1)进行整数离散余弦变换,求取输入图像变换参数;(2)定义GOP第一帧和整个序列第二帧的量化参数;(3)确定当前P帧图像的目标编码比特数;(4)计算码率预测模型中的待定系数a和b;(5)求取当前P帧的量化参数;(6)使用量化参数进行后续编码工作,同时将当前图像帧的有关参数保存于滑动窗口中;(7)重复步骤(1)~(6),直到全部图象编码结束。本发明基于低码率情况实现快速、准确的码率控制,输出码率波动小、PSNR值平稳,接近于目标码率,鲁棒性好,适用于所有的测试序列。