字幕检测方法及装置、背景恢复方法及装置

    公开(公告)号:CN101835011B

    公开(公告)日:2013-08-28

    申请号:CN200910118779.6

    申请日:2009-03-11

    IPC分类号: H04N17/00

    摘要: 本发明涉及视频检测技术,公开了字幕检测方法及装置、背景恢复方法及装置,其中字幕检测方法包括:获取视频帧中像素区域属于平滑背景的概率;使用帧间相关系数确定所述像素区域属于静止纹理的概率;获取所述像素区域属于动态纹理的概率;根据所述像素区域属于平滑背景的概率、属于静止纹理的概率和属于动态纹理的概率确定所述像素区域是否属于滚动字幕区域。使用本发明实施例提供的技术方案,可以使用帧间信息对视频的字幕进行检测。

    一种有遮挡的人脸识别方法、装置、存储介质及终端

    公开(公告)号:CN112487886A

    公开(公告)日:2021-03-12

    申请号:CN202011278529.1

    申请日:2020-11-16

    IPC分类号: G06K9/00

    摘要: 本发明公开了一种有遮挡的人脸识别方法、装置、存储介质及终端,该方法包括:采集并预处理有遮挡的待识别人脸图像;提取预处理后的待识别人脸图像所对应的人脸全局特征;检测并提取预处理后的待识别人脸图像中未遮挡的人脸局部特征;将人脸全局特征和人脸局部特征拼接后,生成拼接后的人脸特征;从预设被遮挡人脸数据库中匹配拼接后的人脸特征对应的第二人脸特征;计算拼接后的人脸特征与第二人脸特征之间的相似度,并根据相似度判定待识别人脸图像和第二人脸特征的人脸图像是否为同一身份。因此,采用本申请实施例,可以提高复杂环境中被遮挡人脸识别的准确率。

    字幕检测方法及装置、背景恢复方法及装置

    公开(公告)号:CN101835011A

    公开(公告)日:2010-09-15

    申请号:CN200910118779.6

    申请日:2009-03-11

    IPC分类号: H04N5/445

    摘要: 本发明涉及视频检测技术,公开了字幕检测方法及装置、背景恢复方法及装置,其中字幕检测方法包括:获取视频帧中像素区域属于平滑背景的概率;使用帧间相关系数确定所述像素区域属于静止纹理的概率;获取所述像素区域属于动态纹理的概率;根据所述像素区域属于平滑背景的概率、属于静止纹理的概率和属于动态纹理的概率确定所述像素区域是否属于滚动字幕区域。使用本发明实施例提供的技术方案,可以使用帧间信息对视频的字幕进行检测。

    一种视频兴趣物体提取与关联的方法及系统

    公开(公告)号:CN102232220A

    公开(公告)日:2011-11-02

    申请号:CN201080005209.7

    申请日:2010-10-29

    IPC分类号: G06F17/30 G06T7/00 G06K9/46

    摘要: 本发明涉及一种图像和视频处理方法,特别是一种基于两阶段交互的视频兴趣物体提取与关联方法。本方法中,用户通过某种不限于常规方式、先验知识要求低的交互方法进行粗定位交互,在此基础上采用某种快速、易实现的提取算法对兴趣物体进行多参数提取。基于重选择交互出来的最合适的兴趣物体,本方法通过提取多种特征进行检索并加权得到最终结果,从增值信息库中取出对应的图像及附加信息,最后将这些信息展示在视频的周边。本方法在充分挖掘视频信息、保证用户偏好的基础上,以不影响用户观看的方式为其感兴趣的物体关联增值信息,进而满足了用户对其所关注区域深入了解和进一步探索的需求。

    一种视频兴趣物体提取与关联的方法及系统

    公开(公告)号:CN102232220B

    公开(公告)日:2014-04-30

    申请号:CN201080005209.7

    申请日:2010-10-29

    IPC分类号: G06F17/30 G06T7/00 G06K9/46

    摘要: 本发明涉及一种图像和视频处理方法,特别是一种基于两阶段交互的视频兴趣物体提取与关联方法。本方法中,用户通过某种不限于常规方式、先验知识要求低的交互方法进行粗定位交互,在此基础上采用某种快速、易实现的提取算法对兴趣物体进行多参数提取。基于重选择交互出来的最合适的兴趣物体,本方法通过提取多种特征进行检索并加权得到最终结果,从增值信息库中取出对应的图像及附加信息,最后将这些信息展示在视频的周边。本方法在充分挖掘视频信息、保证用户偏好的基础上,以不影响用户观看的方式为其感兴趣的物体关联增值信息,进而满足了用户对其所关注区域深入了解和进一步探索的需求。

    一种基于自动搜索与知识蒸馏的神经网络剪枝的压缩算法

    公开(公告)号:CN110175628A

    公开(公告)日:2019-08-27

    申请号:CN201910338123.9

    申请日:2019-04-25

    IPC分类号: G06K9/62 G06N3/04

    摘要: 本发明涉及神经网络领域,特别涉及一种基于自动搜索与知识蒸馏的神经网络剪枝的压缩算法。具体包括以下步骤:步骤一、对于卷积神经网络,对神经网络l层搜索最佳剪枝比例pl;步骤二、对卷积神经网络的l层按照最佳剪枝比例进行剪枝操作;步骤三、对学生网络与教师网络输入训练集样本,前向传播;步骤四、对学生网络使用知识蒸馏算法,进行优化训练;步骤五、对学生网络进行反向传播更新参数,并且优化更新参数,然后跳转至步骤四。本发明实现卷积神经网络的剪枝与精度恢复,克服卷积神经网络压缩依赖原始数据集的问题。

    实现领域自适应的方法、装置、电子设备及介质

    公开(公告)号:CN111680697B

    公开(公告)日:2024-03-22

    申请号:CN202010187988.2

    申请日:2020-03-17

    申请人: 北京大学

    摘要: 本申请公开了一种实现领域自适应的方法、装置、电子设备及介质。其中,在基于预设的第一神经网络模型,对样本图像进行至少两个样本图像特征提取后,可以利用至少两个样本图像特征,得到至少两个难度因子,该难度因子为样本图像特征与目标图像特征之间的特征距离,并利用至少两个难度因子,获取损失函数,进而根据该损失函数以及随机梯度下降法,实现目标领域自适应。通过应用本申请的技术方案,可以利用原有的样本图像数据中的图像特征生成对应的难度因子,并根据难度因子的不同进行对应强度的特征对齐。从而使得神经网络模型无法区分源域样本和目标域样本,进而达到覆盖源域和目标域的特征表示的目的。从而实现神经网络模型的领域自适应。

    基于振幅与相位重组的数据增强方法、系统、设备及介质

    公开(公告)号:CN113610737B

    公开(公告)日:2023-10-24

    申请号:CN202110838150.X

    申请日:2021-07-23

    申请人: 北京大学

    摘要: 本申请涉及数据处理技术领域,更为具体来说,本申请涉及基于振幅与相位重组的数据增强方法、系统、设备及介质。所述方法包括:获取第一图像;对所述第一图像进行转换处理,得到转换处理图像;分别对所述第一图像和所述转换处理图像进行傅里叶变换得到所述第一图像和所述转换处理图像的相位信息与振幅信息;将所述第一图像的相位信息和所述转换处理图像的振幅信息基于反傅里叶变换得到第一增强图像;将所述转换处理图像的相位信息和所述第一图像的振幅信息基于反傅里叶变换得到第二增强图像。本方法能辅助针对图像的神经网络模型的训练,增强后的数据可以提高神经网络的泛化能力及鲁棒性,促进神经网络对雾、雨及各种噪音场景下的图像识别能力。