-
公开(公告)号:CN101959067A
公开(公告)日:2011-01-26
申请号:CN201010291989.8
申请日:2010-09-26
Applicant: 北京大学
Abstract: 本发明公开了一种基于外极线约束的快速编码模式决策方法和系统。其中,包括:根据视图间的外极线约束关系,确定待编码宏块外极线上宏块的范围;使用滑动搜索窗方式,从所述外极线上宏块的最优预测模式范围中筛选候选模式,并通过模式修正的方式避免候选模式选择遗漏,确定候选模式集合;使用所述待编码宏块外极线上位置靠近该宏块的N个宏块的率失真优化参数值设置待编码宏块的率失真优化参数上限阈值和下限阈值,并将该阈值作为所述待编码宏块最优预测模式选择的条件,在所述候选模式集合进行至少一次筛选,获取预测模式。本发明既能够充分利用视图间相似性来提高编码速度,又无需引入具有极高计算复杂度的视差估计等步骤。
-
公开(公告)号:CN101877127A
公开(公告)日:2010-11-03
申请号:CN200910237862.5
申请日:2009-11-12
Applicant: 北京大学
IPC: G06T7/00
Abstract: 本发明公开了一种基于梯度剖面的图像无参考质量评价方法及系统。该图像无参考质量评价系统包括:用于对输入图像边缘点进行检测,并依据边缘点提取梯度剖面的梯度剖面提取装置、用于依据梯度剖面,进行图像模糊效应的度量的模糊效应评价装置、用于依据梯度剖面,进行图像振铃效应的度量的振铃效应评价装置,以及用于将模糊效应度量和振铃效应度量进行融合,获取输入图像质量评价参考值的综合评价装置。基于本发明,可以对各种类型的自然图像进行质量评价,特别是针对由于离焦、运动等原因导致的部分模糊的图像,具有很好的鲁棒性。
-
公开(公告)号:CN113905234B
公开(公告)日:2025-04-11
申请号:CN202111185644.9
申请日:2019-03-12
Applicant: 深圳市大疆创新科技有限公司 , 北京大学
IPC: H04N19/14 , H04N19/176 , H04N19/50 , H04N19/513 , H04N19/426
Abstract: 提供一种视频图像处理方法与装置,该方法包括:确定当前图像块;当所述当前图像块的尺寸满足预设条件时,根据时域运动矢量预测TMVP操作,和/或,高级/可选时域运动矢量预测ATMVP操作确定所述当前图像块的时域候选运动矢量。在保证编解码性能的前提下,可以降低复杂度。
-
公开(公告)号:CN119336157A
公开(公告)日:2025-01-21
申请号:CN202411272324.0
申请日:2024-09-11
Applicant: 北京大学
IPC: G06F3/01 , G06F3/04815 , G06F3/14
Abstract: 本申请公开了一种交互式三维显示系统和方法,该系统包括:服务器、显示模块以及交互装置;服务器分别与显示模块以及交互装置通信连接;交互装置,用于根据用户的手势,发送交互请求至服务器;服务器,接收交互装置发送的交互请求,基于交互请求与预设多屏拼接模型,调整显示模块上显示的内容;预设多屏拼接模型用于计算用户为获得最佳视觉效果所需的目标观察距离。本申请提供了一种预设多屏拼接模型,该模型用于计算用户为获得最佳视觉效果所需的目标观察距离,因此当显示屏更换或参数调整后,通过该模型可以重新计算最佳视觉效果所需的目标观察距离作为内容调整的基础参数,使得用户不会由于角度变化引起视觉错位,提升了观看的连贯性和舒适度。
-
公开(公告)号:CN119225530A
公开(公告)日:2024-12-31
申请号:CN202411208770.5
申请日:2024-08-30
Applicant: 北京大学
IPC: G06F3/01 , G06F3/04815 , G06T17/00 , G06T15/00 , G06T19/20
Abstract: 本申请公开了一种人机交互方法、装置、介质及电子设备,方法包括:响应于用户针对目标对象的选择指令,展示目标对象的数字3D模型;在数字3D模型的展示时长到达预设时长的情况下,获取目标对象的介绍文本;根据介绍文本,通过多模态大模型对数字3D模型进行推理,得到与介绍文本相关的分割区域,多模态大模型用于将介绍文本与多个视角的2D图像进行对齐并分割,多个视角的2D图像是将数字3D模型的不同预定义视点进行渲染得到的;播放介绍文本对应的音频,并显示分割区域。因此,采用本申请实施例,用户在面对文化遗产的数字化展示时,可以将抽象的文本解释与具体的文化细节有效联系起来,从而提升了用户的体验和学习效果。
-
公开(公告)号:CN117422855B
公开(公告)日:2024-05-03
申请号:CN202311750184.9
申请日:2023-12-19
Applicant: 浙江省北大信息技术高等研究院 , 北京大学
Abstract: 本申请提出一种面向机器视觉的图像预处理方法、装置、设备及存储介质,该方法包括:对原始图像进行模糊处理生成待增强图像,待增强图像的清晰度低于原始图像的清晰度;对待增强图像的语义特征进行增强处理生成目标图像;将目标图像输入图像处理神经网络,以触发所述图像处理神经网络基于所述目标图像的语义特征执行图像分析任务。本申请实施例提供的图像预处理技术,能够在降低码率的情况下,将图像处理神经网络的分析性维持在较佳的水平。
-
公开(公告)号:CN111247804B
公开(公告)日:2023-10-13
申请号:CN201980005232.7
申请日:2019-03-12
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/513 , H04N19/56 , H04N19/82 , H04N19/176 , H04N19/13 , H04N19/107
Abstract: 提供一种图像处理的方法与装置,该方法包括:获取图像块的控制点的运动矢量CPMV;根据该图像块的CPMV,获取该图像块中子图像块的运动矢量,运动矢量为整像素精度。通过使作为图像处理单元的子图像块的运动矢量为整像素精度,可以使子图像块的运动补偿过程不涉及亚像素,从而在一定程度上可以降低Affine预测技术产生的带宽压力。
-
公开(公告)号:CN116866605A
公开(公告)日:2023-10-10
申请号:CN202311024533.9
申请日:2019-01-03
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/513 , H04N19/176 , H04N19/107
Abstract: 提供一种视频处理方法和装置,该方法包括:获取当前块的参考帧列表,当前块的参考帧列表包括第一参考帧列表和第二参考帧列表;根据当前块的参考帧列表,确定目标参考帧列表,目标参考帧列表为第一参考帧列表和第二参考帧列表之一;根据当前块的目标参考帧列表确定当前块的时域运动矢量;根据时域运动矢量确定当前块的子块的运动信息;根据当前块的子块的运动信息对当前块进行帧间预测。通过限制双向预测过程中需要扫描的参考帧列表的数量,可以简化编解码操作。
-
公开(公告)号:CN116634172A
公开(公告)日:2023-08-22
申请号:CN202310664406.9
申请日:2019-01-02
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/52 , H04N19/577 , H04N19/105
Abstract: 本申请实施例提供一种候选MV列表构建方法和装置,包括:在帧间预测模式为第一合并模式时,构建第一合并模式下的当前图像块的第一候选MV列表;在帧间预测模式为第二合并模式时,获取当前图像块的第一候选MV列表,若第一候选MV列表中包括双向MV,则对第一候选MV列表中的MV进行重组,得到第二合并模式下的当前图像块的第二候选MV列表。本申请实施例提供的候选MV列表构建方法和装置,可降低视频编解码装置硬件的复杂度。
-
公开(公告)号:CN116527911A
公开(公告)日:2023-08-01
申请号:CN202310437128.3
申请日:2023-04-21
Applicant: 北京大学
IPC: H04N19/156 , H04N19/124 , H04N19/146 , H04N19/42
Abstract: 本发明提供一种码率控制的方法及装置,所述方法包括:获取当前时刻编码缓存器的第一实际充溢度;通过对所述第一实际充溢度进行指数映射,确定量化步长;所述指数映射的目标关系式中的指数函数的底数为大于1的数;基于所述量化步长确定当前编码单元的量化参数。基于此,在待编码图像的编码难度升高时,缓冲编码缓存器的充溢度的波动以缓解缓存器的状态。