一种基于非线性优化的多视角相机标定方法及系统

    公开(公告)号:CN114663533A

    公开(公告)日:2022-06-24

    申请号:CN202210399245.0

    申请日:2022-04-15

    Applicant: 南京大学

    Inventor: 于耀 丁明宇 周余

    Abstract: 本发明涉及一种基于非线性优化的多视角相机标定方法及系统。所述方法包括:对所有待标定相机的内参进行预标定,得到所有待标定相机的内参矩阵;通过多相机之间的相邻关系粗标定所有待标定相机在选定世界坐标系下的外参,得到所有待标定相机待优化的初始外参;通过非线性优化方法,基于所述内参矩阵对所有待标定相机待优化的初始外参进行同步优化,获得精细化的相机外参。本发明针对多视角相机的外参标定问题,采用一种先粗标定再优化的方式,有效解决了二维棋盘格标定物在多相机系统中存在的自遮挡问题,在不需要三维标定物的情况下,利用多相机之间的拓扑关系同步优化所有相机外参,可以得到精度可观的标定结果,提高了标定精度。

    一种实时的衣物形态确定方法及系统

    公开(公告)号:CN111062136A

    公开(公告)日:2020-04-24

    申请号:CN201911325532.1

    申请日:2019-12-20

    Applicant: 南京大学

    Inventor: 于耀 张延 周余

    Abstract: 本发明涉及一种实时的衣物形态确定方法及系统。方法包括:获取当前帧物体的三维网格数据和运动参数和当前帧衣物的多个质点的初始位置;确定质点的第一势能和第二势能;确定质点的初始总能量;根据质点的初始位置和质点的初始总能量,对质点的当前位置进行更新;根据更新后的质点的当前位置,对质点的当前总能量进行更新;判断更新后质点的当前总能量与质点的当前总能量的差值是否小于更新阈值;并确定下一帧质点的位置;根据下一帧所有质点的位置,确定下一帧的衣物形态。本发明所提供的一种实时的衣物形态确定方法及系统,解决现有技术中衣物仿真中的衣物形态的真实性低和仿真的效率低的问题。

    一种基于深度学习的多相机协同跟踪系统

    公开(公告)号:CN110276233A

    公开(公告)日:2019-09-24

    申请号:CN201810232732.1

    申请日:2018-03-15

    Applicant: 南京大学

    Inventor: 于耀 李炎峻 周余

    Abstract: 本发明是一种对于视频中行人轨迹进行跟踪的算法,属于计算机视觉领域。本发明解决的问题是:行人跟踪中由于遮挡等原因使得跟踪效果不鲁棒的问题。本发明提出一种在多相机环境下进行行人跟踪的算法。本发明的主要算法的核心部分在于提出了一种端到端的多相机协同跟踪算法,使用多台相机对目标区域进行数据采集,然后对视频流中的每帧图片进行行人的检测与识别,根据检测的结果进行行人的跟踪,再将不同相机下同一行人的轨迹进行匹配融合,最终得到行人在每帧的位置信息,构成行人的轨迹。对于行人跟踪中常见的遮挡问题,我们应用对抗生成网络来解决,当跟踪过程中发生遮挡问题时,我们便应用对抗生成网络来生成下一帧的未遮挡图片,并使用生成的图片来进行行人的检测与跟踪。

    一种云计算环境中的主机负载预测方法

    公开(公告)号:CN103365727B

    公开(公告)日:2017-02-15

    申请号:CN201310285843.6

    申请日:2013-07-09

    Applicant: 南京大学

    CPC classification number: Y02D10/22 Y02D10/36

    Abstract: 本发明是一种针对云计算中心主机的负载预测方法,属于云计算领域。本发明解决的问题是:针对云计算中心的主机上运行着属于不同用户的虚拟机,主机负载变化更加复杂,如何准确的预测主机负载,从而能够进一步调度虚拟机,实现负载均衡和降低能耗的目的。本发明的算法核心部分在于将混沌理论中的相空间重构的方法与基于遗传算法的数据分组处理算法相结合。通过与目前一些已经存在的方法进行比较,本发明提出的方法能够得到更小的相对误差。而且,本发明所提出的方法在预测时间长度变大的情况下,相比于传统方法,减少了预测的累积误差。

    一种室外场景三维点云采集系统

    公开(公告)号:CN105844700A

    公开(公告)日:2016-08-10

    申请号:CN201610149194.0

    申请日:2016-03-14

    Applicant: 南京大学

    CPC classification number: G06T17/00

    Abstract: 本发明是一种基于激光雷达的室外场景三维点云采集系统,属于计算机视觉领域。本发明解决的问题是:利用单线雷达102,相机103,通过同步模块104同步采集,在计算机101中利用相机的运动轨迹拼接雷达数据,解决了单线雷达室外场景测量中的尺度求解问题。本发明的主要算法的核心部分在于分别利用图像和雷达形成的点云进行点云融合,迭代求解尺度。本发明提出的方法能够简单、廉价的获取比较准确的室外场景三维模型。

    基于语音特征判别的静音检测方法

    公开(公告)号:CN100573663C

    公开(公告)日:2009-12-23

    申请号:CN200610039696.4

    申请日:2006-04-20

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel尺度倒谱系数;用二分类支持向量机对音频的复合特征加以判别,一类结果为正常语音,另一类为静音。本发明可以提高静音检测成功率,并能对一些特殊语音加以识别。本发明广泛适用于网络语音通话中,特别是在语音聊天、视频会议中具有广阔的市场前景。

    支持大容量混音的同声传译视频会议系统及方法

    公开(公告)号:CN1845573A

    公开(公告)日:2006-10-11

    申请号:CN200610040060.1

    申请日:2006-04-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种支持大容量混音的同声传译视频会议系统及方法,提出了基于Mel尺度倒谱特征与支持向量机静音检测方法、大容量混音方法和同声传译方法。可以实现更高的静音检测率、比其它混音方法更多的混音路数和在同一会议室进行多语种同步混音。静音检测方法以Mel尺度倒谱系数为语音特征,二分类支持向量机为分类器判断出静音和正常语音;混音方法采用语音的短时能量作为权重处理依据;多语种同步混音通过定义新的音频数据包头格式实现。

    一种风格化人脸图像编辑方法、装置、产品、介质及设备

    公开(公告)号:CN119919541A

    公开(公告)日:2025-05-02

    申请号:CN202510008499.9

    申请日:2025-01-03

    Applicant: 南京大学

    Inventor: 周余 张瀚 于耀

    Abstract: 本申请公开了一种风格化人脸图像编辑方法、装置、产品、介质及设备,涉及计算机视觉技术领域,该方法包括:将图片内容目标编辑方向和待编辑人脸图像分别输入至StyleCLIP模型和GAN Inversion模型中,输出图片内容目标编辑方向对应的W特征空间变化量和待编辑人脸图像对应的W特征空间编码;基于待编辑人脸图像和待编辑人脸图像对应的W特征空间编码对StyleGAN模型中生成器的模型参数进行微调,得到微调后的生成器;根据W特征空间变化量、W特征空间编码以及微调后的生成器对待编辑人脸图像进行编辑,得到编辑后的人脸图像。本申请可快速生成风格统一且内容丰富的人脸图像。

Patent Agency Ranking