面向海量数据近似快速聚类和索引方法

    公开(公告)号:CN101339553A

    公开(公告)日:2009-01-07

    申请号:CN200810059127.5

    申请日:2008-01-14

    申请人: 浙江大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种面向海量数据的递归分块信息传递聚类和索引方法。利用该方法可以实现各种海量数据的准确,快速的聚类和适用于查询,更新的索引结构。用户可以将海量的无序数据进行处理,快速的进行聚类并索引,有利于以后的查询,检索,维护和更新。此方法可以应用于面向互联网的海量文本,图像,音频,视频等快速聚类和索引,也可以应用于海量生物基因序列的相似度比较,同源蛋白质检测。本发明还公开了一种近似的快速海量数据的聚类方法,利用该方法可以在保证聚类效果损失不大的情况下,能够呈指数级的加快聚类的速度。并且还能较好有利于训练集以外数据进行聚类,插入和更新,因此该方法可以普遍适用于各种复杂的海量数据的快速聚类和索引。

    一种基于轮廓时空特征的视频对象标注方法

    公开(公告)号:CN100413327C

    公开(公告)日:2008-08-20

    申请号:CN200610053398.0

    申请日:2006-09-14

    申请人: 浙江大学

    IPC分类号: H04N5/262

    摘要: 本发明公开了一种视频前景对象标注的方法。包括如下步骤:(1)把一段视频分成若干部分,每部分包含一幅关键帧和若干幅非关键帧;(2)对于关键帧,要求用户输入提示信息,指定前景对象和背景对象中的一些关键部分,然后对关键帧进行标注;(3)对于非关键帧,根据关键帧上的标注结果,把前景部分的颜色分布和形状信息,以及背景部分的颜色部分作为先验知识,根据这些先验知识,对非关键帧进行标注。本发明把关键帧上的交互信息和前景形状传送到非关键帧上,综合考虑非关键帧上每个部分对于前景和背景分布的颜色相关性,相邻两个区域的颜色差异,以及形状信息来求解非关键帧的标注。结果表明,本发明能够解决前景物体边缘部分标注不准确的问题。

    一种基于视频流的人脸表情幻想方法

    公开(公告)号:CN100403338C

    公开(公告)日:2008-07-16

    申请号:CN200610053394.2

    申请日:2006-09-14

    申请人: 浙江大学

    发明人: 庄越挺 张剑 肖俊

    IPC分类号: G06T3/00 G06T5/00

    摘要: 本发明公开了一种基于视频流的人脸表情幻想技术用来根据一张输入的中性人脸表情图像合成相应的多种表情序列。算法步骤为:1)手工从输入人脸图像中选择人脸兴趣子区域;2)计算其在样本空间中的k近邻以及相应的m维特征坐标;3)用近邻的m维坐标和特征表示训练径向基函数;4)以输入图像的坐标作为径向基函数的输入得到对应的特征表示,进而逐帧合成人脸兴趣子区域的动态序列;5)将合成的动态序列逐帧移植到输入的中性人脸表情图像上得到最终表情效果。本发明提供的人脸表情幻想技术能够根据一幅图像快速产生丰富合理的多种动态表情序列,具有极大的创新性,并在人机交互、电影制作和游戏娱乐等方面有较高的应用价值。

    基于快速图像配准的视角变化条件下视频前景提取方法

    公开(公告)号:CN101216888A

    公开(公告)日:2008-07-09

    申请号:CN200810059124.1

    申请日:2008-01-14

    申请人: 浙江大学

    CPC分类号: G06K9/38

    摘要: 本发明公开了一种基于快速图像配准的视角变化条件下视频前景分割的方法。本方法利用一组不同视角下的训练背景图像进行Isomap流形学习获得背景模型。然后,对由于相机运动等原因而引起视角变化的视频,可以实时地进行前景分割,即:将其中每帧的前景和背景进行分割。前景分割过程首先通过视频帧和最接近的训练背景图像间的光流构造一幅和视频帧的视角完全相同的背景图像,然后通过背景减除来获得前景区域。为了解决光流计算的低效率问题,本方法使用一种基于流形的光流插值来避免在线阶段的光流计算,在背景建模阶段预先计算视角相似的背景图像之间的光流,在前景分割阶段,利用新视频帧在背景流形上的位置快速插值获得光流。获得了很高的效率。

    交互式书法字k近邻查询方法

    公开(公告)号:CN100401304C

    公开(公告)日:2008-07-09

    申请号:CN200610053409.5

    申请日:2006-09-14

    申请人: 浙江大学

    发明人: 庄越挺 吴飞 庄毅

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种交互式书法字k近邻查询方法。利用该方法可以实现书法字的基于语义的交互式索引和检索,即用户可以参与调整索引的过程,使查询精度进一步提高。在实施本方法的过程中,首先对书法字库中的每对书法字在一定阙值条件下求得距离,生成一个局部距离图,并对该图建立基于B+树的索引。当用户提交一个例子书法字后,系统根据要求检索出与该字相似的字,然后用户可以根据相关反馈动态选择与该字语义相同的字。这样系统会根据用户的反馈信息动态调整局部距离图,排除不相关的字,使得保持较高的查询精度。

    用于门户网站上,对多种资源仓库统一并行检索的方法

    公开(公告)号:CN100397401C

    公开(公告)日:2008-06-25

    申请号:CN200610053388.7

    申请日:2006-09-14

    申请人: 浙江大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种用于门户网站上,对多种资源仓库统一并行检索的方法。用户在门户网站上面,动态交互地选择想要检索的资源仓库;视图综合器会依据用户的动态选择,确定相应资源仓库的检索结果在浏览器页面中的呈现区域,视图综合器将按照多个资源仓库的检索结束先后,依次更新被检索资源仓库所对应的页面区域,而不会完全刷新整个浏览器页面。该交互方式的优点在于减少用户等待检索结果的时间,充分利用页面空间显示大量检索结果。该方法规定了资源仓库的统一接口,资源仓库既可以是以数据库形式存储的原始数据,也可以是利用索引技术对原始数据处理后得到的索引数据,实现了通过配置文件添加、删除资源仓库,这样设计使得系统的部署更加灵活。

    基于P300脑电电位的中文输入BCI系统

    公开(公告)号:CN101201696A

    公开(公告)日:2008-06-18

    申请号:CN200710164418.6

    申请日:2007-11-29

    申请人: 浙江大学

    IPC分类号: G06F3/01

    摘要: 本发明公开了一种基于P300脑电电位的中文输入BCI系统,包括:用于采集带P300成分的脑电信号并进行放大和数字化的脑电采集系统,用于将经脑电采集系统放大和数字化的脑电信号进行增强处理和P300成分检测的脑电信号分析模块,用于诱发使用者脑电信号并将脑电信号分析模块的检测结果转化为中文输入的用户界面模块,用于显示用户界面模块产生的中文输入的显示装置。本发明中文输入BCI系统可以为身体瘫痪且语言功能受损的严重残疾病患提供与他人进行交流的途径,并且对其外围功能加以延伸后可以让患者实现对计算机程序和电子机械装置的控制。这在医疗康复、医学生理实验、脑功能机制探索方面具有诸多价值。

    根据多视角视频流生成全景视频的方法

    公开(公告)号:CN101146231A

    公开(公告)日:2008-03-19

    申请号:CN200710069772.0

    申请日:2007-07-03

    申请人: 浙江大学

    IPC分类号: H04N9/09 G03B37/04 G03B37/00

    摘要: 本发明公开了一种根据多视角视频流生成全景视频的方法。包括如下步骤:1)采用多个摄像头对不同视角方向进行全方位覆盖的视频采集;2)将各个视频流中的同步帧都一一对应起来;3)通过摄像机标定的方法对各个视频流分别进行矫正;4)对一组同步的视频帧进行全景拼接,计算出各帧的拼接参数;5)将拼接参数应用到各视频流中的每一帧进行拼接,得到由全景帧组成的全景视频。本发明的有益效果是:比目前的利用凹面镜或凸透镜对光线会聚还原生成全景视频的方法更经济适用,并能避免画面扭曲失真、不适应于运动时拍摄等缺点。

    基于侧影和末端节点的视频人体三维运动恢复方法

    公开(公告)号:CN101075351A

    公开(公告)日:2007-11-21

    申请号:CN200610053405.7

    申请日:2006-09-14

    申请人: 浙江大学

    IPC分类号: G06T15/70

    摘要: 本发明公开了一种基于侧影和末端节点的视频人体三维运动恢复方法。它采用基于模型的方式,系统内部包含一个3维人体关节骨架模型,方法寻找能够和视频达到最佳符合的关节模型姿态序列。首先从视频中提取各帧的侧影;之后,在侧影上进行末端节点检测;之后,对每帧通过模拟退火算法寻找能够解释该帧侧影和末端节点位置的最佳姿态;最后,将每帧的姿态相连,经过后期处理后形成连贯的3维运动序列。本方法通过设计出一个快速的目标函数,减小了最优化算法的计算量;通过动态双手皮肤颜色建模,使得双手的检测更加精确;通过对视频的分段恢复和算法的自动重启动,解决了误差累积和传递问题,使得恢复过程更加鲁棒。

    三维人体运动数据关键帧提取方法

    公开(公告)号:CN1967525A

    公开(公告)日:2007-05-23

    申请号:CN200610053399.5

    申请日:2006-09-14

    申请人: 浙江大学

    IPC分类号: G06F17/30 G06T7/00

    摘要: 本发明公开了一种对人体运动数据自动提取关键帧的方法。在数据表示上采用人体四肢骨骼与中心骨骼夹角作为运动特征并以此来表征三维人体运动数据,然后根据骨骼夹角的运动轨迹确定运动时可能存在的“边界”姿势作为候选关键帧集合,最后采用分层曲线简化算法精选候关键帧获得最终关键帧集合。同时,本发明还提出一种自适应误差参数调整方法以满足不同压缩率要求。使用该方法对人体运动数据具有良好的关键帧提取、压缩效果,以及较强的运动概括能力,并在一定程度上保证了同类运动关键帧集合之间的一致性。