- 专利标题: 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统
-
申请号: CN201910343325.2申请日: 2019-04-26
-
公开(公告)号: CN110188098B公开(公告)日: 2021-02-19
- 发明人: 付聪 , 张永辉 , 蔡登
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州天勤知识产权代理有限公司
- 代理商 胡红娟
- 主分类号: G06F16/22
- IPC分类号: G06F16/22 ; G06F16/26 ; G06F16/28
摘要:
本发明公开了一种基于双层锚点图投影优化的高维向量数据可视化方法及系统,其中,具体方法包括:(1)对原始高维向量数据集D进行K‑means聚类,将得到的聚类中心作为锚点集合A;(2)根据锚点集合A建立高维向量数据的倒排索引;(3)使用倒排索引建立数据集D的近似kD近邻图GD;(4)针对数据集D中的每个点d,暴力搜索距离d最近的c个锚点,并将这c个锚点作为d的邻居更新到近邻图GD;(5)在锚点集合A上用暴力检索方式构建kA近邻图GA;(6)基于GD和GA所表示成的高维空间数据结构信息,使用双层投影优化算法产生低维空间可视化投影。利用本发明,可以将高维空间中的全局宏观和局部微观结构信息一并保留,得到高质量的布局信息。
公开/授权文献
- CN110188098A 一种基于双层锚点图投影优化的高维向量数据可视化方法及系统 公开/授权日:2019-08-30