Invention Publication
- Patent Title: 一种基于归一化最小生成树聚类的离群点检测方法
-
Application No.: CN202110046982.8Application Date: 2021-01-14
-
Publication No.: CN112948732APublication Date: 2021-06-11
- Inventor: 李佳 , 王晓春
- Applicant: 西安交通大学
- Applicant Address: 陕西省西安市咸宁西路28号
- Assignee: 西安交通大学
- Current Assignee: 西安交通大学
- Current Assignee Address: 陕西省西安市咸宁西路28号
- Agency: 西安通大专利代理有限责任公司
- Agent 贺小停
- Main IPC: G06F16/958
- IPC: G06F16/958 ; G06K9/62

Abstract:
本发明公开了一种基于归一化最小生成树聚类的离群点检测方法,分析网页内容数据集,判断其中的内容是文本数据还是非文本数据,先计算一个归一化的最小生成树,然后选择网页文本数据中的任意一个点作为构造树的初始点加入归一化最小生成树中,计算剩下的所有点到树中点的归一化距离作为两点组成的边的权重,选择最小权重的边,将其两端点加入到树中,循环计算已经加入树中的点到树中点的最小归一化距离,得到一个最小生成树,然后根据簇中点数是否大于簇中最大点数对簇进行切割,将所有边的权重按从大到小的顺序排序,然后切前k‑1条最长边,得到k个簇,然后判断每个簇中的点是否是离群点。本发明能够较为准确的检测出离群点。
Public/Granted literature
- CN112948732B 一种基于归一化最小生成树聚类的离群点检测方法 Public/Granted day:2023-08-22
Information query