-
公开(公告)号:CN107204879B
公开(公告)日:2019-09-20
申请号:CN201710413817.5
申请日:2017-06-05
Applicant: 浙江大学
Abstract: 本发明公开了一种基于指数移动平均的分布式系统自适应故障检测方法,包含四个步骤:时序数据收集、心跳预测、输出诊断值以及故障判别。该故障检测方法可以用于分布式系统中的故障检测,及时发现系统故障隐患,降低系统宕机风险。本发明利用历史心跳序列,输出一个随时间动态累积的诊断值,根据系统初始化时设定的阈值,判断系统中节点是否故障。在计算心跳预测值时,基于指数移动平均计算各历史心跳消息的影响权值,使影响权值随时间的递增而指数递减,同时通过方差比降低突变历史心跳的影响权值。
-
公开(公告)号:CN109992777A
公开(公告)日:2019-07-09
申请号:CN201910232087.8
申请日:2019-03-26
Applicant: 浙江大学
IPC: G06F17/27 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种基于关键词的中医病情文本关键语义信息提取方法,包括以下步骤:(1)对中医病情文本进行分句、分词处理;(2)对分句、分词处理结果生成依存句法树;(3)初始化中医病情文本中的关键词,生成关键词队列;(4)基于依存句法树,对关键词队列中的任意词为起始点,在依存句法树中进行向上搜索和向下搜索,搜索得到的词语标记为关键语义信息。该方法以关键词作为提取关键语义信息的一个特征,通过依存句法树来获得最终结果。
-
公开(公告)号:CN107346335A
公开(公告)日:2017-11-14
申请号:CN201710509023.9
申请日:2017-06-28
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。
-
-
公开(公告)号:CN107346335B
公开(公告)日:2020-04-14
申请号:CN201710509023.9
申请日:2017-06-28
Applicant: 浙江大学
IPC: G06F16/95
Abstract: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。
-
公开(公告)号:CN108647203A
公开(公告)日:2018-10-12
申请号:CN201810359667.9
申请日:2018-04-20
Applicant: 浙江大学
Abstract: 本发明公开了一种中医病情文本相似度的计算方法,包括:基于规则和统计的短语识别,得到文本块;文本块划分,得到文本语义分块;计算文本语义分块的权值;计算文本语义分块向量;组合文本语义分块特征,得到病情文档特征;根据病情文档特征,计算文本相似度。本发明以文本语义分块为最小粒度来表示病情文本特征,将病情文本按照所描述的病位划分为文本语义分块,并赋予各个文本语义分块不同的权重来区分主次症状,通过计算文本语义分块向量夹角的余弦值找出两段病情文本的相似症状,最后按照权重进行加权得出两段病情文本的相似度,克服了传统文本相似度计算方法或丢失语义信息,或不能突出病因主次的缺点。
-
公开(公告)号:CN109977406A
公开(公告)日:2019-07-05
申请号:CN201910232088.2
申请日:2019-03-26
Applicant: 浙江大学
IPC: G06F17/27 , G06F16/335
Abstract: 本发明公开了一种基于病位的中医病情文本关键词提取方法,包括以下步骤:对中医病情文本分词,并基于中医病情文本分词结果生成中医病情词典;计算中医病情词典中每个词语的IDF值和TF值;根据词语的IDF值和TF值、以及词语中包含病位情况,提升词语的重要度;根据每个词语的重要度,选择排在前m位的m个词语为文本的关键词。本发明虑到中医病情文本中的文本关键词大部分是病位词及病症词,以病位为基础,通过对TF‑IDF的值进行病位加权,进而提升了中医病情文本关键词提取的准确性。
-
-
公开(公告)号:CN107204879A
公开(公告)日:2017-09-26
申请号:CN201710413817.5
申请日:2017-06-05
Applicant: 浙江大学
Abstract: 本发明公开了一种基于指数移动平均的分布式系统自适应故障检测方法,包含四个步骤:时序数据收集、心跳预测、输出诊断值以及故障判别。该故障检测方法可以用于分布式系统中的故障检测,及时发现系统故障隐患,降低系统宕机风险。本发明利用历史心跳序列,输出一个随时间动态累积的诊断值,根据系统初始化时设定的阈值,判断系统中节点是否故障。在计算心跳预测值时,基于指数移动平均计算各历史心跳消息的影响权值,使影响权值随时间的递增而指数递减,同时通过方差比降低突变历史心跳的影响权值。
-
-
-
-
-
-
-
-