一种中医病情文本相似度的计算方法

    公开(公告)号:CN108647203B

    公开(公告)日:2020-07-07

    申请号:CN201810359667.9

    申请日:2018-04-20

    申请人: 浙江大学

    摘要: 本发明公开了一种中医病情文本相似度的计算方法,包括:基于规则和统计的短语识别,得到文本块;文本块划分,得到文本语义分块;计算文本语义分块的权值;计算文本语义分块向量;组合文本语义分块特征,得到病情文档特征;根据病情文档特征,计算文本相似度。本发明以文本语义分块为最小粒度来表示病情文本特征,将病情文本按照所描述的病位划分为文本语义分块,并赋予各个文本语义分块不同的权重来区分主次症状,通过计算文本语义分块向量夹角的余弦值找出两段病情文本的相似症状,最后按照权重进行加权得出两段病情文本的相似度,克服了传统文本相似度计算方法或丢失语义信息,或不能突出病因主次的缺点。

    一种基于指数移动平均的分布式系统自适应故障检测方法

    公开(公告)号:CN107204879B

    公开(公告)日:2019-09-20

    申请号:CN201710413817.5

    申请日:2017-06-05

    申请人: 浙江大学

    IPC分类号: H04L12/24 H04L12/26

    摘要: 本发明公开了一种基于指数移动平均的分布式系统自适应故障检测方法,包含四个步骤:时序数据收集、心跳预测、输出诊断值以及故障判别。该故障检测方法可以用于分布式系统中的故障检测,及时发现系统故障隐患,降低系统宕机风险。本发明利用历史心跳序列,输出一个随时间动态累积的诊断值,根据系统初始化时设定的阈值,判断系统中节点是否故障。在计算心跳预测值时,基于指数移动平均计算各历史心跳消息的影响权值,使影响权值随时间的递增而指数递减,同时通过方差比降低突变历史心跳的影响权值。

    一种基于组合特征的网页主题块识别方法

    公开(公告)号:CN107346335A

    公开(公告)日:2017-11-14

    申请号:CN201710509023.9

    申请日:2017-06-28

    申请人: 浙江大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。

    一种基于频域的多模型融合预测方法和系统

    公开(公告)号:CN109992608B

    公开(公告)日:2022-03-04

    申请号:CN201910230755.3

    申请日:2019-03-26

    申请人: 浙江大学

    IPC分类号: G06F16/2458 G06F17/14

    摘要: 本发明公开了一种基于频域的多模型融合预测方法和系统,包括:建立数据库实时存储监控器测量所得的数据;对原始时序数据预处理,包括异常值检测及缺失值处理;对干净的时序数据通过小波变换转为频域数据;建立循环神经网络及可加性回归模型对频域系数进行预测;选取最优权重和阈值得到最佳预测结果。本发明通过对预处理之后的时序数据变换到频域上进行分析处理,并融合不同模型得到最佳预测结果,克服了传统时序预测模型预测周期短,预测精度低等缺点。

    一种针对中医药症状句子的中文分词方法

    公开(公告)号:CN107357780A

    公开(公告)日:2017-11-17

    申请号:CN201710508975.9

    申请日:2017-06-28

    申请人: 浙江大学

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种针对中医药症状句子的中文分词方法,该分词方法首先通过分割词库、频繁词库做预筛选,然后利用正向条件概率和逆向条件概率做进一步分析,对于依旧不能确定的情况,再综合相对位置给出最后的结果。本发明分词方法有效地针对了中医药症状领域的特殊性,克服了传统中文分词方法不适用于中医药领域的缺点,在分词的准确率和召回率上均有较大的提高。

    一种基于指数移动平均的分布式系统自适应故障检测方法

    公开(公告)号:CN107204879A

    公开(公告)日:2017-09-26

    申请号:CN201710413817.5

    申请日:2017-06-05

    申请人: 浙江大学

    IPC分类号: H04L12/24 H04L12/26

    摘要: 本发明公开了一种基于指数移动平均的分布式系统自适应故障检测方法,包含四个步骤:时序数据收集、心跳预测、输出诊断值以及故障判别。该故障检测方法可以用于分布式系统中的故障检测,及时发现系统故障隐患,降低系统宕机风险。本发明利用历史心跳序列,输出一个随时间动态累积的诊断值,根据系统初始化时设定的阈值,判断系统中节点是否故障。在计算心跳预测值时,基于指数移动平均计算各历史心跳消息的影响权值,使影响权值随时间的递增而指数递减,同时通过方差比降低突变历史心跳的影响权值。