一种多维参数识别方法及装置

    公开(公告)号:CN107609582B

    公开(公告)日:2023-10-10

    申请号:CN201710772738.3

    申请日:2017-08-31

    IPC分类号: G06F18/214 G06F18/24

    摘要: 本发明公开了一种多维参数识别方法及装置,所述识别方法包括:采集多个训练样本,组成训练样本集,每个训练样本包括多种过程参数,每种过程参数具有相应的属性参数和类别,其中,所述属性参数和类别的组合有多种;根据所述训练样本集中的类别,获取所述训练样本集的分布传递信息值;根据所述分布传递信息值,获取每种过程参数的信息增益;选择信息增益最大的过程参数作为分裂节点,建立决策树;根据决策树,对新数据进行类别识别。本发明以信息增益作为决策树模型的建立依据,提高模型的准确度,有效、精确识别数据类型,为智能参数反馈提供可靠的依据。

    一种多维参数识别方法及装置
    3.
    发明公开

    公开(公告)号:CN107609582A

    公开(公告)日:2018-01-19

    申请号:CN201710772738.3

    申请日:2017-08-31

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种多维参数识别方法及装置,所述识别方法包括:采集多个训练样本,组成训练样本集,每个训练样本包括多种过程参数,每种过程参数具有相应的属性参数和类别,其中,所述属性参数和类别的组合有多种;根据所述训练样本集中的类别,获取所述训练样本集的分布传递信息值;根据所述分布传递信息值,获取每种过程参数的信息增益;选择信息增益最大的过程参数作为分裂节点,建立决策树;根据决策树,对新数据进行类别识别。本发明以信息增益作为决策树模型的建立依据,提高模型的准确度,有效、精确识别数据类型,为智能参数反馈提供可靠的依据。

    一种基于聚类的优化粒子群BP网络预测方法和系统

    公开(公告)号:CN110020712A

    公开(公告)日:2019-07-16

    申请号:CN201910230781.6

    申请日:2019-03-26

    申请人: 浙江大学

    摘要: 本发明公开了一种基于聚类的优化粒子群BP网络预测方法和系统,包括:建立数据库实时存储监控器测量所得的数据;对原始数据预处理后通过聚类将相似的数据划分为一类,提高预测模型的准确性;通过优化的粒子群算法对BP网络初始权重和阈值进行赋值,相比于通过随机数对权重和阈值的初始化,本发明能够使得BP网络在避免陷入局部最优的基础上同时提升收敛速度;通过选取Sigmoid函数作为激活函数,并采用反向传播算法对BP网络权重和阈值进行更新,训练得到最终模型,输出预测结果。本发明克服了传统的回归分类等预测模型存在对非线性数据预测不准确,预测精度不高的问题,有效地提高了预测结果的准确性。

    一种针对中医药症状句子的中文分词方法

    公开(公告)号:CN107357780B

    公开(公告)日:2019-12-10

    申请号:CN201710508975.9

    申请日:2017-06-28

    申请人: 浙江大学

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种针对中医药症状句子的中文分词方法,该分词方法首先通过分割词库、频繁词库做预筛选,然后利用正向条件概率和逆向条件概率做进一步分析,对于依旧不能确定的情况,再综合相对位置给出最后的结果。本发明分词方法有效地针对了中医药症状领域的特殊性,克服了传统中文分词方法不适用于中医药领域的缺点,在分词的准确率和召回率上均有较大的提高。

    一种基于频域的多模型融合预测方法和系统

    公开(公告)号:CN109992608A

    公开(公告)日:2019-07-09

    申请号:CN201910230755.3

    申请日:2019-03-26

    申请人: 浙江大学

    IPC分类号: G06F16/2458 G06F17/14

    摘要: 本发明公开了一种基于频域的多模型融合预测方法和系统,包括:建立数据库实时存储监控器测量所得的数据;对原始时序数据预处理,包括异常值检测及缺失值处理;对干净的时序数据通过小波变换转为频域数据;建立循环神经网络及可加性回归模型对频域系数进行预测;选取最优权重和阈值得到最佳预测结果。本发明通过对预处理之后的时序数据变换到频域上进行分析处理,并融合不同模型得到最佳预测结果,克服了传统时序预测模型预测周期短,预测精度低等缺点。

    一种基于聚类的优化粒子群BP网络预测方法和系统

    公开(公告)号:CN110020712B

    公开(公告)日:2021-01-26

    申请号:CN201910230781.6

    申请日:2019-03-26

    申请人: 浙江大学

    摘要: 本发明公开了一种基于聚类的优化粒子群BP网络预测方法和系统,包括:建立数据库实时存储监控器测量所得的数据;对原始数据预处理后通过聚类将相似的数据划分为一类,提高预测模型的准确性;通过优化的粒子群算法对BP网络初始权重和阈值进行赋值,相比于通过随机数对权重和阈值的初始化,本发明能够使得BP网络在避免陷入局部最优的基础上同时提升收敛速度;通过选取Sigmoid函数作为激活函数,并采用反向传播算法对BP网络权重和阈值进行更新,训练得到最终模型,输出预测结果。本发明克服了传统的回归分类等预测模型存在对非线性数据预测不准确,预测精度不高的问题,有效地提高了预测结果的准确性。

    一种基于组合特征的网页主题块识别方法

    公开(公告)号:CN107346335B

    公开(公告)日:2020-04-14

    申请号:CN201710509023.9

    申请日:2017-06-28

    申请人: 浙江大学

    IPC分类号: G06F16/95

    摘要: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。

    一种中医病情文本相似度的计算方法

    公开(公告)号:CN108647203A

    公开(公告)日:2018-10-12

    申请号:CN201810359667.9

    申请日:2018-04-20

    申请人: 浙江大学

    IPC分类号: G06F17/27 G16H10/00

    摘要: 本发明公开了一种中医病情文本相似度的计算方法,包括:基于规则和统计的短语识别,得到文本块;文本块划分,得到文本语义分块;计算文本语义分块的权值;计算文本语义分块向量;组合文本语义分块特征,得到病情文档特征;根据病情文档特征,计算文本相似度。本发明以文本语义分块为最小粒度来表示病情文本特征,将病情文本按照所描述的病位划分为文本语义分块,并赋予各个文本语义分块不同的权重来区分主次症状,通过计算文本语义分块向量夹角的余弦值找出两段病情文本的相似症状,最后按照权重进行加权得出两段病情文本的相似度,克服了传统文本相似度计算方法或丢失语义信息,或不能突出病因主次的缺点。