一种针对中医药症状句子的中文分词方法

    公开(公告)号:CN107357780A

    公开(公告)日:2017-11-17

    申请号:CN201710508975.9

    申请日:2017-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对中医药症状句子的中文分词方法,该分词方法首先通过分割词库、频繁词库做预筛选,然后利用正向条件概率和逆向条件概率做进一步分析,对于依旧不能确定的情况,再综合相对位置给出最后的结果。本发明分词方法有效地针对了中医药症状领域的特殊性,克服了传统中文分词方法不适用于中医药领域的缺点,在分词的准确率和召回率上均有较大的提高。

    一种优化的相变存储器体系结构

    公开(公告)号:CN105740090A

    公开(公告)日:2016-07-06

    申请号:CN201610055083.3

    申请日:2016-01-27

    Applicant: 浙江大学

    Inventor: 付钊 姜晓红

    CPC classification number: G06F11/1064

    Abstract: 本发明公开了一种优化的相变存储器体系结构,每个PCM行由数据域和校验域组成,校验域包括分组信息域和ECC校验码域,数据域采用单层PCM单元存储,而数据校验域则采用双层PCM单元存储。本发明采用动态分组的方式,将数据域依据易损位元位置动态划分为N组,使得易损位均匀分布在每个组中,每个组至多一个易损位;同时本发明使用分组的ECC校验,通过使用双层PCM单元存储校验位,增加了校验域长度,提高了PCM行数据出错的修正能力,能够修正更多的位元错误;在增强容错能力的同时,可以提高读取电压减少读延迟,大大提高PCM的读取速度。

    一种基于组合特征的网页主题块识别方法

    公开(公告)号:CN107346335B

    公开(公告)日:2020-04-14

    申请号:CN201710509023.9

    申请日:2017-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。

    一种中医病情文本相似度的计算方法

    公开(公告)号:CN108647203A

    公开(公告)日:2018-10-12

    申请号:CN201810359667.9

    申请日:2018-04-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种中医病情文本相似度的计算方法,包括:基于规则和统计的短语识别,得到文本块;文本块划分,得到文本语义分块;计算文本语义分块的权值;计算文本语义分块向量;组合文本语义分块特征,得到病情文档特征;根据病情文档特征,计算文本相似度。本发明以文本语义分块为最小粒度来表示病情文本特征,将病情文本按照所描述的病位划分为文本语义分块,并赋予各个文本语义分块不同的权重来区分主次症状,通过计算文本语义分块向量夹角的余弦值找出两段病情文本的相似症状,最后按照权重进行加权得出两段病情文本的相似度,克服了传统文本相似度计算方法或丢失语义信息,或不能突出病因主次的缺点。

    一种中医病情文本相似度的计算方法

    公开(公告)号:CN108647203B

    公开(公告)日:2020-07-07

    申请号:CN201810359667.9

    申请日:2018-04-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种中医病情文本相似度的计算方法,包括:基于规则和统计的短语识别,得到文本块;文本块划分,得到文本语义分块;计算文本语义分块的权值;计算文本语义分块向量;组合文本语义分块特征,得到病情文档特征;根据病情文档特征,计算文本相似度。本发明以文本语义分块为最小粒度来表示病情文本特征,将病情文本按照所描述的病位划分为文本语义分块,并赋予各个文本语义分块不同的权重来区分主次症状,通过计算文本语义分块向量夹角的余弦值找出两段病情文本的相似症状,最后按照权重进行加权得出两段病情文本的相似度,克服了传统文本相似度计算方法或丢失语义信息,或不能突出病因主次的缺点。

    一种基于组合特征的网页主题块识别方法

    公开(公告)号:CN107346335A

    公开(公告)日:2017-11-14

    申请号:CN201710509023.9

    申请日:2017-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于组合特征的网页主题块识别方法,其对网页进行分块后,首先利用支持向量机根据网页块的视觉特征预测网页块是否为主题块,然后利用改进后的BM25算法计算每个网页块内容与主题的相关性权重值,将权重值与寻找的最佳阈值进行比较从而判断网页块是否为主题块,最后将这两种方式相结合,综合利用网页块的视觉特征和文本特征来判断其是否为主题块。这样在识别主题块时,同时考虑了其结构和内容,避免了采用单个特征可能存在的偏差,可以更加准确的识别出网页中与主题相关的内容。

    一种云基础设施服务的计费方法

    公开(公告)号:CN106257524A

    公开(公告)日:2016-12-28

    申请号:CN201610318805.X

    申请日:2016-05-13

    Applicant: 浙江大学

    CPC classification number: G06Q30/0645

    Abstract: 本发明涉及云计算领域,特别涉及一种云基础设施服务的计费方法,包括以下步骤:S1、云基础设施服务平台指定虚拟机镜像类型、资源计费维度、资源计费粒度、最小计费时间单位和资源粒度价格,并构造资源总量价格模型;S2、云基础设施服务平台接收用户的虚拟机申请后加入到虚拟机信息表,计算虚拟机运行价格;S3、计费引擎获取用户申请的虚拟机的配置信息,从计费策略池选取对应的计费策略对用户虚拟机进行计费,计费策略包括预留租赁和按需付费两种。本发明根据云服务用户对基础设施资源的需求差异制定相应的计费策略,能使资源租赁计费方法更加灵活,同时保证云服务厂商的合理利润。

    一种增量式的在线特征提取分析方法及系统

    公开(公告)号:CN105843891A

    公开(公告)日:2016-08-10

    申请号:CN201610165185.0

    申请日:2016-03-22

    Applicant: 浙江大学

    CPC classification number: G06F16/284 G06F16/2465

    Abstract: 本发明公开了一种增量式的在线特征提取分析方法及系统,该方法和系统通过将工业控制时序数据存储到数据库,原始的数据经过数据预处理得到干净的数据,特征提取模块提取特征数据存储到特征数据表,增量触发器实时监控数据库系统的原始数据量,超过触发阈值,触发特征提取模块实现增量读取原始数据,并提取对应的特征,存储到特征数据表中。本发明优势在于提出了一个增量式特征提取分析的框架,增加增量触发监督程序,实现了对数据库系统的监控和特征的增量提取,最终实现了特征的实时在线提取和数据的在线分析,效率高,可扩展性好。

    一种针对中医药症状句子的中文分词方法

    公开(公告)号:CN107357780B

    公开(公告)日:2019-12-10

    申请号:CN201710508975.9

    申请日:2017-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种针对中医药症状句子的中文分词方法,该分词方法首先通过分割词库、频繁词库做预筛选,然后利用正向条件概率和逆向条件概率做进一步分析,对于依旧不能确定的情况,再综合相对位置给出最后的结果。本发明分词方法有效地针对了中医药症状领域的特殊性,克服了传统中文分词方法不适用于中医药领域的缺点,在分词的准确率和召回率上均有较大的提高。

    一种优化的相变存储器体系结构

    公开(公告)号:CN105740090B

    公开(公告)日:2018-11-23

    申请号:CN201610055083.3

    申请日:2016-01-27

    Applicant: 浙江大学

    Inventor: 付钊 姜晓红

    Abstract: 本发明公开了一种优化的相变存储器体系结构,每个PCM行由数据域和校验域组成,校验域包括分组信息域和ECC校验码域,数据域采用单层PCM单元存储,而数据校验域则采用双层PCM单元存储。本发明采用动态分组的方式,将数据域依据易损位元位置动态划分为N组,使得易损位均匀分布在每个组中,每个组至多一个易损位;同时本发明使用分组的ECC校验,通过使用双层PCM单元存储校验位,增加了校验域长度,提高了PCM行数据出错的修正能力,能够修正更多的位元错误;在增强容错能力的同时,可以提高读取电压减少读延迟,大大提高PCM的读取速度。

Patent Agency Ranking