-
公开(公告)号:CN106649265A
公开(公告)日:2017-05-10
申请号:CN201611053116.7
申请日:2016-11-25
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
CPC classification number: G06F17/277 , G06F17/2705
Abstract: 本发明涉及一种基于图的最大紧密度划分的复合短语无监督识别方法。该方法包括以下步骤:1)采用词性标注工具对输入语料进行词性标注和分词;2)将分词后的输入序列映射到有序的图结构中,将语义紧密度高的词语划分到一个分段内,并使得整个图的紧密度之和最大;3)通过验证各分段是否包含特征词,实现候选复合短语的最终识别。本发明能够自动识别科技类复合短语,省时省力,相比于传统的有监督方法,不需要大量标注语料,便于在线部署应用,是一种高效的科技类复合短语识别方法。
-
公开(公告)号:CN106569997A
公开(公告)日:2017-04-19
申请号:CN201610912585.3
申请日:2016-10-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
Abstract: 本发明公开了一种基于隐式马尔科夫模型的科技类复合短语识别方法。本方法为:1)采用词性标注工具对输入语料进行词性标注和分词;2)采用隐式马尔科夫模型对步骤1)处理后的语料进行隐状态预测,输出一状态序列;然后对该状态序列进行切分,得到一复合短语集合;3)判断步骤2)得到的复合短语中是否包含特征词集合中的特征词,将含有设定特征词的复合短语作为识别的科技类复合短语结果。本发明缓解了角色标注的巨大人工成本代价。
-
公开(公告)号:CN103763151B
公开(公告)日:2017-01-18
申请号:CN201410005380.8
申请日:2014-01-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种通信网络模拟数据生成方法,包括获取一个通讯网络预定量的真实数据,并按预定规则划分为一系列网络快照,记为训练集G;依据活跃度等级对训练集G进行训练,得到通信网络的各个分布参数,其中活跃度等级为节点作为发信者在训练集的各快照中出现的频度;根据通信网络的分布参数随机生成一系列模拟快照G'n,构成所需的通信网络模拟数据;本发明通过引入活跃度这一隐含属性,提出一种线性的通信网络生成算法,利用已有的通信网络数据来快速生成大量模拟通信网络数据,同时能保证生成的模拟网络既能体现通信网络的宏观性质又可保留个体的通信行为特征。
-
公开(公告)号:CN103744994B
公开(公告)日:2016-11-16
申请号:CN201410030664.2
申请日:2014-01-22
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种面向通信网络的用户行为模式挖掘方法及系统,包括:获取一系列网络快照,根据活跃度确定研究对象,确定M个与研究对象相关的相关特征,并根据相关特征计算每个网络快照的特征矩阵,进而计算基准特征矩阵;对基准特征矩阵和每个网络快照的特征矩阵做标准化处理,分解标准化基准特征矩阵得到模元矩阵和系数矩阵;利用每个网络快照的标准化特征矩阵和模元矩阵计算每个网络快照中所有研究对象的行为模式矩阵,即本发明采用“相关特征‑模元‑行为模式”的三元对应关系表示用户行为模式,为用户的通信行为模式提供统一的表示方法,在用户量大的情况下用户间的模式对比清晰明了,有助于方便正确地检测数据集中用户行为模式的变化情况。
-
公开(公告)号:CN103336865B
公开(公告)日:2016-09-07
申请号:CN201310258432.8
申请日:2013-06-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/50
Abstract: 本发明涉及一种动态通信网络构建方法及装置。动态通信网络构建方法,包括:步骤一,获取通信网络在当前时间段t内的网络快照gt和通信网络图Gt‑1,Gt‑1由前t‑1个时间段的网络快照叠加得到,G1=g1,t为自然数,且t大于1;步骤二,根据步骤一获取的网络快照gt和通信网络图Gt‑1以及可变参数β构建通信网络图Gt,Gt=βGt‑1+(1‑β)gt,其中,β=Sim(Gt‑1,gt),β大于或等于0且小于或等于1,函数Sim用于计算两个图的相似度,函数Sim的返回值随两个图的变化剧烈程度增大而减小。本发明的动态通信网络构建方法及装置使得使用本发明构建的通信网络图精确度更高,更接近真实情况。
-
公开(公告)号:CN103336865A
公开(公告)日:2013-10-02
申请号:CN201310258432.8
申请日:2013-06-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/50
Abstract: 本发明涉及一种动态通信网络构建方法及装置。动态通信网络构建方法,包括:步骤一,获取通信网络在当前时间段t内的网络快照gt和通信网络图Gt-1,Gt-1由前t-1个时间段的网络快照叠加得到,G1=g1,t为自然数,且t大于1;步骤二,根据步骤一获取的网络快照gt和通信网络图Gt-1以及可变参数β构建通信网络图Gt,Gt=βGt-1+(1-β)gt,其中,β=Sim(Gt-1,gt),β大于或等于0且小于或等于1,函数Sim用于计算两个图的相似度,函数Sim的返回值随两个图的变化剧烈程度增大而减小。本发明的动态通信网络构建方法及装置使得使用本发明构建的通信网络图精确度更高,更接近真实情况。
-
-
-
-
-