-
公开(公告)号:CN112907380A
公开(公告)日:2021-06-04
申请号:CN202110317928.2
申请日:2021-03-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种用于金融市场监管的流动性评价方法,包括:步骤L1,基于获取的交易记录建立交易网络有向图;所述交易记录包括卖方、买方、交易量、交易次数;所述交易网络有向图中,节点代表交易者,边由卖方指向买方,边上的权重为交易量;步骤L2,对所述交易网络有向图网络做k‑core分解,将所述交易网络有向图按层划分;步骤L3,计算每两层之间的流动性指标;步骤L4,基于层间的所述流动性指标,生成层间流动性分布图。
-
公开(公告)号:CN112287273A
公开(公告)日:2021-01-29
申请号:CN202011161426.7
申请日:2020-10-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种网站列表页面的分类方法,所述网站系基于超文本标记语言(HTML),方法包括:步骤100,获取网站页面集合,页面归属于同一网站;步骤200,提取每一网站页面的文档对象模型(Document Object Model,DOM)的树结构特征和页面文本特征,分别构成DOM树结构特征空间和页面文本特征空间;步骤300,在DOM树结构特征空间和页面文本特征空间针对DOM树结构特征和页面文本特征分别进行聚类,分别得到结构类簇和文本类簇;步骤400,根据网站页面的网址链接(URL),在结构类簇与文本类簇之间进行映射,当映射出现多对一的情况,则选择最大相交的结构类簇或者文本类簇,并找到所述最大相交的结构类簇或者文本类簇在网站中的最近公共父节点,该公共父节点即为列表页面。
-
公开(公告)号:CN111914152A
公开(公告)日:2020-11-10
申请号:CN202010615515.8
申请日:2020-06-30
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9532 , G06F16/33 , G06F16/35
Abstract: 本发明提出一种网络事件预警方法及系统,包括:针对现有网络事件预警技术在子指标的计算、指标权重的赋值、预警效果的评价方面缺乏足够客观性,进而影响预警准确率的问题,本发明提出一种网络事件预警方法及系统。在计算子指标方面,本发明充分考虑消息之间的相互影响,利用物理学中的安培定律,让预警结果尽可能地反应整个事件的走向,提升客观性,提高预警准确率。在通过子指标逐级向上计算父指标方面,本发明利用物理学中场的概念来分析指标之间的关系,并借用场的度量方法为子指标赋权重,不需要专家参与,提升赋值过程的客观性,提高预警准确率。在网络事件预警评价方面,本发明借鉴异常检测思想提出客观的预警评价方法,提高评价的准确率。
-
公开(公告)号:CN104636466B
公开(公告)日:2020-07-31
申请号:CN201510071993.6
申请日:2015-02-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向开放网页的实体属性抽取方法和系统。其中,所述方法包括:提取开放网页的文本,从中获得目标实体的候选文本集合;以及,根据目标实体属性在训练文本集合中出现的频率,选择基于规则的方式或者基于统计的方式从所述候选文本集合中抽取目标实体属性的值。本发明能够提高开放网页实体属性抽取的准确率和召回率,并且不依赖于网页结构,能够适应开放网页类型的变化。
-
公开(公告)号:CN110990059A
公开(公告)日:2020-04-10
申请号:CN201911191154.2
申请日:2019-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种用于倾斜数据的流式计算引擎运行方法及系统,包括:获取包含倾斜数据的用户作业,并将该用户作业转换为表示该用户作业的有向无环图,根据该有向无环图中算子的业务处理逻辑,将该有向无环图中节点划分为有状态算子和无状态算子;将全部状态算子包装为有状态任务后输入有状态数据流,将全部无状态算子包装为无状态任务后输入无状态数据流;将该无状态数据流中无状态任务复制发送至任意计算节点,得到无状态处理结果;将该有状态数据流中有状态任务转换为包含键和值的数据记录,将包含相同键的数据记录分配至相同计算节点,得到有状态处理结果,集合该无状态处理结果和有状态处理结果作为该用户作业的运行结果。
-
公开(公告)号:CN106648934B
公开(公告)日:2019-12-03
申请号:CN201611228895.X
申请日:2016-12-27
Applicant: 中国科学院计算技术研究所 , 中科天玑数据科技股份有限公司
Abstract: 本发明公开了一种Impala与HBase之间的高效数据传输方法及系统。该方法包括:步骤1,将Impala发出的查询语句编译为查询指令,该查询指令的数量与HBase的Region的数量相同;步骤2,每个该查询指令对应查询该HBase的一个Region,所有该查询指令并行对该HBase进行查询,所获得的查询结果并行传输至一缓冲区;步骤3,以socket的方式,将该缓冲区中存储的数据传输至Impala。本发明具有较高的传输性能,且通过采用以socket传输二进制数据的方式,使得本发明在数据传输层,没有序列化以及反序列化的开销,不存在性能瓶颈,使得传输性能比JNI的传输方式更加高效。
-
公开(公告)号:CN106844416B
公开(公告)日:2019-11-29
申请号:CN201611024146.5
申请日:2016-11-17
Applicant: 中国科学院计算技术研究所
IPC: G06F16/332 , G06F17/27
Abstract: 本发明提供一种子话题挖掘方法,包括:1)对语料库中每篇文档的每个词语的主题值进行初始化;2)基于当前的各篇文档的各个词语的主题值,对于每篇文章中的每个词语,分别计算该词语来自各个子话题的概率以及计算该词语来自背景模块的概率,然后基于所计算出的概率,利用吉布斯采样算法重新为每篇文章中的每个词语分配主题值;其中,词语来自背景模块的概率根据预先统计的背景模块中的词语分布向量计算,所述背景模块中的词语分布向量在迭代过程中始终恒定;3)如果满足停止迭代的条件则根据当前的的主题值信息得出LDA子话题,如果否,则回到步骤2)。本发明能够显著地提升针对专题文章集合的话题挖掘效果。
-
公开(公告)号:CN110502742A
公开(公告)日:2019-11-26
申请号:CN201910625736.0
申请日:2019-07-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种复杂实体抽取方法,用于迭层膨胀卷积神经网络,该神经网络包括字级别迭层膨胀卷积神经网络层和词级别迭层膨胀卷积神经网络层,该方法包括:语料生成步骤,用于构建实体语料集,以采集语料,并对该语料进行自定义格式标注,形成训练集、测试集和/或验证集;字级别向量生成步骤,用于对该语料进行预训练,生成字向量,并将该字向量输入该字级别迭层膨胀卷积神经网络层,得到字级别向量;自定义特征提取步骤,用于从自由文本中提取所述自定义格式标注的特征;实体抽取步骤,将所述字级别向量进行拼接后,与所述词级别特征输入该词级别迭层膨胀卷积神经网络层,对所述自由文本进行复杂实体的抽取。该方法提高了实体抽取的精度和效率。
-
公开(公告)号:CN110389953A
公开(公告)日:2019-10-29
申请号:CN201910508926.4
申请日:2019-06-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/22
Abstract: 本发明涉及一种基于压缩图的数据存储方法、系统和存储介质,该方法包括:步骤100,生成点表逻辑定义,根据该逻辑定义构建点表,并向该点集中插入数据;步骤200,生成边表逻辑定义,根据该逻辑定义构建边表,从所述点表中选择与该边表相关联的点表,并向所述边表中插入数据;步骤300,设置和执行压缩图定义命令,生成所述压缩图的建图逻辑,设置函数获取与所述压缩图定义关联的所述边表,形成边集聚合组,并生成与所述压缩图定义关联的所述点表的代理结构;步骤400,设置和执行压缩图重置命令,根据所述压缩图的建图逻辑构建所述压缩图。本方法降低了多次建图与建多类图的开销,增加了图构建的灵活性与表示性,减少了重复建图的排序工作量。
-
公开(公告)号:CN110287378A
公开(公告)日:2019-09-27
申请号:CN201910441015.4
申请日:2019-05-24
Applicant: 中国科学院计算技术研究所
IPC: G06F16/901 , G06F16/2458
Abstract: 本发明提出一种基于动态代码生成的图计算方法及系统,包括:根据建图请求,构造包含图操作原语的中间图结构,并将中间图结构与图名关联后存入中间图缓存器;根据图算法请求,生成由外部代码字节码构成的图算法结构,发送至图算法缓存器;以执行请求检索中间图缓存器和图算法缓存器,得到待执行中间图结构、待执行图算法结构与参数列表组成的三元组,并在本地代码缓存器中检索三元组,得到本地代码缓存器中的执行对象,以执行得到结果。本发明在本地代码空间中注入生成代码,消除了数据交换的开销;构建了可二次编译的中间图结构,使图数据的访问代码可进行编译优化;同时增加了中间图结构缓存与图算法缓存,规避了图计算的预处理开销。
-
-
-
-
-
-
-
-
-