-
公开(公告)号:CN110136016A
公开(公告)日:2019-08-16
申请号:CN201910270828.1
申请日:2019-04-04
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/00 , G06F16/901
Abstract: 本发明涉及一种基于隐式关联的多标签传播方法及系统。该方法包括:对给定的网络构建局部网络结构图,其中部分节点的标签信息已知,并计算概率转移矩阵;基于标签共现方法挖掘多标签之间的隐式关联信息;生成节点-标签矩阵并初始化未知节点的标签信息;根据概率转移矩阵以及隐式关联信息对每一个未知节点的标签进行更新;基于节点-标签矩阵计算更新停止条件;反复执行上述更新步骤直到满足更新停止条件或者达到给定的迭代次数;根据节点-标签矩阵生成网络中未知标签信息的节点的标签信息。本发明能够更好的挖掘标签之间的关联关系,加速方法的收敛速度,从而更准确全面的分析大型网络用户的标签信息。
-
公开(公告)号:CN103714163B
公开(公告)日:2017-02-15
申请号:CN201310744369.9
申请日:2013-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种NoSQL数据库的模式管理方法,具体包括以下步骤:步骤1:接收访问或更新请求;步骤2:按照模式类型对访问或更新请求进行分类,或者按照访问或更新请求进行创建新模式类型及对应新模式类型对应的接口;步骤3:根据所述访问或更新请求通过对应模式类型的接口链接到数据库中的模式管理表;步骤4:根据模式管理表提供的路径,按照所述访问或更新请求访问或更新数据库中保存在不同模式类型下的数据。本发明实现了对多种异构数据在NoSQL数据库中的统一管理;针对数据的不同类型和特征,实现了差异化的模式和接口设计,保证读写的高性能;同时,提供通用的schema管理策略和读写接口,为数据模式的扩展提供了便利。
-
公开(公告)号:CN103714163A
公开(公告)日:2014-04-09
申请号:CN201310744369.9
申请日:2013-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30292
Abstract: 本发明涉及一种NoSQL数据库的模式管理方法,具体包括以下步骤:步骤1:接收访问或更新请求;步骤2:按照模式类型对访问或更新请求进行分类,或者按照访问或更新请求进行创建新模式类型及对应新模式类型对应的接口;步骤3:根据所述访问或更新请求通过对应模式类型的接口链接到数据库中的模式管理表;步骤4:根据模式管理表提供的路径,按照所述访问或更新请求访问或更新数据库中保存在不同模式类型下的数据。本发明实现了对多种异构数据在NoSQL数据库中的统一管理;针对数据的不同类型和特征,实现了差异化的模式和接口设计,保证读写的高性能;同时,提供通用的schema管理策略和读写接口,为数据模式的扩展提供了便利。
-
公开(公告)号:CN103116595A
公开(公告)日:2013-05-22
申请号:CN201210409905.5
申请日:2012-10-24
Applicant: 中国电力科学研究院 , 中国科学院信息工程研究所 , 国家电网公司
IPC: G06F17/30
Abstract: 本发明公开了一种面向电网的SCADA历史数据分布式存储的实现方法,前置服务器实时采集电力数据,并将数据组装成报文,以消息的形式发放到总线上;各应用服务器读取各自订阅的消息报文,解析得到的数据放入实时库;实时库的数据不断被刷新,不同业务类型的数据以不同的采样频率批量存入开源分布式数据库。本发明采用海量scada历史数据的分布式存储,具有大数据的快速查询分析能力、支持多副本容错、支持分布式计算等优点,并且其还具有良好的扩展性。
-
公开(公告)号:CN102855271A
公开(公告)日:2013-01-02
申请号:CN201210231859.4
申请日:2012-07-05
Applicant: 中国电力科学研究院 , 中国科学院信息工程研究所 , 国家电网公司
Abstract: 本发明提供一种多版本电网模型的存储与可追溯管理方法,包括以下步骤:在分布式数据库中创建模型库表,并维护模型库表信息;将地区的初始模型和全网的初始模型导入分布式数据库;若某地区模型更改,则生成SQL增量文件,批量执行SQL操作将新版本地区模型和全网模型存储至所述分布式数据库;可追溯管理多版本电网模型。本发明提供的方法能有效地对多版本电网模型进行管理,而且只存储增量,没有冗余;此外,数据分布式存储,当模型库表数据量增大时,查询访问速度能显著提高。
-
公开(公告)号:CN102855271B
公开(公告)日:2016-09-21
申请号:CN201210231859.4
申请日:2012-07-05
Applicant: 中国电力科学研究院 , 中国科学院信息工程研究所 , 国家电网公司
Abstract: 本发明提供一种多版本电网模型的存储与可追溯管理方法,包括以下步骤:在分布式数据库中创建模型库表,并维护模型库表信息;将地区的初始模型和全网的初始模型导入分布式数据库;若某地区模型更改,则生成SQL增量文件,批量执行SQL操作将新版本地区模型和全网模型存储至所述分布式数据库;可追溯管理多版本电网模型。本发明提供的方法能有效地对多版本电网模型进行管理,而且只存储增量,没有冗余;此外,数据分布式存储,当模型库表数据量增大时,查询访问速度能显著提高。
-
公开(公告)号:CN103631907B
公开(公告)日:2016-09-07
申请号:CN201310612192.7
申请日:2013-11-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种将关系型数据迁移至HBase的方法及系统,包括关系数据库、HBase数据库、SQL解析模块、查询转换模块和数据模式管理模块;通过在HBase数据库中设计映射关系表,存储原关系数据库中模式信息与HBase数据库中模式信息的映射关系,完整保留了原关系数据库中数据表格的模式信息,且可灵活配置映射方式,为用户提供了更多的选择,且HBase的高效数据组织方式,大大提高了访问性能,节省了存储空间,同时提供数据导出功能,实现与其他子系统的数据交互,另外,数据查询功能支持SQL查询,将SQL查询语句转换成HBase数据库的查询语句,使用户更平滑地过渡到HBase数据库。
-
公开(公告)号:CN103116595B
公开(公告)日:2016-08-10
申请号:CN201210409905.5
申请日:2012-10-24
Applicant: 中国电力科学研究院 , 中国科学院信息工程研究所 , 国家电网公司
IPC: G06F17/30
Abstract: 本发明公开了一种面向电网的SCADA历史数据分布式存储的实现方法,前置服务器实时采集电力数据,并将数据组装成报文,以消息的形式发放到总线上;各应用服务器读取各自订阅的消息报文,解析得到的数据放入实时库;实时库的数据不断被刷新,不同业务类型的数据以不同的采样频率批量存入开源分布式数据库。本发明采用海量scada历史数据的分布式存储,具有大数据的快速查询分析能力、支持多副本容错、支持分布式计算等优点,并且其还具有良好的扩展性。
-
公开(公告)号:CN103631907A
公开(公告)日:2014-03-12
申请号:CN201310612192.7
申请日:2013-11-26
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/303
Abstract: 本发明涉及一种将关系型数据迁移至HBase的方法及系统,包括关系数据库、HBase数据库、SQL解析模块、查询转换模块和数据模式管理模块;通过在HBase数据库中设计映射关系表,存储原关系数据库中模式信息与HBase数据库中模式信息的映射关系,完整保留了原关系数据库中数据表格的模式信息,且可灵活配置映射方式,为用户提供了更多的选择,且HBase的高效数据组织方式,大大提高了访问性能,节省了存储空间,同时提供数据导出功能,实现与其他子系统的数据交互,另外,数据查询功能支持SQL查询,将SQL查询语句转换成HBase数据库的查询语句,使用户更平滑地过渡到HBase数据库。
-
公开(公告)号:CN110136016B
公开(公告)日:2021-06-29
申请号:CN201910270828.1
申请日:2019-04-04
Applicant: 中国科学院信息工程研究所
IPC: G06Q50/00 , G06F16/901
Abstract: 本发明涉及一种基于隐式关联的多标签传播方法及系统。该方法包括:对给定的网络构建局部网络结构图,其中部分节点的标签信息已知,并计算概率转移矩阵;基于标签共现方法挖掘多标签之间的隐式关联信息;生成节点‑标签矩阵并初始化未知节点的标签信息;根据概率转移矩阵以及隐式关联信息对每一个未知节点的标签进行更新;基于节点‑标签矩阵计算更新停止条件;反复执行上述更新步骤直到满足更新停止条件或者达到给定的迭代次数;根据节点‑标签矩阵生成网络中未知标签信息的节点的标签信息。本发明能够更好的挖掘标签之间的关联关系,加速方法的收敛速度,从而更准确全面的分析大型网络用户的标签信息。
-
-
-
-
-
-
-
-
-