-
-
-
-
公开(公告)号:CN108108470B
公开(公告)日:2020-08-21
申请号:CN201711495105.9
申请日:2017-12-31
申请人: 浙江工业大学
摘要: 一种基于REST的电梯数据服务自动抽取与封装方法。首先,根据电梯数据源及其访问权限连接到数据库,抽取电梯元数据;其次,从电梯元数据中自动抽取原子数据服务;最后,将抽取得到电梯原子数据服务自动封装成REST服务,注册并统一管理,用唯一的URI进行统一访问。本发明为基于数据服务的数据集成提供了一种有效的数据服务自动抽取与封装方法,提高了其自动化程度。
-
-
公开(公告)号:CN106055311A
公开(公告)日:2016-10-26
申请号:CN201610357853.X
申请日:2016-05-26
申请人: 浙江工业大学
IPC分类号: G06F9/38
CPC分类号: G06F9/3867
摘要: 本发明提出了一种基于流水线多线程的MapReduce任务并行化方法,将MapReduce任务的计算过程划分为具有一定依赖关系的子任务,以此能够将节点内串行的MapReduce任务并行化为流水线多线程MapReduce任务,从而充分利用多核节点丰富的硬件资源提高大数据处理性能。
-
公开(公告)号:CN105630916A
公开(公告)日:2016-06-01
申请号:CN201510969896.9
申请日:2015-12-21
申请人: 浙江工业大学
IPC分类号: G06F17/30
CPC分类号: G06F17/30657 , G06F17/30684
摘要: 本发明涉及一种大数据环境下非结构化表格文档数据抽取与组织方法。首先,分析了非结构化表格文档的结构特征和数据流特征,定义了数据抽取规则;其次,给出了非结构化表格文档数据抽取流程与抽取算法;再次,给出了一种将抽取结果转换为结构化数据的组织方法;最后,给出了基于MapReduce并行编程模型对所得到的结构化数据集进行分析的方法。本方法能够为大数据环境下挖掘非结构化表格文档蕴藏的知识提供技术支持。
-
公开(公告)号:CN107239483B
公开(公告)日:2020-06-09
申请号:CN201710244081.3
申请日:2017-04-14
申请人: 浙江工业大学
摘要: 一种基于数据服务的跨域电梯数据组合视图自动生成方法,首先,将跨域电梯数据集封装为原子数据服务,并基于REST技术将原子数据服务封装注册并统一管理;其次,根据原子数据服务的内在的依赖关系构建跨域电梯数据的数据服务依赖图;再次,在服务依赖图的基础上,根据用户数据需求自动组合原子数据服务生成复合数据服务;最后,执行复合数据服务生成数据组合视图,以表格的形式返回给用户。本发明为跨域电梯数据集成提供了一种有效的数据组合视图自动生成方法,提高了其自动化程度。
-
公开(公告)号:CN106909696B
公开(公告)日:2020-01-14
申请号:CN201710187868.0
申请日:2017-03-27
申请人: 浙江工业大学
摘要: 一种基于数据服务依赖图的高校数据组合视图自动生成方法。首先,将高校各部门的数据集封装为原子数据服务,并基于REST技术将原子数据服务封装注册并统一管理;其次,根据原子数据服务的内在的依赖关系构建高校各部门的数据服务依赖图;再次,在服务依赖图的基础上,根据用户数据需求自动组合原子数据服务生成复合数据服务;最后,执行复合数据服务生成数据组合视图,以表格的形式返回给用户。本发明为高校各部门数据集成提供了一种有效的数据组合视图自动生成方法,提高了其自动化程度。
-
公开(公告)号:CN105630916B
公开(公告)日:2018-11-06
申请号:CN201510969896.9
申请日:2015-12-21
申请人: 浙江工业大学
IPC分类号: G06F17/30
摘要: 本发明专利涉及一种大数据环境下非结构化表格文档数据抽取与组织方法。首先,分析了非结构化表格文档的结构特征和数据流特征,定义了数据抽取规则;其次,给出了非结构化表格文档数据抽取流程与抽取算法;再次,给出了一种将抽取结果转换为结构化数据的组织方法;最后,给出了基于MapReduce并行编程模型对所得到的结构化数据集进行分析的方法。本方法能够为大数据环境下挖掘非结构化表格文档蕴藏的知识提供技术支持。
-
-
-
-
-
-
-
-
-