一种数据查询方法及装置

    公开(公告)号:CN104657387A

    公开(公告)日:2015-05-27

    申请号:CN201310596903.6

    申请日:2013-11-22

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30693

    摘要: 本发明实施例公开了一种数据查询方法及装置。该数据查询方法预先存储多个历史查询请求及其时间戳,以及与所述历史查询请求一一对应的历史查询结果,所述查询方法包括:接收数据查询请求;将所述数据查询请求与所述多个历史查询请求进行匹配;根据匹配结果将所述数据查询请求划分为至少一个子查询请求;根据所述子查询请求进行数据查询;合并所述至少一个子查询请求的查询结果,并将合并后的查询结果作为所述数据查询请求的结果。该方法无需建立和维护物化视图,而且对历史结果数据以及查询过的不需要重复查询,这样可以大大减少扫描和计算的数据量,提高查询效率,改善查询性能,降低查询费用。

    一种数据查询方法及装置

    公开(公告)号:CN104657387B

    公开(公告)日:2019-02-05

    申请号:CN201310596903.6

    申请日:2013-11-22

    IPC分类号: G06F16/24

    摘要: 本发明实施例公开了一种数据查询方法及装置。该数据查询方法预先存储多个历史查询请求及其时间戳,以及与所述历史查询请求一一对应的历史查询结果,所述查询方法包括:接收数据查询请求;将所述数据查询请求与所述多个历史查询请求进行匹配;根据匹配结果将所述数据查询请求划分为至少一个子查询请求;根据所述子查询请求进行数据查询;合并所述至少一个子查询请求的查询结果,并将合并后的查询结果作为所述数据查询请求的结果。该方法无需建立和维护物化视图,而且对历史结果数据以及查询过的不需要重复查询,这样可以大大减少扫描和计算的数据量,提高查询效率,改善查询性能,降低查询费用。

    时序数据处理方法、装置及设备
    3.
    发明公开

    公开(公告)号:CN118260708A

    公开(公告)日:2024-06-28

    申请号:CN202410201558.X

    申请日:2024-02-23

    申请人: 清华大学

    摘要: 本申请提供一种时序数据处理方法、装置及设备,涉及时序数据处理技术,该方法包括:获取真实数据和真实数据的负载信息。根据预设的模式信息提取算法对真实数据进行提取,得到模式信息和去模式数据。基于负载信息、模式信息和去模式数据,采用预设的鲁棒性训练方法对初始的时序数据生成对抗网络进行训练,得到训练后的时序数据生成对抗网络。通过训练后的时序数据生成对抗网络,生成合成的时序数据。本申请的方法,通过分别设置模式信息与时序数据生成对抗网络更好地捕捉序列相关性,利用负载信息,通过鲁棒性训练方法生成更加逼真且多样化的时序数据,解决了时序数据的生成结果不逼真且单一的技术问题。

    数据湖架构下支持跨链交易的区块链系统

    公开(公告)号:CN113114744A

    公开(公告)日:2021-07-13

    申请号:CN202110342134.1

    申请日:2021-03-30

    申请人: 清华大学

    IPC分类号: H04L29/08 G06F16/27 G06Q40/04

    摘要: 本发明提供一种数据湖架构下支持跨链交易的区块链系统,该系统包括:区块链公链、区块链数据湖应用平台及区块链私链/联盟链;其中:区块链数据湖应用平台包括基于数据湖的区块链预言机,基于数据湖的区块链预言机是区块链公链和区块链私链/联盟链的交互接口;基于数据湖的区块链预言机用于对区块链私链/联盟链部署到区块链数据湖应用平台的至少一个区块链应用进行格式化处理,以使得区块链公链访问区块链应用。本发明提供的数据湖架构下支持跨链交易的区块链系统,实现了公链上的区块链应用使用者或来自于私有链和联盟链的参与者可以无缝地在区块链数据湖应用平台上使用来自私有链和联盟链的区块链应用系统,从而更好地服务于区块链应用需求。

    数据湖区块链数据库系统构建方法及装置

    公开(公告)号:CN113094352A

    公开(公告)日:2021-07-09

    申请号:CN202110342171.2

    申请日:2021-03-30

    申请人: 清华大学

    IPC分类号: G06F16/21 G06F16/27

    摘要: 本发明提供一种数据湖区块链数据库系统构建方法及装置,该方法包括:获取至少一个目标对象的第一类型数据及第二类型数据;根据第一类型数据获取交易账本数据,将交易账本数据存储到与目标对象对应的第一区块;对第二类型数据进行语义分析得到语义信息数据,将语义信息数据存储到与目标对象对应的第二区块;获取与第一区块相关的第二区块,将第一区块和与第一区块相关的第二区块中的数据进行融合并进行区块存储得到与目标对象对应的融合区块;为融合区块建立索引标签,从而构建得到数据湖区块链数据库系统。本发明提供的数据湖区块链数据库系统构建方法及装置,实现了基于区块链和数据湖的超融合分布式数据库系统的构建,可以满足各种处理需求。

    一种基于区块链的医疗健康数据可信共享方法及系统

    公开(公告)号:CN112967775A

    公开(公告)日:2021-06-15

    申请号:CN202110332729.9

    申请日:2021-03-26

    申请人: 清华大学

    摘要: 本发明提供一种基于区块链的医疗健康数据可信共享方法及系统,该方法包括:获取医疗健康授权数据,并将所述医疗健康授权数据保存到本地服务器中;根据所述医疗健康授权数据,生成查询字符串和对应的哈希值,并将所述查询字符串和所述哈希值上传到区块链系统;根据目标查询字符串,将所述本地服务器中对应的目标医疗健康授权数据发送到查询终端,以供所述查询终端根据目标哈希值,对所述目标医疗健康授权数据进行验证,得到验证通过后的目标医疗健康授权数据。本发明通过使用区块链作为共识管理的基础,解决了医疗健康行业面临的医疗健康数据碎片化、医疗健康数据共享不充分以及医疗健康数据所有者隐私保护的问题。

    跨语言的医学知识图谱构建方法、装置与电子设备

    公开(公告)号:CN110990579A

    公开(公告)日:2020-04-10

    申请号:CN201911044916.6

    申请日:2019-10-30

    申请人: 清华大学

    IPC分类号: G06F16/36 G16H50/70

    摘要: 本发明实施例提供一种跨语言的医学知识图谱构建方法、装置与电子设备,其中所述方法包括:基于不同语言的医疗标准,通过将生成的跨语言且异构的数据集中的概念与关系进行融合,获取跨语言的概念知识图谱;通过对来自医院、开放数据集和社交数据集中所述不同语言的电子病历进行实体、事件和关系的抽取与融合,获取跨语言的实例知识图谱;将所述跨语言的概念知识图谱与所述跨语言的实例知识图谱相结合,形成跨语言的事实知识图谱。本发明实施例通过对多种不同语言的医疗标准和实例电子病历分别进行分析与信息提取,能够更加准确地对知识库中不同语言形成的知识图谱进行融合,从而得到更加准确、可靠的医学知识图谱。

    基于云目录的统一云存储资源共享方法及装置

    公开(公告)号:CN106506542B

    公开(公告)日:2019-11-22

    申请号:CN201611173748.7

    申请日:2016-12-16

    申请人: 清华大学

    IPC分类号: H04L29/06 H04L29/08

    摘要: 本发明提供一种基于云目录的统一云存储资源共享方法及装置。所述方法包括S1,基于资源共享协议,为资源提供者和资源管理者分配相应的权限;S2,获取待共享的非结构化资源,由具有权限的资源提供者和/或资源管理者进行审计;审计通过后对所述非结构化资源进行统一存储管理,以进行资源共享;S3,接收外部应用系统对特定资源的调用请求,基于所述统一存储管理获取所述特定资源并发送给所述外部应用系统。本发明基于资源共享协议对来自不同资源提供者的非结构化资源进行管理审计,提供一种灵活的资源共享撤销方式;通过统一的云目录编制,实现全局共享的资源定位,基于同步策略实现全局和局部共享资源的同步更新,有效的实现网络资源的共享服务。

    基于时间维度和同类比较维度的学习能力判定方法和系统

    公开(公告)号:CN105654402A

    公开(公告)日:2016-06-08

    申请号:CN201510999753.2

    申请日:2015-12-25

    申请人: 清华大学

    IPC分类号: G06Q50/20

    CPC分类号: G06Q50/205

    摘要: 本发明公开了一种基于时间维度和同类比较维度的学习能力判定方法和系统,该方法包括:S1:获取第N次考试中,具有第一知识点的每一试题的得分、总分和难度系数;S2:计算所述每一试题的得分与总分的第一比值,以及所述第一比值与所述难度系数的第二比值;S3:计算第N-1次考试第一知识点得分率与所有第二比值之和作为第N次考试的第一知识点得分率;S4:计算第N-1次考试的第一知识点理想得分率和所述每一试题的难度系数的倒数之和作为第N次考试的第一知识点理想得分率;S5:计算所述第N次考试的第一知识点得分率和所述第N次考试的第一知识点理想得分率之间的比值,以作为第N次考试的第一知识点的判定结果;其中,N为大于等于1的自然数。

    一种大数据索引方法及系统

    公开(公告)号:CN103198150B

    公开(公告)日:2016-04-20

    申请号:CN201310146076.0

    申请日:2013-04-24

    申请人: 清华大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种大数据索引方法及系统,涉及数据库索引技术领域。所述方法包括:将与数据中心服务器单元相连的所有终端设备产生的数据送入NoSQL数据库单元;建立pLSM索引引擎单元;用户执行索引操作。所述系统包括:数据中心服务器单元,用于接收与其连接的所有终端设备产生的数据并将接收到的数据送入NoSQL数据库单元;NoSQL数据库单元,用于存储数据中心服务器单元传来的数据;pLSM索引引擎单元,以COLA为外存组件,以Skip List为内存组件,并在内存中添加Delete Filter模块以支持外存组件上的删除操作。