-
公开(公告)号:CN115062676B
公开(公告)日:2022-11-22
申请号:CN202210989796.2
申请日:2022-08-18
Applicant: 北京大学 , 北京大学重庆大数据研究院
Abstract: 本发明公开了一种数据处理方法、装置及计算机可读存储介质。其中,该方法包括:获取目标非结构化数据;采用预定打标模型,对目标非结构化数据进行打标,得到目标非结构化数据的新增标签;确定目标非结构化数据的历史标签,其中,历史标签为来自预定数据库中的已有标签;基于新增标签和历史标签,对目标非结构化数据进行打标,得到目标非结构化数据的目标标签。本发明解决了针对非结构化数据打标效果差、效率低、实时性差的技术问题。
-
公开(公告)号:CN114064125A
公开(公告)日:2022-02-18
申请号:CN202210051959.2
申请日:2022-01-18
Applicant: 北京大学 , 北京大学重庆大数据研究院
IPC: G06F9/30
Abstract: 本发明公开了一种指令解析方法、装置及电子设备。其中,该方法包括:接收目标指令以及参数处理器集合,其中,目标指令中包括目标指令参数向量,目标指令参数向量的组成元素为目标指令参数,参数处理器集合中包括至少一个参数处理器,参数处理器由预设待匹配命令参数向量和第一预设匿名函数组成;从参数处理器中确定与目标指令参数向量中的目标指令参数匹配的目标参数处理器,并使用目标参数处理器对目标指令参数进行处理,得到处理结果;依据处理结果,确定与目标指令对应的处理命令,并执行处理命令。本发明解决了由于现有技术中使用硬编码的方式进行参数解析造成的极大提高代码维护难度,不利于模块持续开发的技术问题。
-
公开(公告)号:CN119990361A
公开(公告)日:2025-05-13
申请号:CN202411968906.2
申请日:2024-12-30
Applicant: 北京大学 , 北京大学重庆大数据研究院
Abstract: 本发明公开一种缓解流调数据节点漂移问题的联邦学习方法及系统,属于联邦学习技术领域。所述方法包括:向所有的节点发送全局模型gt,以获取各节点基于本地数据生成的本地模型#imgabs0#其中,t为联邦学习的训练轮次,i为节点序号;对每一个本地模型#imgabs1#进行标准化操作,得到标准化模型#imgabs2#利用验证数据集对标准化模型#imgabs3#进行验证,并基于效果最优的m个标准化模型#imgabs4#生成全局模型gt+1;利用验证数据集对全局模型gt+1进行检验,并当所述全局模型gt+1的效果满足需求的情况下,结束联邦学习训练。本发明可以有效减少不同本地模型之间的差异,消除节点漂移,让联邦学习更专注于既定目标。
-
公开(公告)号:CN119811689A
公开(公告)日:2025-04-11
申请号:CN202510293559.6
申请日:2025-03-13
Applicant: 北京大学 , 北京大学重庆大数据研究院
IPC: G16H50/70 , G06N3/045 , G06N3/084 , G06N5/022 , G06F18/15 , G06F18/213 , G06F18/25 , G06F18/214 , G06F18/2431 , G06F18/2415 , G06F18/2433
Abstract: 本发明涉及一种融合大语言模型与知识图谱的中医证候预测方法,属于证候预测技术领域,解决了现有技术中预测准确率低的问题。方法包括:将待预测患者的初始特征输入证候预测模型预测待预测患者存在每种大类证候的第一概率;分别采用大语言模型和知识图谱确定待预测患者存在每种证候的第二概率和第三概率;基于待预测患者存在每种大类证候的第一概率、第二概率和第三概率得到待预测患者存在每种大类证候的综合概率;基于待预测患者存在每种细分证候第二概率和第三概率,以及待预测患者与每个细分证候的相似度确定待预测患者存在每个细分证候的综合概率;基于每种大类证候和每个细分证候的综合概率得到待预测患者的证候。实现了准确的证候预测。
-
公开(公告)号:CN119339918A
公开(公告)日:2025-01-21
申请号:CN202411382189.5
申请日:2024-09-30
Applicant: 北京大学 , 北京大学重庆大数据研究院
IPC: G16H50/20 , A61B5/00 , G16H20/90 , G06F18/214 , G06F18/23 , G06N3/0895 , G06N3/0455 , G06N3/048 , G06N3/084 , G06F40/284 , G06F40/30
Abstract: 本发明涉及一种基于自监督学习的中医证候预测模型预训练方法和系统,属于医疗保健信息处理技术领域,解决了现有技术中特征提取不准确的问题。方法包括以下步骤:收集患者症状描述信息,基于获取的患者症状描述信息构建症状语料库及训练样本集;基于所述症状语料库对所述训练样本集中的每条原始样本进行数据增强,生成每条原始样本对应的合成正样本和合成负样本;构建自监督学习模型,基于增强后的训练样本集对所述自监督学习模型进行预训练,得到中医证候预测预训练模型。实现了更准确的特征提取,提高后续任务的性能。
-
公开(公告)号:CN118764549A
公开(公告)日:2024-10-11
申请号:CN202410771276.3
申请日:2024-06-14
Applicant: 北京大学重庆大数据研究院
Abstract: 本申请公开了一种数据传输方法、装置及电子设备。其中,包括:通过第一服务端接收采集器客户端采集的待展示数据,并将待展示数据进行量化,得到目标数据;通过第一服务端将目标数据传输给第二服务端,第一服务端和第二服务端部署在同一个服务器终端中,采集器客户端部署在与服务器终端连接的边设备中;通过第二服务端将目标数据输出到终端进行展示。本申请解决了相关技术中物联网设备采集到的数据传输困难的技术问题。
-
公开(公告)号:CN118631846A
公开(公告)日:2024-09-10
申请号:CN202410771512.1
申请日:2024-06-14
Applicant: 北京大学重庆大数据研究院
IPC: H04L67/12 , H04L67/10 , H04L67/60 , H04L67/565
Abstract: 本申请公开了一种数据处理的方法、装置及电子设备。其中,该方法应用于异质互联平台,包括:接收客户端发送的应用需求,其中,应用需求包括客户端所在的物联网系统中的可用资源信息;依据应用需求生成与应用需求对应的服务工单,其中,异质互联平台通过所部署的多类管理系统和与多类管理系统对应的接口实现物联网系统之间的数据交互;通过异质互联平台中的多个资源接口和多个数据接口获取物联网系统中的可用资源信息和可用数据信息;依据可用资源信息和可用数据信息执行服务工单。本申请解决了相关技术中由于不同物联网系统之间在多方面的差异导致数据互通困难的技术问题。
-
公开(公告)号:CN118469562A
公开(公告)日:2024-08-09
申请号:CN202310082938.1
申请日:2023-02-08
Applicant: 北京大学 , 北京大学重庆大数据研究院
Abstract: 本发明公开了一种基于两阶段锁的区块链分片方法及系统,所述方法包括:接收并模拟执行跨分片交易处理请求,以得到该跨分片交易对主链存储状态的读集Rroot和写集Wroot,以及对每个相关子链cci存储状态的读集Ri和写集Wi;锁定读集Rroot和所述写集Wroot;向相关子链cci发送包含读集Ri的准备消息,以使得相关子链cci基于读集Ri锁定本地相关存储状态成功之后,向主链发送准备完成消息;在一设定时间内收到所有相关子链cci的准备完成消息的情况下,向相关子链cci发送包含写集Wi的执行消息,以使得相关子链cci将写集Wi写入本地相关存储之后,解锁本地相关存储状态;解锁读集Rroot和写集Wroot。本发明解决分片方法在区块链系统,特别是联盟链系统中的实用性问题。
-
公开(公告)号:CN118467563A
公开(公告)日:2024-08-09
申请号:CN202310126434.5
申请日:2023-02-08
Applicant: 北京大学 , 北京大学重庆大数据研究院
IPC: G06F16/242 , G06F16/22 , G06F16/27 , G06F16/23
Abstract: 本发明公开了一种区块链的数据链下插入、查询方法及区块链系统,所述区块链系统中的服务器,用于:解析客户端的插入语句,以得到插入数据;存储所述插入数据,并获取所述插入数据的索引键K和数据记录指针P;将所述索引键K和所述数据记录指针P插入Merkle B+树中一叶子节点;更新所述叶子节点、对应的中间节点和根节点的哈希值;和/或,解析客户端的查询语句,以得到索引键范围(Kbegin,Kend);根据所述索引键范围(Kbegin,Kend)在Merkle B+树中进行节点查询,以得到结果集合、Merkle证明和范围证明;基于所述结果集合、所述Merkle证明和所述范围证明生成查询结果,并将所述查询结果返回至该客户端。本发明可以解决区块链数据链下存储的完整性保证问题。
-
公开(公告)号:CN117371316B
公开(公告)日:2024-08-09
申请号:CN202311299858.8
申请日:2023-10-09
Applicant: 北京大学重庆大数据研究院
Abstract: 本发明提供了一种基于深度学习的静止卫星太阳短波辐射反演方法,包括以下步骤:S1.获取静止卫星和极轨卫星的历史监测信息,其中,历史监测信息包括大气背景信息和地理信息;S2.基于静止卫星的标称网格形式的数据确定出对应的经纬度信息,并基于确定的经纬度信息确定出太阳和卫星角度信息;S3.将极轨卫星的检测信息进行行列号转换,将极轨卫星的信息转换成标称网格形式;S4.将极轨卫星和静止卫星的标称网格形式的监测信息进行时空匹配得到有效信息;S5.构建深度学习神经网络,并将有效信息进行预处理后输入至深度学习神经网络中对神经网络进行训练;S6.实时获取静止卫星的监测信息,将实时监测信息进行预处理输入至训练完成的神经网络中得到监测信息采集时刻对应的太阳短波辐射值。
-
-
-
-
-
-
-
-
-