一种基于强化学习和知识库匹配的工业问答模型训练方法

    公开(公告)号:CN117763127B

    公开(公告)日:2024-08-13

    申请号:CN202410039085.8

    申请日:2024-01-10

    摘要: 本发明公开了一种基于强化学习和知识库匹配的工业问答模型训练方法,包括以下步骤:S1、收集工业领域内的专业知识问答构建工业知识库,对奖励模型进行训练,针对工业知识问答,将工业问答模型的输出与工业知识库的内容进行匹配比较,根据相似度得出奖励值;S2、将奖励值按序排列,并利用排序损失函数训练更新奖励模型网络的参数;S3、进行工业问答模型训练,对奖励值加入惩罚项,并利用强化学习算法对工业问答模型进行多次训练后,获得最优策略。本发明采用上述的一种基于强化学习和知识库匹配的工业问答模型训练方法,利用强化学习算法,经过多次迭代训练,帮助工业问答模型学习理解工业专业知识,提高了工业问答模型问答的精确度。

    一种基于区块链技术的分布式信誉管理方法

    公开(公告)号:CN117176321B

    公开(公告)日:2024-06-07

    申请号:CN202311066453.X

    申请日:2023-08-23

    IPC分类号: H04L9/00 G06F16/23 H04L67/104

    摘要: 本发明公开了一种基于区块链技术的分布式信誉管理方法,包括:生成不同应用场景的指定数据,把用户账户和所生成的数据打包为数据聚合合约存储到区块链上,并广播数据聚合合约的账户到评估模块;评估节点收到数据聚合合约的账户后,访问其中的数据给用户评分并且为评分结果签名,多个校验节点对评分结果进行投票和签名,并通过数据聚合合约记录,数据聚合合约作为可验证凭证存储在区块链上;信誉管理合约以可验证凭证为依据,更新所有参与者的信誉值;将信誉值作为权益确定节点是否具有打包区块权,并且还作为区块链分叉选择的依据选择分支。本发明提出的分布式信誉管理机制适用于多种许可链场景,提升许可区块链共识的安全性和可靠性。

    基于边缘计算与电池能量可控的无人机路径优化方法

    公开(公告)号:CN116680881A

    公开(公告)日:2023-09-01

    申请号:CN202310592510.1

    申请日:2023-05-24

    IPC分类号: G06F30/20 G06F9/48 G06F9/50

    摘要: 本申请公开了基于边缘计算与电池能量可控的无人机路径优化方法。方法包括建立无人机搭载边缘计算服务器服务地面用户的系统模型;建立用户端和无人机边缘服务器端的任务积压队列;建立无人机的电池能量队列;为所有队列建立李雅普诺夫优化函数,在任务队列稳定和无人机能量队列稳定的约束下,建立使得用户的时间平均能耗总和最小化的优化问题。根据需要的迭代精度,设置迭代结束的阈值;利用块坐标下降法在每个时隙分别优化用户计算频率,用户关联和无人机的路径,将得到的结果作为下一次优化的初始值,直到迭代变量小于迭代的阈值;本申请使得用户与无人机之间延迟局限于一定范围内,并且实现对无人机电池能量的有效控制。

    基于边缘计算的区块链网络中计算与存储资源分配方法

    公开(公告)号:CN116126511A

    公开(公告)日:2023-05-16

    申请号:CN202210736414.5

    申请日:2022-06-27

    摘要: 本发明公开了一种基于边缘计算的区块链网络中计算与存储资源分配方法,具体为:将轻量级节点与边缘节点之间的博弈建模成两阶段的主从博弈模型,实现轻量级节点的计算与存储任务的卸载和边缘节点资源的分配;在轻量级节点之间达到纳什均衡状态,在多个轻量级节点与边缘节点之间达到主从博弈均衡状态。在第一阶段边缘节点作为领导者,分别为每个轻量级节点提供一个统一的单位算力与存储空间的报价;在第二阶段每个轻量级节点作为追随者,基于边缘节点给定的报价和其他节点的策略,决定轻量级节点自己的算力购买量和区块大小。本发明实现了轻量级节点的计算与存储任务的卸载和边缘节点资源的分配,能够以较低的复杂度迭代到主从博弈均衡点。

    基于蒙特卡洛树搜索的无人机路径规划方法

    公开(公告)号:CN114020024B

    公开(公告)日:2023-03-31

    申请号:CN202111305350.5

    申请日:2021-11-05

    IPC分类号: G05D1/10

    摘要: 本发明公开一种算法效率高、性能好、能够更好地适应动态环境的基于蒙特卡洛树搜索的无人机路径规划方法。本发明方法包括如下步骤:(10)建立蒙特卡洛树,初始化根节点,并初始化无人机位置;(20)根据实验数据,设定蒙特卡洛树搜索算法训练总次数;(30)在设定训练总次数内,对蒙特卡洛树进行搜索算法训练,使蒙特卡洛树参数根据具体步骤进行迭代,无人机作出相应的动作;(40)当训练次数等于训练总次数时,训练结束,得到一棵训练完毕的蒙特卡洛树;根据所述训练完毕蒙特卡洛树的树结构,从根节点开始利用UCT算法持续向下选择UCT值最大的子节点,直到到达一个叶子节点为止,无人机根据所选择的节点执行相应的动作,即得到最优无人机路径。

    一种基于联邦迁移学习的室内无线定位方法

    公开(公告)号:CN118741413A

    公开(公告)日:2024-10-01

    申请号:CN202410773849.6

    申请日:2024-06-14

    IPC分类号: H04W4/02 H04W4/33

    摘要: 本发明属于室内定位技术领域,公开了一种基于联邦迁移学习的室内无线定位方法,包括以下步骤:S1、在边缘节点在源域和目标域采集RSS,构建源域和目标域指纹库;S2、中央服务器初始化全局模型,进行联邦学习训练,经过多轮训练直到收敛,得到源域定位模型;S3、把源域定位模型迁移到目标域,对模型进行调整,进行联邦迁移学习训练,经过多轮训练直到收敛,得到目标域定位模型;S4、对定位模型输入待定位的设备的信号特征,定位模型输出该设备的位置信息。本发明采用上述的一种基于联邦迁移学习的室内无线定位方法,可以快速适应新场景、使新定位模型可以快速收敛,并且提高模型的性能。

    一种基于区块链和隐蔽通信的物联网轻量级认证方法

    公开(公告)号:CN116865939A

    公开(公告)日:2023-10-10

    申请号:CN202310847646.2

    申请日:2023-07-11

    IPC分类号: H04L9/00 H04L9/32 H04L67/12

    摘要: 本发明涉及一种基于区块链和隐蔽通信的物联网轻量级认证方法,该方法包括:物联网设备使用密钥和消息产生身份标签,按照一定功率分配将标签和消息广播给区块链节点;区块链节点使用二元假设对提取到的残差信号进行阈值测试,得到检测标签序列;每个区块链节点将检测到的标签序列广播给其他节点,并接收存储其他节点发送的标签序列;聚合来自其他区块链节点的标签序列,每个节点使用信道状况和信誉加权的全局聚合规则对标签序列进行全局决策;对区块链节点信誉进行更新;使用rPBFT共识协议将认证结果和相关信息上链存储,保证一致的身份验证和信誉管理。本发明使用了基于信道状况和信誉加权的全局聚合规则,具有更强的鲁棒性和安全性。

    一种联邦学习中异质模型融合的优化方法

    公开(公告)号:CN114912705A

    公开(公告)日:2022-08-16

    申请号:CN202210615296.2

    申请日:2022-06-01

    摘要: 本发明公开了一种联邦学习中异质模型融合的优化方法,该方法包括:在联邦学习系统中,客户端上传本地模型,同时上传客户端自身本地迭代次数;服务器根据客户端上传的迭代次数对联邦学习中的异质模型聚合过程进行优化:服务器根据收集到的客户端上传的本地迭代次数,对全局聚合时各个客户端对应的聚合权重进行优化,包括线性权重优化、平方权重优化、差分线性权重优化。所述异质模型是指在联邦学习系统中,由于各个客户端之间计算能力和拥有的数据量大小之间具有差异性,导致本地训练后生成具有异质性的模型;本地迭代次数是指本地客户端在进行本地的模型训练时,在规定的训练时间内共迭代的本地训练的次数。本发明提高了联邦学习系统的学习性能。

    辅助工业区块链智能合约的数据预言机架构及其运行方法

    公开(公告)号:CN114338667A

    公开(公告)日:2022-04-12

    申请号:CN202111472017.3

    申请日:2021-12-06

    摘要: 本发明公开了一种辅助工业区块链智能合约的数据预言机架构及运行方法,采用分布式的预言机网络来桥接链下环境与智能合约,扩展智能合约的链下数据空间;所述数据预言机架构包括链上预言机系统和去中心化的链下数据预言机网络,链上预言机系统包括注册预言机合约、监控预言机合约、支付预言机合约和代理预言机合约;预言机合约表示链上的预言机智能合约,非预言机合约表示链下智能合约。方法为:设计基于拍卖理论的数据预言机激励机制,保证系统中预言机参与方的诚实可靠,仿真结果证明本发明能够使数据预言机系统满足个体理性与激励相容性。本发明针对工业互联网的大数据场景,保证了链上智能合约能够可信地获取链下工业数据和扩展链下数据空间。

    一种基于迁移学习的渐进式跨域模型压缩方法

    公开(公告)号:CN118657185A

    公开(公告)日:2024-09-17

    申请号:CN202410461214.2

    申请日:2024-04-16

    摘要: 本发明公开了一种基于迁移学习的渐进式跨域模型压缩方法,包括以下步骤:S1、教师模型进行无监督域自适应;S2、学生模型基于教师模型的源域和目标域知识进行训练;S3、学生模型计算当前轮数的剪枝率,确定剪枝的迭代次数Np,初始化计数器p=1;S4、学生模型评估所有通道的重要性并进行排序;S5、学生模型修剪不重要的通道,并通过迁移知识蒸馏进行微调,计数器加1;S6、判断计数器是否达到剪枝的迭代次数,如果满足则重复步骤S1‑S6,如果不满足则继续重复步骤S4‑S6,直至计数器达到目标次数Np=p。本发明采用上述的一种基于迁移学习的渐进式跨域模型压缩方法,有利于在真实场景中部署高精确度的轻量的无监督域自适应模型。