一种基于强化学习的模型训练方法以及相关装置

    公开(公告)号:CN111985640A

    公开(公告)日:2020-11-24

    申请号:CN202010662161.2

    申请日:2020-07-10

    IPC分类号: G06N3/08 G06N3/04 G06K9/62

    摘要: 本申请公开了一种基于强化学习的模型训练方法以及相关装置,可以应用于游戏策略模拟的过程中。通过获取预设强化学习模型和多个目标强化学习模型;然后将目标样本输入预设强化学习模型,并在强化学习环境中进行迭代计算,以得到样本集合;并从样本集合中提取经验样本,以结合目标强化学习模型建立正则化安德森目标函数;进一步的通过得到安德森系数向量确定损失函数,以对预设强化学习模型进行训练。由于在训练过程中的样本为循环使用的过程,提高了数据的利用率,进而减少了智能体与环境的交互次数,提高了强化学习模型训练的效率。

    面向现实测试时自适应的医学影像分类方法、系统及设备

    公开(公告)号:CN118864956A

    公开(公告)日:2024-10-29

    申请号:CN202410893706.9

    申请日:2024-07-04

    申请人: 清华大学

    摘要: 本申请提供一种面向现实测试时自适应的医学影像分类方法、系统及设备,涉及医学影像分类技术领域,以域和类作为两个独立维度,基于原始医学影像,利用马尔可夫状态转移矩阵创建多种场景的生成医学影像测试集,每种场景为域和类各自的平衡性参数和时间相关性参数的一个组合;将所述生成医学影像测试集中的影像依次输入目标医学影像分类模型,得到生成医学影像的分类结果,所述目标医学影像分类模型是将预训练的原始医学影像分类模型中的归一化层替换为平衡归一化层而得到的。本申请提出的面向现实测试时自适应的医学影像分类方法全面且适用范围广,且可以针对具体场景选择最合适的方法。

    一种基于生成域对齐的医学超声影像识别方法

    公开(公告)号:CN118506099A

    公开(公告)日:2024-08-16

    申请号:CN202410700912.3

    申请日:2024-05-31

    申请人: 清华大学

    IPC分类号: G06V10/764 G06V10/30

    摘要: 本发明提供了一种基于生成域对齐的医学超声影像识别方法,涉及图像分类技术领域。所述方法包括:利用条件扩散模型创建用于微调的带标签的生成医学超声影像样本,标签用于表征生成医学超声影像样本对应的类别;利用生成域的无条件扩散模型将每个带标签的生成医学超声影像样本对齐至生成域,得到生成域医学超声影像集;利用生成域医学超声影像集对源域模型进行微调,得到生成域模型;利用生成域的无条件扩散模型将目标医学超声影像对齐至生成域,得到生成域目标医学超声影像;将生成域目标医学超声影像输入生成域模型,得到目标医学超声影像的第一预测分类结果。将跨域任务转化为域内预测任务,源域模型和目标数据的域都对齐在同一个生成域上,从而可以得到准确的预测分类结果。

    一种基于医疗影像数据扩增的疾病诊断模型训练方法

    公开(公告)号:CN111430025B

    公开(公告)日:2023-07-25

    申请号:CN202010161921.1

    申请日:2020-03-10

    申请人: 清华大学

    摘要: 本发明涉及一种基于医疗影像数据扩增的疾病诊断方法,属于疾病诊断方法技术领域。本方法首先在将原始影像数据映射到深度特征空间中,提取具有高度线性化的语义信息的特征;根据医疗影像中对应不同类别的数据在特征空间中的分布,获得用于数据扩增的特征协方差矩阵;计算数据扩增损失函数,通过不断优化该损失,获得特征提取能力更强的模型。该数据扩增方法仅在训练模型时使用,在使用模型对医疗影像数据预测时不会引入更多的计算量与计算时间。本方法对固定的医疗影像数据进行有效的扩充,显著地降低了深度神经网络的训练对于标注患者数据的数量要求,有效缓解了医疗影像数据获取困难、标注成本高的问题,而且提高了疾病诊断的准确率。

    基于自适应文本学习的图像生成方法和装置

    公开(公告)号:CN116402910A

    公开(公告)日:2023-07-07

    申请号:CN202310331763.3

    申请日:2023-03-30

    申请人: 清华大学

    摘要: 本公开提供了一种基于自适应文本学习的图像生成方法和装置,涉及计算机视觉技术领域。所述方法包括:将潜在向量输入目标域生成器,得到目标域图像;其中,所述目标域图像的生成方向为:根据所述潜在向量对应的自适应源域文本提示向量确定的方向;所述目标域生成器的训练过程使用了:映射器根据样本向量自适应生成的源域提示文本向量。

    一种数字钱包交易方法、装置及系统

    公开(公告)号:CN112613876B

    公开(公告)日:2023-01-17

    申请号:CN202011613061.7

    申请日:2020-12-30

    申请人: 清华大学

    IPC分类号: G06Q20/36 G06Q20/06

    摘要: 本发明实施例公开了一种数字钱包交易方法、装置及系统,该方法包括:在满足设定条件时,检测是否获取到从冷钱包转移资产到热钱包的操作权限信息,操作权限信息包括操作权限码;若是,则将操作权限码和交易信息进行加密以得到加密信息,并将加密信息通过非接触通信方式传递给冷钱包;检测冷钱包通过非接触通信方式传递的反馈信息,在反馈信息包括签名数据时,从冷钱包转移资产到热钱包。本发明实施例公开的数字钱包交易方法、装置及系统,既具有冷钱包的安全存储特性,也具有热钱包的交易便捷特性,能够满足资产量大交易频繁的用户需求。

    神经网络模型中数据处理方法、存储介质和电子装置

    公开(公告)号:CN112598012B

    公开(公告)日:2022-12-02

    申请号:CN202011541149.2

    申请日:2020-12-23

    申请人: 清华大学

    摘要: 本申请实施例公开了一种神经网络模型中数据处理方法、存储介质和电子装置,其中所述神经网络模型的卷积层采用分情况赋予参数的卷积核,所述方法包括:将卷积层的输入特征图通过预设的寻径函数进行处理,得到所述输入特征图在预设的旋转维度上的空间特征;利用所述空间特征对所述卷积层中的E组卷积权重参数进行空间变换,得到空间变换后的卷积权重参数,其中E为大于等于2的整数;根据所述空间变换后的E组卷积权重参数,获取所述输入特征图的目标卷积权重参数;将所述目标卷积权重参数与所述输入特征图执行卷积运算,得到所述卷积层的输出特征图。

    一种图像处理的方法、装置和存储介质

    公开(公告)号:CN112785575B

    公开(公告)日:2022-11-18

    申请号:CN202110095599.1

    申请日:2021-01-25

    申请人: 清华大学

    IPC分类号: G06T7/00 G06T7/11 G06N3/08

    摘要: 本申请公开了一种图像处理的方法、装置和存储介质,具体为首先获取待训练图像样本和待训练图像样本对应的标签分割图像,将待训练图像样本输入待训练的图像分割模型,在通过图像分割模型对待训练图像样本进行提取时图像分割模型中最末输出层的第一图像特征和倒数第二输出层的第二图像特征,输出对应的分割图像样本,基于标签分割图像和分割图像样本,计算模型损失函数,并对模型参数进行优化,生成优化后的图像分割模型,将获取的待处理图像输入优化后的图像分割模型,生成待处理图像对应的分割图像。本申请实施例通过引入多层解码输出特征,进一步地提高隐层特征的质量,增加分割精度,有效地降低了分割误差,提升了模型的识别效率和识别准确率。