一种基于多视图对比学习的电子病历表示学习方法

    公开(公告)号:CN117409911B

    公开(公告)日:2024-05-07

    申请号:CN202311325540.2

    申请日:2023-10-13

    申请人: 四川大学

    摘要: 本发明提供了一种基于多视图对比学习的电子病历表示学习方法,具体包括以下步骤:根据电子病历中患者数据的医疗代码,构建相应图结构数据;利用医疗代码的共现矩阵对图结构数据进行预训练;利用多视图对比学习法在训练集上对多个任务同时训练模型,得到训练完成的多视图对比学习模型以及在训练集上的多任务患者表示矩阵;根据训练完成的多视图对比学习模型,计算待分类多任务患者表示矩阵,并根据表示矩阵得到多任务的患者预测结果。本发明解决了如何在多任务上有效利用电子病历中医疗代码的内在结构进行患者有效表示的问题,通过结合图对比学习、多视图和多任务学习的思想,提高了下游任务的分类预测准确率。

    一种基于子空间的模糊粗糙离群检测方法

    公开(公告)号:CN117633691A

    公开(公告)日:2024-03-01

    申请号:CN202311668960.0

    申请日:2023-12-07

    申请人: 四川大学

    摘要: 一种基于子空间的模糊粗糙离群检测方法,具体包括以下步骤:获取原始数据,并对原始数据属性值进行标准化处理,得到处理后的数据;根据处理后的数据计算模糊相似度;根据模糊相似度得到模糊关系矩阵;根据模糊关系矩阵计算不同属性子集的信息熵;根据属性子集对原高维数据集进行降维,得到低维子空间数据;根据模糊粗糙密度和权重计算样本在低维子空间数据上的离群分数。本发明显著的减少高维数据的维度,并在低维子空间上判断数据离群程度,有效降低了高维数据离群检测的复杂度,并且保障检测结果的准确率;解决了现有离群检测方法存在的在高维数据中效果不佳且开销过大的问题,及缺乏对模糊和粗糙信息的综合利用的问题。

    一种基于多视图对比学习的电子病历表示学习方法

    公开(公告)号:CN117409911A

    公开(公告)日:2024-01-16

    申请号:CN202311325540.2

    申请日:2023-10-13

    申请人: 四川大学

    摘要: 本发明提供了一种基于多视图对比学习的电子病历表示学习方法,具体包括以下步骤:根据电子病历中患者数据的医疗代码,构建相应图结构数据;利用医疗代码的共现矩阵对图结构数据进行预训练;利用多视图对比学习法在训练集上对多个任务同时训练模型,得到训练完成的多视图对比学习模型以及在训练集上的多任务患者表示矩阵;根据训练完成的多视图对比学习模型,计算待分类多任务患者表示矩阵,并根据表示矩阵得到多任务的患者预测结果。本发明解决了如何在多任务上有效利用电子病历中医疗代码的内在结构进行患者有效表示的问题,通过结合图对比学习、多视图和多任务学习的思想,提高了下游任务的分类预测准确率。

    一种基于证据学习的鲁棒图文检索方法

    公开(公告)号:CN116431849B

    公开(公告)日:2024-01-02

    申请号:CN202310369406.6

    申请日:2023-04-07

    申请人: 四川大学

    摘要: 本发明公开了一种基于证据学习的鲁棒图文检索方法,包括以下步骤:处理包括图像和对应文本描述的训练数据集,得到处理后的训练数据集;根据处理后的训练数据集构建基于证据学习的鲁棒图文检索模型;向鲁棒图文检索模型输入检索数据模态,并计算数据相似性;根据计算的数据相似性进行相似性排序,输出图文检索结果,本发明解决了图文检索方法的鲁棒性差的问题。

    一种在噪声标签下鲁棒的跨域文本检索方法

    公开(公告)号:CN116383342B

    公开(公告)日:2023-11-14

    申请号:CN202310367958.3

    申请日:2023-04-07

    申请人: 四川大学

    摘要: 本发明公开了一种在噪声标签下鲁棒的跨域文本检索方法,属于文本智能检索技术领域,该方法包括获取待检索数据;建立跨域文本检索深度模型;利用所述跨域文本检索深度模型对待检索数据进行检索,得到检索结果,完成跨域文本检索。本发明解决了现有的跨域文本深度学习方法在训练时无法区分文本数据中无法避免带有的噪声标签和干净标签,最终过拟合于噪声标签,导致得到的跨域文本的检索效果大幅降低的重要问题。

    一种基于锚点的无监督跨模态哈希检索方法

    公开(公告)号:CN116383422B

    公开(公告)日:2023-11-03

    申请号:CN202310369473.8

    申请日:2023-04-07

    申请人: 四川大学

    摘要: 本发明公开了一种基于锚点的无监督跨模态哈希检索方法,属于跨模态检索技术领域,该方法包括获取图文对训练集;初始化图像模态神经网络的网络参数和文本模态神经网络的网络参数;根据图文对训练集中得到锚点集和批次图文对;根据锚点集和批次图文对,利用直通估计器以最小化跨模态网络损失函数为目标函数分别对图像模态神经网络的网络参数和文本模态神经网络的网络参数进行迭代优化,得到最优图像模态神经网络和最优文本模态神经网络;根据最优图像模态神经网络和最优文本模态神经网络,完成跨模态检索任务。本发明解决了跨模态哈希检索方法时间复杂度和空间复杂度偏高且二值编码不可微的问题。

    基于松弛稀疏性与子空间学习的相关信号盲源分离方法

    公开(公告)号:CN115859050A

    公开(公告)日:2023-03-28

    申请号:CN202211490236.9

    申请日:2022-11-25

    申请人: 四川大学

    IPC分类号: G06F18/10 G06F18/24 G06F18/23

    摘要: 本发明公开了基于松弛稀疏性与子空间学习的相关信号盲源分离方法,包括以下步骤:S1、获取观测信号,并对其进行预处理;S2、通过自适应聚类方法确定预处理后的观测信号各时频点的隶属子空间,并根据各隶属子空间的法向量确定混合矩阵的估计;S3、根据混合矩阵的估计,进行源信号估计,实现相关信号盲源分离。本发明解决了现有的基于源信号独立性方法所不能解决的相关信号盲源分离问题,并将盲源分离的约束条件进一步的放松到松弛稀疏性这一约束,从而在较为松弛的约束条件下解决了对于相关信号的盲源分离问题。

    一种基于粒子群算法的分布式深度学习参数更新方法

    公开(公告)号:CN111353582B

    公开(公告)日:2022-11-29

    申请号:CN202010100999.2

    申请日:2020-02-19

    申请人: 四川大学

    IPC分类号: G06N3/04 G06N3/08 G06N3/00

    摘要: 本发明提供了一种基于粒子群算法的分布式深度学习参数更新方法,初始化分布式集群和神经网络参数;利用编码策略对粒子群进行初始化,每个计算节点编码为一颗粒子;计算神经网络最大的训练迭代次数;对神经网络进行训练;收集所有计算节点的神经网络参数和每个粒子的适应度值;获取粒子群当前迭代的全局最优值和粒子的局部最优值;计算新的神经网络参数;将新的参数分发至所有计算节点;若当前迭代次数达到最大迭代次数,结束对分布式深度学习参数的更新。本发明利用所有计算节点训练的神经网络参数,并对其进行优化,该方法可以很好的兼顾通信开销和收敛性,解决了数据并行分布式训练平台中参数同步周期和通信开销难以权衡的问题。

    一种基于多层级神经网络的英文邮件主题生成方法

    公开(公告)号:CN111339763B

    公开(公告)日:2022-06-28

    申请号:CN202010119380.6

    申请日:2020-02-26

    申请人: 四川大学

    摘要: 本发明提供了一种基于多层级神经网络的英文邮件主题生成方法,本发明提出了基于Transformer的融合词、句、全文多级信息的多层级网络结构,从抽取到生成,逐步凝练邮件信息并生成最终结果,本发明将邮件正文输入抽取器,输出抽取的句子与全文表达,通过TextRank关键词提取器提取的关键词与抽取的句子、全文表达共同输入摘要器,输出主题。本发明提出了使用关键词、全文信息和邮件重要句信息智能生成邮件主题的方案,综合考虑了邮件的字词、句、全文三个级别的信息;本发明在主题生成任务中使用ElMo算法和拷贝技术,解决由于邮件易见词典外单词而引起的编码与输出偏差问题。