-
公开(公告)号:CN119672458A
公开(公告)日:2025-03-21
申请号:CN202411619943.2
申请日:2024-11-13
Applicant: 吉林大学
IPC: G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本申请提供了一种基于子空间学习的神经网络训练方法、装置和电子设备,涉及计算机技术领域,该方法包括:获取第一样本图像对应的第一融合图像,第一融合图像由第一样本图像和视觉提示模块输出的第一视觉提示融合得到,将第一融合图像输入图像处理模块得到第一输出结果,采用子空间学习将第一损失转换为调整向量,根据调整向量对视觉提示模块中的向量进行调整,迭代上述步骤,在达到第一结束条件时,得到由图像处理模块和调整后的视觉提示模块组合而成的神经网络。本申请提供的训练方法,可以加快神经网络的收敛速度,缩短神经网络的训练时间。
-
公开(公告)号:CN118606813A
公开(公告)日:2024-09-06
申请号:CN202410556580.6
申请日:2024-05-07
Applicant: 吉林大学
IPC: G06F18/2415 , G06F18/213 , G06N3/08 , G06F18/22
Abstract: 本申请实施例公开了一种图节点分类模型的训练方法、装置、存储介质以及电子设备,所述方法包括:首先对在预设存储空间内的节点数据进行特征提取得到节点数据对应的节点特征向量,然后基于节点特征向量对第一图节点分类模型进行针对欧几里得空间的模型训练处理得到第二图节点分类模型,之后基于第二图节点分类模型对节点特征向量进行节点关系识别得到参考图结构,基于参考图结构进行困惑节点识别处理得到困惑节点数据,而后基于困惑节点数据和参考图结构对第二图节点分类模型进行针对双曲空间的模型训练处理得到目标图节点分类模型。
-
公开(公告)号:CN110750992B
公开(公告)日:2023-07-04
申请号:CN201910952910.2
申请日:2019-10-09
Applicant: 吉林大学
IPC: G06F40/295 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种命名实体识别方法、装置、电子设备及介质。其中,本申请中,在获取待识别数据之后,可以基于预训练的词嵌入向量矩阵,将所述待识别数据转换为词嵌入向量;利用多个神经网络模型和注意力机制,对所述词嵌入向量进行多层级特征提取,得到不同级别的待识别特征数据;对所述待识别特征数据进行序列标注,得到实体识别结果。通过应用本申请的技术方案,可以相对于现有技术来说,融合广度学习和注意力机制进行命名实体识别,进而可以达到提高识别准确率的效果。
-
公开(公告)号:CN113384875B
公开(公告)日:2023-06-16
申请号:CN202110695182.9
申请日:2021-06-22
Applicant: 吉林大学
Abstract: 本申请公开了一种模型训练方法、装置、存储介质及电子设备,属于计算机技术领域。所述模型训练方法包括:计算所述状态信息和所述动作信息对应的状态特征和预测动作信息,所述状态特征包括实际状态特征、预测状态特征和固定状态特征,通过模型基于所述实际状态特征、所述预测状态特征、所述预测动作信息和所述固定状态特征计算学习目标,所述模型至少包括特征模块、前向模块、反向模块和目标模块,基于所述学习目标确定所述模型中的所述特征模块、所述前向模块和所述反向模块对应的训练参数。本申请可以避免噪声电视问题,加强模型的探索能力。
-
公开(公告)号:CN116229145A
公开(公告)日:2023-06-06
申请号:CN202211726319.3
申请日:2022-12-30
Applicant: 吉林大学
IPC: G06V10/764 , G06V10/80 , G06V10/77 , G06V10/82 , G06V10/778 , G06V10/75
Abstract: 本申请公开了一种目标对象的分类方法,属于计算机技术领域。通过本申请实施例提供的技术方案,获取目标对象的第一拉曼图像、第二拉曼图像以及统计概率矩阵,该统计概率矩阵用于表示该目标对象处于多种候选状态的可能性,该统计概率矩阵是基于该目标对象的历史生理数据确定的,该历史生理数据包括该目标对象曾经处于的预设状态。对该第一拉曼图像和该第二拉曼图像进行多尺度特征提取,得到多尺度拉曼特征。基于该多尺度拉曼特征进行分类,得到该目标对象的第一分类结果。基于该第一分类结果和该统计概率矩阵,确定目标对象的第二分类结果,也即是该目标对象处于的目标状态。结合图像和统计概率矩阵对目标对象进行分类,分类的准确性较高。
-
公开(公告)号:CN108874914B
公开(公告)日:2021-11-02
申请号:CN201810533975.9
申请日:2018-05-29
Applicant: 吉林大学
IPC: G06F16/9535 , G06Q30/06 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图卷积与神经协同过滤的信息推荐方法,结合图卷积神经网络模型的优点,能够通过直观的方式对多种信息进行融合处理,不仅能够接收用户的特征信息,而且能够接收用户的属性信息,对稀疏的评分数据有较好的推荐性能;另外使用了多种技巧对模型的输入与参数进行优化建模,克服了可能遇到的细节问题。另外,由于引入非线性的基于神经网络的协同过滤方法作为模型的解码器部分,能够很好的利用图卷积编码器输出的用户和物品编码,通过end‑to‑end的模型,所有过程都是运行在同一框架下,不需分别训练。经过输入数据的处理和模型的训练与预测,可以得到完整的评分预测矩阵。
-
公开(公告)号:CN113392952A
公开(公告)日:2021-09-14
申请号:CN202110564559.7
申请日:2021-05-24
Applicant: 吉林大学
Abstract: 本申请实施例公开了一种动态优势函数的建模方法,涉及深度强化学习领域。方法包括:针对静态优势函数的演员‑评论家模型中包括的静态优势函数添加权重因子,得到第一动态优势函数;基于长短期记忆网络模型对所述演员‑评论家模型中包括的原始策略网络进行动作延迟跟随和重构,得到第二动态优势函数;基于所述第一动态优势函数和所述第二动态优势函数构成所述动态优势函数。采用本申请实施例,可以解决现有的基于静态优势函数的演员‑评论家模型需要大量样本数据支撑训练,以及针对智能体的训练初期效果不理想、模型学习效率低、鲁棒性差的问题。
-
公开(公告)号:CN118298648A
公开(公告)日:2024-07-05
申请号:CN202410269549.4
申请日:2024-03-11
Applicant: 吉林大学
IPC: G08G1/083 , G08G1/08 , G08G1/065 , G06N3/0475 , G06N3/0455 , G06N3/094 , G06N3/092 , G06N3/0895
Abstract: 本发明属于智能交通控制技术领域,具体公开了基于多智能体强化学习的多路口交通信号灯公平控制方法,设计了一种新型的公平性度量指标,并提出了一种公平性感知的多智能体强化学习方法,可以在确保模型性能不受影响的前提下,提供相对公平的动作决策;提出了反事实数据增强的模块,通过利用反事实思想,基于已有的交互数据实现数据集的扩展,有利于丰富交互数据的多样性,进而在交互数据收集受限的任务中提高训练样本效率;设计了辅助自监督表示学习任务,通过状态之间天然的时序关系构建自监督表示学习损失,额外训练损失的引入有利于状态信息特征提取,提升模型训练样本效率。
-
公开(公告)号:CN103399858B
公开(公告)日:2016-08-10
申请号:CN201310272543.4
申请日:2013-07-01
Applicant: 吉林大学
Abstract: 一种基于信任的社会化协同过滤推荐方法,融合用户对项目的评分矩阵和用户信任网络两种数据为目标用户进行高质量的推荐,主要包括如下步骤:构建用户与项目的特征向量;构建面向用户浏览行为的评分预测模型Truster?MF;构建面向用户评价行为的评分预测模型Trustee?MF;训练模型Truster?MF;训练模型Trustee?MF;融合训练后的Truster?MF和Trustee?MF,构建综合考虑浏览和评价两种行为的评分预测模型,本发明为基于信任的社会化推荐提供了一种全新方法,与现有方法相比,具有如下主要优点:(1)有效缓解了协同过滤推荐面临的数据稀疏和冷启动两个主要问题,具有更好的推荐质量;(2)算法简洁高效,易于实施,特别适用于大型电子商务网站。
-
公开(公告)号:CN119761454A
公开(公告)日:2025-04-04
申请号:CN202510248451.5
申请日:2025-03-04
Applicant: 吉林大学
Abstract: 本申请提供了一种空间对齐与选择性权重激活的持续离线强化学习方法,包括:针对持续学习任务序列中的每一个任务,使用该任务对应的数据集,利用量化空间对齐方法将状态空间和动作空间对齐,以得到相同空间下的状态序列和动作序列;获取单时间步奖励序列,并利用奖励函数计算出累积折扣奖励和序列;基于该任务的状态序列,将累积折扣奖励和序列作为扩散模型的条件信息,利用被激活的扩散模型生成给定状态序列,再利用逆动力学模型生成给定动作序列;将各任务累积的折扣奖励和的最大化作为目标,进行持续强化学习,以更新各任务对应的扩散模型参数,和逆动力学模型参数。该方法使各任务的强化学习过程在同样的空间上进行,并有效缓解了灾难性遗忘。
-
-
-
-
-
-
-
-
-