-
公开(公告)号:CN118536603B
公开(公告)日:2024-12-24
申请号:CN202410754029.2
申请日:2024-06-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 鹏城实验室
IPC: G06N5/04 , G06N3/0455 , G06N3/0464 , G06F18/22 , G06F18/25
Abstract: 本发明涉及生成式人工智能技术领域,公开了一种基于因果微调的个性化文生图模型构建及文生图方法,包括:将多个主体的多个参考图像、文本描述分别进行合并增强得到多个合并增强图像及合并文本描述;利用预设因果解耦算法,从各主体的文本描述、合并文本描述及合并增强图像中分别提取出保护身份的文本表征、身份相关及身份无关的视觉表征;将其输入预设因果推理模型,得到交叉注意力映射图;将交叉注意力映射图与对应主体身份相关的视觉表征对齐。本发明通过主体感知的因果解耦来鉴别主体身份相关的信息和身份无关的信息,保护主体身份信息,通过交叉注意力引导使每个主体的文本属性与视觉属性因果对齐,避免主体间混淆文生图的有效性、可控性。
-
公开(公告)号:CN118536603A
公开(公告)日:2024-08-23
申请号:CN202410754029.2
申请日:2024-06-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 鹏城实验室
IPC: G06N5/04 , G06N3/0455 , G06N3/0464 , G06F18/22 , G06F18/25
Abstract: 本发明涉及生成式人工智能技术领域,公开了一种基于因果微调的个性化文生图模型构建及文生图方法,包括:将多个主体的多个参考图像、文本描述分别进行合并增强得到多个合并增强图像及合并文本描述;利用预设因果解耦算法,从各主体的文本描述、合并文本描述及合并增强图像中分别提取出保护身份的文本表征、身份相关及身份无关的视觉表征;将其输入预设因果推理模型,得到交叉注意力映射图;将交叉注意力映射图与对应主体身份相关的视觉表征对齐。本发明通过主体感知的因果解耦来鉴别主体身份相关的信息和身份无关的信息,保护主体身份信息,通过交叉注意力引导使每个主体的文本属性与视觉属性因果对齐,避免主体间混淆文生图的有效性、可控性。
-
公开(公告)号:CN119557785A
公开(公告)日:2025-03-04
申请号:CN202411601665.8
申请日:2024-11-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F18/2431 , G06F18/21 , G06F18/25 , G06F18/213 , G06N5/04 , G06N3/045
Abstract: 本发明涉及人工智能技术领域,具体涉及一种多模态情感分类模型训练方法及多模态情感分类方法。方法包括:获取包含多模态样本的训练样本;采用预设神经网络提取多模态样本的多模态特征;采用可学习掩码对多模态特征过滤,得到多模态因果特征;采用多模态特征的情感分类损失和多模态因果特征的情感分类损失计算因果效应;采用由因果效应和可学习参数确定的调度权重和情感分类损失确定联合损失;采用联合优化对预设神经网络、预设分类器以及联合损失中的参数进行参数优化,并基于参数优化后的预设神经网络、可学习掩码和预设分类器构建多模态情感分类模型。该方法实现了基于因果关系的多模态特征学习,缓解了虚假关联问题,提高了情感分类的性能。
-
公开(公告)号:CN116958748A
公开(公告)日:2023-10-27
申请号:CN202310947023.2
申请日:2023-07-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/774 , G06V10/771 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及图像检测技术领域,公开了多任务因果学习的图像检测方法、装置、设备及介质,方法包括:根据多个样本特征对同一任务的重要性分数,从多个样本特征中筛选出干预特征;根据合并反事实特征,以及第二任务的反事实特征,确定第一任务对第二任务的因果亲和力;分别根据每个任务的反事实特征和样本特征的预测损失值生成第一正则约束项;根据第一任务的样本特征的预测损失值、第二任务的样本特征的预测损失值以及第一任务对第二任务的因果亲和力,生成第二正则约束项;根据判别损失函数、第一正则约束项和第二正则约束项,生成预测损失函数;根据预测损失函数对任务模型进行训练得到优化后的多任务模型。本发明能够提高图像检测的性能。
-
公开(公告)号:CN116958748B
公开(公告)日:2024-02-13
申请号:CN202310947023.2
申请日:2023-07-28
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/774 , G06V10/771 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及图像检测技术领域,公开了多任务因果学习的图像检测方法、装置、设备及介质,方法包括:根据多个样本特征对同一任务的重要性分数,从多个样本特征中筛选出干预特征;根据合并反事实特征,以及第二任务的反事实特征,确定第一任务对第二任务的因果亲和力;分别根据每个任务的反事实特征和样本特征的预测损失值生成第一正则约束项;根据第一任务的样本特征的预测损失值、第二任务的样本特征的预测损失值以及第一任务对第二任务的因果亲和力,生成第二正则约束项;根据判别损失函数、第一正则约束项和第二正则约束项,生成预测损失函数;根据预测损失函数对任务模型进行训练得到优化后的多任务模型。本发明能够提高图像检测的性能。
-
公开(公告)号:CN119516558A
公开(公告)日:2025-02-25
申请号:CN202411673640.9
申请日:2024-11-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及人工智能技术领域,公开了基于多任务提示的异常目标识别模型的训练方法和装置,模型包括:图像编码器、文本编码器、多层感知机和联合调度器;方法包括:获取属于预设识别任务的任务样本的集合;采用图像编码器,根据多任务因果提示和训练图像样本生成视觉提示特征;采用文本编码器,根据多任务因果提示和文本标签样本生成文本提示特征;采用多层感知机过滤视觉提示特征得到反事实视觉提示特征;采用对比学习,根据反事实视觉提示特征和文本提示特征之间以及预设识别类别的相似度确定任务损失;采用联合调度器分配各个任务损失的权重;采用权重和任务损失更新模型的参数,直至训练结束。本公开提高了异常目标识别的泛化性、降低错误率。
-
-
-
-
-