-
公开(公告)号:CN118313459A
公开(公告)日:2024-07-09
申请号:CN202410400398.1
申请日:2024-04-03
Applicant: 国网江苏省电力有限公司 , 中国科学院信息工程研究所
IPC: G06N5/04 , G06F40/295 , G06F40/242 , G06F16/36 , G06N5/025
Abstract: 本发明公开一种基于模式项感知的知识库问答方法、装置及设备,属于人工智能技术领域。所述方法包括:判断给定问题是否能够识别出实体;在所述给定问题能够识别出实体的情况下,基于所述实体进行逻辑形式枚举,得到候选逻辑形式;对每一候选逻辑形式进行评分,得到K个评分最高的候选逻辑形式rk;利用给定问题对候选逻辑形式中的类和关系分别进行匹配,得到与所述给定问题最相关的候选模式项CRmat;基于所述给定问题、K个评分最高的候选逻辑形式rk以及所述候选模式项,生成目标逻辑形式。本发明可以提高真实模式项的覆盖率,提升生成逻辑形式的准确率。
-
公开(公告)号:CN112380326B
公开(公告)日:2022-07-08
申请号:CN202011079727.5
申请日:2020-10-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/36 , G06N3/04
Abstract: 本发明提供一种基于多层感知的问题答案抽取方法,其步骤包括:将一问题与若干目标文档拼接,输入到预训练语言模型中,得到问题的表示Q与目标文档的上下文表示P,将表示Q与上下文表示P交互,得到文档相关的问题表示u与融合问题信息的文档表示h;对问题表示u进行多层感知分类,获取问题的推理类型,并根据推理类型、问题表示u、文档表示h及通过表示Q生成的子问题ct,得到所述问题在目标文档中的答案注意力分布,其中t为生成子问题的次数;依据答案注意力分布,获取该问题的答案预测结果。本发明以子问题拆分的形式递进回答问题,引入推理类别分类器控制拆分,对问题的回答进行共享,提升推理阅读理解效果。
-
公开(公告)号:CN110569499A
公开(公告)日:2019-12-13
申请号:CN201910648554.5
申请日:2019-07-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多模态词向量的生成式对话系统编码方法及编码器。本方法为:1)根据当前语料与单词的上下文语境训练多模态词向量,其中每个单词生成多个词向量;2)使用双向LSTM神经网络与词向量对问句进行编码,然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示;3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分,取得分最高的词向量作为该单词的词向量;4)使用LSTM与该问句的各单词词向量对该问句进行编码,得到该问句的分布表示;5)对该问句的分布进行随机采样得到该问句的编码。本发明提高了句子编码的精准性。
-
公开(公告)号:CN117933360A
公开(公告)日:2024-04-26
申请号:CN202410077118.8
申请日:2024-01-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于知识蒸馏和提示工程的模型生成方法及系统,所述方法包括:根据垂域数据集,设计适用于下游任务的训练目标,并根据该训练目标优化基座大模型,得到垂域大模型;将垂域大模型视为教师模型,并根据所述下游任务生成一网络结构作为学生模型;其中,所述学生模型的网络结构规模小于所述垂域大模型;从下游任务数据集中抽取至少一个批量数据作为教师模型和学生模型的输入,并基于提示词工程逐层蒸馏中间特征,以使学生模型与教师模型的中间特征和输出结果对齐后,得到适用于下游任务的小规模模型。本发明能够实现与下游任务实现良好对齐的情况下尽可能地压缩模型规模,提升垂域模型的部署、推理效率。
-
公开(公告)号:CN112347756B
公开(公告)日:2023-12-22
申请号:CN202011051087.7
申请日:2020-09-29
Applicant: 中国科学院信息工程研究所
IPC: G06F40/205 , G06F40/216 , G06N3/0442 , G06N3/045
Abstract: 本发明涉及一种基于序列化证据抽取的推理阅读理解方法及系统。该方法训练基于序列化证据抽取的阅读理解模型,该模型包括编码层、推理交互层、证据预测层、答案预测层;利用训练完成的基于序列化证据抽取的阅读理解模型,输入上下文文本和问题文本,输出答案的类型、答案文本以及相关证据句子的集合。本发明通过GRU与注意力机制根据问题句子来序列化抽取证据文档中的句子作为证据句子的预测结果,将证据句子之间的相关关系考虑进去,逐步推理得到相关证据,同时覆盖问题中的重要信息。本发明从原来的独立预测每个证据句子变为序列化抽取证据句子,从而建模证据之间的相关性认证,从而提高了网络的安全可靠性。
-
公开(公告)号:CN114048395A
公开(公告)日:2022-02-15
申请号:CN202111305785.X
申请日:2021-11-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06Q50/00 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于时间感知与关键信息抽取的用户转发预测方法和系统。该方法的步骤包括:根据用户与目标推文的原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示;使用Topk‑Mask机制动态地抽取用户的朋友圈信息关键词,使用Tweet‑Mask机制学习用户的每条朋友圈推文的权重,并将两种机制输出的结果合并,得到用户的朋友圈特征表示;根据融合用户及原作者的全局和层级历史内容后的目标推文特征表示,以及用户的朋友圈特征表示,预测用户是否会对目标推文进行转发。本发明能够有效提高用户转发预测的准确率。
-
公开(公告)号:CN110569338A
公开(公告)日:2019-12-13
申请号:CN201910660759.5
申请日:2019-07-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种生成式对话系统解码器训练方法及解码方法。本方法为:1)对于问句编码集合中的每一问句编码,使用前向、后向神经网络对该问句编码进行预测分别得到一向量表示结果;2)计算前向、后向神经网络每一步预测结果的差异,作为生成式对话系统编码器的损失函数;3)计算前向、后向神经网络每一步状态的差异,作为二者的局部差异;4)计算前向、后向神经网络所生成向量表示结果的句子向量表示,并计算两句子向量表示的差异,作为二者的整体性差异;5)将局部差异和整体性差异作为惩罚项函数加入损失函数中,得到整体惩罚函数作为生成式对话系统编码器的损失函数;6)采用训练后的前向神经网络对问句编码进行预测,生成回复内容。
-
公开(公告)号:CN120032307A
公开(公告)日:2025-05-23
申请号:CN202410736218.7
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
IPC: G06V20/52 , G06V10/774 , G06V10/764 , G06V10/82 , G06V10/74 , G06N3/0455 , G06N3/09
Abstract: 本发明属于信息技术领域,涉及一种基于文本提示的语义引导的行人重识别方法和系统。该方法包括:将训练图像输入视觉编码器,得到视觉嵌入;利用逆向网络将视觉嵌入映射到文本空间,得到伪令牌,将伪令牌整合到自然语言句子中,得到对于输入图像的语言提示;将语言提示输入文本编码器中,得到文本嵌入;利用视觉嵌入和文本嵌入训练多模态交互模块;将查询图片输入训练完成的多模态交互模块,获得融合视觉与文本信息的特征向量,利用融合视觉与文本信息的特征向量在行人图像数据库中执行相似度检索,得到行人重识别结果。本发明在现有行人重识别数据集上的检索性能得到了显著提升。
-
公开(公告)号:CN119722833A
公开(公告)日:2025-03-28
申请号:CN202411591540.1
申请日:2024-11-08
Applicant: 中国科学院信息工程研究所
IPC: G06T11/00 , G06T5/70 , G06T5/60 , G06V10/774 , G06V10/74
Abstract: 本发明公开了一种基于分化注意力和去噪过程引导的多目标图像生成方法,其步骤包括:1)针对给定包括N个目标词的文本提示y以及一初始隐编码zT,利用稳定扩散模型生成文本提示y中每一目标词与zT之间的交叉注意力图CAT;2)通过设定损失函数优化初始隐编码zT;3)稳定扩散模型生成文本提示y中每一目标词与优化后的初始隐编码zT之间的最优交叉注意力图#imgabs0#4)稳定扩散模型对优化后的初始隐编码zT进行迭代去噪并对设定时间步生成的交叉注意力图进行插值;然后对迭代去噪结束所得隐编码z0进行解码生成该文本提示y对应的图像。本发明有效提高生成图像与给定文本提示之间的语义匹配性。
-
公开(公告)号:CN118644728A
公开(公告)日:2024-09-13
申请号:CN202410809839.3
申请日:2024-06-21
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06V10/82 , G06N3/0475 , G06N3/0455 , G06N3/094 , G06V10/74
Abstract: 本发明公开了一种基于预测向量映射的黑盒模型逆向重建方法,属于图像处理与机器学习领域。本发明在数据挑选阶段,通过从公共数据集中选择具有最高置信度的图像和对应预测向量,构成训练集;在训练阶段,训练一个从预测向量到StyleGAN潜在空间再到图像的逆向模型,并引入多种损失函数确保重建图像与真实图像的相似性;在攻击阶段,通过预测集成攻击方法,增强目标身份的特征,实现有效的图像重建。本发明解决了现有方法中计算成本高、效率低的问题,通过解耦潜在空间的对齐,提升了重建图像的质量和精度。本发明取得了高效攻击过程、语义连续的面部嵌入、增强的特征对齐和更高的重建性能等效果。
-
-
-
-
-
-
-
-
-