-
公开(公告)号:CN112328774B
公开(公告)日:2022-10-25
申请号:CN202011355592.0
申请日:2020-11-27
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/35 , G06N3/04
Abstract: 本申请公开了一种基于多文档的任务型人机对话任务的实现方法,包括:每轮对话结束时,利用预设人机对话任务模型对该轮对话的问答文本处理,该处理包括:基于问答文本生成问答向量;计算问答向量与各候选文档的属性相关向量的相似度;基于问答向量和相似度生成该轮对话中各候选文档的概率分布和该轮对话的属性分布;根据所述概率分布更新全局候选文档概率分布向量;根据所述属性分布更新全局属性分布向量;若满足人机对话结束条件,则基于全局候选文档概率分布向量确定任务执行结果并输出;否则,基于全局候选文档概率分布向量和全局属性分布向量,利用自然语言对话模板,确定下一提问信息。采用本发明可以提高任务执行效率和成功率,且易于实现。
-
公开(公告)号:CN113781598A
公开(公告)日:2021-12-10
申请号:CN202111238938.3
申请日:2021-10-25
Applicant: 北京邮电大学
IPC: G06T11/00 , G06F40/284 , G06F40/211 , G06K9/62
Abstract: 本申请公开了一种图像生成模型的训练方法和设备以及图像生成方法,其中训练方法包括:基于样本数据中的图像描述文本生成句子向量和词向量;将初始高斯噪声输入模型的无条件对抗子网络生成第一图像;基于第一图像计算非条件对抗损失函数值;将第一图像和第一句子的句子向量输入模型的句子级别对抗子网络生成第二图像;基于第二图像和句子向量计算句子级别的条件对抗损失函数值;第一句子为图像描述文本对应的句子;将第二图像和第一句子的词向量,输入模型的词级别对抗子网络生成第三图像;基于第三图像、句子向量和词向量,计算词级别的条件对抗损失函数值;利用上述损失函数值对图像生成模型的参数更新。本申请可以保证生成图像与文本的一致性。
-
公开(公告)号:CN113590800A
公开(公告)日:2021-11-02
申请号:CN202110966233.7
申请日:2021-08-23
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/583 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种图像生成模型的训练方法和设备以及图像生成方法和设备,其中方法包括:获取对话样本数据,所述对话样本数据包括对话文本数据、标准图像、图像描述文本和对话总轮数;基于所述对话样本数据,采用随机重放训练的方式,利用所述对话样本数据和预先训练的异构循环神经网络编码器,对交互式递增图像生成模型进行训练,以使所述交互式递增图像模型能够基于人机对话文本和图像描述文本生成具有交互递增性的图像;其中,利用在对话的最终时刻获得的所有对话文本数据以及在对话的中间时刻获得的所有对话文本数据,进行所述训练。采用本申请,有利于合理地实现对话到图像生成任务。
-
公开(公告)号:CN110135441A
公开(公告)日:2019-08-16
申请号:CN201910414090.1
申请日:2019-05-17
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种图像的文本描述方法及装置,方法包括:获取待描述图像,提取待描述图像的多个区域特征和一个全局特征;将区域特征、全局特征输入预先训练的文本描述神经网络中的句子级子网络,得到针对每个待生成句子的句子指导向量;将句子指导向量输入文本描述神经网络中的词汇子网络,得到描述文本;由于采用句子级子网络和词汇级子网络的分层结构,能够捕捉段落中句子之间的连贯性,提高了生成的文本段落中句子之间的连贯性,此外,相较于现有的基于循环神经网络的方案,降低了训练过程的计算复杂度。
-
公开(公告)号:CN103793507B
公开(公告)日:2016-10-05
申请号:CN201410039222.4
申请日:2014-01-26
Applicant: 北京邮电大学
Abstract: 本发明提出了一种使用深层结构获取双模态相似性测度的方法,该方法包括:第一模态原始数据使用经典特征提取方法获取第一模态的低级表达P1,第二模态原始数据使用经典特征提取方法获取第二模态的低级表达T1,P1为n维向量,T1为l维向量;第一模态的低级表达P1通过堆叠的两层受限波尔兹曼机获得中级表达P3;第二模态的低级表达T1通过堆叠的两层受限波尔兹曼机获得中级表达T3;所述第一模态的中级表达P3与第二模态的中级表达T3分别使用自动编码器进行编码,编码后第一模态表示为P4,第二模态表示为T4,所述P4与T4为相同维数的向量,计算P4与T4的相似性测度。
-
公开(公告)号:CN104462489A
公开(公告)日:2015-03-25
申请号:CN201410800393.4
申请日:2014-12-18
Applicant: 北京邮电大学
CPC classification number: G06F17/30864 , G06F17/30675 , G06N3/08
Abstract: 本发明提出了一种基于深层模型的跨模态检索方法,该方法包括:利用特征提取方法分别获得目标检索模态与检索库中每一个被检索模态的低级表达向量;目标检索模态的低级表达向量分别与检索库中每一个被检索模态的低级表达向量,通过堆叠对应的受限波尔兹曼机Corr-RBMs深层模型获得目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量;利用目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量计算目标检索模态与检索库中每一个被检索模态的距离;将检索库中与目标检索模态距离最近的至少一个被检索模态确定为与目标检索模态匹配的对象。
-
公开(公告)号:CN116797972B
公开(公告)日:2024-09-06
申请号:CN202310756691.7
申请日:2023-06-26
Applicant: 中科(黑龙江)数字经济研究院有限公司 , 北京邮电大学
IPC: G06V20/40 , G06N3/045 , G06N3/0895
Abstract: 本发明为视频分析领域,公开了基于稀疏图因果时序编码的自监督群体行为识别方法及其识别装置。获得群体行为视频数据;基于稀疏图因果时序预测编码,构建描述群体状态时空信息变化的网络结构,网络结构包括特征提取网络、编码器与解码器。特征提取网络,用于根据群体行为视频数据提取特征向量组;编码器,根据群体行为视频数据构建的场景中个体的稀疏图;解码器,利用注意力机制建模长期线索之间的依赖关系关注最相关的历史动态,以用于预测未来群组变化;对描述群体状态时空信息变化的网络结构构建损失函数,增强自监督学习的效果;利用优化后的网络结构实现自监督条件下的群体行为识别。本发明可针对具有复杂时序关系和空间位置关系的群体行为进行建模与识别,用以解决常用的基于循环神经网络等模型在表示行为动态特征方面能力不足、识别性能欠佳的问题。
-
公开(公告)号:CN117609536A
公开(公告)日:2024-02-27
申请号:CN202311632626.X
申请日:2023-12-01
Applicant: 北京邮电大学
IPC: G06F16/58 , G06F16/583 , G06V10/44 , G06V10/764 , G06V10/82 , G06F16/55 , G06F16/33 , G06N3/0455 , G06N3/048 , G06N3/08 , G06N5/04
Abstract: 本发明提供一种基于语言引导的指称表达理解推理网络系统及推理方法,包括:文本特征提取器、图像特征提取器、文本特征扩展器(TFE)、跨模态对齐模块(TCA)和跨模态融合模块(TCF);通过语言引导推理网络模型(LGR‑NET),以充分利用指称表达式的指导;设置预测标记来捕捉跨模态特征,为了充分利用文本特征,通过文本特征扩展模块(TFE)从三个方面对其进行了扩展,文本生成的坐标嵌入有助于预测词元捕获关键的视觉特征;文本特征用于交替的跨模态推理;新颖的跨模态损失增强了跨模态对齐;如此文本特征从多个角度充分的引导了模型整体的跨模态推理流程,充分利用了文本中的线索,大大提高了模型性能。
-
公开(公告)号:CN115900723A
公开(公告)日:2023-04-04
申请号:CN202211699876.0
申请日:2022-12-28
Applicant: 北京邮电大学
IPC: G01C21/20
Abstract: 本申请公开了一种多智能体交互模型的训练方法、多智能体交互方法及设备,其中训练方法包括:被导航的目标智能体需要获取下一跳路径时,导航智能体利用模型的定位网络,根据目标智能体观测到的物体特征定位其位置;并利用模型的路径规划网络,根据该位置和目标位置确定两者间的最短路径;利用模型的导航网络对目标智能体导航,包括:根据最短路径为目标智能体生成下一跳路径的路径导航语言并发送给目标智能体,以触发目标智能体根据路径导航语言预测下一跳移动路径;到达目标位置后,基于导航智能体和目标智能体在定位网络和导航网络中对应模块的输出结果,计算损失函数值并利用其优化模型。采用本申请可以高效地完成导航任务且成本低、泛化性强。
-
公开(公告)号:CN115795008A
公开(公告)日:2023-03-14
申请号:CN202211464999.6
申请日:2022-11-22
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/232 , G06F16/33 , G06N3/0455 , G06N3/0499 , G06N3/08
Abstract: 本申请公开了一种口语对话状态追踪模型训练方法及口语对话状态追踪方法,其中训练方法包括:获取预设的样本数据;样本数据包括正确的对话过程文本数据、经过噪声融合处理的对话过程文本数据和目标槽值标签;利用口语对话状态追踪模型,基于经过噪声融合处理的所述对话过程文本数据,进行文本纠错和槽值提取,并基于文本纠错和槽值提取的结果、正确的对话过程文本数据和目标槽值标签,计算总损失函数值,利用总损失函数值,对口语对话状态追踪模型的参数进行优化调整;其中,基于对话过程文本数据在文本纠错前后分别对应的语义向量的拼接结果,利用对话状态追踪解码器,进行槽值提取。采用本申请,可以提高口语对话状态追踪的准确度。
-
-
-
-
-
-
-
-
-