-
公开(公告)号:CN116029297A
公开(公告)日:2023-04-28
申请号:CN202310061847.X
申请日:2023-02-04
Applicant: 北京信息科技大学 , 复杂系统仿真总体重点实验室
IPC: G06F40/295 , G06V10/40 , G06V10/764 , G06V10/82 , G06N7/01 , G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 本发明解决武器装备领域文本数据因其稀缺性,存在噪声大、句子短、质量差、不具备丰富的上下文语义等现象,利用多模态方法可有效提高实体识别的效果,包括以下步骤:由ResNet提取视觉特征,同时对图像进行分类;将分类标签在字典中的解释通过BERT得到向量信息,取到包含全部分类信息的[CLS];由BERT提取整个文本特征,将含有分类信息的[CLS]替换文本向量的[CLS]部分,然后进行自注意力得到关注实体的特征向量;将两种模态处理好的特征向量进行跨模态注意,通过互注意力模块对两种特征向量进行交互感知;最后通过CRF层提取出实体。在武器装备多模态数据集上进行实验,表明本发明优于单文本模态和主流多模态模型,可实现对武器装备领域实体的有效识别。
-
公开(公告)号:CN117034915B
公开(公告)日:2025-05-13
申请号:CN202310053706.3
申请日:2023-02-03
Applicant: 北京信息科技大学 , 复杂系统仿真总体重点实验室
IPC: G06F40/279 , G06F40/205 , G06F40/216
Abstract: 本发明涉及自然语言处理领域的文本处理方法,针对术语自动抽取任务,为了解决武器装备领域样本稀疏和长术语难以识别的问题,本文提出头尾指针和主动学习相结合的方法。在术语抽取模型方面,提出了融合五笔特征的头尾指针网络的术语抽取模型,使用BERT预训练语言模型得到词向量表示,利用头尾指针网络对长术语进行抽取;然后提出新的主动学习采样策略,在未标注样本上筛选高质量样本不断迭代训练模型,降低模型对数据规模的依赖。
-
公开(公告)号:CN117034915A
公开(公告)日:2023-11-10
申请号:CN202310053706.3
申请日:2023-02-03
Applicant: 北京信息科技大学 , 复杂系统仿真总体重点实验室
IPC: G06F40/279 , G06F40/205 , G06F40/216
Abstract: 本发明涉及自然语言处理领域的文本处理方法,针对术语自动抽取任务,为了解决武器装备领域样本稀疏和长术语难以识别的问题,本文提出头尾指针和主动学习相结合的方法。在术语抽取模型方面,提出了融合五笔特征的头尾指针网络的术语抽取模型,使用BERT预训练语言模型得到词向量表示,利用头尾指针网络对长术语进行抽取;然后提出新的主动学习采样策略,在未标注样本上筛选高质量样本不断迭代训练模型,降低模型对数据规模的依赖。
-
公开(公告)号:CN112380844A
公开(公告)日:2021-02-19
申请号:CN202011101527.5
申请日:2020-10-15
Applicant: 北京信息科技大学 , 复杂系统仿真总体重点实验室
IPC: G06F40/247 , G06F40/211
Abstract: 本申请公开了一种武器装备属性同义词扩展方法,包括:对爬取的文本进行预处理;对预处理后的文本进行分词;利用Glove模型和Word2Vec模型分别扩展同义词;对Glove模型扩展出的同义词和Word2Vec模型扩展出的同义词取交集,获得扩展结果。本申请实施例提供的武器装备属性同义词扩展方法,对文本分词后,分别采用Word2vec模型和Glove模型训练词向量以扩展同义词,将二者扩展的同义词结果取交集后得到更准确的同义词,扩展结果的查准率、召回率和F1值均较高,扩展效果好。
-
-
-