-
公开(公告)号:CN116384402A
公开(公告)日:2023-07-04
申请号:CN202310415757.6
申请日:2023-04-18
Applicant: 华能煤炭技术研究有限公司 , 北京信息科技大学
IPC: G06F40/295 , G06F40/30 , G06F40/242 , G06F16/36 , G06F16/35 , G06N3/0442 , G06N3/08 , G06N3/084
Abstract: 本发明涉及煤矿机电设备领域,特别涉及一种融合机电设备本体库术语词结合对比学习的煤矿机电设备命名实体识别方法。该方法首先使用Word2Vec模型预训练机电设备术语词向量,并利用多术语多头注意力机制将术语词向量与字向量融合。然后采用Bi‑LSTM模型进行编码,在损失函数上采用对比学习做改进,将Bi‑LSTM计算的相对熵损失作为CRF损失的正则项。最后,利用CRF模型解码得到最优标签。实验结果表明,该方法在自构的煤矿机电设备语料上的准确率、召回率和F1值均优于现有主流方法。本发明的技术方案可以有效地识别煤矿机电设备领域中存在实体命名相似以及部分重点设备名称较长的问题,为智能矿山的构建提供了有力的支持。
-
公开(公告)号:CN115952802A
公开(公告)日:2023-04-11
申请号:CN202211001912.1
申请日:2022-08-21
Applicant: 华能煤炭技术研究有限公司 , 北京信息科技大学
IPC: G06F40/30 , G06F16/332 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明涉及自然语言处理领域的文本处理方法,提升现有基于切分等方式处理长文本会产生信息丢失的不足,包括以下步骤:将文本按句子切分成多段内容;将每句话以[CLS]句子[SEP]的形式传入BERT预训练语言模型,获取最后一层隐藏层向量以及[CLS]对应向量;使用词注意力机制获得句子向量;获得原文所有句子的句子向量并拼接,以[SCLS]向量的形式传入transformer模型,获取最后一层隐藏层向量以及[SCLS]对应向量;使用句注意力机制获得文本向量;训练检索网络模型并更新参数,在测试集上提取文本特征并进行测试。本发明可获得更好的处理长文本,能够更为有效的提升长文本分类准确性,并且复杂度更低。
-
公开(公告)号:CN116595169A
公开(公告)日:2023-08-15
申请号:CN202310415758.0
申请日:2023-04-18
Applicant: 北京信息科技大学 , 华能煤炭技术研究有限公司
IPC: G06F16/35 , G06F16/332 , G06F40/186 , G06N3/08 , G06N3/047
Abstract: 本专利摘要涉及一种基于提示学习的煤矿生产领域问答意图分类方法。问答系统是智能化信息处理的重要领域,也是煤矿智能化建设不可或缺的一部分。在实际应用中,意图分类是智能问答的重要子任务,它可以帮助问答系统更好地理解用户查询意图并提供准确答案。本方法通过引入不同的提示模板对BERT预训练模型进行微调,从而提高问答意图分类的准确性。实验结果表明,引入提示模板后,模型的准确率、召回率和F1值均有所提高。此外,该方法还可以在少样本场景下快速适配新领域的任务,具有较好的应用价值。因此,本专利摘要所述的基于提示学习的煤矿生产领域问答意图分类方法可用于问答系统的开发和应用。
-
公开(公告)号:CN115858813B
公开(公告)日:2025-05-16
申请号:CN202211628660.5
申请日:2022-12-20
Applicant: 北京信息科技大学 , 北京市工程咨询股份有限公司
IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/3329 , G06F40/30
Abstract: 本发明涉及面向工程咨询报告的文本检索方法,以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题,包括以下步骤:构建面向工程咨询报告的文本检索语料集,使用语料集微调simCSE对比学习模型,将得到的模型参数初始化Vanilla BERT模型,将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型,得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合,得到最终的匹配分数,完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法,有效增强了文本检索的效果。
-
公开(公告)号:CN117710661B
公开(公告)日:2025-04-15
申请号:CN202410009296.7
申请日:2024-01-04
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种基于矩形可变形卷积的遥感图像目标检测方法,属于目标检测技术领域,包括利用遥感图像目标检测数据集训练改进的Oriented RCNN模型;其中,设计矩形可变形卷积替换卷积神经网络中的一般卷积,在特征金字塔网络中加入了高级和低级特征融合模块并应用子像素卷积生成高分辨率特征图,删除检测头的两个共享的全连接层并在分类和回归分支分别使用适配网络,得到改进的Oriented RCNN模型;将改进的Oriented RCNN模型用于遥感图像目标检测中。本发明使用了矩形可变形卷积能够更好地适应遥感图像目标的几何变换,特征融合模块用于检索尺度较小的目标。本发明可获得更好的目标检测精度。
-
公开(公告)号:CN119741625A
公开(公告)日:2025-04-01
申请号:CN202411956595.8
申请日:2024-12-29
Applicant: 北京信息科技大学
Abstract: 本发明公开了一种基于跨头部协同蒸馏与特征标准化的航拍图像目标检测方法,其特征在于,包括:训练教师网络,得到一个准确度较高的教师网络;随机初始化学生网络,输入图像之后通过特征金字塔结构获取教师和学生网络的多尺度特征;使用特征共享标准化层获取标准化的教师和学生网络的特征,并求特征相关性损失;将学生网络头部特征通过共享标准化层输入跨头部输入教师网络头部,求得预测一致性损失;通过标签获取学生网络的有监督损失;根据反向传播的梯度信息更新学生网络的权重值。本发明可以通过跨头标准化的方法提升目标检测模型蒸馏效果,使较少参数量的目标检测学生网络获得和较大参数的教师模型近似的精度。
-
公开(公告)号:CN118093874A
公开(公告)日:2024-05-28
申请号:CN202410275955.1
申请日:2024-03-12
IPC: G06F16/35 , G06F16/33 , G06F18/2415 , G06F40/30 , G06F40/284 , G06N3/0455 , G06N3/047 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种低资源语言处理领域的情感分析方法。提出一种基于网格结构与多头注意力的新闻句子情感分析方法。包括以下步骤:通过将网格结构无损转换为扁平结构,实现音节序列中单词信息的引入;采用相对位置编码机制,编码音节和单词的位置和方向信息;使用多头自注意力机制,识别序列中音节和单词的关联关系和语义信息;最后通过全连接层进行分类得到低资源语言新闻句子情感类别。本发明解决了传统循环神经网络无法进行大规模并行计算以及卷积神经网络难以建模句子中的长距离依赖关系的问题,其中多头注意力机制的运用,丰富了词语间的关联关系,增强了句子语义和句法结构信息的理解,提高了低资源语言新闻句子情感分类效果。
-
公开(公告)号:CN117710661A
公开(公告)日:2024-03-15
申请号:CN202410009296.7
申请日:2024-01-04
Applicant: 北京信息科技大学
IPC: G06V10/25 , G06V20/10 , G06V10/80 , G06V10/52 , G06V10/44 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/776 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明公开了一种基于矩形可变形卷积的遥感图像目标检测方法,属于目标检测技术领域,包括利用遥感图像目标检测数据集训练改进的Oriented RCNN模型;其中,设计矩形可变形卷积替换卷积神经网络中的一般卷积,在特征金字塔网络中加入了高级和低级特征融合模块并应用子像素卷积生成高分辨率特征图,删除检测头的两个共享的全连接层并在分类和回归分支分别使用适配网络,得到改进的Oriented RCNN模型;将改进的Oriented RCNN模型用于遥感图像目标检测中。本发明使用了矩形可变形卷积能够更好地适应遥感图像目标的几何变换,特征融合模块用于检索尺度较小的目标。本发明可获得更好的目标检测精度。
-
公开(公告)号:CN116029297A
公开(公告)日:2023-04-28
申请号:CN202310061847.X
申请日:2023-02-04
Applicant: 北京信息科技大学 , 复杂系统仿真总体重点实验室
IPC: G06F40/295 , G06V10/40 , G06V10/764 , G06V10/82 , G06N7/01 , G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/08
Abstract: 本发明解决武器装备领域文本数据因其稀缺性,存在噪声大、句子短、质量差、不具备丰富的上下文语义等现象,利用多模态方法可有效提高实体识别的效果,包括以下步骤:由ResNet提取视觉特征,同时对图像进行分类;将分类标签在字典中的解释通过BERT得到向量信息,取到包含全部分类信息的[CLS];由BERT提取整个文本特征,将含有分类信息的[CLS]替换文本向量的[CLS]部分,然后进行自注意力得到关注实体的特征向量;将两种模态处理好的特征向量进行跨模态注意,通过互注意力模块对两种特征向量进行交互感知;最后通过CRF层提取出实体。在武器装备多模态数据集上进行实验,表明本发明优于单文本模态和主流多模态模型,可实现对武器装备领域实体的有效识别。
-
公开(公告)号:CN108920456B
公开(公告)日:2022-08-30
申请号:CN201810611476.7
申请日:2018-06-13
Applicant: 北京信息科技大学
IPC: G06F40/211 , G06F40/216
Abstract: 本发明涉及一种关键词自动抽取方法,包括:抽取技术标准中的通用词,抽取候选关键词,针对候选关键词过滤通用词后,综合位置特征、词共现特征以及上下文语义特征计算候选关键词权重得分,根据候选关键词权重得分范围计算动态阈值,利用动态阈值确定结果关键词。本发明提供的关键词自动抽取方法,融合位置特征、词共现特征以及上下文语义特征抽取关键词,综合考虑文档内部位置以及上下文语义特征对关键词的权重影响,达到了更高的正确率和召回率,提高了3GPP技术标准检索质量,降低了人工成本,可以很好地满足实际应用的需要。
-
-
-
-
-
-
-
-
-