-
公开(公告)号:CN118708675A
公开(公告)日:2024-09-27
申请号:CN202410742517.1
申请日:2024-06-11
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于空间预测型视觉语言预训练模型的跨模态图文检索方法及存储介质,所述方法通过将局部语义预测视觉空间位置引入到视觉语言预训练模型中,使预训练模型能够学习到更有效的高级语义,有效提升下游跨模态图文检索任务的性能;利用基于空间预测型视觉语言预训练模型对下游图文检索数据进行特征提取,构建四元组损失函数并执行有监督跨模态图文检索;利用四元组构造模块挖掘与正样本具有强语义关联假负例样本,减少了假负例样本对图文检索的影响。
-
公开(公告)号:CN118747226A
公开(公告)日:2024-10-08
申请号:CN202410889007.7
申请日:2024-07-04
Applicant: 桂林电子科技大学
IPC: G06F16/532 , G06F16/583 , G06V10/40 , G06F18/213 , G06F18/22 , G06F16/332 , G06F16/383
Abstract: 本发明公开了一种目标级跨模态图文检索方法及存储介质,所述方法构建了图像‑目标信息成对数据,并在特征提取过程中将目标的位置信息集成到文本标题特征中,有效学习了图像中目标和文本的关联关系,提升了图文检索的准确性和可解释性;通过将跨模态鸿沟分布添加到图像特征中并结合鸿沟余弦损失函数最大化图像特征和目标特征的相似性,解决了图文数据的模态鸿沟问题;利用二次训练模块对错误检索数据进一步训练,获得训练完备的一种目标级跨模态图文检索模型,进一步提升了模型的性能。
-
公开(公告)号:CN114091453A
公开(公告)日:2022-02-25
申请号:CN202111427305.7
申请日:2021-11-29
Applicant: 桂林电子科技大学
IPC: G06F40/289 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种拉丁壮语向量表示与计算方法,包括一个由顺序连接的拉丁壮语预处理模块、拉丁壮语语言建模模块、拉丁壮语向量表示归一化模块、拉丁壮语向量表示与计算模块组成的表示与计算模型。一篇由拉丁壮语书写的文本通过该表示与计算模型处理后,最后能够得到该拉丁壮语文本的向量表示。本发明的方法解决了拉丁壮语的向量表示与计算问题,能够用于拉丁壮语的自动化处理与应用。
-
公开(公告)号:CN119514534A
公开(公告)日:2025-02-25
申请号:CN202411608235.9
申请日:2024-11-12
Applicant: 桂林电子科技大学
IPC: G06F40/284 , G06F40/30 , G06F18/2433 , G06F18/25 , G06N3/0455 , G06N3/0442
Abstract: 本发明提供了一种基于字词特征和指针网络的中文事件抽取方法及系统,所述方法包括如下步骤:将原始中文序列输入到BERT模型中,进行切分并编码转换成高维向量以实现分字处理,并采用jieba分词工具对文本进行分词处理;将字符级向量和词级别向量分别输入到BiLSTM网络中进行字词特征提取,通过注意力机制进行字词特征融合;利用双序列指针网络分别识别触发词和论元的起始位置,实现从文本中抽取。本发明的中文事件抽取方法在于解决中文事件抽取中存在的语义表征不充分、角色重叠和论元嵌套等问题,提高事件抽取模型的准确率和泛化能力。
-
公开(公告)号:CN118673133A
公开(公告)日:2024-09-20
申请号:CN202410654697.8
申请日:2024-05-24
Applicant: 桂林电子科技大学
IPC: G06F16/34 , G06F40/211 , G06F17/16 , G06N3/0455 , G06N3/08 , G06N3/0464 , G06N3/042
Abstract: 本发明提供了一种BERT向量化和依存句法的生成式摘要方法及系统,生成式摘要方法包括:将原文文本和摘要文本接入BERT预训练模型,获取句子特征向量;将原文文本和摘要文本采用LTP模型进行句法依存分析,构建依存类型矩阵和邻接矩阵;将依存类型矩阵和邻接矩阵进行注意力权重计算,与所述获取的句子特征向量融合得到多粒度特征语义中间向量;以句子特征向量作为输入序列,采用网络结构为BiLSTM模型的编码器编码得到输出序列;将所述多粒度特征语义中间向量与所述输出序列拼接输入BiLSTM模型的解码器生成结果序列,采用集束搜索生成最终的文本摘要。本发明的生成式摘要方法方法简单,能够更好的捕捉关键信息。
-
-
-
-