一种拉丁壮语向量表示与计算方法

    公开(公告)号:CN114091453A

    公开(公告)日:2022-02-25

    申请号:CN202111427305.7

    申请日:2021-11-29

    Abstract: 本发明提供一种拉丁壮语向量表示与计算方法,包括一个由顺序连接的拉丁壮语预处理模块、拉丁壮语语言建模模块、拉丁壮语向量表示归一化模块、拉丁壮语向量表示与计算模块组成的表示与计算模型。一篇由拉丁壮语书写的文本通过该表示与计算模型处理后,最后能够得到该拉丁壮语文本的向量表示。本发明的方法解决了拉丁壮语的向量表示与计算问题,能够用于拉丁壮语的自动化处理与应用。

    一种基于字词特征和指针网络的中文事件抽取方法及系统

    公开(公告)号:CN119514534A

    公开(公告)日:2025-02-25

    申请号:CN202411608235.9

    申请日:2024-11-12

    Abstract: 本发明提供了一种基于字词特征和指针网络的中文事件抽取方法及系统,所述方法包括如下步骤:将原始中文序列输入到BERT模型中,进行切分并编码转换成高维向量以实现分字处理,并采用jieba分词工具对文本进行分词处理;将字符级向量和词级别向量分别输入到BiLSTM网络中进行字词特征提取,通过注意力机制进行字词特征融合;利用双序列指针网络分别识别触发词和论元的起始位置,实现从文本中抽取。本发明的中文事件抽取方法在于解决中文事件抽取中存在的语义表征不充分、角色重叠和论元嵌套等问题,提高事件抽取模型的准确率和泛化能力。

    基于BERT向量化和依存句法的生成式摘要方法及系统

    公开(公告)号:CN118673133A

    公开(公告)日:2024-09-20

    申请号:CN202410654697.8

    申请日:2024-05-24

    Abstract: 本发明提供了一种BERT向量化和依存句法的生成式摘要方法及系统,生成式摘要方法包括:将原文文本和摘要文本接入BERT预训练模型,获取句子特征向量;将原文文本和摘要文本采用LTP模型进行句法依存分析,构建依存类型矩阵和邻接矩阵;将依存类型矩阵和邻接矩阵进行注意力权重计算,与所述获取的句子特征向量融合得到多粒度特征语义中间向量;以句子特征向量作为输入序列,采用网络结构为BiLSTM模型的编码器编码得到输出序列;将所述多粒度特征语义中间向量与所述输出序列拼接输入BiLSTM模型的解码器生成结果序列,采用集束搜索生成最终的文本摘要。本发明的生成式摘要方法方法简单,能够更好的捕捉关键信息。

Patent Agency Ranking