摘要文本标注方法、装置和设备以及计算机存储介质

    公开(公告)号:CN113378550A

    公开(公告)日:2021-09-10

    申请号:CN202010117646.3

    申请日:2020-02-25

    Abstract: 本公开涉及一种摘要文本标注方法、摘要文本标注装置和摘要文本标注设备以及计算机存储介质。所述摘要文本是基于原始文本生成的,所述摘要文本标注包括:以第一预定长度的字符为单位,将所述摘要文本的字符与所述原始文本执行第一匹配处理,获得第一匹配结果;在所述第一匹配结果指示所述第一匹配处理之后存在未匹配的所述摘要文本的字符时,以第二可变长度的字符为单位,将未匹配的所述摘要文本的字符与所述原始文本执行第二匹配处理,获得第二匹配结果;基于所述第一匹配结果和所述第二匹配结果,标注所述摘要文本的字符与所述原始文本的对应性。

    文本处理方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN114281927A

    公开(公告)日:2022-04-05

    申请号:CN202011030736.5

    申请日:2020-09-27

    Abstract: 本公开涉及文本处理领域,并具体涉及一种文本处理方法、装置、设备以及计算机可读存储介质。文本处理方法包括:接收原始文本、所述原始文本中包含的一个或多个关键字以及第一处理结果,所述第一处理结果是通过对所述原始文本进行简化得到的;判断所述第一处理结果是否包含所有的关键字;以及在所述第一处理结果没有包含所有的关键字的情况下,删除所述原始文本中的一个或多个句子,直到所述第一处理结果与删除后的所述原始文本中的句子的组合包含所有的关键字、且删除后的所述原始文本中的句子数量最小,以所述组合作为最终处理结果。本公开的文本处理方法可以在覆盖所有关键字的情况下降低处理复杂度且无需考虑语法问题。

    训练方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN114281926A

    公开(公告)日:2022-04-05

    申请号:CN202011030347.2

    申请日:2020-09-27

    Abstract: 本公开涉及模型训练领域,并具体涉及一种训练方法、装置、设备以及计算机可读存储介质。训练方法包括:获取第一训练数据集以及所述第一训练数据集的第一预处理结果;利用所述第一训练数据集以及所述第一预处理结果训练第一模型以获得第二模型;获取第二训练数据集以及所述第二训练数据集的第二预处理结果;以及利用所述第二训练数据集以及所述第二预处理结果训练所述第二模型以获得第三模型,其中,所述第一预处理结果是基于与所述第三模型相关的第四模型获得的,且所述第二训练数据集的数量小于所述第一训练数据集的数量。本公开的训练方法利用较少标注的数据集就能获得期望得到的目标模型,降低了处理复杂度和标注成本并加快了开发周期。

    文本处理装置、方法、设备以及计算机可读存储介质

    公开(公告)号:CN112632976A

    公开(公告)日:2021-04-09

    申请号:CN201910895097.X

    申请日:2019-09-20

    Abstract: 本申请涉及一种文本处理装置、方法、设备以及计算机可读存储介质。所述文本处理装置包括:编码单元,配置成对所述源文本进行编码以得到源文本编码隐藏状态;解码单元,配置成对所述源文本编码隐藏状态进行解码以确定源文本解码隐藏状态;输出单元,配置成根据所述源文本编码隐藏状态和所述源文本解码隐藏状态确定每个时间步的输出词语,以确定候选文本;以及后处理单元,配置成根据外部信息对所述候选文本进行后处理,以确定包含外部信息的输出文本。

Patent Agency Ranking