文本缩写数据处理方法、装置
    1.
    发明公开

    公开(公告)号:CN115936010A

    公开(公告)日:2023-04-07

    申请号:CN202211695833.5

    申请日:2022-12-28

    Applicant: 南京大学

    Abstract: 本申请的实施例提供了一种文本缩写数据处理方法、装置。该方法包括:获取属于目标知识领域的参考文本集合,所述参考文本集合包括至少一个参考文本;通过预先训练的缩写全称术语词对识别模型识别分布于各个参考文本中的缩写全称术语词对,所述缩写全称术语词对中包括缩写术语和与缩写术语相对应的全称术语;基于识别到的所述缩写全称术语词对,构建缩写全称术语词对库,所述缩写全称术语词对库记录了缩写术语与至少一个全称术语之间的对应关系;获取属于目标知识领域的待处理文本,并基于所述缩写全称术语词对库,为独立分布于待处理文本中的缩写术语补全全称术语。本申请实施例的技术方案可以提高识别和理解文本中缩写数据的效率。

Patent Agency Ranking