发明授权
- 专利标题: 一种双语篇章标注方法
-
申请号: CN201610317745.X申请日: 2016-05-13
-
公开(公告)号: CN106021224B公开(公告)日: 2019-03-15
- 发明人: 张家俊 , 刘洋 , 宗成庆
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 中科专利商标代理有限责任公司
- 代理商 钟文芳
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06F17/28
摘要:
本发明公开了一种双语篇章标注方法,该方法包括:步骤1,对双语句子对中的源语言端和目标语言端句子分别进行自动分词、自动词对齐与自动篇章分析,得到词对齐信息和两端的篇章分析树;步骤2,根据所述步骤1得到的词对齐信息和两端的篇章分析树得到两端句子中基本篇章单元的对应关系;步骤3,根据所述步骤2得到的两端句子中的基本篇章单元及其对应关系,构建双语篇章结构。本发明能够对双语平行句子进行较高一致性的篇章分析。在中英语言对上,经过标注实验的验证:相对于已有的单语篇章分析方法,本发明方法能分析得到一致性程度更高的篇章分析结果,从篇章的切分信息,到篇章的结构信息都有较高的一致性提升。
公开/授权文献
- CN106021224A 一种双语篇章标注方法 公开/授权日:2016-10-12