发明授权
- 专利标题: 检测并重构固定格式文档中的东亚布局特征
-
申请号: CN201480026958.6申请日: 2014-02-28
-
公开(公告)号: CN105247509B公开(公告)日: 2018-11-23
- 发明人: D·扎里克 , M·舍舒姆 , M·拉扎里维克 , M·拉斯科维克
- 申请人: 微软技术许可有限责任公司
- 申请人地址: 美国华盛顿州
- 专利权人: 微软技术许可有限责任公司
- 当前专利权人: 微软技术许可有限责任公司
- 当前专利权人地址: 美国华盛顿州
- 代理机构: 永新专利商标代理有限公司
- 代理商 王英
- 优先权: 13/794,541 20130311 US
- 国际申请: PCT/US2014/019646 2014.02.28
- 国际公布: WO2014/163981 EN 2014.10.09
- 进入国家日期: 2015-11-11
- 主分类号: G06F17/22
- IPC分类号: G06F17/22 ; G06K9/00
摘要:
提供了东亚布局特征的检测和东亚布局特征的重构。固定格式文档中的垂直书写的文本被检测并旋转以供布局分析。在布局分析之后,经旋转的文本被旋转回去并在流格式文档中重构。当多个字符水平地被书写在文本的垂直行中时,垂直重叠文本串被检测,并分派作为垂直中的水平文本,并被重建为流格式文档中的垂直中的水平文本。文本的行被分析以寻找ruby行的属性,并被分派作为与ruby基础行中的对应文本相关联的ruby文本,并在流格式文档中被重建为ruby文本。在固定格式文档中的文本被分析用于特定东亚语言的检测,使得该语言的字体在流格式文档中被指定。
公开/授权文献
- CN105247509A 检测并重构固定格式文档中的东亚布局特征 公开/授权日:2016-01-13