发明公开
- 专利标题: 创建和使用紧凑语言数据的系统和方法
- 专利标题(英): System and method of creating and using compact linguistic data
-
申请号: CN03815759.4申请日: 2003-07-03
-
公开(公告)号: CN1703692A公开(公告)日: 2005-11-30
- 发明人: 瓦迪姆·富克斯 , 迈克尔·G·埃利萨荣
- 申请人: 2012244安大略公司
- 申请人地址: 加拿大安大略省
- 专利权人: 2012244安大略公司
- 当前专利权人: 2012244安大略公司
- 当前专利权人地址: 加拿大安大略省
- 代理机构: 中科专利商标代理有限责任公司
- 代理商 罗松梅
- 优先权: 2,411,227 2002.11.07 CA; 60/393,903 2002.07.03 US; 10/289,656 2002.11.07 US
- 国际申请: PCT/CA2003/001023 2003.07.03
- 国际公布: WO2004/006122 EN 2004.01.15
- 进入国家日期: 2005-01-04
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
提出了一种创建和使用紧凑语言数据的系统和方法。计算出现在语料中的单词的频率。将单词中的每个惟一字符映射到字符索引,并以字符索引替代单词中的字符。将字符序列映射到置换索引,并以置换索引替代单词中的字符序列。按照公共前缀,将单词分组,并将每个前缀映射到针对以该前缀开头的单词组的位置信息。