创建和使用中文语言数据和用户自纠正数据的方法和系统

    公开(公告)号:CN1679023A

    公开(公告)日:2005-10-05

    申请号:CN03820843.1

    申请日:2003-07-03

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2217

    摘要: 为多个中文拼音音节中的每一个生成唯一的标识符并且存储在标识符阵列中。还生成多个汉字字符候选列表,每个列表包括与拼音音节关联的汉字字符候选。阵列中的每个标识符具有阵列索引,并且每个列表中的每个汉字字符候选在表中具有候选索引。对于具有多个拼音音节的多个词中的每一个,生成包括关键字和值的数据记录。在词的数据记录中,关键字是标识符阵列中的标识符的阵列索引和词的多个拼音音节中的每个声调信息,而值是在与每个拼音音节关联的候选列表中表示每个拼音音节的候选的候选索引。

    创建和使用中文语言数据和用户自纠正数据的方法和系统

    公开(公告)号:CN100561469C

    公开(公告)日:2009-11-18

    申请号:CN03820843.1

    申请日:2003-07-03

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2217

    摘要: 为多个中文拼音音节中的每一个生成唯一的标识符并且存储在标识符阵列中。还生成多个汉字字符候选列表,每个列表包括与拼音音节关联的汉字字符候选。阵列中的每个标识符具有阵列索引,并且每个列表中的每个汉字字符候选在表中具有候选索引。对于具有多个拼音音节的多个词中的每一个,生成包括关键字和值的数据记录。在词的数据记录中,关键字是标识符阵列中的标识符的阵列索引和词的多个拼音音节中的每个声调信息,而值是在与每个拼音音节关联的候选列表中表示每个拼音音节的候选的候选索引。