发明授权
- 专利标题: 用于分类文档的系统,方法和软件
- 专利标题(英): Systems, methods, and software for classifying text
-
申请号: CN02826650.1申请日: 2002-11-01
-
公开(公告)号: CN1701324B公开(公告)日: 2011-11-02
- 发明人: K·阿尔-科法希
- 申请人: 汤姆森路透社全球资源公司
- 申请人地址: 瑞士祖格
- 专利权人: 汤姆森路透社全球资源公司
- 当前专利权人: 汤姆森环球资源公司,申请人
- 当前专利权人地址: 瑞士祖格
- 代理机构: 中国专利代理(香港)有限公司
- 代理商 刘红; 王勇
- 优先权: 60/336,862 2001.11.02 US
- 国际申请: PCT/US2002/035177 2002.11.01
- 国际公布: WO2003/040875 EN 2003.05.15
- 进入国家日期: 2004-07-02
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06K9/68
摘要:
为了降低成本和提高精确度,发明人设计了用于帮助把诸如批注的文本和其它文档分类到目标分类系统内的目标类别上的系统、方法及软件。例如,一种系统基于下列条件来计算综合分数:输入文本与分配给每个目标类别的文本的相似性;分配给该输入文本的非目标类别与目标类别的相似性;被给予分配给该输入文本的一个或多个非目标类别的集合的目标类别的概率;和/或被给予分配给目标类别的输入文本的概率。然后该示例性系统使用诸如阈值的类别特定的决策准则来估算综合分数,最终把该输入文本分配到一个或多个目标类别或推荐分配到一个或多个目标类别。该示例性系统特别适合于具有成千个类别的分类系统。
公开/授权文献
- CN1701324A 用于分类文档的系统,方法和软件 公开/授权日:2005-11-23