通过时间分片进行文本的自动化分类的系统和方法

    公开(公告)号:CN1441930A

    公开(公告)日:2003-09-10

    申请号:CN01802885.3

    申请日:2001-07-09

    IPC分类号: G06F17/30

    摘要: 公开了一种用于信息处理系统的自动分类文本的系统和方法。该系统包括文本分类器控制器,读取带有一个或多个包含在文本内的一个或多个故事段中的关键词的文本。文本分类器控制器标识每行中的关键词,并响应该标识一行文本中的至少一个关键词,将该行文本分类为该文本内的故事段的一部分。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数减少到低于阈值的关键词转换点。文本分类器控制器还标识文本内特定类别的关键词中的关键词的个数增加到高于阈值的关键词转换点。文本分类器控制器基于关键词转换点的位置分类故事段。