-
公开(公告)号:CN1282934A
公开(公告)日:2001-02-07
申请号:CN00122279.1
申请日:2000-07-28
Applicant: 松下电器产业株式会社
CPC classification number: G06F17/30675
Abstract: 提供从文件的文件数据库选取给定字母序列的相似字。相似字的出现模式与给定序列的出现模式相似。准备一个特征矢量表,它包括文件数据库中每个字的第一特征矢量。通过检索相应于给定序列的文件数据库而得到有关给定序列的统计信息。从统计信息,计算相应于给定序列的第二特征矢量。计算第二特征矢量与每个第一特征矢量之间的相似度。选择产生相似度高于预定值的这种字。