一种基于互索引结构的文本查询方法
摘要:
本发明实施例公开了一种基于互索引结构的文本查询方法,包括以下步骤:对需要索引的文本文件进行分割操作,获得含有固定单词数的文本块数组;构建倒排索引结构;计算每一文本块的特征值,并将特征值保存在特征索引文件中;在每个文本块的末尾,使用变长算法给出一个指针地址长度,根据所述指针地址长度获得指针值,指针值为特征索引文件中该文本块所对应的特征值地址;根据文本文件中特定文本块的特征值索引,找到文本块特征值;读取文本块特征值,将所述文本块特征值与查询单词的特征值进行比较,判断所述查询单词是否包含在所述文本块中。本发明用于加快短语匹配的速度,减少I/O操作,减少计算复杂度,提高查询效率和匹配准确率。
公开/授权文献
0/0