-
公开(公告)号:CN119829692A
公开(公告)日:2025-04-15
申请号:CN202510027864.0
申请日:2025-01-08
Applicant: 昆明理工大学
Abstract: 本发明涉及一种基于多阶值查找表的Z阶曲线编码和解码方法,属于空间数据库索引技术领域。本发明包括多阶编码值查找表构建阶段:构建多阶编码值查找表,用于实现坐标和编码值之间的映射;编码阶段:每个坐标分量进行分段,通过迭代查询多阶编码值查找表将每个段的结果拼接起来计算Z阶曲线编码;多阶解码值查找表构建阶段:构建多阶解码值查找表,用于实现编码值和坐标之间的映射;解码阶段:对坐标编码值进行分段,通过迭代查询多阶解码值查找表并将每个段的结果拼接起来计算坐标。本发明通过引入分段机制等技术,可以将逐阶编解码操作转换为逐段编解码操作,提高编解码效率。
-
公开(公告)号:CN108846013B
公开(公告)日:2021-11-23
申请号:CN201810419803.9
申请日:2018-05-04
Applicant: 昆明理工大学
IPC: G06F16/9537 , G06F16/31 , G06F16/387
Abstract: 本发明涉及一种基于geohash与Patricia Trie的空间关键词查询方法,方法包括:通过geohash空间编码方法将数据集D中所有位置点编码成长度为n的字符串geoStr,以geoStr为排序对象按字典序对数据集D中的每行数据排序并生成编号id;对geoStr构建Patricia Trie,Patricia Trie的叶节点指向根据该域内关键词构建的倒排索引,倒排索引的列表元素为关键词及与其相对应的id列表,得到空间关键词索引结构;检索空间关键词索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。
-
公开(公告)号:CN108491462B
公开(公告)日:2021-09-14
申请号:CN201810179478.3
申请日:2018-03-05
Applicant: 昆明理工大学
IPC: G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于word2vec的查询扩展方法及装置,属于信息检索技术领域。本发明方法包括:用户给定查询的预处理步骤:对查询进行分词处理,去除停用词并进行词干还原;扩展词候选集选取步骤:使用word2vec工具选取初始扩展词;建立扩展词表步骤:对扩展词候选集进行过滤,建立实际扩展词表;扩展检索步骤:将用户查询及其扩展词与索引集进行匹配,返回相关文档并排序。本发明提出一种面向扩展词的查询向量生成方法来过滤候选扩展词并构建扩展词表,从而更好的体现扩展词与整个查询的相关性,进而提高查询扩展的效果。
-
公开(公告)号:CN110457317A
公开(公告)日:2019-11-15
申请号:CN201910666140.5
申请日:2019-07-23
Applicant: 昆明理工大学
Abstract: 本发明涉及一种基于状态视图的Hilbert曲线编码和解码方法,属于地理信息系统技术领域。本发明包括Hilbert曲线状态视图构建阶段,对给定状态,分别构建2个用于编码的物理坐标和编码值的映射表、物理坐标和下一阶状态的映射表以及2个用于解码的编码值和物理坐标的反向映射表、编码值和下一阶状态的反向映射表;Hilbert曲线编码阶段,从输入坐标x和y的二进制表示中最大不全为0的位开始查询状态图,计算Hilbert编码;Hilbert解码阶段,从输入的Hilbert编码的二进制表示中最大不为0的位置开始查询状态视图,计算物理坐标值。本发明可降低Hilbert编码的复杂度,且能更好地适应数据的偏斜分布。
-
公开(公告)号:CN108491462A
公开(公告)日:2018-09-04
申请号:CN201810179478.3
申请日:2018-03-05
Applicant: 昆明理工大学
Abstract: 本发明公开了一种基于word2vec的语义查询扩展方法及装置,属于信息检索技术领域。本发明方法包括:用户给定查询的预处理步骤:对查询进行分词处理,去除停用词并进行词干还原;扩展词候选集选取步骤:使用word2vec工具选取初始扩展词;建立扩展词表步骤:对扩展词候选集进行过滤,建立实际扩展词表;扩展检索步骤:将用户查询及其扩展词与索引集进行匹配,返回相关文档并排序。本发明提出一种面向扩展词的查询向量生成方法来过滤候选扩展词并构建扩展词表,从而更好的体现扩展词与整个查询的相关性,进而提高查询扩展的效果。
-
公开(公告)号:CN110457531B
公开(公告)日:2022-11-01
申请号:CN201910666139.2
申请日:2019-07-23
Applicant: 昆明理工大学
IPC: G06F16/901 , G06F16/903
Abstract: 本发明涉及一种基于OpenMP的并行字符串查询方法,属于数据库技术领域。包括字符串数据集预处理步骤,对字符串数据集和查询集按照字典序升序排序并统计各首字母下所有字符串的字符串数量;索引创建步骤,基于贪婪分区方法将数据集划分成K个分区并创建分区表,然后基于OpenMP并行为每个分区创建独立的双数组Trie索引结构;检索步骤,对一批待查询的字典序有序的查询集,根据分区表确定各查询对应的分区号并在相应分区内进行并行检索。本发明通过贪婪分区算法和OpenMP等技术创建分区双数组,使分区负载更为均衡,进而可提高双数组创建以及检索的效率。
-
公开(公告)号:CN119829743A
公开(公告)日:2025-04-15
申请号:CN202510027523.3
申请日:2025-01-08
Applicant: 昆明理工大学
IPC: G06F16/334 , G06F16/335 , G06F16/353 , G06F16/31 , G06F40/30 , G06F18/22 , G06F18/243
Abstract: 本发明涉及一种基于签名的集合语义相似度连接方法,属于数据库和信息检索领域。包括四部分内容:首先,分类树构建步骤:给定数据集,根据WordNet知识库构建分类树;其次,集合签名步骤:将数据集中每个集合进行签名,获得对应的签名数据集;随后,数据预处理步骤:将签名数据集中集合进行排序,得到排序后的数据集;最后,连接处理步骤:对排序后的数据集中的集合执行自连接,获得语义相似结果对集。本发明基于签名前缀过滤技术、长度过滤技术,最终实现集合语义相似度连接方法,可有效提高集合语义连接效率。
-
公开(公告)号:CN119829690A
公开(公告)日:2025-04-15
申请号:CN202510026197.4
申请日:2025-01-08
Applicant: 昆明理工大学
Abstract: 本发明涉及一种基于HQuadTree的空间范围查询方法,属于空间数据库索引技术领域。本发明包括空间索引构建和空间范围查询两个部分。在索引构建时,将Hilbert曲线和QuadTree结合,创建HQuadTree索引。查询执行时,给定一个查询q,采用深度优先结合有限广度扩展的策略对空间范围查询进行适度下钻,可有效降低返回的无效对象的数量。此外为避免下钻过程中的相交判断次数,提出快速相交判断策略来减少判断次数,从而可有效查询效率。
-
公开(公告)号:CN110457317B
公开(公告)日:2023-06-20
申请号:CN201910666140.5
申请日:2019-07-23
Applicant: 昆明理工大学
Abstract: 本发明涉及一种基于状态视图的Hilbert曲线编码和解码方法,属于地理信息系统技术领域。本发明包括Hilbert曲线状态视图构建阶段,对给定状态,分别构建2个用于编码的物理坐标和编码值的映射表、物理坐标和下一阶状态的映射表以及2个用于解码的编码值和物理坐标的反向映射表、编码值和下一阶状态的反向映射表;Hilbert曲线编码阶段,从输入坐标x和y的二进制表示中最大不全为0的位开始查询状态图,计算Hilbert编码;Hilbert解码阶段,从输入的Hilbert编码的二进制表示中最大不为0的位置开始查询状态视图,计算物理坐标值。本发明可降低Hilbert编码的复杂度,且能更好地适应数据的偏斜分布。
-
公开(公告)号:CN108776666B
公开(公告)日:2022-05-20
申请号:CN201810420941.9
申请日:2018-05-04
Applicant: 昆明理工大学
IPC: G06F16/31 , G06F16/9537
Abstract: 本发明涉及一种基于关键词倒排与Trie的空间关键词查询方法及装置,本发明方法包括:数据预处理步骤,将数据集D中所有位置点编码成长度为n的字符串,以该字符串为排序对象按字典序对数据集D中每行数据排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;空间关键词索引建立步骤,对记录集R中关键词集建立倒排索引,之后,对任一关键词所属id对应的字符串构建Trie,得到关键词倒排与Trie组合的索引结构;空间关键词查询步骤,检索关键词倒排与Trie组合的索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。
-
-
-
-
-
-
-
-
-