一种不完整数据的Top-K查询方法和系统

    公开(公告)号:CN113569141B

    公开(公告)日:2024-10-18

    申请号:CN202110811299.9

    申请日:2021-07-19

    Abstract: 本发明公开一种不完整数据的Top‑K查询方法和系统,属于数据查询领域。包括:统计出不完整数据集中每种属性的最小值和最大值,保存数据集中各对象的主键、非主键属性值到元组列表中;遍历元组列表,计算每个对象的最低和最高可能分数,存入元组列表,定位所有对象的最低可能分数位于第K大的值,将其作为判断阈值;遍历元组列表,若对象的最高可能分数不小于判断阈值,将其加入第一候选集;遍历第一候选集,使用填补策略对缺失属性值进行估算,将估算值和最小值中的较大值作为填补值,计算填补后对象的分数,将分数不小于判断阈值的对象加入第二候选集;采用完整数据Top‑K查询方法查询。本发明确保不完整数据Top‑K查询结果正确性的同时有效提高了查询效率。

    人体行为识别方法、系统、设备及介质

    公开(公告)号:CN113869189A

    公开(公告)日:2021-12-31

    申请号:CN202111126363.6

    申请日:2021-09-24

    Abstract: 本发明公开了一种人体行为识别方法、系统、设备及介质,属于数据检索领域,方法包括:捕获目标区域内人体的RGB视频序列、加速度信号和角速度信号,提取RGB视频序列、加速度信号和角速度信号中与人体行为识别相关的视频特征、加速度特征和角速度特征;对加速度特征形成的循环矩阵和角速度特征形成的循环矩阵进行多传感器信号融合处理,得到惯性传感器融合特征向量;对惯性传感器融合特征向量与视频特征进行基于塔克分解的双模态融合,得到融合行为特征;将融合行为特征输入分类器进行人体行为识别,以预测并输出人体动作。多角度、多视角分析人体行为识别任务,解决单一模态信息缺失的问题。

    一种基于词典改进LDA模型的评论方面观点级挖掘方法

    公开(公告)号:CN110837740B

    公开(公告)日:2021-04-20

    申请号:CN201911058218.1

    申请日:2019-10-31

    Abstract: 本发明公开了一种基于词典改进LDA模型的评论方面观点级挖掘方法,属于网络评论文本挖掘领域。包括:基于原始网络评论库,构建倒排索引列表;对原始网络评论库各句子进行去停词处理,得到预处理后网络评论库;将预处理后网络评论库输入基于SentiWordNet与WordNet的改进LDA模型,采用吉布斯抽样,得到抽样结果;对抽样结果进行排序,选取属于对应评价类别的概率排名前m的单词,根据单词的倒排索引找到具体的句子。本发明将网络评论库的方面直接设置为种子词,不需要人工标注。将评价对象词与评论观点进行分离,通过计算单词与种子词的相似度对LDA模型参数进行偏置,提高模型的效果。基于倒排索引,将聚类结果同种子词及原文建立联系,提高结果的可读性。

    一种基于社区发现的社交网络影响力最大化方法及系统

    公开(公告)号:CN110838072A

    公开(公告)日:2020-02-25

    申请号:CN201911015056.3

    申请日:2019-10-24

    Abstract: 本发明公开了一种基于社区发现的社交网络影响力最大化方法及系统,属于数据挖掘领域,包括:(1)对待分析的社交网络进行社区发现,将社交网络划分为多个社区;(2)在社区内部挖掘出k1个节点作为候选种子节点,得到第一候选集合,并识别社交网络中的边界节点,从中挖掘出k2个作为候选种子节点,得到第二候选集合;(3)将第一候选集合和第二候选集合的并集作为候选种子节点集合,并利用贪心算法从候选种子节点集合中筛选出带来最大边际增益的K节点作为种子节点,构成使得社交网络影响力最大化的种子节点集合。本发明能够在降低社交网络影响力最大化的时间复杂度的同时,扩大种子节点集合的影响范围。

    一种基于词典改进LDA模型的评论方面观点级挖掘方法

    公开(公告)号:CN110837740A

    公开(公告)日:2020-02-25

    申请号:CN201911058218.1

    申请日:2019-10-31

    Abstract: 本发明公开了一种基于词典改进LDA模型的评论方面观点级挖掘方法,属于网络评论文本挖掘领域。包括:基于原始网络评论库,构建倒排索引列表;对原始网络评论库各句子进行去停词处理,得到预处理后网络评论库;将预处理后网络评论库输入基于SentiWordNet与WordNet的改进LDA模型,采用吉布斯抽样,得到抽样结果;对抽样结果进行排序,选取属于对应评价类别的概率排名前m的单词,根据单词的倒排索引找到具体的句子。本发明将网络评论库的方面直接设置为种子词,不需要人工标注。将评价对象词与评论观点进行分离,通过计算单词与种子词的相似度对LDA模型参数进行偏置,提高模型的效果。基于倒排索引,将聚类结果同种子词及原文建立联系,提高结果的可读性。

    基于多层注意力机制的跨模态检索模型的构建方法及应用

    公开(公告)号:CN113779361B

    公开(公告)日:2024-09-10

    申请号:CN202110995974.8

    申请日:2021-08-27

    Abstract: 本发明公开了一种基于多层注意力机制的跨模态检索模型的构建方法及应用,包括:S1、搭建跨模态检索模型;S2、计算图像模态和文本模态间的不变性损失、标签空间损失、以及公共表示空间中不同模态间和各个模态内的判别损失,加以不同的权重,得到跨模态检索模型的损失函数;S3、通过最小化跨模态检索模型的损失函数对跨模态检索模型进行训练。本发明在训练过程中,通过考虑不同模态之间的相互影响,分别对各图像文本数据对基于多层注意力机制学习其文本特征和图像特征内细粒度的上下文局部信息,以及学习其文本特征和图像特征之间的全局特征对应关系,充分利用了原始数据中的语义信息,将多模态特征进行融合,大大提高了跨模态检索的准确度。

    基于多层注意力机制的跨模态检索模型的构建方法及应用

    公开(公告)号:CN113779361A

    公开(公告)日:2021-12-10

    申请号:CN202110995974.8

    申请日:2021-08-27

    Abstract: 本发明公开了一种基于多层注意力机制的跨模态检索模型的构建方法及应用,包括:S1、搭建跨模态检索模型;S2、计算图像模态和文本模态间的不变性损失、标签空间损失、以及公共表示空间中不同模态间和各个模态内的判别损失,加以不同的权重,得到跨模态检索模型的损失函数;S3、通过最小化跨模态检索模型的损失函数对跨模态检索模型进行训练。本发明在训练过程中,通过考虑不同模态之间的相互影响,分别对各图像文本数据对基于多层注意力机制学习其文本特征和图像特征内细粒度的上下文局部信息,以及学习其文本特征和图像特征之间的全局特征对应关系,充分利用了原始数据中的语义信息,将多模态特征进行融合,大大提高了跨模态检索的准确度。

Patent Agency Ranking