一种平滑自回归基数估计方法
    1.
    发明公开

    公开(公告)号:CN115328972A

    公开(公告)日:2022-11-11

    申请号:CN202211024149.4

    申请日:2022-08-24

    摘要: 本发明涉及数据库系统查询优化的基数估计技术领域,具体地说,涉及一种平滑自回归基数估计方法,包括:S1、将数据库表格数据编码后得到编码数据x;S2、对x进行平滑,期间复制x来引入不同程度的噪声得到平滑数据xrs和微弱平滑数据xcls,拼接所有平滑数据后得到输入xin;S3、将xin喂给平滑自回归模型,并进行训练;S4、通过训练好的模型进行基数估计。本发明能够达到目前最先进的基数估计准确度,能较出色地完成基数估计任务。

    基于注意力的音频和歌词的多模态音乐风格分类方法

    公开(公告)号:CN113177136B

    公开(公告)日:2022-04-22

    申请号:CN202110460027.9

    申请日:2021-04-27

    摘要: 本发明涉及音乐风格分类技术领域,涉及一种基于注意力的音频和歌词的多模态音乐风格分类方法,步骤如下:一、数据获取;二、音频预处理:先对音频数据采取Mel频谱特征提取,然后经过CNN网络得到音频特征;三、歌词预处理:先进行BERT预训练得到词向量,然后经过HAN网络得到歌词特征向量;四、attention模间融合:通过Attention模间融合,将获取的音频和歌词特征,进行交互融合获取融合的Attention注意力向量,再与音频和歌词特征向量拼接,获得包含音频和歌词各自模态特征,以及模态间融合特征的音乐风格特征;五、经过softmax层进行分类。本发明能较佳地对数据进行学习和分类。

    一种完全注意力机制的属性级情感分析方法

    公开(公告)号:CN111259153B

    公开(公告)日:2021-06-22

    申请号:CN202010072375.4

    申请日:2020-01-21

    摘要: 本发明公开一种完全注意力机制的属性级情感分析方法,该方法结合基于自注意力机制网络SAM‑NN和特定方面注意力机制网络AAM‑NN来分别生成词汇级别、句子级别语义特征,最后通过一个全连接神经网络FC‑NN输出层计算评论句子内容的情感极性。本发明所提出的方法在实现上是并行结构的,并且在每一个网络计算模块,本发明都融合了特定方面信息特征,保证了该方法在尽可能的根据特定方面信息进一步分析出用户评论信息中关于目标对象特定属性方面的情感极性。与现有技术相比,本发明方法不仅有效提高特定方面情感分析任务的准确率,而且有效减少在模型训练时间上的花费。

    一种数据自适应平衡分组方法
    4.
    发明公开

    公开(公告)号:CN110175651A

    公开(公告)日:2019-08-27

    申请号:CN201910452021.X

    申请日:2019-05-28

    IPC分类号: G06K9/62 G06F17/10

    摘要: 本发明公开一种数据自适应平衡分组方法,将数据块边界点信息加入到传统聚类中,并将该聚类算法运用于分布式环境中结点数据分组中,利用数据块边界点信息约束数据块大小,使不同数据块之间满足较高的平衡性,解决了现有基于聚类的数据分组方法效率较低的问题,同时还提高了数据分组的准确率,具有很高的实用价值。

    一种自适应模型基数估计方法
    5.
    发明公开

    公开(公告)号:CN117931857A

    公开(公告)日:2024-04-26

    申请号:CN202410127245.4

    申请日:2024-01-30

    摘要: 本发明涉及一种自适应模型基数估计方法,包括:获取数据集,基于自适应平滑因子选择策略对所述数据集加入噪音,构建深度自回归模型,将加入噪音的所述数据集输入所述深度自回归模型,获取联合概率分布;获取若干个谓词,根据所述联合概率分布依次对查询中涉及的谓词进行采样,获取采样数据,通过所述采样数据,调整所述深度自回归模型的选择率,基于调整后的选择率与基数相乘,获取估计结果。本发明能够实现更加准确的估计结果。

    基于自编码器的学习型文本哈希方法

    公开(公告)号:CN113449849B

    公开(公告)日:2022-05-27

    申请号:CN202110724953.2

    申请日:2021-06-29

    IPC分类号: G06F16/31 G06N3/04 G06N3/08

    摘要: 本发明公开一种基于自编码器的学习型文本哈希方法,先利用真实采集的文本数据和/或程序生成的文本数据构建训练数据集;再构建5层的自编码器结构的哈希函数模型,并利用训练数据集对哈希函数模型进行训练;后将待哈希的文本数据输入到步骤3所训练好的哈希函数模型中,得到待哈希的文本数据的哈希值。本发明使用机器学习方法,构建学习型哈希函数模型来实现文本型数据的哈希,与传统哈希方法相比,有较低的哈希冲突率,与此同时,在哈希的运算时间上有较大改进,提高了文本哈希的效率,能够适应于大规模文本数据的哈希处理。

    一种基于情感知识增强的词语分布式表示学习系统

    公开(公告)号:CN114417814A

    公开(公告)日:2022-04-29

    申请号:CN202111531641.6

    申请日:2021-12-14

    摘要: 本发明涉及情绪侦测与情感分析技术领域,具体地说,涉及一种基于情感知识增强的词语分布式表示学习系统,其包括情感知识整合框架和弱监督知识生成框架;情感知识整合框架包括知识查询模块,知识整合模块以及词表示生成模块;弱监督知识生成框架用于生成一个领域情感词典DSD,DSD整合了目标领域的无标签文本、领域独立的情感词典和目标领域文本的标签三部分的资源。本发明能较佳地进行情感知识整合。

    基于自编码器的学习型文本哈希方法

    公开(公告)号:CN113449849A

    公开(公告)日:2021-09-28

    申请号:CN202110724953.2

    申请日:2021-06-29

    IPC分类号: G06N3/04 G06N3/08 G06F16/31

    摘要: 本发明公开一种基于自编码器的学习型文本哈希方法,先利用真实采集的文本数据和/或程序生成的文本数据构建训练数据集;再构建5层的自编码器结构的哈希函数模型,并利用训练数据集对哈希函数模型进行训练;后将待哈希的文本数据输入到步骤3所训练好的哈希函数模型中,得到待哈希的文本数据的哈希值。本发明使用机器学习方法,构建学习型哈希函数模型来实现文本型数据的哈希,与传统哈希方法相比,有较低的哈希冲突率,与此同时,在哈希的运算时间上有较大改进,提高了文本哈希的效率,能够适应于大规模文本数据的哈希处理。

    一种商品知识图谱的构建方法

    公开(公告)号:CN105912656A

    公开(公告)日:2016-08-31

    申请号:CN201610220247.3

    申请日:2016-04-07

    IPC分类号: G06F17/30 G06Q30/02

    摘要: 本发明公开一种商品知识图谱的构建方法,包括商品知识图谱的客观性商品分类知识的构建和主观性用户观点知识的构建。主观性知识的构建包含采用基于多分类器集成的方法从用户评论中挖掘观点目标和观点词的过程和直接从网站上获取观点持有者、观点发表时间和/或观点的URL信息的过程。客观性知识的构建包含采用基于多源异构分类层次融合的方法获取兼顾深度和广度的商品分类层次的过程和直接从网站上获取商品实例的过程。本发明针对商品所构建的结构化的知识图谱涵盖了客观性商品分类和主观性用户观点两类知识,不仅能够为上层服务提供商品实体的准确解释,而且还能够了解众多用户对商品及其属性的观点描述,从而为用户提供更快速、更精准、更全面的商品知识服务。