一种平滑自回归基数估计方法

    公开(公告)号:CN115328972B

    公开(公告)日:2023-05-23

    申请号:CN202211024149.4

    申请日:2022-08-24

    摘要: 本发明涉及数据库系统查询优化的基数估计技术领域,具体地说,涉及一种平滑自回归基数估计方法,包括:S1、将数据库表格数据编码后得到编码数据x;S2、对x进行平滑,期间复制x来引入不同程度的噪声得到平滑数据xrs和微弱平滑数据xcls,拼接所有平滑数据后得到输入xin;S3、将xin喂给平滑自回归模型,并进行训练;S4、通过训练好的模型进行基数估计。本发明能够达到目前最先进的基数估计准确度,能较出色地完成基数估计任务。

    一种中国学生英语朗读质量分析方法

    公开(公告)号:CN111653292B

    公开(公告)日:2023-03-31

    申请号:CN202010573319.9

    申请日:2020-06-22

    IPC分类号: G10L25/60 G10L25/24 G10L15/02

    摘要: 本发明提供一种中国学生英语朗读质量分析方法,该方法是一个由顺序连接的英语朗读发音预处理模块、英语朗读发音错误检测模块、英语朗读发音质量分析模块、英语朗读发音质量输出模块组成的分析模型。一段英语朗读语音通过该分析模型和分析方法处理后,最后能够得到这段英语朗读语音的质量分析结果。本发明分析方法解决了中国学生英语朗读发音的发音质量自动分析问题,其分析结果比传统的中国学生英语朗读发音的发音质量分析方法的分析结果更好。

    一种融合编码和多版本数据的海量空间对象存储方法

    公开(公告)号:CN106991149B

    公开(公告)日:2020-11-10

    申请号:CN201710192554.X

    申请日:2017-03-28

    IPC分类号: G06F16/29 H04L29/08

    摘要: 本发明公开一种融合编码和多版本数据的海量空间对象存储方法,采用“低精度网格编码,高精度空间对象编码”将多维空间数据转换到一维空间,然后采用“字典序定位数据块,低冗余度数据查询”策略来实现查询过程涉及到的冗余数据修剪,有效提升了范围查询性能。在编码精度为8个Base‑32字符时,一个网格单元的覆盖面积约为725m2,查询半径在1000m时,查询响应时间不超过1秒,能有效满足诸如智慧旅游中基于游客位置的旅游资源推荐等数据查询需求。

    一种电子商务平台用户重复购买行为预测方法

    公开(公告)号:CN110956497A

    公开(公告)日:2020-04-03

    申请号:CN201911181002.4

    申请日:2019-11-27

    IPC分类号: G06Q30/02 G06Q30/06

    摘要: 本发明公开了一种电子商务平台用户重复购买行为预测方法,包括:获取用户历史购买行为数据;采用分段下采样方法进行样本均衡处理;构建用户特征、商户特征、用户与商户交互特征和隐藏特征;将样本均衡的用户历史购买行为数据输入至双层注意力BiGRU个体模型中,将用户特征、商户特征、用户与商户交互特征和隐藏特征输入至深度Catboost个体模型和DeepGBM个体模型中;对各个体模型分别进行用户重复购买行为预测训练;通过Vote-Stacking模型,对训练后的各个体模型进行融合,并采用多数投票决策机制输出最终预测结果。本发明融合深度Catboost个体模型、双层注意力BiGRU个体模型和DeepGBM个体模型,对用户历史购买数据中离散的购买记录数值和行为序列特征进行建模,提高了预测结果的准确性。

    一种农业害虫综合治理装置
    6.
    发明公开

    公开(公告)号:CN118696898A

    公开(公告)日:2024-09-27

    申请号:CN202410981749.2

    申请日:2024-07-22

    IPC分类号: A01M1/02 A01M1/04 A01M1/14

    摘要: 本发明属于害虫治理技术领域,尤其涉及一种农业害虫综合治理装置,包括:箱体;诱捕机构,设置在箱体的上方;放卷组件,固定安装在箱体的一内侧壁上;绕卷组件,固定安装在箱体内与放卷组件相对的内侧壁上,放卷组件与绕卷组件对应设置;粘虫胶带,一端设置在放卷组件上,另一端设置在绕卷组件上,粘虫胶带穿出箱体的顶端;监控组件,设置在箱体的上方且与粘虫胶带对应设置;测量组件,设置在箱体内且与粘虫胶带对应设置;控制组件,设置在箱体内且与绕卷组件、测量组件、监控组件以及诱捕机构电性连接。本发明可以实现自动捕集害虫,减少了人们的工作强度,效率更高,且不存在污染环境的风险。

    时空众包在线微任务快速分配方法

    公开(公告)号:CN117707722A

    公开(公告)日:2024-03-15

    申请号:CN202311458097.6

    申请日:2023-11-04

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明涉及数据库和数据挖掘技术领域,涉及一种时空众包在线微任务快速分配方法,包括:步骤1、实时动态到达平台的时空众包参与者,根据参与者的属性分类,属于工作者存放Workers队列中,属于任务存放在Tasks队列中;步骤2、根据Workers队列和Tasks队列数量大小确定构建二分图,并采用KM算法来实现最优匹配;步骤3、输出最优的匹配对集合M。本发明能实现快速分配,能实现时空众包平台收益最大化。

    一种用于探测预训练深度语言模型生成的句子表示的方法

    公开(公告)号:CN117648922A

    公开(公告)日:2024-03-05

    申请号:CN202311397452.3

    申请日:2023-10-26

    摘要: 本发明涉及语言处理技术领域,涉及一种用于探测预训练深度语言模型生成的句子表示的方法,包括:一、给定句子W、W对应的模型M;二、从模型M中获得向量序列H=M(W);三、设计树拓扑探针,树拓扑探针首先使用结构探针计算H的探测树深序列probSeqf;然后,构建伪树深序列pesuSeqW并计算pesuSeqf与pesuSeqW之间的距离度量;四、将任务损失和距离度量输入综合损失得到最后的微调损失,通过树拓扑探针微调发现预训练深度语言模型生成的句子表示的内部结构是否具有树形结构的层次结构。本发明能较佳地探测句子表示。

    基于文本多特征的TextRank中文摘要生成方法

    公开(公告)号:CN116561296A

    公开(公告)日:2023-08-08

    申请号:CN202310462889.4

    申请日:2023-04-26

    发明人: 程珠鸿 周娅

    摘要: 本发明涉及计算机技术领域,具体涉及一种基于文本多特征的TextRank中文摘要生成方法,通过Word2vec模型对文本提取词向量,并融合为句向量后计算句子之间的相似度,以相似度为边的权值,以各句子为节点构造TextRank图模型,并计算出各句子的TextRank值,然后对文本分别进行情感词特征、关键词特征、转折词特征以及标点特征的多特征提取,计算出文本中各句子的多特征值并与各句子的TextRank值结合,最后得到各句子的权值进行句子排序,抽取排序靠前的句子作为候选摘要句。本发明在虑文本的语义特征基础上,融合了文本的情感特征,使得生成的摘要质量更高。

    一种无监督的英语短文句子跑题分析方法

    公开(公告)号:CN110287291B

    公开(公告)日:2021-11-02

    申请号:CN201910596537.1

    申请日:2019-07-03

    发明人: 黄桂敏 刘剑 周娅

    摘要: 本发明公开一种无监督的英语短文句子跑题分析方法,分析系统是一个由顺序连接的英语短文预处理模块、多元语义表示模型构建模块、英语短文表示模型构建模块、英语短文句子跑题分析模块组成。一篇英语短文通过该分析系统处理后,最后能够得到该篇英语短文中跑题的句子,以及英语短文句子跑题程度分数与评语。本发明方法解决了传统的无监督英语短文句子跑题分析方法忽略了词与词之间的语义相关性,从而导致的在进行英语短文句子跑题分析时无法准确分析出跑题句子和跑题程度评分准确差的问题。