-
公开(公告)号:CN118503424A
公开(公告)日:2024-08-16
申请号:CN202410649214.5
申请日:2024-05-23
Applicant: 天津中科闻歌科技有限公司 , 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F18/241 , G06F18/214 , G06N10/60
Abstract: 本发明公开了一种基于多任务量子启发式神经网络的文本分类方法,包含以下步骤:步骤1、针对收集的海量数据先进行正则化、降重、剔除信息熵含量低的文本处理;步骤2、制作数据集,将数据集中的文本按最终任务需求进行划分;步骤3、对整理的数据集再进行细粒度分类,按需划分为训练集、测试集与验证集。本发明融合了量子启发式神经网络与多任务学习的功能,借鉴了量子计算的原理与解析文本特征间的相互作用,同时处理多个相互关联的任务。通过这种方式,本方法可以更精细地捕捉到文本内容的多样性和复杂性。
-
公开(公告)号:CN114841353B
公开(公告)日:2024-08-09
申请号:CN202210460271.X
申请日:2022-04-28
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
IPC: G06N10/60 , G06F40/211 , G06F40/30
Abstract: 本发明公开了一种融合句法信息的量子语言模型建模方法,该方法从表示句子的量子系统入手,在模型中引入句法结构信息,以提高量子语言模型的建模能力,包括数据的预处理及句法结构生成模块、句法指导的单词表示模块、语义和语法信息融合的句子表达模块;所述数据的预处理及句法结构生成模块将句子处理成句法结构树的形式;句法指导的词向量表达模块利用每个句子的依存信息,训练单词的词向量表达;语义和语法信息融合的句子表达模块将上一步生成的词向量转换为密度矩阵,进一步得到句法指导的句子表达,以用于下游任务的训练;本发明基于句法结构树重构密度矩阵的生成与表达,利用依存关系建模了句子的词项依赖。
-
公开(公告)号:CN118394748A
公开(公告)日:2024-07-26
申请号:CN202410514210.6
申请日:2024-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/215 , G06F16/22
Abstract: 本发明提供了一种数据监测系统,系统包括处理器、存储器和数据库,存储器中存储有计算机程序,数据库中存储有监测规则参考表,处理器用于:获取用户输入的监测任务信息集M;对于M中的Mr,如果当前时间为Tr对应的监测时间,则利用DRr对Mr对应的当前需要处理的数据集DCr进行监测,得到对应的监测结果RSr;如果RSr为表征DCr的质量不满足预设要求的结果,输出对应的提示信息。本发明能够多维度对数据质量进行自动监测,能够提高监测效率和监测准确率。
-
公开(公告)号:CN113159874B
公开(公告)日:2024-07-23
申请号:CN202110570420.3
申请日:2021-05-25
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
IPC: G06Q30/04 , G06Q40/12 , G06Q10/0635 , G06Q30/018
Abstract: 本发明提供了一种增值税发票的检测方法、装置和可读存储介质。增值税发票的检测方法,包括获取数据,对数据进行数据处理,得到清洁数据;基于清洁数据,获取第一特征向量集合;基于第一特征向量集合,采用第一风险量化模型进行检测,得到第一风险量化值;基于企业关联关系拓扑图,获取风险扩散变量;基于风险扩散变量和第一风险量化值,获取第二特征向量集合;基于第二特征向量集合,采用第二风险量化模型进行检测,获取第二风险量化值。本发明提出了洗票风险扩散机制,对洗票风险在企业之间的扩散过程进行建模,实现了企业间风险扩散行为的精确捕获与计算,同时清晰地区分了正常企业与洗票嫌疑企业。
-
公开(公告)号:CN118227262A
公开(公告)日:2024-06-21
申请号:CN202410364624.5
申请日:2024-03-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供了一种针对流式数据处理的弹性扩缩容方法及装置,涉及云原生技术领域,部署于Kubernetes平台中,通过监控指标参数集合中的各个指标,获取所述指标参数集合中各个指标对应的参数值;所述指标参数集合中包括至少一个关于流式数据任务的自定义指标;基于所述各个指标对应的参数值,结合预设告警规则生成告警消息;响应于所述告警消息,对所述各个指标对应的参数值进行分析,以生成目标资源的配置信息;所述目标资源为基于自定义资源定义CRD创建的自定义资源;基于所述目标资源的配置信息,对所述目标资源对应的Deployment进行扩缩容。本申请实施例用于在Kubernetes平台中处理流式数据业务时,提高业务处理的效率。
-
公开(公告)号:CN112613293B
公开(公告)日:2024-05-24
申请号:CN202011593291.1
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06V30/19
Abstract: 本发明实施例公开了一种摘要生成方法、装置、电子设备及存储介质,所述方法包括:获取摘要文本信息;分别确定预设图像集中至少一个图像与所述摘要文本信息的图文相似度;分别提取所述至少一个图像中的图像文本信息,并确定各所述图像的图像文本信息与所述摘要文本信息的文本相似度;基于各所述图像的图文相似度和文本相似度确定与所述摘要文本信息相匹配的摘要图像;基于所述摘要图像和所述摘要文本信息形成目标摘要。本发明实施例的技术方案实现了当用户阅读初始文本时,可以通过摘要图像直观的了解文本的大致内容,通过阅读摘要文本信息获知文本主旨内容,提高用户的阅读体验感。
-
公开(公告)号:CN113051918B
公开(公告)日:2024-05-14
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F18/214 , G06F18/25 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN117786465A
公开(公告)日:2024-03-29
申请号:CN202410199457.3
申请日:2024-02-23
Applicant: 北京中科闻歌科技股份有限公司 , 天津中科闻歌科技有限公司
IPC: G06F18/24 , G06F18/214 , G06N3/08
Abstract: 本发明公开了一种领域预训练模型数据构建方法和系统,包括:自动化数据质量筛选模块。本模块采用混合算法,结合领域专家知识和自定义规则,自动筛选用于标注的原始数据质量,对于低质量的文本数据在本环节直接排除掉。自定义的规则包括:文本信息熵筛查、困惑度筛查、重复度筛查、完整性筛查。本发明一种领域预训练模型数据构建系统及方法,能够提高数据集的质量和多样性,确保预训练模型在领域的应用场景中发挥出最佳的效能。
-
公开(公告)号:CN112685204B
公开(公告)日:2024-03-05
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN113672731B
公开(公告)日:2024-02-23
申请号:CN202110881327.4
申请日:2021-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 析结果的准确率。本公开实施例涉及一种基于领域信息的情感分析方法,该方法包括:对待分析的文本信息进行预处理,并获取领域信息;将待分析的文本信息输入到预先融合有领域信息的情感分类模型中,获取文本信息的情感类别;融合有领域信息的情感分类模型包括:全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略;其中,基于与领域信息匹配的局部情感语义模型,获取局部情感概率值;基于全局情感语义模型,获取全局情感概率值;基于与领域信息匹配的情感融合策略,对局部情感
-
-
-
-
-
-
-
-
-