-
公开(公告)号:CN117236338B
公开(公告)日:2024-05-28
申请号:CN202311095973.3
申请日:2023-08-29
IPC分类号: G06F40/30 , G06F40/289 , G06F16/35 , G06F16/33 , G06F16/332 , G06N3/0442 , G06N3/047 , G06N3/0455 , G06N3/0464 , G06N3/084
摘要: 本发明公开了一种稠密实体文本的命名实体识别模型及其训练方法,其模型包括:预训练语言模型、BiLSTM细粒度捕捉层、实体标签语义网络层和CRF解码层;对于给定的稠密实体标题文本,进行数据预处理后通过预训练语言模型对每个字符进行编码,得到单词的高维语义表示;采用混合多粒度特征的方法,为每个字符拼接句子级文本特征cls;使用BiLSTM提供更细粒度的序列建模;CRF层用于对序列中的标签进行建模;获取模型总损失,得到训练好的综合模型;利用综合模型对稠密实体文本进行命名实体识别,得到识别结果。本发明解决了现有命名实体识别技术没有同时考虑实体密度高、类型粒度细的问题,全面捕获词和文本的内部结构和类别信息,提高实体识别的准确性。
-
公开(公告)号:CN117435982A
公开(公告)日:2024-01-23
申请号:CN202311312641.6
申请日:2023-10-11
IPC分类号: G06F18/2411 , G06F18/213 , G06F18/22 , G06F18/214
摘要: 本发明提供一种多维度快速识别网络水军的方法,分别从时间维度、数量维度、内容维度对水军用户进行特征提取得到数据集,通过构建支持向量机分类器,分别从各个维度对获取的账号用支持向量机进行分类,获得该维度下的疑似水军账号,同一用户账号信息至少在两个维度下被识别为疑似水军账号,以确认其为水军账号,将获得的三个维度的水军账号进行汇总,获得最终的水军账号数据。本发明所述多维度快速识别网络水军的方法,结合网络水军行为,从多个维度,采取更全面更准确的特征,层层递进对账号进行识别,确率更高,同时本方法对在识别过程中,不断缩小计算范围,具有计算量小,计算速度快的特点,可以更快更有效地对网络水军进行识别。
-
公开(公告)号:CN117236337A
公开(公告)日:2023-12-15
申请号:CN202311059824.1
申请日:2023-08-22
IPC分类号: G06F40/30 , G06N5/022 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种基于混合提示学习完成历史知识图谱生成自然语言方法,根据文本提示和软提示综合的混合提示对模型进行调优,将输入的文本和调优后的提示参数进行拼接,在加上相关的令牌参数输入预处理模型进行图生成自然语言。本发明针对中国历史领域的知识图转文本的任务提出解决策略,有效解决历史信息中非连贯的时代信息、复杂的语义表示、少样本问题,根据输入领域三元组数据生成图转文本的提示,并且使用提示学习的方法有效解决了中国历史中各种复杂的语义表征,少样本信息问题并且解决了大模型训练中存储紧张的痛点,其次融合了文本提示学习和软提示学习的优点,使用混合提示模板使方法模型收敛速度加快,生成的文本获得更好的效果。
-
公开(公告)号:CN116976485A
公开(公告)日:2023-10-31
申请号:CN202211648050.1
申请日:2022-12-21
申请人: 中科大数据研究院
IPC分类号: G06Q10/04 , G06Q50/00 , G06F16/951 , G06F16/9536 , G06F18/241 , G06F17/18
摘要: 本发明公开了一种突发事件的网络舆情演化预警方法,涉及计算机数据挖掘技术领域,包括以下步骤:步骤一,进行网络舆情数据采集并对采集数据进行预处理;步骤二,构建舆论内容情绪分类模型;步骤三,建立公众情绪演化分析模型;步骤四,舆情事件的持续追踪;步骤五,对突发事件的网络舆情演化分析预警。本发明提供的网络舆情演化预警方法,通过对在线社交平台中的热点事件的主题分析和情感挖掘,探索突发事件中不同情感对信息传播量的影响,分析公众的情感演变规律和网络舆情演化态势,从而对突发事件进行预测和调控,及时发现影响社会稳定的潜在风险,避免情绪极化现象的发生。
-
公开(公告)号:CN116467090A
公开(公告)日:2023-07-21
申请号:CN202310155137.3
申请日:2023-02-23
申请人: 中科大数据研究院
IPC分类号: G06F9/54 , G06F9/455 , H04L67/02 , H04L67/141 , H04L67/143 , H04L67/54 , H04L67/30 , H04L67/131 , H04L69/16
摘要: 本发明提供了一种unity3d三维场景与web页面元素交互通信的方法,首先使用nodejs实现websocket服务端,由unity3d开发人员根据产品需求完成三维场景效果的开发,对三维场景要完成的交互动作封装成独立的方法,在unity3d中实现支持webgl平台的webscoket通信方式,创建websocket对象,设置好websocket连接的消息接收、发送及关闭连接事件,打包生成webgl端交于web端开发人员,web应用端开发人员根据产品需求在web界面中对要展示的图表和文字的信息交互动作封装独立的方法。本发明提供一种unity3d三维场景与web页面元素交互通信的方法.该方法能有效的解决现有unity3d和web应用元素交互通信的缺点,实现双端开发人员的解耦,降低开发沟通、调式难度,有效的解决开发过程中存在的沟通成本高,开发调式不便利等问题。
-
公开(公告)号:CN116302945A
公开(公告)日:2023-06-23
申请号:CN202211743406.X
申请日:2022-12-30
IPC分类号: G06F11/36
摘要: 本发明公开了一种用于衡量Linux系统实时性的测试方法,涉及计算机技术领域,包括多个步骤,首先将源代码导入Linux系统中生成Linux内核模块和可执行文件,再将内核模块插入到Linux内核中,实现对内核信息的收集保存,之后将通过分类后的细粒度测试点通过内核模块进行测试,粗粒度测试点在用户态进行测试,并将在内核中获取到需求点延时数据后反应到用户态,通过内核模块结合粗粒度的模拟过程进行计算整理,输出反应Linux系统实时性数据。本发明通过将Linux内核态和用户态的协作,进行丰富的模拟测试,获取相应的实时性相关量化数据,使得测试结果更全面更准确。
-
公开(公告)号:CN115757837B
公开(公告)日:2023-04-28
申请号:CN202310006961.2
申请日:2023-01-04
申请人: 军工保密资格审查认证中心 , 中科大数据研究院
IPC分类号: G06F16/36 , G06F40/205 , G06F40/295 , G06F40/30 , G06F18/22
摘要: 本申请涉及一种知识图谱的置信度评估方法、装置、电子设备及计算机可读介质。该方法包括:提取待评价的知识图谱中的文本数据;提取所述文本数据中的多个命名实体;通过实体关系提取模型生成所述多个命名实体对应的多个实体三元组;将所述多个实体三元组和基准知识图谱的多个基准三元组进行比对;根据比对结果生成待评价的所述知识图谱的置信度评分。本申请涉及的知识图谱的置信度评估方法、装置、电子设备及计算机可读介质,能够对不同厂商或者公司的知识图谱进行公平客观的衡量,为其他研究者或者从业者,在后期进行数据融合时提供了便利和参考依据。
-
公开(公告)号:CN114970502B
公开(公告)日:2023-03-28
申请号:CN202111633076.4
申请日:2021-12-29
申请人: 中科大数据研究院
IPC分类号: G06F40/232 , G06F40/146 , G06Q50/26 , G06F16/958
摘要: 本发明属于计算机技术领域,具体涉及一种应用于数字政府的文本纠错方法,包含模型训练、数据采集、数据清洗、文本纠错、数据存储的方法和流程,将字音、字形和字符作为特征加入预训练模型训练,可以提高字音相近、字形相近的纠错准确率,有效减轻监管、检测人员的工作量,模型纠错准确率约为70%,加入字音、字形作为特征训练纠错模型准确率达到83%。
-
公开(公告)号:CN115757837A
公开(公告)日:2023-03-07
申请号:CN202310006961.2
申请日:2023-01-04
申请人: 军工保密资格审查认证中心 , 中科大数据研究院
IPC分类号: G06F16/36 , G06F40/205 , G06F40/295 , G06F40/30 , G06F18/22
摘要: 本申请涉及一种知识图谱的置信度评估方法、装置、电子设备及计算机可读介质。该方法包括:提取待评价的知识图谱中的文本数据;提取所述文本数据中的多个命名实体;通过实体关系提取模型生成所述多个命名实体对应的多个实体三元组;将所述多个实体三元组和基准知识图谱的多个基准三元组进行比对;根据比对结果生成待评价的所述知识图谱的置信度评分。本申请涉及的知识图谱的置信度评估方法、装置、电子设备及计算机可读介质,能够对不同厂商或者公司的知识图谱进行公平客观的衡量,为其他研究者或者从业者,在后期进行数据融合时提供了便利和参考依据。
-
公开(公告)号:CN115186109A
公开(公告)日:2022-10-14
申请号:CN202210942932.2
申请日:2022-08-08
申请人: 军工保密资格审查认证中心 , 中科大数据研究院
IPC分类号: G06F16/36 , G06F40/247 , G06F40/289 , G06F40/295
摘要: 本发明涉及安全信息网络技术领域,提供一种威胁情报知识图谱的数据处理方法、设备、介质,方法包括:获取威胁情报数据,所述威胁情报数据包括多类实体集,每类实体集包括多个实体;每个实体包括多个基本属性和多个关联属性;每个基本属性和关联属性均包括属性名和属性值,每一个关联属性的属性值为另一个实体;将每个实体的基本属性和关联属性存入一个实体文档;建立三元组列表;将三元组列表和每个实体文档转换格式,导入搜索服务器,形成威胁情报知识图谱。本方案将海量的威胁情报相关的信息进行整合、清理、图谱关联,返回关键要素和关联关系等有价值的信息,及时为网络安全的预防工作提供保障。
-
-
-
-
-
-
-
-
-