-
公开(公告)号:CN113608946B
公开(公告)日:2023-09-12
申请号:CN202110910834.6
申请日:2021-08-10
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。
-
公开(公告)号:CN116680419A
公开(公告)日:2023-09-01
申请号:CN202310955604.0
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F40/216 , G06F40/30 , G06F40/295
Abstract: 本发明涉及自然语言处理技术领域,提供一种多源数据映射关联细粒度不良信息检测方法,所述方法包括:获取待检测文本和历史浏览文本,待检测文本和历史浏览文本属于同一用户的浏览文本;对待检测文本进行实体关系抽取,得到待检测三元组;获取历史浏览文本中的不良信息所对应的历史三元组,并基于历史三元组与待检测三元组之间的关联度,从待检测三元组中确定出待检测文本中的不良信息所对应的三元组。本发明提供的一种多源数据映射关联细粒度不良信息检测方法,能够准确从待检测三元组中确定出待检测文本中的不良信息所对应的三元组,避免传统方法中分词演变绕过黑名单机制导致漏检的问题,进一步提高的不良信息的检测精度。
-
公开(公告)号:CN112287684A
公开(公告)日:2021-01-29
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN107153672A
公开(公告)日:2017-09-12
申请号:CN201710171926.0
申请日:2017-03-22
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于言语行为理论的用户交互意图识别方法及系统,所述用户交互意图识别方法包括:基于外部知识源构建行为标记语词典;根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。本发明基于言语行为理论的用户交互意图识别方法通过基于外部知识源构建对应不同意图类别的行为标记语词典,并基于行为标记语词典自动标注扩充语料和基于特征分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。
-
公开(公告)号:CN105160251A
公开(公告)日:2015-12-16
申请号:CN201510390821.5
申请日:2015-07-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56
CPC classification number: G06F21/563 , G06F2221/033
Abstract: 本发明公开了一种APK应用软件行为的分析方法及装置,其中,该方法包括:接收用户上传的APK文件及体验数据,其中,体验数据为用户在APK文件对应的应用软件下的基础用户信息;使用体验数据在沙盒中动态运行对APK文件,并记录运行过程中APK文件的动态行为,以构建动态行为集;对APK文件进行静态分析,以构建静态行为集;根据动态行为集和静态行为集对APK文件进行综合分析,以确认APK文件的安全性能。通过运用本发明,解决了现有技术中的软件安全管理,都是在软件运行过程中进行监测,一旦发现问题对其进行记录及阻止,由于现有应用软件的复杂多样,目前的监测方式无法完全阻止非法应用软件窃取用户隐私及乱扣费等操作,用户体验较低的问题。
-
公开(公告)号:CN103257923A
公开(公告)日:2013-08-21
申请号:CN201310131986.1
申请日:2013-04-16
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种数据中心数据分析类基准测试程序的应用选取方法及系统,该方法执行于数据中心计算机系统中,包括:步骤一,从多种应用领域中分别选取至少一个应用,组成应用集,该应用集覆盖了特定种类的编程模型;步骤二,运行该应用集中的所有应用,针对每个应用,都分别获取预定性能指标的参数值;步骤三,将各个应用所对应的该参数值分别组成一个特征向量,对所有特征向量进行聚类;步骤四,在聚类得到的每个类中,选择距离类中心点最近和最远的两个应用作为基准测试程序的应用进行基准测试。
-
公开(公告)号:CN119068376A
公开(公告)日:2024-12-03
申请号:CN202310623041.5
申请日:2023-05-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/00 , G06V40/16 , G06V40/40 , G06V10/46 , G06V10/50 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0895 , G06N3/084
Abstract: 本申请公开了一种深度伪造视频的溯源方法和装置。其中,该方法包括:利用全局特征匹配预训练数据集对第一原始模型进行训练,得到第一目标模型,第一原始模型是结合语言监督和图像自监督的多任务模型,用于从全局特征匹配预训练数据集中学习图像与图像之间的特征关联、图像与文本之间的特征关联;利用第一目标模型对深度伪造视频进行溯源。本申请解决相关技术中不能对深度伪造视频进行溯源的技术问题。
-
公开(公告)号:CN110059181B
公开(公告)日:2021-06-25
申请号:CN201910202727.0
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。
-
公开(公告)号:CN105740236B
公开(公告)日:2018-09-07
申请号:CN201610066957.5
申请日:2016-01-29
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句,基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如:字、词性等)的序列。然后,针对特征表示的文本子句,利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中,线性链条件随机场模型基于包含传统情感词的文本训练得到。接着,基于文本子句中字的序列和情感词标签序列,利用有限状态自动机识别文本子句中的情感词,形成情感词集合。最后,利用中文旧词词库对情感词集合进行过滤,将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。
-
公开(公告)号:CN119849624A
公开(公告)日:2025-04-18
申请号:CN202411916261.8
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本申请涉及一种基于多模态情感的大模型对话方法、装置、设备及介质,尤其涉及自然语言处理技术领域。包括:接收用户的多模态输入,并对多模态输入进行多模态情感分析得到多模态情感表征;将多模态情感表征和当前对话上下文输入情感生成网络,得到情感生成网络输出的当前情感倾向;基于当前情感倾向对历史情感倾向进行更新,得到目标情感倾向;将目标情感倾向和当前对话上下文输入解码器,得到解码器输出的情感回复内容。本申请实施例提升了情感理解的准确性,适应于用户情感波动,能够生成连贯且一致的情感回复内容。
-
-
-
-
-
-
-
-
-