Patent search ap:("上海观安信息技术股份有限公司") AND inv:"周晓勇" Page 1

1.

发明授权
一种基于网站文本内容的网贷网站实体识别方法及系统有权

公开(公告)号：CN111078978B

公开(公告)日：2024-02-27

申请号：CN201911209943.4

申请日：2019-11-29

Applicant: 上海观安信息技术股份有限公司

Inventor： 梁淑云 , 刘胜 , 马影 , 陶景龙 , 王启凡 , 魏国富 , 徐明 , 殷钱安 , 余贤喆 , 周晓勇

IPC: G06F16/951 , G06F16/958 , G06F40/295 , G06Q50/26

Abstract: 本发明提供一种基于网站文本内容的网贷网站实体识别方法及系统，包括S01、构建训练集域名表；S02、构建预测集域名表；S03、数据清洗与预处理；S04、文本分类模型训练，得到目标文本分类模型；S05、网贷网站识别，将预测集域名表中每个样本的目标网页内容字段输入值目标文本分类模型，输出每个样本对应的是否为网贷网站字段；S06、命名实体识别模型训练，得到目标命名实体识别模型；S07、实体名称标注。本发明基于运营商DPI数据，获取用户访问的网站域名host，获得网页内容并识别出网贷网站，同时利用命名实体识别技术提取出网贷网站中实体名称，进而结合外部黑名单数据，对一些不良网站打标，建立企业黑名单库，这种方法准确率高，

2.

发明授权
一种针对模型倾斜攻击的检测方法及系统有权

公开(公告)号：CN112733140B

公开(公告)日：2023-12-22

申请号：CN202011605328.8

申请日：2020-12-28

Applicant: 上海观安信息技术股份有限公司

Inventor： 刘胜 , 梁淑云 , 马影 , 陶景龙 , 王启凡 , 魏国富 , 徐明 , 殷钱安 , 余贤喆 , 周晓勇

IPC: G06F21/56 , G06F21/64 , G06F18/22 , G06F18/214

Abstract: 本发明一种针对模型倾斜攻击的检测方法及系统，包括以下步骤：步骤S1，获取被篡改的训练数据集data11,测试数据集data22；步骤S2，对数据集样本进行分词处理，得到N维的样本数据特征向量V；步骤S3，对N维的样本数据特征向量V进行编码，生成样本指纹；步骤S4，对所得到的指纹进行相似度匹配，得到相似度高的样本集即为篡改数据。本发明所提供的一种针对存在大量相似文本的训练数据导致模型分类产生倾斜的攻击方式的检测方法，通过人为修改样本数据，保证样本数据存在大量重复，样本数据更准确，基于指纹相似度匹配可快速识别。另外，本发明所提供的检测方法还可应用在模型反馈机制武器化的检测上，通过对海量反馈信息进行相似度匹(56)对比文件姜雪等.基于语义指纹的海量文本快速相似检测算法研究《.电脑知识与技术》.2016,(第36期),

3.

发明授权
基于颜色分量和感知哈希算法的人像采集环境验证方法及系统有权

公开(公告)号：CN110969202B

公开(公告)日：2023-12-19

申请号：CN201911193699.7

申请日：2019-11-28

Applicant: 上海观安信息技术股份有限公司

Inventor： 陶景龙 , 梁淑云 , 刘胜 , 马影 , 王启凡 , 魏国富 , 徐明 , 殷钱安 , 余贤喆 , 周晓勇

IPC: G06V10/764 , G06V10/774 , G06V10/74

Abstract: 本发明公开了一种基于颜色分量和感知哈希算法的人像采集环境验证方法及系统，包括S100，获取样本数据集合；S200，预处理样本数据，包括正样本和负样本；S300，针对预处理的样本数据，生成数据集D；S400，使用支持向量机分类算法结合数据集D进行分类模型训练，得到训练完成的分类模型；S500，对待检验的人像图片和环境图片，使用分类模型进行预测，输出是否匹配的预测结果。本发明采用感知哈希算法可以有效获得图像的重要内容特征，而颜色分量统计算法从颜色角度出发，弥补了前述算法对颜色信息的计算缺陷，并将两种方法所计算的相似度结(56)对比文件Choi, YS ET AL.Image hash generationmethod using hierarchical histogram.《MultiMedia Tools and applications》.2012,赵佳等.结合裁剪技术的颜色特征匹配搜索《.宜宾学院学报》.2016,(第06期),

4.

发明授权
一种基于距离的数值分布异常检测方法及检测系统有权

公开(公告)号：CN112465073B

公开(公告)日：2023-08-08

申请号：CN202011536865.1

申请日：2020-12-23

Applicant: 上海观安信息技术股份有限公司

Inventor： 殷钱安 , 陶景龙 , 梁淑云 , 刘胜 , 马影 , 王启凡 , 魏国富 , 余贤喆 , 周晓勇

IPC: G06F18/2433 , G06F18/2413 , G06F21/62 , G06F11/34

Abstract: 本发明提供一种基于距离的数值分布异常检测方法，属于计算机数据安全技术领域。对于数据组而言，剔重前计算得到的距离为整体数组的每个数据对象的分布情况，体现数据数值分布特点，剔重后计算得到的距离体现数据数值分布的广度。本发明通过分别计算剔重前、剔重后的数值距离，将数组中数值整体分布与数组中数值的集中程度结合，既可以检测低频异常值或者孤立值，同时也可以检测常见的高频行为，可以降低常见单维度异常检测算法的误报。

5.

发明授权
一种基于API的恶意文件检测方法和系统有权

公开(公告)号：CN113378156B

公开(公告)日：2023-07-11

申请号：CN202110749396.X

申请日：2021-07-01

Applicant: 上海观安信息技术股份有限公司

Inventor： 梁淑云 , 殷钱安 , 余贤喆 , 王启凡 , 陶景龙 , 徐明 , 刘胜 , 马影 , 周晓勇 , 魏国富 , 夏玉明

IPC: G06F21/53 , G06F18/214 , G06F18/24 , G06F9/448

Abstract: 本发明提供一种基于API的恶意文件检测方法和系统，所述方法包括如下步骤：将文件放入沙箱中运行，同时记录文件运行时调用的API名称、tid以及线程中API调用的顺序编号index；数据预处理，包括：对数据中的API进行处理、低频率API优化处理、新字段的生成、标签编码映射；基于处理后的数据构建特征工程，包括全局特征和局部组合特征，两部分特征集合最终拼接成一个特征集合；根据模型初次训练结果将部分杀毒软件无法判定的文件修正为“正常”的记录数，进而再次训练模型；模型预测。本发明还提供一种基于API的恶意文件检测系统。本发明对各种绕过特征码、沙箱检测的恶意文件具有一定的识别率，能够提高恶意文件检测的泛化能力。

6.

发明授权
异常访问行为的检测方法、装置、存储介质及电子设备有权

公开(公告)号：CN113726786B

公开(公告)日：2023-05-05

申请号：CN202111014056.9

申请日：2021-08-31

Applicant: 上海观安信息技术股份有限公司

Inventor： 余贤喆 , 梁淑云 , 殷钱安 , 王启凡 , 陶景龙 , 徐明 , 刘胜 , 马影 , 周晓勇 , 魏国富 , 夏玉明

IPC: H04L9/40

Abstract: 本申请公开了一种异常访问行为的检测方法、装置、存储介质及电子设备。其中方法包括：构建以网络地址为节点的访问行为图谱；基于目标设备的网络地址以及所述访问行为图谱，获取所述目标设备的若干访问路径；基于各所述访问路径的节点数进行异常访问行为的判断，获得异常访问行为的检测结果。本申请中，通过构建访问行为图谱，然后根据目标设备的网络地址来从该访问行为图谱中获取目标设备的访问路径，并根据各路径中节点数的多少来确定该路径是否存在访问异常行为，由此使得最终的检测结果更加准确、合理。

7.

发明授权
用户群体的分类方法、装置、存储介质及计算机设备有权

公开(公告)号：CN113836370B

公开(公告)日：2022-03-01

申请号：CN202111412279.0

申请日：2021-11-25

Applicant: 上海观安信息技术股份有限公司

Inventor： 陶景龙 , 王启凡 , 魏国富 , 殷钱安 , 余贤喆 , 周晓勇 , 梁淑云 , 刘胜 , 马影

IPC: G06F16/9035 , G06F16/906 , G06N20/00

Abstract: 本发明公开了一种用户群体的分类方法、装置、存储介质及计算机设备。其中方法包括：获取用户群体的行为数据，并对用户群体的行为数据进行预处理，得到以每个用户的用户名为主体对象的行为序列数据集；利用关联分析算法，对行为序列数据集中的频繁行为指令组合进行提取和频次统计，得到频繁指令组合特征表；通过序列对比算法，计算行为序列数据集中的各个行为序列之间的序列匹配分值和序列间相似度分值，得到序列相似性特征表；对行为序列数据集中的行为指令进行频次统计，得到行为指令频次特征表；采用半监督分类算法，对频繁指令组合特征表、序列相似性特征表和行为指令频次特征表进行分类分析，得到具有不同类别的用户群体，以提高分类效率。

8.

发明公开
投毒数据识别方法、装置、系统及计算机可读存储介质审中-实审

公开(公告)号：CN114004297A

公开(公告)日：2022-02-01

申请号：CN202111286282.2

申请日：2021-11-02

Applicant: 上海观安信息技术股份有限公司

Inventor： 马影 , 魏国富 , 周晓勇 , 夏玉明 , 刘胜 , 徐明 , 王启凡 , 梁淑云 , 余贤喆 , 陶景龙 , 殷钱安

IPC: G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明实施例公开了一种投毒数据识别方法、装置、系统及计算机可读存储介质，其中所述方法包括：获取参照干净数据集Dclean以及初始测试数据集Dtarget；将所述初始测试数据集Dtarget中，原标注标签与数据内容不一致的数据记为标签修改的投毒数据，将所述标签修改的投毒数据从所述初始测试数据集Dtarget中剔除，得到标准测试数据集D′target；根据所述参照干净数据集Dclean，将所述标准测试数据集D′target中，数据内容添加了扰动或后门触发器的数据标记为标签不变的投毒数据；删除所述标准测试数据集D′target中标签不变的投毒数据，得到纯净数据集。本发明对初始测试数据集中的标签修改投毒数据和标签不变投毒数据进行分别识别、删除，提高了投毒数据的识别准确率。

9.

发明授权
数据集质量评估方法、装置、计算机设备及存储介质有权

公开(公告)号：CN113448955B

公开(公告)日：2021-12-07

申请号：CN202110999774.X

申请日：2021-08-30

Applicant: 上海观安信息技术股份有限公司

Inventor： 马影 , 周晓勇 , 魏国富 , 刘胜 , 夏玉明

IPC: G06F16/215

Abstract: 本发明公开了一种数据集质量评估方法、装置、计算机设备及存储介质，涉及信息技术领域，主要在于能够提高数据集质量的评估精度和评估效率。其中方法包括：获取数据集中的待评估数据；分别统计所述待评估数据在多个评估维度下的属性特征；基于所述多个评估维度下的属性特征，对所述待评估数据进行质量评估，得到所述待评估数据分别在所述多个评估维度下的质量评估结果。本发明适用于数据集质量的评估。

10.

发明公开
基于数据库流量日志的低频数据泄漏检测方法及系统有权

公开(公告)号：CN113032824A

公开(公告)日：2021-06-25

申请号：CN202110224544.6

申请日：2021-03-01

Applicant: 上海观安信息技术股份有限公司

Inventor： 王启凡 , 殷钱安 , 刘胜 , 马影 , 梁淑云 , 周晓勇 , 余贤喆 , 陶景龙

IPC: G06F21/62 , G06F21/55 , G06F21/60 , G06K9/62

Abstract: 本发明提供一种基于数据库流量日志的低频数据泄漏检测方法及系统，将同一源IP地址对应相同的源端口及相同时间所产生的操作行为定义为同一用户操作行为。本发明先通过行为数据进行聚类，并根据每个类的用户，学习他们的查询的表的特征，并且特征为非频率性特征，在每个类中找到某个用户查询行为和其他用户查询行为不一致的情况，从而实现检测低频率的数据泄漏情况。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification