专利检索 ap:("中国科学院自动化研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"毛文吉" 第 1 页

1.

发明授权
基于混合神经网络的社交网络谣言识别方法及系统有权

公开(公告)号：CN108563686B

公开(公告)日：2021-07-30

申请号：CN201810208801.5

申请日：2018-03-14

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王慧 , 徐楠 , 陈观淡 , 毛文吉 , 汪立东 , 付戈 , 刘春阳 , 王萌

IPC分类号： G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08

摘要： 本发明涉及计算机技术领域，具体提供了一种基于混合神经网络的社交网络谣言识别方法及系统，旨在解决如何在考虑谣言转发评论信息的情况下，准确识别社交网络中谣言的技术问题。为此目的，本发明中社交网络谣言识别方法，首先利用三种不同的神经网络分别获取用户特征向量、原文特征向量和传播信息特征向量，然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量，最后利用第四种神经网络对融合后的特征向量进行谣言识别。基于上述步骤，能够快速且准确地检测到社交网络中的谣言。同时，本发明中的系统能够执行并实现上述步骤。

2.

发明公开
结合用户情感表达方式的中文情感新词识别方法和系统有权

公开(公告)号：CN105786991A

公开(公告)日：2016-07-20

申请号：CN201610089962.8

申请日：2016-02-18

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 林俊杰 , 毛文吉 , 刘春阳 , 王磊 , 苗琳

IPC分类号： G06F17/30 , G06F17/27

CPC分类号： G06F17/30731 , G06F17/2715

摘要： 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中，该方法包括获取输入文本；基于所述输入文本中词频大于第一预设阈值的字符串，构建候选新词集合；使用中文旧词词库对所述候选新词集合进行过滤；基于统计指标从过滤的候选新词集合中筛选新词，构建新词集合；其中，所述统计指标为构词能力、点互信息、灵活度和邻接熵；基于情感倾向点互信息，从所述新词集合中识别情感新词，构建初始情感新词集合；基于所述输入文本中涉及的用户的情感表达方式，从所述初始情感新词集合中筛选高置信度情感新词，并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

3.

发明授权
融合变体词识别的短文本审核方法及装置有权

公开(公告)号：CN112287684B

公开(公告)日：2024-06-11

申请号：CN202011192254.X

申请日：2020-10-30

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王婧宜 , 王宇琪 , 王磊 , 毛文吉 , 曾大军 , 王祥 , 王元杰

IPC分类号： G06F40/295 , G06F40/30

摘要： 本发明属于领域，具体涉及了一种融合变体词识别的短文本审核方法及装置，旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括：构建配置词库，基于社交媒体平台获取待审核文本数据，对待审核文本数据进行筛选获得可疑文本数据，并去除无意义信息并计算文本特征向量和统计特征向量，将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本，利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新，提高了文本审核的准确率和更新速度。

4.

发明公开
融合变体词识别的短文本审核方法及装置有权

公开(公告)号：CN112287684A

公开(公告)日：2021-01-29

申请号：CN202011192254.X

申请日：2020-10-30

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王婧宜 , 王宇琪 , 王磊 , 毛文吉 , 曾大军 , 王祥 , 王元杰

IPC分类号： G06F40/295 , G06F40/30

摘要： 本发明属于领域，具体涉及了一种融合变体词识别的短文本审核方法及装置，旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括：构建配置词库，基于社交媒体平台获取待审核文本数据，对待审核文本数据进行筛选获得可疑文本数据，并去除无意义信息并计算文本特征向量和统计特征向量，将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本，利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新，提高了文本审核的准确率和更新速度。

5.

发明授权
面向大规模分类体系的短文本标签方法、系统、装置有权

公开(公告)号：CN110059181B

公开(公告)日：2021-06-25

申请号：CN201910202727.0

申请日：2019-03-18

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王磊 , 闫鹏 , 张丽 , 郎佳奇 , 王帅 , 潘进 , 毛文吉 , 王钲淇 , 段运强

IPC分类号： G06F16/35

摘要： 本发明属于文本分类领域，具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置，旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括：获取待分类的第一短文本信息集合，并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合；基于规则的分类方法、有监督的神经网络分类方法，对第二短文本信息集合进行二分类后进行短文本过滤，并基于同样的分类方法进行各短文本的第一、二级分类标签，基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。

6.

发明授权
结合写作特征和序列特征的中文情感新词识别方法和系统有权

公开(公告)号：CN105740236B

公开(公告)日：2018-09-07

申请号：CN201610066957.5

申请日：2016-01-29

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 林俊杰 , 毛文吉 , 王磊 , 王卿 , 马宏远

IPC分类号： G06F17/27

摘要： 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句，基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如：字、词性等)的序列。然后，针对特征表示的文本子句，利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中，线性链条件随机场模型基于包含传统情感词的文本训练得到。接着，基于文本子句中字的序列和情感词标签序列，利用有限状态自动机识别文本子句中的情感词，形成情感词集合。最后，利用中文旧词词库对情感词集合进行过滤，将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。

7.

发明公开
面向大规模分类体系的短文本标签方法、系统、装置有权

公开(公告)号：CN110059181A

公开(公告)日：2019-07-26

申请号：CN201910202727.0

申请日：2019-03-18

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王磊 , 闫鹏 , 张丽 , 郎佳奇 , 王帅 , 潘进 , 毛文吉 , 王钲淇 , 段运强

IPC分类号： G06F16/35

摘要： 本发明属于文本分类领域，具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置，旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括：获取待分类的第一短文本信息集合，并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合；基于规则的分类方法、有监督的神经网络分类方法，对第二短文本信息集合进行二分类后进行短文本过滤，并基于同样的分类方法进行各短文本的第一、二级分类标签，基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。

8.

发明授权
结合用户情感表达方式的中文情感新词识别方法和系统有权

公开(公告)号：CN105786991B

公开(公告)日：2019-03-15

申请号：CN201610089962.8

申请日：2016-02-18

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 林俊杰 , 毛文吉 , 刘春阳 , 王磊 , 苗琳

IPC分类号： G06F16/36 , G06F17/27

摘要： 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中，该方法包括获取输入文本；基于所述输入文本中词频大于第一预设阈值的字符串，构建候选新词集合；使用中文旧词词库对所述候选新词集合进行过滤；基于统计指标从过滤的候选新词集合中筛选新词，构建新词集合；其中，所述统计指标为构词能力、点互信息、灵活度和邻接熵；基于情感倾向点互信息，从所述新词集合中识别情感新词，构建初始情感新词集合；基于所述输入文本中涉及的用户的情感表达方式，从所述初始情感新词集合中筛选高置信度情感新词，并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

9.

发明公开
基于混合神经网络的社交网络谣言识别方法及系统有权

公开(公告)号：CN108563686A

公开(公告)日：2018-09-21

申请号：CN201810208801.5

申请日：2018-03-14

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 孔庆超 , 王慧 , 徐楠 , 陈观淡 , 毛文吉 , 汪立东 , 付戈 , 刘春阳 , 王萌

IPC分类号： G06F17/30 , G06F17/27 , G06N3/04 , G06N3/08

摘要： 本发明涉及计算机技术领域，具体提供了一种基于混合神经网络的社交网络谣言识别方法及系统，旨在解决如何在考虑谣言转发评论信息的情况下，准确识别社交网络中谣言的技术问题。为此目的，本发明中社交网络谣言识别方法，首先利用三种不同的神经网络分别获取用户特征向量、原文特征向量和传播信息特征向量，然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量，最后利用第四种神经网络对融合后的特征向量进行谣言识别。基于上述步骤，能够快速且准确地检测到社交网络中的谣言。同时，本发明中的系统能够执行并实现上述步骤。

10.

发明公开
结合写作特征和序列特征的中文情感新词识别方法和系统有权

公开(公告)号：CN105740236A

公开(公告)日：2016-07-06

申请号：CN201610066957.5

申请日：2016-01-29

申请人： 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

发明人： 林俊杰 , 毛文吉 , 王磊 , 王卿 , 马宏远

IPC分类号： G06F17/27

CPC分类号： G06F17/2715 , G06F17/2775

摘要： 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句，基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如：字、词性等)的序列。然后，针对特征表示的文本子句，利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中，线性链条件随机场模型基于包含传统情感词的文本训练得到。接着，基于文本子句中字的序列和情感词标签序列，利用有限状态自动机识别文本子句中的情感词，形成情感词集合。最后，利用中文旧词词库对情感词集合进行过滤，将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类