-
公开(公告)号:CN110991218B
公开(公告)日:2024-01-12
申请号:CN201910959356.0
申请日:2019-10-10
申请人: 北京邮电大学
摘要: 本申请公开了一种基于图像的网络舆情预警系统和方法,包括:信息获取模块获取网络社区中各话题的主题信息和评论信息,发送主题信息至分类与识别模块,发送评论信息至表情分析模块;分类与识别模块分类主题信息中的图像,得到图像类别,提取图像中的文字,将图像类别、图像中的文字与主题信息中的文字发送至预警与得分模块;表情分析模块分析评论信息中的图片,得到评论信息的舆情分析结果,发送至舆情预警模块;预警与得分模块根据图像类别、图像中的文字和主题信息中的文字确定舆情得分,发送至舆情预警模块;舆情预警模块根据舆情分析结果和舆情得分确定预警得分,发出预警。本申请能够准确、快速地发布与图像中的舆情对应的舆情预警。
-
公开(公告)号:CN114037946A
公开(公告)日:2022-02-11
申请号:CN202111556380.3
申请日:2021-12-17
申请人: 北京邮电大学
摘要: 本申请公开了一种视频分类的方法、装置、电子设备及介质。本申请中,可以获取待分类视频数据;将待分类视频数据输入至音视频学习网络,得到待分类视频对应的图像特征和音频特征;以及待分类视频对应的文本特征;将图像特征、音频特征以及文本特征输入至融合学习网络,得到融合特征向量;将融合特征向量输入至Softmax分类器,并将分类器输出的分类结果作为待分类视频的分类结果。通过应用本申请的技术方案,可以在获取待分类视频之后,利用预设的学习网络模型,得到该视频数据的图像特征、音频特征以及文本特征,并将该三个特征进行融合后,根据融合的特征来判断待分类视频的分类结果。从而避免了相关技术中对视频数据分类不准确的弊端。
-
公开(公告)号:CN109446441B
公开(公告)日:2020-11-03
申请号:CN201811126541.3
申请日:2018-09-26
申请人: 北京邮电大学
IPC分类号: G06F16/955 , G06F16/951
摘要: 一种通用的网络社区可信分布式采集存储系统,包括:分布式数据采集框架、快速开发框架、可信框架以及数据存储框架,其中,所述分布式数据采集框架采用了多元异构的形式,用于分布式并行的数据采集;所述快速开发框架包括多种快速开发模块,用于实现对系统的快速开发;所述可信框架包括多种性质验证模块,用于实现对数据采集过程中的多种性能的保证以及对存储数据的多种性能进行验证;所述数据存储框架包括多种数据存储模块,用于对多种复杂结构数据进行存储。本发明不但解决了现有爬虫框架中缺乏对数据可信性验证的问题,还针对结构复杂的数据设计了多种存储模块用于实现对其的有效存储;通过快速开发框架,使得开发过程更加方便和快速。
-
公开(公告)号:CN110188191A
公开(公告)日:2019-08-30
申请号:CN201910277242.8
申请日:2019-04-08
申请人: 北京邮电大学
摘要: 本申请公开了一种用于网络社区文本的实体关系图谱构建方法和系统,包括:采集网页中的文本,进行实体识别和实体关系抽取,构建语义模型;采集网络社区中的文本,进行实体识别和实体关系抽取,得到网络实体关系集合;使用分类模型对网络实体关系集合进行分类,得到实体对;对所述实体对进行层次分类计算,将实体对融合进语义模型中;对融合后的语义模型进行可视化处理,得到实体关系图谱。使用特定网页中的纯净文本生成语义模型,保证实体关系的准确性和可靠性;使用分类算法和核心实体关系集合训练分类模型,并进行评估,增加了分类的可靠性;将通过评估的网络实体关系集合加进核心语义模型,增加了核心语义模型的丰富性、稳定性和自动扩展性。
-
公开(公告)号:CN109783805A
公开(公告)日:2019-05-21
申请号:CN201811544400.3
申请日:2018-12-17
申请人: 北京邮电大学
摘要: 本申请公开一种网络社区用户识别方法及装置,涉及机器学习及用户识别技术领域。所述方法包括:提取预先收集的网络社区文本数据的第一N-gram特征并生成第一词向量;以交叉熵为代价函数,采用深度神经网络对第一词向量进行训练,得到文本内容分析模型;使用文本内容分析模型分析待识别用户的文本数据,得到内容属性;使用预设行为分析模型分析待识别用户的行为数据,得到行为属性;根据内容属性和行为属性识别待识别用户。本申请中,引入N-gram特征,并结合用户内容以及用户行为两个维度的数据进行目标用户的识别,相较于现有的单一维度数据的用户识别,大大提升了识别性能及准确度。
-
公开(公告)号:CN116669037B
公开(公告)日:2023-10-13
申请号:CN202310891068.2
申请日:2023-07-20
申请人: 北京邮电大学
IPC分类号: H04W12/122 , H04W12/67 , H04W4/40
摘要: 本发明涉及网络空间安全技术领域,尤其是指一种智能网联汽车安全评估方法、装置及存储介质。本发明所述的智能网联汽车安全评估方法,首先分析系统面临的安全威胁,根据节点关系构建层次化的攻击树模型;然后根据威胁行为特点赋予叶节点相应的属性并进行量化,从而计算根节点的风险概率。运用多属性理论和模糊层次分析法评价网络面临已知安全威胁时的风险等级,对系统脆弱性及可能产生的后果进行预测和定量分析,以便根据评估结果提出有效的防护措施,从而降低网络安全风险,提升了效率和精度。
-
公开(公告)号:CN112711948B
公开(公告)日:2022-11-11
申请号:CN202011530521.X
申请日:2020-12-22
申请人: 北京邮电大学
IPC分类号: G06F40/295 , G06F40/30 , G06N3/04
摘要: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
公开(公告)号:CN113343041A
公开(公告)日:2021-09-03
申请号:CN202110686245.4
申请日:2021-06-21
申请人: 北京邮电大学
IPC分类号: G06F16/901 , G06F16/35 , G06F40/216 , G06N3/04 , G06N3/08
摘要: 基于图模型表示学习的消息回复关系判断系统,涉及信息通讯技术领域,解决现有技术只采用两条消息的文本信息和消息间的交叉后的关系信息,没有包含群组用户信息;没有使用当前消息聊天场景的上下文信息等问题,包括图的构建和生成模块、局部图获取和合并模块、异质图注意力网络模块以及孪生网络模块;本发明基于群组内容构建群组图和生成自适应消息图,综合学习群组消息的文本信息、发送消息的群组用户信息和上下文群组消息信息,利用图模型在图结构上进行群组消息的表示学习,拼接消息对的表示向量并进一步预测群组消息间的回复关系。本发明处理不同的输入消息序列生成任务相关的局部消息图,用于捕捉消息之间的隐式关联,弥补人工构图的不足。
-
公开(公告)号:CN110263153B
公开(公告)日:2021-04-30
申请号:CN201910403543.0
申请日:2019-05-15
申请人: 北京邮电大学
IPC分类号: G06F16/35 , G06F40/247 , G06F40/289
摘要: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
公开(公告)号:CN110263153A
公开(公告)日:2019-09-20
申请号:CN201910403543.0
申请日:2019-05-15
申请人: 北京邮电大学
摘要: 本发明涉及话题发现领域,特别涉及一种面向多源信息的混合文本话题发现方法。本发明具体包括以下步骤:步骤一、对原始数据进行特征融合,得到特征均匀的结果集D;步骤二、对步骤一中得到特征均匀的结果集D,基于狄利克雷多项式混合模型的聚类方法进行聚类。本发明能够将文本向量特征不均匀的多源文本数据均匀化;通过DMM模型,提升对高噪声、低信息量的短文本数据的话题检测效果;能自动识别出聚类的类别个数,不需要事先给定簇的个数。
-
-
-
-
-
-
-
-
-