-
公开(公告)号:CN113239926B
公开(公告)日:2022-10-25
申请号:CN202110671289.X
申请日:2021-06-17
Applicant: 北京邮电大学
IPC: G06V10/22 , G06V20/62 , G06V10/40 , G06V10/774 , G06V10/764 , G06K9/62 , G06Q50/00
Abstract: 基于对抗的多模态虚假信息检测模型涉及虚假信息检测技术领域,解决了现有虚假信息伪装则检测器检测常出现错误的问题,该装置包括视觉特征提取模块、多模态预训练模块、协同视觉‑文本多头注意力模块和对抗训练模块;多模态预训练模块用于得到多融合的文本序列特征、视觉序列特征和图文内容特征;协同视觉‑文本多头注意力模块用于得到多模态线索不同层次关系的文本内容特征和视觉内容特征;对抗训练模块用于从文本、视觉和图文角度对抗训练模型以提高鲁棒性。本发明可以捕捉信息数据的多模态线索之间元素级别和模态级别的关系,充分挖掘线索之间的隐藏联系;使得多模态预训练模块能够直接应用于虚假信息检测中。
-
公开(公告)号:CN113610080A
公开(公告)日:2021-11-05
申请号:CN202110892160.1
申请日:2021-08-04
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于跨模态感知的敏感图像识别方法、装置、设备及介质,所述方法包括:获取网络社区中待识别的图像信息;将所述图像信息输入预设的敏感图像识别模型中的跨模态感知模块,得到所述图像信息的跨模态文本描述;将所述图像信息的跨模态文本描述输入所述敏感图像识别模型中的敏感信息识别模块,得到含有敏感信息的敏感图像。根据本公开实施例提供的敏感图像识别方法,旨在跨模态表达网络社区图像的语义信息内容,并融合大量网络社区敏感文本内容先验知识,对社区图像的内容进行更准确的分析判别,通过获取图像的跨模态文本描述使得对敏感图像信息的传播及追溯成为可能。
-
公开(公告)号:CN113378565A
公开(公告)日:2021-09-10
申请号:CN202110542573.7
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供一种多源数据融合的事件分析方法、装置、设备及介质,方法包括:获取第一数据源产生的当前文本,并对当前文本进行预处理得到目标文本;根据历史事件集,判断目标文本是已知事件文本还是未知事件文本;根据事件关键词搜索除第一数据源以外的其他数据源产生的相关文本;根据预设的事件热度预测模型对目标文本进行事件热度预测,得到对应的事件热度值;根据预设的摘要抽取模型对目标文本进行摘要抽取,得到对应的事件摘要;将目标文本及其对应的事件关键词、数据源、相关文本、事件热度值和事件摘要关联存储于历史事件集中。能够从多数据源对热点舆情事件进行检测和追踪,综合多维特征抽取摘要并预测事件热度,分析当前热点舆情事件。
-
公开(公告)号:CN112711948A
公开(公告)日:2021-04-27
申请号:CN202011530521.X
申请日:2020-12-22
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
公开(公告)号:CN111199002A
公开(公告)日:2020-05-26
申请号:CN201911299125.8
申请日:2019-12-17
Applicant: 北京邮电大学
IPC: G06F16/958 , G06F40/194
Abstract: 本发明实施例提供了一种信息处理方法及装置。方案如下:在预设网络中获取待确定信息源,以及待确定信息源在不同平台上发布的待处理信息;其中,预设网络是根据多个信息源在不同平台上发布的信息生成的多个数据节点之间的结构相似度和内容相似度构建的;根据结构相似度和内容相似度,计算待确定信息源与预设网络中目标信息源之间的相似度;根据该相似度和目标信息源的类别,确定待确定信息源的类别;根据待确定信息源的类别,处理待处理信息。通过本发明实施例提供的技术方案,提高了信息识别的准确性,降低了信息识别错误造成的损失。
-
公开(公告)号:CN110991218A
公开(公告)日:2020-04-10
申请号:CN201910959356.0
申请日:2019-10-10
Applicant: 北京邮电大学
Abstract: 本申请公开了一种基于图像的网络舆情预警系统和方法,包括:信息获取模块获取网络社区中各话题的主题信息和评论信息,发送主题信息至分类与识别模块,发送评论信息至表情分析模块;分类与识别模块分类主题信息中的图像,得到图像类别,提取图像中的文字,将图像类别、图像中的文字与主题信息中的文字发送至预警与得分模块;表情分析模块分析评论信息中的图片,得到评论信息的舆情分析结果,发送至舆情预警模块;预警与得分模块根据图像类别、图像中的文字和主题信息中的文字确定舆情得分,发送至舆情预警模块;舆情预警模块根据舆情分析结果和舆情得分确定预警得分,发出预警。本申请能够准确、快速地发布与图像中的舆情对应的舆情预警。
-
公开(公告)号:CN110020062A
公开(公告)日:2019-07-16
申请号:CN201910292891.5
申请日:2019-04-12
Applicant: 北京邮电大学
IPC: G06F16/951 , G06F16/958
Abstract: 本发明实施例提供了一种可定制的网络爬虫方法及系统,其中可定制的网络爬虫方法,包括:通过人工输入配置界面获取单个待生成爬虫任务的配置项;利用所述配置项中的第一爬虫名称,查找为所述第一爬虫名称预先配置的网站静态配置文件,作为目标静态配置文件;通过所述目标静态配置文件中包含的第一网站运行配置文件名称,查找为所述第一网站运行配置文件名称预先配置的网站运行配置文件,作为目标运行配置文件;基于所述目标静态配置文件、所述目标运行配置文件及所述配置项,生成包含所述配置项的爬虫任务;获取所述目标静态配置文件中包含的爬虫入口链接;执行用于对所述爬虫入口链接进行目标数据抓取的爬虫任务。
-
公开(公告)号:CN103391374B
公开(公告)日:2015-07-08
申请号:CN201310342622.8
申请日:2013-08-08
Applicant: 北京邮电大学
Abstract: 本发明涉及无线通信领域,特别是一种支持无缝切换的双系统终端,包括:非智能子系统和智能子系统,所述非智能子系统和所述智能子系统硬件独立,二者共享无线射频模块、屏幕、语音及其相关I/O接口设备,所述非智能子系统始终保持运行状态,用于进行安全通话和短信通信,所述非智能子系统和所述智能子系统通过硬件开关键完成切换。本发明的目的是通过相互隔离的两个手机系统同时运行并无缝快速切换,给用户提供安全的通信环境,保护用户隐私。
-
公开(公告)号:CN111178498B
公开(公告)日:2023-08-22
申请号:CN201911252197.7
申请日:2019-12-09
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种股票预测方法及装置,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果。综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,能够更准确的捕捉股票波动的趋势。
-
公开(公告)号:CN112711948B
公开(公告)日:2022-11-11
申请号:CN202011530521.X
申请日:2020-12-22
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种中文句子的命名实体识别方法,包括:将中文字符序列输入识别模型,由识别模型通过字符嵌入层将中文字符序列转换为字向量并输出到识别模型中的卷积网络,卷积网络对每个字向量进行卷积运算得到局部语义向量并输出到识别模型中的自适应结合层,自适应结合层对字符的局部语义向量进行注意力计算后与对应字向量拼接得到表征向量并输出到识别模型中的序列建模网络,序列建模网络对字符的表征向量进行隐层建模并将建模得到的隐层向量输出到识别模型中的标签推理层计算字符的隐层向量对应的标签。通过卷积网络提取字符的局部语义信息后与潜在词基于字词间注意力实现字词信息融合,从而实现潜在词信息的利用,避免词边界错误传递的问题。
-
-
-
-
-
-
-
-
-