-
公开(公告)号:CN118573398A
公开(公告)日:2024-08-30
申请号:CN202410484577.8
申请日:2024-04-22
Applicant: 北京邮电大学
IPC: H04L9/40 , H04L67/146 , H04L61/4511 , H04L67/63
Abstract: 本公开提供一种隐藏内网服务地址的通信系统及相关方法。具体地,所述通信系统包括:第一网关、节点集群、第二网关和至少一第一服务器;其中,所述第一网关通信连接所述节点集群;所述节点集群通信连接所述第一网关和第二网关;所述第二网关通信连接所述第一服务器;其中,所述第一服务器用于提供所述内网服务;所述节点集群包括至少一多跳链路且每一所述多跳链路对应一所述内网服务;所述多跳链路包括通信连接的第一链路和第二链路,所述第一链路由所述第一网关确定;所述第二链路由所述第二网关确定。基于这样的通信系统,第一网关、节点集群和第二网关均无法同时获悉用户端的地址和内网服务的地址,有效保证了内网服务通信的匿名性。
-
公开(公告)号:CN110232149B
公开(公告)日:2022-03-01
申请号:CN201910385776.2
申请日:2019-05-09
Applicant: 北京邮电大学
IPC: G06F16/9535 , G06F16/33
Abstract: 本申请公开了一种热点事件检测方法和系统,包括:对文本进行预处理、分词和向量化,计算文本相似度矩阵;对文本相似度矩阵进行聚类,得到聚类结果集;提取聚类结果集中的关键词,计算关键词向量之间的距离;判断距离与阈值之间的关系,若小于等于阈值,则输出关键词向量对应的聚类结果,得到融合结果集;输入融合结果集至分类器,得到热点事件关键词和热点事件对应的文本分类器。通过提取聚类结果的关键词,使用词向量对聚类关键词进行向量化表示,判断关键词向量之间的距离,对同一事件的多方向讨论进行归并,提高语义识别程度。使用分类器对融合结果集进行分类,能够在包含固有话题的数据中检测热点事件,提高热点事件的识别准确率。
-
公开(公告)号:CN113609306A
公开(公告)日:2021-11-05
申请号:CN202110893417.5
申请日:2021-08-04
Applicant: 北京邮电大学
Abstract: 本发明公开了一种对抗残差图变分自编码器的社交网络链接预测方法及系统,包括如下步骤:利用数据采集技术获取某一时刻下的社交网络数据,包括用户的推文数据和用户之间的交互数据;基于用户的交互进行社交网络图结构抽象,其中节点表示社交网络中的真实用户,边表示用户之间的关系;利用Bert模型提取用户推文数据中的内容语义信息,表示成固定长度的向量,作为用户的内容语义;将社交网络图结构和用户的内容语义作为输入,利用批量正则化下的对抗残差图变分自编码器提取拓扑结构特征和语义特征,融合得到低维连续向量空间中的节点表示;两两计算节点向量表示之间的点积,反映节点间的相似度,将高于给定阈值的两个节点认定为会在未来产生链接关系,从而实现社交网络链接预测。
-
公开(公告)号:CN110020062B
公开(公告)日:2021-09-24
申请号:CN201910292891.5
申请日:2019-04-12
Applicant: 北京邮电大学
IPC: G06F16/951 , G06F16/958
Abstract: 本发明实施例提供了一种可定制的网络爬虫方法及系统,其中可定制的网络爬虫方法,包括:通过人工输入配置界面获取单个待生成爬虫任务的配置项;利用所述配置项中的第一爬虫名称,查找为所述第一爬虫名称预先配置的网站静态配置文件,作为目标静态配置文件;通过所述目标静态配置文件中包含的第一网站运行配置文件名称,查找为所述第一网站运行配置文件名称预先配置的网站运行配置文件,作为目标运行配置文件;基于所述目标静态配置文件、所述目标运行配置文件及所述配置项,生成包含所述配置项的爬虫任务;获取所述目标静态配置文件中包含的爬虫入口链接;执行用于对所述爬虫入口链接进行目标数据抓取的爬虫任务。
-
公开(公告)号:CN110222172B
公开(公告)日:2021-03-16
申请号:CN201910403573.1
申请日:2019-05-15
Applicant: 北京邮电大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于改进层次聚类的多源网络舆情主题挖掘方法,涉及主题挖掘领域。具体包括以下步骤:步骤一、获取词向量;步骤二、对所有数据进行预处理;步骤三、对步骤二预处理后总的样本数据句向量化;步骤四、进行句向量半监督层次主题挖掘;步骤五、输出树状图Dendrogram。本发明利用层次聚类算法包含层次信息的优点,并在此基础上从先验知识使用、模型输入向量化、优质主题筛选等角度进行优化,最终使得本文提出的方法能有效适用于主题广泛、文本噪声多、语法缺少规范的多源网络平台短文本的主题挖掘。
-
公开(公告)号:CN110413989B
公开(公告)日:2020-11-20
申请号:CN201910533898.1
申请日:2019-06-19
Applicant: 北京邮电大学
IPC: G06F40/284 , G06F40/30
Abstract: 本申请公开了一种领域语义关系图的文本领域确定方法与系统,包括:对待分析文本进行处理得到语句集合和文本词汇集合;确定所述文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,所述领域语义关系图为根据从网络平台中采集的文本生成的;根据语句集合和领域语义关系图,确定词汇联合得分;根据词汇联合得分和文本词汇得分确定领域总得分;根据所述领域总得分确定所述待分析文本所属的文本领域。根据从网络平台中采集的文本生成的领域语义关系图,通过确定待分析文本中的文本词汇集合中各词汇在领域语义关系图中的文本词汇得分,能够根据需要针对特殊领域对文本进行分析。通过设置语义关联关系、权重系数和专属属性,提高灵活性和针对性。
-
公开(公告)号:CN111178498A
公开(公告)日:2020-05-19
申请号:CN201911252197.7
申请日:2019-12-09
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种股票预测方法及装置,获取待预测的目标股票的多源历史数据,以及与目标股票相关的参考股票的多源历史数据;其中,股票的多源历史数据包括:在预测时间点之前预设数量个单位时间的每个单位时间内与股票相关的股市量化数据,新闻标题数据以及网络评价数据;从多源历史数据中提取特征数据;基于参考股票的多源历史数据的特征数据,对目标股票的多源历史数据的特征数据进行修正,得到目标股票的修正数据;将修正数据输入预测模型,得到目标股票的波动预测结果。综合考虑了多个数据源的历史数据,包括股市量化数据,新闻标题数据以及网络评价数据,能够更准确的捕捉股票波动的趋势。
-
公开(公告)号:CN111144709A
公开(公告)日:2020-05-12
申请号:CN201911244272.5
申请日:2019-12-06
Applicant: 北京邮电大学
IPC: G06Q10/06 , G06F40/289 , G06F40/211
Abstract: 本发明实施例提供了一种机器生成文本的新颖度确定方法及装置:获取机器生成文本以及机器生成文本对应的多个参考文本;根据机器生成文本包括的词语,以及多个参考文本包括的词语,确定机器生成文本的重叠因子;根据机器生成文本包括的短句,确定机器生成文本的重复惩罚因子;根据机器生成文本的文本长度,多个参考文本的平均文本长度以及多个参考文本的最小文本长度,确定机器生成文本的长度惩罚因子;根据机器生成文本的重叠因子、重复惩罚因子和长度惩罚因子,确定机器生成文本的新颖度。综合考虑了机器生成文本与参考文本的重叠度,机器生成文本自身的重复度,机器生成文本和参考文本的长度因素,更有效的衡量机器生成文本的新颖度。
-
公开(公告)号:CN104091206B
公开(公告)日:2017-07-28
申请号:CN201410273421.1
申请日:2014-06-18
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于演化博弈论的社交网络信息传播预测方法,首先将社交网络的信息聚类成不同的类别,然后建立信息博弈传播模型,并通过学习的方法拟合模型参数得到描述信息相互作用关系的收益矩阵,最后利用信息传播模型,对信息传播能力进行预测。本发明方法通过演化博弈来表示社交网络上信息之间的相互作用,并建立信息博弈传播模型揭示信息博弈和信息传播的关系,从而在信息相互作用且用户顶点传播多条信息的情况下,获得对信息在社交网络传播的预测。
-
公开(公告)号:CN104091206A
公开(公告)日:2014-10-08
申请号:CN201410273421.1
申请日:2014-06-18
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于演化博弈论的社交网络信息传播预测方法,首先将社交网络的信息聚类成不同的类别,然后建立信息博弈传播模型,并通过学习的方法拟合模型参数得到描述信息相互作用关系的收益矩阵,最后利用信息传播模型,对信息传播能力进行预测。本发明方法通过演化博弈来表示社交网络上信息之间的相互作用,并建立信息博弈传播模型揭示信息博弈和信息传播的关系,从而在信息相互作用且用户顶点传播多条信息的情况下,获得对信息在社交网络传播的预测。
-
-
-
-
-
-
-
-
-