一种面向实时新闻内容的流式话题演化跟踪方法

    公开(公告)号:CN108509517B

    公开(公告)日:2021-05-11

    申请号:CN201810195967.8

    申请日:2018-03-09

    申请人: 东南大学

    摘要: 本发明公开了一种面向实时新闻内容的流式话题演化跟踪方法,首先把实时采集的新闻内容,按时间段进行分批,对每一批新闻内容采用LDA方法挖掘初步话题结果;接着,在这一批新闻内容内部进行命名实体识别,并计算话题与实体间关联,以此更新实体库中的实体链接关系;然后,通过话题内部词项聚类,得到话题‑话题内类簇对应关系,并将话题结果存入话题库;最后,计算话题及其内部类簇的热度信息,并根据热度信息对LDA话题挖掘参数进行动态更新,供下一批新闻内容的话题演化跟踪使用。本发明可挖掘实时新闻内容中的话题特征以及话题内词项的类簇特征,充分利用话题间以及话题内不同类簇间的差异性,对LDA话题挖掘参数进行动态更新。

    基于数字指纹和语义特征的新闻文本侵权检测方法与装置

    公开(公告)号:CN109918621A

    公开(公告)日:2019-06-21

    申请号:CN201910119330.5

    申请日:2019-02-18

    申请人: 东南大学

    摘要: 本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。

    一种基于深度学习的钓鱼网站URL检测方法

    公开(公告)号:CN109101552A

    公开(公告)日:2018-12-28

    申请号:CN201810750707.2

    申请日:2018-07-10

    申请人: 东南大学

    IPC分类号: G06F17/30 G06N3/04

    摘要: 本发明公开了一种基于深度学习的钓鱼网站URL检测方法,该方法仅根据网站URL就能够实时检测互联网上的钓鱼网站。本发明首先将URL字符串序列编码成one-hot二维稀疏矩阵,接着转化为稠密字符嵌入矩阵,输入到卷积神经网络中,抽取局部深度特征,然后将卷积神经网络的输出输入到长短期记忆网络,捕获URL序列的前后关联,最后接入softmax模型,对URL分类。本发明能避免繁冗的特征工程,通过卷积神经网络抽取局部深度关联性特征,通过长短期记忆网络学习URL中的长程依赖,能快速、准确地检测出钓鱼网站URL。

    一种面向播存网络的广播内容补包方法及系统

    公开(公告)号:CN108390764A

    公开(公告)日:2018-08-10

    申请号:CN201810002696.X

    申请日:2018-01-02

    申请人: 东南大学

    IPC分类号: H04L12/18 H04L12/865 H04L1/00

    摘要: 本发明公开了一种面向播存网络的广播内容补包方法及系统,利用32位循环冗余检验法对接收的广播数据包进行检错,然后提取出错内容的类别、热度、内容指纹等相关参数,并利用服从指数分布的补包概率模型计算补包概率,以此概率值为依据对出错内容进行筛选和优先级评估,最后利用一个优先级队列对出错数据包进行有序补包。本发明能在保证数据包正确补回的基础上,充分兼顾播存网络的个性化特色和资源利用率,并能通过改变补包阈值灵活调节补包强度,增强播存网络的内容广播分发性能。

    基于信任机制的区块链DPoS共识方法

    公开(公告)号:CN109639837A

    公开(公告)日:2019-04-16

    申请号:CN201910096783.0

    申请日:2019-01-31

    申请人: 东南大学

    摘要: 本发明公开了一种基于信任机制的区块链DPoS共识方法,该方法首先为区块链系统中的节点引入信任度和信任能级的概念,信任能级为Error的节点无法参与代理节点竞选,然后通过信任权利机制选举出代理节点;接着采用可验证随机函数在代理节点中抽选出记账节点;最后在区块链网络运行过程中,对节点行为进行信任奖惩,对降到Error能级的记账节点采取中断剔除策略。本发明通过对节点信任能级的跟踪以及节点的信任奖惩,降低恶意节点成为记账节点的概率,提高普通节点的参与积极度,保证整个共识方法的可靠性,并且以信任度作为股权证明,不需要额外的代币分发。

    基于数字指纹和语义特征的新闻文本侵权检测方法与装置

    公开(公告)号:CN109918621B

    公开(公告)日:2023-02-28

    申请号:CN201910119330.5

    申请日:2019-02-18

    申请人: 东南大学

    摘要: 本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。

    一种面向电商评论文本的Aspect级情感分析方法

    公开(公告)号:CN109101478B

    公开(公告)日:2022-04-08

    申请号:CN201810564582.4

    申请日:2018-06-04

    申请人: 东南大学

    摘要: 本发明公开了一种面向电商评论文本的Aspect级情感分析方法。首先,对电商评论文本进行预处理,并按照其所属的商品、商家、品牌进行分批;接着,在一批电商评论文本内部,综合考虑词性、句法及共现性特征,对候选评价对象的重要性进行排序,抽取电商评论文本中的评价对象;然后,利用动态滑动窗口机制将词项间共现限定在评论段级,并基于LDA模型对这一批电商评论文本中的评价对象进行聚类,得到评论Aspect‑评价对象间对应关系;最后,基于构建的情感词典、否定词典,对电商评论文本进行情感分析。本发明不仅可以挖掘电商评论文本中的评价对象,给出细粒度的评价对象级情感分析结果;还能充分利用具体商品、商家、品牌范围内评价对象间的主题相关性,对评价对象进行聚类,进而得到评论Aspect级情感分析结果。

    基于信任机制的区块链DPoS共识方法

    公开(公告)号:CN109639837B

    公开(公告)日:2021-04-06

    申请号:CN201910096783.0

    申请日:2019-01-31

    申请人: 东南大学

    摘要: 本发明公开了一种基于信任机制的区块链DPoS共识方法,该方法首先为区块链系统中的节点引入信任度和信任能级的概念,信任能级为Error的节点无法参与代理节点竞选,然后通过信任权利机制选举出代理节点;接着采用可验证随机函数在代理节点中抽选出记账节点;最后在区块链网络运行过程中,对节点行为进行信任奖惩,对降到Error能级的记账节点采取中断剔除策略。本发明通过对节点信任能级的跟踪以及节点的信任奖惩,降低恶意节点成为记账节点的概率,提高普通节点的参与积极度,保证整个共识方法的可靠性,并且以信任度作为股权证明,不需要额外的代币分发。

    一种面向实时新闻内容的流式话题演化跟踪方法

    公开(公告)号:CN108509517A

    公开(公告)日:2018-09-07

    申请号:CN201810195967.8

    申请日:2018-03-09

    申请人: 东南大学

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种面向实时新闻内容的流式话题演化跟踪方法,首先把实时采集的新闻内容,按时间段进行分批,对每一批新闻内容采用LDA方法挖掘初步话题结果;接着,在这一批新闻内容内部进行命名实体识别,并计算话题与实体间关联,以此更新实体库中的实体链接关系;然后,通过话题内部词项聚类,得到话题-话题内类簇对应关系,并将话题结果存入话题库;最后,计算话题及其内部类簇的热度信息,并根据热度信息对LDA话题挖掘参数进行动态更新,供下一批新闻内容的话题演化跟踪使用。本发明可挖掘实时新闻内容中的话题特征以及话题内词项的类簇特征,充分利用话题间以及话题内不同类簇间的差异性,对LDA话题挖掘参数进行动态更新。

    基于播存网络的雾计算架构内容协同分发方法及应用系统

    公开(公告)号:CN107682416A

    公开(公告)日:2018-02-09

    申请号:CN201710851632.2

    申请日:2017-09-19

    申请人: 东南大学

    IPC分类号: H04L29/08

    摘要: 本发明公开了一种基于播存网络的雾计算架构内容协同分发方法及应用系统。本发明利用播存网络来提升传统雾计算架构的内容主动推送能力和减少其对互联网带宽的消耗,采用软件定义网络SDN的集中控制思想,提出兼顾广播内容和Web缓存内容的多粒度协同存储机制;在此基础上,通过控制器来集中维护和控制域内所有结点,并为域内雾服务器制定高效的内容转发策略;最后,通过控制器来实现域内多结点的内容协同分发。本发明可以有效增强雾计算架构的内容主动推送能力,减少用户请求时延,提升用户体验。