一种针对网络舆情热度的计算与预警系统及方法

    公开(公告)号:CN113609424B

    公开(公告)日:2024-06-11

    申请号:CN202110693652.8

    申请日:2021-06-22

    IPC分类号: G06F16/958 G06Q50/00

    摘要: 本发明公开是关于一种针对网络舆情热度的计算与预警系统及方法,涉及网络安全技术领域。新闻媒体热度模块由报道热度单元、报道覆盖度单元和报道权威度单元构成,用于反映网络舆情热度;社交平台热度模块由发帖热度单元、互动热度单元、账户活跃度单元和发布者影响度单元构成,用于反映网络舆情热度。解决了传统网络舆情热度计算方法中从全网采集数据时所采集的数据过于宽泛,从而导致信息密度太低的问题。解决了传统网络舆情热度指标计算时,未考虑不同媒体和不同的用户之间的影响力和权威度存在差别的问题。解决传统网络舆情热度计算时,权重定义掺杂人为主观性且无法针对不同的话题进行更新的问题。

    基于赋范线性空间拓扑结构的图谱信息补全方法、系统

    公开(公告)号:CN115827891A

    公开(公告)日:2023-03-21

    申请号:CN202211510362.6

    申请日:2022-11-29

    IPC分类号: G06F16/36

    摘要: 本发明属于自然语言处理技术领域,公开了基于赋范线性空间拓扑结构的图谱信息补全方法、系统,基于赋范线性空间拓扑结构的图谱信息补全方法包括:针对图谱信息补全进行抽象建模,将构建的模型抽象至赋范线性空间中,将拓扑结构作为模型的超参数,根据数据特点和需求对拓扑结构进行调整,在不同拓扑结构下对数据进行针对性的优化,补全知识图谱的信息。本发明解决了知识图谱领域信息补全方法缺少对拓扑结构参数进行必要考虑的问题,将图谱信息补全问题还原到理论层面,并提出将拓扑结构作为超参数的新型方法。本发明在不同拓扑结构下对数据实现针对性的优化,提升了图谱信息补全的准确性。

    一种文本生成质量评价方法、系统及应用

    公开(公告)号:CN115796169A

    公开(公告)日:2023-03-14

    申请号:CN202211442035.1

    申请日:2022-11-17

    IPC分类号: G06F40/284 G06F40/30

    摘要: 本发明属于人工智能、深度学习以及文本生成技术领域,公开了一种文本生成质量评价方法、系统及应用,将生成句和参照句拆成词块,分别用BERT预训练模型提取特征;对两个句子的每个词向量分别计算余弦相似度,得到相似性矩阵;基于所述相似性矩阵,分别对所述参照句和所述生成句进行最大相似性得分的累加和归一化,得到生成句的precision、recall和F1;其中,所述生成句x是指生成模型生成的句子,所述参照句x’是指人工撰写的句子。本发明采用语言模型BERT提取句子上下文表示和人工设计的计算逻辑对句子相似度进行计算,能够准确识别句子语义或语法的变化,对词重复、短句和长文本都非常友好,具有较好的鲁棒性。

    一种舆情指数分析方法、分析系统、计算机设备及终端

    公开(公告)号:CN115660847A

    公开(公告)日:2023-01-31

    申请号:CN202211330353.9

    申请日:2022-10-27

    摘要: 本发明属于金融数据统计分析与识别技术领域,公开了一种舆情指数分析方法、分析系统、计算机设备及终端。所述分析方法包括:对分析目标与监测地区进行目标舆情数据获取以及与舆情指数的计算,获得舆情指数数据;基于获得的舆情指数数据,进行递归移动平均线算法优化使用优化后的递归移动平均线算法,进行针对舆情指数数据的移动平均值指数计算,并进一步依据移动平均值指数变化特征对舆情指数未来发展趋势进行分析研判。本发明TMA算法能够综合考虑所有历史数据对现状指数的影响,时间越近影响权重相对越高。可应用于金融交易数据的分析。而且准确率高,耗时短,提高了运行效率。

    敏感词检测方法、装置、设备和计算机可读存储介质

    公开(公告)号:CN114510936A

    公开(公告)日:2022-05-17

    申请号:CN202111644633.2

    申请日:2021-12-29

    摘要: 本申请涉及人工智能领域,提供了敏感词检测方法、装置、设备和计算机可读存储介质,以检测出文本中各种复杂敏感类型和/或自定义敏感类型的敏感词。所述方法包括:基于敏感词扩充算法对基础敏感词库进行扩充,得到敏感词扩充库,其中,敏感词扩充库包括按照不同组合规则构成的I种敏感类型的单敏感词和/或多敏感词对;基于非敏感词库、停用词库和所述敏感词扩充库,检测目标检测文本;若从目标检测文本检出的关键词均为非敏感词,则确定目标检测文本为非敏感文本;若从目标检测文本尚未检测到非敏感词,则对目标检测文本进行预处理,并对预处理后的目标检测文本继续检测。本申请的技术方案具有检测速率高、误报率低和召回率高等显著优势。

    一种基于图模型的文本分词提取方法、系统及应用

    公开(公告)号:CN114492415A

    公开(公告)日:2022-05-13

    申请号:CN202210095563.8

    申请日:2022-01-26

    IPC分类号: G06F40/284

    摘要: 本发明属于语义网络技术领域,公开了一种基于图模型的文本分词提取方法、系统及应用。利用中文分词技术对文本进行分词处理;根据停用表对文本词汇进行去停用词处理;依据概率统计学,将待分词句子拆分为网状结构,得n个能组合的句子结构;基于统计学方法,给网状结构每条边赋予一定的权值;将权值最大的路径作为待分词句子的分词结果。本发明的方法比传统的词频‑反文档频率方法得到的特征词汇集合的准确度更高。本发明克服了信息增益方法只适合用来提取一个类别的文本特征的缺点。为后续的文本相似度与文本聚类技术提供良好的理论基础。本发明具有更大的利用价值。本发明精确地计算了特征词汇中不同词汇对文本思想的贡献度。

    基于改进的TF-IDF文本分类方法、系统及计算机设备

    公开(公告)号:CN114282525A

    公开(公告)日:2022-04-05

    申请号:CN202111584594.1

    申请日:2021-12-22

    摘要: 本发明公开一种基于改进的TF‑IDF文本分类方法、系统及计算机设备,涉及语义网络技术领域。构建文本训练样本,类别集合为;提取上述文本训练样本的类别抽象特征。测试样本先进行分词,去停用词,根据特征加权函数把测试样本转换为向量空间模型,同样提取前m个特征代表测试文本,再计算文本与各类间的相似程度,取相似度最高的即为测试文本所属类别。更新文本训练样本库。本发明综合考虑了特征类间区分度以及类内贡献度,得到的特征值更能代表类特征和当前文档特征。本发明得到的分类结果更符合经验值,准确率更高。本发明该算法运算处理速度快,简便,得到高效率的分类结果。

    一种结合内容和图谱的舆情事件推荐方法、系统及终端

    公开(公告)号:CN114153965A

    公开(公告)日:2022-03-08

    申请号:CN202111494086.4

    申请日:2021-12-08

    IPC分类号: G06F16/335 G06F16/36

    摘要: 本发明属于网络空间认知技术领域,公开了一种结合内容和图谱的舆情事件推荐方法、系统及终端。将领域知识图谱引入相关舆情事件推荐中,采用实体提取和关系提取知识图谱构建方法将舆情事件整合到已有的领域图谱数据,并采用TransE的知识嵌入方法计算事件的知识表示;对获取的最终的事件表示,以舆情事件的影响力指数作为额外补充信息,为推荐数量不满足k个的事件推荐k‑n个影响力值最大的事件作为补充。本发明创新性地将领域知识图谱引入相关舆情事件推荐中,采用实体提取和关系提取等知识图谱构建方法将舆情事件整合到已有的领域图谱数据,并采用TransE的知识嵌入方法计算事件的知识表示。