-
公开(公告)号:CN112732914A
公开(公告)日:2021-04-30
申请号:CN202011625579.2
申请日:2020-12-30
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/35 , G06F16/335 , G06F16/903 , G06F40/216 , G06K9/62
摘要: 本发明公开一种基于关键词匹配的文本聚类方法、系统、储存介质及终端,涉及数据处理技术领域。对分析数据进行清洗,采用TextRank算法计算文本关键词;根据不同文本间关键词的重复占比判断文本相似度,实现初步聚类;对文本簇中不同文本关键词依据汇总计算得出文本簇的关键词;文本簇聚类后形成新的文本簇同时通过相同方式再进行聚类,直至满足设定聚类轮数。本发明在不将文本转化为向量的情况下,基于不同文本间关键词的重复占比判断不同文本的相似度,实现文本聚类,简化了文本相似度的计算过程,提升了计算效率。本方法能够根据文本内容自动判断聚类个数k,无需预先指定,具有较强适用性。
-
公开(公告)号:CN112685560B
公开(公告)日:2024-01-19
申请号:CN202011563057.4
申请日:2020-12-25
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/35 , G06F40/284 , G06F40/30
摘要: 本发明公开一种事件拐点识别的方法、系统、终端、计算机设备及介质,涉及语义网络技术领域。构建事件基础元素数据库,所述事件包含人、组织、时间、地点、事件触发词元素,所述人、组织、地点、事件触发词分别具备各自特有属性;根据所述事件多维度的发展趋势数据,构建所述事件发展趋势数据的各个影响因素的行业影响力值;根据所述行业影响力,识别出事件发展趋势数据中的拐点。事件拐点识别系统包括事件基础元素数据库、行业影响力值构建模块、数据拐点识别模块。本发明针对事件拐点识别具备普适性。本发明为垂直领域事件的拐点识别提供了基础理论。
-
公开(公告)号:CN114818966A
公开(公告)日:2022-07-29
申请号:CN202210509853.2
申请日:2022-05-11
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06K9/62
摘要: 本发明属于网络空间认知技术领域,公开了一种话题生命周期曲线聚类方法、系统及应用,利用K‑Shape算法对时间序列数据进行聚类,采用z‑normalization对时间序列数据进行标准化处理,再将处理后的数据集进行K‑Shape聚类,利用轮廓系数确定最佳K值,通过循环当轮廓系数值最好时的K值为最佳分类,输出聚类结果,并输出能够代表每个簇生命周期曲线的中心曲线。本发明创新性地提出了话题生命周期曲线聚类方法,成功的将生命周期曲线相似的话题聚类成簇,可以有效地观察分析不同簇话题生命周期的特点;利用K‑Shape算法对时间序列数据进行聚类,能够大大减少计算量,提高运算效率,同时消除异常曲线造成的干扰。
-
公开(公告)号:CN114780815A
公开(公告)日:2022-07-22
申请号:CN202210435296.4
申请日:2022-04-24
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/906 , G06F16/9535
摘要: 本发明属于网络空间认知域技术领域,公开了基于多平台的议题网络关注度信息处理方法、系统及应用。提取议题的社交平台数据、新闻媒体数据及地方报纸杂志数据;从议题相关发帖及发帖的互动数据两个维度计算议题社交平台的网络关注度;基于新闻媒体的影响力及新闻媒体报道的信息计算新闻媒体的关注度,基于报纸杂志的影响力及报纸杂志的报道信息计算报纸杂志的关注度;将议题最终网络关注度计算为社交媒体的网络关注度、新闻媒体的网络关注度与报纸杂志的关注度之和。本发明创新性地提出了为网络互动指标添加科学、合理的权重配比,并结合地方网民数据的综合计算方法,为议题的网络关注度计算提供了更科学合理的理论支撑。
-
公开(公告)号:CN113704403A
公开(公告)日:2021-11-26
申请号:CN202110984517.9
申请日:2021-08-25
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06F16/33 , G06F16/335 , G06F40/30
摘要: 本发明公开一种基于词库的OCR语义校正方法、系统、介质、设备、终端,涉及语义网络技术领域。过滤出所有字符识别置信度小于阈值0.4的字符,每个字符记录前5的结果;分别对置信度小于阈值0.4的字符的5种结果提取嫌疑词,最终对应得到5组嫌疑词,每组嫌疑词会有1个或多个嫌疑词;按照置信度顺序从高到低的顺序,分别对5组嫌疑词和词库进行匹配,分别计算匹配距离,匹配距离采用编辑距离评估;以匹配距离最小的结果作为结果输出。本发明结合字符识别结果top5和词库,精准定位识别错误字符,有针对性地对识别错误字符进行高效率纠错,保证识别结果的语义正确性。
-
公开(公告)号:CN112861967A
公开(公告)日:2021-05-28
申请号:CN202110168649.4
申请日:2021-02-07
申请人: 中国电子科技集团公司电子科学研究院 , 深圳市网联安瑞网络科技有限公司
摘要: 本发明公开了一种基于异构图神经网络的社交网络异常用户检测方法及设备,基于异构图神经网络的社交网络异常用户检测方法,包括:针对社交网络收集用户信息,并对收集到的用户信息进行特征提取;基于提取的特征,构建基于社交网络的异构信息网络,并利用社交网络的关系属性设计相应的元路径和元图;基于异构信息网络、元路径和元图,根据用户之间的亲密度和相似度,确定用户在社交网络中的表示;基于用户在社交网络中的表示,检测用户类型,以确定异常用户。本发明整合了丰富的用户特征,基于真实的社交场景汇总用户信息形成了两个视角,即用户亲密程度和关系类型,模型具有出色的性能,在准确度和F1值上都表现较好。
-
公开(公告)号:CN112800898A
公开(公告)日:2021-05-14
申请号:CN202110065005.2
申请日:2021-01-18
申请人: 深圳市网联安瑞网络科技有限公司
摘要: 本发明开一种行人重识别数据集增强方法、系统、终端、摄像头及介质,涉及图像处理技术领域。用于网络输入三张行人图片,分别使用外貌编码器和结构编码器进行编码,得到外貌编码和结构编码;使用Es编码器对xi进行编码,得到结构编码Csi;使用Ea编码器对xk进行编码,得到xk的外貌编码Cak,鉴别器D1和D2的判断;重复迭代得到最优生成器;利用训练好的最优生成器生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。本发明降低行人重识别数据集采集及标注成本,丰富行人重识别数据集的多样性,助力行人重识别技术发展。
-
公开(公告)号:CN112712210A
公开(公告)日:2021-04-27
申请号:CN202011628435.2
申请日:2020-12-30
申请人: 深圳市网联安瑞网络科技有限公司
摘要: 本发明公开一种突发性话题传播规模预测方法、系统、处理终端、介质,涉及社交网络信息处理技术领域。计算网络中消息总影响力;利用转发量作边构造“0”节点对用户转发关系网络进行补全,根据用户在转发网络的用户影响力排名分配影响力额度;同时基于用户影响力衰减机制,对突发性话题传播规模进行预测。本发明同时考虑消息和用户影响力的时间衰减机制,融合消息转发影响力和用户转发关系网络,利用用户影响力预测突发话题在下一个阶段的传播规模。本发明创新提出融合消息转发影响力和用户转发关系网络的突发性话题传播规模预测系统,该系统提出的方法可操作性强、数据获取便捷,能有效预测实际存在一定用户关系缺失的突发性话题数据规模。
-
公开(公告)号:CN112561644A
公开(公告)日:2021-03-26
申请号:CN202011487378.0
申请日:2020-12-16
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06Q30/06 , G06F16/9535 , G06F16/901 , G06N3/04 , G06N3/08 , G06K9/62
摘要: 本发明公开了一种基于链接预测的商品推荐方法,应用于链接预测技术领域,用于无法基于稀疏的标注信息的图数据集进行特征预测以及无法实现跨平台推荐的问题。本发明提供的方法包括:获取来自第一平台的第一图数据集和来自第二平台的第二图数据集;所述第一图数据集包括商品购买用户节点集合、商品节点集合及标注信息;根据所述标注信息获得每个商品购买用户节点的商品喜好度表示特征并传播到所述第一用户节点集合,并基于所述人际关系边连接关系传播到所述第二用户节点集合中的每个用户节点形成对应的商品购买倾向特征;根据所述商品喜好度表示特征与所述商品购买倾向特征获取商品推荐结果。
-
公开(公告)号:CN113762269B
公开(公告)日:2024-03-22
申请号:CN202111052414.5
申请日:2021-09-08
申请人: 深圳市网联安瑞网络科技有限公司
IPC分类号: G06V30/148 , G06V30/18 , G06N3/0464 , G06N3/08 , G06V30/19
摘要: 本发明公开一种基于神经网络的中文字符OCR识别方法、系统、介质及应用,涉及图象识别技术领域。对输入图像进行文本检测;对检测后的文本区域图像进行文本掩膜信息提取,并定位文本区域每个字符的位置坐标,按照字符位置坐标从文本掩膜截取每个字符掩膜;对字符掩膜进行特征提取,并映射到多维向量空间得到字符向量;字符向量按照字符次序组成文本向量矩阵,利用文本向量矩阵学习上下文依赖信息,完成文本的识别。本发明解决了输入图像进行中文文本检测,截取图像文本区域,并对文本区域文字识别的问题。本发明中文字符识别准确率得到了提升;形近字识别准确率提升;字符的方向不敏感。
-
-
-
-
-
-
-
-
-