基于大数据的中文网页个性化精准分类系统

    公开(公告)号:CN118839047A

    公开(公告)日:2024-10-25

    申请号:CN202410710621.2

    申请日:2024-06-04

    申请人: 高从明

    发明人: 高从明 刘鑫

    摘要: 本申请的基于大数据的中文网页个性化精准分类系统,设计了对HTML无用标签的过滤算法,得到较高价值的网页文本内容。在最大顺序匹配分词算法上,采用三字长交集型歧义字段处理,提高了分词过程中的歧义识别能力。改进了基于TF*IDF的权重计算方法,结合CHI计算量计算权重,综合考虑了特征项在某类文本和所有文本中出现次数、类别信息对权重的影响和特征出现位置对权重的影响。实现了中文自动分类模型,设计了中文网页自动分类各个模块的构建方法,有效组织和处理网络上的海量信息,让人们更好的搜索到自己想要的资源,本申请网页自动分类是实现快速信息检索的重要技术,分类准确率达到96.3%,满足个性化网页分类需求。

    一种工艺案例检索方法、装置、设备和介质

    公开(公告)号:CN118839042A

    公开(公告)日:2024-10-25

    申请号:CN202410969697.7

    申请日:2024-07-19

    摘要: 本申请公开了一种工艺案例检索方法、装置、设备和介质,涉及数据库技术领域,解决现有检索方法检索出的工艺案例匹配精度低的技术问题。该方法包括获取待检索案例词条信息;基于待检索案例词条信息,获得相似案例备用筛选库和相同理论案例备用筛选库;基于关键词条信息,对相似案例备用筛选库和相同理论案例备用筛选库进行聚类处理,获得相似案例输出集;基于TRIZ理论附加属性标签信息,获得相同理论案例输出集;对相似案例备用筛选库中的所有工艺案例的TRIZ理论附加属性标签信息进行数量统计,获得推荐理论输出集;将相似案例输出集、相同理论案例输出集和推荐理论输出集进行输出,获得目标检索结果。因此,本申请能够有效提高产品研发效率和质量。

    应用软件分类方法、装置、电子设备及可读存储介质

    公开(公告)号:CN114707042B

    公开(公告)日:2024-10-25

    申请号:CN202210383425.X

    申请日:2022-04-13

    摘要: 本申请公开了一种应用软件分类方法、装置、电子设备及计算机可读存储介质,应用于软件领域,该方法包括:获取待分类应用软件对应的应用信息;提取应用信息中的关键词;利用关键词与预设类别词典进行关键词匹配;若目标预设关键词匹配成功,则将目标预设关键词对应的类别确定为待分类应用软件的软件类别;若匹配失败,则利用预设分类模型对应用信息进行分类处理,得到软件类别;该方法利用预设分类模型,可以对预设类别词典没有覆盖到的待分类应用软件进行分类,无需人工介入分类过程,提高了分类效率。同时,避免人工介入也能够提高分类准确性。

    基于分区和降维的可更新空间学习索引方法和装置

    公开(公告)号:CN118820537A

    公开(公告)日:2024-10-22

    申请号:CN202411310232.7

    申请日:2024-09-19

    摘要: 本申请涉及一种基于分区和降维的可更新空间学习索引方法和装置。所述方法包括:将二维数据空间划分为多个不相交的空间区域,以及聚类至空间区域中;将原始数据映射至二维空间中,得到原始数据在二维空间中的位置信息,采用希尔伯特曲线对二维空间进行递归划分,得到原始数据在划分后二维空间中的希尔伯特值的排序数组以及空间区域顺序值的位置数组;根据排序数组和位置数组对应的一维排序数据,在坐标轴上构建多段线性结构模型;输入检索条件确定待查找数据和待查找数据的聚类标签,获取待查找数据的数据点和空间区域;根据空间区域对应的多段线性结构模型,对数据点进行索引。该方法可以对高维数据进行更新索引,并且占用空间小。

    一种基于模糊联合聚类的电信数据库异常检测方法、系统

    公开(公告)号:CN118820531A

    公开(公告)日:2024-10-22

    申请号:CN202410955207.8

    申请日:2024-07-16

    发明人: 王伟斌 刘亚 黄彪

    摘要: 本发明设计一种基于模糊联合聚类的电信数据库异常检测方法、系统,先通过同时对样本和特征进行模糊联合聚类,从多个维度揭示数据的内在结构和关联性。然后又引入自适应权重策略,在迭代过程中动态调整对样本聚类和特征聚类的关注程度,可以更好地适应复杂多变的数据特性。又利用信息熵计算子矩阵的信息熵,可有效识别出可能包含异常或噪声的子矩阵,提升了算法在异常检测方面的表现力。综上所述,本发明提供了一种灵活、全面且具有较高解释性的数据分析方法,以适应电信数据库数据的复杂性和多样性,能够更准确、高效地识别电信数据库中的异常指标,为电信行业的运营管理和决策分析提供有力的数据支撑和工具支持,推动电信行业的数字化转型和智能化发展。

    固弃物无人值守控制系统、方法、存储介质、设备及程序

    公开(公告)号:CN118819082A

    公开(公告)日:2024-10-22

    申请号:CN202410710272.4

    申请日:2024-06-03

    摘要: 本公开涉及一种固弃物无人值守控制系统、方法、存储介质、设备及程序。该系统包括:数据采集模块、数据处理模块和设备管理模块,数据采集模块与数据处理模块连接,数据处理模块与设备管理模块连接;数据采集模块获取固弃物容器中的固弃物数据,并将固弃物数据传输至数据处理模块,固弃物数据包括固弃物容器的填充度和/或废物类别;数据处理模块接收固弃物数据,并对固弃物数据进行数据处理,将处理后的固弃物数据发送至设备管理模块,数据处理包括数据清洗和/或数据分类;设备管理模块根据处理后的固弃物数据输出第一操作指令,第一操作指令控制固弃物处理设备对固弃物容器中的固弃物进行处理,第一操作指令包括空箱指令和/或回收指令。

    一种基于多维感知的态势预警分析可视化系统及方法

    公开(公告)号:CN118227856B

    公开(公告)日:2024-10-22

    申请号:CN202311583299.3

    申请日:2023-11-24

    发明人: 梁春艳

    摘要: 本发明涉及态势感知技术领域,公开了一种基于多维感知的态势预警分析可视化系统及方法,包括:前端感知模块,包括RFID采集单元、电子信息采集单元、移动采集单元和网格化采集单元,用于采集指定区域位置的人员动态数据信息;智能研判分析模块,与所述前端感知模块连接,包括活动规律分析模型、常驻人口分析模型、人员关系分析模型、行为异常发现模型和人员态势统计预警模型;可视化显示模块,支持地图形式下进行视频摄像头的实时视频调取,实现过往人员、车辆的视频巡查。通过可视化的数据呈现、多维研判分析、指定目标人员管控手段及能力,实现对目标人员的数据研判,为城市案件、应急处突提供情报支撑。

    档案数据的处理方法、装置、设备及存储介质

    公开(公告)号:CN117909556B

    公开(公告)日:2024-10-22

    申请号:CN202410198838.X

    申请日:2024-02-22

    发明人: 宋思淼

    摘要: 本申请涉及数据处理技术领域,公开了一种档案数据的处理方法、装置、设备及存储介质。所述方法包括:获取多个目标数据源的初始档案数据集并创建初始档案数据分类结果和初始档案数据索引信息;生成第一档案数据特征集和第二档案数据特征集;构建档案数据特征知识图谱;进行关系节点提取,得到多个图谱关系节点并进行节点聚类分析,得到目标聚类结果;进行互相关性分析,得到互相关性分析结果并进行矩阵转换,生成目标档案数据特征矩阵;将目标档案数据特征矩阵输入多任务优化模型进行数据分类优化和索引信息优化,输出目标档案数据分类结果和目标档案数据索引信息,本申请实现了档案数据处理的智能化并提高了档案数据处理的效率。

    基于情绪分析和生成式对抗网络的对话生成方法及系统

    公开(公告)号:CN114492462B

    公开(公告)日:2024-10-22

    申请号:CN202111646947.6

    申请日:2021-12-30

    申请人: 湖南大学

    摘要: 本发明公开了基于情绪分析和生成式对抗网络的对话生成方法及系统,通过构建并训练基础对话模型、对话情绪分类器;使用基础对话模型以及对话情绪分类器构建生成式对抗网络,生成式对抗网络基于基础对话模型生成生成器,基于对话情绪分类器生成判别器,判别器用于判别生成器输出回答与真实回答之间的情绪异同,并将根据情绪异同优化生成器的网络参数,使生成器的输出回答的情绪趋近于真实回答的情绪;训练生成式对抗网络,并使用训练好的生成式对抗网络生成对话。本发明使用基础对话模型以及对话情绪分类器构建生成式对抗网络;使训练完成的生成式对抗网络模型拥有配合用户情绪的能力,可根据用户使用时的情绪调整生成的语句,更加贴近真实对话。