基于大数据和主题社区的学术选题分析系统及方法

    公开(公告)号:CN118551098A

    公开(公告)日:2024-08-27

    申请号:CN202410425722.5

    申请日:2024-04-10

    摘要: 本发明公开了一种基于大数据和主题社区的学术选题分析系统及方法,涉及计算机技术领域,可解决在数据量大,且用户群体需求不同的情况下,如何准确快速的进行针对性学术选题分析的技术问题。系统包括:数据获取模块用于获取目标用户检索参数对应的目标数据集合;热门主题分析模块用于提取目标数据集合的至少一个第一热门主题和每个第一热门主题所在的文献数量,依此分析热门主题共现信息;热门主题发展态势分析模块用于按时间划分目标数据集合得到子目标数据集合,确定每个子目标数据集合的目标主题社区,计算任意一子目标数据集合的任意一目标主题社区与时间相邻的子目标数据集合的所有目标主题社区之间的相似性,得到热门主题发展态势信息。

    用户投稿的期刊推荐方法、装置、设备及介质

    公开(公告)号:CN118377956A

    公开(公告)日:2024-07-23

    申请号:CN202410312305.X

    申请日:2024-03-19

    摘要: 本申请涉及数据处理技术领域,提出了一种用户投稿的期刊推荐方法、装置、设备及介质,其中,方法包括:获取用户投稿信息;分析各期刊的收录文献信息,以构建期刊知识网络结构;根据所述用户投稿信息和所述期刊知识网络结构,确定所述用户投稿信息对应的期刊推荐集合;根据所述用户投稿信息,从多个维度对所述期刊推荐集合中各推荐期刊进行投稿分析,得到投稿分析结果;展示所述投稿分析结果。通过该技术方案,从多个维度进行分析为用户推荐更合适的期刊集合,同时通过展示推荐期刊画像让用户更直观判断期刊的合适程度。

    社区评价方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN118349588A

    公开(公告)日:2024-07-16

    申请号:CN202410584286.6

    申请日:2024-05-11

    摘要: 本公开涉及数据挖掘技术领域,公开了一种社区评价方法、装置、电子设备及计算机可读存储介质;其方法包括:获取多个待评价文献主题社区的社区结构数据,社区结构数据包括节点数据、边数据、社区标识数据;针对多个待评价文献主题社区中任一目标社区,根据目标社区的目标社区结构数据,计算目标社区对应的多个目标评价指标的指标值;其中,多个目标评价指标包括:用于衡量社区规模的直径指标、用于衡量社区信息集中程度的信息密度指标;基于各目标社区对应的多个目标评价指标的指标值,生成针对多个待评价文献主题社区的评价结果。本公开从主题社区直径和主题社区信息密度两个维度评价主题社区,从而可以更加全面地评价每个主题社区。

    一种基于文件的分布式存储方法

    公开(公告)号:CN111078153B

    公开(公告)日:2023-08-01

    申请号:CN201911322978.9

    申请日:2019-12-20

    IPC分类号: G06F3/06 G06F21/64 G06F16/14

    摘要: 本发明公开了一种基于文件的分布式存储方法,包括:根据写入的路径确定要写入的节点,及根据写入的文件名确定要写入的dob文件的全路径名以及存储的表名;获取dob文件的大小,将获取的dob文件指针移动到该dob文件的末尾,读取写入的文件内容并进行加密,将处理过的文件内容写入dob文件;存储写入dob文件的目录、位置、大小、检索信息,并缓存目录信息,以提高检索性能。本发明采用局部变换算法结合位置偏移,实现分布式存储节点数据的安全性;采用了负载均衡算法,数据平衡地存储在各个节点,提高了整体的处理性能。

    一种基于任务可视化拖拽的spark机器学习系统及学习方法

    公开(公告)号:CN111240662B

    公开(公告)日:2024-01-09

    申请号:CN202010059133.1

    申请日:2020-01-16

    摘要: 本发明公开了一种基于任务可视化拖拽的spark机器学习系统及方法,该系统包括流程设计器、流程解析器与流程调度器;所述方法包括将数据源组件、数据预处理组件、机器学习组件、保存组件拖拽到设计区构建机器学习流程,并生成流程描述语言;解析用户构建的机器学习流程图,对各个组件之间的关系、输入、输出进行解析,通过设计的算法将流程图翻译为一套调度器可识别的数据;解析可识别的数据,将构建的机(56)对比文件Zhixiang Wang 等.Distributed Big DataMining Platform for Smart Grid《.2018 IEEEInternational Conference on Big Data (BigData)》.2019,2345-2354.赵玲玲 等.基于Spark的流程化机器学习分析方法《.计算机系统应用》.2016,第25卷(第12期),162-168.钟华等.科学大数据智能分析软件的现状与趋势《.中国科学院院刊》.2018,第33卷(第8期),812-817.

    渐进式学习资源推荐方法、装置、存储介质及计算机设备

    公开(公告)号:CN117194743A

    公开(公告)日:2023-12-08

    申请号:CN202311041088.7

    申请日:2023-08-17

    摘要: 本发明公开了一种渐进式学习资源推荐方法、装置、存储介质及计算机设备,涉及信息技术领域,主要在于能够提高学习资源的推荐效率和推荐准确度。其中方法包括:获取学习资源和用户输入的检索信息;对学习资源进行聚类,得到不同聚类主题下的学习资源;基于不同聚类主题下的学习资源,确定不同聚类主题对应的主题特征词;基于检索信息和主题特征词,在不同聚类主题中确定向用户推荐的第一目标聚类主题,并响应于用户在第一目标聚类主题选择的第二目标聚类主题;确定第二目标聚类主题对应的主题热度图、主题分布图和特征共现图谱;接收用户针对上述三种图选择的目标主题特征词,并根据目标主题特征词,向用户推荐对应的学习资源。