一种基于大数据的标准智库数据检索方法及系统

    公开(公告)号:CN118916375B

    公开(公告)日:2025-04-18

    申请号:CN202410961834.2

    申请日:2024-07-18

    Abstract: 本发明公开了一种基于大数据的标准智库数据检索方法及系统,包括采集标准智库的用户检索数据和智库数据,对所述用户检索数据和所述智库数据进行预处理,根据关键度对所述检索数据进行语义抽取获得核心特征,对所述智库数据进行文本信息嵌入获得完备数据,根据语义相似度对所述核心特征和所述完备数据进行匹配获得池配数据,对所述池配数据进行组合筛选获得补充数据,根据所述补充数据构建标准智库数据检索模型,将待检索数据输入所述标准智库数据检索模型,输出检索结果。该方法不仅可以提高基于大数据的标准智库数据检索的精度,同时具有较好的可解释性,可以直接应用于标准智库数据检索系统中。

    一种用于纸质文献三维扫描的智能自动修复的方法

    公开(公告)号:CN119027348B

    公开(公告)日:2025-03-21

    申请号:CN202411110878.0

    申请日:2024-08-14

    Inventor: 李景 王益谊 于钢

    Abstract: 本发明公开了一种用于纸质文献三维扫描的智能自动修复的方法,涉及文献数据处理技术领域。该方法包括以下步骤:采集纸质文献三维扫描参数;根据纸质文献三维扫描参数分别进行纸质文献三维扫描第一性能评估和纸质文献三维扫描第二性能评估;根据纸质文献三维扫描性能评估结果与预设纸质文献三维扫描性能阈值对比分析;根据纸质文献三维扫描性能对比分析结果对纸质文献三维扫描进行调整。本发明通过对纸质文献三维扫描参数评估分析并调整纸质文献三维扫描方式,达到了提高纸质文献三维扫描采集数据质量,为后续生成最终的纸质文献三维模型提高准确性,解决了现有技术中存在纸质文献三维扫描采集数据质量不高的问题。

    基于指数量化模型的区域发展数据对比查询方法

    公开(公告)号:CN118227666A

    公开(公告)日:2024-06-21

    申请号:CN202410442265.0

    申请日:2024-04-12

    Abstract: 本发明公开了基于指数量化模型的区域发展数据对比查询方法,包括查询系统,所述查询系统由数据采集模块、清洗与整合模块、存储与管理模块、指数量化模型、分析与可视化模块、实时数据更新模块、用户界面模块、报告生成模块和权限管理模块,所述数据采集模块包括有网络爬虫、API接口和数据连接器。本发明通过建立指数量化模型能够将不同区域或不同时期的数据进行量化,从而实现了数据的可比性,通过比较不同区域或不同时期的指标数值,能够更直观地了解到它们之间的差异和变化趋势,为进一步分析和决策提供了可操作性的依据,指数量化模型的建立使得区域发展数据更加具体和可操作。

    一种基于知识图谱的标准数据处理方法

    公开(公告)号:CN117891958A

    公开(公告)日:2024-04-16

    申请号:CN202410289883.6

    申请日:2024-03-14

    Abstract: 本发明公开了一种基于知识图谱的标准数据处理方法,该方法通过获得待标准化处理的源数据并进行分词处理,根据所述源数据的分词结果确定目标领域;进一步获取知识图谱中对应的三元组得到第一集合;采用自注意力机制的关系抽取模型,得到待标准化的第二集合;计算第二集合中的待标准化三元组与第一集合的中三元组的相似度,并根据计算结果建立所述源数据与所述标准化结果之间的映射关系,根据所述映射关系输出所述源数据的标准化结果,该方法能够提高数据标准化后的一致性和准确性,为科学研究、管理、分析等方面的工作提供有力支持。

    一种基于文本挖掘的标准智能推荐方法

    公开(公告)号:CN118708758B

    公开(公告)日:2025-01-24

    申请号:CN202410761375.3

    申请日:2024-06-13

    Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种基于文本挖掘的标准智能推荐方法,本发明通过将线上教学视频按播放时间进度划分为若干播放时段,通过若干播放时段内的特征动作次数的波动程度判定线上教学视频是否为特征动作显性视频,并确定特征动作显性时段,通过确定用户在线上教学视频发出提问所对应的播放时刻是否在特征动作显性时段内,以确定提问的索引类别,通过对提问文本进行分词得到若干提问词组,通过提问的索引类别确定内容推荐的响应方式,进而,实现了根据用户提问的时机分析提问内容的难度,以及根据提问难度差异快速推荐对应的教学内容,避免线上教学推荐内容的信息过载,提高了线上教学推荐内容的个性化。

    基于知识图谱的舆情信息展示方法及系统

    公开(公告)号:CN118260437B

    公开(公告)日:2024-10-01

    申请号:CN202410480051.2

    申请日:2024-04-22

    Abstract: 本发明公开了基于知识图谱的舆情信息展示方法及系统。该基于知识图谱的舆情信息展示方法,包括以下步骤:舆情信息收集;舆情信息数据源分析处理;知识图谱构建;性能评估。本发明通过收集舆情信息得到舆情信息数据源并进行数据清洗和预处理,然后进行实体识别和关系抽取并转化为三元组格式,并对舆情信息数据源中提取出的实体数据进行评估获取实体数据的实体关联系数,利用结果构建知识图谱并设计可视化界面,最后对知识图谱进行性能评估,并定期更新和维护知识图谱中的数据,提高了舆情信息展示准确性,解决了舆情信息展示准确性低的问题。

    一种基于知识图谱的标准数据处理方法

    公开(公告)号:CN117891958B

    公开(公告)日:2024-05-24

    申请号:CN202410289883.6

    申请日:2024-03-14

    Abstract: 本发明公开了一种基于知识图谱的标准数据处理方法,该方法通过获得待标准化处理的源数据并进行分词处理,根据所述源数据的分词结果确定目标领域;进一步获取知识图谱中对应的三元组得到第一集合;采用自注意力机制的关系抽取模型,得到待标准化的第二集合;计算第二集合中的待标准化三元组与第一集合的中三元组的相似度,并根据计算结果建立所述源数据与所述标准化结果之间的映射关系,根据所述映射关系输出所述源数据的标准化结果,该方法能够提高数据标准化后的一致性和准确性,为科学研究、管理、分析等方面的工作提供有力支持。

    一种基于大数据的语义信息检索方法

    公开(公告)号:CN116756347B

    公开(公告)日:2023-10-27

    申请号:CN202311053567.0

    申请日:2023-08-21

    Abstract: 本发明公开了一种基于大数据的语义信息检索方法,包括获取历史检索数据和资料库资料的主题,对所述历史检索数据进行预处理,提取预处理后的所述历史检索数据主题,对所述主题进行词义消歧,根据所述主题的计算相似度,根据所述相似度对所述历史检索数据和所述资料库资料进行语义关联分析,计算所述历史检索数据和语义关联分析后的所述资料库资料的语义相似度,根据所述语义相似度构建语义匹配模型,将关联分析后的所述历史检索数据和所述资料库资料输入语义匹配模型,输出为检索结果。该方法不仅可以提高语义信息检索的精度,同时具有较好的可解释性,可以直接应用于基于大数据的语义信息检索系统中。

    一种基于大数据的语义信息检索方法

    公开(公告)号:CN116756347A

    公开(公告)日:2023-09-15

    申请号:CN202311053567.0

    申请日:2023-08-21

    Abstract: 本发明公开了一种基于大数据的语义信息检索方法,包括获取历史检索数据和资料库资料的主题,对所述历史检索数据进行预处理,提取预处理后的所述历史检索数据主题,对所述主题进行词义消歧,根据所述主题的计算相似度,根据所述相似度对所述历史检索数据和所述资料库资料进行语义关联分析,计算所述历史检索数据和语义关联分析后的所述资料库资料的语义相似度,根据所述语义相似度构建语义匹配模型,将关联分析后的所述历史检索数据和所述资料库资料输入语义匹配模型,输出为检索结果。该方法不仅可以提高语义信息检索的精度,同时具有较好的可解释性,可以直接应用于基于大数据的语义信息检索系统中。

    一种基于文本挖掘的标准要素查重方法

    公开(公告)号:CN116629228A

    公开(公告)日:2023-08-22

    申请号:CN202310375469.2

    申请日:2023-04-11

    Abstract: 本发明公开了一种基于文本挖掘的标准要素查重方法,包括如下步骤:根据上传的标准文本,从中提取有关信息;对提取的有关信息进行特征抽取,即对文件进行切分,从而组成文本的特征集合;经过特征抽取后的文本集合经数学描述计算相似度;计算标准文本中每个句子的相似度,并取其中最高值,作为该要素板块与对比标准文本的总相似度;将各个要素板块的总相似度进行加权平均,最终得到上传标准文本内容以及对比的标准文本内容的文本相似度;抽样分析聚类结果是否符合要求。本发明减少查重的工作量,减少词条交叉重复问题,准确度高,且流程易操作,能极大的提高对标准文本进行查重比对工作的效率。

Patent Agency Ranking