-
公开(公告)号:CN107193858B
公开(公告)日:2018-09-11
申请号:CN201710193071.1
申请日:2017-03-28
Applicant: 福州金瑞迪软件技术有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种面向多源异构数据融合的智能服务应用平台和方法,涉及数据融合应用领域。通过利用可视化技术实现多源异构数据采集和数据交易可定义,利用自动化技术,实现自动实时地采集与清洗多源异构数据,同时实时完成数据交易。采用可动态扩展的语义模板库,实现多源异构数据源之间语义映射,生成语义词典,实现语义清洗规则可定义,保证文本数据可在异构数据源之间语义自动转换,实现文本数据智能清洗和交易。该技术方案可以填补目前国内外非结构化多源异构数据的语义自动转换和交易这方面的空白,并且能广泛应用于国内的政府和企事业单位中,解决其存在的多源异构数据转换与交易的问题。
-
公开(公告)号:CN119180330A
公开(公告)日:2024-12-24
申请号:CN202411688143.6
申请日:2024-11-25
Applicant: 福州金瑞迪软件技术有限公司
IPC: G06N5/025 , G06F16/332 , G06F16/901
Abstract: 本发明提供档案知识管理技术领域的一种基于大语言模型的档案知识管理方法和系统,方法包括:步骤S1、创建档案知识库、档案知识提取规则库以及问题模板库;步骤S2、获取历史档案文件构建数据集;步骤S3、创建大语言模型并训练;步骤S4、通过OCR技术识别待管理档案文件得到待管理档案内容,提取对应档案知识提取规则以及问题模板;步骤S5、将生成的知识提取问题以及待管理档案内容输入大语言模型,得到档案知识;步骤S6、将档案知识存入neo4j图型知识库和mysql关系型知识库;步骤S7、从图型知识库中获取知识三元组并以知识图谱的方式表现;步骤S8、对所述档案知识进行增加、删除、更新、查询的管理。本发明的优点在于:提高档案知识管理的效率以及质量。
-
公开(公告)号:CN119150859A
公开(公告)日:2024-12-17
申请号:CN202411649122.3
申请日:2024-11-19
Applicant: 福州金瑞迪软件技术有限公司
IPC: G06F40/284 , G06F16/33
Abstract: 本发明提供了数据标注技术领域的一种基于行业词库与标签库的数据标注方法及系统,方法包括:步骤S1、获取大量历史标注数据,基于行业对各历史标注数据进行分组;步骤S2、基于各历史标注数据创建行业词库以及标签库;步骤S3、识别待标注文件得到待标注数据,识别待标注数据的行业以及项目编号;步骤S4、通过行业匹配对应的行业词库,自然语言分词工具基于行业词库的行业分词对文本数据执行分词操作,得到分词结果;通过项目编号匹配对应的标签库,基于标签库的项目标签对分词结果进行预标注,得到预标注结果;步骤S5、对预标注结果进行审核和修正后,生成标注结果。本发明的优点在于:极大的提升了数据标注的质量以及效率,降低标注成本。
-
公开(公告)号:CN107193858A
公开(公告)日:2017-09-22
申请号:CN201710193071.1
申请日:2017-03-28
Applicant: 福州金瑞迪软件技术有限公司
IPC: G06F17/30
CPC classification number: G06F17/30731 , G06F17/30575
Abstract: 本发明公开了一种面向多源异构数据融合的智能服务应用平台和方法,涉及数据融合应用领域。通过利用可视化技术实现多源异构数据采集和数据交易可定义,利用自动化技术,实现自动实时地采集与清洗多源异构数据,同时实时完成数据交易。采用可动态扩展的语义模板库,实现多源异构数据源之间语义映射,生成语义词典,实现语义清洗规则可定义,保证文本数据可在异构数据源之间语义自动转换,实现文本数据智能清洗和交易。该技术方案可以填补目前国内外非结构化多源异构数据的语义自动转换和交易这方面的空白,并且能广泛应用于国内的政府和企事业单位中,解决其存在的多源异构数据转换与交易的问题。