-
公开(公告)号:CN119416097A
公开(公告)日:2025-02-11
申请号:CN202510012592.7
申请日:2025-01-06
Applicant: 江苏润和软件股份有限公司
IPC: G06F18/2431 , G06F18/214 , G06F18/213 , G06F18/22 , G06N3/09
Abstract: 本发明公开了一种AI模型服务平台数据集标注方法及系统,涉及数据集标注技术领域,将待标注数据集按照数据类型进行拆分,并识别AI模型服务平台中是否存在现有标注模型能够分别处理当前拆分后的待标注数据集;基于标注模型的评估指标评估标注模型的标注表现,进而基于数据增强对标注模型进行更新;利用更新后的标注模型分别对拆分后的待标注数据集进行标注,生成第一标注结果;基于多模型联合标注对第一标注结果进行二次标注,生成第二标注结果;通过置信区间筛选识别出第二标注结果中不合格的标注数据集,进而触发人工标注。实现了高效、低成本、高质量且灵活可扩展的数据集标注流程,从而显著提升了AI模型服务平台的标注能力和服务质量。
-
公开(公告)号:CN119399778A
公开(公告)日:2025-02-07
申请号:CN202510006602.6
申请日:2025-01-03
Applicant: 江苏润和软件股份有限公司
Abstract: 本发明公开了基于多规则库的文档智能审核方法及系统,涉及文档智能审核技术领域。该基于多规则库的文档智能审核方法及系统,通过光学字符识别与格式解析技术,结合自然语言处理来识别文档内容的规则库匹配特征,能够有效地提取文档的关键信息并为后续的规则匹配提供基础。加载并选择数据库中的多规则库进行匹配审核。在规则匹配审核的过程中,通过随机森林算法对文档内容进行多维度特征分析与规则分类,从而识别并标记出不符合规则匹配的文档内容。通过支持向量机算法,将标记的文档内容与文档的整体结构进行比对,识别文档中的逻辑冲突,并对其进行二次标记。确保文档内部的一致性与逻辑性,进一步提高审核的精准度和全面性。
-
公开(公告)号:CN119399778B
公开(公告)日:2025-04-29
申请号:CN202510006602.6
申请日:2025-01-03
Applicant: 江苏润和软件股份有限公司
Abstract: 本发明公开了基于多规则库的文档智能审核方法及系统,涉及文档智能审核技术领域。该基于多规则库的文档智能审核方法及系统,通过光学字符识别与格式解析技术,结合自然语言处理来识别文档内容的规则库匹配特征,能够有效地提取文档的关键信息并为后续的规则匹配提供基础。加载并选择数据库中的多规则库进行匹配审核。在规则匹配审核的过程中,通过随机森林算法对文档内容进行多维度特征分析与规则分类,从而识别并标记出不符合规则匹配的文档内容。通过支持向量机算法,将标记的文档内容与文档的整体结构进行比对,识别文档中的逻辑冲突,并对其进行二次标记。确保文档内部的一致性与逻辑性,进一步提高审核的精准度和全面性。
-
公开(公告)号:CN119416097B
公开(公告)日:2025-04-04
申请号:CN202510012592.7
申请日:2025-01-06
Applicant: 江苏润和软件股份有限公司
IPC: G06F18/2431 , G06F18/214 , G06F18/213 , G06F18/22 , G06N3/09
Abstract: 本发明公开了一种AI模型服务平台数据集标注方法及系统,涉及数据集标注技术领域,将待标注数据集按照数据类型进行拆分,并识别AI模型服务平台中是否存在现有标注模型能够分别处理当前拆分后的待标注数据集;基于标注模型的评估指标评估标注模型的标注表现,进而基于数据增强对标注模型进行更新;利用更新后的标注模型分别对拆分后的待标注数据集进行标注,生成第一标注结果;基于多模型联合标注对第一标注结果进行二次标注,生成第二标注结果;通过置信区间筛选识别出第二标注结果中不合格的标注数据集,进而触发人工标注。实现了高效、低成本、高质量且灵活可扩展的数据集标注流程,从而显著提升了AI模型服务平台的标注能力和服务质量。
-
-
-