-
公开(公告)号:CN118467681A
公开(公告)日:2024-08-09
申请号:CN202410909730.7
申请日:2024-07-09
申请人: 金现代信息产业股份有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/137 , G06F16/31 , G06N5/04
摘要: 本发明属于检索优化领域,提供了一种基于标题增强和意图识别的RAG检索优化方法及系统,包括提取文档中的高频词汇,将相同场景知识库中的高频词汇结合,构成场景知识库索引;对文档中的标题进行识别,判断标题是否符合标题格式,并对标题分级;按照标题级别切分文档,并进行向量化存储;将提问问题向量化后与场景知识库索引求相似度,确定文档所在场景知识库,进行文档分块的检索返回给大模型生成答案。本发明改善了常规切分方式中忽略了标题与文本间联系的问题,使知识库中存储的信息更加丰富,大模型回答的结果也更加多样;减少了检索所需要的时间,检索到的文本块也更加准确,减小了无关知识对检索结果的影响,使大模型的总结更加准确。
-
公开(公告)号:CN118351557A
公开(公告)日:2024-07-16
申请号:CN202410541441.6
申请日:2024-04-30
申请人: 金现代信息产业股份有限公司
IPC分类号: G06V30/412
摘要: 本发明提供了一种用于解析型PDF的非完整框线表格识别方法及系统,包括对待识别的PDF文档进行直线和矩形提取,并将提取的矩形转化为若干直线;基于获得的若干直线,通过构建连通域获得表格区域及表格区域对应表格线集合;基于获得的表格区域,获得表格区域的四周框线;基于所述四周框线是否存在于表格线集合的判断结果,将不存在的四周框线添加入表格线集合中;基于获得的表格线集合,获取表格区域的表格线横线和竖线的交点坐标,基于获得的交点坐标,进行表格区域内单元格区域的识别;基于获得的表格区域及表格区域内部的单元格区域,实现表格的识别。
-
公开(公告)号:CN116486141A
公开(公告)日:2023-07-25
申请号:CN202310287761.9
申请日:2023-03-20
申请人: 金现代信息产业股份有限公司
IPC分类号: G06V10/764 , G06T7/11 , G06T7/62 , G06V10/26 , G06T7/73 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本公开提供了基于多模态图像识别的木板等级分类及切割方法与系统,涉及机器学习技术领域,方法包括对木板图像并进行预处理;检测木板切割的圆形定位点,获取切割的木板的粗定位图像;根据粗定位图像进行垂直方向投影,获取投影遮挡区域的掩膜图像;对掩膜图像进行木板特征提取,将提取的特征向量输入支持向量机进行分类,获取分级类型;对分级之后的非缺陷木板进行最大内接矩形算法计算,得到木板区域内的最大切割面积,进而得到切割位置,再使用改进的Mask R‑CNN算法,对木板进行像素级的定位,接着进行最大内接矩形算法,得到木板区域内的最大切割面积,利用两者的面积差值与一定的阈值大小关系,确定切割方法进行木板的分割。本公开提高了木板的出材率。
-
公开(公告)号:CN118467681B
公开(公告)日:2024-09-24
申请号:CN202410909730.7
申请日:2024-07-09
申请人: 金现代信息产业股份有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/137 , G06F16/31 , G06N5/04
摘要: 本发明属于检索优化领域,提供了一种基于标题增强和意图识别的RAG检索优化方法及系统,包括提取文档中的高频词汇,将相同场景知识库中的高频词汇结合,构成场景知识库索引;对文档中的标题进行识别,判断标题是否符合标题格式,并对标题分级;按照标题级别切分文档,并进行向量化存储;将提问问题向量化后与场景知识库索引求相似度,确定文档所在场景知识库,进行文档分块的检索返回给大模型生成答案。本发明改善了常规切分方式中忽略了标题与文本间联系的问题,使知识库中存储的信息更加丰富,大模型回答的结果也更加多样;减少了检索所需要的时间,检索到的文本块也更加准确,减小了无关知识对检索结果的影响,使大模型的总结更加准确。
-
公开(公告)号:CN117496425A
公开(公告)日:2024-02-02
申请号:CN202311288440.7
申请日:2023-09-28
申请人: 金现代信息产业股份有限公司
IPC分类号: G06V20/52 , G06V10/77 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/09 , G06N3/047
摘要: 本发明属于配电室火灾预警技术领域,具体涉及一种基于改进的卷积神经网络的配电室火灾预警方法及系统,包括:获取配电室的监控图像以及环境参数;根据所获取的监控图像、环境参数和预设的预警模型,计算当前配电室环境发生火灾的概率,完成配电室火灾的预警;其中,预设的预警模型采用改进的卷积神经网络,通过融入注意力机制的ResNet34网络对所获取的配电室监控图像进行分类,分类后的监控图像与归一化处理后的环境参数输入到卷积神经网络的全连接层,输出配电室发生火灾的概率。
-
公开(公告)号:CN116860221A
公开(公告)日:2023-10-10
申请号:CN202310946433.5
申请日:2023-07-28
申请人: 金现代信息产业股份有限公司
IPC分类号: G06F8/30 , G06F16/22 , G06F16/245 , G06F40/169 , G06F18/214
摘要: 本发明属于低代码开发领域,提供了一种低代码数据模型智能推荐方法及系统。该方法包括,获取用户想要获取的特定领域的数据模型的描述;对所述描述进行分解,得到数据模型名称和数据模型注释;根据数据模型名称和数据模型注释,采用特定场景的大语言模型,得到字段数据;其中,所述特定场景的大语言模型的构建过程包括:构建表单名称,遍历表单名称,构建字段生成数据集,并选定prompt;基于字段生成数据集和prompt对大语言模型进行微调,得到特定场景的大语言模型。
-
公开(公告)号:CN118467826A
公开(公告)日:2024-08-09
申请号:CN202410589044.6
申请日:2024-05-13
申请人: 金现代信息产业股份有限公司
IPC分类号: G06F16/9535 , G06F18/22 , G06F16/907
摘要: 本公开提供了基于检索增强生成的干部标签推荐方法及系统,涉及大语言模型标签推荐技术领域,包括:获取原始干部考察文档以及原始干部考察检索语句,对考察文档进行预处理得到切分考察语句,对所述切分考察语句以及检索语句进行向量化,分别得到切分语句向量以及检索语句向量;将切分语句向量与检索语句向量进行相似性比较,得到与检索语句关联大的切分考察语句;将与检索语句关联大的切分考虑语句输入到基于Prompt的语言模型中,生成评价标签,对每一个生成的评价标签寻找对应的原始切分考察语句,建立评价标签与原始文档之间的关联关系,实现评价标签的原始追溯。
-
公开(公告)号:CN117877038B
公开(公告)日:2024-06-04
申请号:CN202410274972.3
申请日:2024-03-12
申请人: 金现代信息产业股份有限公司
IPC分类号: G06V30/146 , G06V30/413
摘要: 本发明属于扫描文档图像处理领域,提供了一种基于文字检测的文档图像纠偏方法、系统、设备及介质,包括获取扫描文档图像;基于扫描文档图像进行图像方向检测并调整,得到基本扫描文档图像;对基本扫描文档图像进行表格检测,若基本扫描图像存在表格,则根据表格的上下边的坐标计算得到第一倾斜角;若基本扫描文档图像不存在表格,则对基本扫描文档图像进行文字检测,根据文字坐标计算得到第二倾斜角;基于第一倾斜角和第二倾斜角进行加权,得到扫描文档图像的总倾斜角度并进行图像旋转,得到纠偏后扫描文档图像。本发明提供的方法还可以应用到常规的含有文字或含有表格的图像纠偏中,通用性能好,准确率高。
-
公开(公告)号:CN117877038A
公开(公告)日:2024-04-12
申请号:CN202410274972.3
申请日:2024-03-12
申请人: 金现代信息产业股份有限公司
IPC分类号: G06V30/146 , G06V30/413
摘要: 本发明属于扫描文档图像处理领域,提供了一种基于文字检测的文档图像纠偏方法、系统、设备及介质,包括获取扫描文档图像;基于扫描文档图像进行图像方向检测并调整,得到基本扫描文档图像;对基本扫描文档图像进行表格检测,若基本扫描图像存在表格,则根据表格的上下边的坐标计算得到第一倾斜角;若基本扫描文档图像不存在表格,则对基本扫描文档图像进行文字检测,根据文字坐标计算得到第二倾斜角;基于第一倾斜角和第二倾斜角进行加权,得到扫描文档图像的总倾斜角度并进行图像旋转,得到纠偏后扫描文档图像。本发明提供的方法还可以应用到常规的含有文字或含有表格的图像纠偏中,通用性能好,准确率高。
-
公开(公告)号:CN117454168A
公开(公告)日:2024-01-26
申请号:CN202311345277.3
申请日:2023-10-17
申请人: 金现代信息产业股份有限公司
IPC分类号: G06F18/214 , G06F18/20 , G06F18/213 , G06Q50/06 , G06Q50/08 , G06N3/0442
摘要: 本发明属于能耗预测技术领域,提供了一种建筑能耗预测方法及系统,包括:获取待预测建筑的相关参数;根据所获取的相关参数和能耗预测模型,预测建筑能耗;其中,在预测建筑能耗的过程中,在长短期记忆网络之前加入注意力层,通过改进的长短期记忆网络构建能耗预测模型,预测建筑用电,实现建筑能耗的预测。本发明基于改进的长短期记忆网络预测建筑在未来一段时间内的能耗情况,预测准确度高、速度快;能够及时发现异常情况,为建筑能源管理和节能提供有力支持;所构建的能耗预测模型能够准确的捕捉到历史时间序列上能耗之间的关系,准确快速地完成电力能耗预测。
-
-
-
-
-
-
-
-
-