- 专利标题: 基于本地知识库的报告自动生成检索增强优化方法和系统
-
申请号: CN202410954562.3申请日: 2024-07-17
-
公开(公告)号: CN118981476A公开(公告)日: 2024-11-19
- 发明人: 王朋飞 , 高旋 , 冯威源 , 夏睿 , 邰伟鹏
- 申请人: 安徽工业大学科技园有限公司
- 申请人地址: 安徽省马鞍山市经济技术开发区(示范园区)嘉善科技园1号科研楼
- 专利权人: 安徽工业大学科技园有限公司
- 当前专利权人: 安徽工业大学科技园有限公司
- 当前专利权人地址: 安徽省马鞍山市经济技术开发区(示范园区)嘉善科技园1号科研楼
- 代理机构: 南京思宸知识产权代理事务所(特殊普通合伙) 32548专利代理师韦康
- 主分类号: G06F16/2453
- IPC分类号: G06F16/2453 ; G06F16/2455 ; G06F16/26
摘要:
本发明公开了基于本地知识库报告自动生成的检索增强优化方法和系统,提出重构检索增强可控生成架构,包括:文档预处理,提取文档结构、剔除无效内容,将文档分块、向量化及存入数据库;问题重构模块,将用户问题拆解为检索关键字、用户意图、问题重写、问题扩充四个部分;检索增强模块,将检索关键字应用关键字搜索方法,问题重写、问题扩充应用向量语义检索方法,对检索结果进行合并、过滤、重排序、压缩及对齐;最终将检索结果与用户意图合并,并应用特定提示模板生成基于本地知识库的文本内容。本发明对非结构化文件进行结构标准化,提取图表及图片信息,对用户输入进行拆解、重构、扩展,以及基于本地知识对特定格式的文档生成。