发明公开
- 专利标题: 一种基于LLM和RAG的企业年报分析方法
-
申请号: CN202410720845.1申请日: 2024-06-05
-
公开(公告)号: CN118520867A公开(公告)日: 2024-08-20
- 发明人: 胡智文 , 蔡旭强
- 申请人: 浙江工商大学
- 申请人地址: 浙江省杭州市钱塘区下沙高教园区学正街18号
- 专利权人: 浙江工商大学
- 当前专利权人: 浙江工商大学
- 当前专利权人地址: 浙江省杭州市钱塘区下沙高教园区学正街18号
- 代理机构: 杭州天欣专利事务所
- 代理商 梁斌
- 主分类号: G06F40/216
- IPC分类号: G06F40/216 ; G06F40/279 ; G06F16/242 ; G06Q10/0633 ; G06Q10/10 ; G06Q40/12
摘要:
本发明提供一种基于LLM和RAG的企业年报分析方法,能够智能理解和处理大量非结构化年报数据的新技术解决方案,以提升分析效率和准确性,满足日益增长的市场需求。本发明包括如下步骤:步骤S1:获取某上市公司连续多年的年报数据,对年报数据进行解析和预处理;步骤S2:对预处理后的年报数据进行结构化处理,通过数据处理模块接收输入的企业年报PDF文件;步骤S3:使用用户问题意图识别模块,该模块通过路由器将用户输入的问题基于问题意图分类并路由至对应的处理路径;步骤S4:应用RAG生成模块,在识别用户查询意图后,选择从数据库DB、向量化的索引系统、json文件中检索和召回与查询相关的信息;步骤S5:利用LLM模块,结合步骤S4中召回的信息和构建的Prompt,通过对结构化数据的SQL查询生成分析结果,同时结合非结构化文本分析和半结构化数据处理,以产生企业年报的深入分析报告;步骤S6:LLM对问题和回答进行反思,推理回答是否已经完整,如果LLM认为回答还不够完善,将自动提出新的补充问题然后回到步骤S1,否则将结束本轮回答。