发明公开
- 专利标题: 一种文本推理问题处理优化方法和系统
-
申请号: CN202410368750.8申请日: 2024-03-28
-
公开(公告)号: CN118536593A公开(公告)日: 2024-08-23
- 发明人: 苏立伟 , 覃浩 , 陈海燕 , 康峰 , 廖云亭 , 黄小强 , 邵彦宁 , 王帅 , 白艳玲 , 李静 , 冯伟夏 , 杨雯哲 , 燕宪瑞 , 林浩 , 潘淑华
- 申请人: 广东电网有限责任公司 , 广东电网有限责任公司客户服务中心
- 申请人地址: 广东省广州市越秀区东风东路757号;
- 专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人: 广东电网有限责任公司,广东电网有限责任公司客户服务中心
- 当前专利权人地址: 广东省广州市越秀区东风东路757号;
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 江嘉玲
- 主分类号: G06N5/04
- IPC分类号: G06N5/04 ; G06N5/045 ; G06F16/33 ; G06F40/16
摘要:
本发明公开了一种文本推理问题处理优化方法和系统,包括:获取无思维链标注的文本推理问题数据集,通过大语言模型对所述无思维链标注的文本推理问题数据集进行思维链标注,得到第一思维链数据集;其中,所述第一思维链数据集中每组数据包括问题、若干条思维链和若干个答案;计算所述每组数据中各答案的熵,并过滤熵大于预设过滤值的数据,得到第二思维链数据集;获取测试问题,通过双塔模型,从所述第二思维链数据集中检索与所述测试问题语义相关的若干条数据,作为候选组;根据所述测试问题与各所述候选组,通过大语言模型得到测试问题参考组,并根据所述测试问题参考组,得到所述测试问题对应的答案。本发明实现了更高效的文本推理问题处理。