发明公开
- 专利标题: 一种基于大模型的文本处理方法、装置、设备及介质
-
申请号: CN202410367189.1申请日: 2024-03-28
-
公开(公告)号: CN118536511A公开(公告)日: 2024-08-23
- 发明人: 田羽慧 , 刘微 , 孟卫明 , 杜兆臣 , 杨成喆 , 刘敏
- 申请人: 海信集团控股股份有限公司
- 申请人地址: 山东省青岛市经济技术开发区前湾港路218号
- 专利权人: 海信集团控股股份有限公司
- 当前专利权人: 海信集团控股股份有限公司
- 当前专利权人地址: 山东省青岛市经济技术开发区前湾港路218号
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 郭晓丽
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06F18/22 ; G06N3/0455
摘要:
本申请涉及人工智能技术领域,尤其涉及一种基于大模型的文本处理方法、装置、设备及介质。由于在本申请实施例中,针对每个预设意图,获取该预设意图对应的每个增强文本,确定两个增强文本之间的字形相似度和语义相似度,将字形相似度大于第一预设阈值的增强文本,确定为第一候选文本,并将语义相似度小于第二预设阈值的增强文本,确定为第二候选文本,从而将第一候选文本和第二候选文本中相同的增强文本,确定为异常文本,也就是说,通过相似度比较的方式,筛选出同一预设意图下形式上相近而语义上相差比较大的异常文本,实现了自动对增强文本进行质检,无需人工参与,提高了文本处理的效率,且节约了人力物力。