一种基于大模型的文本处理方法、装置、设备及介质

发明公开

CN118536511A 一种基于大模型的文本处理方法、装置、设备及介质审中-实审

请登陆查看更多内容

专利标题： 一种基于大模型的文本处理方法、装置、设备及介质
申请号： CN202410367189.1

申请日： 2024-03-28
公开(公告)号： CN118536511A

公开(公告)日： 2024-08-23
发明人: 田羽慧 , 刘微 , 孟卫明 , 杜兆臣 , 杨成喆 , 刘敏
申请人： 海信集团控股股份有限公司
申请人地址： 山东省青岛市经济技术开发区前湾港路218号
专利权人： 海信集团控股股份有限公司
当前专利权人： 海信集团控股股份有限公司
当前专利权人地址： 山东省青岛市经济技术开发区前湾港路218号
代理机构： 北京同达信恒知识产权代理有限公司
代理商 郭晓丽
主分类号： G06F40/30
IPC分类号： G06F40/30 ; G06F18/22 ; G06N3/0455

摘要：

本申请涉及人工智能技术领域，尤其涉及一种基于大模型的文本处理方法、装置、设备及介质。由于在本申请实施例中，针对每个预设意图，获取该预设意图对应的每个增强文本，确定两个增强文本之间的字形相似度和语义相似度，将字形相似度大于第一预设阈值的增强文本，确定为第一候选文本，并将语义相似度小于第二预设阈值的增强文本，确定为第二候选文本，从而将第一候选文本和第二候选文本中相同的增强文本，确定为异常文本，也就是说，通过相似度比较的方式，筛选出同一预设意图下形式上相近而语义上相差比较大的异常文本，实现了自动对增强文本进行质检，无需人工参与，提高了文本处理的效率，且节约了人力物力。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/30	.语义分析