发明公开
CN117371431A 一种语料处理方法及装置
审中-实审
- 专利标题: 一种语料处理方法及装置
-
申请号: CN202210772100.0申请日: 2022-06-30
-
公开(公告)号: CN117371431A公开(公告)日: 2024-01-09
- 发明人: 田羽慧 , 杨斐 , 高雪松
- 申请人: 海信集团控股股份有限公司
- 申请人地址: 山东省青岛市经济技术开发区前湾港路218号
- 专利权人: 海信集团控股股份有限公司
- 当前专利权人: 海信集团控股股份有限公司
- 当前专利权人地址: 山东省青岛市经济技术开发区前湾港路218号
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 刘彩红
- 主分类号: G06F40/258
- IPC分类号: G06F40/258 ; G06F40/205
摘要:
本发明实施例涉及一种语料处理方法及装置。该方法包括:采用主题演化分析模型对第一时间窗口内获取的语料提取n个主题,并确定每个主题在第一时间窗口中的第一实际主题强度;根据主题在每个第一时间窗口内的第一实际主题强度,确定主题在第二时间窗口内的预测主题强度;根据主题在第二时间窗口的第二实际主题强度与主题在第二时间窗口内的预测主题强度,确定主题的偏离状况;根据n个主题的偏离状况,确定第三时间窗口的大小;采用主题演化分析模型对第三时间窗口内获取的语料进行主题提取。对第三时间窗口的大小进行自适应地调整。提高了时间窗口大小的调整的灵活性,提高了主题演化分析的准确性。