一种语料处理方法及装置
摘要:
本发明实施例涉及一种语料处理方法及装置。该方法包括:采用主题演化分析模型对第一时间窗口内获取的语料提取n个主题,并确定每个主题在第一时间窗口中的第一实际主题强度;根据主题在每个第一时间窗口内的第一实际主题强度,确定主题在第二时间窗口内的预测主题强度;根据主题在第二时间窗口的第二实际主题强度与主题在第二时间窗口内的预测主题强度,确定主题的偏离状况;根据n个主题的偏离状况,确定第三时间窗口的大小;采用主题演化分析模型对第三时间窗口内获取的语料进行主题提取。对第三时间窗口的大小进行自适应地调整。提高了时间窗口大小的调整的灵活性,提高了主题演化分析的准确性。
0/0