-
公开(公告)号:CN115599882A
公开(公告)日:2023-01-13
申请号:CN202110777944.X
申请日:2021-07-09
IPC分类号: G06F16/33 , G06F40/216 , G06F40/30
摘要: 本发明提供了一种文本数据检测方法、装置及存储介质,涉及语料分析技术领域,方法包括:通过获取目标对象的目标文本数据,提取目标文本数据中的多个目标关键词;结合多个对照关键词,通过卡方分析计算多个目标关键词在目标文本数据中对应的多个卡方词频信息;将多个卡方词频信息与多个对照卡方词频信息进行比对,确定多个目标关键词的检测结果。装置包括:数据获取单元、第一处理单元和第二处理单元,该装置结合方法通过数据获取单元、第一处理单元和第二处理单元处理目标文本数据得到检测结果。由于卡方词频信息是反映了目标关键词的词频信息的偏差程度。进而根据偏差程度的大小确定出检测结果。所以提高了目标关键词掌握情况的检测准确性。