-
公开(公告)号:CN120067415A
公开(公告)日:2025-05-30
申请号:CN202510144247.9
申请日:2025-02-10
Applicant: 北京工业大学
IPC: G06F16/906 , G06F16/9535 , G06F16/334 , G06F16/353 , G06F40/284 , G06F40/30 , G06F18/2433 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06N3/096 , G06N3/047 , G06Q50/00
Abstract: 本发明提供一种面向“信息疫情”不实信息甄别的三分类混合迁移学习方法及系统,涉及信息管理技术领域,包括:使用融合后的数据,并根据常规的“虚假”或“真实”标签,进行二分类训练,以构建预训练模型;在微调模型中,通过“未确定”类别用于分类无法明确判定为“虚假”或“真实”的记录;利用预训练模型的BERT层生成的融合“信息疫情”关键词和常规不实信息的文本输出;结合BERT模型、TextCNN模型和fastText模型,对BERT模型的输入特征进行处理,利用微调模型对处理后的特征进行训练,将“信息疫情”相关的数据细分为“未确定”、“虚假”或“真实”三类。本发明可以更精准地甄别“信息疫情”中的不实信息,增加方法的实际应用效果。