-
公开(公告)号:CN119597922A
公开(公告)日:2025-03-11
申请号:CN202410944061.7
申请日:2024-07-15
Applicant: 济南大学
IPC: G06F16/353 , G06F40/284 , G06F40/30 , G06F18/213 , G06F18/241 , G06F18/2431 , G06N3/042 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种面向互联网文本的多标签分类方法及系统,方法包括:获取待识别文本,并对待识别文本进行预处理;将预处理后的文本、标签集以及外部知识,均输入到训练后的多标签分类模型中,得到分类的多标签结果;其中,在训练后的多标签分类模型中,对预处理后的文本进行特征提取,得到文本特征表示;对文本特征表示进行平滑处理,得到平滑后的文本特征表示;同时,基于原始标签集和外部知识构建标签图,从标签图中提取标签特征表示;将平滑后的文本特征表示、标签特征表示以及原始标签集进行双粒度学习,得到分类特征,分类特征包括:文本‑标签中与分类相关的信息,和标签‑标签中与分类相关的信息;利用分类特征进行分类,得到分类结果。
-
公开(公告)号:CN120030167A
公开(公告)日:2025-05-23
申请号:CN202510197525.7
申请日:2025-02-21
Applicant: 济南大学
IPC: G06F16/353 , G06F40/30 , G06F40/194 , G06N3/045 , G06N3/09 , G06N3/042 , G06N3/0464
Abstract: 本发明属于自然语言处理技术领域,提供了一种互联网文本层次多标签分类方法及系统,在训练过程中首先对原始文本进行增强,得到增强文本,将原始文本与其增强文本作为正样本对挖掘标签间共现关系;将具有直接层次关系的标签作为正标签对挖掘标签间层次关系;然后对原始标签特征进行差异化增强,通过高频共现标签信息增强低频标签,通过历史标签信息增强高频标签;最后将文本特征和增强后的标签特征进行双向交互,利用标签与文本之间潜在的语义关联进行二次增强,得到分类特征;基于分类特征进行分类,得到分类结果,达到了丰富标签和文本的语义特征的目的,同时利用标签之间的共现关系和层次关系提高了层次多标签分类的分类精度。
-