-
公开(公告)号:CN116089607A
公开(公告)日:2023-05-09
申请号:CN202211515977.8
申请日:2022-11-30
申请人: 号百信息服务有限公司
IPC分类号: G06F16/35 , G06F16/33 , G06F18/241 , G06F18/2415 , G06N3/0464 , G06N3/047 , G06N3/08
摘要: 本发明涉及一种智能应答文本分类的方法、装置、电子设备及存储介质。智能应答文本分类方法包括步骤:S1、数据处理,对经过ASR转换后的数据进行ETL工程,选取通话数据,进而得到模型所需的原始语料数据集;S2、文本构图,对原始语料数据集进行包括标点符号处理和除停用词的标准化处理,使用one‑hot对单词、文档及实体进行编码,形成初始图;S3、模型构建,基于特征投影网络Fpnet优化图卷积神经网络,采用多头边节点池化方法改进图卷积网络,形成多头边池化图卷积网络MHSP‑GCN架构,然后将MHSP‑GCN替换Fpnet中的共性特征学习网络C‑net和特征投影网络P‑net,通过特征投影网络OPL让原始特征Fp和共享特征Fc进行正交投影计算得到更纯的分类特征,从而提升智能应答文本分类任务的准确性。
-
公开(公告)号:CN115495579A
公开(公告)日:2022-12-20
申请号:CN202211140540.0
申请日:2022-09-20
申请人: 号百信息服务有限公司
IPC分类号: G06F16/35 , G06F40/289 , G06N3/04 , G06N3/08
摘要: 本发明涉及一种5G通信助理文本分类的方法、装置、电子设备及存储介质。5G通信助理文本分类的方法包括步骤:S1、对语料数据进行ASR转换,再对数据进行ETL数据清洗得到模型所需的原始语料数据集;S2、数据输入,将字向量、词向量和位置向量进行合并,生成训练数据,传递给BERT的嵌入层进行输出;S3、由分类模型分别进行训练;S4、结果融合,将由基于Attention机制改进的BiLSTM模型、Text CNN模型、DPCNN模型、Text RCNN模型输出的语义特征,分别输入至分类器层,得到分类场景下各分类类别的预测概率;S5、采用算数平均进行融合,输出分类结果。依据本发明的5G通信助理多场景语料数据进行文本分类的方法,可以解决分类正确率低的问题,并能够提升服务质量、挖掘数据潜在价值。
-