-
公开(公告)号:CN113312903B
公开(公告)日:2022-04-19
申请号:CN202110585587.7
申请日:2021-05-27
申请人: 云南大学
IPC分类号: G06F40/242 , G06F40/126 , G06F40/216 , G06F40/284 , G06F40/30 , G06N3/08
摘要: 本发明涉及一种5G移动业务产品词库的构建方法及系统。该方法包括:获取套餐办理类来电文本,基于字符串模式匹配算法,构建原始词源数据集;计算所有分词词语的词频以及逆文档频率,构建词频‑逆文档频率矩阵;根据词频‑逆文档频率矩阵确定移动业务产品词集以及移动业务语义词集;对所有分词词语进行编码,确定分词词语的编码;根据移动业务产品词集以及移动业务语义词集确定负样本数据集;将分词词语以及分词词语的编码加载至神经网络模型中,利用负样本数据集训练加载后的神经网络模型,生成训练后的神经网络模型;基于训练后的神经网络模型,利用移动业务产品词集构建产品词库以及同义词库。本发明能够准确提供移动业务产品以及提高识别效率。
-
公开(公告)号:CN113312903A
公开(公告)日:2021-08-27
申请号:CN202110585587.7
申请日:2021-05-27
申请人: 云南大学
IPC分类号: G06F40/242 , G06F40/126 , G06F40/216 , G06F40/284 , G06F40/30 , G06N3/08
摘要: 本发明涉及一种5G移动业务产品词库的构建方法及系统。该方法包括:获取套餐办理类来电文本,基于字符串模式匹配算法,构建原始词源数据集;计算所有分词词语的词频以及逆文档频率,构建词频‑逆文档频率矩阵;根据词频‑逆文档频率矩阵确定移动业务产品词集以及移动业务语义词集;对所有分词词语进行编码,确定分词词语的编码;根据移动业务产品词集以及移动业务语义词集确定负样本数据集;将分词词语以及分词词语的编码加载至神经网络模型中,利用负样本数据集训练加载后的神经网络模型,生成训练后的神经网络模型;基于训练后的神经网络模型,利用移动业务产品词集构建产品词库以及同义词库。本发明能够准确提供移动业务产品以及提高识别效率。
-