一种5G移动业务产品词库的构建方法及系统

    公开(公告)号:CN113312903B

    公开(公告)日:2022-04-19

    申请号:CN202110585587.7

    申请日:2021-05-27

    申请人: 云南大学

    摘要: 本发明涉及一种5G移动业务产品词库的构建方法及系统。该方法包括:获取套餐办理类来电文本,基于字符串模式匹配算法,构建原始词源数据集;计算所有分词词语的词频以及逆文档频率,构建词频‑逆文档频率矩阵;根据词频‑逆文档频率矩阵确定移动业务产品词集以及移动业务语义词集;对所有分词词语进行编码,确定分词词语的编码;根据移动业务产品词集以及移动业务语义词集确定负样本数据集;将分词词语以及分词词语的编码加载至神经网络模型中,利用负样本数据集训练加载后的神经网络模型,生成训练后的神经网络模型;基于训练后的神经网络模型,利用移动业务产品词集构建产品词库以及同义词库。本发明能够准确提供移动业务产品以及提高识别效率。

    一种5G移动业务产品词库的构建方法及系统

    公开(公告)号:CN113312903A

    公开(公告)日:2021-08-27

    申请号:CN202110585587.7

    申请日:2021-05-27

    申请人: 云南大学

    摘要: 本发明涉及一种5G移动业务产品词库的构建方法及系统。该方法包括:获取套餐办理类来电文本,基于字符串模式匹配算法,构建原始词源数据集;计算所有分词词语的词频以及逆文档频率,构建词频‑逆文档频率矩阵;根据词频‑逆文档频率矩阵确定移动业务产品词集以及移动业务语义词集;对所有分词词语进行编码,确定分词词语的编码;根据移动业务产品词集以及移动业务语义词集确定负样本数据集;将分词词语以及分词词语的编码加载至神经网络模型中,利用负样本数据集训练加载后的神经网络模型,生成训练后的神经网络模型;基于训练后的神经网络模型,利用移动业务产品词集构建产品词库以及同义词库。本发明能够准确提供移动业务产品以及提高识别效率。