一种快速领域问答方法及其装置

    公开(公告)号:CN111930911B

    公开(公告)日:2024-03-29

    申请号:CN202010807749.2

    申请日:2020-08-12

    发明人: 李欢欢 陈亚萍

    摘要: 本发明实施例提供了一种领域问答方法及其装置,该方法包括:获取用户问题语句;提取该用户问题语句的关键词组;通过近义词典获取关键词组中的各个关键词的近义词,用每个近义词分别替换用户问题语句中对应的关键词,生成若干扩展问题语句;提取若干扩展问题语句的关键词组,根据关键词组包含的关键词、关键词所属问题子领域,确认各个扩展问题语句匹配的问题子领域;通过问答语料集,确定各个扩展问题语句匹配的问题子领域包含的各个标准问题语句,根据各个标准问题语句与各个扩展问题语句的文本相似度,确定第一标准问题;根据问答语料集,获取第一标准问题的标准问题答案,以其作为用户问题语句的答案。

    基于机器学习算法的工单质检方法和装置

    公开(公告)号:CN109635292B

    公开(公告)日:2023-07-28

    申请号:CN201811482026.9

    申请日:2018-12-05

    摘要: 本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中,工单质检方法包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与实际的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明实施例有助于提高工单质检准确率。

    基于机器学习算法的工单质检方法和装置

    公开(公告)号:CN109635292A

    公开(公告)日:2019-04-16

    申请号:CN201811482026.9

    申请日:2018-12-05

    IPC分类号: G06F17/27 G06F17/22 G06N20/00

    CPC分类号: G06F17/2765

    摘要: 本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中,工单质检方法包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与实际的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明实施例有助于提高工单质检准确率。

    一种移动互联网端到端问题定位方法和系统

    公开(公告)号:CN106911517A

    公开(公告)日:2017-06-30

    申请号:CN201710175360.9

    申请日:2017-03-22

    发明人: 孙勇 陈亚萍

    IPC分类号: H04L12/24 H04W24/04

    CPC分类号: H04L41/0677 H04W24/04

    摘要: 本发明实施例公开了一种移动互联网端到端问题定位方法和系统。在所述方法中,根据XDR数据确定XDR数据中包括的异常信息。根据所述异常信息确定问题端。根据确定的问题端确定具体的问题对象。本发明具体实施例通过对LTE信令的XDR数据进行分析,实现移动互联网业务的端到端质量分析和问题定界。同时结合网管的OMC数据和网优的MR数据进行无线侧和核心侧网络问题的详细定位,快速找到问题原因。

    一种投诉原因定位方法及装置

    公开(公告)号:CN106528675A

    公开(公告)日:2017-03-22

    申请号:CN201610929622.1

    申请日:2016-10-31

    IPC分类号: G06F17/30 G06Q30/00

    摘要: 本发明涉及一种投诉原因定位方法及装置,包括:将地图分割为栅格单元;根据预设规则,将投诉原因聚合在所述栅格单元内,使栅格单元具有栅格属性,栅格属性包括投诉原因的可信度;当接收到用户投诉时,获取用户投诉的位置信息,将位置信息与栅格单元进行匹配,确定目标栅格单元;根据投诉原因的可信度,在目标栅格单元中确定用于回复用户的最佳解释口径。具有以下优点:简化了判断流程,节省了时间,投诉原因定位更加精确,统一了解释口径,给出最优解释口径。

    一种通话关键信息的获取方法及装置

    公开(公告)号:CN113590828A

    公开(公告)日:2021-11-02

    申请号:CN202110926678.2

    申请日:2021-08-12

    摘要: 本申请实施例提供一种通话关键信息的获取方法及装置,该获取方法包括:获取待处理的通话录音信息;对通话录音信息进行语音识别,确定通话录音信息对应的通话文本信息;通过预先配置的可读性识别算法对通话文本信息的可读性进行识别,确定通话文本信息的可读性是否满足要求;若是,则处理通话文本信息,确定通话关键信息,通话关键信息包括通话文本的摘要和/或通话文本的关键词。本申请实施例提供的通话关键信息的获取方法,在实现提高对通话信息的关键信息的获取效率的基础上,增加了对通话关键信息的获取的准确性,提升了用户的使用体验。

    一种实现计算集群资源跨域架构的方法及系统

    公开(公告)号:CN111049898A

    公开(公告)日:2020-04-21

    申请号:CN201911259787.2

    申请日:2019-12-10

    发明人: 孟彬 梁策 陈亚萍

    IPC分类号: H04L29/08

    摘要: 本发明属于大数据处理技术领域,具体涉及一种实现计算集群资源跨域架构的方法及系统。包括多个域的计算集群,包括至少两级计算集群的跨域汇合集群单元,所述跨域汇合集群单元包括一级n域集群和二级汇合集群,其中一级n域集群包括并列的n个域的计算集群,所述n为大于1的整数;所述方法包括:所述一级n域集群的n个计算集群分别进行分布式计算数据处理后,分别推送给所述二级汇合集群,进行汇合计算。本发明通过架设多级计算集群的跨域汇合集群单元,抽取跨域集群的结果数据,实现二级汇合计算,解决跨域集群间专线网络的通信压力,支持不同地区、不同机房架设集群实施跨域分布式计算。

    基于数据仓库的数据汇聚调度方法

    公开(公告)号:CN103810258B

    公开(公告)日:2017-06-30

    申请号:CN201410037541.1

    申请日:2014-01-26

    发明人: 何峻 陈亚萍 孙勇

    IPC分类号: G06F17/30 G06F9/46 G06F11/34

    摘要: 本发明涉及一种基于数据仓库的数据汇聚调度方法,该方法包括:开启调度任务中的主任务进程;所述主任务进程根据数据源的属性信息启动第一相关任务云中的第一任务云;所述第一任务云对本地的第一任务组进行遍历,从所述第一任务组中选择满足汇聚条件的表组成第一组表;将所述第一组表并行汇聚处理得到汇聚表;当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;标记所述第一任务组实例状态。本发明通过任务模型配置可以最大化地利用数据库资源,并在数据缺失时及时发出告警,通过数据戳快速定位问题根源。

    用户反馈故障信息处理方法、设备、服务器和存储介质

    公开(公告)号:CN111181786B

    公开(公告)日:2022-06-10

    申请号:CN201911395269.3

    申请日:2019-12-30

    发明人: 陈应见 陈亚萍

    摘要: 本申请提供一种用户反馈故障信息处理方法、设备、服务器和存储介质,属于网络维护技术领域,用以解决的现有技术中难以发现服务质量异常点的技术问题。该方法包括:获取用于记录用户反馈的故障信息的电子工单;采集与各个电子工单分别对应的流程轨迹数据和业务轨迹数据;根据全流程数据,通过预设的稽核规则模型对电子工单进行稽核校正,输出反馈目标信息,全流程数据包括流程轨迹数据和业务轨迹数据;针对反馈目标信息进行聚类分析,获得服务质量存在异常的异常点信息。本申请通过稽核规则模型提高了故障信息表达的准确度,相比于人工少量抽检的方式,本申请质检覆盖率更高,能够更准确地查找到服务质量存在问题的异常点。

    一种基于机器学习算法的IDC流量数据预测方法及装置

    公开(公告)号:CN111614520B

    公开(公告)日:2021-12-14

    申请号:CN202010450312.8

    申请日:2020-05-25

    发明人: 李欢欢 陈亚萍

    IPC分类号: H04L12/26 H04L12/24 G06N20/00

    摘要: 本发明实施例公开了一种基于机器学习算法的IDC流量数据预测方法及装置,方法包括:利用滑窗对任一时刻IDC流量数据进行特征提取,以获取流量数据特征;其中,流量数据特征至少包括时序特征、固有特征和统计特征;将上述特征输入到预置的IDC流量数据预测模型中,得到任一时刻的下一时刻的流量数据;预置的IDC流量数据预测模型为,以具有周期性的IDC历史流量数据在历史任一时刻对应的时序特征、固有特征和统计特征为输入,以历史任一时刻的下一时刻的IDC历史流量数据为输出对机器学习模型进行训练得到。本发明实施例通过将提取的流量数据特征输入预置的IDC流量数据预测模型中,得到未来的流量数据,达到了对未来流量数据进行时间序列预测的目的。