-
公开(公告)号:CN118467726A
公开(公告)日:2024-08-09
申请号:CN202410173530.X
申请日:2024-02-06
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/243 , G06F18/2413 , G06N3/045 , G06N3/08 , G06F18/27 , G06N20/20
Abstract: 本发明属于数据处理技术领域,公开了一种文本主题提取方法、装置、设备、存储介质及产品。该方法包括:获取用户提问的问题文本;提取所述问题文本的特征工程向量;将所述特征工程向量输入至双塔模型中,得到所述问题文本的文本主题,其中,所述双塔模型包括文本表示网络和标签表示网络,所述文本表示网络为经过文本向量训练的网络,所述标签表示网络为经过标签向量训练的网络,所述文本向量为根据标注数据集的树回归向量和线性回归向量确定,所述标签向量为根据标签提取模型和无标注数据集确定,所述标签提取模型为基于树状结构的无监督标注提取模型。能够在高效率的情况下实现更准确更细粒度的文本主题提取。
-
公开(公告)号:CN118861284A
公开(公告)日:2024-10-29
申请号:CN202410875636.4
申请日:2024-07-01
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/194 , G06F40/284
Abstract: 本申请实施例公开了一种异常日志检测方法、系统、设备、存储介质及产品,涉及日志监控技术领域,公开了异常日志检测方法,包括:将各待检测日志各自划分为各个日志分词,并将各日志分词分别转化为数字,得到各待检测日志各自对应的数字序列;将各数字序列划分为各个簇,其中,同一簇中非簇心数字序列与簇心所对应的数字序列的相似度均大于或者等于预设相似度阈值,且,同一数字序列不存在于多个簇中;将各待检测日志中用户标注异常的日志对应的簇作为异常簇,并将异常簇中的数字序列各自对应的待检测日志作为异常日志。本申请实施例旨在解决如何提出一种简便的异常日志的检测方法的技术问题。
-
公开(公告)号:CN118838785A
公开(公告)日:2024-10-25
申请号:CN202410424333.0
申请日:2024-04-09
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F11/32 , G06V20/62 , G06V30/19 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/088
Abstract: 本申请公开了一种服务器的运维监控方法、装置、设备、存储介质及产品,该方法包括:获取至少一个用于描述针对服务器的操作命令和命令执行结果的提示文本,并确定所述提示文本对应的文本编码向量;获取当前操作命令关联的视频帧,并根据所述视频帧确定所述当前操作命令对应的图片编码向量;基于语言表示模型,从已确定的各文本编码向量中确定所述图片编码向量的目标文本编码向量,其中,所述语言表示模型包括所述图片编码向量和已确定的各文本编码向量之间的对应关系;输出所述目标文本编码向量对应的目标提示文本。能够提高模型的泛化能力,改善服务器的运维监控预警效果。
-
-