一种基于时空图的诈骗号码识别方法

    公开(公告)号:CN111726460B

    公开(公告)日:2021-04-20

    申请号:CN202010542365.2

    申请日:2020-06-15

    Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。

    一种网络诈骗易感人群筛选方法

    公开(公告)号:CN111737318A

    公开(公告)日:2020-10-02

    申请号:CN202010585668.2

    申请日:2020-06-24

    Abstract: 本发明提供一种网络诈骗易感人群筛选方法,包括:提取高危用户的社会属性数据;根据高危用户的社会属性进行分段,统计每个属性分段的访问诈骗网站人数;根据高危用户在各个属性分段的数量分布,为每个属性分段分配不同的权重,形成权重集合;计算所有高危用户的权重的加权平均值,取加权平均值最小的用户作为筛选阈值;使用权重集合与筛选阈值建立初始模型。由于容易受害的群体往往集中在部分人群,针对这些人群重点宣传,可以起到事半功倍的效果,因此通过本发明可以准确、迅速的对诈骗网站的访问数据分析筛选,挖掘出网络诈骗易受害人群,从而提高防网络诈骗宣传的效率,针对易被骗人群重点宣传,有效降低诈骗率,降低宣传成本。

    一种VoIP网络流量所属平台的识别方法

    公开(公告)号:CN111641599A

    公开(公告)日:2020-09-08

    申请号:CN202010394712.1

    申请日:2020-05-11

    Abstract: 一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。

    一种诈骗电话语音自动标注系统及方法

    公开(公告)号:CN109493882A

    公开(公告)日:2019-03-19

    申请号:CN201811304612.4

    申请日:2018-11-04

    Abstract: 本发明公开一种诈骗电话语音自动标注系统,包括基础维度标注模块、声纹标注模块、连续语音识别标注模块,所述基础维度标注模块的输出端分别与所述声纹标注模块的输入端、所述连续语音识别标注模块的输入端相连接。本发明还提出一种诈骗电话语音自动标注方法,具体包括如下步骤:基础维度标注步骤;连续语音识别步骤;声纹标注步骤。本发明通过智能语音技术实现对输入语音数据进行自动处理,实现语音数据的自动分析识别,并进行标签预标注工作,再结合人工确认,进行目标数据维度标签的有效标注管理,有效地利用通话语音数据,优化智能语音技术在电话诈骗场景下的应用及效果,同时保证数据在标注过程中的脱密及加密传输。

    语言模型的训练方法、NLP任务处理方法及装置

    公开(公告)号:CN113420123B

    公开(公告)日:2025-01-14

    申请号:CN202110705729.9

    申请日:2021-06-24

    Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置,包括:获取训练样本集;训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签;复制语言模型得到教师语言模型,将语言模型作为学生语言模型;将第二任务标签输入至教师语言模型中,生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签;将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中,生成第一预测文本、第一预测结果、第二预测文本和第二预测结果,对学生语言模型进行训练。根据本申请实施例,能够解决相关技术中存储资源占用大的问题。

Patent Agency Ranking