一种基于分类梯度提升算法的骚扰号码识别方法

    公开(公告)号:CN114006982A

    公开(公告)日:2022-02-01

    申请号:CN202111288535.X

    申请日:2021-11-02

    IPC分类号: H04M3/22 G06K9/62

    摘要: 本发明涉及网络通信技术和机器学习算法建模领域,特别是一种基于分类梯度提升算法的骚扰号码识别方法,包含步骤:首先选择样本,再对样本进行数据清洗和融合形成包含多维数据的原始数据集,然后从原始数据集中提取特征变量集。利用特征变量集构建Catboost模型,最后将完成训练的最终模型部署到生产系统中,用于在具体业务中识别骚扰号码,并对骚扰号码加以针对性处理。本发明采用SMOTE TomeK算法解决了数据不平衡问题,采用XGBoost特征选择方法有效降低特征维度,并结合蝙蝠算法配合训练Catboost模型避免陷入局部最优解,最终使用Catboost模型有效提高了骚扰号码的预测精度。

    一种短信应用区别授权接管的方法及系统

    公开(公告)号:CN113795000A

    公开(公告)日:2021-12-14

    申请号:CN202111051041.X

    申请日:2021-09-08

    IPC分类号: H04W4/14 H04W4/16

    摘要: 本发明涉及一种短信应用区别授权接管的方法及系统,涉及手机终端技术领域。本发明判断当前短信应用的包名是否与第三方短信应用的包名匹配,得到第一判断结果;当第一判断结果为当前短信应用的包名与第三方短信应用的包名不匹配时,启动系统短信应用;当第一判断结果为所述当前短信应用的包名与第三方短信应用的包名匹配时,提取所述当前短信的报文头,并根据报文头确定所述当前短信的类别;当所述当前短信的类别为所述普通短信时,启动所述第三方短信应用;当所述当前短信的类别为所述特殊短信时,启动所述系统短信应用。本发明既能让第三方短信应用正常使用,满足智能终端生态的发展要求,又能使特殊类型的短信能正常的被终端接收和展示。

    一种语音通话的双向实时翻译系统及方法

    公开(公告)号:CN113079142A

    公开(公告)日:2021-07-06

    申请号:CN202110313297.7

    申请日:2021-03-24

    IPC分类号: H04L29/06 G06F40/58

    摘要: 本发明涉及一种语音通话的双向实时翻译系统及方法。系统中业务受理IT系统与IMS核心网连接;业务受理IT系统受理用户的语音翻译业务,并当受理业务后将业务触发条件iFC下发至IMS核心网的xCSCF设备上;xCSCF设备用于接收受理业务的用户通过呼叫终端拨打电话时生成的业务触发条件iFC,进而根据业务触发条件iFC触发语音翻译业务,并转发业务触发条件iFC至语音翻译应用服务器;语音翻译应用服务器部署在IMS核心网上;语音翻译应用服务器根据转发的业务触发条件iFC,建立与呼叫终端的两路语音话路,并当接收到翻译指令后,执行语音翻译,并将两侧的语音翻译进行交互;本发明完全依靠通信网络对信令和话路的控制,提高了实现方式灵活性。

    一种基于媒体协商的电话视频名片系统

    公开(公告)号:CN112752310A

    公开(公告)日:2021-05-04

    申请号:CN202110149150.9

    申请日:2021-02-03

    摘要: 本发明公开了一种基于媒体协商的电话视频名片系统。该系统中主叫终端向IMS核心网发送主叫呼叫请求报文,当主叫呼叫请求报文与预先存储的业务触发数据匹配成功后,IMS核心网将主叫呼叫请求报文发送至视频名片应用服务器以完成业务触发功能;视频名片应用服务器通过IMS核心网向被叫终端发送媒体协商报文,与被叫终端进行媒体协商,并将协商结果发送至视频名片业务平台;当协商成功后,视频名片应用服务器通过IMS核心网向被叫终端发送主叫关联的信息。本发明能实现主叫触发、被叫视频媒体播放的业务功能,且在支持终端覆盖不足的情况下,现有的通话业务不受影响,同时还能实现多种主叫号码关联信息的传递和展现。

    一种基于动态规划方法实现数据去重装置及方法

    公开(公告)号:CN108052626A

    公开(公告)日:2018-05-18

    申请号:CN201711372970.4

    申请日:2017-12-19

    IPC分类号: G06F17/30

    摘要: 本发明公开一种基于动态规划方法实现数据去重装置及方法。包括数据排序单元,数据分组单元,数据清洗单元,数据相似度分析单元,数据输出单元;对所有数据进行排序得到排序后数据;将相似的排序后数据编成数据组;对数据组内提取source和traget进行清洗得到清洗后数据;对所述清洗后数据进行相似度分析得到分析结果;判断分析结果是否合格,判断合格后,输出合格数据。本发明大大降低人工匹配相似度信息,减少人工成本,提高工作效率,也保证数据质量准确性、一致性、标准性、完整性。

    一种基于流计算实现快速提取号码热度的方法

    公开(公告)号:CN106844450A

    公开(公告)日:2017-06-13

    申请号:CN201611175911.3

    申请日:2016-12-19

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种基于流计算实现快速提取号码热度的方法,步骤是:基于分布式日志收集系统Flume,用于将海量日志或数据实时的收集,达到实时高效可靠得处理各种数据源;基于分布式消息队列Kafka集群用于将数据源的数据通过消息队列送达到实时处理平台上,能够实现高吞吐和线性扩展;基于分布式流式计算集群用于消费消息队列的数据,在内存里进行迭代运算,实现秒级出运算结果;基于key‑value库Redis集群,用于将结果存于内存,实现毫秒级数据查询服务。本发明通过建立一套标准流式计算模型,实时处理海量数据,实现快速提取号码热度,给业务和市场人员快速直接的反应,为决策做更好的支撑;并不断实时更新壮大号码库。

    一种基于图注意力网络的跨语言代码相似性检测系统及方法

    公开(公告)号:CN118227139A

    公开(公告)日:2024-06-21

    申请号:CN202410374991.3

    申请日:2024-03-29

    发明人: 李宏图

    摘要: 本发明涉及一种基于图注意力网络的跨语言代码相似性检测系统及方法,该系统包括:代码预处理模块的输入为源代码、输出为抽象语法树AST的特征矩阵以及AST对应图结构的邻接矩阵;图注意力网络模块利用代码预处理模块的输出数据进行训练,以得到代码的高级特征向量;相似性度量模块根据代码的高级特征向量,用于计算代码之间的相似度;应用层模块则用于提供集成接口以及实时展示检测过程和检测结果数据。与现有技术相比,本发明将不同编程语言的抽象语法树AST进行特征向量标准化,以及对AST的图结构化和向量化,利用图注意力网络来训练,能够深入理解和分析不同编程语言之间代码的结构和语义特征,有效提高跨语言代码相似性检测的准确性和效率。