-
公开(公告)号:CN117095673A
公开(公告)日:2023-11-21
申请号:CN202310830037.6
申请日:2023-07-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。
-
公开(公告)号:CN115915038A
公开(公告)日:2023-04-04
申请号:CN202110805859.X
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于移动用户信令数据的跨城通勤用户识别方法及装置,包括:基于每一周期的白天时间段与夜间时间段,利用目标区域的移动用户信令数据获取该周期日工作用户与该周期日居住用户;依据该周期日工作用户的该周期夜间信令数据与该周期日居住用户的该周期白天信令数据,分别得到该周期夜间信令消失用户与该周期白天信令消失用户;利用全部移动用户在设定时间段内成为该周期夜间信令消失用户或该周期白天信令消失用户的次数,得到跨城通勤用户识别结果。本发明基于原始信令数据挖掘跨城通勤用户,采用Spark计算框架进行分析处理,具有高可靠性和高效率,可用于区域人口监管。
-
公开(公告)号:CN115700514A
公开(公告)日:2023-02-07
申请号:CN202110806905.8
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/332 , G06F40/30 , G06F18/2411
Abstract: 本发明公开了一种结合BIGRU和多头注意的事件主体提取方法及装置,包括:把文本数据转化为文本输入序列X;利用BiGRU网络获取文本输入序列X对应的向量XB;基于文本输入序列X与向量XB进行多头注意力计算;依据注意力计算结果,获取事件主体提取结果。本发明使用BIGRU网络学习上下文语义特征,通过引入多头注意力机制捕获序列中的关键特征信息,提高了工作效率及准确性。
-
公开(公告)号:CN115221940A
公开(公告)日:2022-10-21
申请号:CN202210617794.0
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于决策树的历史通讯记录异常行为分析方法及系统,所述一种基于决策树的历史通讯记录异常行为分析方法包括采集历史通讯记录数据进行预处理得到历史通讯记录预处理数据;利用所述历史通讯记录预处理数据得到历史通讯记录异常行为分析结果,结合通话行为和标记库与互联网标记等信息,实现异常电话的精准发现,避免错误捕捉正常用户号码,进而对正常用户实现保护。
-
公开(公告)号:CN113676604A
公开(公告)日:2021-11-19
申请号:CN202010403400.2
申请日:2020-05-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 国家计算机网络与信息安全管理中心
IPC: H04M7/00
Abstract: 本发明实施例公开了一种语音处理方法、相关设备和存储介质。所述方法包括:第一网络设备接收到呼叫请求消息,所述呼叫请求消息中包括主叫号码和被叫号码;判断所述主叫号码是否满足预设触发条件;在判定所述主叫号码满足预设触发条件的情况下,将所述呼叫请求消息转发至接入能力网元;所述接入能力网元用于从业务服务器获得针对所述呼叫请求消息的呼叫控制策略、并根据所述呼叫控制策略对所述呼叫请求消息对应的呼叫事件进行处理。
-
公开(公告)号:CN113326689A
公开(公告)日:2021-08-31
申请号:CN202010128327.2
申请日:2020-02-28
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/205 , G06F40/211 , G06N20/00 , G06K9/62
Abstract: 本发明属于数据通信和数据处理技术领域,具体涉及一种基于深度强化学习模型的数据清洗方法,该方法包括:获取待清洗的带标签的数据集;采用预筛选算法,删除待清洗的带标签的数据集中的无内容数据、不在标签集内的标签数据和标签矛盾的数据,获得待分类的数据集;将待分类的数据集输入至预先训练的深度强化学习模型中,获得不同类别的延迟奖励;再根据获得的不同类别的延迟奖励,依据预先训练的深度强化学习模型中的动作集合,丢弃掉有偏数据,保留有效数据,并更新状态列表S,最大化每一类别的延迟奖励值,将每一类别的最大延迟奖励值对应的带标签的训练数据集作为清洗干净的带标签的训练数据集,从而完成数据清洗。
-
公开(公告)号:CN113115363A
公开(公告)日:2021-07-13
申请号:CN202110426526.6
申请日:2021-04-20
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 倪善金 , 万辛 , 黄远 , 孙晓晨 , 宁珊 , 沈亮 , 高圣翔 , 计哲 , 杨晶超 , 张震 , 李鹏 , 石瑾 , 李沁 , 侯炜 , 刁则鸣 , 刘发强 , 孙旭东 , 王立强 , 刘睿霖
IPC: H04W28/02 , H04W28/08 , H04B17/318 , H04B17/382
Abstract: 本公开提供一种异构网络中的移动通信方法、装置与电子设备。异构网络中的移动通信方法包括:确定目标用户在所述目标异构网络中的目标位置确定所述目标位置处于所述目标低功率节点的目标信号范围内,所述目标信号范围是根据所述目标低功率节点与所述宏基站之间的目标信号强度边界和所述目标信号强度边界的目标范围扩展基基确定的将所述目标用户与所述宏基站之间通信切换为所述目标用户与所述目标低功率节点进行通信。本公开实施例提供的技术方案可以通过低功率节点的覆盖边界扩展,降低宏基站的负载,提高异构网络中用户的网络信号强度,增强系统的可靠性和频谱效率。
-
公开(公告)号:CN112989839A
公开(公告)日:2021-06-18
申请号:CN201911309397.1
申请日:2019-12-18
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/284
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于关键词特征嵌入语言模型的意图识别方法,包括:采用前后向最大分词算法,对提取的有效文本的语言信息进行分词,获得不同类别的分词结果;针对获得的不同类别的分词结果,获得不同类别的分词结果对应的候选意图相关的关键词列表;剔除每一种类别的分词结果对应的候选意图相关的关键词列表中的通用高频词和领域无关词,获得每一种类别的分词结果对应的最终关键词表,进而获得不同的关键词特征向量;将获得的每一个关键词特征向量嵌入至预先训练好的语言模型,获得带有关键词特征的有效文本的语音信息;并对其进行编码和分类,获得该有效文本的语言信息的意图识别结果。
-
公开(公告)号:CN112331181A
公开(公告)日:2021-02-05
申请号:CN201910694870.6
申请日:2019-07-30
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于目标语音提取和自适应技术领域,具体涉及一种基于多说话人条件下目标说话人语音提取方法,该方法具体包括:实时获取多个说话人混合的语音,提取多个说话人混合的语音的频谱;将锚语音输入到预先训练的说话人识别模型中,提取出目标说话人的特征向量;将获取的多个说话人混合的语音的频谱和目标说话人的特征向量输入至预先训练的目标说话人语音提取网络中,获取目标说话人的语音频谱;基于该目标说话人的语音频谱,获取目标说话人的语音。
-
公开(公告)号:CN111862970A
公开(公告)日:2020-10-30
申请号:CN202010505265.2
申请日:2020-06-05
Applicant: 珠海高凌信息科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于智能语音机器人的虚假宣传治理应用方法及装置,包括:对接入的信令及媒体数据进行语音分析,得到实时媒体流和/或文字数据;智能语音机器人根据实时媒体流及文字数据进行语义理解和意图判断,根据所述语义理解和意图判断生成对应的回复语句,进而生成相应的通话媒体数据,将通话媒体数据发送至主叫;记录每次虚假呼叫档案信息,用于在后续的呼叫识别时,将虚假呼叫档案信息作为对应的应用场景。本发明的有益效果为:引入智能语音机器人进行语音互动,可有效占用虚假宣传源头的通话时间,间接的减少了受害人等接通次数;对虚假宣传源头进行干扰,降低其诈骗成功率。