Patent search ap:("中国科学院声学研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"张震" Page 1

1.

发明公开
一种语音检测方法审中-实审

公开(公告)号：CN116778910A

公开(公告)日：2023-09-19

申请号：CN202310505872.2

申请日：2023-05-06

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张鹏远 , 张震 , 陆镜泽 , 孙旭东 , 王文超 , 刘睿霖 , 王丽 , 杜金浩 , 陈树丽 , 计哲

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/28 , G06F18/2135 , G06F18/241 , G06N3/0464 , G06N3/08

Abstract: 本申请提供了一种语音检测方法，包括：获取目标语音，将所述目标语音进行预处理，所述预处理包括预加重、分帧及加窗；确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征；基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征；将所述第一主成分特征输入训练好的分类器，输出分类的结果，所述分类结果为伪造语音，或自然语音。本申请利用伪造语音在基频处留下的痕迹信息，利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选，选取具有较高相关性的主成分作为特征，减少特征维度和冗余特征，提高模型的泛化能力和效率。

2.

发明授权
一种立体声音频的带宽扩展方法与装置失效

公开(公告)号：CN106960672B

公开(公告)日：2020-08-21

申请号：CN201710203054.1

申请日：2017-03-30

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所

Inventor： 高昕 , 颜永红 , 邹潇湘 , 白海钏 , 舒敏 , 云晓春 , 王锟 , 张震 , 计哲 , 董琳 , 金暐 , 王中华 , 李海灵 , 李佳

IPC: G10L21/0388 , H04S7/00

Abstract: 本发明公开了一种立体声音频的带宽扩展方法与装置。该方法包括：将立体声信号分解为直达声和扩散声；按照预设的频带扩展方法对扩散声进行带宽扩展；将直达声分离成多个不同方位的点声源，对多个点声源分别进行带宽扩展，得到带宽扩展后的多个点声源；将带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合，得到带宽扩展后的直达声；根据带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。借助于本发明的技术方案，解决了现有技术中仅根据单个声道重建信号的主观质量实现对信号带宽的扩展，没有考虑到两个声道中信号能量和相位的相关性，其重建立体声信号严重影响了听者对声源位置和距离的判定的问题。

3.

发明授权
语言模型的训练方法、NLP任务处理方法及装置有权

公开(公告)号：CN113420123B

公开(公告)日：2025-01-14

申请号：CN202110705729.9

申请日：2021-06-24

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张学君 , 张震 , 王晗 , 李鹏 , 刘建 , 石瑾 , 刘睿霖 , 颜永红

IPC: G06F16/3329 , G06F16/334 , G06F18/214 , G06N3/02

Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置，包括：获取训练样本集；训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签；复制语言模型得到教师语言模型，将语言模型作为学生语言模型；将第二任务标签输入至教师语言模型中，生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签；将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中，生成第一预测文本、第一预测结果、第二预测文本和第二预测结果，对学生语言模型进行训练。根据本申请实施例，能够解决相关技术中存储资源占用大的问题。

4.

发明公开
语言模型的训练方法、NLP任务处理方法及装置有权

公开(公告)号：CN113420123A

公开(公告)日：2021-09-21

申请号：CN202110705729.9

申请日：2021-06-24

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张学君 , 张震 , 王晗 , 李鹏 , 刘建 , 石瑾 , 刘睿霖 , 颜永红

IPC: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02

Abstract: 本申请提供了一种语言模型的训练方法、NLP任务处理方法及装置，包括：获取训练样本集；训练样本集包括新任务的第一任务标签、新任务的多个第一训练文本和每个第一训练文本的第一文本标签、至少一个旧任务中每个旧任务的第二任务标签；复制语言模型得到教师语言模型，将语言模型作为学生语言模型；将第二任务标签输入至教师语言模型中，生成旧任务对应的多个第二训练文本和每个第二训练文本的第二文本标签；将第一任务标签、第二任务标签、第一训练文本和第二训练文本输入至学生语言模型中，生成第一预测文本、第一预测结果、第二预测文本和第二预测结果，对学生语言模型进行训练。根据本申请实施例，能够解决相关技术中存储资源占用大的问题。

5.

发明公开
文本处理模型训练方法、语音文本处理方法及装置有权

公开(公告)号：CN113420121A

公开(公告)日：2021-09-21

申请号：CN202110704938.1

申请日：2021-06-24

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 周军 , 张震 , 李成章 , 李鹏 , 刘建 , 石瑾 , 刘睿霖 , 颜永红

IPC: G06F16/33 , G06F16/332 , G06F16/951 , G06K9/62

Abstract: 本申请提供了一种文本处理模型训练方法、语音文本处理方法及装置，涉及自然语言处理技术领域。该方法包括：从互联网爬取对话文本，得到正样本；对对话文本中的语句进行变换操作，得到负样本和负样本的第一标签信息；将正样本和负样本对应输入至预先训练的第一文本处理模型中和待训练的第二文本处理模型中，生成第一文本处理模型的目标层的第一特征向量和第二文本处理模型的目标层的第二特征向量；根据第一特征向量、第二特征向量，对第二文本处理模型进行知识蒸馏，得到训练好的第二文本处理模型。根据本申请实施例，能够解决相关技术中对语音文本进行校对效率低、耗时长且计算资源占用大的问题。

6.

发明公开
一种基于无监督学习的新闻实体分析方法及装置有权

公开(公告)号：CN113420112A

公开(公告)日：2021-09-21

申请号：CN202110685518.3

申请日：2021-06-21

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 周军 , 张震 , 杨家豪 , 沈亮 , 张鹏远 , 王立强 , 颜永红

IPC: G06F16/33 , G06F40/289 , G06K9/62

Abstract: 本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括：对待处理的多条新闻数据中的每条新闻数据分别进行分词处理，将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果；基于所述标注结果构建分布式表示模型，得到所述多个实体的分布式表示信息，所述分布式表示信息标识为实体向量；根据所述多个实体的分布式表示信息，对所述多个实体进行聚类分析以得到聚类结果。本申请将分布式的思想引入新闻实体的处理当中，通过新闻实体所处位置的上下文来得到实体的分布式表示，通过对实体的聚类分析来得到实体的聚类结果。

7.

发明公开
一种基于无网格最大互信息准则的神经网络训练加速方法无效

公开(公告)号：CN108629412A

公开(公告)日：2018-10-09

申请号：CN201710152727.5

申请日：2017-03-15

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 黎塔 , 张震 , 程高峰 , 万辛 , 颜永红

IPC: G06N3/08

Abstract: 本发明提供了一种基于无网格最大互信息准则的神经网络训练加速方法，本发明的方法通过对无网格最大互信息准则(LFMMI准则)下的神经网络CE准则输出端进行低秩转换，将原有的高秩矩阵模块拆分为两个低秩矩阵模块，拆分后的两个低秩矩阵模块内的子阵相乘最后的维度和之前的全连接矩阵一致，在保证神经网络CE准则输出端总体维度不变的情况下，利用改造后的低维度子阵进行神经网络训练，从而简化了运算结构，使神经网络的输出层前向计算和后向计算占据训练时间比例明显减小，加快了神经网络的训练。

8.

发明公开
一种全音素框架下的通用语音唤醒识别方法及系统无效

公开(公告)号：CN108281137A

公开(公告)日：2018-07-13

申请号：CN201710002097.3

申请日：2017-01-03

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 徐及 , 张震 , 李文凤 , 李鹏 , 颜永红

IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L15/183 , G10L17/02 , G10L17/04 , G10L19/16 , G10L25/30

Abstract: 本发明公开了一种全音素框架下的通用语音唤醒识别方法及系统，所述方法包括：首先训练深度神经网络声学模型，根据唤醒词修改词典，构造基于filler的解码网络，并根据训练样本训练支持向量机分类器；对输入语音进行预处理，将处理后的语音特征输入解码网络进行解码，根据深度神经网络声学模型计算声学得分，得到解码结果；将识别成功的解码结果的统计量输入支持向量机分类器进行分类，得到最终的识别结果。本发明的方法对全部无调音素扩展得到的三音子状态进行建模得到的是通用声学模型，解码过程中限制解码路径，可以提高唤醒性能，同时结合后期处理部分通过对每条路径上音素后验概率等多维统计量进行分析，消除虚警率升高的隐患。

9.

发明公开
一种社区发现方法无效

公开(公告)号：CN106296420A

公开(公告)日：2017-01-04

申请号：CN201510272423.3

申请日：2015-05-25

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张艳 , 万辛 , 张震 , 姜亚松 , 颜永红

IPC: G06Q50/00 , G06F17/30

Abstract: 本发明涉及一种社区发现方法，包括：从待发现社区的网络中选取若干个种子节点，由所述种子节点出发进行局部扩张，得到网络中所要发现的社区。本发明的方法只需要从种子节点进行局部扩张，极大地降低了算法复杂度，以便应用于大规模的网络中。

10.

发明授权
一种基于无监督学习的新闻实体分析方法及装置有权

公开(公告)号：CN113420112B

公开(公告)日：2025-02-18

申请号：CN202110685518.3

申请日：2021-06-21

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 周军 , 张震 , 杨家豪 , 沈亮 , 张鹏远 , 王立强 , 颜永红

IPC: G06F16/334 , G06F40/289 , G06F18/214 , G06F18/23213

Abstract: 本发明涉及一种基于无监督学习的新闻实体分析方法及装置。方法包括：对待处理的多条新闻数据中的每条新闻数据分别进行分词处理，将分词处理后的每条新闻中包含的多个实体进行标注以得到标注结果；基于所述标注结果构建分布式表示模型，得到所述多个实体的分布式表示信息，所述分布式表示信息标识为实体向量；根据所述多个实体的分布式表示信息，对所述多个实体进行聚类分析以得到聚类结果。本申请将分布式的思想引入新闻实体的处理当中，通过新闻实体所处位置的上下文来得到实体的分布式表示，通过对实体的聚类分析来得到实体的聚类结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification