专利检索 ap:"北京捷通华声科技股份有限公司" 第 1 页

1.

发明公开
生僻字的识别方法、装置、电子设备及可读存储介质审中-实审

公开(公告)号：CN118411726A

公开(公告)日：2024-07-30

申请号：CN202410441962.4

申请日：2024-04-12

申请人： 北京捷通华声科技股份有限公司

发明人： 高大帅 , 李健 , 陈明 , 武卫东

IPC分类号： G06V30/148 , G06V30/18 , G06V30/19 , G06V30/16 , G06N3/0464 , G06V10/82

摘要： 本发明实施例提供了一种生僻字的识别方法、装置、电子设备及可读存储介质，所述方法包括：通过对字符集中的汉字进行拆分，建立汉字拆字字典；将多个构件进行合成，得到合成生僻字；对合成生僻字进行笔画切分以及预处理，得到笔画数据；对笔画数据进行特征提取，得到笔画特征；对笔画特征进行构件序列识别，得到输出构件序列；根据输出构件序列和汉字拆字字典，识别得到与合成生僻字对应的目标生僻字。本发明实施例无需采集真实的生僻字手写数据，只需要采集每个构件作为样本即可，而生僻字数据则是使用自由写仿真工具根据拆字方法将构件进行合成得到的，实现了一种低成本高效率的生僻字识别方法。

2.

发明授权
一种信息处理方法及装置有权

公开(公告)号：CN112613327B

公开(公告)日：2024-07-16

申请号：CN202110020630.5

申请日：2021-01-07

申请人： 北京捷通华声科技股份有限公司

发明人： 刘绍孔 , 李健 , 武卫东 , 陈明

IPC分类号： G06F40/58 , G06F40/30 , G06F40/295 , G06F18/22

摘要： 本申请示出了一种信息处理方法及装置。通过本申请，可以自动化地收集互为翻译的词汇对，收集过程中可以没有工作人员的参与，从可以节省人工成本，其次，通过计算低频专有名词被替换后的源语句分别与每一个替换后的目标语句的语义相似度，并将替换后的源语句中的被替换的低频专有名词以及替换后的源语句之间的语义相似度最高的替换后的目标语句中的被替换的词汇组合为互为翻译的词汇对，可以提高收集的互为翻译的词汇对的两个词汇之间相互翻译的准确度。

3.

发明公开
一种音频处理方法及装置、电子设备、存储介质审中-实审

公开(公告)号：CN118314913A

公开(公告)日：2024-07-09

申请号：CN202410470187.5

申请日：2024-04-18

申请人： 北京捷通华声科技股份有限公司

发明人： 王愈 , 陈明 , 李健 , 武卫东

IPC分类号： G10L21/013 , G10L25/18

摘要： 本发明实施例提供了一种音频处理方法及装置、电子设备、存储介质，通过获取第一音频数据和针对第一音频数据选取的目标音色信息，并根据目标音色信息对第一音频数据进行处理，得到谱特征；进而根据谱特征确定周期性信号修正系数；并在获取第一音频数据的音高数据后，采用周期性信号修正系数对音高数据进行转换，得到周期性信号；从而根据周期性信号和谱特征生成第二音频数据的方式，通过引入与谱特征相关联的周期性信号修正系数的方式来根据谱特征微调准周期性信号的形状细节，解决了周期性信号自身几何形状过于理想化/平滑化的问题，提高了歌声转换后生成的目标音频的拟人度，提升了歌声转换的实际效果。

4.

发明授权
问答知识的提取方法、提取装置与计算机可读存储介质有权

公开(公告)号：CN111737437B

公开(公告)日：2024-06-28

申请号：CN202010615397.0

申请日：2020-06-30

申请人： 北京捷通华声科技股份有限公司

发明人： 刘光华 , 李健 , 武卫东

IPC分类号： G06F16/332 , G06F16/33

摘要： 本申请提供了一种问答知识的提取方法、提取装置与计算机可读存储介质，该提取方法包括：确定预定词表，预定词表为与用户预咨询的业务相关的词表；获取业务文档；根据预定词表，从业务文档中获取与预定词表相关联的段落，段落包括一个或多个语句；从段落中提取出问答对，问答对由与预定词表相关联的问题和问题对应的答案组成，本方案通过先确定与预定词表相关联的段落的方式，有效缩小了问答知识的提取范围，达到了精确提取问答对的目的，避免提取出范围较大且业务关联性不强的问答知识，实现了从大量的业务文档快速提取问答对。

5.

发明授权
一种文本处理方法及装置有权

公开(公告)号：CN111753047B

公开(公告)日：2024-06-07

申请号：CN202010427483.9

申请日：2020-05-19

申请人： 北京捷通华声科技股份有限公司

发明人： 吴帅 , 李健 , 武卫东

IPC分类号： G06F16/33 , G06F40/126

摘要： 本发明实施例提供一种文本处理方法及装置，属于计算机技术领域。本发明先从获取至少一个预设正则表达式对待检测文本的匹配结果，一个匹配结果中包括至少一个字符串，再针对任一预设正则表达式的匹配结果，根据预设正则表达式的预设权重，计算匹配结果中字符串的字符串权重，并将字符串中字符位置不重叠的至少两个字符串作为字符串组合，并根据字符串权重，确定字符串组合的组合权重，最后，输出目标字符串组合中的字符串，目标字符串组合的组合权重满足预设条件。这样，输出符合预设条件的目标字符串组合中的字符串，一定程度上可以在包含至少一个正则表达式时，从多个匹配结果中更准确的输出字符串，进而可以避免正则匹配结果出现混乱。

6.

发明授权
语音识别的方法、装置、计算机可读存储介质与处理器有权

公开(公告)号：CN113506565B

公开(公告)日：2024-06-04

申请号：CN202110786043.7

申请日：2021-07-12

申请人： 北京捷通华声科技股份有限公司

发明人： 李健 , 谢园园 , 陈明 , 武卫东

IPC分类号： G10L15/08 , G10L25/24 , G10L25/30

摘要： 本申请提供了一种语音识别的方法、装置、计算机可读存储介质与处理器。该方法包括获取语音数据；确定语音数据的语音类别，语音类别包括语种和/或方言；确定语音数据的上下文语义；根据语音类别和上下文语义，确定ASR引擎和ASR模型；采用ASR引擎和ASR模型，对语音数据进行识别。通过获取语音数据，确定语音数据的语音类别和上下文语义，再综合语音类别和上下文语义确定ASR引擎和ASR模型，最后采用确定好的ASR引擎和ASR模型，对语音数据进行识别。实现了对语音数据的精确识别。

7.

发明授权
多意图识别的方法、装置、电子设备及可读存储介质有权

公开(公告)号：CN112256864B

公开(公告)日：2024-05-14

申请号：CN202011011080.2

申请日：2020-09-23

申请人： 北京捷通华声科技股份有限公司

发明人： 周洪杰 , 李健 , 武卫东 , 陈明

IPC分类号： G06F16/35 , G06F40/30 , G06F40/284 , G06N3/049 , G06N3/08

摘要： 本申请实施例提供了一种多意图识别的方法、装置、电子设备及可读存储介质，旨在于各种应用场景下对用户输入语句中包含的多个意图对应的标准问句和扩展问句进行序列输出。所述方法包括：对用户输入语句进行语义识别，得到所述用户输入语句对应的语义向量；对所述语义向量中包含的意图进行识别，得到多个不同意图对应的语义子向量组成的语义子向量序列；对所述语义子向量序列中的每个语义子向量与多个标准意图问句向量进行相似度计算，得到与所述语义子向量序列中的每个语义子向量对应的标准意图问句，将所述标准意图问句按顺序输出。

8.

发明授权
一种音色转换方法、装置、电子设备及可读存储介质有权

公开(公告)号：CN113611309B

公开(公告)日：2024-05-10

申请号：CN202110790316.5

申请日：2021-07-13

申请人： 北京捷通华声科技股份有限公司

发明人： 王愈 , 武卫东 , 陈明 , 李健

IPC分类号： G10L15/26 , G10L25/24 , G10L25/30 , G10L21/013 , G10L21/007

摘要： 本发明提供了一种音色转换方法、装置、电子设备及可读存储介质，涉及音频处理技术领域。其中，所述方法包括：提取待转换语音的输入谱参数；基于所述输入谱参数，确定第一语音文本参数；基于所述音色转换模型，对所述输入谱参数进行变分自编码处理及注意力机制处理，确定所述语音声音参数；基于所述音色转换模型，对所述语音声音参数及所述第一语音文本参数进行处理，确定输出谱参数；基于所述输出谱参数，得到音色转换后的目标语音。通过在变分自编码处理获得语音声音参数的过程中，加入注意力机制处理，可以提升VAE模型克服音频波动的鲁棒性，从而进一步提升音色转换模型对误识别的纠错和容错，保证音色转换的转换效果，提高音色转换的可靠性。

9.

发明授权
语音合成方法、装置及电子设备有权

公开(公告)号：CN112837670B

公开(公告)日：2024-05-10

申请号：CN202110071250.4

申请日：2021-01-19

申请人： 北京捷通华声科技股份有限公司

发明人： 李婉 , 李健 , 武卫东 , 陈明

IPC分类号： G10L13/02 , G10L13/04 , G10L19/16 , G10L25/30

摘要： 本申请公开了一种语音合成方法、装置及电子设备，属于音频处理技术领域。所述方法包括：对接收到的目标语音信息进行特征提取处理，获得声学特征参数；基于第一损失函数对生成模型进行训练，更新得到生成模型参数；基于第二损失函数对判别模型进行训练，更新得到判别模型参数；重复执行参数更新处理，直至所述生成模型达到收敛状态，将所述声学特征参数输入达到收敛状态的所述生成模型，得到合成语音。本申请实施例可以实现基于第一损失函数和第二损失函数，以及通过增加判别模型，使得生成模型达到收敛状态，降低了语音合成过程中的噪声或其他容易引起听感不适的合成效应，提高了非自回归结构神经声码器的稳定性和可靠性，提高了用户体验。

10.

发明公开
话者分离方法、装置、电子设备及可读存储介质审中-实审

公开(公告)号：CN117912483A

公开(公告)日：2024-04-19

申请号：CN202311785639.0

申请日：2023-12-22

申请人： 北京捷通华声科技股份有限公司

发明人： 郑晓明 , 李健 , 陈明 , 武卫东

IPC分类号： G10L21/0272 , G10L21/0308 , G10L25/27 , G06F18/23

摘要： 本申请公开了一种话者分离方法、装置、电子设备及可读存储介质，方法包括：获取语音数据包括的多个语音片段，对多个语音片段依次执行多次聚类操作，在每次聚类操作中，获取上一次聚类操作得到的包括语音片段的第一聚类簇，根据第一聚类簇之间的第一相似度，以及和当前聚类操作对应的第一阈值，得到包括语音片段的第二聚类簇，在确定当前聚类操作得到的第二聚类簇满足预设聚类要求的情况下，将多个第二聚类簇确定为目标聚类簇，每个目标聚类簇中的语音片段对应同一个说话人。本方法提高了数据处理效率。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类