-
公开(公告)号:CN111883165B
公开(公告)日:2024-06-18
申请号:CN202010633445.9
申请日:2020-07-02
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G10L21/0272 , G10L21/0308 , G10L25/24
摘要: 本发明实施例涉及语音处理技术领域,公开了一种说话人语音切分方法。本发明在初始说话人语音包括静音时进行静音切除,得到标准说话人语音,提取所述标准说话人语音的梅尔频率倒谱特征,得到梅尔频率倒谱特征集,从所述梅尔频率倒谱特征集中选取不同维度的梅尔频率倒谱特征,得到梅尔频率倒谱特征子集,对所述梅尔频率倒谱特征子集进行聚类切分,得到不同说话人的语音。本发明还提出一种说话人语音切分装置、电子设备以及计算机可读存储介质。本发明可有效解决语音切分过程中计算量较大、切分准确率低的问题。
-
公开(公告)号:CN112242140A
公开(公告)日:2021-01-19
申请号:CN202011092003.4
申请日:2020-10-13
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G10L15/22 , G10L15/30 , G06N20/00 , G06F16/435
摘要: 本发明涉及物联网技术领域,提供了一种智能设备控制方法、装置、电子设备及存储介质。本发明实施例通过对用户指令进行解析得到一条或者多条具有类型标签的解析命令;将所述具有类型标签的解析命令添加到消息缓冲池的消息列表中供每一个智能设备根据订阅的类型,选择处理所述解析命令。本发明实施例能够解析出用户的语音指令中的一种或者多种意图,并由智能设备根据订阅选择执行,从而不需要用户指定动作执行方,同时可以由多个智能设备执行用户的同一语音指令。
-
公开(公告)号:CN112231474A
公开(公告)日:2021-01-15
申请号:CN202011091700.8
申请日:2020-10-13
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/35
摘要: 本发明实施例涉及自然语言处理,公开了一种意图识别方法、系统、电子设备及存储介质。本发明中,获取待识别的交互文本;对交互文本进行领域分类,得到交互文本所属领域的分类结果;根据分类结果对包括所有授权领域的第一领域集进行降维处理,得到与分类结果相关的第二领域集;根据第二领域集对交互文本进行意图识别,得到识别结果。本发明实施例通过对交互文本进行领域分类,根据分类结果对第一领域集降维得到第二领域集,将第二领域集与交互文本进行意图匹配,得到识别结果,减少意图识别需要的识别时间,提高意图识别效率。
-
公开(公告)号:CN111241814A
公开(公告)日:2020-06-05
申请号:CN201911410367.X
申请日:2019-12-31
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F40/232 , G06F40/30 , G10L15/26 , G10L15/30
摘要: 本发明实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。
-
公开(公告)号:CN111242248B
公开(公告)日:2023-07-21
申请号:CN201811329311.7
申请日:2018-11-09
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
摘要: 本发明公开了一种人员信息监控的方法、装置及计算机存储介质,用以解决现有技术中存在的园区管理效率不高的技术问题。包括:接收用户终端发送的电子工牌申请消息;其中,电子工牌申请消息中携带有对用户身份进行认证的第一信息;基于人员信息数据库对第一信息进行认证;其中,人员信息数据库用于记录经过管理员审核通过后的所有用户信息;若认证通过,则根据人员信息数据库中记录的与第一信息相一致的用户信息,生成与用户信息相关联的唯一映射码对应的动态二维码;并动态二维码到用户终端生成对应的电子工牌;其中,唯一映射码按指定时长进行动态更换,使动态二维码被更新。
-
公开(公告)号:CN111883165A
公开(公告)日:2020-11-03
申请号:CN202010633445.9
申请日:2020-07-02
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G10L21/0272 , G10L21/0308 , G10L25/24
摘要: 本发明实施例涉及语音处理技术领域,公开了一种说话人语音切分方法。本发明在初始说话人语音包括静音时进行静音切除,得到标准说话人语音,提取所述标准说话人语音的梅尔频率倒谱特征,得到梅尔频率倒谱特征集,从所述梅尔频率倒谱特征集中选取不同维度的梅尔频率倒谱特征,得到梅尔频率倒谱特征子集,对所述梅尔频率倒谱特征子集进行聚类切分,得到不同说话人的语音。本发明还提出一种说话人语音切分装置、电子设备以及计算机可读存储介质。本发明可有效解决语音切分过程中计算量较大、切分准确率低的问题。
-
公开(公告)号:CN111806100A
公开(公告)日:2020-10-23
申请号:CN202010731277.7
申请日:2020-07-27
申请人: 中移(杭州)信息技术有限公司 , 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: B41J3/44 , B41J2/32 , B41J11/00 , B32B37/10 , B32B38/14 , B32B43/00 , G06K17/00 , G06K13/103
摘要: 本发明属于集中发卡技术领域,公开了一种集中发卡系统和方法。本发明,通过将发卡机、打印装置、卡片滑道、预包装装置组合得到一个集中发卡系统,在实现集中发卡流程时基于该集中发卡系统实现了从写卡到包装发卡的一体化操作,从而大大提高了发卡效率,同时由于整个流程无需人为操作,也大大降低了人工作业量,减少了人力成本的投入;此外,由于卡片对应的信息是打印在打印纸而并非卡片上,因而不会受卡片大小的影响,并且由于预包装袋的尺寸可以灵活调整,因而打印在预包装袋上的卡片信息还可以包括订单信息、物流信息等,方便人工识别,直接进行物流分发。
-
公开(公告)号:CN110910541A
公开(公告)日:2020-03-24
申请号:CN201911215142.9
申请日:2019-12-02
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G07C9/00
摘要: 本发明实施例涉及楼宇智能控制领域,公开了一种门禁控制方法、系统、网络设备及计算机可读存储介质,所述门禁控制方法包括:接收门禁设备发送的通知消息,所述通知消息用于表征有访客到来;根据所述通知消息建立所述门禁设备与音箱的通信连接;在接收到所述音箱发送的开锁指令时,控制所述门禁设备打开。本发明提供的门禁控制方法、系统、网络设备及计算机可读存储介质能够让用户更方便的控制门禁的同时,确保用户的安全。
-
公开(公告)号:CN112037771B
公开(公告)日:2024-03-12
申请号:CN202010886561.1
申请日:2020-08-28
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G10L15/06 , G10L15/02 , G10L21/003 , G10L21/0208
摘要: 本发明实施例涉及语音识别领域,公开了一种音量调节的方法、装置、电子设备和存储介质。上述音量调节的方法包括:获取用于训练语音识别模型的训练集中的各音频样本;其中,所述语音识别模型用于语音识别;确定所述训练集中的各音频样本的音量值;根据所述各音频样本的音量值,确定所述训练集的音量基准值;根据所述音量基准值,对所述各音频样本的音量值进行调节;其中,调节后的所述各音频样本的音量值与所述音量基准值的差值在预设的差值范围内。本发明实施例提供的音量调节的方法可以基于整个训练集对每条音频数据进行音量调节,合适地调整训练集中音频样本的音量值,从而提升语音识别模型的识别效果。
-
公开(公告)号:CN111241814B
公开(公告)日:2023-04-28
申请号:CN201911410367.X
申请日:2019-12-31
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F40/232 , G06F40/30 , G10L15/26 , G10L15/30
摘要: 本发明实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。
-
-
-
-
-
-
-
-
-