-
公开(公告)号:CN112037771B
公开(公告)日:2024-03-12
申请号:CN202010886561.1
申请日:2020-08-28
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L15/06 , G10L15/02 , G10L21/003 , G10L21/0208
Abstract: 本发明实施例涉及语音识别领域,公开了一种音量调节的方法、装置、电子设备和存储介质。上述音量调节的方法包括:获取用于训练语音识别模型的训练集中的各音频样本;其中,所述语音识别模型用于语音识别;确定所述训练集中的各音频样本的音量值;根据所述各音频样本的音量值,确定所述训练集的音量基准值;根据所述音量基准值,对所述各音频样本的音量值进行调节;其中,调节后的所述各音频样本的音量值与所述音量基准值的差值在预设的差值范围内。本发明实施例提供的音量调节的方法可以基于整个训练集对每条音频数据进行音量调节,合适地调整训练集中音频样本的音量值,从而提升语音识别模型的识别效果。
-
公开(公告)号:CN111985231B
公开(公告)日:2023-12-26
申请号:CN202010790776.3
申请日:2020-08-07
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/289 , G06F16/35
Abstract: 本发明实施例涉及信息处理领域,公开了一种无监督角色识别方法。本发明通过多维度提取语音信息的梅尔倒谱特征,得到多组不同维度的梅尔倒谱特征组,对多组不同维度的所述梅尔倒谱特征组进行角色标签聚类,得到多组原始角色标签集,根据预先构建的标签选取原则,从多组所述原始角色标签集中筛选原始角色标签,得到标准角色标签集,根据预构建的文本关键字识别机制,识别与所述语音信息对应的语句集内关键字,得到关键字集,根据所述关键字集和所述标准角色标签集执行对所述语音信息的角色识别。本发明还提出一种无监督角色识别装置、电子设备以及计算机可读存储介质。本发明有效的解决训练数据获取困难,角色识别应用场景有限的问题。
-
公开(公告)号:CN116962828A
公开(公告)日:2023-10-27
申请号:CN202310933848.9
申请日:2023-07-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N21/466 , H04N21/45
Abstract: 本申请涉及视频推荐技术领域,提供一种视频推荐方法及装置。所述方法包括:获取不同采样周期内的目标特征;所述目标特征包括家庭电视的用户属性特征、用户视频行为特征、待推荐视频特征和多场景上下文特征;将所述目标特征输入至视频推荐模型,得到各场景下待推荐视频的点击率预测得分;根据所述点击率预测得分的排序结果,得到在各场景下待推荐视频的推荐排序结果。本申请提供的视频推荐方法及装置可以适应各个场景下各个用户的偏好,极大地提高视频推荐在多用户多场景下的针对性和准确性。
-
公开(公告)号:CN116915528A
公开(公告)日:2023-10-20
申请号:CN202211434316.2
申请日:2022-11-16
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请实施例公开了一种多模态交互信息的识别方法、装置、设备和存储介质,方法包括:获得交互场景下的待识别交互信息;获得多模态场景识别信息;其中,多模态场景识别信息是与待识别交互信息关联的场景信息;根据待识别交互信息和多模态场景识别信息,定位待识别交互信息命中的目标问题;获得目标问题对应的富媒体响应方式,并以富媒体响应方式输出目标问题的答案。
-
公开(公告)号:CN116910378A
公开(公告)日:2023-10-20
申请号:CN202211523757.X
申请日:2022-11-30
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/9536 , G06F16/787 , G06F16/78
Abstract: 本公开提供了一种视频推荐系统,所述系统包括:数据采集计算模块,用于获取第一用户的用户特征、视频特征以及第一用户对视频的视频行为特征,并生成带有时间顺序以及视频类型标签的第一用户的视频行为特征;数据召回计算模块,用于根据带有时间顺序以及视频类型标签的第一用户的视频行为特征,确定待推荐给第一用户的视频推荐序列;推荐模块,用于根据待推荐给第一用户的视频推荐序列,推荐视频给第一用户;如此,通过分模块的视频推荐系统,并且结合第一用户的观看视频的时间进行推荐,使得推荐具有时效性。
-
公开(公告)号:CN111209740B
公开(公告)日:2023-08-15
申请号:CN201911419034.3
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/289 , G06N3/044 , G06N3/0442 , G06N3/08
Abstract: 本发明实施例涉及深度学习领域,公开了文本模型训练方法、文本纠错方法、电子设备及存储介质。本发明中,将语音对话进行文本转换,得到错误文本,对错误文本进行纠错,得到正确文本,根据热词表对错误文本以及正确文本进行分词;之后对分词后的文本样本进行编码得到的文本训练样本,将文本输入样本输入至深度神经网络中进行训练,得到目标文本模型。相对于现有技术基于规则的模型或者基于统计的模型进行文本纠错而言,分词精确度更高,提高了模型训练得到的目标文本模型的纠错准确率。另外,基于建立的目标文本模型进行纠错,在纠错过程中仅需输入错误句子即可得到正确句子,减少了纠错过程中的工作量以及成本。
-
公开(公告)号:CN111241814B
公开(公告)日:2023-04-28
申请号:CN201911410367.X
申请日:2019-12-31
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/232 , G06F40/30 , G10L15/26 , G10L15/30
Abstract: 本发明实施例涉及自然语言处理领域,公开了一种语音识别文本的纠错方法、装置、电子设备及存储介质。本发明中接收语音信息;识别语音信息对应的至少一个用户意图;根据识别的至少一个用户意图,在云端数据集中选取用户意图的所有数据作为个性化模糊数据集;结合个性化模糊数据集与预先设置的基础模糊数据集对根据语音信息所识别的文本进行纠错,通过用户的个性化用户意图在保证纠错准确性的同时减少纠错所需数据量,提高纠错效率。
-
公开(公告)号:CN115700820A
公开(公告)日:2023-02-07
申请号:CN202110806018.0
申请日:2021-07-16
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V20/62 , G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种数字识别方法、装置、电子设备及存储介质。其中,方法包括:获取待处理图像;所述待处理图像至少包含目标设备的显示区域显示的数据;所述目标设备的显示区域显示的数据包含至少一个数字;基于轮廓提取的方式,在所述待处理图像中确定所述至少一个数字中每个数字对应的数字区域;在每个数字区域中确定与数字的笔画对应的七个笔画区域,并确定每个笔画区域的像素值;根据每个笔画区域的像素值,确定每个数字区域的每个笔画区域的笔画占用情况;根据每个数字区域的每个笔画区域的笔画占用情况,识别每个数字区域的数字。
-
公开(公告)号:CN111145741B
公开(公告)日:2022-12-27
申请号:CN201911301362.3
申请日:2019-12-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例涉及通信领域,公开了一种多媒体内容的提供方法、装置、电子设备以及存储介质。本发明中,接收终端发送的语音数据;获取已与终端绑定的多媒体设备的设备列表;根据语音数据和设备列表,确定目标多媒体设备以及待推送的多媒体内容;将目标多媒体设备通知终端并将多媒体内容的网络地址发送至终端,以供终端将多媒体内容的网络地址推送至目标多媒体设备。本发明使得智能音箱对用户语音进行语音识别后,能够针对智能音箱已绑定的多媒体设备进行多媒体内容的提供,智能化程度提高。
-
公开(公告)号:CN110875861B
公开(公告)日:2022-07-01
申请号:CN201810997928.X
申请日:2018-08-29
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04L12/28
Abstract: 本申请公开了一种家庭网络智能组网方法、装置和存储介质,涉及通信技术领域。该方法中,能够根据用户输入的组网需求信息确定采用的组网设备及其数量,然后根据是否暗埋网线确定组网方案,并将采用的可用组网设备库存量充足的组网方案作为最终可推荐使用的组网方案。这样,减少了人工上门服务咨询需求和人工确定组网方案的过程,提高了组网方案确定的效率。避免因技术人员技术差异带来的服务水平参差不齐的情况,从而提高服务质量。
-
-
-
-
-
-
-
-
-