-
公开(公告)号:CN112115869B
公开(公告)日:2024-11-05
申请号:CN202010990374.8
申请日:2020-09-18
申请人: 北京搜狗科技发展有限公司
IPC分类号: G06V30/413 , G06F40/263 , G06F40/58 , G11C7/16
摘要: 本发明实施例提供了一种数据处理方法、装置和录音设备,其中,所述方法包括:录音设备获取目标图像;获取所述目标图像对应的目标语种;依据所述目标语种对所述目标图像进行文本识别,确定对应的文本信息;使得用户能够使用录音设备对图像进行文本识别,提高用户的使用体验。
-
公开(公告)号:CN118617887A
公开(公告)日:2024-09-10
申请号:CN202410881502.3
申请日:2024-07-03
申请人: 无锡市健林笔业有限公司
摘要: 本发明公开了一种环保型多功能竹子笔,涉及办公用具领域,包括电容笔和书写笔,所述电容笔的底端与书写笔的顶端螺纹安装,所述书写笔包括笔杆一、笔杆二、螺旋笔杆、书写笔套、螺纹连接杆、操作板和笔头。本发明,通过将书写笔和电容笔结合,该竹子笔可以通过笔头实现书写功能、通过布头可在电容式触控屏上书写、通过激光灯可以进行指示、通过录音组件可以进行录音,该竹子笔不仅起到良好的环保效果,同时还具有多种功能,且该竹子笔可以适用于多个使用场景,当人们在使用平板进行办公时,通过一支竹子笔即可实现触控屏幕、书写记录、激光教学和录音的效果,满足人们的使用需求,提高了人们在使用竹子笔时的使用效果。
-
公开(公告)号:CN118608728A
公开(公告)日:2024-09-06
申请号:CN202410794048.8
申请日:2024-06-19
申请人: 沪东中华造船(集团)有限公司 , 上海江南长兴造船有限责任公司
IPC分类号: G06T19/00 , G06T19/20 , G06Q10/0639 , G06Q50/04 , G06F30/20 , G06F30/15 , G06K17/00 , G06K19/06 , G11C7/16
摘要: 本发明公开了一种基于AR技术的船舶中间产品完整性检验方法,通过将包含完整零部件信息的中间产品三维模型导入到AR模块,在检验过程中将三维模型与实物进行虚实叠加,快速对比出实际中间产品上各零部件的安装错误、安装遗漏、舾装保护、涂装错误等问题,并在三维模型中对相应的零部件进行信息备注,最终生成完整性检验问题清单、检验视频等问题件,帮助施工人员及时处理,可大幅提高检验效率和检验质量。
-
公开(公告)号:CN113611296B
公开(公告)日:2024-09-03
申请号:CN202110963369.2
申请日:2021-08-20
申请人: 天津讯飞极智科技有限公司
摘要: 本发明提供一种语音识别装置和拾音设备,其中语音识别装置包括CPU和NPU,CPU和NPU通信连接,NPU上加载有语音识别模型,语音识别模型基于样本音频和样本音频的识别文本训练得到;CPU用于确定待识别音频;NPU用于运行语音识别模型,确定待识别音频的语音识别结果,将语音识别结果传输至CPU。本发明提供的语音识别装置和拾音设备,结合NPU的强大算力,在语音识别装置中部署了本地的语音识别模型,基于该语音识别模型对待识别音频进行离线语音识别,从而实现了高可靠度和高识别效率的本地离线识别,本地离线识别无需依赖网络,数据更加安全,也不存在网络传输带来的延时问题,识别显示更加及时流畅,有助于优化用户体验。
-
公开(公告)号:CN118553278A
公开(公告)日:2024-08-27
申请号:CN202410571667.0
申请日:2024-05-09
申请人: 深圳市广和通科技有限公司
发明人: 王敬
摘要: 本申请公开了一种音频播放方法、装置、电子设备及存储介质,其中,方法包括:根据音频播放设备的脉冲宽度调制参数和第一音频的第一采样率确定第一采样位深,其中,第一采样位深为音频播放设备在第一采样率下支持播放的音频的最大采样位深;若第二采样位深大于第一采样位深,将第一音频转换为第二音频,其中,第二采样位深为第一音频的采样位深,第二音频的采样位深等于第一采样位深;播放第二音频。使用本方法可以自适应调整音频播放的采样位深,避免了降低到标准采样位深带来的音效损失,使音频播放时的失真更小。
-
公开(公告)号:CN118452816A
公开(公告)日:2024-08-09
申请号:CN202410366471.8
申请日:2024-03-28
申请人: 香港中文大学(深圳) , 深圳市人工智能与机器人研究院
摘要: 本发明公开了一种基于认知评估的自动化语音采集方法、系统及终端,该方法包括:获取任务提示信息和认知评估图像;按照所述任务提示信息向目标对象进行展示和语音引导,并将所述任务提示信息和所述认知评估图像显示在同一界面内;其中,所述认知评估图像的屏占比大于所述任务提示信息的屏占比;当所述认知评估图像向所述目标对象进行展示时,对所述目标对象进行预设时间的录制,得到第一音频信息,在超出所述预设时间后继续对所述目标对象进行录制,得到第二音频信息;根据所述第一音频信息和所述第二音频信息,得到所述目标对象的采样信息。本发明能够将采集流程规范化,以确保采集所得的信息统一、完整及准确,以便于后续的信息分析。
-
公开(公告)号:CN118016111B
公开(公告)日:2024-07-23
申请号:CN202410416492.6
申请日:2024-04-08
申请人: 腾讯科技(深圳)有限公司
发明人: 梁俊斌
摘要: 本申请公开了音频处理方法、装置、介质及设备,涉及多媒体领域,方法包括:获取目标设备播放的原始参考音频信号;在目标设备播放原始参考音频信号时,进行音频录制,得到预设时间段的录制音频信号;根据原始参考音频信号和录制音频信号,进行帧间匹配处理,确定时延数据;根据时延数据,从原始参考音频信号中确定目标参考音频信号;目标参考音频信号与录制音频信号时序对齐;根据目标参考音频信号和录制音频信号,进行逐频点的音频能量的比较处理,得到与目标设备匹配的至少一个频点调节参数;根据至少一个频点调节参数,调节目标设备,以基于调节后的目标设备播放待播放的音频信号。本申请可以有效提升目标设备的音质播放效果,优化用户体验。
-
公开(公告)号:CN115083259B
公开(公告)日:2024-06-14
申请号:CN202210835396.6
申请日:2022-07-15
申请人: 广州克孟特医疗科技有限公司
摘要: 本发明公开了一种语音控制的大面积显示屏科室,涉及手术室技术领域,解决了现有的手术区内科室墙体安装显示屏不能够实现模块化,悬挂在墙体上需要经常消毒和除尘,且显示屏尺寸偏小影响观察效果等问题。一种语音控制的大面积显示屏科室,包括科室墙体,所述科室墙体的内侧固定安装有隔音防护机构,所述隔音防护机构的一侧位于科室墙体的内侧安装有多功能覆盖机构,所述多功能覆盖机构包括覆盖扣板、操作面板、触摸显示屏、按键区、透气板、第二钢制固定框架、导气管、管体安装座和风扇箱。本发明通过对科室墙体进行大尺寸显示屏的模块化安装,便于实现语音交互和实时对单一或多个科室的手术过程进行显示,便于医务人员的观察和交流。
-
公开(公告)号:CN111986715B
公开(公告)日:2024-05-31
申请号:CN202010838416.6
申请日:2020-08-19
申请人: 科大讯飞股份有限公司
IPC分类号: G11C7/16 , G11B20/10 , G06F16/632
摘要: 本申请提出一种录音系统及录音方法,该录音系统包括:第一录音设备和第二录音设备;其中,所述第一录音设备,用于采集音频数据,得到第一音频数据,以及,控制所述第二录音设备同步采集第二音频数据;获取所述第二音频数据,并对所述第一音频数据和所述第二音频数据进行混响处理得到混响后的第三音频数据,或对所述第一音频数据和所述第二音频数据分别进行存储;所述第二录音设备,用于在所述第一录音设备的控制下同步采集音频数据,得到第二音频数据,并将所述第二音频数据发送给所述第一录音设备。上述的录音系统借助多个录音设备,可以实现多方发言人的同步、独立音频采集,从而能够胜任多发言人场景下的多发言人语音录制任务。
-
公开(公告)号:CN111370034B
公开(公告)日:2024-05-28
申请号:CN202010139993.6
申请日:2020-03-03
申请人: 珠海格力电器股份有限公司
IPC分类号: G11B20/10 , G11C7/16 , G06F3/16 , H04M1/72412 , H04M1/72433 , H02J7/00 , H04R1/10
摘要: 本发明公开了一种同步录音的方法及装置、无线耳机充电设备。该发明包括:在无线耳机充电盒接收到录音指令时,控制语音采集模块采集语音信息;检测无线通信模块与终端设备之间是否存在无线通信连接;如果无线通信模块与终端设备建立有无线通信连接,则将语音信息发送至终端设备。通过本发明,解决了相关技术中无线耳机充电盒不具备录音和信息同步功能,导致现有录音设备使用具有局限性的技术问题。
-
-
-
-
-
-
-
-
-