-
公开(公告)号:CN118520229B
公开(公告)日:2024-11-15
申请号:CN202410991497.1
申请日:2024-07-23
Applicant: 北京海天瑞声科技股份有限公司
Abstract: 本公开是关于一种基于大语言模型的数据清洗方法、装置、产品及介质,涉及数据处理领域,用于解决数据清洗过程人工参与程度大的问题。方法包括:响应于基于大语言模型第i次对待清洗数据进行清洗,基于第一规则数据匹配对微调大语言模型;基于微调后的大语言模型生成匹配当前待清洗数据的清洗规则;对当前待清洗数据进行数据清洗,得到清洗后的数据,其中,第一规则数据匹配对基于第j次清洗后数据和对应的待清洗数据以及第j次清洗的清洗规则合集确定,第j次清洗的清洗规则合集中包括基于第j次清洗后数据和对应的待清洗数据所确定的清洗规则,i、j为正整数,i大于或等于j。通过本公开所提出的方法,可以提升数据清洗效率。
-
公开(公告)号:CN118467777A
公开(公告)日:2024-08-09
申请号:CN202410931982.X
申请日:2024-07-12
Applicant: 北京海天瑞声科技股份有限公司
IPC: G06F16/635 , G06F16/68
Abstract: 本公开涉及声音处理技术领域,针对人工推荐声优方法耗时长的问题,提供一种声优推荐方法、装置、电子设备及存储介质。其中,声优推荐方法包括:获取用户对目标声优的需求信息,所述需求信息中包括一类或多类信息;向量化所述一类或多类信息中每一类信息,得到多类信息特征向量,并融合所述多类信息特征向量,得到信息特征融合向量;基于所述信息特征融合向量和所述第一音色特征向量之间的相似度,在音频推荐库中确定匹配所述需求信息的目标音频;向所述用户推荐所述目标音频对应的声优。通过本公开,自动筛选并推荐匹配的声优,提升用户体验感。
-
公开(公告)号:CN116188293A
公开(公告)日:2023-05-30
申请号:CN202211646150.0
申请日:2022-12-21
Applicant: 北京海天瑞声科技股份有限公司
Abstract: 本公开是关于一种图像处理方法、装置、设备、介质及程序产品。图像处理方法包括:响应于在噪声图像中检测到文本,确定所述文本的文本内容、文本字体、及文本所处图像区域;按照所述文本内容和所述文本字体,在所述文本所处图像区域中重新绘制检测到的文本,得到所述噪声图像的增强图像。通过本公开可以提高包含有文本内容的噪声图像的显示效果。
-
公开(公告)号:CN116152491A
公开(公告)日:2023-05-23
申请号:CN202310001219.2
申请日:2023-01-03
Applicant: 北京海天瑞声科技股份有限公司
IPC: G06V10/26 , G06V10/774 , G06T3/00
Abstract: 本公开是关于一种语义分割方法、装置及存储介质。语义分割方法包括:获取多个透视图像语义分割数据集,并在多个透视图像语义分割数据集中确定需进行鱼眼图像识别的语义分割类别,得到对应鱼眼图像的至少一个透视图像语义分割数据集;基于对应鱼眼图像的至少一个透视图像语义分割数据集,得到至少一个鱼眼图像数据集;基于至少一个鱼眼图像数据集,训练得到目标鱼眼图像语义分割模型;基于目标鱼眼图像语义分割模型,进行语义分割预测。通过本公开的语义分割方法,能够快速得到一个可用的鱼眼图像语义分割模型,并提升鱼眼图像语义分割模型融合多个鱼眼图语义分割数据集的能力。
-
公开(公告)号:CN111292341B
公开(公告)日:2023-01-03
申请号:CN202010078873.X
申请日:2020-02-03
Applicant: 北京海天瑞声科技股份有限公司
Abstract: 本发明涉及计算机视觉技术领域,提供一种图像标注方法、图像标注装置及计算机存储介质。图像标注方法,包括:获取待标注图像;基于待标注图像,确定分割区域的最小尺寸;基于最小尺寸,将待标注图像进行超像素分割,得到分割图像;基于当前分割图像确定当前阈值;根据当前阈值,采用区域融合的方式将分割图像的分割区域进行融合,得到当前融合图像;对局部区域中仅包括一个目标图像的局部区域进行标注;判断当前融合图像是否包括未标注的局部区域,根据判断结果完成待标注图像的标注。根据本公开提供的图像标注方法,能够有利于降低人工标注的时间成本,提高标注效率,且不影响图像标注的准确度。
-
公开(公告)号:CN113253294A
公开(公告)日:2021-08-13
申请号:CN202110667088.2
申请日:2021-06-16
Applicant: 北京海天瑞声科技股份有限公司
IPC: G01S17/89
Abstract: 本公开是关于一种关于3D雷达点云数据中地面点检测的方法、装置及介质。关于3D雷达点云数据中地面点检测的方法包括:获取待进行地面检测的点云数据。基于所述点云数据,确定基准平面。以所述点云数据的雷达中心在所述基准平面的投影为极坐标圆心点,将所述基准平面进行栅格划分,得到多个待检测栅格。基于所述多个待检测栅格内的各点数据在Z轴上的高度距离,确定所述点云数据中的地面点云数据。通过本公开提供的关于3D雷达点云数据中地面点检测的方法,基于各点数据在Z轴上的高度距离,确定待进行地面检测的点云数据中的地面点云数据,能够使得到的地面点云数据更准确,更贴合真实路面高度,进而有利于增强地面点云数据的适用性。
-
公开(公告)号:CN113064135A
公开(公告)日:2021-07-02
申请号:CN202110607326.0
申请日:2021-06-01
Applicant: 北京海天瑞声科技股份有限公司
IPC: G01S7/48 , G01S17/931
Abstract: 本公开是关于一种在3D雷达点云连续帧数据中检测障碍物的方法及装置、电子设备和计算机可读存储介质。其中方法包括:采集点云数据连续帧,将当前帧的点云数据划分为地面点集及障碍物点集;根据地面点集,获取当前帧的道路边缘;根据道路边缘,得到障碍物的位置,位置包括路面及非路面;基于障碍物的位置信息,检测当前帧包含的所有障碍物的类别。通过算法预先对物体的类别进行检测,减少了后续人工标注的工作量,提高了标注效率;引入了道路边缘检测的方法,将整个检测场景分类为路面及非路面区域,通过先验知识提高了障碍物类别检测的精度及效率,适用于对实时性要求高的任务场景。
-
公开(公告)号:CN111539495B
公开(公告)日:2020-11-10
申请号:CN202010659647.0
申请日:2020-07-10
Applicant: 北京海天瑞声科技股份有限公司 , 清华大学
Abstract: 本公开涉及一种基于识别模型的识别方法、模型训练方法及装置。其中,基于识别模型的识别方法包括识别模型包括特征提取模块,特征提取模块包括多个LSTM单元。识别方法包括:获取待识别特征序列,待识别特征序列包括连续的特征;将多个特征依序分别输入至多个LSTM单元,通过每个LSTM单元得到特征对应的第一隐藏状态;基于多个特征,以及多个特征分别对应的第一隐藏状态,以及特征提取模块的前次输出结果,得到特征提取模块的当前输出结果;基于特征提取模块的当前输出结果,得到识别结果。通过本公开,使得特征提取模块的当前输出结果更加合理、准确。
-
公开(公告)号:CN111540382A
公开(公告)日:2020-08-14
申请号:CN202010659644.7
申请日:2020-07-10
Applicant: 北京海天瑞声科技股份有限公司 , 清华大学
Abstract: 本公开是关于一种基于线性预测残差负熵的语音音质度量评价方法及装置、电子设备和计算机可读存储介质。其中方法包括:获取待评价的语音数据;将语音数据划分为多个语音帧;对语音帧进行线性预测分析,得到线性预测残差;计算每个语音帧的线性预测残差负熵;根据负熵评价语音数据的音质。通过利用语音信号的线性预测残差的负熵,可以实现定量的对语音音质的高层特征进行评价,而评价结果也更加接近于主观判断,从而对语音数据库的生产提供质量控制依据。
-
公开(公告)号:CN111179939B
公开(公告)日:2020-07-28
申请号:CN202010283135.9
申请日:2020-04-13
Applicant: 北京海天瑞声科技股份有限公司
Abstract: 本公开是关于一种语音转写方法、语音转写装置及计算机存储介质。语音转写方法包括:获取语音包;基于语音包,获取当前转写语音;通过N个语音识别引擎,分别对第k条语音进行语音识别,得到第k条语音对应各语音识别引擎的N个识别结果;基于各语音识别引擎识别第k条语音的置信度以及各语音识别引擎的历史正确率参数,得到各识别结果对应的推荐系数;基于推荐系数,得到识别结果中的最优结果;基于最优结果,得到第k条语音的转写结果。通过本公开提供的方法,能够根据各语音识别引擎的置信度和对应的历史正确参数,为当前转写的第k条语音筛选出准确率高的语音识别结果进行人工校对,进而节约人工校对的时间成本,提高语音转写的工作效率。