-
公开(公告)号:CN111261165A
公开(公告)日:2020-06-09
申请号:CN202010033625.3
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的字符识别结果以及与所述字符识别结果对应的备选车站名称集合;计算所述备选车站名称集合中每个备选车站名称的匹配评价分数,所述匹配评价分数包括:字符统计分数和/或字符排序分数;根据所述匹配评价分数选择至少一个备选车站名称作为所述语音请求数据的车站名称识别结果。采用上述方案可以解决现有技术中,在文本提取时,无法在降低对数据集的要求时,保证泛化能力的技术问题。
-
公开(公告)号:CN111259657A
公开(公告)日:2020-06-09
申请号:CN202010033448.9
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
IPC分类号: G06F40/279 , G06F40/30 , G06F40/126
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的文本识别结果;查找所述文本识别结果中出现的备选车站名称;生成所述备选车站名称的正则表达式,并根据所述正则表达式在车站名称集合中匹配相关的目标车站名称,所述正则表达式为拼音的混淆发音表达式;利用所述目标车站名称替换所述文本识别结果中的所述备选车站名称,以得到最终文本识别结果。采用上述方案可以解决现有技术中,由于用户混淆发音而无法对语音数据进行正确识别的技术问题。
-
公开(公告)号:CN111242040A
公开(公告)日:2020-06-05
申请号:CN202010040705.1
申请日:2020-01-15
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本申请实施例公开了一种动态人脸聚类方法、装置、设备和存储介质。该方法包括对批量人脸图片进行静态聚类处理,得到多个包括邻居人脸集合的簇,根据每个簇中每张人脸图片相对于簇中其他人脸图片的平均相似度,对每个簇中的人脸图片进行筛选,从每个簇中选取多张人脸图片分别建立档案,根据档案的邻居相似度对满足邻居合并条件的簇进行合并,并基于合并后的簇重新建立档案,根据新增人脸图片与每个档案中的人脸图片的平均相似度,确定所述新增人脸图片所对应的档案,将所述新增人脸图片加入所述档案对应的簇中。本方案提高了人脸聚类的效率。
-
公开(公告)号:CN111738319A
公开(公告)日:2020-10-02
申请号:CN202010531994.5
申请日:2020-06-11
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06K9/62
摘要: 本申请实施例公开了一种基于大规模样本的聚类结果评价方法及装置。本申请实施例提供的技术方案,通过获取聚类结果,从聚类结果的所有类中随机抽取第一设定数量个类,作为第一抽样类,对第一抽样类的每个类按照设定抽样规则抽取第二设定数量个样本作为抽样样本,基于抽样样本组成第二抽样类,最终根据第二抽样类计算轮廓系数,获取对应的聚类结果评价。采用上述技术手段,通过合理的样本抽样可以减少聚类结果的数据量,在保障抽样样本具备聚类结果的代表性的前提下,降低聚类结果评价计算的复杂度,进而提升聚类结果评价的生成效率。
-
公开(公告)号:CN112672288A
公开(公告)日:2021-04-16
申请号:CN202011483218.9
申请日:2020-12-15
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: H04W4/029 , H04W4/40 , G06Q10/04 , G06F16/9537
摘要: 本申请实施例公开了基于卡口记录的车辆轨迹预测方法及装置。本申请实施例提供的技术方案,通过获取当前车辆已知轨迹末段的卡口序列,基于卡口序列构建对应不同阶数的候选模式,通过候选模式筛选确定命中模式,并提取与命中模式匹配的历史轨迹,作为命中轨迹。以命中模式中最后一个卡口作为预测标记并对齐命中轨迹,从预测标记之后依次使用预设的加权窗口滑动选中各个命中轨迹的卡口作为命中卡口,基于卡口数量和卡口位置的窗口权重从命中卡口中逐个确定预测卡口,基于各个预测卡口选中一个命中轨迹作为预测轨迹。采用上述技术手段,可以基于当前车辆的已知轨迹准确地选择一历史轨迹作为预测轨迹,以此来提升车辆轨迹的预测效率和精准度。
-
公开(公告)号:CN110825785A
公开(公告)日:2020-02-21
申请号:CN201911072865.8
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06Q50/26
摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。
-
公开(公告)号:CN110414429A
公开(公告)日:2019-11-05
申请号:CN201910686533.2
申请日:2019-07-29
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
摘要: 本发明实施例公开了一种人脸聚类方法、装置、设备和存储介质,该方法包括获取人脸相似度矩阵,依据所述人脸相似度矩阵确定成对相似人脸;依据所述成对相似人脸之间的传递关系生成传递相似人脸;确定所述传递相似人脸之间的簇间相似度,依据所述簇间相似度确定每个传递相似人脸的相似簇,将满足预设条件的相似簇进行合并;根据合并结果确定人脸聚类分组。本方案提高了人脸聚类的效率以及准确度。
-
公开(公告)号:CN111738341A
公开(公告)日:2020-10-02
申请号:CN202010587955.7
申请日:2020-06-24
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06K9/62
摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。
-
公开(公告)号:CN110807052A
公开(公告)日:2020-02-18
申请号:CN201911072846.5
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06F16/28
摘要: 本发明实施例公开了一种用户群分类方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取用户群中每位用户在各维度下的行为数据,每个所述维度对应至少一类所述行为数据;根据所述行为数据确定每个所述维度下各所述用户之间的行为相似度;根据所述行为相似度计算基于全部所述维度的用户之间的最终相似度;根据所述最终相似度对所述用户群进行分类。采用上述方案可以解决现有技术中嫌疑人团伙确定方案准确度低、应用场景单一的技术问题。
-
公开(公告)号:CN113343671B
公开(公告)日:2023-03-31
申请号:CN202110632498.3
申请日:2021-06-07
申请人: 佳都科技集团股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
IPC分类号: G06F40/232 , G06F40/216
摘要: 本申请实施例公开了一种语音识别后的语句纠错方法、装置、设备及存储介质。本申请实施例提供的技术方案通过语言模型识别出每个文字在待纠错文本中的第一出现概率,并根据第一出现概率确定在待纠错文本中的识别错误字,利用该语言模型确定模型候选字,并根据识别错误字的拼音和声调确定同音候选字,进一步确定模型候选字和同音候选字之间的第一排序和第二排序,根据第一排序和第二排序确定模型候选字和所述同音候选字之间的候选排序,根据该候选排序可确定纠错候选字,并利用纠错候选字替换待纠错文本中的识别错误字,得到纠正文本,通过非侵入式的方式直接对接并修改语音识别的结果,有效降低语音识别网络学习的训练成本。
-
-
-
-
-
-
-
-
-