一种基于大规模样本的聚类结果评价方法及装置

    公开(公告)号:CN111738319A

    公开(公告)日:2020-10-02

    申请号:CN202010531994.5

    申请日:2020-06-11

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种基于大规模样本的聚类结果评价方法及装置。本申请实施例提供的技术方案,通过获取聚类结果,从聚类结果的所有类中随机抽取第一设定数量个类,作为第一抽样类,对第一抽样类的每个类按照设定抽样规则抽取第二设定数量个样本作为抽样样本,基于抽样样本组成第二抽样类,最终根据第二抽样类计算轮廓系数,获取对应的聚类结果评价。采用上述技术手段,通过合理的样本抽样可以减少聚类结果的数据量,在保障抽样样本具备聚类结果的代表性的前提下,降低聚类结果评价计算的复杂度,进而提升聚类结果评价的生成效率。

    基于卡口记录的车辆轨迹预测方法及装置

    公开(公告)号:CN112672288A

    公开(公告)日:2021-04-16

    申请号:CN202011483218.9

    申请日:2020-12-15

    摘要: 本申请实施例公开了基于卡口记录的车辆轨迹预测方法及装置。本申请实施例提供的技术方案,通过获取当前车辆已知轨迹末段的卡口序列,基于卡口序列构建对应不同阶数的候选模式,通过候选模式筛选确定命中模式,并提取与命中模式匹配的历史轨迹,作为命中轨迹。以命中模式中最后一个卡口作为预测标记并对齐命中轨迹,从预测标记之后依次使用预设的加权窗口滑动选中各个命中轨迹的卡口作为命中卡口,基于卡口数量和卡口位置的窗口权重从命中卡口中逐个确定预测卡口,基于各个预测卡口选中一个命中轨迹作为预测轨迹。采用上述技术手段,可以基于当前车辆的已知轨迹准确地选择一历史轨迹作为预测轨迹,以此来提升车辆轨迹的预测效率和精准度。

    一种数据挖掘方法、装置、电子设备及存储介质

    公开(公告)号:CN110825785A

    公开(公告)日:2020-02-21

    申请号:CN201911072865.8

    申请日:2019-11-05

    IPC分类号: G06F16/2458 G06Q50/26

    摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。

    一种分布式大规模人脸聚类方法及装置

    公开(公告)号:CN111738341A

    公开(公告)日:2020-10-02

    申请号:CN202010587955.7

    申请日:2020-06-24

    IPC分类号: G06K9/62

    摘要: 本申请实施例公开了一种分布式大规模人脸聚类方法及装置。本申请实施例提供的技术方案,通过将待聚类人脸图片进行分批聚类并汇总聚类结果,得到聚类集合和未聚类集合,从聚类集合的每个类中抽取设定数量的人脸图片构成代表类,并计算每一个未聚类人脸图片与每个代表类的相似度距离,得到相似度距离集合,基于相似度距离集合将未聚类人脸图片聚类到最相似的代表类中,并根据设定的链接阈值确定各个未聚类人脸图片与对应的代表类的链接关系,基于链接关系合并各个代表类,输出合并结果。采用上述技术手段,可以减少大规模人脸数据聚类的数据计算量,减少内存的消耗,在保障聚类结果稳定的前提下提升人脸聚类效率。

    一种语音识别后的语句纠错方法、装置、设备及存储介质

    公开(公告)号:CN113343671B

    公开(公告)日:2023-03-31

    申请号:CN202110632498.3

    申请日:2021-06-07

    发明人: 杨东泉 秦伟

    IPC分类号: G06F40/232 G06F40/216

    摘要: 本申请实施例公开了一种语音识别后的语句纠错方法、装置、设备及存储介质。本申请实施例提供的技术方案通过语言模型识别出每个文字在待纠错文本中的第一出现概率,并根据第一出现概率确定在待纠错文本中的识别错误字,利用该语言模型确定模型候选字,并根据识别错误字的拼音和声调确定同音候选字,进一步确定模型候选字和同音候选字之间的第一排序和第二排序,根据第一排序和第二排序确定模型候选字和所述同音候选字之间的候选排序,根据该候选排序可确定纠错候选字,并利用纠错候选字替换待纠错文本中的识别错误字,得到纠正文本,通过非侵入式的方式直接对接并修改语音识别的结果,有效降低语音识别网络学习的训练成本。