-
公开(公告)号:CN114491416B
公开(公告)日:2024-07-16
申请号:CN202210166903.1
申请日:2022-02-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/18 , G06F18/27 , G06F18/2431 , G06Q30/0201 , G06Q30/0202
摘要: 本公开提供了一种特征信息的处理方法,涉及数据处理技术领域,尤其涉及人工智能和大数据领域。具体实现方案为:在特征信息的待分割取值范围中确定至少一个候选分割点,并确定所述至少一个候选分割点中每个候选分割点对应的信息价值;基于所述信息价值,在所述至少一个候选分割点中确定目标分割点;基于所述目标分割点对所述待分割取值范围进行分割,得到所述待分割取值范围的两个子范围;将所述两个子范围中符合终止条件的子范围确定为目标区间,并将所述两个子范围中不符合终止条件的子范围确定为新的待分割取值范围,返回所述在待分割取值范围中确定至少一个候选分割点的步骤,直至所述两个子范围均满足所述终止条件,得到多个目标区间。
-
公开(公告)号:CN115130581B
公开(公告)日:2023-06-23
申请号:CN202210754096.5
申请日:2022-04-02
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06F18/23 , G06V10/762 , G06V10/774 , G06N20/00
摘要: 本发明提供了一种样本生成方法、训练方法、数据处理方法以及电子设备,涉及人工智能技术领域,尤其涉及工业安全、数据挖掘、计算机视觉和深度学习技术领域。具体实现方案为:根据第一样本集,得到样本表征向量集,其中,第一样本集包括多个样本,样本未被确定类别;根据样本表征向量集,对第一样本集进行聚类,得到至少一个聚类样本集;根据至少一个聚类样本集,生成显著样本数据集。
-
公开(公告)号:CN114401254B
公开(公告)日:2022-11-25
申请号:CN202210280690.5
申请日:2022-03-22
申请人: 北京百度网讯科技有限公司
IPC分类号: H04L65/65 , H04L67/142 , H04N21/6437
摘要: 本公开提供了一种流媒体服务的处理方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及工业视觉、深度学习、流媒体和信息流等技术领域。具体实现方案为:获取输入源的注册信息,所述注册信息包括所述输入源的流媒体服务进程的进程信息和所述输入源的流媒体地址信息;根据所述进程信息,启动所述流媒体服务进程;利用所述流媒体地址信息,控制所述流媒体服务进程,对所述输入源的流媒体数据进行处理。
-
公开(公告)号:CN114936915A
公开(公告)日:2022-08-23
申请号:CN202210190295.8
申请日:2022-02-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06Q40/02 , G06F16/23 , G06F40/194
摘要: 本公开提供了一种数据处理方法、装置、电子设备和存储介质,涉及计算机领域,尤其涉及数据分析和智能搜索领域。具体实现方案为:获取数据字典,其中,数据字典用于表示待分析的银行卡的信息;从数据字典中获取银行卡的目标类别信息,其中,目标类别信息与下游系统相对应,下游系统为在银行卡的应用场景中所使用到的系统;基于目标类别数据生成由下游系统分析的目标文件。
-
公开(公告)号:CN114842317A
公开(公告)日:2022-08-02
申请号:CN202210195108.5
申请日:2022-02-28
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型训练方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及人工智能技术领域。具体实现方案为:校验第一对象的权限信息以及与第二对象的原始样本数据;在确定权限信息和原始样本数据均通过校验的情况下,根据原始样本数据,确定目标样本数据;以及利用目标样本数据训练深度学习模型,得到目标模型。
-
公开(公告)号:CN114444472B
公开(公告)日:2022-07-12
申请号:CN202210340057.0
申请日:2022-04-02
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/211 , G06F40/289
摘要: 本公开提供了一种文本处理方法,涉及人工智能领域,尤其涉及文本处理、知识图谱、文本结构化、数据挖掘和文本摘要等技术领域。具体实现方案为:根据目标文本,得到依存句法信息,其中,依存句法信息包括至少一个结点,结点对应至少一个字;根据至少一个结点和结点对应的至少一个字,确定至少一个第一边;根据至少一个第一边,得到更新后的依存句法信息;以及根据更新后的依存句法信息,确定目标文本中词之间的关联关系。本公开还提供了一种文本处理装置、电子设备和存储介质。
-
公开(公告)号:CN114548261A
公开(公告)日:2022-05-27
申请号:CN202210153080.9
申请日:2022-02-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06K9/62 , G06F40/30 , G06N3/08 , G06F16/2458
摘要: 本公开提供了一种数据处理方法、装置、电子设备以及存储介质,本公开涉及计算机技术领域,尤其涉及人工智能、数据挖掘及机器学习领域。实现方案为:获取用于建模的样本数据集;从样本数据集中选择第一样本数据;响应于确定对应于第一特征维度的第一语义向量和对应于第二特征维度的第二语义向量之间的相似度满足预设条件,基于第一样本数据生成第二样本数据;以及将第二样本数据加入样本数据集。
-
公开(公告)号:CN114547448A
公开(公告)日:2022-05-27
申请号:CN202210148468.X
申请日:2022-02-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本公开提供了数据处理、模型训练方法、装置、设备、存储介质及程序,应用于人工智能领域,尤其涉及大数据、深度学习、智能风控和智能营销技术。具体实现方案为:获取第一用户的属性信息和历史行为信息;根据属性信息和历史行为信息,确定第一用户对应的第一用户特征信息,第一用户特征信息包括M个特征项对应的特征信息;对M个特征项中不同特征项对应的特征信息进行组合,得到多个组合特征信息;根据第一用户特征信息和多个组合特征信息,确定第一用户的目标类别。上述过程中,通过对M个特征项中不同特征项对应的特征信息进行组合,能够产生出更多的组合特征信息,使得在分类时考虑的特征信息更加丰富,因此,能够提高用户分类结果的准确性。
-
公开(公告)号:CN114547301A
公开(公告)日:2022-05-27
申请号:CN202210159137.6
申请日:2022-02-21
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/35 , G06F40/295 , G06F40/30 , G06K9/62
摘要: 本公开提供一种文档处理、识别模型训练方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及深度学习、自然语言处理、深度搜索技术领域。其中,文档处理方法包括:对获取到的待处理文档进行处理,得到待处理文档中的识别对象集合,根据该识别对象集合中对象类别包括的识别对象的识别得分,确定待处理文档的识别结果。识别模型训练方法包括:将获取到的文本样本集的文本样本输入到预设网络,得到该文本样本的对象识别结果,进而结合该文本样本携带的对象标注信息,调整预设网络的参数,得到对象识别模型。该技术方案可以准确的识别出文档中的对象类别以及对象类别对应的识别对象,提高了文档的信息抽取效果。
-
公开(公告)号:CN114444619A
公开(公告)日:2022-05-06
申请号:CN202210340191.0
申请日:2022-04-02
申请人: 北京百度网讯科技有限公司
IPC分类号: G06K9/62 , G06N20/00 , G06V10/774 , G06V10/762
摘要: 本发明提供了一种样本生成方法、训练方法、数据处理方法以及电子设备,涉及人工智能技术领域,尤其涉及工业安全、数据挖掘、计算机视觉和深度学习技术领域。具体实现方案为:根据第一样本集,得到样本表征向量集,其中,第一样本集包括多个样本,样本未被确定类别;根据样本表征向量集,对第一样本集进行聚类,得到至少一个聚类样本集;根据至少一个聚类样本集,生成显著样本数据集。
-
-
-
-
-
-
-
-
-