-
公开(公告)号:CN113392811B
公开(公告)日:2023-08-01
申请号:CN202110772650.8
申请日:2021-07-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V30/412 , G06V30/14 , G06V30/16 , G06T5/00
摘要: 本公开提供了一种表格提取方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及自动识别技术。具体实现方案为:对表格图片进行光学字符识别,得到表格图片的光学字符识别结果;其中,光学字符识别结果包括:表格图片中的至少一个文字块的内容以及该至少一个文字块中各个文字块的坐标;基于表格图片的光学字符识别结果,对表格图片进行结构化处理,得到表格图片的结构化处理结果;基于表格图片的结构化处理结果,提取出表格图片中的表格。本公开可以在扭曲或者歪斜的图片中提取出表格,无需获取原始图像,同时还可以提升表格结构化的效果。
-
公开(公告)号:CN116204559A
公开(公告)日:2023-06-02
申请号:CN202310228228.5
申请日:2023-03-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/2455 , G06F16/28 , G06F16/901
摘要: 本公开提供了一种数据存储、数据查询方法、装置、电子设备及介质,涉及数据处理技术领域,尤其涉及数据挖掘、数据处理等大数据技术领域。具体实现方案为:确定图数据中记录的对象所属的对象分组;基于存在对象关系的对象所属的对象分组,确定所述图数据中记录的对象关系所属的关系分组;在关系型数据库中存储所得对象分组和关系分组。应用本公开实施例提供的数据存储方法进行数据存储时,可以节省存储资源的消耗量。
-
公开(公告)号:CN115146725B
公开(公告)日:2023-05-30
申请号:CN202210776197.2
申请日:2022-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/2431 , G06Q10/0635 , G06Q40/00
摘要: 本公开提供了一种对象分类模式的确定方法、对象分类方法、装置、设备、介质和产品,涉及人工智能领域,具体为机器学习、大数据、金融等技术领域。对象分类模式的确定方法包括:基于初始条件信息和多个对象的历史特征数据,将多个对象进行分类,得到多个候选类别;基于多个候选类别的对象风险概率,从多个候选类别中确定目标类别;从初始条件信息中,确定与目标类别相关联的目标条件信息;基于目标条件信息,确定对象分类模式。
-
公开(公告)号:CN114565402A
公开(公告)日:2022-05-31
申请号:CN202210152216.4
申请日:2022-02-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06Q30/02
摘要: 本公开提供了信息推荐方法、装置以及电子设备,涉及人工智能技术领域,尤其涉及云计算、自然语言处理、智能搜索、智能营销技术领域。具体实现方案为:确定当前活动场景,以及其中至少一个待处理对象的对象数据;根据当前活动场景对应的至少一个响应维度,以及至少一个待处理对象的对象数据,确定目标对象;针对每个目标对象,根据当前活动场景下至少一个权益产品的推荐条件,以及目标对象的对象数据,确定待推荐权益产品;为目标对象推送待推荐权益产品的权益信息以及发放条件,从而能够提高权益推荐的精细化水平和智能化水平,支持针对不同对象群的权益产品推送,精准匹配权益产品以及目标对象,提高权益推荐的效率以及准确度。
-
公开(公告)号:CN113377958B
公开(公告)日:2024-08-23
申请号:CN202110768945.8
申请日:2021-07-07
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种文档分类方法、装置、电子设备、存储介质以及计算机程序产品,尤其涉及图像处理领域。具体实现方案为:获取待分类图像中与审核业务相关的图像特征,以及所述待分类图像中的指定文本对应的文本特征;针对所述图像特征以及所述文本特征进行特征融合,获得融合特征;根据所述融合特征,获得所述待分类图像对应的文档分类结果。本公开的方案,为获得待分类图像对应的文档分类结果,同时考虑了待分类图像中与审核业务相关的图像特征,以及待分类图像中的指定文本对应的文本特征。因此,提高了文档分类结果的准确性。
-
公开(公告)号:CN115146725A
公开(公告)日:2022-10-04
申请号:CN202210776197.2
申请日:2022-06-30
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种对象分类模式的确定方法、对象分类方法、装置、设备、介质和产品,涉及人工智能领域,具体为机器学习、大数据、金融等技术领域。对象分类模式的确定方法包括:基于初始条件信息和多个对象的历史特征数据,将多个对象进行分类,得到多个候选类别;基于多个候选类别的对象风险概率,从多个候选类别中确定目标类别;从初始条件信息中,确定与目标类别相关联的目标条件信息;基于目标条件信息,确定对象分类模式。
-
公开(公告)号:CN114549018A
公开(公告)日:2022-05-27
申请号:CN202210126336.7
申请日:2022-02-10
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种反欺诈策略的确定方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、云计算、自然语言处理技术领域。该方案为:确定待处理的多个对象标识,每个对象标识对应的对象数据,以及每个对象标识对应的特征向量序列;根据特征向量序列,对多个对象标识进行聚类处理,得到至少一个对象标识群组;针对每个对象标识群组,获取对象标识群组中至少部分对象标识对应的标签,并根据至少部分对象标识对应的标签,确定对象标识群组的标签;根据至少一个对象标识群组的标签,以及每个对象标识群组中对象标识对应的对象数据,确定针对对象标识的反欺诈策略,进一步提高反欺诈策略的准确度,进一步提高反欺诈检测的准确度和效率。
-
公开(公告)号:CN114548307A
公开(公告)日:2022-05-27
申请号:CN202210190043.5
申请日:2022-02-28
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种分类模型训练方法和装置,涉及大数据、机器学习等技术领域。具体实现方案为:基于分类建模任务,确定待构建模型的建模信息;基于建模信息,在历史模型库中选取至少一个预训练模型;基于选取的样本,得到预训练模型的输出结果;基于输出结果和样本,对待构建模型进行训练,得到训练完成的分类模型。该实施方式提升了分类模型分类效果。
-
公开(公告)号:CN114445186A
公开(公告)日:2022-05-06
申请号:CN202210110639.X
申请日:2022-01-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开公开了一种页面的生成方法、装置、电子设备和存储介质,尤其涉及自然语言处理、深度学习等人工智能技术领域。其中,具体方案为:响应于接收到物品换购请求,确定当前用户的第一描述信息及当前用户的可用资源量;根据所述可用资源量及当前处于可换购状态的各物品对应的目标资源量,确定各候选物品及每个所述候选物品的第二描述信息;基于预设的规则,根据所述第一描述信息及每个所述第二描述信息,确定所述用户换购每个所述候选物品的第一概率;根据所述第一概率,生成物品换购页面。由此,提高了换购物品推荐的准确性和可靠性,也节省了用户选取换购物品的时间,进而提高了用户进行物品换购的效率,也进一步改善了用户体验。
-
公开(公告)号:CN114444606A
公开(公告)日:2022-05-06
申请号:CN202210113494.9
申请日:2022-01-30
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型训练方法和装置,涉及大数据、机器学习等技术领域。具体实现方案为:根据预先获取的辅助样本和目标样本,得到训练样本;采用预设的权重规则,生成训练样本的训练权重,权重规则用于使辅助样本和目标样本权重占比相同;执行以下训练步骤:将训练样本和训练权重输入基学习器,得到基学习器的输出;基于基学习器的输出,采用迁移算子调整训练权重,直到满足训练停止条件,得到目标模型。该实施方式提高了建模的效率。
-
-
-
-
-
-
-
-
-