-
公开(公告)号:CN112307053B
公开(公告)日:2023-10-17
申请号:CN202011174219.5
申请日:2020-10-28
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/242 , G06F40/253
Abstract: 本申请实施例公开了一种基于强化学习的语言处理方法及装置。所述方法包括:确定SQL语法结构对应的中间表达词集;以及,获取样本自然语言数据;所述中间表达词集中包括多个用于表示各类语法结构的中间表达词;基于所述中间表达词集和所述样本自然语言数据进行强化学习,以得到自然语言处理模型;利用所述自然语言处理模型,确定待处理的目标自然语言数据所对应的目标中间表达序列;所述目标中间序列由多个所述中间表达词组成;根据所述中间表达词集和所述SQL语法结构之间的对应关系,确定所述目标中间表达序列对应的目标SQL语法结构。该技术方案能够提升自然语言转换为SQL语言的效率,且不受限于SQL语言的长度,提升自然语言处理的通用性。
-
公开(公告)号:CN116795860A
公开(公告)日:2023-09-22
申请号:CN202310159528.2
申请日:2023-02-20
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/242 , G06F16/22 , G06F16/36
Abstract: 本申请公开了一种查询数据的方法、装置、电子设备及存储介质,属于图像处理领域。所述方法包括:根据用户查询语句中的语义要素,匹配预设索引表中的多组字段数据,所述预设索引表用于映射数据库中的字段数据和对应的元数据,所述字段数据包括:字段的标识、字段值、表的标识中的至少一项;根据所述数据库中的关联关系,从所述多组字段数据中筛选出目标字段数据,所述关联关系包括:表和表之间的关联关系或表和字段之间的关联关系;确定所述目标字段数据对应的操作标签,所述操作标签与各个数据库查询操作对应;基于所述目标字段数据和所述操作标签,生成数据库查询语句;根据所述数据库查询语句查询数据。
-
公开(公告)号:CN116611948A
公开(公告)日:2023-08-18
申请号:CN202310440968.5
申请日:2023-04-21
Applicant: 北京百分点科技集团股份有限公司
IPC: G06Q50/00 , G06F16/901 , G06F16/9035 , G06F16/907 , G06F16/908
Abstract: 本公开涉及一种身份数据的挖掘方法、装置、存储介质及电子设备,该方法包括:获取待识别视频数据的公开信息,公开信息包括视频发布时间和视频特征信息,确定播放待识别视频数据所需要的数据消耗量,根据数据消耗量和视频特征信息,确定待识别视频数据的视频原始大小,从网络详细记录中筛选视频发布时间以前与视频原始大小匹配的目标网络记录,根据目标网络记录,确定待识别视频数据对应视频发布者的身份数据。从而根据视频数据的公开信息计算视频的原始大小,从网络详细记录中筛选出与视频发布时间和原始大小相匹配的身份数据。基于用户的视频发布行为和网络详细记录,确定出视频发布者的真实身份数据。
-
公开(公告)号:CN116185623A
公开(公告)日:2023-05-30
申请号:CN202310128449.5
申请日:2023-02-07
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F9/50
Abstract: 本申请公开了一种任务分配方法、装置、电子设备及存储介质,所述方法包括:响应于待分配任务的执行请求,获取至少一个备选工作节点;根据任务分配策略以及各个所述备选工作节点当前的状态信息,确定目标工作节点;将所述待分配任务分配给所述目标工作节点;其中,所述备选工作节点满足所述待分配任务的资源需求;所述备选工作节点当前的状态信息包括所述备选工作节点的资源配置、当前的资源占用量以及当前的资源剩余量。
-
公开(公告)号:CN116127098A
公开(公告)日:2023-05-16
申请号:CN202310147705.5
申请日:2023-02-20
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本申请公开了一种知识图谱的构建方法、装置。所述方法包括:获取目标知识图谱对应的本体、抽取规则和映射规则,本体中包括多个实体的定义与多个实体的相关信息的定义,抽取规则为从实体对应的源数据中抽取数据的规则,映射规则为将实体对应的源数据中的字段映射到本体的规则;接收查询请求,查询请求中包括第一实体,根据查询请求,确定第一实体在目标知识图谱对应的图数据库中是否已经被构建,查询请求用于在图数据库中查询第一实体的第一相关知识;在第一实体未被构建的情况下,根据本体、抽取规则和映射规则,对第一实体对应的源数据进行抽取,确定第一相关知识;将第一相关知识导入图数据库中,进行目标知识图谱的构建。
-
公开(公告)号:CN116108820A
公开(公告)日:2023-05-12
申请号:CN202211706137.X
申请日:2022-12-29
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F40/183 , G06F40/30
Abstract: 本申请公开了一种表单生成方法、装置、电子设备及存储介质,所述方法包括:获取目标数据模型,其中,所述目标数据模型包括目标数据对象、所述目标数据对象的属性以及所述目标数据对象的属性配置;确定与所述目标数据模型对应的目标语义模型,其中,所述目标语义模型通过对多种类型的表单控件进行语义分析得到;根据所述目标语义模型,生成与所述目标数据模型对应的语义实例,其中,所述语义实例包括所述目标数据对象以及所述目标数据对象的属性;将所述语义实例渲染为用户可见的表单。
-
公开(公告)号:CN116089996A
公开(公告)日:2023-05-09
申请号:CN202211527734.6
申请日:2022-12-01
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F21/62 , G06F16/903 , G06F16/953
Abstract: 本申请涉及一种数据搜索方法、装置、计算机设备及存储介质,涉及数据存储技术领域。该方法包括:接收数据搜索请求;该数据搜索请求中包含用户信息以及数据搜索关键词;根据用户信息,获取用户的行级权限集合;该行级权限集合中包含用户被授予的至少一个行级权限;遍历行级权限集合,对行级权限集合中的各个行级权限进行同构化处理,获得各个行级权限对应的同构化结果;基于各个行级权限对应的同构化结果,以及数据搜索关键词,构建全域搜索条件;基于全域搜索条件在数据库中进行数据搜索;数据库中的数据是基于与同构化结果的数据结构相对应目标数据结构进行存储。通过上述方法,在实现了全域数据检索的同时,保障了数据库中的数据安全性。
-
公开(公告)号:CN116051306A
公开(公告)日:2023-05-02
申请号:CN202310324284.9
申请日:2023-03-29
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本公开涉及一种社交网络分析方法、装置、电子设备和存储介质,该方法包括:获取目标社交网络,目标社交网络包括多个用户节点以及表征多个用户节点之间的互动关系的多条互动边,以社区适应度最大为目标,对目标社交网络中的多个用户节点进行社区划分,得到第一社区划分结果,以社区内的互动边的紧密度最大为目标,对目标社交网络中的多个用户节点进行社区划分,得到第二社区划分结果,根据第一社区划分结果和第二社区划分结果,得到目标社区划分结果,从而实现了基于用户的社区识别和基于用户间的社交互动关系的社区识别。能够使得到的目标社区划分结果能够更加准确,从而能够更加准确地对社交网络进行有效分析。
-
公开(公告)号:CN116049403A
公开(公告)日:2023-05-02
申请号:CN202310043525.2
申请日:2023-01-29
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/35 , G06F16/31 , G06F40/295 , G06F40/30 , G06F18/2321
Abstract: 本发明涉及自动化数据处理方法领域,提供了一种基于自然语言处理的数据元识别方法。主旨在于解决简单的枚举方式对所有不同行业和领域分类造成的数据稀疏问题和随之产生的不同细分行业和领域层级数据元字典类别过多的问题。主要方案包括利用带有OCR识别技术获取原始数据元,对数据清洗操作;对初步清洗后的数据元进行语义增广操作,得到增强语义数据元;对增强语义数据元进行聚类划分操作,得到不同分支增强语义数据元组;对不同分支增强语义数据元进行属性自生成操作,得到不同分支属性数据元组;对不同分支属性数据元组进行数据规范操作,得到不同分支规范数据元组,然后进行分类数据存储操作,得到不同分支数据存储。
-
公开(公告)号:CN110909535B
公开(公告)日:2023-04-07
申请号:CN201911244893.3
申请日:2019-12-06
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F40/232 , G06F40/295
Abstract: 本公开涉及一种命名实体校对方法、装置、可读存储介质及电子设备。方法包括:基于中文分词结果,从待识别文本中提取第一命名实体,所述第一命名实体包括第一人名和/或第一职务;基于预设的数据库,从所述待识别文本中提取第二命名实体,所述第二命名实体包括第二人名和/或第二职务,所述预设的数据库中包括预设的人名和/或职务;根据所述第二命名实体,对所述第一命名实体进行纠错处理。由于是基于预设的数据库提取的第二命名实体,所以,所提取的第二命名实体较为准确,进而基于该较为准确的第二命名实体辅助对第一命名识别进行纠错处理,可以提高对待识别文本中的第一命名实体校对的准确度。
-
-
-
-
-
-
-
-
-