-
公开(公告)号:CN118093059A
公开(公告)日:2024-05-28
申请号:CN202311595351.7
申请日:2023-11-27
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本申请实施例提供了一种多模态非结构化数据处理方法、装置、电子设备和存储介质,该多模态非结构化数据处理方法包括:获取目标场景下待处理的非结构化数据;利用预定义的数据格式根据所述目标场景配置所述非结构化数据对应的处理任务,得到配置后的处理任务;调用与所述配置后的处理任务对应的应用接口,通过所述应用接口对所述配置后的处理任务对应的非结构化数据进行处理。
-
公开(公告)号:CN115829406A
公开(公告)日:2023-03-21
申请号:CN202211596043.1
申请日:2022-12-13
Applicant: 北京百分点科技集团股份有限公司
IPC: G06Q10/0639 , G06Q50/18
Abstract: 本申请涉及一种专利布局分析方法、装置、计算机设备及存储介质,涉及专利分析技术领域。该方法包括:获取n个目标专利的专利数据;该目标专利是基于目标搜索条件获得的专利;对各个目标专利的专利数据进行解析,获得各个目标专利的专利特征信息;该专利特征信息中包含目标专利对应的cpc分类号;获取各个cpc分类号指示cpc分类号的核心性的第一分值;获取各个cpc分类号用于指示cpc分类号的跨领域性的第二分值;基于各个cpc分类号的第一分值与各个cpc分类号的第二分值,从n个目标专利的cpc分类号中确定目标cpc分类号,以通过目标cpc分类号对专利布局进行指导;通过上述方法,可以提高对专利布局的指导效果。
-
公开(公告)号:CN111083136B
公开(公告)日:2022-03-08
申请号:CN201911275230.8
申请日:2019-12-12
Applicant: 北京百分点科技集团股份有限公司
IPC: H04L9/40 , H04L67/1023
Abstract: 本公开涉及一种账号资源管理装置、方法及数据采集系统、方法。本公开提供的技术方案,对于每个账号使用不同的固定登录IP、登录Header信息进行模拟登录,在登录后将获得的Cookie信息与所述登录IP和登录Header信息关联存储,以模拟一个用户在一个地方使用固定浏览器上网,避免出现一个账号、cookie对应多个IP及单个IP被大量用户使用的情况,从而避免受到浏览拦截限制。并且,每一账号登录模块与一下载解析服务节点对应且与一组登录IP对应,从而可以通过控制每个下载解析服务节点对应的登录IP分配,以实现控制多个下载解析服务节点的负载均衡。
-
公开(公告)号:CN115600593A
公开(公告)日:2023-01-13
申请号:CN202211362675.1
申请日:2022-11-02
Applicant: 北京百分点科技集团股份有限公司(CN)
IPC: G06F40/289 , G06F40/30
Abstract: 本申请公开了一种获取文献关键内容的方法和装置,所述方法包括:获取待提取关键内容的目标文献;将所述目标文献的目标内容输入目标模型,输出从所述目标文献中提取出的多种关键信息,其中,所述目标模型包括与所述多种关键信息相对应的多个子模型,所述多个子模型是预先基于标注过的文献语料训练得到的,一个子模型用于提取一种关键信息,所述多种关键信息包括研究对象、针对问题、解决方法、基本原理和结论中的至少一种,研究对象、针对问题、解决方法和基本原理对应的子模型为BERT+CRF,结论对应的子模型为规则匹配模型;对所述多种关键信息进行组合,得到所述目标文献的关键内容报告。该方法及装置可以提升文献关键内容获取效率。
-
公开(公告)号:CN116304840A
公开(公告)日:2023-06-23
申请号:CN202310409404.5
申请日:2023-04-17
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F18/24 , G06F18/21 , G06F18/214 , G06F18/241 , G06F16/35 , G06Q50/00 , H04L51/52
Abstract: 本公开涉及一种虚假消息识别方法、装置、电子设备和存储介质,该方法包括:获取目标消息对应的目标消息特征,目标消息特征为多个目标要素所对应的特征,并通过虚假消息识别模型对目标消息特征进行处理,得到虚假消息识别结果,虚假消息识别模型基于样本训练集合分别训练多个不同的基础网络得到,且虚假消息识别模型为由多个不同的基础网络训练得到的多个原始识别模型中识别效果最好的原始识别模型,样本训练集合包括多个样本消息对应的样本消息特征以及每个样本消息对应的标注标签,每个样本消息对应的样本消息特征为样本消息对应于多个原始要素的特征,原始要素包括目标要素。能够提高对虚假消息进行识别的识别效果。
-
公开(公告)号:CN115761852A
公开(公告)日:2023-03-07
申请号:CN202211449695.2
申请日:2022-11-18
Applicant: 北京百分点科技集团股份有限公司
Abstract: 本公开涉及一种伪造人脸识别方法、装置、电子设备及存储介质,该方法包括:获取目标图像,目标图像包含人脸区域,通过伪造人脸识别模型中的第一网络对目标图像进行处理,得到表征人脸噪声边界的人脸噪声边界识别结果,人脸噪声边界为目标图像中不同图像噪声所形成的边界线,通过伪造人脸识别模型中的第二网络对人脸噪声边界识别结果进行处理,得到伪造人脸识别结果。考虑到来源不同的图像区域会存在不同的图像噪声,通过伪造人脸识别模型中的第一网络对目标图像进行识别得到人脸噪声边界识别结果,从而能够根据人脸噪声边界识别结果来判断目标图像是否为伪造图像,对于所有的图像伪造方法得到的伪造人脸图像均有较好的识别效果。
-
公开(公告)号:CN118152671A
公开(公告)日:2024-06-07
申请号:CN202410010165.0
申请日:2024-01-02
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/9536
Abstract: 本申请实施例提供一种舆情信息采集入口的确定方法、装置、设备及存储介质。在本申请实施例中,所述方法包括:获取基于搜索条件在社交媒体中命中的目标信息;所述目标信息,包括:舆情信息和/或与所述舆情信息关联的社交信息;根据预先设置的不同信息类型与采集入口挖掘策略的对应关系,以及所述目标信息的信息类型,确定与所述目标信息的信息类型相匹配的采集入口挖掘策略;采用所述采集入口挖掘策略对所述目标信息进行信息挖掘,以获得与所述目标信息相关联的社交媒体账号,作为舆情信息采集入口。
-
公开(公告)号:CN118916564A
公开(公告)日:2024-11-08
申请号:CN202411045093.X
申请日:2024-07-31
Applicant: 北京百分点科技集团股份有限公司
IPC: G06F16/958
Abstract: 本申请提供一种新闻站点的解析方法和装置,该方法包括:获取新闻网站的站点列表,站点列表中包括多个链接;根据多个链接的链接结构,从多个链接中提取新闻链接;根据新闻链接的html页面源码以及html页面源码中各html节点的属性信息,提取新闻链接的新闻数据,新闻数据包括新闻正文、新闻发布时间和新闻标题中的至少一项。由于新闻链接的链接结构与其他链接的链接结构不同,因此,通过分析新闻站点中多个链接的链接结构,可以从新闻站点中有效提取得到新闻链接;由于可以根据新闻链接的html页面源码和html页面源码中各html节点的属性信息对新闻链接进行分析,因此,可以有效提取得到新闻数据,提高新闻数据的解析准确率。
-
-
-
-
-
-
-