页面数据抓取方法、装置、电子设备及存储介质

    公开(公告)号:CN118312659A

    公开(公告)日:2024-07-09

    申请号:CN202410425111.0

    申请日:2024-04-09

    发明人: 王鹏

    IPC分类号: G06F16/951

    摘要: 本公开提供了页面数据抓取方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及网络技术领域。具体实现方案为:调用定制的页面抓取组件抓取与目标页面对应的页面数据,得到目标页面数据,定制的页面抓取组件中增加了对页面源文件中文字内容以及图片信息的导出功能;将目标页面数据发送至抓取执行器中。本公开调用定制的页面抓取组件抓取与目标页面对应的页面数据,由于定制的页面抓取组件中增加了对页面源文件中文字内容以及图片信息的导出功能,从而可以实现自动化的抓取,进而显著提高了数据抓取的效率。

    软件开发方法、装置、电子设备和存储介质

    公开(公告)号:CN118092863A

    公开(公告)日:2024-05-28

    申请号:CN202410014460.3

    申请日:2024-01-03

    发明人: 龚正 郭彪 王鹏 李伟

    IPC分类号: G06F8/10 G06F8/36

    摘要: 本公开提供了一种软件开发方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及软件开发、软件安全等领域。具体实现方案为:确定包括已开发完成的SDK的标识信息的SDK标识信息集合中是否包括SDK开发请求中的SDK标识信息;在SDK标识信息集合中未包括SDK开发请求中的SDK标识信息的情况下,基于SDK开发请求中的SDK标识信息,以及至少一个SDK冲突类型中各个SDK冲突类型,生成各个SDK冲突类型对应的开发规范;基于各个SDK冲突类型对应的开发规范,开发目标SDK。采用本公开的技术,可以避免新生成的SDK与已开发完成的SDK发生冲突。

    对象关系网络的构建方法、装置和电子设备

    公开(公告)号:CN114416990B

    公开(公告)日:2024-05-21

    申请号:CN202210051806.8

    申请日:2022-01-17

    摘要: 本公开提供了一种对象关系网络的构建方法、装置和电子设备,涉及深度神经网络、深度学习等人工智能技术领域。具体实现方案为:通过提取多个对象各自对应的文本内容中的关键词,得到各对象对应的关键词;并根据对象对应的关键词,确定多个对象之间的相似度;再根据多个对象之间的相似度,构建多个对象之间的对象关系网络。鉴于通过多个对象之间的相似度,构建的对象关系网络可以准确地描述对象之间的关系紧密程度,因此,通过构建的对象关系网络可以有效地多个对象进行管理。

    构建组织协同网络的方法和装置

    公开(公告)号:CN114422321B

    公开(公告)日:2024-03-22

    申请号:CN202210061719.0

    申请日:2022-01-19

    摘要: 本公开提供了构建组织协同网络的方法和装置,涉及人工智能领域,尤其涉及大数据分析领域。具体实现方案为:获取至少一对组织之间的协同数据;根据协同数据计算每对组织之间的至少一个协同指标;对于每对组织,根据该对组织之间的至少一个协同指标的加权和计算该对组织之间的紧密度;将每个组织作为节点,并将每对组织之间的关系作为边,将每对组织之间的紧密度作为边的权重,构建组织协同网络。该实施方式用科学的方法构建起组织协同网络,基于组织协同网络可进行组织量化评估、组织异常诊断及组织协同效率分析,帮助企业管理者及人力资源团队做好组织系统规划和组织持续运营建设。

    模型训练、难例识别方法、装置、设备、存储介质及程序

    公开(公告)号:CN115359308B

    公开(公告)日:2024-02-13

    申请号:CN202210354081.X

    申请日:2022-04-06

    IPC分类号: G06V10/774 G06V30/19

    摘要: 本公开提供了模型训练、难例识别方法、装置、设备、存储介质及程序,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:获取预设目标检测模型及其对应的好例样本图像和难例样本图像;预设目标检测模型包括M个相同的目标检测分支网络;通过预设目标检测模型对好例样本图像和难例样本图像进行处理,得到好例样本图像对应的M个目标检测结果以及难例样本图像对应的M个目标检测结果;根据上述目标检测结果,对预设目标检测模型的模型参数进行更新,以得到难例识别模型;更新的目标为:最大化难例样本图像对应的M个目标检测结果之间的不确定性、以及最小化好例样本图像对应的M个目标检测结果之

    用于匹配数据的方法、装置、设备和计算机可读存储介质

    公开(公告)号:CN112925913B

    公开(公告)日:2023-08-29

    申请号:CN202110262413.7

    申请日:2021-03-09

    IPC分类号: G06F16/35

    摘要: 本公开公开了用于匹配数据的方法、装置、设备和计算机可读存储介质,涉及人工智能领域,尤其涉及智能搜索和深度学习领域。具体实现方案为:获取简历的第一实例和岗位简档的第二实例;确定针对元路径的第一实例的简历特征数据和第二实例的简档特征数据,元路径为从简历到达岗位简档的知识图谱路径;以及将分类模型应用于第一实例的简历特征数据和第二实例的简档特征数据,以确定第一实例和第二实例之间的匹配结果。通过该方法,减少简历和岗位简档的匹配时间,提高了匹配简历和岗位简档的准确度,改进了用户体验。

    站点评估方法、装置、电子设备、存储介质和程序产品

    公开(公告)号:CN113783855B

    公开(公告)日:2023-07-21

    申请号:CN202111007121.5

    申请日:2021-08-30

    摘要: 本公开提供了一种站点评估方法、装置、电子设备、存储介质和程序产品,涉及网络安全领域和内容推荐领域,可应用于站点链接抓取和站点库维护场景。该方法包括:获取与站点相关联的因特网协议地址集合;确定与因特网协议地址集合相关联的地域特征集合,地域特征集合中的地域特征指示与站点相关联的服务器所处的地理位置;以及基于地域特征集合来确定站点是否属于不良站点。利用上述方法,可以基于与站点相关联的因特网协议地址来判断站点是否属于不良站点,从而可以降低判断不良站点的成本,因此能够提高站点链接抓取和站点库维护的质量和效率。

    图像处理方法和装置
    8.
    发明公开

    公开(公告)号:CN114973258A

    公开(公告)日:2022-08-30

    申请号:CN202210564943.1

    申请日:2022-05-23

    IPC分类号: G06V30/14 G06V30/19 G06V30/41

    摘要: 本公开提供了一种图像处理方法和装置,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。实现方案为:获得包括沿第一方向排列的多个字符的目标图像,多个字符中的每一个字符来自预设字符集并且在预设标签集中具有相应的标签;获得目标图像对应的识别结果集,识别结果集中的每一个识别结果包括来自预设标签集的按顺序排列的多个标签和该多个标签中的每一个标签的置信度;以及基于识别结果集,获得目标图像的图像标签,图像标签包括来自预设标签集的按顺序排列的多个标签。

    训练方法、图像检索方法、图像处理方法、装置及设备

    公开(公告)号:CN114782771A

    公开(公告)日:2022-07-22

    申请号:CN202210335680.7

    申请日:2022-03-30

    摘要: 本公开提供了一种训练方法、图像检索方法、图像处理方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习领域。深度学习模型包括第一模型或第二模型,具体实现方案为:利用子模型处理样本图像,得到样本图像特征数据;利用子模型处理样本图像特征数据和样本任务特征数据,得到样本实例特征数据,其中,样本任务特征数据是根据样本图像确定的;基于对比损失函数,利用至少两个样本实例特征数据,训练至少两个子模型,其中,至少两个子模型的训练数据不同;根据训练后的子模型得到经训练的深度学习模型。

    构建组织协同网络的方法和装置
    10.
    发明公开

    公开(公告)号:CN114422321A

    公开(公告)日:2022-04-29

    申请号:CN202210061719.0

    申请日:2022-01-19

    摘要: 本公开提供了构建组织协同网络的方法和装置,涉及人工智能领域,尤其涉及大数据分析领域。具体实现方案为:获取至少一对组织之间的协同数据;根据协同数据计算每对组织之间的至少一个协同指标;对于每对组织,根据该对组织之间的至少一个协同指标的加权和计算该对组织之间的紧密度;将每个组织作为节点,并将每对组织之间的关系作为边,将每对组织之间的紧密度作为边的权重,构建组织协同网络。该实施方式用科学的方法构建起组织协同网络,基于组织协同网络可进行组织量化评估、组织异常诊断及组织协同效率分析,帮助企业管理者及人力资源团队做好组织系统规划和组织持续运营建设。