-
公开(公告)号:CN112445862B
公开(公告)日:2024-01-26
申请号:CN202011359712.4
申请日:2020-11-27
Applicant: 中国科学院信息工程研究所
IPC: G06F16/27 , G06F16/215 , G06F16/951 , G06F40/295
Abstract: 本发明实施例提供了一种物联网设备数据集构建方法、装置、电子设备和存储介质,从网络抓取到物联网设备信息后,当设备品牌存在缺失或冗余时,通过命名实体识别模型、预先设置的正则表达式以及网页内容关键词抽取等方式对物联网设备信息进行修正,基于修正之后的物联网设备信息构建联网设备数据集。通过修正之后符合规范的物联网设备信息构建物联网设备数据集,使得物联网设备数据集中的每一条数据均是符合规范的数据项,从而能够基于规范的数据项对物联网数据集进行查询,提高了物联网数据集的可用性。
-
公开(公告)号:CN112445862A
公开(公告)日:2021-03-05
申请号:CN202011359712.4
申请日:2020-11-27
Applicant: 中国科学院信息工程研究所
IPC: G06F16/27 , G06F16/215 , G06F16/951 , G06F40/295
Abstract: 本发明实施例提供了一种物联网设备数据集构建方法、装置、电子设备和存储介质,从网络抓取到物联网设备信息后,当设备品牌存在缺失或冗余时,通过命名实体识别模型、预先设置的正则表达式以及网页内容关键词抽取等方式对物联网设备信息进行修正,基于修正之后的物联网设备信息构建联网设备数据集。通过修正之后符合规范的物联网设备信息构建物联网设备数据集,使得物联网设备数据集中的每一条数据均是符合规范的数据项,从而能够基于规范的数据项对物联网数据集进行查询,提高了物联网数据集的可用性。
-