-
公开(公告)号:CN111104520B
公开(公告)日:2023-06-30
申请号:CN201911149062.8
申请日:2019-11-21
申请人: 新华智云科技有限公司
IPC分类号: G06F16/36 , G06F16/33 , G06F40/35 , G06F40/295 , G06N3/0442 , G06N3/045 , G06N3/047 , G06N3/08
摘要: 本发明涉及实体链接技术领域,具体地说,涉及一种基于人物身份的人物实体链接方法。其包括训练深度学习模型,从人物实体信息中进行身份抽取,找到人物名称在文中出现的句子,进行人物身份抽取,阈值判断。该基于人物身份的实体链接方式,人物身份信息的人物实体链接准确率高达93%+,特别对于文中带有人物身份描述的链接场景,效果更佳,采取深度学习模型从实体信息和文本中抽取人物身份信息,然后使用深度学习模型将身份信息转换为句向量,进而进行相似度比较,通过与阈值大小的比较,最终判断实体是否链接成功。
-
公开(公告)号:CN111090754B
公开(公告)日:2023-04-07
申请号:CN201911140587.5
申请日:2019-11-20
申请人: 新华智云科技有限公司
摘要: 本发明涉及知识图谱技术领域,具体地说,涉及一种基于百科词条自动构建影视综知识图谱的方法。其包括将百科词条infobox、参演电影、参演电视剧模块转化为创建图谱节点和边的解析流程和根据百科词条判断是否为影视综相关人物流程。该基于百科词条自动构建影视综知识图谱的方法中,采用百科词条作为数据源,数据源易获得,容易复现,同时,数据源单一,不存在数据融合的问题,将百科词条infobox、参演电影、参演电视剧模块转化为创建图谱节点和边的解析,根据百科词条判断是否为影视综相关人物,实现影视综领域图谱自动化建设。
-
公开(公告)号:CN114386418A
公开(公告)日:2022-04-22
申请号:CN202210022901.5
申请日:2022-01-10
申请人: 新华智云科技有限公司
IPC分类号: G06F40/295 , G06F16/35 , G06F16/36
摘要: 本申请涉及一种知识图谱中重复实体的去重方法,通过利用一个训练用知识图谱中实体的实体信息构建多个正和/或反例作为预训练模型调整的训练数据,节省标注成本,而且将实体去重目标转化为文本二分类任务,大大降低了实体去重的难度,不用引入量化计算的指标,且正反例数量足够多的条件下,调整后的预训练模型作为实体去重模型,它的去重准确率不会降低,反而相对传统去重方法会有显著的提高。
-
公开(公告)号:CN112559756A
公开(公告)日:2021-03-26
申请号:CN202010922395.6
申请日:2020-09-04
申请人: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC分类号: G06F16/36 , G06F16/9532
摘要: 一种地震事件知识图谱构建方法、应用方法,包括以下步骤:构建地震事件知识图谱的schema;构建历史地震事件信息库;识别并筛选地震事件新闻,抽取地震信息;将历史地震事件新闻信息库和抽取的地震信息进行知识融合;对融合后的地震知识进行知识加工;根据S200‑S500的步骤定时更新地震事件知识图谱。采用上述方法构建一个具有全面历史数据、同时具有实时更新能力的地震事件知识图谱。
-
公开(公告)号:CN111506770A
公开(公告)日:2020-08-07
申请号:CN202010321662.4
申请日:2020-04-22
申请人: 新华智云科技有限公司
IPC分类号: G06F16/738 , G06F16/78 , G06F16/787 , G06F16/332 , G06F16/36 , G06K9/00
摘要: 本发明公开了一种采访视频集锦生成方法和系统,所述方法包括如下步骤:预建立至少一个对象知识图谱;根据场景位置构建至少一环境知识库;根据所述对象知识图谱和/或环境知识库内容进行采访问答;获取采访问答的音视频信息,并对采访问答的音视频信息进行处理。本发明提供的采访视频集锦生成方法和系统可提高采访视频集锦的生产效率,构建环境知识库和利用关键词匹配环境知识库的方法可提高采访话题的关联性、互动性;图文解释等可视化显示提高采访的体验效果。
-
公开(公告)号:CN110532740A
公开(公告)日:2019-12-03
申请号:CN201910767844.1
申请日:2019-08-20
申请人: 新华智云科技有限公司
摘要: 本发明公开了一种图片加密方法,所述方法包括:获取待加密图片;对所述待加密图片追加二进制加密数据,将加密后的图片作为第一次加密图片;对所述第一次加密图片设置可交换图像文件信息,将加密后的图片作为第二次加密图片;获取所述第二次加密图片的哈希值;根据水印数据和所述第二次加密图片进行叠加,获得加密后的图片。本发明还同时公开了图片加密装置、图片侵权确定方法和计算机存储介质。
-
公开(公告)号:CN108241856B
公开(公告)日:2019-03-01
申请号:CN201810032454.5
申请日:2018-01-12
申请人: 新华智云科技有限公司
摘要: 本发明的目的是提供一种资讯信息生成方法及设备,本发明通过对视频资源中的图片和音频进行相似度聚类,对聚类后对图片和音频进行特征统计,以得到相应的统计特征集,根据统计特征集生成关键词,进而根据关键词生成文本资讯信息如新闻等,能够汇总和呈现既有或未来可能输入的视频资料,基于视频资料精确、高效地生成资讯信息,极大丰富各场景下可获取的资讯信息量。
-
公开(公告)号:CN108959270A
公开(公告)日:2018-12-07
申请号:CN201810906886.4
申请日:2018-08-10
申请人: 新华智云科技有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/278
摘要: 本发明公开了一种基于深度学习的实体链接方法,包括获取待识别文档中待链接的实体指称,并抽取库中与实体指称对应的候选实体集;计算每个候选实体与实体指称的概念相似度,抽取候选实体集中与实体指称的概念相似度最高的候选实体为待链接实体;获取待链接实体的属性信息,判断待链接实体能否与相应的实体指称进行链接,并将能够链接的待链接实体与实体指称进行链接。本发明能够结合候选实体的属性信息以及概念相似度对候选实体能否与实体指称进行链接进行判断,将确定候选实体与实体指称的概念相似度、候选实体是否链接实体指称两过程进行联合建模,模型训练过程中将自动学习候选实体能否与实体指称进行链接,使判断更加准确。
-
公开(公告)号:CN108345663A
公开(公告)日:2018-07-31
申请号:CN201810107186.9
申请日:2018-02-02
申请人: 新华智云科技有限公司
IPC分类号: G06F17/30
摘要: 本申请提供了一种新闻推送方法及设备,该方案首先根据用户输入的提问语句,识别用户的提问意图,若所述提问意图为获取新闻,则从所述提问语句中提取新闻元素,然后根据所述新闻元素对新闻库中的候选新闻进行相关度评分,并根据所述相关度评分,向用户推送所述新闻库中的候选新闻。由此,用户可以通过提问的方式主动获取感兴趣的新闻内容,而非被动地获取预先设定好的固定新闻,并且向用户推送其感兴趣的新闻时,是基于提取到的新闻元素进行过精准匹配的,使得推送的新闻内容能够与符合用户的实际期望。
-
公开(公告)号:CN108241861A
公开(公告)日:2018-07-03
申请号:CN201810009644.5
申请日:2018-01-05
申请人: 新华智云科技有限公司
摘要: 本申请提供了一种数据可视化方法及设备,该方案在获取输入图像之后,对所述输入图像进行预处理,获取所述输入数据中几何图形和文本的构图信息,然后分别基于几何图形的构图信息和文本的构图信息进行处理,根据所述几何图形的构图信息生成第一图层,以及根据所述文本的构图信息生成第二图层,最后融合第一图层和第二图层,从而快速地实现图像数据可视化重构、还原,生成符合用户期望的可视化设计。
-
-
-
-
-
-
-
-
-