基于热点知识共现聚类的环境特征数据集构建方法

    公开(公告)号:CN117933247A

    公开(公告)日:2024-04-26

    申请号:CN202311838214.1

    申请日:2023-12-28

    摘要: 基于热点知识共现聚类的环境特征数据集构建方法,涉及环境工程技术领域。本发明是为了解决根据研究人员主观经构建的水环境特征集存在低价值要素的问题。本发明将目标环境的各项指标作为检索词进行检索,对检索结果的索引词进行共现分析;对共现分析获得的索引词进行同义词合并以及不清晰词语筛除获得关键词;利用关键词构建共现聚类网络,并导出各集群中各关键词的信息数据;分别计算各个关键词的时间距离权重并排序;将排名前十的关键词及其次级下位概念的关键词作为特征词;将处于不同应用场景下的特征词作为场景特征词,并判断其价值;对高价值场景特征词的信息数据进行交叉衍生,构建出不同时空分辨率下的场景特征数据。

    知识抽取方法、装置、电子设备及存储介质

    公开(公告)号:CN115526318A

    公开(公告)日:2022-12-27

    申请号:CN202211222796.6

    申请日:2022-10-08

    摘要: 本公开提供一种知识抽取方法、装置、电子设备及存储介质。该方法包括:获取待处理视频和所述待处理视频的文本信息;从所述待处理视频及所述文本信息中抽取多个候选知识文本;获取所述待处理视频的视频特征和各个候选知识文本的文本特征;通过第一模型确定所述视频特征和各个文本特征之间的相似度,并根据所述相似度,从所述多个候选知识文本中确定多个目标候选知识文本;通过第二模型确定各个目标候选知识文本和所述待处理视频的视频内容之间的匹配程度,并根据所述匹配程度,从所述多个目标候选知识文本中确定目标知识文本。该方法提高了视频和知识文本的匹配效率和召回率,同时提高了视频和知识文本匹配的准确性。