一种中文实体关系联合抽取方法

    公开(公告)号:CN113128229B

    公开(公告)日:2023-07-18

    申请号:CN202110397595.9

    申请日:2021-04-14

    发明人: 沈光熠 杨志勇

    摘要: 本发明提供了一种中文实体关系联合抽取方法,包括使用bert模型学习字符向量,字符向量拼接字形特征及字符位置信息;使用双向LSTM模型学习字符特征;使用选择性注意力机制进行实体识别;使用层次注意力机制LSTM进行关系抽取方法。本申请通过底层共享网络参数的方式,进行联合知识抽取,解决抽取中实体识别和关系抽取错误累计的问题;通过引入分词与词表向量,在词向量中拼接中文特征,解决中文特征信息不充分的问题;通过在结合自注意力机制的双向LSTM编码层,对长距离序列进行建模;通过层级注意力机制,解决实体关系之间关联不足的问题。

    一种基于深度学习的降雨图像相似性搜索方法

    公开(公告)号:CN116091801B

    公开(公告)日:2023-06-16

    申请号:CN202310211558.3

    申请日:2023-03-07

    申请人: 河海大学

    摘要: 本发明公开一种基于深度学习的降雨图像相似性搜索方法,对研究流域进行数据预处理后,采用分块加权颜色直方图分别提取研究流域历史时段降雨量图像和待检索降雨图像的降雨特征信息,然后计算待检索图像和历史降雨图像的降雨特征信息间相似度;其次采用多指标加权组合法对降雨特征信息间的相似度进行融合,得到多特征融合的降雨图像相似性度量方法;接着采用改进鲸鱼优化算法IWOA训练得到最优权重系数,得到最优特征融合相似性度量;最后计算历史库中降雨图像搜索和待查询降雨图像间的相似性并进行排序,得到和待检索图像最相似的历史降雨图像。本发明提供基于深度学习的降雨图像相似性搜索方法,实现相似降雨图像的识别和搜索。

    基于GA-PSO优化XGBoost的水文时间序列预测方法

    公开(公告)号:CN112733996B

    公开(公告)日:2022-07-12

    申请号:CN202110049321.0

    申请日:2021-01-14

    申请人: 河海大学

    摘要: 本发明公开一种基于GA‑PSO优化XGBoost的水文时间序列预测方法,采集对应水文站的雨量值及对应水文站的流量,组织成水文时间序列数据集;对数据进行预处理,将样本数据集划分为训练集和测试集;采用改进的GA‑PSO组合优化算法对XGBoost的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth等各项超参进行优化,同时利用样本数据集对XGBoost模型进行训练,最终得到GA‑PSO优化的XGBoost水文时间序列预测模型;对所述GA‑PSO优化的XGBoost水文预测模型进行测试。本发明采用GA‑PSO对XGBoost模型的参数进行优化,利用最优参数得到的模型进行水文预测,准确度更高。

    基于GA-PSO优化XGBoost的水文时间序列预测方法

    公开(公告)号:CN112733996A

    公开(公告)日:2021-04-30

    申请号:CN202110049321.0

    申请日:2021-01-14

    申请人: 河海大学

    摘要: 本发明公开一种基于GA‑PSO优化XGBoost的水文时间序列预测方法,采集对应水文站的雨量值及对应水文站的流量,组织成水文时间序列数据集;对数据进行预处理,将样本数据集划分为训练集和测试集;采用改进的GA‑PSO组合优化算法对XGBoost的学习率lr、基学习器个数n_estimators、最小叶子权重min_weights、最大树深max_depth等各项超参进行优化,同时利用样本数据集对XGBoost模型进行训练,最终得到GA‑PSO优化的XGBoost水文时间序列预测模型;对所述GA‑PSO优化的XGBoost水文预测模型进行测试。本发明采用GA‑PSO对XGBoost模型的参数进行优化,利用最优参数得到的模型进行水文预测,准确度更高。

    一种缺损档案的录入方法与系统
    6.
    发明公开

    公开(公告)号:CN117493268A

    公开(公告)日:2024-02-02

    申请号:CN202311521002.0

    申请日:2023-11-15

    摘要: 本发明涉及档案归档技术领域,公开了一种缺损档案录入方法与系统,主要实现以下功能:对纸质档案进行扫描识别,得到原始数据集;对提取到的原始数据集进行预处理,得到清晰‑模糊混合型数据;通过k‑NN填补算法对预处理后的清晰‑模糊混合型数据进行缺损填补,得到补全档案;将填补完成的补全档案进行分词、降维并综合主题相关性和词性得到档案关键词和关键词的特征值;通过对特征值降维得到二进制特征值指纹,计算特征值指纹的海明距离度量档案相似度,进行档案重复性检测;对通过重复性检测的档案,基于档案的关键词对所述档案进行自动分档。本发明使得纸质档案能够被更好地保存和研究利用,同时保证了存储空间不会被浪费。

    基于图像特征和深度学习的相似场次降雨模式库构建方法

    公开(公告)号:CN116010795B

    公开(公告)日:2023-06-09

    申请号:CN202310261448.8

    申请日:2023-03-17

    申请人: 河海大学

    摘要: 本发明公开一种基于图像特征和深度学习的相似场次降雨模式库构建方法:采用滑动窗口对历史降雨图像数据集进行分割得到所有场次降雨过程;提取各场次降雨过程的降雨持续天数、场次降雨总量、各日降雨量分布、降雨空间分布以及降雨中心运动轨迹特征;并进行特征相似性度量,采用基于混沌映射的多族群灰狼优化算法对特征的相似性度量进行融合,得到场次降雨过程的最优特征融合相似性度量;采用该最优特征融合相似性度量,从场次降雨过程历史库中搜索相似场次降雨过程并进行描述和表达,以此构建相似降雨模式库。本发明解决现有技术方案中或因用时序数据难以表达场次降雨过程的时空特征信息、或因场次降雨过程特征表达及相似性度量方法不足等问题。

    基于WOA-LSTM-MC的水文时间序列预测优化方法

    公开(公告)号:CN112733997B

    公开(公告)日:2022-08-05

    申请号:CN202110049328.2

    申请日:2021-01-14

    申请人: 河海大学

    摘要: 本发明公开一种基于WOA‑LSTM‑MC的水文时间序列预测优化方法,包括使用优化后的鲸鱼优化算法对预测模型的部分参数进行参数寻优;选取待预测水文站的流量数据作为实验数据;将数据集划分为训练集和测试集,进行训练和预测;利用马尔可夫链MC进行矫正,从而得到最终的水文预测结果,即更为准确的预测值;建立混合WOA‑LSTM‑MC模型。本发明可以更快、更准确地找到预测模型所需要的最优参数,既能保证算法全局搜索能力及局部探索能力,收敛速度很快;预测结果精准。

    一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法

    公开(公告)号:CN114463157A

    公开(公告)日:2022-05-10

    申请号:CN202210256087.3

    申请日:2022-03-15

    申请人: 河海大学

    发明人: 刘喆 杨志勇

    IPC分类号: G06T1/00

    摘要: 本发明提出了一种用于PDF格式电子档案图像的数字水印信息嵌入及提取方法,包括1,提取电子档案中的有效图像并过滤掉无效图像,作为需要嵌入数字水印的载体图像;2,将电子档案图像的著录项目编码到汉信码中;3,对汉信码进行二值化处理,获得原始图像水印,并进行分块置乱;4,对载体图像和图像水印进行缩放、灰度化和小波分解;5,再次进行逆小波变换得到嵌入图像水印之后的图像;6,图像水印提取采用嵌入后的载体图像与嵌入前的载体图像进行小波分解和小波逆变换重构。本发明解决了传统的图像水印信息存储容量有限的问题,通过分块置乱的方式降低了在水印嵌入和提取过程中噪声造成的失真对整体图像水印的影响,提高了汉信码的识别效果。

    基于WOA-LSTM-MC的水文时间序列预测优化方法

    公开(公告)号:CN112733997A

    公开(公告)日:2021-04-30

    申请号:CN202110049328.2

    申请日:2021-01-14

    申请人: 河海大学

    摘要: 本发明公开一种基于WOA‑LSTM‑MC的水文时间序列预测优化方法,包括使用优化后的鲸鱼优化算法对预测模型的部分参数进行参数寻优;选取待预测水文站的流量数据作为实验数据;将数据集划分为训练集和测试集,进行训练和预测;利用马尔可夫链MC进行矫正,从而得到最终的水文预测结果,即更为准确的预测值;建立混合WOA‑LSTM‑MC模型。本发明可以更快、更准确地找到预测模型所需要的最优参数,既能保证算法全局搜索能力及局部探索能力,收敛速度很快;预测结果精准。