-
公开(公告)号:CN114239579A
公开(公告)日:2022-03-25
申请号:CN202111326674.7
申请日:2021-11-10
Applicant: 国网福建省电力有限公司信息通信分公司 , 福建亿榕信息技术有限公司
IPC: G06F40/295 , G06F40/242 , G06F40/216 , G06F16/35 , G06F40/30 , G06V30/40 , G06V30/413
Abstract: 本发明公开了一种基于正则表达式和CRF模型的电力可研文档提取方法和装置,所述方法包括:获取用户提交的可研报告,对所述可研报告的内容进行识别、抽取,得到待处理的文本数据;通过数据清洗对所述待处理的文本数据进行重新审查和校验;通过知识库和语义分析模型,对完成数据清洗的待处理的文本数据进行预处理;采用基于文档内容模式、基于文本语言特点模式以及基于上下文辅助信息模式分别配置相应的正则表达式,对预处理后的文本数据进行数据提取;将利用正则表达式规则提取得到的文本数据输入训练后的CRF模型进一步提取,得到可研评审指标。本发明解决了评审过程中指标提取不准确问题,增强可研智能评审系统的智能化能力,提升用户体验。
-
公开(公告)号:CN114239568A
公开(公告)日:2022-03-25
申请号:CN202111328025.0
申请日:2021-11-10
Applicant: 国网福建省电力有限公司信息通信分公司 , 福建亿榕信息技术有限公司
IPC: G06F40/289 , G06N3/04 , G06V30/40 , G06F40/211
Abstract: 本发明实施例公开了一种基于自适应注意力机制的电网公文自动生成方法,包括:获取用户输入的电网公文信息;利用共同注意力机制模型从所述电网公文信息中提取出用户输入的文本特征,并生成上下文特征向量,为所述用户输入的文本特征赋予相应的权重,使模型能够获取用户输入的多窗口文本特征;通过句子BiLSTM模型对所述用户输入的文本特征进行建模,生成句子主题;利用基于自适应注意力机制的词BiLSTM模型自动生成电网公文;在对自动生成的电网公文进行人工校验和确认后,将人工确认后的结果扩充到电网公文语料库中。本发明提供的一种基于自适应注意力机制的电网公文自动生成方法及装置,在节省时间和人力的同时,保障电网公文的精准性与全面性。
-