一种面向特定领域的中文事件抽取方法

    公开(公告)号:CN108920447B

    公开(公告)日:2022-08-05

    申请号:CN201810426812.0

    申请日:2018-05-07

    Abstract: 本发明一种面向特定领域的中文事件抽取方法,包括:预处理:对原始数据信息去除冗余标签、分句、分词;字典构建:人工对大规模新闻语料分析,对特定领域常见角色总结,构建角色字典;对报道特定领域事件的常见句型进行总结,构建基于触发词的句型字典;句法分析:对给定的中文新闻报道语句,进行句法解析得到句法解析树;句型匹配:根据句型字典在句法树上进行句型匹配;事件要素抽取:根据角色字典在句法树上进行角色抽取,根据时间和地点要素的句法特征在句法树上进行时间和地点抽取。本发明解决了大数据环境下快速获取中文新闻资讯信息的难题,通过自动化处理,用户根据自己输入关键词即可得到关键词相关的新闻事件,为信息获取提供极大便利。

    基于大语言模型的特定信息研判方法及系统

    公开(公告)号:CN120045763A

    公开(公告)日:2025-05-27

    申请号:CN202411949680.1

    申请日:2024-12-27

    Abstract: 本发明提供了基于大语言模型的特定信息研判方法及系统,通过基于API接入、逆向分析APP和网络爬虫相结合的方式获取信息数据,并对所述信息数据进行清洗和规范化处理后存入分布式数据库中进行统一管理;基于大语言模型对信息数据进行预处理后,采用预训练和微调相结合的方式提取信息数据中待分析对象的基础属性信息,基于基础属性信息构建关系知识库;通过线上维度获取待分析对象的线上特征,通过线下维度获取待分析对象的线下特征,对线上特征和线下特征进行特征融合,得到立体属性描述;基于滑动窗口技术,对关系知识库和立体属性描述确定的文本进行信息研判分析,根据研判分析结果对异常信息进行实时提示。

Patent Agency Ranking