发明公开
- 专利标题: 一种基于强化学习的隐患实体标注方法
-
申请号: CN202311231508.8申请日: 2023-09-22
-
公开(公告)号: CN117350289A公开(公告)日: 2024-01-05
- 发明人: 毛邓添 , 睢星飞 , 王海琛 , 王磊 , 徐志鹏 , 何睿 , 陈军 , 曾令旗 , 贺鹏艺 , 李晓亮
- 申请人: 中海油安全技术服务有限公司
- 申请人地址: 天津市滨海新区天津经济技术开发区络达路16号
- 专利权人: 中海油安全技术服务有限公司
- 当前专利权人: 中海油安全技术服务有限公司
- 当前专利权人地址: 天津市滨海新区天津经济技术开发区络达路16号
- 代理机构: 天津市尚仪知识产权代理事务所
- 代理商 杨盼盼
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/211 ; G06F40/157 ; G06N3/045 ; G06N3/092
摘要:
本发明提供一种基于强化学习的隐患实体标注方法,包括以下步骤,使用命名实体识别提取出隐患文本中的实体;使用依存句法器分析隐患文本获取隐患实体;对依存句法器输出的隐患实体进行人工筛选,去除错误的隐患实体;将命名实体识别提取出的实体和依存句法器提取的隐患实体输入到强化学习序列标注模型中进行训练;使用训练好的强化学习序列标注模型对隐患文本进行预测得到隐患实体。本发明不需大量人工标注数据,可直接在未标注的数据上训练;不依赖于事先定义的规则或标注样本,因此对于新领域和新隐患类型具有较好的适应性,能够逐步学习和优化标注实体的策略,适应不同的隐患文本特点,根据实际情况进行实体标注,逐步学习和识别未知实体。