Invention Grant
- Patent Title: 基于句法结构的领域自适应方面术语抽取方法及系统
-
Application No.: CN202210401179.6Application Date: 2022-04-18
-
Publication No.: CN114492387BPublication Date: 2022-07-19
- Inventor: 高翠芸 , 董安国 , 肖京 , 王轩 , 王磊 , 张加佳 , 赵盟盟
- Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- Applicant Address: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- Assignee: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- Current Assignee: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- Current Assignee Address: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- Agency: 深圳市添源创鑫知识产权代理有限公司
- Agent 覃迎峰
- Main IPC: G06F40/211
- IPC: G06F40/211 ; G06F40/284 ; G06F40/237 ; G06N20/00

Abstract:
本发明公开一种基于句法结构的领域自适应方面术语抽取方法及系统,包括将源领域和目标领域中词的词性和句法依赖关系作为句法结构信息;计算源领域方面术语的平均词性特征和平均句法依赖关系特征并作为方面术语的平均句法结构特征;根据句法结构信息计算源领域和目标领域中每个词和平均句法结构特征的相似度;对基于Transformer的预训练模型进行基于句法结构相似度的再预训练;基于掩码语言模型MLM构建方面术语抽取模型并进行训练,训练过程中对术语抽取模型的交叉熵损失函数进行加权。本发明能学习到词语级领域不变表征,在细粒度的文本抽取任务中能取得不错的成效。
Public/Granted literature
- CN114492387A 基于句法结构的领域自适应方面术语抽取方法及系统 Public/Granted day:2022-05-13
Information query