Invention Publication
- Patent Title: 一种自然语言文本的惯用句式提取方法及电子装置
-
Application No.: CN202010518026.0Application Date: 2020-06-09
-
Publication No.: CN113779961APublication Date: 2021-12-10
- Inventor: 戚梦苑 , 万辛 , 孙晓晨 , 李鹏 , 黄远 , 杨晶超 , 王勇 , 梁睿琪
- Applicant: 国家计算机网络与信息安全管理中心
- Applicant Address: 北京市朝阳区裕民路甲3号
- Assignee: 国家计算机网络与信息安全管理中心
- Current Assignee: 国家计算机网络与信息安全管理中心
- Current Assignee Address: 北京市朝阳区裕民路甲3号
- Agency: 北京君尚知识产权代理有限公司
- Agent 余功勋
- Main IPC: G06F40/211
- IPC: G06F40/211 ; G06F40/253 ; G06F40/289

Abstract:
本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。
Public/Granted literature
- CN113779961B 一种自然语言文本的惯用句式提取方法及电子装置 Public/Granted day:2024-10-01
Information query