Invention Grant
- Patent Title: 一种基于预加载权重词性组合的中文关键短语抽取的方法
-
Application No.: CN202210100205.1Application Date: 2022-01-27
-
Publication No.: CN114490941BPublication Date: 2024-04-09
- Inventor: 夏立 , 钱柏丞 , 周晶 , 相若晨 , 李颜戎 , 杨学鑫
- Applicant: 南京烽火天地通信科技有限公司
- Applicant Address: 江苏省南京市江宁区滨江经济开发区盛安大道739号
- Assignee: 南京烽火天地通信科技有限公司
- Current Assignee: 南京烽火天地通信科技有限公司
- Current Assignee Address: 江苏省南京市江宁区滨江经济开发区盛安大道739号
- Agency: 江苏圣典律师事务所
- Agent 韩天宇
- Main IPC: G06F16/33
- IPC: G06F16/33 ; G06F40/289 ; G06F40/30
Abstract:
本发明公开了一种基于预加载权重词性组合的中文关键短语抽取的方法,包括建立短语抽取模型,具体步骤如下:S1、对文本预处理;S2、建立核心抽取算法,所述核心抽取算法包括短语权重计算和制定短语拼接规则。该种基于预加载权重词性组合的中文关键短语抽取的方法,通过抽取出的关键短语,不仅能有效代表整个文档的核心内容,而且给出每个关键短语的语义权重,极大增强关键词抽取的可解释性,同时,通过基于中文语言习惯,设计关键短语的短语规则,可有效避免抽取出结构和语义错乱的内容。
Public/Granted literature
- CN114490941A 一种基于预加载权重词性组合的中文关键短语抽取的方法 Public/Granted day:2022-05-13
Information query