- 专利标题: 一种基于中医古籍文献的短语挖掘方法和系统
- 专利标题(英): Phrase mining method and system based on traditional Chinese medicine ancient book literature
-
申请号: CN201910335367.1申请日: 2019-04-24
-
公开(公告)号: CN110334337A公开(公告)日: 2019-10-15
- 发明人: 张德政 , 夏超 , 谢永红 , 贾麒 , 杨石兵 , 栗辉
- 申请人: 北京科技大学
- 申请人地址: 北京市海淀区学院路30号
- 专利权人: 北京科技大学
- 当前专利权人: 北京科技大学
- 当前专利权人地址: 北京市海淀区学院路30号
- 代理机构: 北京市广友专利事务所有限责任公司
- 代理商 张仲波
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06F16/36
摘要:
本发明提供所提供的基于中医古籍文献的短语挖掘方法及系统,所述挖掘方法将短语挖掘技术、面向中医古籍文献的分词方法和语言知识库相结合,通过添加中医古文的停用词表以及高质量短语并使用面向中医古籍文献的分词方法进行分词,再利用分词后的文件和词映射生成的映射文件进行两次词性引导的短语分隔,保存模型和结果,并根据模型结果生成短语挖掘结果并回标。本发明基于远程监督方法,不需要人工标注语料,也不需要人工设计提取特征,只需要利用现有的公共知识库,节省了人力物力;从大量中医古文文献中提取高质量短语,只需进行有限的浅层语言分析,易操作,效率更高;同时,更加全面的利用古籍文献,从而对中医古籍文献中的短语进行高效、智能的挖掘。
公开/授权文献
- CN110334337B 一种基于中医古籍文献的短语挖掘方法和系统 公开/授权日:2020-12-08