一种基于中医古籍文献的短语挖掘方法和系统
摘要:
本发明提供所提供的基于中医古籍文献的短语挖掘方法及系统,所述挖掘方法将短语挖掘技术、面向中医古籍文献的分词方法和语言知识库相结合,通过添加中医古文的停用词表以及高质量短语并使用面向中医古籍文献的分词方法进行分词,再利用分词后的文件和词映射生成的映射文件进行两次词性引导的短语分隔,保存模型和结果,并根据模型结果生成短语挖掘结果并回标。本发明基于远程监督方法,不需要人工标注语料,也不需要人工设计提取特征,只需要利用现有的公共知识库,节省了人力物力;从大量中医古文文献中提取高质量短语,只需进行有限的浅层语言分析,易操作,效率更高;同时,更加全面的利用古籍文献,从而对中医古籍文献中的短语进行高效、智能的挖掘。
公开/授权文献
0/0