发明授权
CN101826102B 一种图书关键字自动生成的方法
失效 - 权利终止
- 专利标题: 一种图书关键字自动生成的方法
- 专利标题(英): Automatic book keyword generation method
-
申请号: CN201010133153.5申请日: 2010-03-26
-
公开(公告)号: CN101826102B公开(公告)日: 2012-07-25
- 发明人: 庄越挺 , 吴江琴 , 张亮 , 张寅 , 魏宝刚
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区浙大路38号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区浙大路38号
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 张法高
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种图书关键字自动生成方法。确定图书与作者的关系,从互联网上抓取书评,将其分词并标注词性,留下名词作候补关键词;通过谷歌检索候补关键词在维基百科中出现的文档数目以初步评定重要性,过滤语气词、错别字;将作者、图书、评论和候补关键词作为四种节点,将其互相间的关系作为边,构建四部图;基于四部图,运用以图书为中心的吸收态随机行走算法挑选出最重要的候补关键词作为图书关键字。本发明考虑了同一作者著作的主题一致性、内容相关性及读者反馈,关键词正确率高;充分覆盖读者不同角度的书评,关键词多样化;数据来自互联网,书评数量庞大、涵盖面广,方法覆盖面广。
公开/授权文献
- CN101826102A 一种图书关键字自动生成的方法 公开/授权日:2010-09-08