基于图书阅读行为的图书章节摘要生成方法

    公开(公告)号:CN103885935A

    公开(公告)日:2014-06-25

    申请号:CN201410090143.6

    申请日:2014-03-12

    申请人: 浙江大学

    IPC分类号: G06F17/27

    摘要: 本发明公开了一种基于图书阅读行为的图书章节摘要生成方法。基于图书阅读行为的图书章节摘要生成技术本质上是一种文档摘要生成技术,即将用户阅读行为加入文档摘要生成之中,并且应用于工程科教图书资源上。本发明首先采用图书页面量化阅读行为评分机制计算图书章节中每页书页的权重大小,然后将图书章节按句子分割,句子之间的相似度按距离计算并将已有的句子权重值按流行结构传播,最后基于数据重构的思想挑选出最能够代表图书章节内容的句子作为图书章节摘要。本发明将用户阅读行为收集,用于对图书书页的重要性评价中,通过基于数据重构的文档摘要生成思想得到对应的图书章节摘要,进而辅助用户快速了解图书章节内容,提高图书阅读效率。

    一种图书关键字自动生成的方法

    公开(公告)号:CN101826102B

    公开(公告)日:2012-07-25

    申请号:CN201010133153.5

    申请日:2010-03-26

    申请人: 浙江大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种图书关键字自动生成方法。确定图书与作者的关系,从互联网上抓取书评,将其分词并标注词性,留下名词作候补关键词;通过谷歌检索候补关键词在维基百科中出现的文档数目以初步评定重要性,过滤语气词、错别字;将作者、图书、评论和候补关键词作为四种节点,将其互相间的关系作为边,构建四部图;基于四部图,运用以图书为中心的吸收态随机行走算法挑选出最重要的候补关键词作为图书关键字。本发明考虑了同一作者著作的主题一致性、内容相关性及读者反馈,关键词正确率高;充分覆盖读者不同角度的书评,关键词多样化;数据来自互联网,书评数量庞大、涵盖面广,方法覆盖面广。

    基于用户点击行为的数字图书搜索方法

    公开(公告)号:CN101320375A

    公开(公告)日:2008-12-10

    申请号:CN200810063010.4

    申请日:2008-07-04

    申请人: 浙江大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于用户点击行为的数字图书搜索的方法。首先,提取Web日志中的图书阅读记录构建图书之间的关联图,使用该关联图来计算图书的相关性排序;其次,提取日志中的检索阅读记录,利用其中读者对检索结果的隐式反馈对查询词进行聚类;最后,在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种信息源,形成最终的图书搜索结果排序。本发明可以获得客观的图书相关性排序和很好的查询词聚类效果;将互联网上丰富的图书评分数据融入到相对封闭和静态的数字图书馆中,有效提高图书搜索质量。

    一种基于知识图谱的文学编年史问答系统的构建方法

    公开(公告)号:CN109766417B

    公开(公告)日:2020-11-24

    申请号:CN201811455685.3

    申请日:2018-11-30

    申请人: 浙江大学

    摘要: 本发明公开了一种基于知识图谱的文学编年史问答系统的构建方法:以中国文学编年史相关的结构化数据为基础,结合自上而下创建的文学编年史本体结构,构建了文学编年史垂直领域的知识图谱;设计了语义解析框架,包含了两种用户问题解析的模块,一个是基于正则与规则,一个是基于神经网络;将问题解析得到的结果组织成对应的SPARQL查询语句,在构建的知识图谱中搜索对应的结果;将结果组织为回复,返回给用户;设计实现了网页端和微信公众号服务,作为系统与用户交互的窗口;设计实现了用户使用日志与反馈收集模块,将相关数据用于迭代训练神经网络模型,增强模型的泛化能力;本发明可以直接处理用户的自然语言查询,返回精准的结果,对提升知识获取效率、促进中国文化研究等方面均有重要作用。

    书法特定风格渲染的方法

    公开(公告)号:CN101916451A

    公开(公告)日:2010-12-15

    申请号:CN201010242254.6

    申请日:2010-07-30

    申请人: 浙江大学

    IPC分类号: G06T11/00

    摘要: 本发明公开了一种书法特定风格渲染的方法。它是采用贝塞尔曲线从特定的碑帖中抽取笔画,按照汉字笔画类别分类创建笔画库,构建笔画索引和偏旁索引,使用特殊九宫格判定识别手写输入汉字的基本类型,建立偏旁部首过滤器从手写输入笔画序列中查找偏旁部首,从笔画库中取出相应的标准笔画,将标准笔画根据手写输入笔画进行形变,将渲染后的毛笔字输出。本发明可以将手写的硬笔字渲染为具有指定碑帖的风格的毛笔字,计算量小,实时性强,渲染结果具有一定的审美价值。

    基于电阻网络和稀疏数据预测的协同过滤方法

    公开(公告)号:CN101320461A

    公开(公告)日:2008-12-10

    申请号:CN200810062742.1

    申请日:2008-07-01

    申请人: 浙江大学

    IPC分类号: G06Q30/00

    摘要: 本发明公开了一种基于电阻网络和稀疏数据预测的协同过滤方法。包括如下步骤:1)通过电阻网络计算用户之间或物品之间的相似度;2)根据预先设定的标准提取相似用户或物品的集合;3)对评分矩阵中的稀疏数据进行有选择性地预测;4)根据实际应用的需要进行评分预测。本发明采用了一种新颖的基于电阻网络模型的相似度计算方法,更多的利用了评分矩阵中的有益信息。给出相似邻居的判断标准,抽取有益的信息。给出一种有效的稀疏数据预测算法:集成使用物品间相似度与用户间相似度,有选择性地预测有益的缺失评分,减轻了数据稀疏性的负面影响,在扩大后的评分集合基础上预测最终的用户评分,提高了预测的准确性。

    基于标注重要性次序的图像语义自动标注方法

    公开(公告)号:CN100401302C

    公开(公告)日:2008-07-09

    申请号:CN200610053403.8

    申请日:2006-09-14

    申请人: 浙江大学

    IPC分类号: G06F17/30 G06T1/00

    摘要: 本发明公开了一种基于标注重要性次序的图像语义自动标注方法,包括以下步骤:(1)对训练图像集进行分类,形成一系列内容一致的图像集;(2)对每一个图像集构建语义骨架,将其中的图像用语义骨架表示,同时计算图像的关键词重要性次序和图像子块的重要性次序;(3)用统计学习的方法进行图像自动标注。本发明在图像自动标注时,考虑了图像区域子块的重要性和训练集中文本的重要性次序,有效的解决了图像自动标注准确性和词频畸形分布的问题,从而支持基于语义的图像检索。

    一种基于知识图谱的文学编年史问答系统的构建方法

    公开(公告)号:CN109766417A

    公开(公告)日:2019-05-17

    申请号:CN201811455685.3

    申请日:2018-11-30

    申请人: 浙江大学

    摘要: 本发明公开了一种基于知识图谱的文学编年史问答系统的构建方法:以中国文学编年史相关的结构化数据为基础,结合自上而下创建的文学编年史本体结构,构建了文学编年史垂直领域的知识图谱;设计了语义解析框架,包含了两种用户问题解析的模块,一个是基于正则与规则,一个是基于神经网络;将问题解析得到的结果组织成对应的SPARQL查询语句,在构建的知识图谱中搜索对应的结果;将结果组织为回复,返回给用户;设计实现了网页端和微信公众号服务,作为系统与用户交互的窗口;设计实现了用户使用日志与反馈收集模块,将相关数据用于迭代训练神经网络模型,增强模型的泛化能力;本发明可以直接处理用户的自然语言查询,返回精准的结果,对提升知识获取效率、促进中国文化研究等方面均有重要作用。

    基于近邻传播模型从图书目录中学习层次结构的方法

    公开(公告)号:CN104699666B

    公开(公告)日:2017-09-01

    申请号:CN201510050439.X

    申请日:2015-01-30

    申请人: 浙江大学

    IPC分类号: G06F17/27 G06F17/30

    摘要: 本发明公开了一种基于近邻传播模型从图书目录中学习层次结构的方法。学习结构化数据已经成为了很多领域中非常重要的问题,例如文档及web数据挖掘,生物信息学,图书分析等。学习这种复杂结构的一种方法是将其分解为小的、不完全的而且带有噪声的结构化碎片。本发明从图书的目录出发,首先对图书目录进行预处理,接着通过增加结构和语义相似度来对学习得到的层次结构进行约束,并利用结构化信息拓展了近邻传播模型,使其能够将一组原有的碎片信息整合成一致的,更大的层次主题。本发明利用图书目录这种高可靠性,低噪声的数据构建出来的层次结构比现有的方法有着更高的准确度和更低的冲突性。

    使用标签隐含主题进行图书推荐的方法

    公开(公告)号:CN103886067A

    公开(公告)日:2014-06-25

    申请号:CN201410105985.4

    申请日:2014-03-20

    申请人: 浙江大学

    IPC分类号: G06F17/30 G06F17/27

    CPC分类号: G06F17/30867 G06F17/30731

    摘要: 本发明公开了一种使用标签隐含主题进行图书推荐的方法。它将图书作为文档,图书标签作为文档中的单词,采用LDA-Gibbs算法对图书标签进行主题建模,得到标签-主题模型,然后根据用户的图书阅读记录得到用户和标签的对应关系,使用LDA-inference算法得到用户-主题模型,最后根据用户在主题分布上的相似度找到兴趣相似的用户,对图书进行协同过滤推荐。本发明充分挖掘了图书标签中的语义信息,通过使用主题降低了表达用户所需的维度,减小了计算量,有助于提高推荐结果的质量,有一定的实用价值。