-
公开(公告)号:CN108520440A
公开(公告)日:2018-09-11
申请号:CN201810299147.3
申请日:2018-03-30
申请人: 掌阅科技股份有限公司
IPC分类号: G06Q30/02
摘要: 本发明公开了一种电子书消费需求的确定方法、电子设备及计算机存储介质,该方法包括:获取与阅读用户发生交互的电子书,针对获取到的每本电子书,确定阅读用户针对该电子书执行的各次交互操作的操作时间戳;根据各次交互操作中相邻的两次交互操作之间的时间间隔,确定阅读用户针对该电子书的交互时长;根据阅读用户针对获取到的每本电子书的交互时长,从获取到的电子书中筛选与阅读用户相对应的深度交互电子书;根据筛选出的深度交互电子书以及对应深度交互电子书的消费金额,确定阅读用户的消费需求信息。该方式能够有效提升消费需求的准确度,进而提升据此推送的活动内容的转化率,并成功实现提升用户阅读量的效果。
-
公开(公告)号:CN107391729A
公开(公告)日:2017-11-24
申请号:CN201710651375.8
申请日:2017-08-02
申请人: 掌阅科技股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30867 , G06F17/30905
摘要: 本发明公开了一种用户评论的排序方法、电子设备及计算机存储介质,该方法包括:通过第一种机器学习算法确定各个评论样本所对应的隐语义特征以及用户评论所对应的隐语义特征,根据每个评论样本所对应的隐语义特征确定该评论样本的特征向量;通过第二种机器学习算法,并结合各个评论样本的样本标注结果对各个评论样本的特征向量进行训练,得到评论排序模型;根据每个用户评论所对应的隐语义特征确定该用户评论的特征向量,通过评论排序模型确定与各个用户评论的特征向量相对应的评价得分;根据与各个用户评论的特征向量相对应的评价得分对各个用户评论进行排序。本发明能够更好地确定各个评论的质量,进而使排序结果更加合理。
-
公开(公告)号:CN110705302B
公开(公告)日:2023-12-12
申请号:CN201910964988.6
申请日:2019-10-11
申请人: 掌阅科技股份有限公司
发明人: 柳燕煌
IPC分类号: G06F40/295 , G06F40/30
摘要: 本发明公开了一种命名实体的识别方法、电子设备及计算机存储介质,该方法包括:获取原始文本中包含的各个文字及其初始字向量,获取原始文本中包含的各个分词及其初始词向量;根据各个文字的初始字向量以及各个文字在原始文本中的上下文信息,确定各个文字的语义字向量;以及,根据各个分词的初始词向量以及各个分词在原始文本中的上下文信息,确定各个分词的语义词向量;确定与各个文字的语义字向量相对应的第一实体识别结果,与各个分词的语义词向量相对应的第二实体识别结果;根据第一实体识别结果以及第二实体识别结果识别原始文本中包含的命名实体。该方式能够获取到更加准确的识别结果,避免了因字向量的信息量少所导致的识别错误。
-
公开(公告)号:CN111159347B
公开(公告)日:2023-03-21
申请号:CN201911394161.2
申请日:2019-12-30
申请人: 掌阅科技股份有限公司
发明人: 柳燕煌
IPC分类号: G06F16/33
摘要: 本发明公开了一种文章内容质量数据计算方法、计算设备及存储介质,其中,文章内容质量数据计算方法包括:从文章集合中的文章内容中提取多个语句;针对每个语句,在文章集合中查找包含有该语句的文章内容;在包含有相同语句的各个文章内容之间建立关联关系,并确定关联关系权重值,构造得到文章关联图;根据文章关联图,计算得到各个文章内容的质量数据。根据本发明提供的技术方案,对于各个文章内容的质量数据的计算充分考虑了语句共现关系,所得到的各个文章内容的质量数据能够准确地从文章语句方面反映文章内容的质量,优化了文章内容的质量数据的计算方式。
-
公开(公告)号:CN109451018B
公开(公告)日:2021-03-19
申请号:CN201811317708.4
申请日:2018-11-07
申请人: 掌阅科技股份有限公司
发明人: 柳燕煌
IPC分类号: H04L29/08 , G06F16/9535
摘要: 本发明公开了一种信息对象的推送方法、计算设备及计算机存储介质。方法包括:确定信息平台中相关联的信息对象以及信息标签;计算信息对象与该信息对象所对应的信息标签之间的对象标签相似度;根据对象标签相似度计算结果进行信息对象的推送。本方案利用信息对象与信息标签之间的对象标签相似度来推送信息对象,可提高为用户推送的信息对象与用户的契合度,提升用户体验,并有利于信息平台用户留存率的提高。
-
公开(公告)号:CN110968666A
公开(公告)日:2020-04-07
申请号:CN201911159176.0
申请日:2019-11-22
申请人: 掌阅科技股份有限公司
发明人: 柳燕煌
IPC分类号: G06F16/33 , G06F40/258
摘要: 本发明公开了一种基于相似度的标题生成模型的训练方法及计算设备,该方法包括:从文章集合提取各个文章内容对应的标题;针对文章集合中的每个文章内容,对文章内容的全文以及文章内容的各个组成语句进行特征提取,得到文章内容的全文的第一特征向量以及各个组成语句对应的第二特征向量;计算第一特征向量与各个第二特征向量之间的相似度;根据相似度从各个组成语句中提取词语,构建对应的词语样本集合;根据各个文章内容对应的词语样本集合以及各个文章内容对应的标题,训练得到标题生成模型。该方案依据文章内容的特征向量以及各个组成语句对应的特征向量之间的相似度便捷地构建词语样本集合,所得到的标题生成模型能够快速地生成文章的标题。
-
公开(公告)号:CN110705302A
公开(公告)日:2020-01-17
申请号:CN201910964988.6
申请日:2019-10-11
申请人: 掌阅科技股份有限公司
发明人: 柳燕煌
IPC分类号: G06F40/295 , G06F40/30
摘要: 本发明公开了一种命名实体的识别方法、电子设备及计算机存储介质,该方法包括:获取原始文本中包含的各个文字及其初始字向量,获取原始文本中包含的各个分词及其初始词向量;根据各个文字的初始字向量以及各个文字在原始文本中的上下文信息,确定各个文字的语义字向量;以及,根据各个分词的初始词向量以及各个分词在原始文本中的上下文信息,确定各个分词的语义词向量;确定与各个文字的语义字向量相对应的第一实体识别结果,与各个分词的语义词向量相对应的第二实体识别结果;根据第一实体识别结果以及第二实体识别结果识别原始文本中包含的命名实体。该方式能够获取到更加准确的识别结果,避免了因字向量的信息量少所导致的识别错误。
-
公开(公告)号:CN110222340B
公开(公告)日:2023-04-18
申请号:CN201910493223.9
申请日:2019-06-06
申请人: 掌阅科技股份有限公司
IPC分类号: G06F40/295 , G06F18/214
摘要: 本发明公开了一种书籍人物姓名识别模型的训练方法、电子设备及存储介质,其中,该方法包括:从书籍集合中提取书籍人物的姓名字典;针对姓名字典中的每个姓名,与书籍集合中每本书籍的所有语句作匹配,得到包含姓名的语句样本集合;针对语句样本集合中的每个语句样本,对该语句样本中的每个字进行序列标注,得到每个字的序列标记;对该语句样本中的每个字进行特征提取,得到每个字的特征;其中特征包含n‑gram通用特征以及停用词特征;根据语句样本集合中的每个语句样本的每个字的序列标记以及每个字的特征,训练得到书籍人物姓名识别模型。利用该方案训练得到的书籍人物姓名识别模型能够准确地对书籍人物姓名进行识别,有效地提高了识别准确率。
-
公开(公告)号:CN108520440B
公开(公告)日:2020-12-08
申请号:CN201810299147.3
申请日:2018-03-30
申请人: 掌阅科技股份有限公司
IPC分类号: G06Q30/02
摘要: 本发明公开了一种电子书消费需求的确定方法、电子设备及计算机存储介质,该方法包括:获取与阅读用户发生交互的电子书,针对获取到的每本电子书,确定阅读用户针对该电子书执行的各次交互操作的操作时间戳;根据各次交互操作中相邻的两次交互操作之间的时间间隔,确定阅读用户针对该电子书的交互时长;根据阅读用户针对获取到的每本电子书的交互时长,从获取到的电子书中筛选与阅读用户相对应的深度交互电子书;根据筛选出的深度交互电子书以及对应深度交互电子书的消费金额,确定阅读用户的消费需求信息。该方式能够有效提升消费需求的准确度,进而提升据此推送的活动内容的转化率,并成功实现提升用户阅读量的效果。
-
公开(公告)号:CN110222340A
公开(公告)日:2019-09-10
申请号:CN201910493223.9
申请日:2019-06-06
申请人: 掌阅科技股份有限公司
摘要: 本发明公开了一种书籍人物姓名识别模型的训练方法、电子设备及存储介质,其中,该方法包括:从书籍集合中提取书籍人物的姓名字典;针对姓名字典中的每个姓名,与书籍集合中每本书籍的所有语句作匹配,得到包含姓名的语句样本集合;针对语句样本集合中的每个语句样本,对该语句样本中的每个字进行序列标注,得到每个字的序列标记;对该语句样本中的每个字进行特征提取,得到每个字的特征;其中特征包含n-gram通用特征以及停用词特征;根据语句样本集合中的每个语句样本的每个字的序列标记以及每个字的特征,训练得到书籍人物姓名识别模型。利用该方案训练得到的书籍人物姓名识别模型能够准确地对书籍人物姓名进行识别,有效地提高了识别准确率。
-
-
-
-
-
-
-
-
-