-
公开(公告)号:CN109766434B
公开(公告)日:2020-12-11
申请号:CN201811641236.8
申请日:2018-12-29
申请人: 北京百度网讯科技有限公司
摘要: 本发明提出一种摘要生成方法及装置,其中,该方法包括:通过采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。
-
公开(公告)号:CN109766434A
公开(公告)日:2019-05-17
申请号:CN201811641236.8
申请日:2018-12-29
申请人: 北京百度网讯科技有限公司
摘要: 本发明提出一种摘要生成方法及装置,其中,该方法包括:通过采用预先训练的深度神经网络模型对接收到的所述文本内容中的各个句子进行打分,得到每个句子的第一得分;采用文本排序算法对所述文本内容的各个句子进行打分,得到每个句子的第二得分;采用预先训练的第一逻辑回归模型处理每个句子的第一得分和第二得分,得到每个句子的第三得分;根据至少一个次模函数、贪心算法和每个句子的第三得分,从所述文本内容的各个句子中选出至少一个目标句子;根据至少一个目标句子生成所述文本内容的摘要。从而实现了摘要内容的重要性和丰富性(去冗余)的最大化,较大程度地解决了摘要内容不通顺的问题。
-
公开(公告)号:CN107832299B
公开(公告)日:2021-11-23
申请号:CN201711147815.2
申请日:2017-11-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/253 , G06F40/258
摘要: 本发明提供一种基于人工智能的标题的改写处理方法、装置及可读介质。其方法包括:获取文章中各句子的特征表达,该句子的特征表达包括句子的信息特征以及句子与文章的原始标题的相似性特征;根据各句子的特征表达和预先训练的支撑句提取模型,从文章的各句子中提取文章的支撑句;根据文章的支撑句和预先训练的标题生成模型,生成文章的支撑句对应的候选标题;根据文章的原始标题、候选标题和预先训练的点击率预估模型,确定是否利用候选标题对文章的原始标题进行改写处理。采用本发明的技术方案,可以保证在文章的标题只要被改写,就可以提高改写后的标题的质量,提高改写标题后的文章的召回率,从而满足真正的标题改写需求。
-
公开(公告)号:CN109710840B
公开(公告)日:2020-12-11
申请号:CN201811540935.3
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06F16/33
摘要: 本发明提出一种文章内容深度的评估方法及装置,其中方法包括:获取待评估的文章;将文章输入预设的深度打分模型,以使深度打分模型对文章中的每个段落进行切词以及关键词提取,获取每个关键词对应的向量,根据每个段落中关键词对应的向量确定每个段落对应的向量,根据每个段落对应的向量确定文章对应的向量以及内容深度;获取深度打分模型输出的内容深度,从而能够根据文章的内容对文章进行内容深度打分,提高了文章打分的准确度,提高了文章推荐效率。
-
公开(公告)号:CN107977363A
公开(公告)日:2018-05-01
申请号:CN201711384836.6
申请日:2017-12-20
申请人: 北京百度网讯科技有限公司
摘要: 本发明公开了一种标题生成方法、装置和电子设备,其中,标题生成方法包括:获取待生成标题的文本,并将文本切分为多个分句;获取多个分句的特征信息;将特征信息输入至标题支撑句模型,以抽取出至少一个标题支撑句;将至少一个标题支撑句输入至标题生成模型,以生成对应的标题;基于标题打分模型对生成的标题进行打分,并根据标题的得分确定文本对应的标题。本发明实施例的标题生成方法、装置和电子设备,降低了人工成本,提高了效率和时效性,并且能够满足优化标题提高点击率的需求。
-
公开(公告)号:CN109815481B
公开(公告)日:2023-05-26
申请号:CN201811541645.0
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/295 , G06F16/35 , G06F16/34
摘要: 本发明提供一种对文本进行事件抽取的方法、装置、设备和计算机存储介质,包括:获取待处理文本;对待处理文本进行切词并对切词结果中各词语进行实体标注,根据各词语标注的标签得到待处理文本的标注序列;分别确定各标注序列中的标签能激发的事件,并将其中预设权重值最高的事件作为各标注序列的目标事件;根据各标注序列的标签集合与各标注序列的目标事件确定各标注序列的抽取事件,并从标签集合中获取与抽取事件相匹配的抽取标签;从待处理文本中获取与各抽取事件相匹配的抽取标签对应的切词结果,将抽取事件、抽取事件相匹配的抽取标签与抽取标签对应的切词结果输出,完成对待处理文本的事件抽取。本发明能够对不同领域的文本进行事件抽取。
-
公开(公告)号:CN109710840A
公开(公告)日:2019-05-03
申请号:CN201811540935.3
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9535 , G06F16/33
摘要: 本发明提出一种文章内容深度的评估方法及装置,其中方法包括:获取待评估的文章;将文章输入预设的深度打分模型,以使深度打分模型对文章中的每个段落进行切词以及关键词提取,获取每个关键词对应的向量,根据每个段落中关键词对应的向量确定每个段落对应的向量,根据每个段落对应的向量确定文章对应的向量以及内容深度;获取深度打分模型输出的内容深度,从而能够根据文章的内容对文章进行内容深度打分,提高了文章打分的准确度,提高了文章推荐效率。
-
公开(公告)号:CN107977363B
公开(公告)日:2021-12-17
申请号:CN201711384836.6
申请日:2017-12-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/258 , G06F40/279 , G06N3/08
摘要: 本发明公开了一种标题生成方法、装置和电子设备,其中,标题生成方法包括:获取待生成标题的文本,并将文本切分为多个分句;获取多个分句的特征信息;将特征信息输入至标题支撑句模型,以抽取出至少一个标题支撑句;将至少一个标题支撑句输入至标题生成模型,以生成对应的标题;基于标题打分模型对生成的标题进行打分,并根据标题的得分确定文本对应的标题。本发明实施例的标题生成方法、装置和电子设备,降低了人工成本,提高了效率和时效性,并且能够满足优化标题提高点击率的需求。
-
公开(公告)号:CN109815481A
公开(公告)日:2019-05-28
申请号:CN201811541645.0
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
摘要: 本发明提供一种对文本进行事件抽取的方法、装置、设备和计算机存储介质,包括:获取待处理文本;对待处理文本进行切词并对切词结果中各词语进行实体标注,根据各词语标注的标签得到待处理文本的标注序列;分别确定各标注序列中的标签能激发的事件,并将其中预设权重值最高的事件作为各标注序列的目标事件;根据各标注序列的标签集合与各标注序列的目标事件确定各标注序列的抽取事件,并从标签集合中获取与抽取事件相匹配的抽取标签;从待处理文本中获取与各抽取事件相匹配的抽取标签对应的切词结果,将抽取事件、抽取事件相匹配的抽取标签与抽取标签对应的切词结果输出,完成对待处理文本的事件抽取。本发明能够对不同领域的文本进行事件抽取。
-
公开(公告)号:CN108121697A
公开(公告)日:2018-06-05
申请号:CN201711138896.X
申请日:2017-11-16
申请人: 北京百度网讯科技有限公司
摘要: 本发明提供一种文本改写的方法,该方法包括:获取待改写的文本内容;确定所述文本内容的可泛化成分,获取所述文本内容的泛化模板;匹配与所述泛化模板对应的改写模板,并基于所述改写模板对所述文本内容进行改写。本发明通过对文本内容进行泛化得到泛化模板,进而根据所得到的泛化模板匹配与其对应的改写模板,依据匹配得到的改写模板对文本内容进行改写,从而实现对文本内容进行整句改写,提升文本内容的改写效果。
-
-
-
-
-
-
-
-
-