-
公开(公告)号:CN113408272B
公开(公告)日:2023-08-18
申请号:CN202110734020.1
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/279 , G06F40/30
摘要: 本公开提供了一种摘要生成模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。摘要生成模型的训练方法包括:获取文档样本对应的文档表示;基于所述文档表示,构造所述文档表示对应的摘要表示,所述摘要表示包括正摘要表示和负摘要表示;基于所述文档表示、所述正摘要表示、所述负摘要表示,构建总对比损失函数,并基于所述总对比损失函数训练摘要生成模型。本公开可以提高摘要生成模型的准确度。
-
公开(公告)号:CN109684634B
公开(公告)日:2023-07-25
申请号:CN201811542306.4
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/289 , G06F40/284 , G06F40/247
摘要: 本申请公开了一种情感分析方法、装置、设备及存储介质,其中方法包括:获取情感分析请求,其中,分析请求中包括第一文本数据及第一文本数据所属的目标领域;对第一文本数据进行切词处理,以确定第一文本数据中包括的各第一分词;通过查询与目标领域关联的词典,获取每个第一分词对应的词向量;将第一文本数据中每个第一分词对应的词向量,输入与目标领域对应的情感分析模型,以确定第一文本数据对应的情感类型。本申请通过根据文本数据所属的领域,获取对应的情感分析模型,以确定文本数据对应的情感类型,从而能够提高文本数据情感分析服务的准确性和可靠性,满足了不同用户的情感分析需求,提升用户体验。
-
公开(公告)号:CN111831814B
公开(公告)日:2023-06-23
申请号:CN202010501240.5
申请日:2020-06-04
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/34 , G06F16/903 , G06F40/44
摘要: 本申请公开了摘要生成模型的预训练方法、装置、电子设备和存储介质,涉及深度学习和自然语言处理技术领域。具体实现方案为:获取训练数据集,其中,数据集中包括多个原始文本及对应的多个文本标题;分别根据多个文本标题中的每一个文本标题,将对应的每一个原始文本进行掩码处理,以生成多个掩码后的文本;将多个掩码后的文本分别输入初始摘要生成模型,以生成多个预测文本;以及根据多个预测文本与对应的多个原始文本的差异,对初始摘要生成模型进行修正,以生成预训练后的摘要生成模型。由此,能够保证预训练模型的目的和语料与摘要生成模型一致,从而为生成可靠、准确的摘要生成模型提供了条件。
-
公开(公告)号:CN114417974B
公开(公告)日:2023-06-20
申请号:CN202111579688.X
申请日:2021-12-22
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型训练方法、信息处理方法、装置、电子设备和介质,涉及深度学习和自然语言处理等领域。具体实现方案为:获取经过多任务的预训练所得到的识别模型;获取待标注的样本数据和样本数据对应的目标描述信息;采用识别模型基于目标描述信息对样本数据进行识别,得到与目标描述信息匹配的目标识别信息;根据目标识别信息对样本数据进行标注;根据标注后的样本数据对识别模型进行目标任务的适配训练。由此,在多任务场景下,对模型进行预训练,可以使得预训练后的模型学习得到不同任务中的输入和输出之间的对应关系,从而在新任务场景下,只需采用少量的样本数据,即可对模型进行训练,降低人工对样本进行标注的成本。
-
公开(公告)号:CN109800418B
公开(公告)日:2023-05-05
申请号:CN201811539984.5
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F40/242 , G06F16/35
摘要: 本发明提供一种文本处理方法、装置和存储介质,该方法包括:根据目标领域的已有的用户评论文本,获取目标领域的情感搭配词典,情感搭配词典中包括多个目标情感搭配组,每个目标情感搭配组用于表征用户对目标领域的评论对象的属性的情感评论;根据目标领域的待处理用户评论文本和情感搭配词典,获取待处理用户评论文本对应的情感搭配组。本发明提供的文本处理方法根据已有的用户评论文本构建目标领域的情感搭配词典,再采用该情感搭配词典获取待处理文本的情感搭配组,能够准确获取目标领域的文本的情感观点。
-
公开(公告)号:CN114490709B
公开(公告)日:2023-03-24
申请号:CN202111626289.4
申请日:2021-12-28
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/242 , G06F16/2452 , G06F40/30 , G06N3/02
摘要: 本公开提供了一种文本生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习和自然语言处理技术领域。具体实现方案为:接收待处理语句,获取多个查询从句,采用多个查询从句分别对待处理语句进行解析,得到多个查询元素,以及根据多个查询从句结合相应多个查询元素,生成目标查询文本。由此,能够较大程度提升对待处理语句进行解析处理的处理效率,在保证目标查询文本生成准确性的同时,有效提升目标查询文本的生成效率。
-
公开(公告)号:CN114880441B
公开(公告)日:2023-02-10
申请号:CN202210788120.7
申请日:2022-07-06
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F16/36 , G06F40/126 , G06F40/194 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本公开提供了一种视觉内容生成方法、装置、系统、设备和介质,涉及人工智能领域,具体涉及计算机视觉、自然语言处理、深度学习等技术领域,尤其涉及人机交互、智能创作等场景。实现方案为:基于用户的自然语言指令,利用预训练的深度学习网络模型获取第一视觉内容;确定用于表征第一视觉内容的第一特征向量;获取用于表征用户的偏好的用户特征向量;以及基于第一特征向量和用户特征向量,调整所述深度学习网络模型以获取与自然语言指令对应的第二视觉内容,其中,用于表征第二视觉内容的第二特征向量与用户特征向量之间的相似度大于第一特征向量与用户特征向量之间的相似度。
-
公开(公告)号:CN114860995B
公开(公告)日:2022-09-06
申请号:CN202210781581.1
申请日:2022-07-05
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/783 , G06F16/35 , G06F40/258 , G06F40/30 , H04N21/81
摘要: 本公开提供了一种视频脚本生成方法、装置、电子设备及介质,涉及计算机视觉、自然语言处理、深度学习等人工智能技术领域,尤其涉及人机交互、智能创作等场景。实现方案为:响应于确定至少一个原始文本,从至少一个原始文本中提取多个文本单元,其中,每个文本单元中的文本内容均具有连贯的语义;基于多个文本单元之间的逻辑关系,确定视频脚本的结构框架,其中,结构框架包括具有时序关系的多个结构单元,每个结构单元对应于至少一个文本单元;以及基于结构框架,生成视频脚本。
-
公开(公告)号:CN109635103B
公开(公告)日:2022-05-20
申请号:CN201811542117.7
申请日:2018-12-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/34
摘要: 本申请实施例公开了摘要生成方法和装置。该方法的一具体实施方式包括:确定目标文本的文本特征;根据所述文本特征确定所述目标文本所属的目标文本类别;将所述目标文本输入到预先训练的、与所述目标文本类别对应的摘要提取模型,得到所述目标文本的摘要,其中所述摘要提取模型用于确定所输入的文本的摘要。该实施方式一方面可以降低各摘要提取模型的复杂度,从而减少训练摘要提取模型所用的标注数据,以降低训练成本。另一方面还可以提高所提取的文本的摘要的准确度。
-
公开(公告)号:CN114510928A
公开(公告)日:2022-05-17
申请号:CN202210031254.4
申请日:2022-01-12
申请人: 中国科学院软件研究所 , 北京百度网讯科技有限公司
IPC分类号: G06F40/253 , G06F40/30 , G06K9/62
摘要: 本发明提出一种基于统一结构生成的通用信息抽取方法及系统,属于自然语言处理技术领域,采用通用的结构化抽取语言表达不同的抽取结构,该结构化语言包含不同的层次,可以表示多种不同结构的信息抽取结果;解码时通过结构化框架抽取引导机制对特定的抽取需求进行建模,帮助模型快速泛化到特定任务;利用不同的任务对统一生成模型进行预训练,并对预训练后的模型进行微调,提高统一生成模型的性能。
-
-
-
-
-
-
-
-
-