-
公开(公告)号:CN111597800B
公开(公告)日:2023-12-12
申请号:CN201910122455.3
申请日:2019-02-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F16/33 , G06F16/36
Abstract: 本发明实施例公开了一种同义句的获取方法及装置、设备及存储介质。所述方法包括:获取待处理语句;将待处理语句输入翻译模型,得到待处理语句的同义句,其中,翻译模型由用户输入的搜索内容以及用户选取的搜索结果的标题所组成的训练样本对训练而获得。本发明实施例的技术方案解决了现有技术中同义句的确定过程较为繁琐,且浪费了大量的人力的技术缺陷,实现了在不通过人工挖掘同义词对的基础上,简便、准确及快捷地获取语句的同义句。
-
公开(公告)号:CN111738010B
公开(公告)日:2023-10-17
申请号:CN201910211647.1
申请日:2019-03-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/30 , G06F16/332 , G06F16/33 , G06F18/214 , G06F18/22 , G06N3/045 , G06N3/048 , G06N3/08 , G06N3/084
Abstract: 本申请实施例公开了用于生成语义匹配模型的方法和装置。该方法的一具体实施方式包括:获取样本集,其中,样本集中的样本包括第一语句、与第一语句语义匹配的第二语句、与第一语句语义不匹配的第三语句;从样本集中选取样本,以及执行以下训练步骤:将选取的样本的第一语句、第二语句、第三语句分别进行分词,得到第一词序列、第二词序列和第三词序列;将第一词序列、第二词序列和第三词序列输入到孪生神经网络,得到损失值;根据损失值确定孪生神经网络是否训练完成;响应于确定孪生神经网络训练完成,将孪生神经网络作为语义匹配模型。该实施方式能够提高语义匹配的准确性。
-
公开(公告)号:CN110738220B
公开(公告)日:2022-09-30
申请号:CN201810707323.2
申请日:2018-07-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种句子的情感极性分析方法、装置和计算机可读存储介质。其中,句子的情感极性分析方法包括:利用机器学习模型对句子的情感极性进行分析,得到表示所述句子的情感极性的结果向量,所述机器学习模型包括决策树模型、分类器模型、卷积神经网络模型和循环神经网络模型中至少两种;利用逻辑回归模型拟合所述结果向量,得到所述句子的情感极性。本发明实施例中,通过多模型深度融合的句子极性分析法进行深层次语义分析,极性判断准确率高。
-
公开(公告)号:CN110737820B
公开(公告)日:2022-05-31
申请号:CN201810717197.9
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/9537 , G06F16/2458
Abstract: 本申请实施例公开了用于生成事件信息的方法和装置。该方法的一具体实施方式包括:获取第一搜索用信息集合,其中,第一搜索用信息是驻地位于目标地理区域内的用户的搜索用信息;对于第一搜索用信息集合中的第一搜索用信息,对该第一搜索用信息进行分析,获取与该第一搜索用信息对应的事件信息;合并获取到的事件信息得到事件信息集合。该事件信息集合中的事件信息所指示的事件可以被确定为目标地理区域内的居民所关注的事件。该实施方式可以实现对目标地理区域内的居民所关注的事件的挖掘。
-
公开(公告)号:CN111753080A
公开(公告)日:2020-10-09
申请号:CN201910243599.4
申请日:2019-03-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于输出信息的方法和装置。上述方法的一具体实施方式包括:获取目标句子;对目标句子进行分类,以及确定与分类结果对应的、预先建立的语义表达模型,其中,语义表达模型用于表征句子与向量的对应关系;根据所确定的语义表达模型,确定目标句子的向量;基于所确定的向量,输出与目标句子相关的信息。该实施方式提高了句子的语义表达的准确度。
-
公开(公告)号:CN111666416A
公开(公告)日:2020-09-15
申请号:CN201910176885.3
申请日:2019-03-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/332
Abstract: 本公开实施例公开了用于生成语义匹配模型的方法和装置。该方法的一具体实施方式包括:获取样本集;选取样本执行以下训练步骤:将选取的样本的第一语句和第二语句分别输入初始语义匹配模型的语句编码层,得到第一语句向量和第二语句向量;将第一语句向量和第二语句向量分别输入初始语义匹配模型的第一分类器,得到第一预测类别、第二预测类别;将第一语句向量和第二语句向量输入初始语义匹配模型的匹配层,得到预测匹配信息;将根据第一预测类别、第二预测类别、预测匹配信息与标注信息确定出达到预设的训练完成条件的初始语义匹配模型作为语义匹配模型。该实施方式联合训练语句分类和语义匹配两个任务,提升了语义匹配模型的性能。
-
公开(公告)号:CN110737821A
公开(公告)日:2020-01-31
申请号:CN201810719378.5
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F40/289 , G06K9/62
Abstract: 本发明提出一种相似事件查询的方法、装置、存储介质和终端设备,其中,所述方法包括:根据待查询事件的主题类别,从事件库中获取与所述主题类别相匹配的事件,获得主题事件集合;其中,所述事件库包括多个事件,每个事件包括事件的主题类别、触发词和事件特征;根据所述待查询事件的触发词,判断所述主题事件集合是否包括与所述触发词相匹配的事件;以及当所述主题事件集合包括与所述触发词匹配的事件时,根据所述待查询事件的事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件。采用本发明,可以减少计算事件相似度的计算量,提高获取相似事件的效率。
-
公开(公告)号:CN110737821B
公开(公告)日:2022-06-07
申请号:CN201810719378.5
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F40/289 , G06K9/62
Abstract: 本发明提出一种相似事件查询的方法、装置、存储介质和终端设备,其中,所述方法包括:根据待查询事件的主题类别,从事件库中获取与所述主题类别相匹配的事件,获得主题事件集合;其中,所述事件库包括多个事件,每个事件包括事件的主题类别、触发词和事件特征;根据所述待查询事件的触发词,判断所述主题事件集合是否包括与所述触发词相匹配的事件;以及当所述主题事件集合包括与所述触发词匹配的事件时,根据所述待查询事件的事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件。采用本发明,可以减少计算事件相似度的计算量,提高获取相似事件的效率。
-
公开(公告)号:CN108182211B
公开(公告)日:2020-06-30
申请号:CN201711374282.1
申请日:2017-12-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/783 , G06F16/78 , G06Q50/00
Abstract: 本发明公开了视频舆情获取方法、装置、计算机设备及存储介质,其中方法包括:获取信息来源及监控实体;从信息来源获取实时流数据;针对实时流数据中的每个视频,分别对视频进行预定内容识别,得到识别结果;根据识别结果确定视频与监控实体是否相匹配,若匹配,则生成视频对应的舆情信息并存储。应用本发明所述方案,能够获取到视频类舆情信息。
-
公开(公告)号:CN110738046A
公开(公告)日:2020-01-31
申请号:CN201810720034.6
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F16/35
Abstract: 本发明提出一种观点抽取方法及装置,其中方法包括:获取待处理的文本内容;将文本内容中的各个语句输入预设的主观句识别模型,获取各个语句中的主观句;主观句为对评论对象进行评论的语句;针对主观句,抽取主观句中的观点五元组;观点五元组包括:评论对象、评论属性、评论词、评论者以及评论时间;根据观点五元组,确定针对评论对象和评论属性的各类型评论的占比;将针对评论对象和评论属性的各类型评论的占比,以及主观句,确定为文本内容对应的观点,从而能够先提取文本内容中的主观句,然后针对主观句进行五元组抽取和观点分析操作,减少了需要分析的五元组的数量,提高了五元组分析的准确度,能够满足实时性和准确率的要求。
-
-
-
-
-
-
-
-
-