-
公开(公告)号:CN106372086A
公开(公告)日:2017-02-01
申请号:CN201510437087.3
申请日:2015-07-23
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种获取词向量的方法和装置,属于计算机技术领域。所述方法包括:获取语句库中包含的每个待分析词语在所述语句库中所属的各语句的预设的类型,得到每个待分析词语对应的类型集合;将每个待分析词语的词向量设置为训练变量,根据每个待分析词语对应的类型集合和词向量,建立各待分析词语之间关联度的总和的计算模型,作为训练模型;根据所述训练模型,基于使所述关联度的总和最大的原则,对所述训练变量进行训练,得到所述每个待分析词语的词向量。采用本发明,可以提高词向量的语义的准确度。
-
公开(公告)号:CN106294506B
公开(公告)日:2020-04-24
申请号:CN201510316353.7
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/35
摘要: 本发明公开一种领域自适应的观点数据分类方法,属于互联网技术领域。包括:确定源领域检索词矩阵及目标领域检索词矩阵;确定源领域目标函数及目标领域目标函数;根据源领域目标函数及目标领域目标函数确定总目标函数;分别确定总目标函数中各个参数的目标值;根据各个参数的目标值及源领域中的已标注观点数据,训练指定分类模型,通过训练得到的指定分类模型对目标领域的观点数据进行分类。由于总目标函数与源领域特定话题矩阵、目标领域特定话题矩阵及表示源领域与目标领域间的共享话题的枢纽矩阵有关,从而提供一种借助共享话题实现领域自适应的观点数据分类方法。由于共享话题能够减小源领域与目标领域间的差异,从而可确保分类结果的准确性。
-
公开(公告)号:CN106294507A
公开(公告)日:2017-01-04
申请号:CN201510316362.6
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/35
摘要: 本发明公开了一种跨语言的观点数据分类方法和装置,属于数据分类领域。方法包括:获取部分平行数据;构造源数据矩阵、源基矩阵和源特征矩阵,确定源语言的第一目标函数;构造目标数据矩阵、目标基矩阵和目标特征矩阵,并确定目标语言的第二目标函数;根据第一目标函数、第二目标函数和预设条件确定总目标函数,预设条件为第一源观点数据对应的第一源特征矩阵与第一目标观点数据对应的第一目标特征矩阵相同;确定总目标函数中各个参数的收敛值,建立分类模型,以对目标语言的观点数据进行分类。本发明提供了一种基于部分平行数据对跨语言的观点数据进行分类的方法,无需获取完全平行的源语言观点数据和目标语言观点数据,节省了时间和人力成本。
-
公开(公告)号:CN106294506A
公开(公告)日:2017-01-04
申请号:CN201510316353.7
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
摘要: 本发明公开一种领域自适应的观点数据分类方法,属于互联网技术领域。包括:确定源领域检索词矩阵及目标领域检索词矩阵;确定源领域目标函数及目标领域目标函数;根据源领域目标函数及目标领域目标函数确定总目标函数;分别确定总目标函数中各个参数的目标值;根据各个参数的目标值及源领域中的已标注观点数据,训练指定分类模型,通过训练得到的指定分类模型对目标领域的观点数据进行分类。由于总目标函数与源领域特定话题矩阵、目标领域特定话题矩阵及表示源领域与目标领域间的共享话题的枢纽矩阵有关,从而提供一种借助共享话题实现领域自适应的观点数据分类方法。由于共享话题能够减小源领域与目标领域间的差异,从而可确保分类结果的准确性。
-
公开(公告)号:CN106294505B
公开(公告)日:2020-07-07
申请号:CN201510316013.4
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/9536
摘要: 本发明公开了一种反馈答案的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的问题、最佳答案及其它答案的对应关系,基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件,对预设的语义提取公式中的语义提取参数进行训练,得到语义提取参数的训练值;当接收到携带有目标问题的解答请求时,根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值,分别确定所述各答案与所述目标问题的语义接近度;根据所述各答案与所述目标问题的语义接近度,在所述各答案中选取目标答案,对所述解答请求进行反馈。采用本发明,可以提高服务器进行答案反馈的准确率。
-
公开(公告)号:CN106294505A
公开(公告)日:2017-01-04
申请号:CN201510316013.4
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种反馈答案的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的问题、最佳答案及其它答案的对应关系,基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件,对预设的语义提取公式中的语义提取参数进行训练,得到语义提取参数的训练值;当接收到携带有目标问题的解答请求时,根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值,分别确定所述各答案与所述目标问题的语义接近度;根据所述各答案与所述目标问题的语义接近度,在所述各答案中选取目标答案,对所述解答请求进行反馈。采用本发明,可以提高服务器进行答案反馈的准确率。
-
公开(公告)号:CN106294507B
公开(公告)日:2020-07-24
申请号:CN201510316362.6
申请日:2015-06-10
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/35
摘要: 本发明公开了一种跨语言的观点数据分类方法和装置,属于数据分类领域。方法包括:获取部分平行数据;构造源数据矩阵、源基矩阵和源特征矩阵,确定源语言的第一目标函数;构造目标数据矩阵、目标基矩阵和目标特征矩阵,并确定目标语言的第二目标函数;根据第一目标函数、第二目标函数和预设条件确定总目标函数,预设条件为第一源观点数据对应的第一源特征矩阵与第一目标观点数据对应的第一目标特征矩阵相同;确定总目标函数中各个参数的收敛值,建立分类模型,以对目标语言的观点数据进行分类。本发明提供了一种基于部分平行数据对跨语言的观点数据进行分类的方法,无需获取完全平行的源语言观点数据和目标语言观点数据,节省了时间和人力成本。
-
公开(公告)号:CN106372086B
公开(公告)日:2019-12-03
申请号:CN201510437087.3
申请日:2015-07-23
申请人: 华中师范大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/36
摘要: 本发明公开了一种获取词向量的方法和装置,属于计算机技术领域。所述方法包括:获取语句库中包含的每个待分析词语在所述语句库中所属的各语句的预设的类型,得到每个待分析词语对应的类型集合;将每个待分析词语的词向量设置为训练变量,根据每个待分析词语对应的类型集合和词向量,建立各待分析词语之间关联度的总和的计算模型,作为训练模型;根据所述训练模型,基于使所述关联度的总和最大的原则,对所述训练变量进行训练,得到所述每个待分析词语的词向量。采用本发明,可以提高词向量的语义的准确度。
-
公开(公告)号:CN110209923B
公开(公告)日:2023-07-25
申请号:CN201810601709.5
申请日:2018-06-12
申请人: 中国人民大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06F16/9535 , G06Q50/00
摘要: 本发明提出一种话题影响力用户的推送方法和装置,其中,方法包括:获取话题影响力的订阅查询请求,所述订阅查询请求包括至少一个话题;根据社交网络中社交行为事件流,计算社交网络中各个用户对应所述话题的影响力;根据所述影响力确定与每个话题对应的符合预设影响力推送条件的实时用户集合;将所述实时用户集合推送给所述查询用户。由此,结合动态变化的社交网络中社交行为事件流确定每个话题对应的影响力较大的实时用户集合,保证了确定的实时用户集合中用户的话题影响力较高,为有关商家的营销决策提供可靠支持。
-
公开(公告)号:CN109726726B
公开(公告)日:2023-06-20
申请号:CN201711023244.1
申请日:2017-10-27
申请人: 北京邮电大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06V10/764 , G06V10/40 , G06V20/40 , G06T5/50
摘要: 本发明公开了一种视频中的事件检测方法及装置,属于计算机技术领域。所述方法包括:对待检测的视频进行特征提取,得到单帧特征向量集合,所述单帧特征向量集合包括至少两个单帧特征向量,所述单帧特征向量中的每个分量表示所述视频中的关键帧属于概念集合中对应的概念的概率,所述概念集合包括所述视频中的事件;对所述单帧特征向量集合进行均值池化和最大值池化,得到视频特征向量;将所述视频特征向量输入预先训练得到的事件分类器中;将所述事件分类器输出的事件作为所述视频中的事件。本发明解决了只对特征向量进行均值池化,或者,只对特征向量进行最大值池化,导致检测结果不准确的问题,提高了事件检测的准确性。
-
-
-
-
-
-
-
-
-