-
公开(公告)号:CN111738007B
公开(公告)日:2021-04-13
申请号:CN202010635292.1
申请日:2020-07-03
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/216 , G06F16/31 , G06F16/35 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi‑LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。
-
公开(公告)号:CN109766553A
公开(公告)日:2019-05-17
申请号:CN201910018546.2
申请日:2019-01-09
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于多正则化结合的胶囊模型的中文分词方法,通过增加胶囊滑动窗口capsule sliding window,将胶囊模型迁移应用到自然语言处理NLP序列标注任务即中文分词任务中,解决了胶囊模型并不适用于序列标注的任务的技术问题;将多个正则化项联合,实现简单的领域迁移,本发明将胶囊模型适应到序列标注任务上,完成了更高准确率的中文分词,帮助更复杂的自然语言处理任务;通过多正则项的联合,提升了模型的泛化能力,实现了一定的领域迁移,能够减少人工语料的标注,降低在自然语言处理研究时人工标注语料的人工和时间成本。
-
公开(公告)号:CN111738007A
公开(公告)日:2020-10-02
申请号:CN202010635292.1
申请日:2020-07-03
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/216 , G06F16/31 , G06F16/35 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi-LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。
-
公开(公告)号:CN110765775B
公开(公告)日:2020-08-04
申请号:CN201911059048.9
申请日:2019-11-01
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi‑LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。
-
公开(公告)号:CN110196980B
公开(公告)日:2020-08-04
申请号:CN201910487638.5
申请日:2019-06-05
Applicant: 北京邮电大学
IPC: G06F40/289 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于卷积网络在中文分词任务上的领域迁移方法,在用于中文分词任务的卷积神经网络的基础上,通过在传统的用于计算不同领域分布差异的最大化平均差异Maximum Mean Discrepancy方法中,引入注意力机制attention mechanism,使得在训练神经网络的过程中,注意力机制能够获得对于领域迁移任务更具有帮助的语句信息,将最大化平均差异方法更好的引入到序列标注任务中;同时,在计算最大化平均差异的过程中,为能够正向迁移的语句添加较大的权重,而为没有帮助的语句或是反而产生负面影响的语句添加很小的权重,实现更高效的领域迁移,减少人工语料的标注,缓解自然语言处理NLP研究时由于标注语料工作带来的人工和时间的压力。
-
公开(公告)号:CN110765775A
公开(公告)日:2020-02-07
申请号:CN201911059048.9
申请日:2019-11-01
Applicant: 北京邮电大学
IPC: G06F40/295 , G06F40/30 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi-LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。
-
公开(公告)号:CN110196980A
公开(公告)日:2019-09-03
申请号:CN201910487638.5
申请日:2019-06-05
Applicant: 北京邮电大学
Abstract: 本发明提供了一种基于卷积网络在中文分词任务上的领域迁移方法,在用于中文分词任务的卷积神经网络的基础上,通过在传统的用于计算不同领域分布差异的最大化平均差异Maximum Mean Discrepancy方法中,引入注意力机制attention mechanism,使得在训练神经网络的过程中,注意力机制能够获得对于领域迁移任务更具有帮助的语句信息,将最大化平均差异方法更好的引入到序列标注任务中;同时,在计算最大化平均差异的过程中,为能够正向迁移的语句添加较大的权重,而为没有帮助的语句或是反而产生负面影响的语句添加很小的权重,实现更高效的领域迁移,减少人工语料的标注,缓解自然语言处理NLP研究时由于标注语料工作带来的人工和时间的压力。
-
-
-
-
-
-