一种基于多正则化结合的胶囊模型的中文分词方法

    公开(公告)号:CN109766553A

    公开(公告)日:2019-05-17

    申请号:CN201910018546.2

    申请日:2019-01-09

    Abstract: 本发明提供了一种基于多正则化结合的胶囊模型的中文分词方法,通过增加胶囊滑动窗口capsule sliding window,将胶囊模型迁移应用到自然语言处理NLP序列标注任务即中文分词任务中,解决了胶囊模型并不适用于序列标注的任务的技术问题;将多个正则化项联合,实现简单的领域迁移,本发明将胶囊模型适应到序列标注任务上,完成了更高准确率的中文分词,帮助更复杂的自然语言处理任务;通过多正则项的联合,提升了模型的泛化能力,实现了一定的领域迁移,能够减少人工语料的标注,降低在自然语言处理研究时人工标注语料的人工和时间成本。

    一种基于元学习的个性化对话改写方法

    公开(公告)号:CN112487169B

    公开(公告)日:2023-02-07

    申请号:CN202011457909.1

    申请日:2020-12-11

    Inventor: 孙忆南 李思

    Abstract: 本发明公开了一种基于元学习的个性化对话改写方法,属于自然语言处理领域。该方法的基本思想是通过元学习减轻个性化对话改写中的过拟合问题。该方法的步骤包括:基于不同用户画像数据构建多个相关的个性化对话改写任务,通过元学习在相关任务上进行联合训练,获得对新任务敏感的模型参数。当面向新任务时,使用此参数初始化的模型进行训练从而获得面向新任务的个性化对话改写模型。利用本发明实施例,可以使模型具有快速学习此类相关任务的能力。当模型用在新的任务数据上时,不需要从头学习,而是基于现有的快速学习此类任务的能力在新任务上快速拟合,减弱过拟合问题,从而提升个性化对话改写的效果,具有很大的实用价值。

    一种基于弱化语法错误特征表示的中文语法错误更正方法

    公开(公告)号:CN111767718A

    公开(公告)日:2020-10-13

    申请号:CN202010636770.0

    申请日:2020-07-03

    Abstract: 本发明提供了一种基于弱化语法错误特征表示的中文语法错误更正方法,在用于中文语法错误更正任务的Transformer神经网络的基础上,通过编码器所提取得到字符特征表示和上下文特征表示,为待纠错文本中每一个字符学习得到一个弱化因子。弱化因子能够通过联合方程将编码器提取得到的字符特征表示和上下文特征表示联合,使得编码器所提取得到的待纠错文本的特征表示中,语法错误的特征信息得到抑制,从而弱化了语法错误特征信息对中文语法错误更正模型的负面影响,提升了基于Transformer的序列到序列神经网络模型在中文语法错误更正任务中的性能。

    一种基于序列生成对抗网络的中文命名实体识别数据增强算法

    公开(公告)号:CN111738007A

    公开(公告)日:2020-10-02

    申请号:CN202010635292.1

    申请日:2020-07-03

    Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi-LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。

    一种融合语义和标签差异的命名实体识别领域自适应的方法

    公开(公告)号:CN110765775B

    公开(公告)日:2020-08-04

    申请号:CN201911059048.9

    申请日:2019-11-01

    Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi‑LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。

    一种基于卷积网络在中文分词任务上的领域迁移

    公开(公告)号:CN110196980B

    公开(公告)日:2020-08-04

    申请号:CN201910487638.5

    申请日:2019-06-05

    Abstract: 本发明提供了一种基于卷积网络在中文分词任务上的领域迁移方法,在用于中文分词任务的卷积神经网络的基础上,通过在传统的用于计算不同领域分布差异的最大化平均差异Maximum Mean Discrepancy方法中,引入注意力机制attention mechanism,使得在训练神经网络的过程中,注意力机制能够获得对于领域迁移任务更具有帮助的语句信息,将最大化平均差异方法更好的引入到序列标注任务中;同时,在计算最大化平均差异的过程中,为能够正向迁移的语句添加较大的权重,而为没有帮助的语句或是反而产生负面影响的语句添加很小的权重,实现更高效的领域迁移,减少人工语料的标注,缓解自然语言处理NLP研究时由于标注语料工作带来的人工和时间的压力。

    一种融合语义和标签差异的命名实体识别领域自适应的方法

    公开(公告)号:CN110765775A

    公开(公告)日:2020-02-07

    申请号:CN201911059048.9

    申请日:2019-11-01

    Abstract: 本发明提供了一种通过融合源领域和目标域中句子的语义差异和标签差异,来选择源领域数据中的正样本数据来扩展目标域的训练数据,达到增强目标域的命名实体识别性能的方法。在以往的Bi-LSTM+CRF模型的基础上,为了融合源领域和目标域中句子的语义差异和标签差异,我们通过强化学习中的状态表示和奖励设置来引入语义差异和标签差异,使得训练的决策网络可以选择源领域的数据中对于目标域的命名实体识别的性能有正向影响的句子,扩展目标域的训练数据,解决目标域训练数据不足的问题,同时提升目标域的命名实体识别性能。

    一种基于卷积网络在中文分词任务上的领域迁移

    公开(公告)号:CN110196980A

    公开(公告)日:2019-09-03

    申请号:CN201910487638.5

    申请日:2019-06-05

    Abstract: 本发明提供了一种基于卷积网络在中文分词任务上的领域迁移方法,在用于中文分词任务的卷积神经网络的基础上,通过在传统的用于计算不同领域分布差异的最大化平均差异Maximum Mean Discrepancy方法中,引入注意力机制attention mechanism,使得在训练神经网络的过程中,注意力机制能够获得对于领域迁移任务更具有帮助的语句信息,将最大化平均差异方法更好的引入到序列标注任务中;同时,在计算最大化平均差异的过程中,为能够正向迁移的语句添加较大的权重,而为没有帮助的语句或是反而产生负面影响的语句添加很小的权重,实现更高效的领域迁移,减少人工语料的标注,缓解自然语言处理NLP研究时由于标注语料工作带来的人工和时间的压力。

Patent Agency Ranking