一种基于多通道融合与重排序的中文文本自动校对方法

    公开(公告)号:CN110427619A

    公开(公告)日:2019-11-08

    申请号:CN201910663927.6

    申请日:2019-07-23

    摘要: 本发明公开了一种基于多通道融合与重排序的中文文本自动校对方法。该方法中的神经机器翻译模型选择卷积编解码网络,通过三个预测通道结合字级别和子词级别的校对模型,其中各通道均启用集成解码机制并输出N个最佳候选,然后应用重排序组件基于标准化的语言模型特征对聚合的输出结果重打分。不同中文校对系统的性能对比实验表明,M1+M2+M3(4ens,n-best)+LM特征(标准化)在NLPCC 2018中文校对基准测试集上建立了新的SOTA分数,相较于之前最好的结果,性能相对提升了约19.4%。不同重排序方法对比实验表明了本发明提出的LM特征(标准化)重排序方法的有效性。组件拆解对比实验则表明了各通道启用集成解码和n-best输出的必要性。

    一种基于观点挖掘分析的汽车竞品对比方法

    公开(公告)号:CN110415071A

    公开(公告)日:2019-11-05

    申请号:CN201910592949.8

    申请日:2019-07-03

    摘要: 本发明公开了一种基于观点挖掘分析的汽车竞品对比方法,首先构建汽车用户评价训练数据集,之后使用深度学习网络结构,包括卷积神经网络TextCNN训练文本主题抽取模型、LSTM-Attention训练文本情感极性判别模型;通过结合TextCNN及LSTM-Attention两种深度学习模型,利用pipeline处理的方式得到汽车用户评价主题及主题情感打分,最后利用模型输出主题评价和情感极性实现基于汽车用户评论观点的汽车竞品对比。与现有技术相比,汽车竞品分析来源于用户评论,具有真实性高、可行性强的特点,且模型有良好的准确率和通用性。

    一种基于观点挖掘分析的汽车竞品对比方法

    公开(公告)号:CN110415071B

    公开(公告)日:2024-02-27

    申请号:CN201910592949.8

    申请日:2019-07-03

    摘要: 本发明公开了一种基于观点挖掘分析的汽车竞品对比方法,首先构建汽车用户评价训练数据集,之后使用深度学习网络结构,包括卷积神经网络TextCNN训练文本主题抽取模型、LSTM‑Attention训练文本情感极性判别模型;通过结合TextCNN及LSTM‑Attention两种深度学习模型,利用pipeline处理的方式得到汽车用户评价主题及主题情感打分,最后利用模型输出主题评价和情感极性实现基于汽车用户评论观点的汽车竞品对比。与现有技术相比,汽车竞品分析来源于用户评论,具有真实性高、可行性强的特点,且模型有良好的准确率和通用性。

    一种基于多通道融合与重排序的中文文本自动校对方法

    公开(公告)号:CN110427619B

    公开(公告)日:2022-06-21

    申请号:CN201910663927.6

    申请日:2019-07-23

    摘要: 本发明公开了一种基于多通道融合与重排序的中文文本自动校对方法。该方法中的神经机器翻译模型选择卷积编解码网络,通过三个预测通道结合字级别和子词级别的校对模型,其中各通道均启用集成解码机制并输出N个最佳候选,然后应用重排序组件基于标准化的语言模型特征对聚合的输出结果重打分。不同中文校对系统的性能对比实验表明,M1+M2+M3(4ens,n‑best)+LM特征(标准化)在NLPCC 2018中文校对基准测试集上建立了新的SOTA分数,相较于之前最好的结果,性能相对提升了约19.4%。不同重排序方法对比实验表明了本发明提出的LM特征(标准化)重排序方法的有效性。组件拆解对比实验则表明了各通道启用集成解码和n‑best输出的必要性。