基于Spark的大规模短语翻译模型的训练方法

    公开(公告)号:CN106055543A

    公开(公告)日:2016-10-26

    申请号:CN201610346396.4

    申请日:2016-05-23

    申请人: 南京大学

    IPC分类号: G06F17/28 G06F17/30 G06K9/62

    摘要: 本发明公开了一种基于Spark的大规模短语翻译模型的训练方法,包括以下步骤:首先采取Spark分布式地调用单机多线程词对齐训练工具MGIZA++的模式,在大规模平行语料库中使用期望最大化算法进行词对齐模型的迭代训练,生成带有词对齐信息的平行语料库;接着使用上一步生成的带有词对齐信息的双语语料数据,在Spark平台上实现了短语翻译模型的并行化训练,最终得到短语表。本发明提出了一种基于Spark的大规模翻译模型的训练方法,解决了现有翻译系统在翻译模型训练中耗时较长、数据扩展性不佳的问题。

    基于Spark的大规模短语翻译模型的训练方法

    公开(公告)号:CN106055543B

    公开(公告)日:2019-04-09

    申请号:CN201610346396.4

    申请日:2016-05-23

    申请人: 南京大学

    IPC分类号: G06F17/28 G06F16/182 G06K9/62

    摘要: 本发明公开了一种基于Spark的大规模短语翻译模型的训练方法,包括以下步骤:首先采取Spark分布式地调用单机多线程词对齐训练工具MGIZA++的模式,在大规模平行语料库中使用期望最大化算法进行词对齐模型的迭代训练,生成带有词对齐信息的平行语料库;接着使用上一步生成的带有词对齐信息的双语语料数据,在Spark平台上实现了短语翻译模型的并行化训练,最终得到短语表。本发明提出了一种基于Spark的大规模翻译模型的训练方法,解决了现有翻译系统在翻译模型训练中耗时较长、数据扩展性不佳的问题。

    一种氧化锆改性的活性炭纤维及其在去除水体中磷酸盐中的应用

    公开(公告)号:CN102941064A

    公开(公告)日:2013-02-27

    申请号:CN201210531335.7

    申请日:2012-12-12

    申请人: 南京大学

    摘要: 本发明公开了一种氧化锆改性的活性炭纤维吸附剂及其在去除水体中磷酸盐上的应用。所述的氧化锆改性的活性炭纤维系采用液相合成法在活性炭纤维表面负载氧化锆纳米粒,方法是将预处理后的活性炭纤维和正丙醇锆加入到无水甲苯中,超声分散,在惰性气氛中加热回流进行锆化反应,反应产物分离、洗涤,真空干燥后制得。所述的氧化锆改性的活性炭纤维作为吸附剂,可应用于水体中磷酸盐进行吸附去除。本发明采用氧化锆改性的活性炭纤维吸附去除水体中磷酸盐,表现出较强的吸附性能;吸附剂制备简单,原料易得,操作简便,处理效果显著。因此,将氧化锆改性的活性炭纤维应用于含磷废水的处理,具有良好的经济和环境效益。

    一种氧化锆改性的活性炭纤维及其在去除水体中磷酸盐中的应用

    公开(公告)号:CN102941064B

    公开(公告)日:2015-04-01

    申请号:CN201210531335.7

    申请日:2012-12-12

    申请人: 南京大学

    摘要: 本发明公开了一种氧化锆改性的活性炭纤维吸附剂及其在去除水体中磷酸盐上的应用。所述的氧化锆改性的活性炭纤维系采用液相合成法在活性炭纤维表面负载氧化锆纳米粒,方法是将预处理后的活性炭纤维和正丙醇锆加入到无水甲苯中,超声分散,在惰性气氛中加热回流进行锆化反应,反应产物分离、洗涤,真空干燥后制得。所述的氧化锆改性的活性炭纤维作为吸附剂,可应用于水体中磷酸盐进行吸附去除。本发明采用氧化锆改性的活性炭纤维吸附去除水体中磷酸盐,表现出较强的吸附性能;吸附剂制备简单,原料易得,操作简便,处理效果显著。因此,将氧化锆改性的活性炭纤维应用于含磷废水的处理,具有良好的经济和环境效益。