一种基于关键词的文章生成方法
摘要:
本发明公开了一种基于关键词的文章生成方法,包括S1、利用爬虫获取互联网上的散文内容,并将其作为初始训练数据集,对所述初始训练数据集进行分段,获取多个段落文本,给各个段落文本配置ID编号,并将所有段落文本汇总为散文段落数据集;S2、根据ID编号对所述散文段落数据集建立索引,以获取散文段落数据集的索引;对所述散文段落数据集进行切词,并对分词结果进行训练,以获取散文段落数据集的sentence特征向量模型;S3、获取用户提交的待生成文本的关键词和待生成文本的段落数量;等步骤。优点是:采用了全新的基于sentence的正排索引和倒排索引工程实现服务在线计算服务,在线计算性能高,可以反复生成keyword的多种语义角度的文本文章。
公开/授权文献
0/0