文章生成方法、装置、设备及存储介质

    公开(公告)号:CN118550997A

    公开(公告)日:2024-08-27

    申请号:CN202310208292.7

    申请日:2023-02-27

    摘要: 本发明公开了一种文章生成方法、装置、设备及存储介质。其中,所述方法包括:获取第一数据;将所述第一数据输入至第一模型,得到第二数据;所述第一数据表征待处理的标题文本,所述第二数据表征第一摘要段落;将所述第一数据和所述第二数据输入至第二模型,得到第三数据;所述第三数据表征第一大纲文本;所述第一大纲文本包括多个一级标题;将所述第一数据、所述第二数据和所述第三数据输入至第三模型,得到第四数据;所述第四数据表征与各个一级标题分别对应的段落;利用所述第一数据、所述第二数据、所述第三数据和所述第四数据,生成文章。

    一种网络爬虫调度方法、装置、设备及可读存储介质

    公开(公告)号:CN114722258A

    公开(公告)日:2022-07-08

    申请号:CN202110001476.7

    申请日:2021-01-04

    发明人: 边增亚

    摘要: 本发明提供一种网络爬虫调度方法、装置、设备及可读存储介质,涉及网络爬虫技术领域,该网络爬虫调度方法,包括获取目标网站在目标时刻前第一时间段内的历史信息发布数据;基于历史信息发布数据与第一时间段,获取信息发布数据与目标时间段之间的对应关系,第一时间段包括多个目标时间段;基于对应关系预测目标网站在目标时刻后第二时间段内的预测信息发布数据;基于目标时间段和预测信息发布数据确定调度频率;基于调度频率执行网络爬虫调度。可以解决现有的网络爬虫调度方法无法在节省硬件资源的同时提升网络爬取的时效性的问题。

    文本识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN116912864A

    公开(公告)日:2023-10-20

    申请号:CN202310255423.7

    申请日:2023-03-10

    摘要: 本申请公开了一种文本识别方法、装置、电子设备及可读存储介质,属于自然语言处理领域。本申请实施例的文本识别方法包括:获取N个待识别文本以及K个属于广告营销类的目标文本,所述N和K为大于1的整数;根据所述N个待识别文本和所述K个目标文本,构建图结构模型,并根据所述图结构模型进行迭代计算,获得每个所述待识别文本与所述K个目标文本的关系值;所述图结构模型中的节点表征所述待识别文本或所述目标文本,所述图结构模型中的边表征所述边对应的两节点所表征的文本之间的关系;根据每个待识别文本与所述K个目标文本的关系值,判定每个待识别文本是否属于广告营销类。由此,可以准确识别广告营销类的文本内容。

    一种新兴技术的预测方法、装置及终端设备

    公开(公告)号:CN116361625A

    公开(公告)日:2023-06-30

    申请号:CN202111587728.5

    申请日:2021-12-23

    摘要: 本发明提供一种新兴技术的预测方法、装置及终端设备,涉及通信技术领域。该方法包括:根据文献数据获取候选短语集,所述文献数据包括论文数据和专利数据;获取所述候选短语集中目标短语的新颖性值以及影响力值;根据所述目标短语的新颖性值和影响力值,确定新兴技术主题。本发明实施例的方案,基于短语级别的技术主题语义描述,提高了对新兴技术主题预测结果的一致性、完整性以及语义的可解释性;并且将论文数据和专利数据同时作为文献数据,保证了文献数据的新颖性和高覆盖率;根据对候选短语集中短语的新颖性值以及影响力值的计算,得到针对新颖性和影响力的二维预测结果,提高了新兴技术预测的准确性。

    一种文本摘要的生成方法、装置和电子设备

    公开(公告)号:CN116361446A

    公开(公告)日:2023-06-30

    申请号:CN202111598649.4

    申请日:2021-12-24

    摘要: 本发明提供一种文本摘要的生成方法、装置和电子设备,涉及自然语言处理领域。该方法包括:获取目标文档;根据所述目标文档,确定句子‑词语关系和词语‑词语关系的关联信息;根据所述关联信息,分别确定句子和词语的权重信息;根据所述句子和词语的权重信息,生成所述目标文档的目标摘要。本发明通过确定句子‑词语关系和词语‑词语关系的关联信息,能够更好地建立全文信息之间的关系,生成更能概括全文的摘要,采用本发明所述的方法,一方面能够同时提取文本摘要和关键词,另一方面能够取得更好的摘要与关键词抽取效果。