中文诗歌自动生成方法及装置

    公开(公告)号:CN110555197A

    公开(公告)日:2019-12-10

    申请号:CN201810549683.4

    申请日:2018-05-31

    申请人: 清华大学

    IPC分类号: G06F17/24

    摘要: 本发明实施例公开一种中文诗歌自动生成方法及装置,能自动生成紧密扣题、上下文连贯一致、接近人类创作水平的高质量中文诗歌。方法包括:S1、获取用户输入的关键词,将所述关键词编码为向量,将所述向量存储在第一区域;S2、从所述第一区域、第二区域和第三区域读取与待生成的当前诗句最相关的内容,利用所述最相关的内容生成当前诗句;S3、将所述当前诗句存储在所述第二区域,将上一次生成的诗句中重要的部分存储在所述第三区域,在判断获知整首诗歌未生成完毕时,执行步骤S2,或者在判断获知整首诗歌生成完毕时,结束。

    一种具有风格多样性的绝句生成方法及装置

    公开(公告)号:CN108563622A

    公开(公告)日:2018-09-21

    申请号:CN201810420813.4

    申请日:2018-05-04

    申请人: 清华大学

    IPC分类号: G06F17/24

    摘要: 本发明提供一种具有风格多样性的绝句生成方法及装置,所述方法包括:获取待生成绝句的首句,将首句的文字序列转化成首句向量,将首句向量和表示绝句风格类型的单热向量拼接之后得到的第一向量输入到预先建立好的绝句生成模型中,得到多首具有不同风格的绝句。该方法和装置可以实现在给定同一输入时,可以生成风格不同的多首诗,不需要对诗歌风格进行标注,具有良好的多样性和适用性,同时可以降低诗歌生成成本。

    语法改错质量评估方法和系统

    公开(公告)号:CN113128204B

    公开(公告)日:2024-11-01

    申请号:CN202110393905.X

    申请日:2021-04-13

    申请人: 清华大学

    摘要: 本发明实施例提供一种语法改错质量评估方法和系统,其中所述方法包括:基于给定输入句子和若干个语法改错结果,采用一个预训练语言模型构建给定输入句子和语法改错结果的词语向量表示;针对于每个语法改错结果中的词语向量,采用节点交互注意力机制从其他若干个语法改错结果中获取能够验证当前语法改错结果的词语的语法改错线索,并采用节点选择注意力机制将每条语法改错结果词语的语法改错线索进行整合,得到语法改错证据;利用所述语法改错证据,对当前语法改错结果进行质量评估。本发明实施例通过设计的注意力机制能够在不同的语法改错结果中找到有利于验证当前语法改错结果质量的语法改错证据,从而对当前语法改错结果进行质量评估。

    一种具有风格多样性的绝句生成方法及装置

    公开(公告)号:CN108563622B

    公开(公告)日:2020-04-07

    申请号:CN201810420813.4

    申请日:2018-05-04

    申请人: 清华大学

    IPC分类号: G06F40/186

    摘要: 本发明提供一种具有风格多样性的绝句生成方法及装置,所述方法包括:获取待生成绝句的首句,将首句的文字序列转化成首句向量,将首句向量和表示绝句风格类型的单热向量拼接之后得到的第一向量输入到预先建立好的绝句生成模型中,得到多首具有不同风格的绝句。该方法和装置可以实现在给定同一输入时,可以生成风格不同的多首诗,不需要对诗歌风格进行标注,具有良好的多样性和适用性,同时可以降低诗歌生成成本。

    语法改错质量评估方法和系统

    公开(公告)号:CN113128204A

    公开(公告)日:2021-07-16

    申请号:CN202110393905.X

    申请日:2021-04-13

    申请人: 清华大学

    摘要: 本发明实施例提供一种语法改错质量评估方法和系统,其中所述方法包括:基于给定输入句子和若干个语法改错结果,采用一个预训练语言模型构建给定输入句子和语法改错结果的词语向量表示;针对于每个语法改错结果中的词语向量,采用节点交互注意力机制从其他若干个语法改错结果中获取能够验证当前语法改错结果的词语的语法改错线索,并采用节点选择注意力机制将每条语法改错结果词语的语法改错线索进行整合,得到语法改错证据;利用所述语法改错证据,对当前语法改错结果进行质量评估。本发明实施例通过设计的注意力机制能够在不同的语法改错结果中找到有利于验证当前语法改错结果质量的语法改错证据,从而对当前语法改错结果进行质量评估。

    中文诗歌自动生成方法及装置

    公开(公告)号:CN110555197B

    公开(公告)日:2021-04-02

    申请号:CN201810549683.4

    申请日:2018-05-31

    申请人: 清华大学

    IPC分类号: G06F40/166

    摘要: 本发明实施例公开一种中文诗歌自动生成方法及装置,能自动生成紧密扣题、上下文连贯一致、接近人类创作水平的高质量中文诗歌。方法包括:S1、获取用户输入的关键词,将所述关键词编码为向量,将所述向量存储在第一区域;S2、从所述第一区域、第二区域和第三区域读取与待生成的当前诗句最相关的内容,利用所述最相关的内容生成当前诗句;S3、将所述当前诗句存储在所述第二区域,将上一次生成的诗句中重要的部分存储在所述第三区域,在判断获知整首诗歌未生成完毕时,执行步骤S2,或者在判断获知整首诗歌生成完毕时,结束。

    一种自动生成诗歌的方法及系统

    公开(公告)号:CN111291536A

    公开(公告)日:2020-06-16

    申请号:CN201811392886.3

    申请日:2018-11-21

    申请人: 清华大学

    摘要: 本发明实施例提供一种自动生成诗歌的方法及系统,该方法包括:根据若干个关键词和预设诗歌生成器,获取若干首诗歌;利用每一评分器对每一首诗歌进行评价,获取每一首诗歌的每一指标评分;根据每一首诗歌的每一指标评分,获取每一首诗歌的综合评分;根据每一首诗歌的综合评分,对所述预设诗歌生成器的参数进行优化;根据若干个关键词和所述目标诗歌生成器,获取若干首目标诗歌。本发明实施例通过直接对人类评价诗歌的四个指标进行近似和量化,解决了现有诗歌生成系统存在的优化覆盖面受限和参数优化指标不匹配的问题,使得生成的诗歌能在各个指标上都有提升且相互不冲突,能较大地提升人类评价角度下诗歌的质量。