一种体育文本摘要提取方法、装置、存储介质及设备

    公开(公告)号:CN111708878B

    公开(公告)日:2020-11-24

    申请号:CN202010844192.X

    申请日:2020-08-20

    Abstract: 本申请公开了一种体育文本摘要提取方法、装置、存储介质及设备,该方法包括:对于获取到的目标文本中的每一非细节句,首先根据从非细节句中提取的词语特征,确定非细节句为摘要句的概率,然后,根据所有非细节句为摘要句的概率,从所有非细节句中选取满足预设初选条件的目标非细节句,组成初选文本摘要,再根据初选文本摘要确定目标文本的文本摘要。可见,由于本申请先去除了目标文本中的细节句,使得剩下的非细节句能够更多的反应出文本关键信息,然后再根据所有非细节句的词语特征,更为准确地确定出非细节句为摘要句的概率,用以作为构成文本摘要的依据,从而能够提高体育文本摘要提取结果的准确性。

    长文档跨语言摘要生成及模型训练方法、装置及相关设备

    公开(公告)号:CN117787294A

    公开(公告)日:2024-03-29

    申请号:CN202311754187.X

    申请日:2023-12-19

    Abstract: 本申请公开了一种长文档跨语言摘要生成及模型训练方法、装置及相关设备,基于不同领域间跨语言摘要生成任务的相似性,将长文档跨语言摘要生成模型在数据量充足的源域上进行训练,然后让模型在数据稀缺的目标域上进行微调学习,在目标域训练数据不足时,实现了长文档跨语言摘要模型端到端的训练过程。训练分为两个阶段,第一阶段按照第一训练任务训练长文档跨语言摘要模型,第一训练任务包括两类子任务,分别为在源域上进行跨语言摘要生成任务的训练,以及在目标域上进行单语种摘要生成和摘要翻译的训练;第二阶段按照第二训练任务对模型进行微调训练,第二训练任务包括在目标域上进行跨语言摘要生成任务的训练。

    文本提取方法、文本提取系统、电子设备和存储装置

    公开(公告)号:CN113505218B

    公开(公告)日:2021-12-21

    申请号:CN202111042292.1

    申请日:2021-09-07

    Abstract: 本申请公开了一种文本提取方法、文本提取系统、电子设备和存储装置,该方法包括:对待处理文本进行基于自注意力机制的编码,以生成编码后的第一向量,并且在基于自注意力机制的编码过程中,待处理文本中的一部分字符与待处理文本中的所有字符进行交互,待处理文本中的另一部分字符仅与待处理文本中的部分字符进行交互;对第一向量进行解码,以得到初始提取文本;对初始提取文本进行过滤,以得到目标提取文本。上述方案,能够提高自注意力机制对待处理文本的处理效率,节约从待处理文本中提取目标提取文本的人力资源。

    文本提取方法、文本提取系统、电子设备和存储装置

    公开(公告)号:CN113505218A

    公开(公告)日:2021-10-15

    申请号:CN202111042292.1

    申请日:2021-09-07

    Abstract: 本申请公开了一种文本提取方法、文本提取系统、电子设备和存储装置,该方法包括:对待处理文本进行基于自注意力机制的编码,以生成编码后的第一向量,并且在基于自注意力机制的编码过程中,待处理文本中的一部分字符与待处理文本中的所有字符进行交互,待处理文本中的另一部分字符仅与待处理文本中的部分字符进行交互;对第一向量进行解码,以得到初始提取文本;对初始提取文本进行过滤,以得到目标提取文本。上述方案,能够提高自注意力机制对待处理文本的处理效率,节约从待处理文本中提取目标提取文本的人力资源。

    文本摘要方法、装置、电子设备和存储介质

    公开(公告)号:CN111428025B

    公开(公告)日:2020-12-11

    申请号:CN202010520451.3

    申请日:2020-06-10

    Abstract: 本发明实施例提供一种文本摘要方法和装置,其中方法包括:确定待摘要的多模态数据中的若干个关键文本;将任一关键文本,以及多模态数据中的任一图像输入至文本图像匹配模型,得到文本图像匹配模型输出的任一关键文本和任一图像之间的匹配结果;基于每一关键文本和每一图像之间的匹配结果,确定每一关键文本分别对应的图像;若任一关键文本存在对应图像,则基于该关键文本及其对应的图像,确定该关键文本的摘要文本;否则,基于该关键文本,确定该关键文本的摘要文本;基于每一关键文本的摘要文本,确定多模态数据的摘要文本。本发明实施例提供的方法和装置,提高了后续模型收敛的速度,加强了图像文本融合的针对性,并提高了摘要生成的准确性。

    一种体育文本摘要提取方法、装置、存储介质及设备

    公开(公告)号:CN111708878A

    公开(公告)日:2020-09-25

    申请号:CN202010844192.X

    申请日:2020-08-20

    Abstract: 本申请公开了一种体育文本摘要提取方法、装置、存储介质及设备,该方法包括:对于获取到的目标文本中的每一非细节句,首先根据从非细节句中提取的词语特征,确定非细节句为摘要句的概率,然后,根据所有非细节句为摘要句的概率,从所有非细节句中选取满足预设初选条件的目标非细节句,组成初选文本摘要,再根据初选文本摘要确定目标文本的文本摘要。可见,由于本申请先去除了目标文本中的细节句,使得剩下的非细节句能够更多的反应出文本关键信息,然后再根据所有非细节句的词语特征,更为准确地确定出非细节句为摘要句的概率,用以作为构成文本摘要的依据,从而能够提高体育文本摘要提取结果的准确性。

    文本摘要方法、装置、电子设备和存储介质

    公开(公告)号:CN111428025A

    公开(公告)日:2020-07-17

    申请号:CN202010520451.3

    申请日:2020-06-10

    Abstract: 本发明实施例提供一种文本摘要方法和装置,其中方法包括:确定待摘要的多模态数据中的若干个关键文本;将任一关键文本,以及多模态数据中的任一图像输入至文本图像匹配模型,得到文本图像匹配模型输出的任一关键文本和任一图像之间的匹配结果;基于每一关键文本和每一图像之间的匹配结果,确定每一关键文本分别对应的图像;若任一关键文本存在对应图像,则基于该关键文本及其对应的图像,确定该关键文本的摘要文本;否则,基于该关键文本,确定该关键文本的摘要文本;基于每一关键文本的摘要文本,确定多模态数据的摘要文本。本发明实施例提供的方法和装置,提高了后续模型收敛的速度,加强了图像文本融合的针对性,并提高了摘要生成的准确性。

Patent Agency Ranking