-
公开(公告)号:CN111444349B
公开(公告)日:2023-09-12
申请号:CN202010150123.9
申请日:2020-03-06
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种信息抽取方法、装置、计算机设备和存储介质。所述方法包括:获取目标文本;基于预训练的信息抽取模型提取目标文本的第一字符特征;根据第一字符特征从目标文本中抽取至少一个主语;分别基于抽取出的每个主语重构所述目标文本,得到一个或多个重构文本;提取重构文本的第二字符特征;根据第二字符特征,从每个重构文本中抽取对应主语的关系以及宾语。采用本方法能够提取出文本中的全部三元组信息。
-
公开(公告)号:CN111444723B
公开(公告)日:2023-07-28
申请号:CN202010149572.1
申请日:2020-03-06
申请人: 深圳追一科技有限公司
IPC分类号: G06F40/30 , G06F40/295 , G06F40/216 , G06F16/36
摘要: 本申请涉及一种信息抽取方法、计算机设备和存储介质。所述方法包括:确定样本文本中所包含的实体;根据所述样本文本中所包含的各实体的出现频次以及词性,对所述样本文本中每个分词进行词性标注;根据所述词性标注确定相应分词中每个字符所对应的分类标签,得到所述样本文本对应的标签序列;基于所述样本文本以及对应的标签序列对信息抽取模型进行训练。采用本方法能够得到可以提取完整三元组信息的信息抽取模型。
-
公开(公告)号:CN111933187A
公开(公告)日:2020-11-13
申请号:CN202010992862.2
申请日:2020-09-21
申请人: 深圳追一科技有限公司
摘要: 本申请提供了一种情感识别模型的训练方法、装置、计算机设备和存储介质,该方法包括:获取通过源模型生成的源音频的源音频特征;源模型,是根据携带情感类别标注的第一领域下的所述源音频,训练得到的情感识别模型;在每轮迭代训练中,通过当前的目标特征提取网络,生成目标音频的目标音频特征;目标音频是未携带情感类别标注的第二领域下的音频;将目标音频特征和源音频特征输入至当前的对抗网络,得到对抗损失;所述对抗网络,用于区分所述目标音频特征和所述源音频特征所属的音频源;根据所述对抗损失对所述对抗网络和目标特征提取网络进行训练;根据迭代停止时的目标特征提取网络,确定目标情感识别模型。本方案能够节省人工标注成本。
-
公开(公告)号:CN111968679B
公开(公告)日:2021-01-29
申请号:CN202011137837.2
申请日:2020-10-22
申请人: 深圳追一科技有限公司
摘要: 本申请公开了一种情感识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法包括:获取待分析音频数据的语音特征和文本特征;利用深度学习模型获取所述待分析音频数据对应的身份特征,所述深度学习模型是基于声源分离技术的模型;将所述语音特征、文本特征和身份特征输入至情感识别模型,得到情感分析结果。本申请通过结合待分析语音数据包含的语音特征、文本特征以及身份特征能够准确高效的获取到情感识别结果。
-
公开(公告)号:CN111968679A
公开(公告)日:2020-11-20
申请号:CN202011137837.2
申请日:2020-10-22
申请人: 深圳追一科技有限公司
摘要: 本申请公开了一种情感识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法包括:获取待分析音频数据的语音特征和文本特征;利用深度学习模型获取所述待分析音频数据对应的身份特征,所述深度学习模型是基于声源分离技术的模型;将所述语音特征、文本特征和身份特征输入至情感识别模型,得到情感分析结果。本申请通过结合待分析语音数据包含的语音特征、文本特征以及身份特征能够准确高效的获取到情感识别结果。
-
公开(公告)号:CN111444723A
公开(公告)日:2020-07-24
申请号:CN202010149572.1
申请日:2020-03-06
申请人: 深圳追一科技有限公司
IPC分类号: G06F40/30 , G06F40/295 , G06F40/216 , G06F16/36
摘要: 本申请涉及一种信息抽取模型训练方法、装置、计算机设备和存储介质。所述方法包括:确定样本文本中所包含的实体;根据所述样本文本中所包含的各实体的出现频次以及词性,对所述样本文本中每个分词进行词性标注;根据所述词性标注确定相应分词中每个字符所对应的分类标签,得到所述样本文本对应的标签序列;基于所述样本文本以及对应的标签序列对信息抽取模型进行训练。采用本方法能够得到可以提取完整三元组信息的信息抽取模型。
-
公开(公告)号:CN111444349A
公开(公告)日:2020-07-24
申请号:CN202010150123.9
申请日:2020-03-06
申请人: 深圳追一科技有限公司
摘要: 本申请涉及一种信息抽取方法、装置、计算机设备和存储介质。所述方法包括:获取目标文本;基于预训练的信息抽取模型提取目标文本的第一字符特征;根据第一字符特征从目标文本中抽取至少一个主语;分别基于抽取出的每个主语重构所述目标文本,得到一个或多个重构文本;提取重构文本的第二字符特征;根据第二字符特征,从每个重构文本中抽取对应主语的关系以及宾语。采用本方法能够提取出文本中的全部三元组信息。
-
公开(公告)号:CN111933187B
公开(公告)日:2021-02-05
申请号:CN202010992862.2
申请日:2020-09-21
申请人: 深圳追一科技有限公司
摘要: 本申请提供了一种情感识别模型的训练方法、装置、计算机设备和存储介质,该方法包括:获取通过源模型生成的源音频的源音频特征;源模型,是根据携带情感类别标注的第一领域下的所述源音频,训练得到的情感识别模型;在每轮迭代训练中,通过当前的目标特征提取网络,生成目标音频的目标音频特征;目标音频是未携带情感类别标注的第二领域下的音频;将目标音频特征和源音频特征输入至当前的对抗网络,得到对抗损失;所述对抗网络,用于区分所述目标音频特征和所述源音频特征所属的音频源;根据所述对抗损失对所述对抗网络和目标特征提取网络进行训练;根据迭代停止时的目标特征提取网络,确定目标情感识别模型。本方案能够节省人工标注成本。
-
-
-
-
-
-
-