语音识别方法和装置、计算机可读存储介质

    公开(公告)号:CN114333795A

    公开(公告)日:2022-04-12

    申请号:CN202111592910.X

    申请日:2021-12-23

    摘要: 本申请公开了一种语音识别方法和装置、计算机可读存储介质,属于语音交互技术领域。所述语音识别方法先根据语音信息获取第一文本,并获取第一语义;其中第一文本包括第一实体文本序列,第一语义包括与第一实体文本序列对应的第一实体语义,且第一实体语义有对应的实体类型标签;再判断第一语义是否符合预设标准;若是,将第一语义作为语音识别结果;否则,将第一文本中的第一实体文本序列替换为对应的发音编码序列,并为发音编码序列添加实体类型标签,以获得纠错文本;根据发音编码序列获得第二实体文本序列,并使实体类型标签与第二实体文本序列相匹配,以获得第二文本;利用第二文本获取语音识别结果。本申请提高语音识别及语义理解的准确性。

    一种命名实体识别方法及装置
    2.
    发明公开

    公开(公告)号:CN114330348A

    公开(公告)日:2022-04-12

    申请号:CN202111679368.1

    申请日:2021-12-31

    发明人: 刘强 艾坤

    IPC分类号: G06F40/295 G06F40/30 G06K9/62

    摘要: 本申请提供一种命名实体识别方法及装置,在样本数据中加入至少一种领域的先验知识;基于至少一种领域的先验知识,对预训练模型进行训练,通过减少预训练模型中多头注意力机制的个数,多头注意力机制的个数与命名实体识别关注的领域一致,如影视领域的命名实体识别中,从词性上区分主要是重点关注名词、动词、形容词、数词等识别领域。让不同头注意力机制关注不同的识别领域,同时拉远不同头注意力机制之间的距离,使得多头注意力机制学习到的语义表达不产生冗余。

    一种三元组知识库的构建方法及装置

    公开(公告)号:CN109726254B

    公开(公告)日:2020-12-18

    申请号:CN201811582996.6

    申请日:2018-12-24

    IPC分类号: G06F16/28

    摘要: 本申请公开了一种三元组知识库的构建方法及装置,构建了五个数据结构,第一数据结构用于存储了三元组集合中各个三元组中的各个不同第一元素以及用于在第五数据结构中找到该第一元素的相关信息的标识;第二数据结构,用于存储各个不同的第二元素;第三数据结构,用于存储每一第三元素;第四数据结构,用于存储每一第二元素在第二数据结构中的索引、以及每一第三元素在第三数据结构中的第一存储位置;第五数据结构,用于存储每一第一元素对应的第二元素和第三元素的相关信息在第四数据结构中的第二存储位置。可见,由于第一数据结构和第二数据结构中只存储了三元组集合中的不同第一元素和不同第二元素,可以减少对存储内存的占用。

    语义理解处理方法、装置、设备及可读存储介质

    公开(公告)号:CN111104803B

    公开(公告)日:2024-02-13

    申请号:CN201911415186.6

    申请日:2019-12-31

    IPC分类号: G06F40/30 G06F40/289

    摘要: 本发明实施例提供一种语义理解处理方法、装置、设备及可读存储介质,对待分析语句进行分词处理,为分词结果设置对应的标签;所述标签包括用于表征通用词性的词性标签和用于表征专用词性的词典标签;将所述标签代入所述待分析语句得到更新后的待分析语句,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果;其中,所述匹配规则包括意图和规则,所述规则至少包括通过分隔符标记连接分词形成的N元组;所述规则中的关键词用其对应的所述词典标签表示,所述规则中的非关键词用其本身表示。本发明实施例中的规则支持多种匹配方式,能够满足语义理解规则的泛化需求。

    语义理解处理方法、装置、设备及可读存储介质

    公开(公告)号:CN111104803A

    公开(公告)日:2020-05-05

    申请号:CN201911415186.6

    申请日:2019-12-31

    IPC分类号: G06F40/30 G06F40/289

    摘要: 本发明实施例提供一种语义理解处理方法、装置、设备及可读存储介质,对待分析语句进行分词处理,为分词结果设置对应的标签;所述标签包括用于表征通用词性的词性标签和用于表征专用词性的词典标签;将所述标签代入所述待分析语句得到更新后的待分析语句,将所述更新后的待分析语句与预设的匹配规则进行匹配,获得匹配结果;其中,所述匹配规则包括意图和规则,所述规则至少包括通过分隔符标记连接分词形成的N元组;所述规则中的关键词用其对应的所述词典标签表示,所述规则中的非关键词用其本身表示。本发明实施例中的规则支持多种匹配方式,能够满足语义理解规则的泛化需求。

    一种三元组知识库的构建方法及装置

    公开(公告)号:CN109726254A

    公开(公告)日:2019-05-07

    申请号:CN201811582996.6

    申请日:2018-12-24

    IPC分类号: G06F16/28

    摘要: 本申请公开了一种三元组知识库的构建方法及装置,构建了五个数据结构,第一数据结构用于存储了三元组集合中各个三元组中的各个不同第一元素以及用于在第五数据结构中找到该第一元素的相关信息的标识;第二数据结构,用于存储各个不同的第二元素;第三数据结构,用于存储每一第三元素;第四数据结构,用于存储每一第二元素在第二数据结构中的索引、以及每一第三元素在第三数据结构中的第一存储位置;第五数据结构,用于存储每一第一元素对应的第二元素和第三元素的相关信息在第四数据结构中的第二存储位置。可见,由于第一数据结构和第二数据结构中只存储了三元组集合中的不同第一元素和不同第二元素,可以减少对存储内存的占用。