中文问答系统知识标记语言的表示方法及中文问答系统

    公开(公告)号:CN105630887A

    公开(公告)日:2016-06-01

    申请号:CN201510958742.X

    申请日:2015-12-18

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30976

    摘要: 本发明提供一种中文问答系统知识标记语言的表示方法及中文问答系统,该方法包括:所述中文问答系统知识标记语言的表示方法包括:知识的基本表示方法,知识的语义表示方法,知识模板的表示和实例化方法,知识的引用与关联方法,知识中命名实体的表示和消歧方法,知识中表情、数学、超文本符号和时间的表示方法,本发明还提供了一种所述中文问答系统使用上述的表示方法。本发明以推动中文问答系统在科研界和企业界的进一步研究和应用。

    一种用于多轮问答系统中缺失语义补充的方法

    公开(公告)号:CN105589844A

    公开(公告)日:2016-05-18

    申请号:CN201510958743.4

    申请日:2015-12-18

    发明人: 游世学 杜新凯

    IPC分类号: G06F17/27 G06F17/30

    CPC分类号: G06F17/30654 G06F17/2785

    摘要: 本发明公开了一种用于多轮问答系统中缺失语义补充的方法,其特征在于,包括以下步骤:S1、获取用户在问答系统中输入的问题;S2、根据用户输入的在先问题对当前问题进行缺失语义补充,且所述缺失语义补充是从指代消解和/或省略恢复的角度进行语义补充;S3、对缺失语义补充后的当前问题进行检索。本发明通过指代消解和/或省略恢复对当前问题进行缺失语义补充,能够针对用户输入的问题进行准确的回答,本发明方法允许用户使用省略句进行提问,提高了人机交互的流畅性和准确性,获得更好的用户体验。

    一种移动端页面生成方法及系统

    公开(公告)号:CN105468377A

    公开(公告)日:2016-04-06

    申请号:CN201510917312.3

    申请日:2015-12-10

    发明人: 游世学 孟凡兴

    IPC分类号: G06F9/44

    CPC分类号: G06F8/38

    摘要: 本发明涉及互联网技术领域,具体是一种移动终端页面生成方法,所述方法包括:S1、根据用户需求选取对应类型的控件;S2、将控件加载到页面,调整控件在页面中的展示位置;S3、为控件设置控件模板;S4、为控件设置数据;S5、根据页面上的控件、控件模板和设置数据进行页面渲染。本发明还提供了一种移动终端页面生成系统。本发明在页面构建中引入控件概念,每个页面都有一个或多个控件组装而成,其操作简单,降低了用户构建移动站点的门槛,也提高了创建移动站点的效率。

    模型训练及语音生成方法、装置、设备及存储介质

    公开(公告)号:CN117423329B

    公开(公告)日:2024-02-23

    申请号:CN202311746255.8

    申请日:2023-12-19

    IPC分类号: G10L13/027

    摘要: 本公开实施例公开了一种模型训练及语音生成方法、装置、设备及存储介质。该方法包括:获取初始生成模型,初始生成模型为经过预训练的条件扩散模型;获取用户数据,用户数据包括用于反映目标人物特性的文本语音对数据;将初始生成模型作为待训练模型,并基于用户数据,调整待训练模型的激活函数,得到目标模型,目标模型用于语音生成。

    一种基于消融的大模型示例选择方法

    公开(公告)号:CN117235230A

    公开(公告)日:2023-12-15

    申请号:CN202311318602.7

    申请日:2023-10-12

    摘要: 本发明提供了一种基于消融的大模型示例选择方法,包括:搭建用户问题表征模型,并基于数据库对其进行训练,通过训练后的用户问题表征模型获取用户问题相关的示例,搭建第一语言模型及第二语言模型,并将用户问题及相关的示例输入第一语言模型中。本发明提供的基于消融的大模型示例选择方法,能够在已有的数据库中获取合适的示例,帮助大模型生成更好的回复。

    一种复合实体提取方法及系统

    公开(公告)号:CN111639499B

    公开(公告)日:2023-06-16

    申请号:CN202010484708.4

    申请日:2020-06-01

    IPC分类号: G06F40/295

    摘要: 本发明公开了一种复合实体提取方法及系统,所述方法包括:确定复合实体的依赖实体组;确定复合实体的表达式组;从目标文本依次提取依赖实体组,得到依赖实体命中词;对依赖实体命中词进行组合,生成候选依赖词组;根据候选依赖词组中各个词在文本中的位置过滤候选依赖词组;根据候选依赖词组分割目标文本,生成文本片段组;匹配表达式组和文本片段组,根据匹配结果提取出复合实体的命中词。本发明提供的复合实体提取方法及系统,能够利用提取出的简单实体的命中词,从文本中提取出复合实体的命中词,有利于提高复合实体的识别效果。

    一种基于提示的高效率小样本对话语义理解方法

    公开(公告)号:CN115983282A

    公开(公告)日:2023-04-18

    申请号:CN202310272467.0

    申请日:2023-03-21

    IPC分类号: G06F40/30 G06N20/00

    摘要: 本发明提供了一种基于提示的高效率小样本对话语义理解方法,包括:收集槽位标签的中文名称及描述语句,得到预训练数据集,构造提示模板,搭建小样本微调语言模型,将提示模板及预训练数据集输入小样本微调语言模型,对小样本微调语言模型进行训练,输入需要预测的语句,进行小样本对话语义理解预测。本发明提供的基于提示的高效率小样本对话语义理解方法,通过在提示中陈述槽类型来预测槽值,减少了解码和预测的所需要的模型前向传播次数,在不损失模型表现的同时,大大提高了模型的效率。

    一种混合神经网络和字符信息的文本编码方法及系统

    公开(公告)号:CN115392192A

    公开(公告)日:2022-11-25

    申请号:CN202211322130.8

    申请日:2022-10-27

    摘要: 本发明提供了一种混合神经网络和字符信息的文本编码方法及系统,方法包括:获取待编码文本,使用预训练神经网络根据细粒度分词对待编码文本编码,得到第一词序列编码和第一文本编码;使用SimHash根据粗粒度分词对待编码文本进行编码,得到第二词序列编码和第二文本编码;使用SimHash根据词和文本的标签对待编码文本编码,得到第三词序列编码和第三文本编码;混合第一词序列编码、第一文本编码、第二词序列编码、第二文本编码、第三词序列编码和第三文本编码,得到最终词序列编码和最终文本编码。本发明消除了单纯使用神经网络预训练模型带来的数据偏见和信息丢失问题,提高了下游模型的训练收敛速度和推理泛化能力,加快了应用落地的工程迭代速度。

    一种条件实体提取方法
    70.
    发明授权

    公开(公告)号:CN113239688B

    公开(公告)日:2022-04-08

    申请号:CN202110562087.1

    申请日:2021-05-24

    IPC分类号: G06F40/284

    摘要: 本发明提供了一种条件实体提取方法,接收待提取实体的文本及其人机交互上下文语境信息,从接收到的文本中提取实体词,并标注实体类型,对提取到的实体词,根据其所在的文本判断语境约束条件,识别实体用途,对实体用途未确定的实体词,根据其人机交互上下文语境信息判断语境约束条件,识别实体用途,封装实体词及其实体类型及实体用途,得到条件实体。本发明提供的条件实体提取方法,能够提取条件实体,从而得到实体类型和实体用途信息,能够显著提高自然语言理解词槽填充、智能填单表单项填充的准确率,尤其适用于需要同时提取多个相同实体类型不同实体用途的实体词的应用场景。